X

Neuigkeiten, IT-Strategien und
Expertenwissen von Oracle aus der DACH-Region

Nicht alle Daten sind gleich

Sue Daley
Associate Director, Technology & Innovation, techUK

Jede Person braucht für ihre Tätigkeit andere Daten. Dabei ist es entscheidend, ein Verständnis für die unterschiedlichen Datengruppen zu haben, die es im Unternehmen gibt. Das gleiche gilt für die Eigenschaften und Qualität der Daten, die für Training und Ausführung von KI-Systemen verwendet werden können. Denn nur so lassen sich Erkenntnisse und Leistungsfähigkeit vorhandener Daten nutzen und das volle Potenzial neuester datengestützter Technologien erschließen.

Ein Machine-Learning-Algorithmus ist im Grunde genommen ein Software-Code und eine Reihe von Anweisungen, die ein Computer oder eine Maschine befolgen soll, damit ein bestimmtes Ergebnis erreicht wird.  Nur durch das Anwenden von Datensätzen auf den Algorithmus kann das KI-System trainiert werden, so dass es Muster erkennt, aus Erfahrung lernt und wichtige Erkenntnisse in großen Datenmengen aufzeigt. Je mehr Daten zugrunde liegen, desto mehr kann es lernen und desto besser die Antworten. Klingt einfach, oder?

Es gibt allerdings für diejenigen, die eine KI-basierte Lösung einsetzen und bereitstellen möchen, drei fundamentale Fragen, die zunächst beantwortet werden müssen:

1.           Was ist das geschäftliche Ziel, das erreicht werden soll?

2.           Liegen die Daten in einem digitalen Format vor und kann die KI sie verarbeiten?

3.           Vertrauen Sie der Qualität der Daten?

Wie bei jedem Einsatz digitaler Technologien muss es einen klaren geschäftlichen Grund geben, weshalb Technologietools oder -lösungen eingesetzt werden. Setzt ein Unternehmen auf komplexes Machine Learning, um Erkenntnisse zu gewinnen, für die auch eine Excel-Tabellenkalkulation genügt hätte, dann ist das vermutlich kein guter Einsatz von Ressourcen. Diese Erfahrung kann dazu führen, dass künftig zögerlicher in KI-Innovationen investiert wird.

Ist aber ein klares geschäftliches Ziel festgelegt, dann besteht der nächste Schritt darin zu verstehen, ob die nötigen Daten in digitaler Form vorhanden sind und wo im Unternehmen sich die Datensätze befinden, mit denen KI-Systeme trainiert werden. Zu wissen, woher die Daten stammen und wie zuverlässig und sicher sie während ihrer Lebensdauer sind, ist ebenfalls entscheidend.

Wenn ein Unternehmen schließlich den von einem KI-System generierten Ergebnissen vertrauen können soll, dann muss die Qualität der Daten, mit denen das System trainiert wird, ebenfalls vertrauenswürdig sein. So ist es beispielsweise entscheidend sicherzustellen, dass Verzerrungen, die in historischen oder Legacy-Daten vorhanden sind, erkannt und entfernt werden, ehe die Daten für das Training von KI-Systemen verwendet werden. Und KI-gestützte HR-Systeme, die auf historischen Daten basieren, könnten zu einheitlichen Einstellungsempfehlungen führen, die eine Mentalität des „Gruppendenkens“ nach sich ziehen. Das kann sich langfristig auf den Markterfolg eines Unternehmens auswirken.

Sich jetzt die Zeit zu nehmen und Art und Format von Datensätzen zu betrachten, die für das Training von KI-Systemen zum Einsatz kommen können, ist die einzige Möglichkeit, mit der sich ein Unternehmen wirklich auf KI vorbereiten kann. Dazu gehört untrennbar ein richtiger Ansatz beim Identifizieren, Bewerten und Beseitigen von Verzerrungen.

Mehr zu unserem Bericht über Datensicherheit erfahren Sie hier.

Be the first to comment

Comments ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.