„Wenn die IT schon anfängt, mal wieder etwas zu implementieren…!“ – Da ist was dran, zumindest manchmal. In tragischen Fällen auch dauernd. Jetzt die gute Nachricht: Muss aber nicht sein. Schauen Sie sich einmal die Zahlen an.
Auf einen Blick: Leisten Sie sich die etwas intellektuellere Datenbank
Datenbanken mit integriertem Machine Learning bieten Unternehmen schnellere und effizientere Daten-Analyseprozesse durch Lösungen von Oracle Big Data.
Um zum Beispiel ein trainiertes Modell maschinellen Lernens zu übernehmen und im Unternehmen in Gang zu bringen, allein dafür brauchten 14 Prozent der Befragten mehr als 9 Monate. Das nackte Grauen also. Aber bei über 20 Prozent dauerte dieser Schritt nur wenige Tage bis wenige Wochen. Untersucht haben das die Datenexperten von TDWI.
Vermutlich wollen Sie zu den 20 agilsten Prozent gehören. Die Frage ist, wie denn nun ein solches agileres maschinelles Lernen geht. Ein vielversprechender Ansatz ist natürlich, das Kapital Ihrer eigenen Datenbank für das maschinelle Lernen ins Rennen zu werfen.

Was kann Machine Learning überhaupt wirklich?
Einige Anwendungen von Machine Learning sind schon fast Pop, z. B. Computer, die Kunst und Musik durch maschinelles Lernen erschaffen. Das ist jetzt ein etwas spezieller Markt – aber was breite Schichten von Unternehmern wirklich vom Hocker reißt, ist die Fähigkeit des maschinellen Lernens, mithilfe großer Mengen von Daten und der anschließenden Nutzung von Computern mit Algorithmen eigenständig Muster und Trends aufzudecken. Computer können auf diese Weise lernen, Daten zu erkunden, um bisher verborgene Informationen zu nutzen.
Dies ermöglicht es Unternehmen unter anderem,
- Einzelhandelsumsätze durch einen Empfehlungsalgorithmus zu steigern;
- Geräteausfällen mit einem Vorhersagealgorithmus vorzubeugen;
- Betrugsversuche durch Anomalieerkennung aufzudecken;
- all dies mit Machine Learning auf eine Weise zu erreichen, die traditionelle Analytik einfach nicht beherrscht.
Machine Learning und Datenbanken: Der Blick unter die Motorhaube

Spoileralarm: Es gibt Datenbanken, die bereits mit maschinellem Lernen ausgestattet sind. Das bedeutet erst einmal, dass für Sie im Unternehmen ein paar Kleinigkeiten wegfallen: Sie brauchen keine Data Science Platform mehr dazuzukaufen. Sie müssen nicht lernen, wie man Hadoop benutzt. Und Sie müssen sich nicht gleich am Anfang schon mit Data Lakes herumschlagen.
Eigentlich haben Sie also schon alles, was Sie brauchen, um loszulegen, wenn Sie eine solche Datenbank mit maschinellem Lernen verwenden. Zugegeben, das ist nicht bei jedem Datenbankanbieter so, und es läuft auch nicht bei jeder Plattform für Machine Learning so. Aber entscheidend ist, das Leben wird für Sie schon mal in vieler Hinsicht leichter. Hier sind ein paar Beispiele:
- Sie stellen mit Ihren vorhandenen Daten mehr an als je zuvor. Zugleich behalten Sie aber komplett die Kontrolle über diese Daten, weil es allein Ihre Datenbank ist, aus der neue Erkenntnisse sprudeln – nichts muss nach draußen.
- Sie probieren unterschiedlichste Operationen mit den Machine Learning Tools aus, die bereits mit der Datenbank geliefert werden und dafür optimiert sind, eben einfach loszulegen. Mit den richtigen Produkten können Sie sogar ohne Data-Scientist-Kenntnisse experimentieren, obwohl diese Skills dabei auch wieder nicht schaden.
- Maschinelles Lernen in der Datenbank hilft Ihnen an allen Ecken und Enden – von der Betrugserkennung über die Vorhersage des Kundenverhaltens bis hin zur Identifizierung von Verkaufsmöglichkeiten.
- Sie erleichtern es Ihren Teams, die von Ihnen erstellten Machine-Learning-Modelle zu nutzen, und Sie operationalisieren zugleich Ihr maschinelles Lernen einfacher denn je.
- Es gibt also im Detail einen Haufen Vorteile, wenn Sie Ihre Datenbank mit maschinellem Lernen von oben bis unten nutzen – zuvor aber zum besseren Verständnis noch ein kurzer Blick auf den Prozess selbst.
So läuft Data Science mit maschinellem Lernen
Vereinfacht dargestellt, beginnt alles (konkret also das datenwissenschaftliche Verfahren zur Entwicklung von Modellen des maschinellen Lernens) damit, die für das Modell benötigten Daten zu identifizieren. Wenn Sie eine gesonderte Plattform für Machine Learning verwenden, müssen die Daten aus der jeweiligen Quelle extrahiert und in diese Plattform geladen werden.

Anders sieht es aus, wenn Sie innerhalb der Datenbank arbeiten. Dann werden nämlich die Daten bereits vorhanden sein und Sie müssen sie nicht extrahieren. Damit entfällt schon einmal ein oft zeitaufwändiger Schritt.
Die nächsten drei Schritte umfassen den eigentlichen Kern des Prozesses: das Verstehen und die Aufbereitung der Daten, den Aufbau des Modells und dann das Testen und Bewerten des Modells. Diese Schritte werden eventuell mehrfach wiederholt.
Wenn Sie mit dem Ergebnis zufrieden sind, deployen Sie das Modell. Jetzt können Sie es mit neuen Daten füttern und je nach Bedarf von Personen bzw. Anwendungen verwenden lassen. Wenn Sie bisher etwa mit einer Open-Source-Plattform für Machine Learning gearbeitet haben, war das unter Umständen einer der schwierigsten Schritte. Denn dann tauchen Fragen auf wie: Auf welcher Hardware wird das laufen? Wie funktioniert der Zugriff auf Daten? Muss Code in eine andere Sprache konvertiert werden? Muss ich über eine API darauf zugreifen?
Wenn Sie dagegen Ihr maschinelles Lernen in der Datenbank selbst aufgebaut haben, dann führen Sie es auch in der Datenbank aus. Es ist nicht notwendig, Code zu konvertieren. Rufen Sie das Modell einfach aus einer SQL-Anweisung auf. Zusätzlich steht Ihnen bei Bedarf die Möglichkeit zur Verfügung, dieses Modell als REST-API zu nutzen.
Dieser Ablauf macht deutlich, dass Sie 40 Prozent der Sachen, die Sie sonst für den Aufbau und die Bereitstellung eines Modells brauchen, deutlich vereinfachen können. Hier haben Sie ein echtes Potential, den Wert Ihrer vorhandenen Daten zu maximieren. – Jetzt aber zu den Vorteilen, mit vorhandenen Daten zu operieren.
3 Vorteile von Machine Learning innerhalb Ihrer Datenbank
- (Fast) alles wird einfacher
Ihre Daten sind bekanntes Gelände. Für Datenwissenschaftler oder wen auch immer ist die Arbeit mit Daten in der Datenbank im Vergleich zu Daten im Data Lake so etwas wie ein digitales Schlaraffenland: Die Daten sind quasi servierfertig, clean, sie sind verwaltet, und oft können Sie einfach loslegen und Analysetechniken praktisch einsetzen.
Wenn Ihre Datenbank mit maschinellem Lernen ausgestattet ist, können Sie Ihre eigenen Leute daransetzen. Sie ersparen es sich, mehrere Mitarbeiter einzustellen, die jeder (hoffentlich!) Experte für eine der fünf Softwareplattformen sind, die Sie in Ihrem maschinellen Lern-Workflow glauben zu benötigen. Sie können einfach ein oder zwei Mitarbeiter einstellen, die mit Ihrem bestehenden Ökosystem gut vertraut sind, oder Sie greifen auf Talente in Ihren Teams zurück. Jedenfalls können Sie auf diese Weise sicher sein, dass alle wirklich im selben Film sind – weil sie sich ja auf derselben Plattform bewegen.
Nicht zuletzt können Sie auch davon ausgehen, dass Ihr Datenbankanbieter seine Datenbank wirklich dahingehend optimiert hat, dass sie für maschinelles Lernen tadellos funktioniert. Machine Learning ist deswegen noch kein Sonntagsspaziergang. Aber umso attraktiver ist es, sich jede verfügbare Vereinfachung der Prozesse zunutze zu machen.
- (Fast) alles geht schneller
Bei Oracle gibt es im Bereich Machine Learning ein hervorstechendes Merkmal. Vor rund 20 Jahren war für uns absehbar, dass die Verschiebung immer größerer Datenmengen von A nach B, nämlich um dann spannende Algorithmen darauf loslassen zu können, sich zum Elefanten im Raum auswachsen würde: Es kann dabei ja durchaus Stunden oder Tage dauern, bloß um die blöden Daten auf eine andere Plattform zu transferieren – bevor auch nur irgend etwas Interessantes dabei herauskommt. Und das Ganze wird auch zunehmend komplex, wenn man z. B. an mögliche Datenverluste denkt. Nebenbei bemerkt, das ist vielerorts auch heute noch leidvoller Alltag.
Daher war die Idee bei Oracle, dass es weitaus schlauer ist, die Algorithmen gleich in die Datenbank zu verfrachten, wo auch die Leistungsfähigkeit für extrem schnelle Prozesse bereit steht, und wo die Datenbank auch als Sprungbrett für den Zugriff auf Daten in anderen Datenbanken dient – übrigens eine weitere zeitsparende native Funktion der Oracle Database.
- (Fast) überall werden Ergebnisse schneller greifbar
Das Dumme ist oft, dass maschinelles Lernen für Unternehmen normalerweise erst dann eine Rolle spielt, wenn das Modell produktiv im Unternehmen eingeführt wird. Zugleich kann es einiges an Zeit und Mühe kosten, ein maschinelles Lernmodell zu erstellen, es zu trainieren, Ergebnisse zu erzielen und die Ergebnisse zu analysieren.
Beispiel: Sie erstellen ein hübsches Lead-Scoring-Modell für Ihr Marketing-Team und freuen sich so richtig, wie überlegen und ausgereift Ihre neuen kategorisierten Leads sind. Aber bevor dieses Lead-Scoring-Modell in die Systeme Ihres Marketing-Teams integriert ist, bevor es tatsächlich als Teil des Workflows verwendet wird, ist dieses Projekt für maschinelles Lernen nicht produktiv.
Genau hier liegt die praktische Relevanz der erwähnten Umfrage des TDWI: 20 Prozent der Befragten schaffen es in weniger als einem Monat, aber 14 Prozent schlagen sich über 9 Monate lang damit herum. Die Operationalisierung kann also einfach oder sehr komplex sein, denn die Bereitstellung und Integration in Anwendungen wie Business Intelligence (BI)-Dashboards, Call Center, Geldautomaten, Websites oder mobile Geräte ist unter Umständen ziemlich herausfordernd für die IT. Fehler können sich in mehreren Phasen einschleichen. Das Ganze ist ein wirklich komplizierter Prozess, und die Phase der Modellbereitstellung kann zeitaufwändig und teuer werden.
Moderne datengetriebene Unternehmen verfolgen daher das Ziel, über ein operationalisiertes Modell mit echten geschäftlichen Vorteilen zu verfügen. Damit können Sie Ihrem Führungsteam etwas präsentieren, was das Geschäft tatsächlich und nachweislich durch maschinelles Lernen verbessert hat, und zwar mit imposanten Ergebnissen.
Ein großer Schritt zu mehr Effektivität
Für Ihr Unternehmen bedeutet maschinelles Lernen mit vorhandenen Daten in der Datenbank also, dass Sie mit der richtigen Datenbank und dem richtigen Anbieter für maschinelles Lernen die Schritte für effizienteres, schnelleres und einfacher zu bedienendes maschinelles Lernen minimieren können. Sie gewinnen
- mehr Einfachheit für Sie und Ihre Mitarbeiter, da Sie mit Tools und Daten starten, mit denen Sie schon vertraut sind;
- mehr Zeit durch Algorithmen in der Datenbank, die eine minimierte Datenbewegung und mehr Geschwindigkeit bei geringeren Kosten gewährleisten;
- schnellere Ergebnisse mit Modellen in der Datenbank, die einfacher zu implementieren und zu operationalisieren sind.
Wie Sie von Oracle Big Data profitieren können, erfahren Sie auf Oracle.com/Big-Data. Und wenn Sie den Oracle Big Data Blog abonnieren, bleiben Sie als Erster mit den neuesten Entwicklungen auf dem Laufenden.
Kontakt:
Ein spannendes Thema, über das ich gerne mit Ihnen spreche, per E-Mail, LinkedIn, Xing oder Twitter. Cesar Ortiz, Principal Solution Engineer.