X

Neuste Trends, Tipps, Strategien &
Events rund um das Thema Cloud

Sie brauchen eine Data-Science-Plattform – ob Sie's glauben oder nicht

Unternehmen hantieren heute zwangsläufig mit großen und immer noch wachsenden Datenmengen aus unterschiedlichsten Quellen. Das ist, je nachdem, ein Haufen produktives – oder totes! – Kapital. Ein Unternehmen, das Datenwissenschaft ignoriert, ist ungefähr so wie ein Land, in dem jeder Auto fährt, aber es gibt weder Straßenschilder noch ein Verkehrskonzept. Mal ganz grob gesagt.

 

Auf einen Blick: Warum Sie eine Data-Science-Plattform brauchen

Data Science Plattformen aus der Oracle Cloud ermöglichen Unternehmen, ihr Geschäftsergebnis mit datenwissenschaftlichen Tools, KI und ML zu optimieren.

 

Worum geht es bei Plattformen für Datenwissenschaft? Es ist natürlich völlig korrekt, wenn sich Unternehmen auf das Geschäftsergebnis konzentrieren. Aber das hat heute eine neue Bedeutung. Früher konnte es passieren, dass Data Scientists unter der Flagge der Innovation in alle möglichen Routine-Aufgaben oder in zeitraubende Versuche mit irgendwelchen Open-Source-Tools verwickelt waren. Kooperation? Ja, okay, nachher mal. Und auch noch unternehmensübergreifend? Schwierig, schwierig! – Kurz, zum eigentlich letzten Schritt, der wirklichen Idee von Data Science, nämlich brauchbare Modelle für das Unternehmen zu liefern, dazu kam es nur selten. 

Allerdings ist es heute deutlich kostspieliger als früher, wenn Unternehmensergebnisse nicht datenwissenschaftlich fundiert sind. Allein schon deshalb hat es Sinn, über eine datenwissenschaftliche Plattform für Ihr Unternehmen nachzudenken.

Lassen Sie uns aufdröseln, warum Sie diesen entscheidenden Schritt machen sollten und woher Sie wissen, wann der richtige Zeitpunkt dafür gekommen ist.

 

Hier liegt der Fokus der wirklich guten Plattformen für Data Science im Unternehmen

Der Markt für Data Science, maschinelles Lernen und KI ist fragmentiert, umkämpft und komplex; das macht die Sache zunächst etwas undurchsichtig. Gartner definiert eine Plattform für Datenwissenschaft und maschinelles Lernen als zusammenhängende Softwareanwendung; sie bietet eine Mischung aus grundlegenden und unerlässlichen Bausteinen für die Erstellung vieler Arten von Data-Science-Lösungen und die Integration solcher Lösungen in Geschäftsprozesse, in die umgebende Infrastruktur und Produkte. Hauptsächlich werden diese Plattformen von Datenexperten, Citizen Data Scientists, Dateningenieuren und Ingenieuren oder Spezialisten für maschinelles Lernen benutzt.

 

Der Zweck hochentwickelter Data-Science-Plattformen ist im Allgemeinen,

•      Data Scientists produktiver zu machen, indem die Plattformen ihnen helfen, Modelle schneller und mit weniger Fehlern bereitzustellen;

•      die Arbeit von Data Scientists mit großen Datenmengen unterschiedlicher Art zu erleichtern;

•      zuverlässige künstliche Intelligenz auf Unternehmensebene bereitzustellen, die verzerrungsfrei, überprüfbar und reproduzierbar ist.

 

Warum Data-Science-Plattformen der beste Weg zur Nutzung von Open Source sind

Data Scientists beschäftigen sich häufig mit Open-Source-Tools. Sie haben dazu also schon eine gewisse Affinität, wenn sie diese Tools in ihrer Funktion in einem Unternehmen weiterhin einsetzen. Allerdings kann es einige Herausforderungen nach sich ziehen, sich allein auf Open-Source-Werkzeuge zu verlassen, z. B.

•      Schwierigkeiten bei der Verwaltung verschiedener Tools mit unterschiedlichen Versionen

•      Komplikationen, die bei der gemeinsamen Nutzung von Code und Sharing-Modellen auftreten

•      Governance- und Sicherheitsfragen

•      Zeit und Kosten für die Integration und Wartung dieser Werkzeuge

•      Schwierigkeiten beim Einsatz von Machine-Learning-Modellen in Unternehmens-Dashboards und -systemen

 

Jetzt die gute Nachricht: Ein Data Scientist kann durchaus die Vorteile von Open Source nutzen, ohne zugleich mit diesen Problemen konfrontiert zu sein: durch die Wahl einer Data-Science-Plattform, die Zugang zu verwalteten Open-Source-Tools und Bibliotheken bietet. Auf diese Weise haben Data Scientists eine effektive Möglichkeit, ihre Arbeit zu organisieren und zu verwalten und zugleich ihre bevorzugten Werkzeuge und Bibliotheken zu verwenden. Außerdem – auch nicht zu verachten! – sind sie nicht mehr auf die IT angewiesen, um ihre bevorzugten Werkzeuge und Bibliotheken einzurichten oder zu pflegen.

Noch ein Aspekt kommt hinzu: Tools allein gewährleisten noch keine Teamzusammenarbeit sowie den größeren datenwissenschaftlichen Lebenszyklus, der zwischen IT, Geschäftsanalysten und Entwicklern besteht. Eine effektive Data-Science-Plattform stellt die Möglichkeit her, dass Machine-Learning-Modelle im gesamten Unternehmen konsistent operationalisiert werden und dass Daten von verschiedenen Orten – genauso wie intern – in der Cloud und in hybriden Verwaltungsumgebungen aufgefunden, gemeinsam genutzt und von Teams produktiv genutzt werden können.

 

Kollaborative Machine-Learning-Plattformen: Das ist im Angebot

Im Wesentlichen verfügen Data-Science-Plattformen über Werkzeuge, die Data Scientists brauchen, um Open-Source-Bibliothekssprachen und -Frameworks zu unterstützen. Die passende kollaborative Plattform sollte auch ein reichhaltiges Portfolio an integrierten Produkten und Komponenten bieten, die der Data Science in verschiedenen Phasen des Lebenszyklus weiterhelfen.

Da die Zusammenarbeit zwischen Data Scientist, IT, Geschäftsanalytikern und Entwicklern für die Steigerung der Produktivität und der Geschäftsergebnisse unerlässlich ist, bieten wirklich gute Plattformen für die Datenwissenschaft Funktionen, die Folgendes abdecken:

•      Aufnahme von Daten

•      Datenaufbereitung

•      Datenexploration

•      Feature-Engineering

•      Modellerstellung und -training

•      Prüfung von Modellen

•      Bereitstellung

•      Überwachung

•      Wartung

 

Eine vollständige und integrierte Data-Science-Plattform sollte über die Grundfunktion hinausgehen, den Lebenszyklus der Datenwissenschaft zu unterstützen: Sie sollte also auch Möglichkeiten zur Aufnahme und Umwandlung von Daten bieten. Sie sollte Möglichkeiten zur Verwaltung und Sicherung der Daten bieten. Und sie sollte zusätzliche Dienste bereitstellen, wie z.B. einen Analysedienst zur Visualisierung, einen Graphenanalysedienst zur Erweiterung des maschinellen Lernens oder einen Datenkatalog zur Erforschung von Daten. Cloud-basierte Data-Science-Plattformen bieten außerdem die Vorteile verwalteter Services, unbegrenzter Speicher- und Rechenkapazität sowie eine stärker integrierte Umgebung für die Zusammenarbeit von Teams.

 

Data-Science-Plattformen im praktischen Einsatz

Es ist ja nicht so, als ob das nur schöne Theorie wäre! Der echte Wert einer Data-Science-Plattform zeigt sich in tatsächlichen Anwendungsfällen. Interessanterweise hat sich ausgerechnet die Landwirtschaft die Datenwissenschaft zu eigen gemacht, um Nutzpflanzenkrankheiten und die Nahrungsmittelknappheit zu bekämpfen.

Ein israelisches Landwirtschaftsunternehmen setzt erfolgreich eine cloudbasierte Data-Science-Plattform ein, um von autonomen Drohnen erfasste Daten zu analysieren. Die Drohnen flogen über Felder und machten Bilder von Nutzpflanzen, die in die Cloud hochgeladen und mit maschinellem Lernen auf Pflanzenkrankheiten analysiert werden. Die Landwirte können dann genau dort Pestizide gegen Schädlinge einsetzen, wo es am notwendigsten ist.

Der Umstieg auf eine cloudbasierte Data-Science-Plattform ermöglichte dem Unternehmen den Übergang von einer statischen zu einer dynamischen Anwendung, die Cloud-native Container und DevOps zur Unterstützung von Micro Services verwendet. Damit stand der Weg offen für ein tägliches globales Onboarding neuer Kunden sowie für die Aktualisierung von Anwendungsversionen innerhalb von Minuten, im Gegensatz zu den 24 Stunden, die früher erforderlich waren.

Die Plattform hat auch den Zugang zur Rechenleistung verbessert, so dass Landwirte Tausende von Bildern in wenigen Minuten abfragen und vergleichen können, um den Zustand ihrer Kulturen besser zu diagnostizieren.

 

Wann wechseln Sie zu einer Data-Science-Plattform?

Wenn Produktivität und Zusammenarbeit Anzeichen von Belastung zeigen, Modelle für maschinelles Lernen nicht geprüft oder reproduziert werden können oder Modelle nie in Produktion gehen – dann spricht einiges dafür, dass Ihre Organisation für eine Data-Science-Plattform reif ist.

So weit sollten Sie es aber nicht kommen lassen. 

Oracle bietet eine breite Palette von Services zur Unterstützung im Bereich Data Science an, vor allem

•      Oracle Cloud Infrastructure Data Science, die Unternehmen dabei hilft, gemeinsam Machine-Learning-Modelle zu erstellen, zu trainieren, zu verwalten und einzusetzen, um den Erfolg heutiger datenwissenschaftlicher Projekte zu steigern, und

•      Oracle Machine Learning, das die Leistungsfähigkeit des datenbankinternen maschinellen Lernens nutzt, um datenwissenschaftliche Projekte voranzutreiben.

 

Jeder dieser Services umfasst Workshops für einen leichten Einstieg. Beginnen Sie noch heute mit dieser Innovation, um zu neuen Ergebnissen vorzustoßen:

·      Oracle Cloud Infrastructure Data Science Workshop

·      Oracle Machine Learning Workshop

·      Sie können Oracle Cloud Infrastructure Data Science auch kostenlos testen.

 

Um mehr darüber zu erfahren, wie Oracle Data-Science-Lösungen für Ihr Unternehmen von Nutzen sein können, besuchen Sie unsere Oracle Data Science-Seite und folgen Sie uns auch auf Twitter @OracleDataSci.

 

Kontakt:

Ein spannendes Thema, über das ich gerne mit Ihnen spreche, per E-MailLinkedInXing oder Twitter. Sabine Leitner, Sr. Marketing Manager.

 

Kommentieren

Kommentare ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.