X

Neuste Trends, Tipps, Strategien &
Events rund um das Thema Cloud

Schlüsselfaktoren für Data Science Projekte

Wo liegt eigentlich der Schlüssel für eine erfolgreiche Umsetzung eines Data Science Projektes? Hängt es von den Beteiligten ab? Na ja, die zahlreichen Mitarbeiter mit den verschiedenen Aufgabenbereichen im Workflow spielen sicher eine wichtige Rolle; von IT-Mitarbeitern, die die Infrastruktur für die Datenerhebung zusammenstellen, über Data Scientists, die die Modelle entwickeln, bis hin zu den Anwendern im Unternehmen, die diese Modelle dann zum Gewinn von Erkenntnissen nutzen. Sie bilden quasi die Links in der langen Kette des Prozesses von der Datenerhebung bis zur Anwendung und Übertragung auf das Geschäft.

 

Auf einen Blick: Schlüsselfaktoren für Data Science Projekte

Unternehmen benötigen Data Science Verfahren, um aus immer größeren Datenmengen erfolgskritische Erkenntnisse zu gewinnen. Wie geht das?

 

Big Data bedeutet praktisch, dass es manuell fast unmöglich ist, diese Datenmengen effizient und in einem vertretbaren Zeitrahmen zu verarbeiten. Dazu ist Machine Learning erforderlich und der Einsatz einer geeigneten ML-Plattform ist sogar erfolgskritisch für den gesamten Prozess.

"Was wollen Unternehmen? – Sie suchen nach neuen Wegen, um ihre Kunden zufriedenzustellen; sie wollen in ihrer Organisation effizienter arbeiten oder die Dinge innovativer gestalten", sagt Aali Masood, Senior Director bei Big Data Go to Market. Masood präsentierte vor kurzem einen Oracle-Webcast mit dem Titel Accelerate Data Science on Oracle Cloud, der sich eingehend mit diesem Thema befasst.

Hier sind eine Übersicht zum Prozessablauf und einige Beispiele außerhalb des Bereichs der Datenmodellierung:

 

Daten Management: Wenn Daten aus verschiedenen Quellen in einen Data Lake einfließen, dann wird dieser höchstwahrscheinlich schon bald unübersichtlich sein –  vor allem, wenn man vorher keine klaren Organisations- und Speicherstrukturen festgelegt hat. Hier ist maschinelles Lernen hilfreich, indem es schon im Vorbereitungsprozess konsistente Muster bei den Daten identifiziert. Beispielsweise kann man mit ML die Verwendung eines Datenkatalogs optimieren, damit Metadaten automatisch auf bestimmte Datentypen angewendet werden; so wird das Auffinden von Daten für einen effizienteren Modellaufbau deutlich leichter.

Analytics: ML unsterstützt Business Analysten auf vielfältiger Weise, von der Identifizierung von Key-Indikatoren über die Berechnung von Vorhersagen und Prognosen bis hin zur Unterstützung bei der Erstellung von Analysen und Visualisierungen.
Nun liegt es zwar auf der Hand, dass maschinelles Lernen für Data Science notwendig ist, aber wie lässt sich am besten sicherstellen, dass es für Teams und Organisationen verfügbar und nahtlos integrierbar ist?

 

Die Oracle Data Science Platform

Machine Learning ist das Herzstück der Oracle Cloud Infrastructure Data Science Platform. Masood konzentriert sich speziell auf fünf Komponenten, die in Kombination miteinander den gesamten Lifecycle unterstützen.

Oracle Cloud Infrastructure Data Science: diese Unternehmensplattform ermöglicht es Data Scientists mit Open Source Tools flexibel vorzugehen und gleichzeitig mit anderen zusammenzuarbeiten, um gemeinsam Projekte umzusetzen und ML-Modelle zu entwickeln. Die Infrastruktur unterstützt automatisierte Arbeitsabläufe und vereinfacht den Entwicklungsprozess.

Oracle Machine Learning: integrierte Algorithmen für Machine Learning mit der Unterstützung von SQL, R und Python ermöglichen die Entwicklung von Anwendungen, die Echtzeit-Vorhersagen durchführen.

Graph Analytics: Basierend auf Oracle Big Data Spatial and Graph können Sie mit den erweiterten Funktionen für die räumliche Analyse und Diagrammanalyse Geodaten einfach verarbeiten, anreichern und anspruchsvolle leistungsstarke Diagrammanalysen nutzen.

Oracle Analytics Cloud: mithilfe von ML ermöglicht es die Oracle Analytics Cloud Business Analysten, Modelle zu erstellen, Visualisierungen zu generieren und Prognosen abzuleiten auf Self-Service-Basis.

Oracle Big Data Platform: Unter der Oracle Big Data Platform wird der gesamte Daten-Workflow – von der Datenaufnahme bis zur Datenanlyse – in einer einheitlichen Plattform zusammengeführt. Konsolidierte Daten bedeuten verbesserten Zugriff und größere Flexibilität, besonders wenn komponentenübergreifend ein durchgängiges Verfahren verwendet wird.

 

Der vollständige Data-Science-Lifecycle

 

 

Eines ist klar: Bei Data Science geht es nicht allein darum, wie die ML-Modelle umzusetzen sind. Vielmehr erfordert das Ganze einen durchgängigen Prozess: von der Infrastruktur, die für die Aufnahme der Daten erforderlich ist, bis hin zu den Visualisierungen, die die Ergebnisse veranschaulichen, inklusive der Arbeit der Data Scientists auf der ganzen Strecke. Wie Masood im Webinar erklärt: "Um mit Data Science Erfolg zu verbuchen, muss man über den gesamten Lifecycle hinweg Erfolge verzeichnen. Es geht darum, dass Data Scientists, Business-Analysten und Ingenieure zusammenkommen." Machine Learning hält das also im Fluss und macht in einigen Fällen sogar Schritte entbehrlich.

Darüber und über vieles mehr spricht Masood in der gesamten 30-minütigen Präsentation, einschließlich der Fragen:

  • Wie man den Lebenszyklus von ML-Modellen effizient verwaltet
  • Wie Data Science Teams effizient zusammenarbeiten können
  • Wie man wichtige Daten zur Erstellung von ML-Modellen identifziert

Um das vollständige Webinar für Accelerate Data Science with Oracle Cloud zu verfolgen, registrieren Sie sich einfach, um einen Link zur On-Demand-Ansicht zu erhalten.

Wenn Sie mehr darüber erfahren möchten, wie Sie das Beste aus Ihren Big Data herausholen können, besuchen Sie die Oracle Data Science Cloud – und vergessen Sie nicht, den Oracle Big Data-Blog zu abonnieren, um die neuesten Beiträge als Erster in der Hand zu haben. Folgen Sie uns auch auf Twitter @OracleBigData.

 

Kontakt:

Ein spannendes Thema, über das ich gerne mit Ihnen spreche, per E-MailLinkedInXing oder Twitter. Cesar Ortiz, Principal Solution Engineer.

Kommentieren

Kommentare ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.