X

Neuste Trends, Tipps, Strategien &
Events rund um das Thema Cloud

Big Data: 4 Gründe, warum Unternehmen Data Lakes brauchen

Der Treibstoff des Geschäftslebens sind nicht mehr einfach bloß Daten – es sind Big Data! Diese massiven Datenmengen werden von zukunftsorientierten Unternehmen zu Analysezwecken gesammelt. Sie sind zentrales Element jeder betrieblichen Strategie: in Vertrieb, Marketing, Finanz- und Personalwesen sowie so gut wie allen anderen Abteilungen. Sie sind auf Big-Data-Lösungen angewiesen, um der Konkurrenz einen Schritt voraus zu sein. Eine ganz andere Frage ist allerdings, wie Unternehmen überhaupt mit diesen großen Datenmengen umgehen.

Auf einen Blick: Big Data - 4 Gründe, warum Unternehmen Data Lakes brauchen


Data Lakes sind für die Marktposition jedes Unternehmens nötig, das jetzt oder in Zukunft mit Big Data zu tun hat. Hier die 4 wichtigsten Gründe dafür.

 

Und damit sind wir mitten im Thema Data Lakes. Data Lakes sind Speicherbereiche, die Daten aus verschiedenen Quellen aufnehmen können. Anstatt nun die Daten für eine sofortige Analyse zu verarbeiten, werden hier alle empfangenen Daten in ihrem ursprünglichen Format gespeichert. Das ermöglicht die Speicherung großer Datenmengen bei minimalem Ressourceneinsatz. Die Daten werden nur dann verarbeitet, wenn sie zur Verwendung aufgerufen werden. Hier liegt der Unterschied zu einem Data Warehouse, das alle eingehenden Daten verarbeitet. Data Lakes können also eine höchst effiziente Art der Speicherung, des Ressourcenmanagements und der Datenaufbereitung sein.

Fall Sie aber nun schon ein Data Warehouse haben – brauchen Sie dann tatsächlich auch noch einen Data Lake? Die Antwort ist ein klares Ja. Denn die Menge der über unzählige Geräte übertragenen Daten nimmt ständig zu. Das macht es für Unternehmen erfolgskritisch, vor allem ressourcenschonend auf Daten zugreifen zu können. Konkret gibt es 4 spezifische Gründe, warum ein Data Lake immer notwendiger wird.

 

90 % aller Daten wurden seit 2016 generiert

Was in den wenigen Jahren seit 2016 passiert ist, veranschaulicht das schwindelerregende exponentielle Wachstum der Datengenerierung und -verarbeitung. Denn schon bis 2016 gab es ja Wi-Fi, Smartphones und Hochgeschwindigkeits-Datennetzwerke. In den frühen 2000er Jahren war Streaming auf Audio beschränkt; Breitbandverbindungen dienten hauptsächlich zum Surfen im Internet, für E-Mails und Downloads. Gerätedaten waren in dieser Welt eher Peanuts. Dennoch kam bereits in dieser Zeit eine bis dahin absolut unvorstellbare Datenmenge zusammen. Aber das alles summierte sich bloß auf kaum mehr als ein Zehntel der Daten, die seit 2016 hinzukamen.

Der größte Teil des Datenverkehrs betraf die zwischenmenschliche Kommunikation, denn Video und Fernsehen kamen noch nicht auf jene Stufe der Komprimierung, die qualitativ hochwertiges Streaming überhaupt erst ermöglicht. Gegen Ende des Jahrzehnts verbreiteten sich dann Smartphones; Netflix verlagerte seinen Geschäftsschwerpunkt auf Streaming. Das exponentielle Wachstum des Datenverkehrs zwischen 2010 und 2020 beruhte auf immer mehr Smartphones (und ihren Apps), sozialen Medien, Streaming-Diensten für Audio und Video, Streaming-Plattformen für Videospiele, Software-Downloads (statt durch physische Medien) usw.

Für die Wirtschaft am relevantesten war und ist die wachsende Anzahl von Unternehmen, mit Anwendungen, die kontinuierlich Daten von und zu Geräten übertragen, sei es zur Steuerung dieser Geräte, zur Bereitstellung von Anweisungen und Spezifikationen oder zur stillen Übertragung von Benutzermetriken im Hintergrund.

Mit der weitgehenden Einführung von 5G-Datennetzen werden die Bandbreiten und Geschwindigkeiten noch einmal weiter zunehmen.

 

95 % der Unternehmen verarbeiten unstrukturierte Daten

In dieser digitalen Welt sammeln Unternehmen Daten aus allen Arten von Quellen, und das meiste davon ist unstrukturiert. Nur ein Beispiel: Nehmen wir die Daten, die von einem Unternehmen gesammelt werden, das Dienstleistungen verkauft und Termine über eine App vereinbart. Einige dieser Daten kommen zwar strukturiert, also in vordefinierten Formaten und Feldern wie Telefonnummern, Daten, Transaktionspreisen, Zeitstempeln usw., aber ein solches Unternehmen muss darüber hinaus noch eine Menge unstrukturierter Daten archivieren und speichern. Unstrukturierte Daten sind alle Arten von Daten, die keine inhärente Struktur oder vordefinierten Modelle enthalten. Das erschwert die Suche, Sortierung und Analyse, jedenfalls ohne weitere Vorbereitung.

Für unser obiges Beispiel kommen die unstrukturierten Daten in einer Vielzahl von Formaten herein. Bei einem Benutzer, der einen Termin vereinbart, gelten alle Textfelder, die ausgefüllt werden, um diesen Termin zu vereinbaren, als unstrukturierte Daten. Innerhalb des Unternehmens selbst sind E-Mails und Dokumente eine weitere Form unstrukturierter Daten. Auch die Beiträge aus dem Social-Media-Kanal des Unternehmens sind unstrukturiert. Ebenso alle Fotos oder Videos, die von den Mitarbeitern bei der Erbringung von Dienstleistungen als Notizen verwendet werden, nicht zuletzt auch alle vom Unternehmen als Marketingmittel erstellten Schulungsvideos oder Podcasts.

Unstrukturierte Daten gibt es also überall, und je mehr Geräte sich verbinden, um eine größere Bandbreite an Informationen zu liefern, desto deutlicher wird, dass Unternehmen eine Möglichkeit brauchen, sich um all diese Daten kümmern zu können.

 

4,4 Mio. GB Daten werden in den USA jede Minute genutzt

In den USA leben über 325 Millionen Menschen. Fast 70 Prozent von ihnen haben Smartphones. Und selbst wenn man die Menschen weglässt, die derzeit irgendwelche Medien streamen, bleibt es hochgradig beachtlich, was auf einem durchschnittlichen Smartphone in einer Minute passiert. Es empfängt zum Beispiel ein Update über das Wetter. Es prüft, ob neue E-Mails im Posteingang des Benutzers angekommen sind. Es sendet Daten an soziale Medien, stellt Voicemail über Wi-Fi bereit und liefert strategische Marketingbenachrichtigungen von Anwendungen, z. B. wenn eine Immobilienapp einen neuen Wohnungseintrag bewirbt. Es sendet Text und Bilder über Chat-Apps und lädt im Hintergrund App- sowie OS-Updates herunter.

Kurz und gut, Daten über Daten. Das bedeutet, dass in der vergangenen Minute, während Sie den letzten Absatz gelesen haben, 4,4 Millionen GB Daten in den USA übertragen worden sind. Das jedenfalls sagt der Report „Data Never Sleeps“ von Domo. Wohlgemerkt, das sind nur die Vereinigten Staaten; kombiniert mit dem Rest der Welt, wächst das Gesamtdatenvolumen exponentiell an.

Für Unternehmen ist die Erfassung dieser Art von Daten für alle Aspekte der Geschäftstätigkeit von entscheidender Bedeutung, vom Marketing über den Verkauf bis hin zur Kommunikation. Daher muss jedes Unternehmen einen deutlichen Schwerpunkt auf sichere, stets verfügbare und zugängliche Speicherplätze setzen.

 

50 % der Unternehmen sagen, dass Big Data Vertrieb und Marketing verändert haben

Die meisten Menschen denken bei Big Data zunächst an die technischen Aspekte. Schon klar: Ein Unternehmen, das über eine Telefonapp arbeitet oder eine Form von Streaming anbietet, verwendet Big Data und bietet einen Service an, der vor zwanzig Jahren einfach nicht denkbar gewesen wäre. Big Data sind jedoch viel mehr als die Bereitstellung von Streaming-Inhalten. Sie können erhebliche Verbesserungen in den Bereichen Vertrieb und Marketing bewirken – und zwar in einem Ausmaß, dass laut einem McKinsey-Bericht 50 % der Unternehmen sagen, Big Data veranlassten sie dazu, ihre Vorgehensweisen in diesen Bereichen zu ändern.

Die Ursache dafür ist die: Mit Big Data können Unternehmen ihre Kunden viel effizienter verstehen als etwa mit persönlichen Fokusgruppen. Die Daten ermöglichen es, eine Gesamterhebung von Aktionen bestehender und potenzieller Kunden zu sammeln: Alles wird breit verfügbar, vom Surfen auf Ihrer Website vor der Konvertierung bis hin zur Dauer der Beschäftigung mit bestimmten Merkmalen eines Produkts oder einer Dienstleistung.  Dadurch entsteht eine ausreichend große Stichprobe für die Erstellung einer zuverlässigen Kunden-Persona. Um zur Spitzengruppe zu gehören, muss ein Unternehmen einfach über ausreichend Dateninfrastruktur verfügen, um riesige Mengen an strukturierten und unstrukturierten Daten zu empfangen, zu speichern und abzurufen, die dann verarbeitet werden sollen.

 

Fazit: Man braucht einen Data Lake, Punkt.

Die vier genannten Statistiken laufen alle auf eines hinaus: Ihre Organisation braucht einen Data Lake. Und wenn Sie beim Datenmanagement nicht schon jetzt einen Schritt voraus sind, ist zu befürchten, dass der Rest der Welt überall an Ihnen vorbeiziehen wird: im laufenden Betrieb, im Vertrieb, im Marketing, in der Kommunikation und in anderen Abteilungen. Daten sind heute einfach Teil des Lebens; sie ermöglichen präzise, auf Erkenntnissen basierende Entscheidungen und eine unvergleichlich tiefgehende Analyse. In Kombination mit maschinellem Lernen und künstlicher Intelligenz ermöglichen Daten schließlich auch eine vorausschauende Modellierung Ihrer zukünftigen geschäftlichen Aktionen.

Erfahren Sie mehr darüber, warum Data Lakes die Zukunft im Bereich Big Data sind, und entdecken Sie die Big-Data-Lösungen von Oracle.

Wenn Sie hier den Oracle Big Data-Blog abonnieren, bekommen Sie stets als Erster die neuesten Beiträge.

 

Kontakt:

Ein spannendes Thema, über das ich gerne mit Ihnen spreche, per E-MailLinkedInXing oder Twitter. Cesar Ortiz, Principal Solution Engineer.

Kommentieren

Kommentare ( 0 )
Please enter your name.Please provide a valid email address.Please enter a comment.CAPTCHA challenge response provided was incorrect. Please try again.