Überblick
Die fünf wichtigsten Big Data-Technologien
Es gibt fünf kritische Must-Haves, um eine wertschöpfende Big Data-Technologieinfrastruktur aufzubauen.
Die große Nachfrage nach Big Data-Computing war die Hauptursache für die Gründung von Teradata. Tatsächlich kommt der Name des Unternehmens von unserer Fähigkeit, Terabytes an Daten zu verwalten. (Heute ist diese Zahl auf viele Petabytes angewachsen!) Damals war das Speichern und Analysieren von Big Data durch die damals verfügbare Hardware begrenzt. Wir haben die Teradata-Datenbank erstellt, um Daten effektiv in großem Maßstab zu verwalten, um Unternehmensanalysen zu ermöglichen, technische Probleme zu lösen und die Leistungsfähigkeit von integrierten Daten in ein Beziehungsmodell zu demonstrieren.
Heute, da das Data Warehouse Dutzende Millionen von Abfragen pro Tag ausführt und geschäftskritische Vorgänge unterstützt, haben sich die technologischen Herausforderungen weit über die Grenzen der Hardware hinaus verschoben. Um mit dem wachsenden Datenvolumen und der Vielfalt der Daten Schritt zu halten, benötigen Unternehmen eine Big Data-Architektur, mit der Daten über die richtigen Tools sicher zu den richtigen Benutzern fließen.
Fragen zur Big Data-Architektur
Das Entwerfen der für Sie passenden Architektur beginnt damit, sich die richtigen Fragen zu stellen:
- Wie werden meine Big Data-Strategien meine Big Data-Technologieanforderungen prägen? Mit anderen Worten, was sind die Geschäftsprobleme, die gelöst werden müssen? Welche Abläufe müssen verbessert werden? Und welche Ziele müssen durch die Nutzung von Big Data erreicht werden?
- Welche meiner vorhandenen Datenquellen und Systeme können in eine integrierte Architektur "eingesteckt" werden?
- Wie werde ich neue Datensätze (wie Sensordaten oder Daten aus dem Internet der Dinge) berücksichtigen?
- Wie kann mein Ansatz dazu beitragen, datengesteuertes und analysegestütztes Denken in den Mittelpunkt meines Unternehmens zu stellen?
- Was sind die erforderlichen Komponenten, um mein Big Data- und Analytics-Programm über Pilotphasen hinaus zu "operationalisieren" und zu skalieren?
Must-Haves der Big Data-Technologie
1. Integriert
Die Vereinheitlichung von Data Warehouses, Data Lakes und Analysen auf einer einzigen Plattform schließt die Lücke zwischen Rohdatenquellen, spezifischen Business Intelligence-Tools und Standard-CRM-Anwendungen. Es reduziert drastisch die Komplexität herkömmlicher "hybrider" Umgebungen und ermöglicht es, extrem schnelllebige Datensätze aufzunehmen. Es bietet Benutzern auch plattformübergreifenden Zugriff auf Daten- und Analyse-Engines.
2. Skalierbar
Laut einer aktuellen IDC-Umfrage würden 56 Prozent der Befragten einen IT-Infrastrukturanbieter oder IT-Cloud-Service-Anbieter ablehnen, wenn er keine flexiblen IT-Nutzungsoptionen anbietet. Als Reaktion auf die Anfragen unserer Kunden entwickelten wir Vantage, eine Datenanalyse-Softwareplattform, die auf jede für sie am besten geeignete Art nutzbar ist - sei es in der Cloud, hybrid oder vor Ort. Wir wissen, dass Kunden den Umfang der Analysefunktionen eher nicht vorhersagen können, die sie im nächsten Monat, geschweige denn im nächsten Jahr benötigen. Daher geben wir ihnen die Flexibilität, ihre Analyse-Workloads anzupassen, wenn sich ihre Bereitstellungsstrategien ändern.
3. Vorhersagbar
Für viele Analysten und Experten ist die Fähigkeit Ihres Unternehmens, große Daten zu sammeln und zu verwalten, kein Problem mehr – es geht darum, Big Data vorherzusagen und darauf zu reagieren. Hier kommen künstliche Intelligenz und ihre Teildisziplin maschinelles Lernen (ML) ins Spiel. ML gibt Computern die Möglichkeit, ohne manuelle Programmierung zu lernen. So können sie Muster erkennen und Modelle erstellen, die zukünftige Szenarien vorhersagen. Dies kann enorm nützlich sein, um die Absichten eines Kunden zu erkennen, die Leistung der Maschinen in Ihrer Produktionsstätte zu optimieren oder Ihre Sicherheitslage zu verbessern.
Bei der Entwicklung von Vantage haben wir darauf geachtet, dass die Plattform eine breite Palette fortschrittlicher Analysefunktionen unterstützt. Beispielsweise bietet die Machine Learning-Engine mehr als 100 vorgefertigte Analysefunktionen für Pfad-, Muster-, Statistik- und Textanalysen, um eine breite Palette von Analysen zu ermöglichen. Zudem bietet die Graph Engine eine Reihe von Funktionen, die Beziehungen zwischen Personen, Produkten und Prozessen innerhalb eines Netzwerks aufdecken.
4. Zugänglich
Mit Technologien und Richtlinien für Self Service-Analysen reduzieren Sie Datensilos und erhöhen die Innovationsfähigkeit ihres Unternehmens. Im Idealfall hätten alle Mitarbeiter in Ihrem Unternehmen Zugriff auf die benötigten Tools und Daten, ohne Berechtigungen von der IT anfordern zu müssen. So müssen Sie weniger Zeit mit dem Zusammenstellen verschiedener Lösungen verbringen und haben mehr Zeit für die Beantwortung der wichtigsten strategischen Fragen.
Ihre Technologie sollte zudem alle Sprachen und Tools unterstützen, die die Anwender bevorzugen. Mit Vantage können Datenwissenschaftler und Business Analysten mit denselben Daten arbeiten, auch wenn sie unterschiedliche Tools und Sprachen verwenden. Vantage lässt sich in die bevorzugten Tools und Sprachen der Kunden integrieren, darunter SQL, R, Python, Tableau, Qlik und Teradata AppCenter, Jupyter und RStudio.
5. Offen für Innovation
Neue Anwendungsfälle für Advanced Analytics und immer mehr Datenquellen zwingen Datenwissenschaftler, verschiedene Data Science-Techniken zu nutzen. Ihre Technologie sollte umfassend und in der Lage sein, die Geschäftsprobleme von heute und morgen zu lösen. Daher benötigen Sie eine Architektur, die mit allen künftigen Tools und Technologien kompatibel ist. Aus diesem Grund haben wir Vantage entwickelt, um sowohl Open Source- als auch kommerzielle Analysetechnologien miteinander zu kombinieren.
Die Technologien für Big Data-Analysen ändern sich rasant. Um eine langfristige, nachhaltige Big Data-Strategie zu entwickeln, ist eine Architektur wichtig, die 1. verschiedene Datenströme, Tools und Anwendungen integriert; die 2. je nach Anforderungen skalierbar ist; die 3. fortschrittlicher Predictive Analytics-Funktionen unterstützt; die 4. allen in Ihrer Organisation offensteht, unabhängig von ihrer Rolle; und 5. auch offen für zukünftige Innovationen ist. Mit diesen Kriterien im Hinterkopf sind Sie gut gerüstet, um sich einen Vorteil zu verschaffen, wenn die globale Datenwirtschaft weiter expandiert.