Überblick
Das Integrated Data Warehouse fördert Innovation
Ein Integrated Data Warehouse (IDW) ist nicht nur die Single Source of Truth für ein Unternehmen, sondern auch, sondern auch immer noch wichtig.
In der heutigen digitalen Welt generieren Menschen, Produkte und Dinge gewaltige Menge an Daten. Die zentrale Herausforderung beim Data Warehousing besteht daher darin, möglichst viele verschiedene Arten von Daten zu erfassen, zu kombinieren und zu analysieren. Das ist das Ziel des Integrated Data Warehouse (IDW), einem zentralen Speicher für detaillierte und Massen-Daten aus den verschiedensten Abteilungen, um eine 360-Grad-Sicht auf das Unternehmens zu bieten.
Zwei Möglichkeiten der Datenintegration
Beim Aufbau eines Systems zur Integration von Daten befolgen Systemarchitekten im Allgemeinen eine von zwei Philosophien, die von den Data-Warehouse-Vorreitern William Inmon und Ralph Kimball entwickelt wurden:
- Der Inmon- oder "Top-Down"-Ansatz identifiziert die Themen und Bereiche, die das Unternehmen antreiben, als da wären Kunden, Produkte und Anbieter. Für jede dieser Entitäten wird ein detailliertes logisches Modell gebildet, alle Daten werden im Voraus integriert und definiert. Dieses Modell macht das Laden von Daten weniger kompliziert, aber das Strukturieren von Abfragen schwieriger.
- Der Kimball- oder "Bottom-up"-Ansatz identifiziert die wichtigsten Geschäftsprozesse und Fragen, die das Data Warehouse beantworten kann. Es erstellt dann Data Marts, um diese Anforderungen zu erfüllen. Daten werden in einen Staging-Bereich geladen, sind aber nicht so eng mit Entitäten gekoppelt wie im Inmon-Modell.
Die wesentliche Stärke des Inmon-Ansatzes besteht darin, dass das Data Warehouse als „Single Source of Truth“ und als Ort dient, an dem alle Daten integriert und standardisiert werden. Dem Kimball-Ansatz fehlt diese zentralisierte Standardisierung, da die Daten vor der Abfrage nicht vollständig integriert sind. Die Kimball-Methode ermöglicht es jedoch, das Data Warehouse schnell zu erstellen und effizient auf Geschäftsanwendungen auszurichten.
Teradata befürwortet den "Top-Down"-Ansatz. Damit haben Anwender immer die Freiheit, jederzeit jede Frage zu beliebigen Daten zu stellen. Data Warehousing by Design regt zu gründlichen und umfassenden Fragestellungen an. Beim Kimball-Ansatz kann es vorkommen, dass Anwender einen neuen Anlauf unternehmen müssen, um Schlüsselfragen beantwortet zu bekommen. Das kostet kostbare Zeit.
Warum ein integriertes Data Warehouse (IDW) wichtig ist
Durch die Integration riesiger Datenmengen aus verschiedenen Quellen und ihre allgemeine Zugänglichkeit können Unternehmen…
...Informationen über Funktionseinheiten hinweg teilen
Unterschiedliche Datenquellen werden an einem Ort gesammelt, was möglicherweise vorhandene Datensilos reduziert und die Datenkonsistenz sicherstellt.
…wichtige Geschäftsantworten schnell und präzise zur Verfügung stellen und dabei mehrere Standpunkte integrieren
Erhalten Sie effizient Antworten auf die schwierigsten Geschäftsfragen, damit Entscheider die richtige Strategie verfolgen können.
...eine einzige Version der Wahrheit anzeigen
Ermöglichen Sie es jedem in Ihrem Unternehmen, aus denselben Informationen zu schöpfen und Rückschlüsse zu ziehen. Ein universeller Zugang entlastet die IT, da mehr Datenwissenschaftler auch mehr Wert schaffen können.
Diese Funktionen können die Kultur eines Unternehmens in Sachen Datenzugänglichkeit grundlegend verändern. Anstatt den Zugriff der Benutzer auf Daten einzuschränken und Innovationen zu behindern, kann ein gut konzipiertes IDW Daten sicher und in den richtigen Formaten zur Verfügung stellen. Dies macht die Analyse schnell und agil und sorgt dafür, dass Geschäftsanwender und Datenwissenschaftler gleichermaßen zu Antworten kommen, die für das Unternehmen entscheidend sind.
Evolution des Integrated Data Warehouse (IDW)
Die Idee eines Data Warehouse nahm erstmals in den 1960er und 1970er Jahren Gestalt an. Ein bahnbrechender Moment kam 1988, als Barry Devlin und Paul Murphy über die Notwendigkeit eines "integrierten Speichers für Unternehmensdaten" schrieben, der "die verschiedenen Stränge der Informationssystemaktivität innerhalb des Unternehmens zusammenführen könnte".
Seit Jahrzehnten versuchen Informatiker engagiert diese Art von groß angelegter Plattform zu bauen. Im Jahr 1991 demonstrierte die Integrated Public Use Microdata Series (IPUMS) die Leistungsfähigkeit eines Data Warehousing-Ansatzes, bei dem sie die ETL-Methode (Extract, Transform and Load) zur Integration von Daten aus verschiedenen Quellen übernahmen.
Als die Datenmengen mit der Expansion des Internets, dem Aufkommen von Smartphones und dem Aufstieg von Cloud Computing explodierten, griff ETL für Datensätze, die ständig aktualisiert werden mussten, nicht mehr. Seitdem haben sich Data Hub- und Data-Lake-Ansätze herausgebildet, die unstrukturierte Daten bündeln, ohne dass eng gekoppelte relationale Datenprozesse erforderlich sind.
Die Sichtweise von Teradata
Seit mehr als vier Jahrzehnten steht Teradata an der Spitze der IDW-Entwicklung. Es setzt seine Innovationen in diesem Bereich fort, da wir die Best Practices auf Teradata Vantage anwenden.
Teradata Vantage ist die führende Hybrid-Cloud-Software für die Datenanalyse, die 100 Prozent Ihrer Daten nutzt, um alles, überall und jederzeit zu analysieren. Teradata Vantage kombiniert die Leistung und den Einfallsreichtum des IDW mit der Flexibilität und Skalierbarkeit der Cloud. Es bietet branchenführende Leistung in großem Maßstab und ist preislich optimiert. Zudem lässt es sich einfach bedienen und in Ihre aktuellen Systeme integrieren und offeriert Flexibilität und Kontrolle, unabhängig von Ihren Anforderungen oder neuen Entwicklungen.