Was ist der Unterschied zwischen Data Warehouses und Data Lakes?
Ein Data Warehouse ist themenorientiert, integriert, konsistent und nichtflüchtig. Ob traditionell aufgesetzt, hybrid oder in der Cloud: Ein Data Warehouse ist im Endeffekt das Gedächtnis des Unternehmens für die wichtigsten Daten.
Ein Data Lake ist eine Sammlung langfristiger Datencontainer, die jede Form von Rohdaten in großem Maßstab erfasst, verfeinert und untersucht. Data Lakes werden durch kostengünstige Technologien ermöglicht, auf die mehrere nachgelagerte Einrichtungen zurückgreifen können, darunter Data Marts, Data Warehouses und Empfehlungs-Engines.
Wie sie zusammenspielen
Data Warehouses verbinden Datenqualität, Konsistenz, Wiederverwendung und Leistung mit hoher Parallelität. Data Lakes konzentrieren sich auf die Ablage roher Daten und deren langfristige Speicherung zu niedrigen Kosten. Damit bieten Data Lakes eine neue Form der analytischen Agilität.
Obwohl es sich um Gegensätze handelt, sind Data Warehouses und Data Lakes komplementäre Lösungen und sollten Teil jeder Datenverarbeitungs-Infrastruktur sein. Data Warehouses sind eine Service- und Compliance-Umgebung – sie bieten Daten in der Form an, wie Ihre Anwender die Daten sehen sollen. Data Lakes sind ideal für die Staging- und Verarbeitungsschichten.
Gemeinsam können sie den Wert von Daten freisetzen. Erfahren Sie, wie Teradata Vantage™ (The Connected Multi-Cloud Data Platform for Enterprise Analytics) Ihnen helfen kann, das Beste aus beiden Entwurfsmustern zu machen.
Erfahre mehr über Vantage