Strukturierte Daten beziehen sich auf Datensätze mit starker und konsistenter Organisation. Strukturierte Daten werden mit der Structured Query Language (SQL) verwaltet, mit der Anwender die Daten einfach durchsuchen und bearbeiten können.
Was ist ein Beispiel für strukturierte Daten?
Strukturierte Daten sind in Zeilen und Spalten mit bekannten und vorhersagbaren Inhalten organisiert. Jede Spalte enthält einen bestimmten Datentyp, z. B. Datumsangaben, Text, Geld oder Prozentsätze. Daten, die nicht mit dem Datentyp dieser Spalte übereinstimmen, werden als Fehler zurückgewiesen.
Relationale Datenbanktabellen und Tabellenkalkulationen enthalten in der Regel strukturierte Daten. Eine höhere semantische Strukturebene kombiniert Stammdaten und historische Daten zu einem
Datenmodell. Zu den Themenbereichen des Datenmodells gehören Themen wie Kunden, Inventar, Verkaufstransaktionen, Preise und Lieferanten. Strukturierte Daten sind einfach zu bedienen, die Datenintegrität kann erzwungen werden. Strukturierte Daten werden zu
Big Data, da riesige Mengen historischer Fakten erfasst werden.
Was sind die Vorteile von strukturierten Daten?
Strukturierte Daten werden von
Algorithmen des
maschinellen Lernens leicht verstanden, was Modifikationen einfach und schnell macht. Auch Abfragen durch Anwender werden ganz simpel.
Strukturierte vs. unstrukturierte Daten
Während strukturierte Daten aus hochorganisierten quantitativen Daten bestehen, die mit SQL-Datenbanken verwaltet werden, beschäftigen sich
unstrukturierte Daten mit qualitativen Daten ohne vordefiniertes Datenmodell, die am besten in NoSQL-Datenbanken (wie
MongoDB) verwaltet werden.
Alle wichtigen Geschäftsprozesse und Entscheidungen hängen von strukturierten Daten ab. Sie bilden die Grundlage von
Data Warehouses, Data Lakes und Anwendungen. Wenn strukturierte Daten in ein Datenmodell integriert werden, bieten sie einen exponentiellen Geschäftswert.