Was sind unstrukturierte Daten?

Unstrukturierte Daten beziehen sich auf ungefilterte Informationen ohne festes Organisationsprinzip. Sie werden oft auch als Rohdaten bezeichnet. Gängige Beispiele sind Webprotokolle, XML, JSON, Textdokumente, Bilder, Video- und Audiodateien. Unstrukturierte Daten werden durchsucht und analysiert, um nützliche Fakten zu extrahieren. Bis zu 80 Prozent der Unternehmensdaten sind unstrukturiert. Dies bedeutet, dass es für viele Menschen die sichtbarste Form von Big Data ist. Die Größe unstrukturierter Daten erfordert skalierbare Analysen, um Erkenntnisse zu gewinnen. Unstrukturierte Daten finden sich aufgrund der geringeren Speicherkosten in den meisten, aber nicht in allen Data Lakes.

Unstrukturierte Daten sind mehr Rauschen als Wert. Das Extrahieren des in solchen Dateien verborgenen Wertes erfordert große Skills und Tools. Es ist ein Mythos, dass relationale Datenbanken keine unstrukturierten Daten verarbeiten können. Die Unified Data Architecture von Teradata umfasst unstrukturierte Daten auf verschiedene Weise. Teradata Database und Wettbewerber können XML, JSON, Avro und andere Formen unstrukturierter Daten speichern und verarbeiten.