Hadoop ist eine verteilte Datenmanagementplattform oder ein Open Source-Software Framework zum Speichern und Verarbeiten von
Big Data. Es wird manchmal als ein reduziertes verteiltes Betriebssystem beschrieben. Es wurde entwickelt, um immense
Datenmengen zu verwalten und mit ihnen zu arbeiten und linear auf große Cluster von Tausenden von Standardcomputern zu skalieren. Es wurde ursprünglich für Yahoo! entwickelt, ist aber jetzt kostenlos und öffentlich über die Apache Software Foundation verfügbar, obwohl es normalerweise umfangreiche Programmierkenntnisse erfordert, um verwendet zu werden.