Il documento tratta di Apache Hadoop, un framework per l'elaborazione distribuita di big data che utilizza il modello di programmazione MapReduce. Vengono discusse le componenti principali di Hadoop, come HDFS e YARN, e viene fornito un esempio di implementazione del conteggio delle parole utilizzando MapReduce. Sono anche analizzati i miglioramenti apportati nella versione 2.x di Hadoop, comprese la federazione di HDFS e l'alta disponibilità del Namenode.