Dokumen ini menjelaskan mengenai Hadoop, termasuk sejarah, pengertian, arsitektur, manfaat, kelebihan, kekurangan, dan cara instalasinya. Hadoop adalah software open source yang digunakan untuk mengelola data besar secara terdistribusi dan skalabel, dengan arsitektur yang terdiri dari empat komponen utama: HDFS, MapReduce, YARN, dan Hadoop Common. Selain itu, Hadoop juga memiliki ekosistem yang terdiri dari berbagai modul tambahan, dan telah banyak digunakan oleh perusahaan-perusahaan besar untuk analisis data.