SlideShare a Scribd company logo
1 of 34
Hadoop
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Fakultas Sains dan Teknologi
Teknik Informatika
2017
Nurhayati, P. Hd
Oleh :
1.Fajar Nugraha Wahyu 111409100000
2.Alfat Nursyahban 11140910000027
3.Yunita Riska Andayani 11140910000066
TITLETITLE
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Outline
 Sejarah Hadoop
 Pengertian Hadoop
 Arsitektur Hadoop
 Cara Kerja Hadoop
 Vendor Hadoop
 Manfaat dari Penggunaan Hadoop
 Kelebihan dan Kekurangan Hadoop
 Implementasi dari Penggunaan
Hadoop
 Cara Menginstall Hadoop
Censor
Kelompok 1
TITLETITLE
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Sejarah Hadoop
Censor
Kelompok 1
TITLETITLE
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Asal mula hadoop muncul karena terinspirasi
dari makalah tentang Google MapReduce dan Google File
System (GFS) yang ditulis oleh ilmuwan dari Google,
Jeffrey Dean dan Sanjay Ghemawat pada tahun 2003.
Proses development dimulai pada saat proyek Apache
Nutch, yang kemudian baru dipindahkan menjadi sub-
proyek hadoop pada tahun 2006. Penamaan menjadi
hadoop adalah diberikan oleh Doug Cutting, yaitu
berdasarkan nama dari mainan gajah anaknya.
Sejarah Hadoop
Censor
Kelompok 1
TITLETITLE
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
VENDORVENDOR
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Hadoop sejak tanggal 23 Januari 2008 telah
menjadi proyek tingkat atas di lingkungan Apache
Software Foundation dan dikembangkan secara terbuka
oleh komunitas kontributor secara global. Pengguna
Hadoop adalah, termasuk Facebook, a9.com, AOL,
Baidu, IBM, ImageShack, dan Yahoo. Hadoop tersedia
bebas menyandang lisensi Apache License 2.0
Pengertian Hadoop
Censor
Kelompok 1
Hadoop atau Apache Hadoop adalah
software bebas dan open source, yang ditulis
dalam kerangka bahasa pemrograman Java untuk
dijalankan secara terdistribusi dan skalabel. Ia
dibangun berdasarkan algoritma popular
MapReduce dari Google Inc, berikut sistem
berkas yang disarankan Google (GFS = Google
File System), yang memungkinkan menjalankan
tugas komputasi intensif dalam mengolah data
jumlah besar di komputer cluster dengan
hardware komoditas.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Pengertian Hadoop
Censor
Kelompok 1
Hadoop bisa dijalankan disatu komputer
saja (single node) ataupun dalam cluster yang
berisi banyak komputer (multi node). Single
node biasanya untuk development atau training
saja. Hadoop memerlukan Java untuk bisa
berjalan. Untuk proses instalasinya juga cukup
sederhana. Setelah file core Hadoop di download
disitu ada petunjuk menjalankannya. Selanjutnya
bisa dipilih mana saja komponen lain yang
dibutuhkan.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Arsitektur Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Arsitektur Hadoop
Censor
Kelompok 1
Framework Hadoop terdiri atas empat modul atau
komponen utama, yaitu :
 Hadoop Distributed File System (HDFS), yaitu sebuah
system file yang terdistribusi.
 Hadoop MapReduce, yaitu sebuah model
programming/algoritma untuk pengolahan data skala
besar dengan komputasi secara terdistribusi.
 Hadoop YARN, yaitu sebuah platform resource
management yang bertanggung jawab untuk mengelola
resources dalam clusters dan scheduling.
 Hadoop Common, yaitu berisi libraries dan utilities yang
dibutuhkan oleh modul Hadoop lainnya.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Arsitektur Hadoop
Censor
Kelompok 1
Semenjak tahun 2008 framework hadoop
bukan hanya empat modul utama tersebut namun
merupakan kumpulan modul open source seperti
Hive, Pig, Oozie, Zookeeper, Flume Sqoop,
Mahout, Hbase, Ambari, Spark, dsb.
 Hadoop Hive, yaitu Hadoop Hive dilengkapi
dengan fungsi Data-Warehouse, yaitu bahasa
query HiveQL dan indeks. HiveQL adalah bahasa
query berbasis SQL dan memungkinkan
pengembang untuk menggunakan sintaks seperti
SQL.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Arsitektur Hadoop
Censor
Kelompok 1
 Hadoop Pig, yaitu Hadoop Pig dapat digunakan
sebagai bahasa pemrograman high-level untuk
menulis program pada Hadoop MapReduce.
 Hadoop Base, yaitu database sederhana, dan
skalabel untuk mengelola data dengan jumlah
yang sangat besar dalam cluster Hadoop. Struktur
data ini cocok untuk data yang jarang berubah,
tapi sangat sering ditambahkan. Menggunakan
HBase dapat dikelola miliaran baris data secara
efisien.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Arsitektur Hadoop
Censor
Kelompok 1
Sekelompok modul dalam arsitektur hadoop
kadang di sebut juga sebagai Ekosistem Hadoop.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Kerja Hadoop
Censor
Kelompok 1
Hadoop Distributed File System (HDFS)
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Kerja Hadoop
Censor
Kelompok 1
 Hadoop Distributed File System adalah sebuah sistem
berkas terdistribusi dengan high-availability yang
dapat menyimpan data pada mesin komoditas,
digunakan untuk menyediakan bandwidth sangat
tinggi yang di agregasi ke semua cluster (node).
 Berkas dibagi menjadi blok data dengan panjang yang
baku dan didistribusikan secara redundan (berlebihan)
pada simpul (node) yang berpartisipasi
 Sebuah kluster HDFS terdiri dari NameNode, yang
mengelola metadata dari kluster, dan DataNode yang
menyimpan data/file
 File dan direktori diwakili pada NameNode oleh
inode. Inode menyimpan atribut seperti permission,
modifikasi dan waktu akses, atau kuota namespace
dan diskspace
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Kerja Hadoop
Censor
Kelompok 1
 Isi file dibagi menjadi blok-blok file (biasanya 128
MB), dan setiap blok file tersebut direplikasi di
beberapa DataNodes
 Blok file disimpan pada sistem file lokal dari
DataNode
 Namenode aktif memonitor jumlah salinan/replika
blok file. Ketika ada salinan blok file yang hilang
karena kerusakan pada DataNode, NameNode akan
mereplikasi kembali blok file tersebut ke datanode
lainnya yang berjalan baik
 NameNode mengelola struktur namespace dan
memetakan blok file pada datanode
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Kerja Hadoop
Censor
Kelompok 1
Hadoop MapReduce
MapReduce bertugas membagi data yang besar ke dalam
potongan lebih kecil dan mengatur mereka kedalam bentuk tupel
untuk pemrosesan paralel. Tupel adalah kombinasi antara key dan
value-nya, dapat disimbolkan dengan notasi : "(k1, v1)". Dengan
pemrosesan bersifat paralel tersebut, tentunya akan meningkatkan
kecepatan dan keandalan komputasi pada sistem klustering.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Kerja Hadoop
Censor
Kelompok 1
MapReduce terdiri atas tiga tahap, yaitu tahap
map, shuffle, dan terakhir reduce. Shuffle dan reduce
digabungkan kedalam satu tahap saja yaitu tahap
reduce.
 Map berfungsi memproses data inputan yang umumnya
berupa file yang tersimpan dalan HDFS, inputan
tersebut kemudian diubah menjadi tuple yaitu pasangan
antara key dan value-nya.
 Tahap reduce, memproses data inputan dari hasil
proses map, yang kemudian dilakukan tahap shuffle
dan reduce yang hasil data set baru-nya disimpan di
HDFS kembali.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Kerja Hadoop
Censor
Kelompok 1
Hadoop YARN
Hadoop YARN adalah sebuah platform manajemen
sumber daya yang bertanggung jawab atas pengelolaan
sumber daya komputasi dalam sebuah cluster dan digunakan
untuk penjadwalan aplikasi pengguna.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Kerja Hadoop
Censor
Kelompok 1
Tujuan awal YARN adalah untuk memisahkan dua
tanggung jawab utama dari Job Tracker atau Task Tracker
menjadi beberapa entitas yang terpisah.
 Global Resource Manager di node master, yang berfungsi
mengatur semua resource yang digunakan aplikasi dalam sistem
 Application Master di setiap aplikasi, yang berfungsi untuk
negosiasi resource dengan Resource Manager dan kemudian
bekerja sama dengan Node Manager untuk mengeksekusi dan
memonitor tasks
 Node Manager di Agen-Framework setiap node slave, yang
bertanggung jawab terhadap Container, dengan memantau
penggunaan resource/sumber daya dari container (cpu, memori,
disk, jaringan) dan melaporkannya pada Resource Manager.
 Container di setiap aplikasi yang jalan di Node Manager,
sebagai wadah penyimpanan data/file
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Manfaat dari Penggunaan
Hadoop dalam Big Data
Censor
Kelompok 1
Big data memiliki 3 tantangan utama sehingga Hadoop
sangat dibutuhkan, yaitu karena :
 Volume, keperluan menyimpan dan mengelola data dalam
jumlah yang sangat besar, dan data tersebut selalu tambah besar
setiap saat.
 Velocity, begitu cepat data yang muncul dan keperluan untuk
bisa mengakses data besar tersebut dengan cepat.
 Variety, semakin bervariasinya data saat ini sehingga dengan
teknologi relational database (RDBMS) saat ini sudah tidak bisa
ditangani lagi.
Hadoop optimal digunakan untuk menangani data dalam
jumlah besar baik data Structured, Semi-structured, maupun
Unstructured. Hadoop mereplikasi data di beberapa komputer
(Klustering), sehingga jika salah satu komputer
mati/bermasalah maka data dapat diproses dari salah satu
komputer lainnya yang masih hidup.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Kelebihan dan
Kekurangan Hadoop
Censor
Kelompok 1
Kelebihan Hadoop
 Hadoop merupakan software bebas dan open source
 Hadoop dapat menampung data dengan jumlah yang
sangat besar
Kekurangan Hadoop
 Map reduce hanya bisa berjalan secara serial untuk
mengolah data. Artinya tidak bisa dilakukan pemrosesan
data secara paralel
 Map Reduce hanya bisa berjalan dalam batch atau secara
periodik dan tidak bisa terus menerus secara realtime. Hal
ini membuat Map Reduce tidak bisa mengolah data dalam
bentuk streaming tanpa henti seperti misalnya tweet dari
twitter
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Implementasi Hadoop
Censor
Kelompok 1
Penggunaan Hadoop saat ini sudah semakin luas,
diantaranya adalah :
 Yahoo
Terdiri dari 24.000 server di 17 cluster. Lebih dari 10
petabytes data user. Mengerjakan ratusan ribu jobs tiap
bulannya. Dan digunakan untuk news, search dan mail.
 New York Times
Menggunakan Hadoop untuk mengkonversi artikel
NYTimes menjadi pdf dari tahun 1851 sampai dengan
1922. Berjalan di atas 100 server Amazon EC2 selama
24 jam. Input data sebesar 4TB dan output 1,5TB.
 Facebook
Digunakan untuk data mining dan data werehousing,
user data analysis. Dan dijalankan di 600 server.
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Sebelum memulai isntalasi pastikan anda memiliki software
ini :
Hadoop 2.7.1
Java – Jdk 1.7
Berikut ini adalah step-stepnya
Configuration
Step 1 – Windows path configuration
Set HADOOP_HOME path in enviornment
variable for windows
Right click on my computer > properties >
advanced system settings > advance tab > environment
variables > click on new
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Set hadoop bin directory path
Find path variable in system variable > click on edit > at the
end insert ‘; (semicolon)’ and paste path upto hadoop bin
directory in my case it’s a
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Step 2 – Hadoop configuration
Edit hadoop-2.7.1/etc/hadoop/core-site.xml, paste the following lines and
save it.
Edit hadoop-2.7.1/etc/hadoop/mapred-site.xml, paste the following lines
and save it.
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Edit hadoop-2.7.1/etc/hadoop/hdfs-site.xml, paste the
following lines and save it, please create data folder
somewhere and in my case i have created it in my
HADOOP_HOME directory
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Edit hadoop-2.7.1/etc/hadoop/yarn-site.xml, paste the
following lines and save it.
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Edit hadoop-2.7.1/etc/hadoop/hadoop-env.cmd, comment
existing %JAVA_HOME% using @rem at start, give
proper path and save it. (my jdk is in program files to
avoid spaces i gave PROGRA~1)
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
o Demo
Step 3 – Start everything
Very Important step
Before starting everything you need to add some [dot].dll
and [dot].exe files of windows please download bin folder
from my github repository -sardetushar_gitrepo_download
bin folder – this contains .dll and .exe file (winutils.exe for
hadoop 2.7.1)
Now delete you existing bin folder and replace with new one
(downloaded from my repo)
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Open cmd and type ‘hdfs namenode -format’ – after
execution you will see below logs
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
JPS – to see services are running
open cmd and type – jps (for jps make sure your java path is set
properly)
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
o GUI
Step 4 – namenode GUI, resource manager GUI
Resource manager GUI address – http://localhost:8088
Cara Install Hadoop
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Namenode GUI address – http://localhost:50070
Kesimpulan
Censor
Kelompok 1
OUTLINEOUTLINE
SEJARAHSEJARAH
PENGERTIANPENGERTIAN
ARSITEKTURARSITEKTUR
MANFAATMANFAAT
CARA KERJACARA KERJA
KELEBIHANKELEBIHAN
KEKURANGANKEKURANGAN
IMPLEMENTAS
I
IMPLEMENTAS
I
CARA INSTALLCARA INSTALL
KESIMPULANKESIMPULAN
Kesimpulannya yaitu:
 Hadoop merupakan framework yang digunakan sebagai
solusi untuk Big Data dan bersifat open source.
 Hadoop HDFS adalah sistem file terdistribusi yang bersifat
fault-tolerant dan mendukung untuk mengolah data set
yang besar (Big Data).
 Hadoop MapReduce adalah model komputasi berbasis
Java pada sistem terdistribusi dalam rangka mendukung
aplikasi Big Data.
 Hadoop YARN adalah platform untuk resource-
management yang muncul untuk mengatasi limitasi
MapReduce pada arsitektur Hadoop 1.0.

More Related Content

What's hot

Data lineage and observability with Marquez - subsurface 2020
Data lineage and observability with Marquez - subsurface 2020Data lineage and observability with Marquez - subsurface 2020
Data lineage and observability with Marquez - subsurface 2020Julien Le Dem
 
Perancangan database penyewaan lapangan
Perancangan database penyewaan lapanganPerancangan database penyewaan lapangan
Perancangan database penyewaan lapanganevi kufia mahasanti
 
Makalah Data Warehouse - Muh. Abdullah Sapiih 05201740068
Makalah Data Warehouse - Muh. Abdullah Sapiih 05201740068Makalah Data Warehouse - Muh. Abdullah Sapiih 05201740068
Makalah Data Warehouse - Muh. Abdullah Sapiih 05201740068moys17
 
Dataflow with Apache NiFi - Apache NiFi Meetup - 2016 Hadoop Summit - San Jose
Dataflow with Apache NiFi - Apache NiFi Meetup - 2016 Hadoop Summit - San JoseDataflow with Apache NiFi - Apache NiFi Meetup - 2016 Hadoop Summit - San Jose
Dataflow with Apache NiFi - Apache NiFi Meetup - 2016 Hadoop Summit - San JoseAldrin Piri
 
Introduction to NOSQL databases
Introduction to NOSQL databasesIntroduction to NOSQL databases
Introduction to NOSQL databasesAshwani Kumar
 
Mind Map of Big Data Technologies and Concepts
Mind Map of Big Data Technologies and ConceptsMind Map of Big Data Technologies and Concepts
Mind Map of Big Data Technologies and ConceptsAmir Hadad
 
Sistem Basis Data(PPT)
Sistem Basis Data(PPT)Sistem Basis Data(PPT)
Sistem Basis Data(PPT)tafrikan
 
Azure Data Factory Introduction.pdf
Azure Data Factory Introduction.pdfAzure Data Factory Introduction.pdf
Azure Data Factory Introduction.pdfMaheshPandit16
 
Spline: Data Lineage For Spark Structured Streaming
Spline: Data Lineage For Spark Structured StreamingSpline: Data Lineage For Spark Structured Streaming
Spline: Data Lineage For Spark Structured StreamingVaclav Kosar
 
Manajemen Transaksi
Manajemen TransaksiManajemen Transaksi
Manajemen TransaksiSherly Uda
 
Deep Dive into Azure Data Factory v2
Deep Dive into Azure Data Factory v2Deep Dive into Azure Data Factory v2
Deep Dive into Azure Data Factory v2Eric Bragas
 
Introducing the Snowflake Computing Cloud Data Warehouse
Introducing the Snowflake Computing Cloud Data WarehouseIntroducing the Snowflake Computing Cloud Data Warehouse
Introducing the Snowflake Computing Cloud Data WarehouseSnowflake Computing
 
The Modern Data Team for the Modern Data Stack: dbt and the Role of the Analy...
The Modern Data Team for the Modern Data Stack: dbt and the Role of the Analy...The Modern Data Team for the Modern Data Stack: dbt and the Role of the Analy...
The Modern Data Team for the Modern Data Stack: dbt and the Role of the Analy...Databricks
 

What's hot (20)

Hadoop Tutorial For Beginners
Hadoop Tutorial For BeginnersHadoop Tutorial For Beginners
Hadoop Tutorial For Beginners
 
MySql slides (ppt)
MySql slides (ppt)MySql slides (ppt)
MySql slides (ppt)
 
Data lineage and observability with Marquez - subsurface 2020
Data lineage and observability with Marquez - subsurface 2020Data lineage and observability with Marquez - subsurface 2020
Data lineage and observability with Marquez - subsurface 2020
 
#1 PENGENALAN PYTHON
#1 PENGENALAN PYTHON#1 PENGENALAN PYTHON
#1 PENGENALAN PYTHON
 
Perancangan database penyewaan lapangan
Perancangan database penyewaan lapanganPerancangan database penyewaan lapangan
Perancangan database penyewaan lapangan
 
Makalah Data Warehouse - Muh. Abdullah Sapiih 05201740068
Makalah Data Warehouse - Muh. Abdullah Sapiih 05201740068Makalah Data Warehouse - Muh. Abdullah Sapiih 05201740068
Makalah Data Warehouse - Muh. Abdullah Sapiih 05201740068
 
Dataflow with Apache NiFi - Apache NiFi Meetup - 2016 Hadoop Summit - San Jose
Dataflow with Apache NiFi - Apache NiFi Meetup - 2016 Hadoop Summit - San JoseDataflow with Apache NiFi - Apache NiFi Meetup - 2016 Hadoop Summit - San Jose
Dataflow with Apache NiFi - Apache NiFi Meetup - 2016 Hadoop Summit - San Jose
 
Activity Diagram
Activity DiagramActivity Diagram
Activity Diagram
 
Introduction to NOSQL databases
Introduction to NOSQL databasesIntroduction to NOSQL databases
Introduction to NOSQL databases
 
Mind Map of Big Data Technologies and Concepts
Mind Map of Big Data Technologies and ConceptsMind Map of Big Data Technologies and Concepts
Mind Map of Big Data Technologies and Concepts
 
Sistem Basis Data(PPT)
Sistem Basis Data(PPT)Sistem Basis Data(PPT)
Sistem Basis Data(PPT)
 
Alteryx workflow 10,000 feet view
Alteryx workflow 10,000 feet viewAlteryx workflow 10,000 feet view
Alteryx workflow 10,000 feet view
 
Azure Data Factory Introduction.pdf
Azure Data Factory Introduction.pdfAzure Data Factory Introduction.pdf
Azure Data Factory Introduction.pdf
 
Spline: Data Lineage For Spark Structured Streaming
Spline: Data Lineage For Spark Structured StreamingSpline: Data Lineage For Spark Structured Streaming
Spline: Data Lineage For Spark Structured Streaming
 
Apache hive introduction
Apache hive introductionApache hive introduction
Apache hive introduction
 
Manajemen Transaksi
Manajemen TransaksiManajemen Transaksi
Manajemen Transaksi
 
Deep Dive into Azure Data Factory v2
Deep Dive into Azure Data Factory v2Deep Dive into Azure Data Factory v2
Deep Dive into Azure Data Factory v2
 
Introducing the Snowflake Computing Cloud Data Warehouse
Introducing the Snowflake Computing Cloud Data WarehouseIntroducing the Snowflake Computing Cloud Data Warehouse
Introducing the Snowflake Computing Cloud Data Warehouse
 
The Modern Data Team for the Modern Data Stack: dbt and the Role of the Analy...
The Modern Data Team for the Modern Data Stack: dbt and the Role of the Analy...The Modern Data Team for the Modern Data Stack: dbt and the Role of the Analy...
The Modern Data Team for the Modern Data Stack: dbt and the Role of the Analy...
 
Data Vault and DW2.0
Data Vault and DW2.0Data Vault and DW2.0
Data Vault and DW2.0
 

Viewers also liked

Data Pipelines in Hadoop - SAP Meetup in Tel Aviv
Data Pipelines in Hadoop - SAP Meetup in Tel Aviv Data Pipelines in Hadoop - SAP Meetup in Tel Aviv
Data Pipelines in Hadoop - SAP Meetup in Tel Aviv larsgeorge
 
Hadoop or Spark: is it an either-or proposition? By Slim Baltagi
Hadoop or Spark: is it an either-or proposition? By Slim BaltagiHadoop or Spark: is it an either-or proposition? By Slim Baltagi
Hadoop or Spark: is it an either-or proposition? By Slim BaltagiSlim Baltagi
 
Power of OpenStack & Hadoop
Power of OpenStack & HadoopPower of OpenStack & Hadoop
Power of OpenStack & HadoopTuan Yang
 
Accelerating Hadoop, Spark, and Memcached with HPC Technologies
Accelerating Hadoop, Spark, and Memcached with HPC TechnologiesAccelerating Hadoop, Spark, and Memcached with HPC Technologies
Accelerating Hadoop, Spark, and Memcached with HPC Technologiesinside-BigData.com
 
Hoodie: Incremental processing on hadoop
Hoodie: Incremental processing on hadoopHoodie: Incremental processing on hadoop
Hoodie: Incremental processing on hadoopPrasanna Rajaperumal
 
SAS-Hadoop Foundation
SAS-Hadoop FoundationSAS-Hadoop Foundation
SAS-Hadoop FoundationAshish Jain
 
Neural interfacing
Neural interfacingNeural interfacing
Neural interfacingBrujath Bru
 
06. guía de permisos y obligaciones normativas para un proyecto minero
06.  guía de permisos y obligaciones normativas para un proyecto minero06.  guía de permisos y obligaciones normativas para un proyecto minero
06. guía de permisos y obligaciones normativas para un proyecto mineroLorena Alfaro Ramos
 
What's new in hadoop 3.0
What's new in hadoop 3.0What's new in hadoop 3.0
What's new in hadoop 3.0Heiko Loewe
 
Hadoop Introduction (1.0)
Hadoop Introduction (1.0)Hadoop Introduction (1.0)
Hadoop Introduction (1.0)Keeyong Han
 
Neural interfacing
Neural interfacingNeural interfacing
Neural interfacingKirtan Shah
 
Cyber terrorism power point
Cyber terrorism power pointCyber terrorism power point
Cyber terrorism power pointjessicafay2010
 
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the EnterpriseEnabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the EnterpriseDataWorks Summit/Hadoop Summit
 

Viewers also liked (20)

Data Pipelines in Hadoop - SAP Meetup in Tel Aviv
Data Pipelines in Hadoop - SAP Meetup in Tel Aviv Data Pipelines in Hadoop - SAP Meetup in Tel Aviv
Data Pipelines in Hadoop - SAP Meetup in Tel Aviv
 
Hadoop or Spark: is it an either-or proposition? By Slim Baltagi
Hadoop or Spark: is it an either-or proposition? By Slim BaltagiHadoop or Spark: is it an either-or proposition? By Slim Baltagi
Hadoop or Spark: is it an either-or proposition? By Slim Baltagi
 
Hadoop basics
Hadoop basicsHadoop basics
Hadoop basics
 
Big data Hadoop
Big data  Hadoop   Big data  Hadoop
Big data Hadoop
 
Power of OpenStack & Hadoop
Power of OpenStack & HadoopPower of OpenStack & Hadoop
Power of OpenStack & Hadoop
 
Accelerating Hadoop, Spark, and Memcached with HPC Technologies
Accelerating Hadoop, Spark, and Memcached with HPC TechnologiesAccelerating Hadoop, Spark, and Memcached with HPC Technologies
Accelerating Hadoop, Spark, and Memcached with HPC Technologies
 
Hoodie: Incremental processing on hadoop
Hoodie: Incremental processing on hadoopHoodie: Incremental processing on hadoop
Hoodie: Incremental processing on hadoop
 
Hire Hadoop Developer
Hire Hadoop DeveloperHire Hadoop Developer
Hire Hadoop Developer
 
SAS-Hadoop Foundation
SAS-Hadoop FoundationSAS-Hadoop Foundation
SAS-Hadoop Foundation
 
Neural interfacing
Neural interfacingNeural interfacing
Neural interfacing
 
06. guía de permisos y obligaciones normativas para un proyecto minero
06.  guía de permisos y obligaciones normativas para un proyecto minero06.  guía de permisos y obligaciones normativas para un proyecto minero
06. guía de permisos y obligaciones normativas para un proyecto minero
 
Optimizing Hive Queries
Optimizing Hive QueriesOptimizing Hive Queries
Optimizing Hive Queries
 
What's new in hadoop 3.0
What's new in hadoop 3.0What's new in hadoop 3.0
What's new in hadoop 3.0
 
Hadoop Introduction (1.0)
Hadoop Introduction (1.0)Hadoop Introduction (1.0)
Hadoop Introduction (1.0)
 
Neural interfacing
Neural interfacingNeural interfacing
Neural interfacing
 
Optical computers pdf
Optical computers pdfOptical computers pdf
Optical computers pdf
 
Cyber terrorism power point
Cyber terrorism power pointCyber terrorism power point
Cyber terrorism power point
 
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the EnterpriseEnabling Apache Zeppelin and Spark for Data Science in the Enterprise
Enabling Apache Zeppelin and Spark for Data Science in the Enterprise
 
Hive: Loading Data
Hive: Loading DataHive: Loading Data
Hive: Loading Data
 
Data science lifecycle with Apache Zeppelin
Data science lifecycle with Apache ZeppelinData science lifecycle with Apache Zeppelin
Data science lifecycle with Apache Zeppelin
 

Similar to Ppt hadoop

ETL Big Data dengan Apache Hadoop
ETL Big Data dengan Apache HadoopETL Big Data dengan Apache Hadoop
ETL Big Data dengan Apache HadoopSyafrizal Adi
 
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...Lippo Group Digital
 
Technology Consulting _ by Slidesgo.pptx
Technology Consulting _ by Slidesgo.pptxTechnology Consulting _ by Slidesgo.pptx
Technology Consulting _ by Slidesgo.pptxAgusNugraha39
 
pertemuan2.ppt
pertemuan2.pptpertemuan2.ppt
pertemuan2.pptdenyadhar2
 
Analisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanAnalisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanLippo Group Digital
 
Si & Pi, cilin christianto, hapzi ali, database management sistem dalam kegia...
Si & Pi, cilin christianto, hapzi ali, database management sistem dalam kegia...Si & Pi, cilin christianto, hapzi ali, database management sistem dalam kegia...
Si & Pi, cilin christianto, hapzi ali, database management sistem dalam kegia...Cilin christianto
 
Tugas 1 rekayasa web
Tugas 1 rekayasa webTugas 1 rekayasa web
Tugas 1 rekayasa webNasrul Akbar
 
Integrasi slims atau eprints dengan dspace
Integrasi slims atau eprints dengan dspaceIntegrasi slims atau eprints dengan dspace
Integrasi slims atau eprints dengan dspaceDwi Fajar Saputra
 
Database For Software Development Trend
Database For Software Development TrendDatabase For Software Development Trend
Database For Software Development TrendLogistyo Yulistianto
 
Tugas 5 0317-mukhlis abdilah-1411511213
Tugas 5 0317-mukhlis abdilah-1411511213Tugas 5 0317-mukhlis abdilah-1411511213
Tugas 5 0317-mukhlis abdilah-1411511213mukhlis abdilah
 
Software Defined Network (Overview)
Software Defined Network (Overview)Software Defined Network (Overview)
Software Defined Network (Overview)Heri Fauzan
 
Tugas akhir automation ansible final
Tugas akhir automation ansible finalTugas akhir automation ansible final
Tugas akhir automation ansible finalRakha Fauzi
 
PPT Automasi-1.pptx
PPT Automasi-1.pptxPPT Automasi-1.pptx
PPT Automasi-1.pptxmjarot
 
Tugas 4 0317 individu
Tugas 4 0317 individuTugas 4 0317 individu
Tugas 4 0317 individueko nofrianto
 
Kelebihan dan kekurangan database engine
Kelebihan dan kekurangan database engineKelebihan dan kekurangan database engine
Kelebihan dan kekurangan database engineroji muhidin
 
Tugas Rekayasa Web instilah pada pemrograman java
Tugas Rekayasa Web instilah pada pemrograman javaTugas Rekayasa Web instilah pada pemrograman java
Tugas Rekayasa Web instilah pada pemrograman javaAjat Sudrajat
 
Rekayasa web part 4 khaerul anwar
Rekayasa web part 4 khaerul anwarRekayasa web part 4 khaerul anwar
Rekayasa web part 4 khaerul anwarKhaerul Anwar
 

Similar to Ppt hadoop (20)

ETL Big Data dengan Apache Hadoop
ETL Big Data dengan Apache HadoopETL Big Data dengan Apache Hadoop
ETL Big Data dengan Apache Hadoop
 
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
Analisis performa kecepatan mapreduce pada hadoop menggunakan tcp packet flow...
 
Technology Consulting _ by Slidesgo.pptx
Technology Consulting _ by Slidesgo.pptxTechnology Consulting _ by Slidesgo.pptx
Technology Consulting _ by Slidesgo.pptx
 
pertemuan2.ppt
pertemuan2.pptpertemuan2.ppt
pertemuan2.ppt
 
HDFS.pptx
HDFS.pptxHDFS.pptx
HDFS.pptx
 
Analisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanAnalisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatan
 
50 tutorial 11
50 tutorial 1150 tutorial 11
50 tutorial 11
 
Si & Pi, cilin christianto, hapzi ali, database management sistem dalam kegia...
Si & Pi, cilin christianto, hapzi ali, database management sistem dalam kegia...Si & Pi, cilin christianto, hapzi ali, database management sistem dalam kegia...
Si & Pi, cilin christianto, hapzi ali, database management sistem dalam kegia...
 
Tugas 1 rekayasa web
Tugas 1 rekayasa webTugas 1 rekayasa web
Tugas 1 rekayasa web
 
Integrasi slims atau eprints dengan dspace
Integrasi slims atau eprints dengan dspaceIntegrasi slims atau eprints dengan dspace
Integrasi slims atau eprints dengan dspace
 
Database For Software Development Trend
Database For Software Development TrendDatabase For Software Development Trend
Database For Software Development Trend
 
Tugas 5 0317-mukhlis abdilah-1411511213
Tugas 5 0317-mukhlis abdilah-1411511213Tugas 5 0317-mukhlis abdilah-1411511213
Tugas 5 0317-mukhlis abdilah-1411511213
 
Software Defined Network (Overview)
Software Defined Network (Overview)Software Defined Network (Overview)
Software Defined Network (Overview)
 
ceph software defined storage
ceph software defined storageceph software defined storage
ceph software defined storage
 
Tugas akhir automation ansible final
Tugas akhir automation ansible finalTugas akhir automation ansible final
Tugas akhir automation ansible final
 
PPT Automasi-1.pptx
PPT Automasi-1.pptxPPT Automasi-1.pptx
PPT Automasi-1.pptx
 
Tugas 4 0317 individu
Tugas 4 0317 individuTugas 4 0317 individu
Tugas 4 0317 individu
 
Kelebihan dan kekurangan database engine
Kelebihan dan kekurangan database engineKelebihan dan kekurangan database engine
Kelebihan dan kekurangan database engine
 
Tugas Rekayasa Web instilah pada pemrograman java
Tugas Rekayasa Web instilah pada pemrograman javaTugas Rekayasa Web instilah pada pemrograman java
Tugas Rekayasa Web instilah pada pemrograman java
 
Rekayasa web part 4 khaerul anwar
Rekayasa web part 4 khaerul anwarRekayasa web part 4 khaerul anwar
Rekayasa web part 4 khaerul anwar
 

Ppt hadoop

  • 1. Hadoop Universitas Islam Negeri Syarif Hidayatullah Jakarta Fakultas Sains dan Teknologi Teknik Informatika 2017 Nurhayati, P. Hd Oleh : 1.Fajar Nugraha Wahyu 111409100000 2.Alfat Nursyahban 11140910000027 3.Yunita Riska Andayani 11140910000066 TITLETITLE OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 2. Outline  Sejarah Hadoop  Pengertian Hadoop  Arsitektur Hadoop  Cara Kerja Hadoop  Vendor Hadoop  Manfaat dari Penggunaan Hadoop  Kelebihan dan Kekurangan Hadoop  Implementasi dari Penggunaan Hadoop  Cara Menginstall Hadoop Censor Kelompok 1 TITLETITLE OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 3. Sejarah Hadoop Censor Kelompok 1 TITLETITLE OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Asal mula hadoop muncul karena terinspirasi dari makalah tentang Google MapReduce dan Google File System (GFS) yang ditulis oleh ilmuwan dari Google, Jeffrey Dean dan Sanjay Ghemawat pada tahun 2003. Proses development dimulai pada saat proyek Apache Nutch, yang kemudian baru dipindahkan menjadi sub- proyek hadoop pada tahun 2006. Penamaan menjadi hadoop adalah diberikan oleh Doug Cutting, yaitu berdasarkan nama dari mainan gajah anaknya.
  • 4. Sejarah Hadoop Censor Kelompok 1 TITLETITLE OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA VENDORVENDOR KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Hadoop sejak tanggal 23 Januari 2008 telah menjadi proyek tingkat atas di lingkungan Apache Software Foundation dan dikembangkan secara terbuka oleh komunitas kontributor secara global. Pengguna Hadoop adalah, termasuk Facebook, a9.com, AOL, Baidu, IBM, ImageShack, dan Yahoo. Hadoop tersedia bebas menyandang lisensi Apache License 2.0
  • 5. Pengertian Hadoop Censor Kelompok 1 Hadoop atau Apache Hadoop adalah software bebas dan open source, yang ditulis dalam kerangka bahasa pemrograman Java untuk dijalankan secara terdistribusi dan skalabel. Ia dibangun berdasarkan algoritma popular MapReduce dari Google Inc, berikut sistem berkas yang disarankan Google (GFS = Google File System), yang memungkinkan menjalankan tugas komputasi intensif dalam mengolah data jumlah besar di komputer cluster dengan hardware komoditas. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 6. Pengertian Hadoop Censor Kelompok 1 Hadoop bisa dijalankan disatu komputer saja (single node) ataupun dalam cluster yang berisi banyak komputer (multi node). Single node biasanya untuk development atau training saja. Hadoop memerlukan Java untuk bisa berjalan. Untuk proses instalasinya juga cukup sederhana. Setelah file core Hadoop di download disitu ada petunjuk menjalankannya. Selanjutnya bisa dipilih mana saja komponen lain yang dibutuhkan. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 7. Arsitektur Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 8. Arsitektur Hadoop Censor Kelompok 1 Framework Hadoop terdiri atas empat modul atau komponen utama, yaitu :  Hadoop Distributed File System (HDFS), yaitu sebuah system file yang terdistribusi.  Hadoop MapReduce, yaitu sebuah model programming/algoritma untuk pengolahan data skala besar dengan komputasi secara terdistribusi.  Hadoop YARN, yaitu sebuah platform resource management yang bertanggung jawab untuk mengelola resources dalam clusters dan scheduling.  Hadoop Common, yaitu berisi libraries dan utilities yang dibutuhkan oleh modul Hadoop lainnya. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 9. Arsitektur Hadoop Censor Kelompok 1 Semenjak tahun 2008 framework hadoop bukan hanya empat modul utama tersebut namun merupakan kumpulan modul open source seperti Hive, Pig, Oozie, Zookeeper, Flume Sqoop, Mahout, Hbase, Ambari, Spark, dsb.  Hadoop Hive, yaitu Hadoop Hive dilengkapi dengan fungsi Data-Warehouse, yaitu bahasa query HiveQL dan indeks. HiveQL adalah bahasa query berbasis SQL dan memungkinkan pengembang untuk menggunakan sintaks seperti SQL. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 10. Arsitektur Hadoop Censor Kelompok 1  Hadoop Pig, yaitu Hadoop Pig dapat digunakan sebagai bahasa pemrograman high-level untuk menulis program pada Hadoop MapReduce.  Hadoop Base, yaitu database sederhana, dan skalabel untuk mengelola data dengan jumlah yang sangat besar dalam cluster Hadoop. Struktur data ini cocok untuk data yang jarang berubah, tapi sangat sering ditambahkan. Menggunakan HBase dapat dikelola miliaran baris data secara efisien. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 11. Arsitektur Hadoop Censor Kelompok 1 Sekelompok modul dalam arsitektur hadoop kadang di sebut juga sebagai Ekosistem Hadoop. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 12. Cara Kerja Hadoop Censor Kelompok 1 Hadoop Distributed File System (HDFS) OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 13. Cara Kerja Hadoop Censor Kelompok 1  Hadoop Distributed File System adalah sebuah sistem berkas terdistribusi dengan high-availability yang dapat menyimpan data pada mesin komoditas, digunakan untuk menyediakan bandwidth sangat tinggi yang di agregasi ke semua cluster (node).  Berkas dibagi menjadi blok data dengan panjang yang baku dan didistribusikan secara redundan (berlebihan) pada simpul (node) yang berpartisipasi  Sebuah kluster HDFS terdiri dari NameNode, yang mengelola metadata dari kluster, dan DataNode yang menyimpan data/file  File dan direktori diwakili pada NameNode oleh inode. Inode menyimpan atribut seperti permission, modifikasi dan waktu akses, atau kuota namespace dan diskspace OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 14. Cara Kerja Hadoop Censor Kelompok 1  Isi file dibagi menjadi blok-blok file (biasanya 128 MB), dan setiap blok file tersebut direplikasi di beberapa DataNodes  Blok file disimpan pada sistem file lokal dari DataNode  Namenode aktif memonitor jumlah salinan/replika blok file. Ketika ada salinan blok file yang hilang karena kerusakan pada DataNode, NameNode akan mereplikasi kembali blok file tersebut ke datanode lainnya yang berjalan baik  NameNode mengelola struktur namespace dan memetakan blok file pada datanode OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 15. Cara Kerja Hadoop Censor Kelompok 1 Hadoop MapReduce MapReduce bertugas membagi data yang besar ke dalam potongan lebih kecil dan mengatur mereka kedalam bentuk tupel untuk pemrosesan paralel. Tupel adalah kombinasi antara key dan value-nya, dapat disimbolkan dengan notasi : "(k1, v1)". Dengan pemrosesan bersifat paralel tersebut, tentunya akan meningkatkan kecepatan dan keandalan komputasi pada sistem klustering. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 16. Cara Kerja Hadoop Censor Kelompok 1 MapReduce terdiri atas tiga tahap, yaitu tahap map, shuffle, dan terakhir reduce. Shuffle dan reduce digabungkan kedalam satu tahap saja yaitu tahap reduce.  Map berfungsi memproses data inputan yang umumnya berupa file yang tersimpan dalan HDFS, inputan tersebut kemudian diubah menjadi tuple yaitu pasangan antara key dan value-nya.  Tahap reduce, memproses data inputan dari hasil proses map, yang kemudian dilakukan tahap shuffle dan reduce yang hasil data set baru-nya disimpan di HDFS kembali. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 17. Cara Kerja Hadoop Censor Kelompok 1 Hadoop YARN Hadoop YARN adalah sebuah platform manajemen sumber daya yang bertanggung jawab atas pengelolaan sumber daya komputasi dalam sebuah cluster dan digunakan untuk penjadwalan aplikasi pengguna. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 18. Cara Kerja Hadoop Censor Kelompok 1 Tujuan awal YARN adalah untuk memisahkan dua tanggung jawab utama dari Job Tracker atau Task Tracker menjadi beberapa entitas yang terpisah.  Global Resource Manager di node master, yang berfungsi mengatur semua resource yang digunakan aplikasi dalam sistem  Application Master di setiap aplikasi, yang berfungsi untuk negosiasi resource dengan Resource Manager dan kemudian bekerja sama dengan Node Manager untuk mengeksekusi dan memonitor tasks  Node Manager di Agen-Framework setiap node slave, yang bertanggung jawab terhadap Container, dengan memantau penggunaan resource/sumber daya dari container (cpu, memori, disk, jaringan) dan melaporkannya pada Resource Manager.  Container di setiap aplikasi yang jalan di Node Manager, sebagai wadah penyimpanan data/file OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 19. Manfaat dari Penggunaan Hadoop dalam Big Data Censor Kelompok 1 Big data memiliki 3 tantangan utama sehingga Hadoop sangat dibutuhkan, yaitu karena :  Volume, keperluan menyimpan dan mengelola data dalam jumlah yang sangat besar, dan data tersebut selalu tambah besar setiap saat.  Velocity, begitu cepat data yang muncul dan keperluan untuk bisa mengakses data besar tersebut dengan cepat.  Variety, semakin bervariasinya data saat ini sehingga dengan teknologi relational database (RDBMS) saat ini sudah tidak bisa ditangani lagi. Hadoop optimal digunakan untuk menangani data dalam jumlah besar baik data Structured, Semi-structured, maupun Unstructured. Hadoop mereplikasi data di beberapa komputer (Klustering), sehingga jika salah satu komputer mati/bermasalah maka data dapat diproses dari salah satu komputer lainnya yang masih hidup. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 20. Kelebihan dan Kekurangan Hadoop Censor Kelompok 1 Kelebihan Hadoop  Hadoop merupakan software bebas dan open source  Hadoop dapat menampung data dengan jumlah yang sangat besar Kekurangan Hadoop  Map reduce hanya bisa berjalan secara serial untuk mengolah data. Artinya tidak bisa dilakukan pemrosesan data secara paralel  Map Reduce hanya bisa berjalan dalam batch atau secara periodik dan tidak bisa terus menerus secara realtime. Hal ini membuat Map Reduce tidak bisa mengolah data dalam bentuk streaming tanpa henti seperti misalnya tweet dari twitter OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 21. Implementasi Hadoop Censor Kelompok 1 Penggunaan Hadoop saat ini sudah semakin luas, diantaranya adalah :  Yahoo Terdiri dari 24.000 server di 17 cluster. Lebih dari 10 petabytes data user. Mengerjakan ratusan ribu jobs tiap bulannya. Dan digunakan untuk news, search dan mail.  New York Times Menggunakan Hadoop untuk mengkonversi artikel NYTimes menjadi pdf dari tahun 1851 sampai dengan 1922. Berjalan di atas 100 server Amazon EC2 selama 24 jam. Input data sebesar 4TB dan output 1,5TB.  Facebook Digunakan untuk data mining dan data werehousing, user data analysis. Dan dijalankan di 600 server. OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 22. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Sebelum memulai isntalasi pastikan anda memiliki software ini : Hadoop 2.7.1 Java – Jdk 1.7 Berikut ini adalah step-stepnya Configuration Step 1 – Windows path configuration Set HADOOP_HOME path in enviornment variable for windows Right click on my computer > properties > advanced system settings > advance tab > environment variables > click on new
  • 23. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN
  • 24. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Set hadoop bin directory path Find path variable in system variable > click on edit > at the end insert ‘; (semicolon)’ and paste path upto hadoop bin directory in my case it’s a
  • 25. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Step 2 – Hadoop configuration Edit hadoop-2.7.1/etc/hadoop/core-site.xml, paste the following lines and save it. Edit hadoop-2.7.1/etc/hadoop/mapred-site.xml, paste the following lines and save it.
  • 26. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Edit hadoop-2.7.1/etc/hadoop/hdfs-site.xml, paste the following lines and save it, please create data folder somewhere and in my case i have created it in my HADOOP_HOME directory
  • 27. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Edit hadoop-2.7.1/etc/hadoop/yarn-site.xml, paste the following lines and save it.
  • 28. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Edit hadoop-2.7.1/etc/hadoop/hadoop-env.cmd, comment existing %JAVA_HOME% using @rem at start, give proper path and save it. (my jdk is in program files to avoid spaces i gave PROGRA~1)
  • 29. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN o Demo Step 3 – Start everything Very Important step Before starting everything you need to add some [dot].dll and [dot].exe files of windows please download bin folder from my github repository -sardetushar_gitrepo_download bin folder – this contains .dll and .exe file (winutils.exe for hadoop 2.7.1) Now delete you existing bin folder and replace with new one (downloaded from my repo)
  • 30. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Open cmd and type ‘hdfs namenode -format’ – after execution you will see below logs
  • 31. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN JPS – to see services are running open cmd and type – jps (for jps make sure your java path is set properly)
  • 32. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN o GUI Step 4 – namenode GUI, resource manager GUI Resource manager GUI address – http://localhost:8088
  • 33. Cara Install Hadoop Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Namenode GUI address – http://localhost:50070
  • 34. Kesimpulan Censor Kelompok 1 OUTLINEOUTLINE SEJARAHSEJARAH PENGERTIANPENGERTIAN ARSITEKTURARSITEKTUR MANFAATMANFAAT CARA KERJACARA KERJA KELEBIHANKELEBIHAN KEKURANGANKEKURANGAN IMPLEMENTAS I IMPLEMENTAS I CARA INSTALLCARA INSTALL KESIMPULANKESIMPULAN Kesimpulannya yaitu:  Hadoop merupakan framework yang digunakan sebagai solusi untuk Big Data dan bersifat open source.  Hadoop HDFS adalah sistem file terdistribusi yang bersifat fault-tolerant dan mendukung untuk mengolah data set yang besar (Big Data).  Hadoop MapReduce adalah model komputasi berbasis Java pada sistem terdistribusi dalam rangka mendukung aplikasi Big Data.  Hadoop YARN adalah platform untuk resource- management yang muncul untuk mengatasi limitasi MapReduce pada arsitektur Hadoop 1.0.