SlideShare a Scribd company logo
1 of 41
Analisis Performa Kecepatan Mapreduce
Pada Hadoop Menggunakan TCP Packet Flow Analysis
Priagung Khusumanegara
1006661084
Skripsi
Teknik Komputer
Universitas Indonesia
Senin, 30 Juni 2014
Latar Belakang
Referensi Gambar: http://technews.tmcnet.com/telecommunications/topics/telecommunications/articles/156051-what-att-purchase-t-mobile-means.htm
1. Mengimplementasikan sebuah program untuk mengolah data aliran paket
TCP pada sebuah jaringan yang dapat dijalankan secara terditribusi oleh
Hadoop,
2. Melakukan percobaan terhadap enam skenario berdasarkan topologi yang
telah dirancang,
3. Melakukan analisis pengaruh physical node, virtual node, block size dan
jumlah slot map terhadap kecepatan MapReduce pada Hadoop.
Tujuan Penelitian
Hadoop Framework
Hadoop merupakan framework software
berbasis Java dan opensource yang
berfungsi untuk mengolah data yang
memiliki ukuran besar secara terdistribusi.
Pengertian Hadoop
Hadoop terdiri dari 2 komponen inti:
1.Hadoop Distributed File System (HDFS)
2.MapReduce
Arsitektur Hadoop
Gambar: Bagian inti Hadoop (a) komponen HDFS (b) komponen MapReduce
Referensi Gambar : JeongJin Cheon, Tae-Young Choe. Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET), Gyeongbuk Korea, 2013.
HADOOP
HDFS MapReduce
• File system pada Hadoop
• Menyimpan data secara terdisribusi
• Data disimpan dalam bentuk potongan-potongan (secara default
64 MB)
Hadoop Distributed File System (HDFS)
Referensi Gambar: http://www.cloudera.com/content/dam/cloudera/product-assets/hdfs-data-distribution.png
Gambar: Distribusi data pada HDFS
HDFS memiliki 3 komponen utama berupa:
1.NameNode
2.DataNode
3.Secondary NameNode
Komponen HDFS
Gambar: Komponen HDFS
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
1. NameNode
• Berada pada master node
• Mengkoordinasi DataNode yang terdapat pada slave node.
Komponen HDFS…Lanjutan…
Gambar: NameNode pada HDFS
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
2. DataNode
• Berada pada slave node
• Menyimpan data pada slave node.
Komponen HDFS…Lanjutan…
Gambar: DataNode pada HDFS
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
3. Secondary NameNode
• Berada pada master node
• Melakukan monitoring keadaan dari cluster HDFS.
Komponen HDFS…Lanjutan…
Gambar: Secondary NameNode pada HDFS
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
• Framework untuk aplikasi dan programming yang digunakan Hadoop
• Melakukan suatu pekerjaan dari komputasi terdistribusi yang dijalankan
pada sebuah cluster.
• Proses utama : Map dan Reduce
Mapreduce
Gambar: Bagian inti Hadoop (a) komponen HDFS (b) komponen MapReduce
HADOOP
HDFS MapReduce
Referensi Gambar : JeongJin Cheon, Tae-Young Choe. Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET), Gyeongbuk Korea, 2013.
Shuffle ReduceMap
Proses Mapreduce
Referensi Gambar : The overall MapReduce WordCount process, http://www.rabidgremlin.com/data20/#%283%29. Dikases pada tanggal 30 Oktober 2013.
Gambar 2.4 Proses MapReduce pada Hadoop
Komponen MapReduce pada Hadoop yaitu:
1.JobTracker
2.TaskTracker
Komponen Mapreduce
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
Gambar: Komponen MapReduce
1. JobTracker
• Memecah permintaan yang diberikan ke HDFS menjadi beberapa pekerjaan
yang lebih kecil.
• Memberikan pekerjaan tersebut kepada setiap slave node.
Komponen Mapreduce…Lanjutan…
Gambar: Komponen MapReduce
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
2. Tasktracker
• Berfungsi untuk menerima pekerjaan yang diberikan oleh JobTracker.
• Menjalankan pekerjaan yang diberikan JobTracker.
Komponen Mapreduce…Lanjutan…
Gambar: Kerja TaskTracker pada setiap node
Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
Perancangan, Hasil, dan Analisa
TCP Packet Flow Analysis
• Menganalisis aliran paket yang terdapat pada sebuah jaringan
menggunakan Hadoop.
• Program yang menggunakan konsep MapReduce.
Gambar: Contoh file yang akan diproses
TCP Packet Flow Analysis…Lanjutan…
Gambar: Flowchart TCP Packet Flow Analysis
TCP Packet Flow Analysis…Lanjutan…
Gambar: Hasil dari TCP Packet Flow Analysis (a) packet total (b) packet length
Skenario 1
Hardware Laptop 1 Laptop 2
CPU
AMD Dual Core,
Clock Speed 1.48 GHz
Intel Dual Core,
Clock Speed 2.0 GHz
RAM 4.00 GB 4.00 GB
Sistem Operasi CentOS 6.3 CentOS 6.3
Gambar: Topologi Skenario 1
Tabel: Spesifikasi machine yang digunakan pada skenario 1
Hasil Skenario 1
Skenario 2
Hardware Host VM 1 VM 2
CPU
AMD Dual Core,
Clock Speed 1.48 GHz
One Core One Core
RAM 4.00 GB 1.00 GB 1.00 GB
Sistem Operasi CentOS 6.3 CentOS 6.3 CentOS 6.3
Gambar: Topologi Skenario 2
Tabel: Spesifikasi machine yang digunakan pada skenario 2
Hasil Skenario 2
Skenario 3
Hardware Laptop 1
CPU AMD Dual Core, Clock Speed 1.48 GHz
RAM 4.00 GB
Sistem Operasi CentOS 6.3
Gambar: Pembagian block size pada Hadoop yang dijalankan secara single node
Tabel: Spesifikasi machine yang digunakan pada skenario 3
Hasil Skenario 3
Analisis Skenario 3
Gambar: Jumlah task pada file 1 GB dengan (a) block size 64 MB (b) block size 128 MB
Gambar: Komunikasi antara scheduler, JobTracker, dan TaskTracker
Analisis Skenario 3…Lanjutan…
Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 256 MB
Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 256 MB
Skenario 4
Hardware Laptop 1 Laptop 2
CPU
AMD Dual Core,
Clock Speed 1.48 GHz
Intel Dual Core,
Clock Speed 2.0 GHz
RAM 4.00 GB 4.00 GB
Sistem Operasi CentOS 6.3 CentOS 6.3
Gambar: Pembagian block size pada Hadoop yang dijalankan secara multi node
Tabel: Spesifikasi machine yang digunakan pada skenario 4
Hasil Skenario 4
Analisis Skenario 4
Gambar: Jumlah task pada file 512 GB dengan block size 128 MB
Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 128 MB
Skenario 5
Hardware Laptop 1
CPU AMD Dual Core, Clock Speed 1.48 GHz
RAM 4.00 GB
Sistem Operasi CentOS 6.3
Gambar: Gambaran slot map pada Hadoop
Tabel: Spesifikasi machine yang digunakan pada skenario 5
Hasil Skenario 5
Skenario 6
Hardware PC
CPU Intel i7-2600 , Clock Speed 3.4 GHz
RAM 4.00 GB
Sistem Operasi CentOS 6.3
Gambar: Topologi Skenario 6
Tabel: Spesifikasi machine yang digunakan pada skenario 6
Hasil Skenario 6
1. Penambahan jumlah physical machine dapat mempercepat kecepatan rata-rata
MapReduce.
2. Penambahan jumlah virtual machine dapat memperlambat kecepatan rata-rata
MapReduce.
3. Block size dapat mempengaruhi kecepatan MapReduce pada Hadoop, semakin
besar block size maka semakin cepat kecepatan MapReduce pada Hadoop
dengan syarat: number of task > slot map
Kesimpulan
4. Jumlah slot map dapat mempengaruhi kecepatan MapReduce pada Hadoop,
dimana performa kecepatan MapReduce lebih cepat jika jumlah slot map pada
Hadoop sesuai dengan jumlah core yang dimiliki oleh machine.
5. Hadoop memiliki keunggulan dalam mengolah data yang memiliki ukuran yang
besar dan jumlah yang banyak karena Hadoop dapat mengolah data tersebut
secara terdistribusi.
Kesimpulan…Lanjutan…
1. Leslie Lamport and Nancy Lynch. (1989, February 3). Chapter on Distributed Computing.
2. Chuck Lam. (2011). Hadoop In Action. Stamford: Mainning Publications Co.
3. Tom White. (2009). Hadoop: The Definitive Guide. California: O’Reilly.
4. Garry Turkington. (2013). Hadoop Beginner's Guide. Birmingham: Packt Publishing.
5. Shv, Hairong, SRadia, Chansler. (2010). The Hadoop Distributed File System. Jurnal IEEE.
6. Intel Corporation. (2013). Optimizing Java* and Apache Hadoop* for Intel® Architecture.
USA: Intel Corporation.
7. Apache TM
Hadoop @ homepage. http://hadoop.apache.org/. Diakses 17 Oktober 2013.
8. JeongJin Cheon, Tae-Young Choe. (2013). Distributed Processing of Snort Alert Log using
Hadoop. International Journal of Engineering and Technology (IJET).
9. Aditya B. Patel, Manashvi Birla, Ushma Nair. (2012). Addressing Big Data Problem Using
Hadoop and Map Reduce. Nirma University International Conference On Engineering.
Daftar Referensi
10. Amit Anand. (2013). Configuration Parameters dfs.Block.Size. Hadoop.
11. Dima May. (2012). Hadoop Distributed File System (HDFS) Overview. coreservlets.com.
12. Magang Industri. (2013). Definisi Cloud Computing. Meruvian.org Cloud Computing.
13. Colin White. (2012, January). MapReduce and the Data Scientist. BI Research.
14. R. David Idol. Large-Scale TCP Packet Flow Analysis for C Using Apache™ Hadoop.
University of North Carolina at Chapel Hill.
15. Tutorial dan Konfigurasi Hadoop Single Node.
16. http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-
cluster/. Diakses pada tanggal 20 Oktober 2013.
17. MapReduce Hadoop. http://www.yalescientific.org/2012/03/hadapt-yale-startup/. Diakses pada
tanggal 29 Oktober 2013.
Daftar Referensi…Lanjutan…
18. Interaction between the JobTracker, TaskTracker and the Scheduler @ homepage.
http://www.thecloudavenue.com/2011/11/interaction-between-jobtracker.html. Diakses
pada tanggal 29 Oktober 2013.
19. The overall MapReduce WordCount process,
20. http://www.rabidgremlin.com/data20/#%283%29. Diakses pada tanggal 30 Oktober 2013.
21. Thinking in MapReduce, https://engineering.cerner.com/2013/07/thinking-in-
mapreduce/. Diakses pada tanggal 30 Oktober 2013.
Daftar Referensi…Lanjutan…
Sekian…
Terima Kasih…

More Related Content

What's hot

Perkembangan sistem informasi
Perkembangan sistem informasiPerkembangan sistem informasi
Perkembangan sistem informasiUlmi_Kalsum
 
Masyarakat informasi
Masyarakat informasiMasyarakat informasi
Masyarakat informasiIrwan Dujour
 
MAKALAH CLOUD COMPUTING
MAKALAH CLOUD COMPUTINGMAKALAH CLOUD COMPUTING
MAKALAH CLOUD COMPUTINGHanny Maharani
 
Desain sistem keamanan jaringan
Desain sistem keamanan jaringanDesain sistem keamanan jaringan
Desain sistem keamanan jaringanTeuacan Nami
 
Modul 5 2 strategi pemberdayaan masyarakat desa
Modul 5 2 strategi pemberdayaan masyarakat desaModul 5 2 strategi pemberdayaan masyarakat desa
Modul 5 2 strategi pemberdayaan masyarakat desaSafa'at Muhtar
 
Data Base Tiket Pesawat
Data Base Tiket PesawatData Base Tiket Pesawat
Data Base Tiket Pesawatnaufals11
 
Struktur organisasi lsm indonesia membangun
Struktur organisasi lsm indonesia membangunStruktur organisasi lsm indonesia membangun
Struktur organisasi lsm indonesia membangunKantor M
 
Analisis dan perancangan basis data
Analisis dan perancangan basis dataAnalisis dan perancangan basis data
Analisis dan perancangan basis dataFadil Muhammad
 
Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043DinaNisrinaRosandi
 
Pemasaran Sosial [Sejarah,Definisi, Pemahaman, dan Konsep]
Pemasaran Sosial [Sejarah,Definisi, Pemahaman, dan Konsep]Pemasaran Sosial [Sejarah,Definisi, Pemahaman, dan Konsep]
Pemasaran Sosial [Sejarah,Definisi, Pemahaman, dan Konsep]Penny Hutabarat
 
Rekayasa Perangkat Lunak
Rekayasa Perangkat LunakRekayasa Perangkat Lunak
Rekayasa Perangkat LunakYudi Purwanto
 
Sessi 7 sistem informasi manajemen
Sessi 7   sistem informasi manajemenSessi 7   sistem informasi manajemen
Sessi 7 sistem informasi manajemenSatria Wijaya
 
Modul communication for_behavioral_impact(comb)-dbd
Modul communication for_behavioral_impact(comb)-dbdModul communication for_behavioral_impact(comb)-dbd
Modul communication for_behavioral_impact(comb)-dbdVicky Hilang
 
Pertemuan14 keamananwirelessnetworking
Pertemuan14 keamananwirelessnetworkingPertemuan14 keamananwirelessnetworking
Pertemuan14 keamananwirelessnetworkingRoziq Bahtiar
 
Ppt Penyebaran Berita Hoax Melalui Internet
Ppt Penyebaran Berita Hoax Melalui InternetPpt Penyebaran Berita Hoax Melalui Internet
Ppt Penyebaran Berita Hoax Melalui InternetTiara Arianti
 
03 enkapsulasi
03 enkapsulasi03 enkapsulasi
03 enkapsulasiKuliahKita
 

What's hot (20)

Perkembangan sistem informasi
Perkembangan sistem informasiPerkembangan sistem informasi
Perkembangan sistem informasi
 
Masyarakat informasi
Masyarakat informasiMasyarakat informasi
Masyarakat informasi
 
MAKALAH CLOUD COMPUTING
MAKALAH CLOUD COMPUTINGMAKALAH CLOUD COMPUTING
MAKALAH CLOUD COMPUTING
 
Desain sistem keamanan jaringan
Desain sistem keamanan jaringanDesain sistem keamanan jaringan
Desain sistem keamanan jaringan
 
Modul 5 2 strategi pemberdayaan masyarakat desa
Modul 5 2 strategi pemberdayaan masyarakat desaModul 5 2 strategi pemberdayaan masyarakat desa
Modul 5 2 strategi pemberdayaan masyarakat desa
 
Data Base Tiket Pesawat
Data Base Tiket PesawatData Base Tiket Pesawat
Data Base Tiket Pesawat
 
Struktur organisasi lsm indonesia membangun
Struktur organisasi lsm indonesia membangunStruktur organisasi lsm indonesia membangun
Struktur organisasi lsm indonesia membangun
 
Analisis dan perancangan basis data
Analisis dan perancangan basis dataAnalisis dan perancangan basis data
Analisis dan perancangan basis data
 
Bab 2 - Sekilas Tentang Proyek
Bab 2 - Sekilas Tentang ProyekBab 2 - Sekilas Tentang Proyek
Bab 2 - Sekilas Tentang Proyek
 
BIGDATA
BIGDATABIGDATA
BIGDATA
 
Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043
 
Requirement Engineering
Requirement EngineeringRequirement Engineering
Requirement Engineering
 
Pemasaran Sosial [Sejarah,Definisi, Pemahaman, dan Konsep]
Pemasaran Sosial [Sejarah,Definisi, Pemahaman, dan Konsep]Pemasaran Sosial [Sejarah,Definisi, Pemahaman, dan Konsep]
Pemasaran Sosial [Sejarah,Definisi, Pemahaman, dan Konsep]
 
Kode etik profesi it
Kode etik profesi itKode etik profesi it
Kode etik profesi it
 
Rekayasa Perangkat Lunak
Rekayasa Perangkat LunakRekayasa Perangkat Lunak
Rekayasa Perangkat Lunak
 
Sessi 7 sistem informasi manajemen
Sessi 7   sistem informasi manajemenSessi 7   sistem informasi manajemen
Sessi 7 sistem informasi manajemen
 
Modul communication for_behavioral_impact(comb)-dbd
Modul communication for_behavioral_impact(comb)-dbdModul communication for_behavioral_impact(comb)-dbd
Modul communication for_behavioral_impact(comb)-dbd
 
Pertemuan14 keamananwirelessnetworking
Pertemuan14 keamananwirelessnetworkingPertemuan14 keamananwirelessnetworking
Pertemuan14 keamananwirelessnetworking
 
Ppt Penyebaran Berita Hoax Melalui Internet
Ppt Penyebaran Berita Hoax Melalui InternetPpt Penyebaran Berita Hoax Melalui Internet
Ppt Penyebaran Berita Hoax Melalui Internet
 
03 enkapsulasi
03 enkapsulasi03 enkapsulasi
03 enkapsulasi
 

Viewers also liked

Viewers also liked (9)

The Cognitive Net is Coming
The Cognitive Net is ComingThe Cognitive Net is Coming
The Cognitive Net is Coming
 
Profiler for Smartphone Users Interests Using Modified Hierarchical Agglomera...
Profiler for Smartphone Users Interests Using Modified Hierarchical Agglomera...Profiler for Smartphone Users Interests Using Modified Hierarchical Agglomera...
Profiler for Smartphone Users Interests Using Modified Hierarchical Agglomera...
 
Distance function
Distance functionDistance function
Distance function
 
Feature Selection
Feature Selection Feature Selection
Feature Selection
 
Clusteryanam
ClusteryanamClusteryanam
Clusteryanam
 
Fall detection
Fall detectionFall detection
Fall detection
 
Domain specific IoT
Domain specific IoTDomain specific IoT
Domain specific IoT
 
Decision tree and random forest
Decision tree and random forestDecision tree and random forest
Decision tree and random forest
 
Understanding Random Forests: From Theory to Practice
Understanding Random Forests: From Theory to PracticeUnderstanding Random Forests: From Theory to Practice
Understanding Random Forests: From Theory to Practice
 

Similar to ANALISIS KINERJA

Analisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanAnalisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanLippo Group Digital
 
Modul membaca netcdf
Modul membaca netcdfModul membaca netcdf
Modul membaca netcdfDimaz Gunawan
 
Pemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataPemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataEmus Kelen
 
Operating System--Memory
Operating System--MemoryOperating System--Memory
Operating System--MemoryEverhythm Past
 
Big Data Essentials With Hadoop
Big Data Essentials With HadoopBig Data Essentials With Hadoop
Big Data Essentials With HadoopMochamad Khoiron
 
Layanan Jaringan Installasi & Konfigurasi
Layanan Jaringan Installasi & KonfigurasiLayanan Jaringan Installasi & Konfigurasi
Layanan Jaringan Installasi & KonfigurasiAlfajri Tsaqifurrosyid
 
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfjbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfIhsanAzhary1
 
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptxSEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptxANNISA735564
 
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptxPENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptxYogiswaraDPutra
 
Tugas 5 0317-fahreza yozi-1612510832
Tugas 5 0317-fahreza yozi-1612510832Tugas 5 0317-fahreza yozi-1612510832
Tugas 5 0317-fahreza yozi-1612510832fahreza yozi
 
Slide Jaringan Komputer ITB pertemuan 1
Slide Jaringan Komputer ITB pertemuan 1 Slide Jaringan Komputer ITB pertemuan 1
Slide Jaringan Komputer ITB pertemuan 1 Putu Shinoda
 
Belajar Pemrograman Matlab
Belajar Pemrograman MatlabBelajar Pemrograman Matlab
Belajar Pemrograman Matlabsoftscients
 
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeezeMedia penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeezeSuyadi Abu Farros
 
Suci Arrum Meilani - Manajemen Memori
Suci Arrum Meilani - Manajemen MemoriSuci Arrum Meilani - Manajemen Memori
Suci Arrum Meilani - Manajemen Memoribelajarkomputer
 
Pengaplikasian halaman Log-in berbasis MySQL
Pengaplikasian halaman Log-in berbasis MySQLPengaplikasian halaman Log-in berbasis MySQL
Pengaplikasian halaman Log-in berbasis MySQLeckoep
 

Similar to ANALISIS KINERJA (20)

Analisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatanAnalisa pengaruh block size pada hdfs terhadap kecepatan
Analisa pengaruh block size pada hdfs terhadap kecepatan
 
Modul membaca netcdf
Modul membaca netcdfModul membaca netcdf
Modul membaca netcdf
 
Pemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi dataPemrosesan paralel untuk kompresi data
Pemrosesan paralel untuk kompresi data
 
Operating System--Memory
Operating System--MemoryOperating System--Memory
Operating System--Memory
 
Big Data Essentials With Hadoop
Big Data Essentials With HadoopBig Data Essentials With Hadoop
Big Data Essentials With Hadoop
 
Cloud computing
Cloud computingCloud computing
Cloud computing
 
Layanan Jaringan Installasi & Konfigurasi
Layanan Jaringan Installasi & KonfigurasiLayanan Jaringan Installasi & Konfigurasi
Layanan Jaringan Installasi & Konfigurasi
 
Merakit Personal Komputer PC
Merakit Personal Komputer PCMerakit Personal Komputer PC
Merakit Personal Komputer PC
 
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdfjbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
jbptunikompp-gdl-widiantoni-29694-14-24.1010-b.pdf
 
Memory
MemoryMemory
Memory
 
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptxSEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
SEMNASRETRO 2023_ANNISA OCTAVYANTI HAKIM2.pptx
 
Front side bus
Front side busFront side bus
Front side bus
 
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptxPENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
PENGANTAR TEKNOLOGI INFORMASI-PERTEMUAN 2.pptx
 
Tugas 5 0317-fahreza yozi-1612510832
Tugas 5 0317-fahreza yozi-1612510832Tugas 5 0317-fahreza yozi-1612510832
Tugas 5 0317-fahreza yozi-1612510832
 
Slide Jaringan Komputer ITB pertemuan 1
Slide Jaringan Komputer ITB pertemuan 1 Slide Jaringan Komputer ITB pertemuan 1
Slide Jaringan Komputer ITB pertemuan 1
 
Belajar Pemrograman Matlab
Belajar Pemrograman MatlabBelajar Pemrograman Matlab
Belajar Pemrograman Matlab
 
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeezeMedia penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
Media penyimpanan-terdistribusi-degan-glusterfs-pada-debian-squeeze
 
Module desain web
Module desain webModule desain web
Module desain web
 
Suci Arrum Meilani - Manajemen Memori
Suci Arrum Meilani - Manajemen MemoriSuci Arrum Meilani - Manajemen Memori
Suci Arrum Meilani - Manajemen Memori
 
Pengaplikasian halaman Log-in berbasis MySQL
Pengaplikasian halaman Log-in berbasis MySQLPengaplikasian halaman Log-in berbasis MySQL
Pengaplikasian halaman Log-in berbasis MySQL
 

Recently uploaded

MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxmariaboisala21
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompokelmalinda2
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxnursariheldaseptiana
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiCristianoRonaldo185977
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxAhmadSyajili
 
Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Surveikustiyantidew94
 
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehBISMIAULIA
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptAhmadSyajili
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxrikosyahputra0173
 

Recently uploaded (9)

MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptxMARIA NOVILIA BOISALA FASILITATOR PMM.pptx
MARIA NOVILIA BOISALA FASILITATOR PMM.pptx
 
415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok415418921-statistika- mean media modus data tunggal dan data kelompok
415418921-statistika- mean media modus data tunggal dan data kelompok
 
PPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptxPPT Olah Nilai Kurikulum merdeka belajar.pptx
PPT Olah Nilai Kurikulum merdeka belajar.pptx
 
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet RiyadiManajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
Manajemen Lalu Lintas Baru Di Jalan Selamet Riyadi
 
kesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptxkesalahan tipe 1 dan 2 pada statistik.pptx
kesalahan tipe 1 dan 2 pada statistik.pptx
 
Metode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau SurveiMetode penelitian Deskriptif atau Survei
Metode penelitian Deskriptif atau Survei
 
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS AcehSKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
SKP GURU satuan kinerja pegawai tahun 2023 untuk PNS Aceh
 
pertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.pptpertemuan-3-distribusi pada-frekuensi.ppt
pertemuan-3-distribusi pada-frekuensi.ppt
 
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptxMATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
MATERI SESI 2 KONSEP ETIKA KOMUNIKASI.pptx
 

ANALISIS KINERJA

  • 1. Analisis Performa Kecepatan Mapreduce Pada Hadoop Menggunakan TCP Packet Flow Analysis Priagung Khusumanegara 1006661084 Skripsi Teknik Komputer Universitas Indonesia Senin, 30 Juni 2014
  • 2. Latar Belakang Referensi Gambar: http://technews.tmcnet.com/telecommunications/topics/telecommunications/articles/156051-what-att-purchase-t-mobile-means.htm
  • 3. 1. Mengimplementasikan sebuah program untuk mengolah data aliran paket TCP pada sebuah jaringan yang dapat dijalankan secara terditribusi oleh Hadoop, 2. Melakukan percobaan terhadap enam skenario berdasarkan topologi yang telah dirancang, 3. Melakukan analisis pengaruh physical node, virtual node, block size dan jumlah slot map terhadap kecepatan MapReduce pada Hadoop. Tujuan Penelitian
  • 5. Hadoop merupakan framework software berbasis Java dan opensource yang berfungsi untuk mengolah data yang memiliki ukuran besar secara terdistribusi. Pengertian Hadoop
  • 6. Hadoop terdiri dari 2 komponen inti: 1.Hadoop Distributed File System (HDFS) 2.MapReduce Arsitektur Hadoop Gambar: Bagian inti Hadoop (a) komponen HDFS (b) komponen MapReduce Referensi Gambar : JeongJin Cheon, Tae-Young Choe. Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET), Gyeongbuk Korea, 2013. HADOOP HDFS MapReduce
  • 7. • File system pada Hadoop • Menyimpan data secara terdisribusi • Data disimpan dalam bentuk potongan-potongan (secara default 64 MB) Hadoop Distributed File System (HDFS) Referensi Gambar: http://www.cloudera.com/content/dam/cloudera/product-assets/hdfs-data-distribution.png Gambar: Distribusi data pada HDFS
  • 8. HDFS memiliki 3 komponen utama berupa: 1.NameNode 2.DataNode 3.Secondary NameNode Komponen HDFS Gambar: Komponen HDFS Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 9. 1. NameNode • Berada pada master node • Mengkoordinasi DataNode yang terdapat pada slave node. Komponen HDFS…Lanjutan… Gambar: NameNode pada HDFS Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 10. 2. DataNode • Berada pada slave node • Menyimpan data pada slave node. Komponen HDFS…Lanjutan… Gambar: DataNode pada HDFS Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 11. 3. Secondary NameNode • Berada pada master node • Melakukan monitoring keadaan dari cluster HDFS. Komponen HDFS…Lanjutan… Gambar: Secondary NameNode pada HDFS Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 12. • Framework untuk aplikasi dan programming yang digunakan Hadoop • Melakukan suatu pekerjaan dari komputasi terdistribusi yang dijalankan pada sebuah cluster. • Proses utama : Map dan Reduce Mapreduce Gambar: Bagian inti Hadoop (a) komponen HDFS (b) komponen MapReduce HADOOP HDFS MapReduce Referensi Gambar : JeongJin Cheon, Tae-Young Choe. Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET), Gyeongbuk Korea, 2013.
  • 13. Shuffle ReduceMap Proses Mapreduce Referensi Gambar : The overall MapReduce WordCount process, http://www.rabidgremlin.com/data20/#%283%29. Dikases pada tanggal 30 Oktober 2013. Gambar 2.4 Proses MapReduce pada Hadoop
  • 14. Komponen MapReduce pada Hadoop yaitu: 1.JobTracker 2.TaskTracker Komponen Mapreduce Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011. Gambar: Komponen MapReduce
  • 15. 1. JobTracker • Memecah permintaan yang diberikan ke HDFS menjadi beberapa pekerjaan yang lebih kecil. • Memberikan pekerjaan tersebut kepada setiap slave node. Komponen Mapreduce…Lanjutan… Gambar: Komponen MapReduce Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 16. 2. Tasktracker • Berfungsi untuk menerima pekerjaan yang diberikan oleh JobTracker. • Menjalankan pekerjaan yang diberikan JobTracker. Komponen Mapreduce…Lanjutan… Gambar: Kerja TaskTracker pada setiap node Referensi Gambar : Chuck Lam. Hadoop In Action. Mainning Publications Co, Stamford, 2011.
  • 18. TCP Packet Flow Analysis • Menganalisis aliran paket yang terdapat pada sebuah jaringan menggunakan Hadoop. • Program yang menggunakan konsep MapReduce. Gambar: Contoh file yang akan diproses
  • 19. TCP Packet Flow Analysis…Lanjutan… Gambar: Flowchart TCP Packet Flow Analysis
  • 20. TCP Packet Flow Analysis…Lanjutan… Gambar: Hasil dari TCP Packet Flow Analysis (a) packet total (b) packet length
  • 21. Skenario 1 Hardware Laptop 1 Laptop 2 CPU AMD Dual Core, Clock Speed 1.48 GHz Intel Dual Core, Clock Speed 2.0 GHz RAM 4.00 GB 4.00 GB Sistem Operasi CentOS 6.3 CentOS 6.3 Gambar: Topologi Skenario 1 Tabel: Spesifikasi machine yang digunakan pada skenario 1
  • 23. Skenario 2 Hardware Host VM 1 VM 2 CPU AMD Dual Core, Clock Speed 1.48 GHz One Core One Core RAM 4.00 GB 1.00 GB 1.00 GB Sistem Operasi CentOS 6.3 CentOS 6.3 CentOS 6.3 Gambar: Topologi Skenario 2 Tabel: Spesifikasi machine yang digunakan pada skenario 2
  • 25. Skenario 3 Hardware Laptop 1 CPU AMD Dual Core, Clock Speed 1.48 GHz RAM 4.00 GB Sistem Operasi CentOS 6.3 Gambar: Pembagian block size pada Hadoop yang dijalankan secara single node Tabel: Spesifikasi machine yang digunakan pada skenario 3
  • 27. Analisis Skenario 3 Gambar: Jumlah task pada file 1 GB dengan (a) block size 64 MB (b) block size 128 MB Gambar: Komunikasi antara scheduler, JobTracker, dan TaskTracker
  • 28. Analisis Skenario 3…Lanjutan… Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 256 MB Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 256 MB
  • 29. Skenario 4 Hardware Laptop 1 Laptop 2 CPU AMD Dual Core, Clock Speed 1.48 GHz Intel Dual Core, Clock Speed 2.0 GHz RAM 4.00 GB 4.00 GB Sistem Operasi CentOS 6.3 CentOS 6.3 Gambar: Pembagian block size pada Hadoop yang dijalankan secara multi node Tabel: Spesifikasi machine yang digunakan pada skenario 4
  • 31. Analisis Skenario 4 Gambar: Jumlah task pada file 512 GB dengan block size 128 MB Gambar: Proses MapReduce pada ukuran file 512 MB dengan block size 128 MB
  • 32. Skenario 5 Hardware Laptop 1 CPU AMD Dual Core, Clock Speed 1.48 GHz RAM 4.00 GB Sistem Operasi CentOS 6.3 Gambar: Gambaran slot map pada Hadoop Tabel: Spesifikasi machine yang digunakan pada skenario 5
  • 34. Skenario 6 Hardware PC CPU Intel i7-2600 , Clock Speed 3.4 GHz RAM 4.00 GB Sistem Operasi CentOS 6.3 Gambar: Topologi Skenario 6 Tabel: Spesifikasi machine yang digunakan pada skenario 6
  • 36. 1. Penambahan jumlah physical machine dapat mempercepat kecepatan rata-rata MapReduce. 2. Penambahan jumlah virtual machine dapat memperlambat kecepatan rata-rata MapReduce. 3. Block size dapat mempengaruhi kecepatan MapReduce pada Hadoop, semakin besar block size maka semakin cepat kecepatan MapReduce pada Hadoop dengan syarat: number of task > slot map Kesimpulan
  • 37. 4. Jumlah slot map dapat mempengaruhi kecepatan MapReduce pada Hadoop, dimana performa kecepatan MapReduce lebih cepat jika jumlah slot map pada Hadoop sesuai dengan jumlah core yang dimiliki oleh machine. 5. Hadoop memiliki keunggulan dalam mengolah data yang memiliki ukuran yang besar dan jumlah yang banyak karena Hadoop dapat mengolah data tersebut secara terdistribusi. Kesimpulan…Lanjutan…
  • 38. 1. Leslie Lamport and Nancy Lynch. (1989, February 3). Chapter on Distributed Computing. 2. Chuck Lam. (2011). Hadoop In Action. Stamford: Mainning Publications Co. 3. Tom White. (2009). Hadoop: The Definitive Guide. California: O’Reilly. 4. Garry Turkington. (2013). Hadoop Beginner's Guide. Birmingham: Packt Publishing. 5. Shv, Hairong, SRadia, Chansler. (2010). The Hadoop Distributed File System. Jurnal IEEE. 6. Intel Corporation. (2013). Optimizing Java* and Apache Hadoop* for Intel® Architecture. USA: Intel Corporation. 7. Apache TM Hadoop @ homepage. http://hadoop.apache.org/. Diakses 17 Oktober 2013. 8. JeongJin Cheon, Tae-Young Choe. (2013). Distributed Processing of Snort Alert Log using Hadoop. International Journal of Engineering and Technology (IJET). 9. Aditya B. Patel, Manashvi Birla, Ushma Nair. (2012). Addressing Big Data Problem Using Hadoop and Map Reduce. Nirma University International Conference On Engineering. Daftar Referensi
  • 39. 10. Amit Anand. (2013). Configuration Parameters dfs.Block.Size. Hadoop. 11. Dima May. (2012). Hadoop Distributed File System (HDFS) Overview. coreservlets.com. 12. Magang Industri. (2013). Definisi Cloud Computing. Meruvian.org Cloud Computing. 13. Colin White. (2012, January). MapReduce and the Data Scientist. BI Research. 14. R. David Idol. Large-Scale TCP Packet Flow Analysis for C Using Apache™ Hadoop. University of North Carolina at Chapel Hill. 15. Tutorial dan Konfigurasi Hadoop Single Node. 16. http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node- cluster/. Diakses pada tanggal 20 Oktober 2013. 17. MapReduce Hadoop. http://www.yalescientific.org/2012/03/hadapt-yale-startup/. Diakses pada tanggal 29 Oktober 2013. Daftar Referensi…Lanjutan…
  • 40. 18. Interaction between the JobTracker, TaskTracker and the Scheduler @ homepage. http://www.thecloudavenue.com/2011/11/interaction-between-jobtracker.html. Diakses pada tanggal 29 Oktober 2013. 19. The overall MapReduce WordCount process, 20. http://www.rabidgremlin.com/data20/#%283%29. Diakses pada tanggal 30 Oktober 2013. 21. Thinking in MapReduce, https://engineering.cerner.com/2013/07/thinking-in- mapreduce/. Diakses pada tanggal 30 Oktober 2013. Daftar Referensi…Lanjutan…