Hadoop

•Download as PPTX, PDF•

0 likes•363 views

AnsviaLab

Hadoop

Technology

WHY HADOOP?
• PROSES DATA DENGAN UKURAN YANG SANGAT BESAR
• MAHALNYA HARGA MESIN YANG DAPAT MEMPROSES DATA BESAR DENGAN CEPAT
• EFISIENSI, RELIABEL, DAN MUDAH DIGUNAKAN
• OPEN SOURCE

HADOOP
• SOFTWARE OPENSOURCE DARI APACHE UNTUK KOMPUTASI TERDEISTRIBUSI YANG HANDAL DAN
SKALABILITAS TINGGI
• PEMROSESAN TERDISTRIBUSI DARI KUMPULAN DATA YANG BESAR PADACLUSTER DENGAN
MENGGUNAKAN PEMROGRAMAN SEDERHANA
• MEMILIKI KEMAMPUAN UNTUK MENDETEKSI DAN MENANGANI KEGAGALAN PADALAYER APLIKASI UNTUK
MEMBERIKAN LAYANAN HIGH-AVAILABILTY PADA SETIAP CLUSTER

HADOOP
• HDFS
• NAME NODE
• DATA NODE
• MAP/REDUCE
• JOB TRACKER
• TASK TRACKER

HDFS (HADOOP DISTRIBUTED FILE SYSTEM)
• TEMPAT PENYIMPANAN DATA PADAHADOOP TERDIRI DARI NODE-NODE PENYIMPANAN
• DAPAT MENYIMPAN DATA DALAM JUMLAH BESAR
• HIGH-AVAILABILITY (SETIAP DATA DIDUPLIKASI)
• DATA DIPECAH TERLEBIH DAHULU KE DALAM BENTUKBLOCK-BLOCK SEBELUM DIMASUKKAN KE DALAM
HDFS
• TERDIRI DARI DATANODE DAN NAMENODE

NAME NODE
• TEMPAT MENYIMPAN ALAMAT DATA YANG DIMASUKKAN PADA DATA NODE (META DATA)
• MANAGEMEN KONFIGURASI CLUSTER
• MAPPING BLOCK DATA PADA DATANODE
• SATU CLUSTER TERDAPAT 1 NAMENODE YANG BERJALAN

DATA NODE
• TEMPAT PENYIMPANAN BLOCK-BLOCK FILE
• SATU CLUSTER TERDIRI DARI BEBERAPA DATANODE
• BESAR BLOCK TERSERAH ADMIN (BIASANYA 64MB, 128MB, DST)

MAP/REDUCE
• PROGRAMMING MODEL UNTUK PENGOLAHAN DATA SECARA DISTRIBUSI
• PEMROSESAN DIPECAH MENJADI 2, TAHAPAN MAP DAN TAHAPAN REDUCE

WORD COUNT EXAMPLE
• MAPPER
• INPUT: VALUE: LINES OF TEXT OF INPUT
• OUTPUT: KEY: WORD, VALUE: 1
• REDUCER
• INPUT: KEY: WORD, VALUE: SET OF COUNTS
• OUTPUT: KEY: WORD, VALUE: SUM
• LAUNCHING PROGRAM
• DEFINES THIS JOB
• SUBMITS JOB TO CLUSTER

Viewers also liked

Usability testAnsviaLab

Oop scalaAnsviaLab

casperjs presentationAnsviaLab

Material Design With PolymerAnsviaLab

The most technical mistakes in tech startupAnsviaLab

Blackbox And Whitebox TestingAnsviaLab

Mengamankan SSH IDAnsviaLab

Artificial intelligence deep learningAnsviaLab

Omni planAnsviaLab

Debian serverAnsviaLab

Bagaimana menjadi system administrator yang baikAnsviaLab

Dynamic dnsAnsviaLab

SeoAnsviaLab

CAPISTRANOAnsviaLab

Intercept Analyze DataAnsviaLab

Evaluasi user interfaceAnsviaLab

Content marketingAnsviaLab

Search engine optimizationAnsviaLab

Best Practices For Writing Super Readable CodeAnsviaLab

File carvingAnsviaLab

Viewers also liked (20)

Usability test

Oop scala

casperjs presentation

Material Design With Polymer

The most technical mistakes in tech startup

Blackbox And Whitebox Testing

Mengamankan SSH ID

Artificial intelligence deep learning

Omni plan

Debian server

Bagaimana menjadi system administrator yang baik

Dynamic dns

Seo

CAPISTRANO

Intercept Analyze Data

Evaluasi user interface

Content marketing

Search engine optimization

Best Practices For Writing Super Readable Code

File carving

Similar to Hadoop

Aspera - Bridging On Premise and Cloud Deployments for Broadcast ITFrançois Quereuil

IBM Aspera - Moving the world’s data at maximum speedMohamed Morsi

Cloudera Analytics and Machine Learning Platform - Optimized for Cloud Stefan Lipp

Pachube: an open, easy to use, secure & scalable platform for building the 'I...pachube

HadoopJaydeep Patel

From Zero to Data Flow in Hours with Apache NiFiDataWorks Summit/Hadoop Summit

Hp hadoop platformAkshat Thakar

HUG France - Apache DrillMapR Technologies

Colorado Springs Open Source Hadoop/MySQL David Smelker

Red Hat Storage Day Dallas - Storage for OpenShift Containers Red_Hat_Storage

BIG DATA ANALYSISNitesh Singh

Building a geospatial processing pipeline using Hadoop and HBase and how Mons...DataWorks Summit

AWS Partner Webcast - Hadoop in the Cloud: Unlocking the Potential of Big Dat...Amazon Web Services

Concepts on HadoopChristopher Sharkey

Hadoop and NoSQL joining forces by Dale Kim of MapRData Con LA

True Reusable Code - DevSum2016Eduard Lazar

Building a scalable analytics environment to support diverse workloadsAlluxio, Inc.

Analytics using big data technologiesBalakrishnan Vinchu

Semantic web meetup 14.november 2013Jean-Pierre König

Customer Applications Of Hadoop On Red Hat Storage ServerRed_Hat_Storage

Similar to Hadoop (20)

Aspera - Bridging On Premise and Cloud Deployments for Broadcast IT

IBM Aspera - Moving the world’s data at maximum speed

Cloudera Analytics and Machine Learning Platform - Optimized for Cloud

Pachube: an open, easy to use, secure & scalable platform for building the 'I...

Hadoop

From Zero to Data Flow in Hours with Apache NiFi

Hp hadoop platform

HUG France - Apache Drill

Colorado Springs Open Source Hadoop/MySQL

Red Hat Storage Day Dallas - Storage for OpenShift Containers

BIG DATA ANALYSIS

Building a geospatial processing pipeline using Hadoop and HBase and how Mons...

AWS Partner Webcast - Hadoop in the Cloud: Unlocking the Potential of Big Dat...

Concepts on Hadoop

Hadoop and NoSQL joining forces by Dale Kim of MapR

True Reusable Code - DevSum2016

Building a scalable analytics environment to support diverse workloads

Analytics using big data technologies

Semantic web meetup 14.november 2013

Customer Applications Of Hadoop On Red Hat Storage Server

Recently uploaded

Developer Data Modeling Mistakes: From Postgres to NoSQLScyllaDB

Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024BookNet Canada

Advanced Computer Architecture – An IntroductionDilum Bandara

Unraveling Multimodality with Large Language Models.pdfAlex Barbosa Coqueiro

SALESFORCE EDUCATION CLOUD | FEXLE SERVICESmohitsingh558521

Moving Beyond Passwords: FIDO Paris Seminar.pdfLoriGlavin3

Tampa BSides - Chef's Tour of Microsoft Security Adoption Framework (SAF)Mark Simos

unit 4 immunoblotting technique complete.pptxBkGupta21

Gen AI in Business - Global Trends Report 2024.pdfAddepto

Use of FIDO in the Payments and Identity Landscape: FIDO Paris Seminar.pptxLoriGlavin3

Hyperautomation and AI/ML: A Strategy for Digital Transformation Success.pdfPrecisely

TeamStation AI System Report LATAM IT Salaries 2024Lonnie McRorey

"Debugging python applications inside k8s environment", Andrii SoldatenkoFwdays

The Role of FIDO in a Cyber Secure Netherlands: FIDO Paris Seminar.pptxLoriGlavin3

Take control of your SAP testing with UiPath Test SuiteDianaGray10

Generative AI for Technical Writer or Information DevelopersRaghuram Pandurangan

Dev Dives: Streamline document processing with UiPath Studio WebUiPathCommunity

DevEX - reference for building teams, processes, and platformsSergiu Bodiu

Unleash Your Potential - Namagunga Girls Coding ClubKalema Edgar

New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024BookNet Canada

Recently uploaded (20)

Developer Data Modeling Mistakes: From Postgres to NoSQL

Transcript: New from BookNet Canada for 2024: Loan Stars - Tech Forum 2024

Advanced Computer Architecture – An Introduction

Unraveling Multimodality with Large Language Models.pdf

SALESFORCE EDUCATION CLOUD | FEXLE SERVICES

Moving Beyond Passwords: FIDO Paris Seminar.pdf

Tampa BSides - Chef's Tour of Microsoft Security Adoption Framework (SAF)

unit 4 immunoblotting technique complete.pptx

Gen AI in Business - Global Trends Report 2024.pdf

Use of FIDO in the Payments and Identity Landscape: FIDO Paris Seminar.pptx

Hyperautomation and AI/ML: A Strategy for Digital Transformation Success.pdf

TeamStation AI System Report LATAM IT Salaries 2024

"Debugging python applications inside k8s environment", Andrii Soldatenko

The Role of FIDO in a Cyber Secure Netherlands: FIDO Paris Seminar.pptx

Take control of your SAP testing with UiPath Test Suite

Generative AI for Technical Writer or Information Developers

Dev Dives: Streamline document processing with UiPath Studio Web

DevEX - reference for building teams, processes, and platforms

Unleash Your Potential - Namagunga Girls Coding Club

New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024

Hadoop

2. WHY HADOOP? • PROSES DATA DENGAN UKURAN YANG SANGAT BESAR • MAHALNYA HARGA MESIN YANG DAPAT MEMPROSES DATA BESAR DENGAN CEPAT • EFISIENSI, RELIABEL, DAN MUDAH DIGUNAKAN • OPEN SOURCE

3. HADOOP • SOFTWARE OPENSOURCE DARI APACHE UNTUK KOMPUTASI TERDEISTRIBUSI YANG HANDAL DAN SKALABILITAS TINGGI • PEMROSESAN TERDISTRIBUSI DARI KUMPULAN DATA YANG BESAR PADACLUSTER DENGAN MENGGUNAKAN PEMROGRAMAN SEDERHANA • MEMILIKI KEMAMPUAN UNTUK MENDETEKSI DAN MENANGANI KEGAGALAN PADALAYER APLIKASI UNTUK MEMBERIKAN LAYANAN HIGH-AVAILABILTY PADA SETIAP CLUSTER

4. HADOOP • HDFS • NAME NODE • DATA NODE • MAP/REDUCE • JOB TRACKER • TASK TRACKER

5. HDFS (HADOOP DISTRIBUTED FILE SYSTEM) • TEMPAT PENYIMPANAN DATA PADAHADOOP TERDIRI DARI NODE-NODE PENYIMPANAN • DAPAT MENYIMPAN DATA DALAM JUMLAH BESAR • HIGH-AVAILABILITY (SETIAP DATA DIDUPLIKASI) • DATA DIPECAH TERLEBIH DAHULU KE DALAM BENTUKBLOCK-BLOCK SEBELUM DIMASUKKAN KE DALAM HDFS • TERDIRI DARI DATANODE DAN NAMENODE

6. NAME NODE • TEMPAT MENYIMPAN ALAMAT DATA YANG DIMASUKKAN PADA DATA NODE (META DATA) • MANAGEMEN KONFIGURASI CLUSTER • MAPPING BLOCK DATA PADA DATANODE • SATU CLUSTER TERDAPAT 1 NAMENODE YANG BERJALAN

7. DATA NODE • TEMPAT PENYIMPANAN BLOCK-BLOCK FILE • SATU CLUSTER TERDIRI DARI BEBERAPA DATANODE • BESAR BLOCK TERSERAH ADMIN (BIASANYA 64MB, 128MB, DST)

10. MAP/REDUCE • PROGRAMMING MODEL UNTUK PENGOLAHAN DATA SECARA DISTRIBUSI • PEMROSESAN DIPECAH MENJADI 2, TAHAPAN MAP DAN TAHAPAN REDUCE

11. WORD COUNT EXAMPLE • MAPPER • INPUT: VALUE: LINES OF TEXT OF INPUT • OUTPUT: KEY: WORD, VALUE: 1 • REDUCER • INPUT: KEY: WORD, VALUE: SET OF COUNTS • OUTPUT: KEY: WORD, VALUE: SUM • LAUNCHING PROGRAM • DEFINES THIS JOB • SUBMITS JOB TO CLUSTER

12. WORD COUNT DATAFLOW

13. MATUR TENGKYU

Hadoop

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (20)

Similar to Hadoop

Similar to Hadoop (20)

Recently uploaded

Recently uploaded (20)

Hadoop