Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Peerapat Asoktummarungsri
914 views
Meetup Big Data by THJUG
Meetup Big Data by Thai Java User Group
Engineering
◦
Read more
1
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 19
2
/ 19
3
/ 19
4
/ 19
5
/ 19
6
/ 19
7
/ 19
8
/ 19
9
/ 19
10
/ 19
11
/ 19
12
/ 19
13
/ 19
14
/ 19
15
/ 19
16
/ 19
17
/ 19
18
/ 19
19
/ 19
More Related Content
PDF
Big Data
by
ThongChai YesMan
PPT
Big Data
by
Thanakrit Lersmethasakul
PDF
Preprocessing with RapidMiner Studio 6
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
PDF
ข้อมูลขนาดใหญ่ Big data
by
maruay songtanin
PDF
Evaluation metrics: Precision, Recall, F-Measure, ROC
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
PPTX
Big Data: IT does matter
by
Sven Niedner
PDF
Building Decision Tree model with numerical attributes
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
PDF
เจาะกระแส Big Data
by
IMC Institute
Big Data
by
ThongChai YesMan
Big Data
by
Thanakrit Lersmethasakul
Preprocessing with RapidMiner Studio 6
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
ข้อมูลขนาดใหญ่ Big data
by
maruay songtanin
Evaluation metrics: Precision, Recall, F-Measure, ROC
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
Big Data: IT does matter
by
Sven Niedner
Building Decision Tree model with numerical attributes
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
เจาะกระแส Big Data
by
IMC Institute
Viewers also liked
PPTX
Big Data - 25 Amazing Facts Everyone Should Know
by
Bernard Marr
PPTX
Big Data Analytics with Hadoop
by
Philippe Julio
PPTX
What is Big Data?
by
Bernard Marr
PDF
Introduction to Data Mining and Big Data Analytics
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
KEY
Big Data in Real-Time at Twitter
by
nkallen
PDF
Big Data v Data Mining
by
University of Hertfordshire
Big Data - 25 Amazing Facts Everyone Should Know
by
Bernard Marr
Big Data Analytics with Hadoop
by
Philippe Julio
What is Big Data?
by
Bernard Marr
Introduction to Data Mining and Big Data Analytics
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
Big Data in Real-Time at Twitter
by
nkallen
Big Data v Data Mining
by
University of Hertfordshire
Similar to Meetup Big Data by THJUG
PDF
Managing Big Data with Apache Hadoop.pdf
by
NETsolutions Asia: NSA – Thailand, Sripatum University: SPU
PDF
รู้สิ่งใดไม่สู้...รู้งี้....
by
Supasate Choochaisri
PDF
บทความ Big Data จากบล็อก thanachart.org
by
IMC Institute
PDF
BigData และการนำมาใช้BigData และการนำมาใช้
by
SUMETRATPRACHUM1
PPTX
บทที่ 2 คุณลักษณะสำคัญของคลังข้อมูล.pptx
by
PloyphanSornsuwit
PDF
Introduction-Management NoSQL with MongoDB.pdf
by
NETsolutions Asia: NSA – Thailand, Sripatum University: SPU
PDF
Big data
by
Satra Eadtrong
PDF
Google bigtableappengine
by
Kanda Runapongsa Saikaew
PDF
Big data
by
newmooxx
PDF
Ch2 bi gdata
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
First Step to Big Data
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
PDF
Data mining and_big_data_web
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
PDF
Chapter 2 : Data Management
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Introduction to Data Mining and Big Data Analytics
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
PDF
เสี่ยวเอ้อสอน Spark
by
Bhuridech Sudsee
PDF
Big data 101
by
Somkiat Puisungnoen
PPT
Database
by
Edz Chatchawan
PPT
การพัฒนาเอกสารออนไลน์ขั้นสูง Intro
by
Jenchoke Tachagomain
PDF
Internship
by
Thunyaporn Kulna
PPT
Scalable Distributed Data Structures for Internet Construction
by
knopporn
Managing Big Data with Apache Hadoop.pdf
by
NETsolutions Asia: NSA – Thailand, Sripatum University: SPU
รู้สิ่งใดไม่สู้...รู้งี้....
by
Supasate Choochaisri
บทความ Big Data จากบล็อก thanachart.org
by
IMC Institute
BigData และการนำมาใช้BigData และการนำมาใช้
by
SUMETRATPRACHUM1
บทที่ 2 คุณลักษณะสำคัญของคลังข้อมูล.pptx
by
PloyphanSornsuwit
Introduction-Management NoSQL with MongoDB.pdf
by
NETsolutions Asia: NSA – Thailand, Sripatum University: SPU
Big data
by
Satra Eadtrong
Google bigtableappengine
by
Kanda Runapongsa Saikaew
Big data
by
newmooxx
Ch2 bi gdata
by
ธนาพัฒน์ ลิ้มสายพรหม
First Step to Big Data
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
Data mining and_big_data_web
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
Chapter 2 : Data Management
by
ธนาพัฒน์ ลิ้มสายพรหม
Introduction to Data Mining and Big Data Analytics
by
Big Data Engineering, Faculty of Engineering, Dhurakij Pundit University
เสี่ยวเอ้อสอน Spark
by
Bhuridech Sudsee
Big data 101
by
Somkiat Puisungnoen
Database
by
Edz Chatchawan
การพัฒนาเอกสารออนไลน์ขั้นสูง Intro
by
Jenchoke Tachagomain
Internship
by
Thunyaporn Kulna
Scalable Distributed Data Structures for Internet Construction
by
knopporn
More from Peerapat Asoktummarungsri
PDF
Lightweight javaEE with Guice
by
Peerapat Asoktummarungsri
PDF
Evolution of MQ Messaging to Distributed Data Pipeline
by
Peerapat Asoktummarungsri
PDF
Sonarqube
by
Peerapat Asoktummarungsri
PDF
Sonar
by
Peerapat Asoktummarungsri
PDF
ePassport eKYC for Financial
by
Peerapat Asoktummarungsri
PDF
Security Deployment by CI/CD
by
Peerapat Asoktummarungsri
PDF
Easy java
by
Peerapat Asoktummarungsri
PDF
Meet Django
by
Peerapat Asoktummarungsri
PDF
Hadoop
by
Peerapat Asoktummarungsri
PDF
Modern Java Development
by
Peerapat Asoktummarungsri
PDF
Homeloan
by
Peerapat Asoktummarungsri
PDF
Data Pipeline with Kafka
by
Peerapat Asoktummarungsri
PDF
Roboguice
by
Peerapat Asoktummarungsri
PDF
Cassandra - Distributed Data Store
by
Peerapat Asoktummarungsri
Lightweight javaEE with Guice
by
Peerapat Asoktummarungsri
Evolution of MQ Messaging to Distributed Data Pipeline
by
Peerapat Asoktummarungsri
Sonarqube
by
Peerapat Asoktummarungsri
Sonar
by
Peerapat Asoktummarungsri
ePassport eKYC for Financial
by
Peerapat Asoktummarungsri
Security Deployment by CI/CD
by
Peerapat Asoktummarungsri
Easy java
by
Peerapat Asoktummarungsri
Meet Django
by
Peerapat Asoktummarungsri
Hadoop
by
Peerapat Asoktummarungsri
Modern Java Development
by
Peerapat Asoktummarungsri
Homeloan
by
Peerapat Asoktummarungsri
Data Pipeline with Kafka
by
Peerapat Asoktummarungsri
Roboguice
by
Peerapat Asoktummarungsri
Cassandra - Distributed Data Store
by
Peerapat Asoktummarungsri
Meetup Big Data by THJUG
1.
Peerapat A. ©
2014 THJUG THJUG Meetup BIG DATA
2.
Peerapat A. ©
2014 THJUG ME Senior Software Engineer @ FICO Blogger @ thjug.com Failed Startuper Twitterlian
3.
Peerapat A. ©
2014 THJUG Special Thank ก่อนเริ่มงานผมก็ขอขอบคุณทางบริษัท Oracle และมหาวิทยาลัยสุรนารี ครับ รวมถึงน้องอาร์ม, พี่ต่อ, พี่ใหม่ (อาจารย์ชาญวิทย์) และคณาจารย์และนักศึกษาจากมทส. ถ้าไม่ไ่ด้คนเหล่านี้คงไม่มีงานวันนี้เหมือนกัน ! สำหรับค่าของว่างนี่ก็มาจากเงินที่ผมไปไถเพือนๆ พี่ น้อง ที่ยอมเสียสละเวลามาเรียน Mobile Backend API with JavaEE กับผมในอีกสองอาทิตย์ข้างหน้านะครับ ขอบคุณครับ
4.
Peerapat A. ©
2014 THJUG Data Structure Level Example Structure RDBMS Semi-structure XML, JSON Quasi-structure Text Document Unstructure Image, Video ก่อนจะเริ่ม Big Data ขอทบทวน Data Structure นิดหน่อย ก็ตามรูปครับ อยากให้มองรูปแบบของตาต้าในโลกเป็นสี่ส่วนตามรูป
5.
Peerapat A. ©
2014 THJUG Big Data? คำถาม: บิ๊กดาต้าคืออะไร
6.
Peerapat A. ©
2014 THJUG Big data analytics is concerned with the analysis of large volumes of transaction/event data and behavioral analysis of human/human a human/system interactions. (Gartner) Big data represents the collection of technologies that handle large data volumes well beyond that inflection point and for which, at least in theory, hardware resources required to manage data by volume track to an almost straight line rather than a curve. (IDC) นิยาม BigData ของ Gartner กับ IDC
7.
Peerapat A. ©
2014 THJUG เปรียบเทียบงานของบิ๊กดาต้ากับเรือขนของขนาดใหญ่นะครับ จะเห็นว่าขนได้ทีเยอะมาก(มองเป็นข้อมูล) แต่ใช้เวลานาน(Overhead สูง) ! เหมาะกับงานที่ต้องการประมวลผลข้อมูลใหญ่ๆ โดยไม่สนใจเรื่องของ Latency ที่จะเกิดขึ้น ! อย่างที่อ. ชาญวิทย์จะมาโชว์ Aiyara วันนี้ก็ใช้เวลาหลักชั่วโมง … (แต่นี่ข้อมูลระดับ 34 GB) เชียวนะ
8.
Peerapat A. ©
2014 THJUG Big Data Challenges Source: oracle.com ขนาด ความเร็ว ความหลากหลายและสุดท้ายต้องเกิด Value
9.
Peerapat A. ©
2014 THJUG Why Hadoop? ทำไมถึงเลือก Hadoop สำหรับ Big Data ทั้งที่จริงๆ มีหลาย Platform ที่ทำงานกับ Big Data ได้ ?
10.
Peerapat A. ©
2014 THJUG Infographic by GO-Globe.com มาดูกันดีกว่าว่ามีดาต้าอะไรเกิดขึ้นรอบตัวเราใน 1 วินาทีกัน (นี่ไม่ใช่ทั้งหมดนะ) จะเห็นว่าข้อมูลทีมีหลากหลายมาก และส่วนใหญ่มักเป็น Quasi-Structure และ Unstructure ซะด้วย
11.
Peerapat A. ©
2014 THJUG Hadoop Figure by - apache.org ลักษณะการทำงานคร่าวๆ ภาพรวมคือเวลา client ติดต่อมาจะคุยกับตัวกลางที่จะเป็นคนกระจายการทำงานไปยังแต่ละ Distribute Node ภาพนี้ Abstract พอสมควรนะครับ ตัว Node Manager จะเป็นทั้ง Disk และ Processing ในตัว
12.
Peerapat A. ©
2014 THJUG Figure by - hortonworks.com สมัย 1.0 นี่รองรับได้สูงสุดแค่ 4000 nodes ส่วน 2.0 ที่มียานแม่ด้วยนี่หลักหมื่น การเปลี่ยนแปลงที่เห็นชัดสุดคือมี YARN เพิ่มเข้ามาทีนี้เวลาจะทำอะไรก็จะติดต่อผ่านทาง YARN ทั้งหมด ไม่ยุ่งกับ HDFS โดยตรงแล้ว ! ถามว่าในแง่การเรียนรู้ควรเริ่มจากอะไร ต้องดูก่อนว่าคุณเป็นใคร ถ้าคุณเป็น Developer ไม่ต้องไปคิดมาก เพราะว่าในแง่การพัฒนามันไมไ่ด้มีอะไรต่างกัน แต่ถ้าคุณเป็น System Engineer จงเรียนรู้มันทั้งหมดซะ เพราะอย่างไรแล้ว HADOOP 2.0 ก็คงมาแทนในไม่ช้า แต่ 1.0 ก็ยังมีงานที่ต้องดูแลกันต่อไป
13.
Peerapat A. ©
2014 THJUG Figure by - hortonworks.com Hadoop Ecosystem. ! ตามรูปจะเห็นว่า Hadoop คือ Eco System ที่ส่วนตัวผมมองมันเป็น Distributed OS ไปแล้ว … มี File System ของตัวเอง มี Cluster Resource Management ของตัวเอง แล้วก็สามารถเอา Application ต่างๆ มา on top บนตัวมันอีกที
14.
Peerapat A. ©
2014 THJUG HDFS Hadoop Distributed File System 1 2 5 3 4 1 2 5 1 4 3 1 5 3 2 5 4 4 2 3 Replication Factor = 3 A B C D E HDFS ตัวนี้แหละหัวใจของ Hadoop เลย ! Replication Factor นี่ถ้าใครทำพวก Cluster จะได้ยินคำนี้บ่อยๆ มันคือค่าที่บอกว่าดาต้าจะถูก duplicate เอาไว้ทั้งหมดกี่ชุด และหมายถึงจำนวนคอมพิวเตอร์ในระบบที่ห้ามตายพร้อมกันด้วย เช่น ถ้าตามรูปถ้า A,C,D ตาย อาจจะไม่สามารถ recovery data ได้ (เพราะ 1 หายไปแล้ว)
15.
Peerapat A. ©
2014 THJUG MapReduce Function (k1, v1) -> list(k2, v2) (k2, List(v2)) -> list(k3, v3)Reduce: Map: สำคัญสุดนะ .. เพราะถ้าไม่เข้าใจคุณจะเริ่มเขียนโปรแกรมเพือทำงานกับ Hadoop ไม่ได้เลย ! ถามว่าการที่มันเรียกว่า framework แสดงว่ามันเป้นส่วนที่กำหนดให้เราทำตามเฉยๆ แล้วมีงานอีกส่วนนึงทำด้วยตัว Framework แทน … ! k1, v1 เป็นอะไรโดย default แล้วถ้าเป็น file processing มันคือ Offset, Line of Record นั่นเอง ! อีกหนึ่งทีคนเข้าใจผิด output ของ Map ไม่ใช่ input ของ Reduce ดังสมการจะเห็นว่า list(k2, v2) จะถูกแปรงเป็น k2, list(v2) (ทำโดยตัว Framework นั่นเอง) ! คำถามจะรู้ได้ไงว่า k3, v3 ที่ต้องการคืออะไร มันก็ขึ้นกับว่าคุณอยากถามอะไร :)
16.
Peerapat A. ©
2014 THJUG Map (k1, v1) -> list(k2, v2) k1 = LongWritable key v1 = Text value !k2 = word v2 = one
17.
Peerapat A. ©
2014 THJUG Reduce (k2, List(v2)) -> list(k3, v3) k2 = Text key List(v2) = Iterable<IntWriteable> values !k3 = key v3 = sum
18.
Peerapat A. ©
2014 THJUG MapReduce Framework v1 k2, v2 k3, v3 k2, list(v2) รูปนี้สำหรับอธิบายการทำงานทั้งหมดของ Map Reduce และ Hadoop จะเห็นว่า Method Map และ Reduce ที่คุณสร้างขึ้นมานั้นสำหรับทำงานแค่ในกรอบสีแดง แต่งานทั้งหมดที่ Hadoop ทำให้นั้นคือตั้งแต่ Input -> Spliting -> Mapping -> Shuffing -> Reducing -> Final Result ! แต่ระบบให้เราเขียนโปรแกรมแค่สองส่วนคือ Map, Reduce พอเพือความง่าย และจัดการในเรือ่งที่เหลือให้ ทั้ง Functional และ Non Functional เช่นการที่ Map ถูกแยกกันทำสามโหนดดังรูป
19.
Peerapat A. ©
2014 THJUG THANK YOU :) ขอบคุณครับ
Download