Open Data Handbook ฉบับภาษาไทย
เพื่อสนับสนุนการจัดทำ Open Government Data โดยหน่วยงานที่สนใจหรือผู้ที่สนใจสามารถใช้คู่มือเล่มนี้เป็นแนวทางในการจัดทำชุดข้อมูลที่เหมาะสมสำหรับการเผยแพร่ และเป็นประโยชน์ในการนำขึ้นเว็บไซต์ ศูนย์กลางข้อมูลภาครัฐ (data.go.th) ต่อไป
Open Data Handbook ฉบับภาษาไทย
เพื่อสนับสนุนการจัดทำ Open Government Data โดยหน่วยงานที่สนใจหรือผู้ที่สนใจสามารถใช้คู่มือเล่มนี้เป็นแนวทางในการจัดทำชุดข้อมูลที่เหมาะสมสำหรับการเผยแพร่ และเป็นประโยชน์ในการนำขึ้นเว็บไซต์ ศูนย์กลางข้อมูลภาครัฐ (data.go.th) ต่อไป
This slides present concept of Data Mining and Big Data Analytics. The topices are:
- Internet of Things (IoT)
- Data Science/Mining applications
- Data Science/Mining techniques including (1) Association, (2) Clustering, (3) Classification
- CRISP-DM: Cross Industry Standard Process for Data Mining
This slides present concept of Data Mining and Big Data Analytics. The topices are:
- Internet of Things (IoT)
- Data Science/Mining applications
- Data Science/Mining techniques including (1) Association, (2) Clustering, (3) Classification
- CRISP-DM: Cross Industry Standard Process for Data Mining
Business executives sometimes ask us, “Isn’t ‘big data’ just another way of saying ‘analytics’?” It’s true that they’re related: The big data movement, like analytics before it, seeks to glean intelligence from data and translate that into business advantage.
This presentation was presented to the Executives of Queen Sirikit Botanical Garden on the occasion of signing ceremony of cooperation between the National Electronics and Computer Technology Center and Queen Sirikit Botanical Garden at NECTEC, Pathumthani on August 16, 2010.
8. ตัวอย่างข้อมูล Big Data
• ข้อมูลเครือข่ายสังคม
• ข้อมูลการบริการทางเว็บ
• ข้อมูลธุรกรรมทางธนาคาร
• ข้อมูลการสื่อสารจากโทรศัพท์เคลื่อนที่
• ข้อมูลภาพถ่ายดาวเทียม
• ข้อมูลสภาพอากาศ
9. ทำไมต้องสนใจ Big Data
• ปัจจุบันเรามีข้อมูลที่หลายหลายรูปแบบ ปริมาณเยอะมาก
ถ้าเราเก็บไว้โดยที่ไม่ทำอะไรก็ไม่เกิดประโยชน์ แต่ถ้านำ
เอาเทคนิคความรู้ในด้าน Big Data เข้ามาช่วย นำข้อมูลที่
มีปริมาณเยอะมาประมวลผล วิเคราะห์ และนำข้อมูลเหล่า
นั้นไปใช้ให้เกิดประโยชน์
10.
11. Apache Hadoop
• ซอฟแวร์ที่สำคัญที่มีการนำมาใช้กันมากในระบบ Big
data คือ Hadoop เพราะ Hadoop เป็น Open Source
Technology พัฒนาขึ้นด้วยภาษา Java ที่จะทำหน้าที่เป็น
Distributed Storage ที่สามารถเก็บข้อมูลขนาดใหญ่ที่
เป็น Unstructure และนำมาประมวลผลได้ โดยองค์ประ
กอบหลักๆของ Hadoop จะประกอบด้วย Hadoop
Dustributed File System (HDFS) และ MapReduce
ใช้สำหรับประมวลผลข้อมูลที่มีขนาดใหญ่บน cluster ได้