Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
ธนาพัฒน์ ลิ้มสายพรหม
237 views
Big Data 101 : Chapter 8 Module 1
Big Data 101 : Chapter 8 Module 1
Business
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 26
2
/ 26
3
/ 26
4
/ 26
5
/ 26
6
/ 26
7
/ 26
8
/ 26
9
/ 26
10
/ 26
11
/ 26
12
/ 26
13
/ 26
14
/ 26
15
/ 26
16
/ 26
17
/ 26
18
/ 26
19
/ 26
20
/ 26
21
/ 26
22
/ 26
23
/ 26
24
/ 26
25
/ 26
26
/ 26
More Related Content
PDF
การเขียนแผนภาพ DFD
by
skiats
PDF
Stat 101 Module2 การวิเคราะห์และแปลผล
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
แนวคิดแผนภาพกระแสข้อมูล
by
Shengyou Lin
PPT
SA Chapter 6
by
Nuth Otanasap
PDF
Epi info unit09
by
Banjong Ardkham
PDF
Epi info unit08
by
Banjong Ardkham
PDF
การรวบรวมความต้องการ
by
skiats
PPT
พจนานุกรมข้อมูล
by
tumetr
การเขียนแผนภาพ DFD
by
skiats
Stat 101 Module2 การวิเคราะห์และแปลผล
by
ธนาพัฒน์ ลิ้มสายพรหม
แนวคิดแผนภาพกระแสข้อมูล
by
Shengyou Lin
SA Chapter 6
by
Nuth Otanasap
Epi info unit09
by
Banjong Ardkham
Epi info unit08
by
Banjong Ardkham
การรวบรวมความต้องการ
by
skiats
พจนานุกรมข้อมูล
by
tumetr
What's hot
PDF
การออกแบบเอาต์พุต/การออกแบบอินพุต
by
CC Nakhon Pathom Rajabhat University
DOC
บทที่ 3 การวิเคราะห์ระบบและการออกแบบระบบ
by
Sarawut Panchon
PDF
สถาปัตยกรรมฐานข้อมูล
by
skiats
PDF
Epi info unit06
by
Banjong Ardkham
DOCX
สถิติ คณิตศาสตร์
by
Pla FC
PDF
Role math stat_cs
by
Laongphan Phan
PDF
Mis_hrcc
by
KruBeeKa
PDF
สถิติเบื่องต้น
by
othanatoso
PDF
01 introduction-to-system-analysis-and-design
by
NuNa DeeNa
PPT
วิธีการสำคัญในการวิเคราะห์ข้อมูลเชิงปริมาณ
by
Saiiew
PDF
งานนำเสนอ1 คอม
by
nuknook
PDF
คู่มือการใช้งานSpss
by
prapapan20
PPTX
ฐานข้อมูลเชิงสัมพันธ์ 2
by
kanjana Pongkan
PDF
ค32203 โครงการสอน
by
othanatoso
PPT
การวิเคราะห์ข้อมูลเชิงปริมาณ
by
tanongsak
PDF
Epi info unit07
by
Banjong Ardkham
PDF
ใบความรู้ที่ 1 การแก้ปัญหาด้วยกระบวนการเทคโนโลยีสารสนเทศ
by
Nattapon
PPT
Chapter4
by
ชาติสยาม ชาติสยาม
PDF
9 spss
by
Nitinop Tongwassanasong
PPTX
การสร้างแฟ้มข้อมูลจากแบบสอบถามโดยโปรแกรม SPSS
by
เบญจวรรณ กลสามัญ
การออกแบบเอาต์พุต/การออกแบบอินพุต
by
CC Nakhon Pathom Rajabhat University
บทที่ 3 การวิเคราะห์ระบบและการออกแบบระบบ
by
Sarawut Panchon
สถาปัตยกรรมฐานข้อมูล
by
skiats
Epi info unit06
by
Banjong Ardkham
สถิติ คณิตศาสตร์
by
Pla FC
Role math stat_cs
by
Laongphan Phan
Mis_hrcc
by
KruBeeKa
สถิติเบื่องต้น
by
othanatoso
01 introduction-to-system-analysis-and-design
by
NuNa DeeNa
วิธีการสำคัญในการวิเคราะห์ข้อมูลเชิงปริมาณ
by
Saiiew
งานนำเสนอ1 คอม
by
nuknook
คู่มือการใช้งานSpss
by
prapapan20
ฐานข้อมูลเชิงสัมพันธ์ 2
by
kanjana Pongkan
ค32203 โครงการสอน
by
othanatoso
การวิเคราะห์ข้อมูลเชิงปริมาณ
by
tanongsak
Epi info unit07
by
Banjong Ardkham
ใบความรู้ที่ 1 การแก้ปัญหาด้วยกระบวนการเทคโนโลยีสารสนเทศ
by
Nattapon
Chapter4
by
ชาติสยาม ชาติสยาม
9 spss
by
Nitinop Tongwassanasong
การสร้างแฟ้มข้อมูลจากแบบสอบถามโดยโปรแกรม SPSS
by
เบญจวรรณ กลสามัญ
Similar to Big Data 101 : Chapter 8 Module 1
PPTX
03 data preprocessing
by
นนทวัฒน์ บุญบา
PDF
Data
by
Aon Narinchoti
PPT
Week 5 scale_and_measurement
by
Sani Satjachaliao
DOCX
โครงงานคอมพิวเตอร์
by
Nattanan Rassameepak
PPT
สถิติเชิงบรรยาย
by
pattya0207
PDF
Mt60307 ch7-data visulization
by
ธนาพัฒน์ ลิ้มสายพรหม
DOC
เอกสารประกอบการสอนบทที่ 1
by
Nut Yuthapong
PPT
Spss jan2010
by
guest629111d
PPT
Spss jan2010
by
juriporn chuchanakij
PPTX
โครงงานคอมพิวเตอร์
by
Nattanan Rassameepak
PPTX
Spc basic for training in thai
by
Krissana Manoping
PPT
Spss
by
saypin
PDF
9789740333432
by
CUPress
PPT
Spssเริ่มต้น
by
saypin
PPT
Spss
by
saypin
PDF
data storytelling คือ อะไร ? การเล่าเรื่อง ( สตอรี่เทลลิ่ง ) จากข้อมูล
by
ธิติพล เทียมจันทร์
PDF
การใช้โปรแกรม Spss
by
thaweesak mahan
DOC
สถิติ
by
Ryoichi Kung
PPTX
How to run SPSS for Quantitative Analysis
by
Nana Tiraphaiboon
PDF
การวิเคราะห์ข้อมูลเบื้องต้นคืออะไร
by
AomJi Math-ed
03 data preprocessing
by
นนทวัฒน์ บุญบา
Data
by
Aon Narinchoti
Week 5 scale_and_measurement
by
Sani Satjachaliao
โครงงานคอมพิวเตอร์
by
Nattanan Rassameepak
สถิติเชิงบรรยาย
by
pattya0207
Mt60307 ch7-data visulization
by
ธนาพัฒน์ ลิ้มสายพรหม
เอกสารประกอบการสอนบทที่ 1
by
Nut Yuthapong
Spss jan2010
by
guest629111d
Spss jan2010
by
juriporn chuchanakij
โครงงานคอมพิวเตอร์
by
Nattanan Rassameepak
Spc basic for training in thai
by
Krissana Manoping
Spss
by
saypin
9789740333432
by
CUPress
Spssเริ่มต้น
by
saypin
Spss
by
saypin
data storytelling คือ อะไร ? การเล่าเรื่อง ( สตอรี่เทลลิ่ง ) จากข้อมูล
by
ธิติพล เทียมจันทร์
การใช้โปรแกรม Spss
by
thaweesak mahan
สถิติ
by
Ryoichi Kung
How to run SPSS for Quantitative Analysis
by
Nana Tiraphaiboon
การวิเคราะห์ข้อมูลเบื้องต้นคืออะไร
by
AomJi Math-ed
More from ธนาพัฒน์ ลิ้มสายพรหม
PPTX
Physics-Informed-Neural-Networks-PINNs.pptx
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Subnets, Gateways, and Route Table Explaned , tanapat limsaiprom
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
AWS Networking Basic , tanapat limsaiprom
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Tanapat-AWS-Certifacate-6-10.pdf
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Tanapat-AWS-certificate-1-5.pdf
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
AWS Identity and access management , tanapat limsaiprom
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
AWS Technical Essential , Tanapat Limsaiprom
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
AWS Amazon DynamoDB
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Hr clinic2
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
ฺBig Data 101Chapter 8 Module 2
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Chapter 6 predictive Analytics
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Ch4 e retailing strategy v62-a4
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Chapter5 descriptive statistic
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Ch2 bi gdata
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Chapter 2 : Data Management
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Ch1 Business Information foundation concept
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Chapter2 e-retailing
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Chapter2 module 4 Peopleware
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Chapter 2 Module 2 Hardware
by
ธนาพัฒน์ ลิ้มสายพรหม
PDF
Chapter2 M1-foundation concepts-thai-62 feb
by
ธนาพัฒน์ ลิ้มสายพรหม
Physics-Informed-Neural-Networks-PINNs.pptx
by
ธนาพัฒน์ ลิ้มสายพรหม
Subnets, Gateways, and Route Table Explaned , tanapat limsaiprom
by
ธนาพัฒน์ ลิ้มสายพรหม
AWS Networking Basic , tanapat limsaiprom
by
ธนาพัฒน์ ลิ้มสายพรหม
Tanapat-AWS-Certifacate-6-10.pdf
by
ธนาพัฒน์ ลิ้มสายพรหม
Tanapat-AWS-certificate-1-5.pdf
by
ธนาพัฒน์ ลิ้มสายพรหม
AWS Identity and access management , tanapat limsaiprom
by
ธนาพัฒน์ ลิ้มสายพรหม
AWS Technical Essential , Tanapat Limsaiprom
by
ธนาพัฒน์ ลิ้มสายพรหม
AWS Amazon DynamoDB
by
ธนาพัฒน์ ลิ้มสายพรหม
Hr clinic2
by
ธนาพัฒน์ ลิ้มสายพรหม
ฺBig Data 101Chapter 8 Module 2
by
ธนาพัฒน์ ลิ้มสายพรหม
Chapter 6 predictive Analytics
by
ธนาพัฒน์ ลิ้มสายพรหม
Ch4 e retailing strategy v62-a4
by
ธนาพัฒน์ ลิ้มสายพรหม
Chapter5 descriptive statistic
by
ธนาพัฒน์ ลิ้มสายพรหม
Ch2 bi gdata
by
ธนาพัฒน์ ลิ้มสายพรหม
Chapter 2 : Data Management
by
ธนาพัฒน์ ลิ้มสายพรหม
Ch1 Business Information foundation concept
by
ธนาพัฒน์ ลิ้มสายพรหม
Chapter2 e-retailing
by
ธนาพัฒน์ ลิ้มสายพรหม
Chapter2 module 4 Peopleware
by
ธนาพัฒน์ ลิ้มสายพรหม
Chapter 2 Module 2 Hardware
by
ธนาพัฒน์ ลิ้มสายพรหม
Chapter2 M1-foundation concepts-thai-62 feb
by
ธนาพัฒน์ ลิ้มสายพรหม
Big Data 101 : Chapter 8 Module 1
1.
Tanapat Limsaiprom BigData101 Chapter8
2.
Tanapat Limsaiprom BigData101 Chapter8
3.
การดาเนินการเก็บรวบรวมข้อมูล เพื่อนามาจัดทาเป็นข้อมูลสถิติมีวิธีการที่ใช้โดยทั่วไปมี
5 วิธี ดังนี้ 1. การเก็บรวบรวมข้อมูลจากรายงานหรือข้อมูลในระบบ (Reporting System) เป็นผลพลอยได้จากระบบการบริหารงาน เป็นการเก็บรวบรวมข้อมูลจากรายงานที่ทาไว้หรือข้อมูลที่ เก็บไว้ในระบบหรือ จากเอกสารประกอบการทางาน ซึ่งการเก็บรวบรวมข้อมูลจากรายงานส่วนมาก ใช้เพียงครั้งเดียว จากรายงานดังกล่าว อาจมีข้อมูลเบื้องต้น บางประเภทที่สามารถนามาประมวลเป็น ยอดรวมข้อมูลสถิติได้ วิธีเก็บรวบรวมข้อมูลจากรายงานของหน่วยบริหาร นับว่าเป็นวิธีการรวบรวมข้อมูลสถิติโดยไม่ต้อง สิ้นเปลืองค่าใช้จ่ายในการดาเนินงานมากนัก ค่าใช้จ่ายที่ใช้ส่วนใหญ่ก็เพื่อการประมวลผล พิมพ์ แบบฟอร์มต่างๆ ตลอดจนการพิมพ์ รายงาน วิธีการนี้ใช้กันมากทั้งในหน่วยงาน รัฐบาลและเอกชน Tanapat LimsaipromBigData101 Chapter8
4.
2. การเก็บรวบรวมข้อมูลจากทะเบียน
(Registration) เป็นข้อมูลสถิติที่ รวบรวมจากระบบทะเบียน มีลักษณะคล้ายกับการรวบรวมจากรายงานตรงที่เป็นผล พลอยได้เช่นเดียวกัน จะต่างกันตรงที่ แหล่งเบื้องต้นของข้อมูลเป็นเอกสารการ ทะเบียนซึ่งการเก็บมีลักษณะต่อเนื่อง มีการปรับแก้หรือเปลี่ยนแปลง ให้ถูกต้อง ทันสมัย Tanapat LimsaipromBigData101 Chapter8
5.
3. การเก็บรวบรวมข้อมูลโดยวิธีสามะโน
(Census ) เป็นการเก็บรวบรวม ข้อมูลสถิติของทุกๆ หน่วยของประชากรที่สนใจศึกษาภายในพื้นที่ที่กาหนด และ ภายในระยะเวลาที่กาหนด การเก็บรวบรวม ข้อมูลสถิติด้วยวิธีนี้ จะทาให้ได้ข้อมูล ในระดับพื้นที่ย่อย เช่น หมู่บ้าน ตาบล อาเภอ และทาให้ได้ข้อมูลที่เป็นค่าจริง Tanapat LimsaipromBigData101 Chapter8
6.
4. วิธีการทดลอง
(Experimental Design) การเก็บรวบรวม ข้อมูล โดยวิธีนี้จะต้องอาศัยวิชาสถิติในเรื่องการวางแผนการทดลองมาช่วย การวิจัย ทางสังคมส่วนใหญ่จะใช้วิธีนี้ไม่ได้โดยมากจะใช้กับการทดลองทางด้านเกษตร วิทยาศาสตร์ การแพทย์ เช่น ทดสอบผลของการใช้ปุ๋ยชนิดต่างๆ ต่อ การ เจริญเติบโตของพืช เป็นต้น Tanapat LimsaipromBigData101 Chapter8
7.
5. การเก็บรวบรวมข้อมูลโดยวิธีสารวจ
(Sample Survey) เป็นการเก็บรวบรวมข้อมูล สถิติ จากบางหน่วยของประชากรด้วยวิธีการเลือกตัวอย่าง การเก็บรวบ รวมข้อมูลสถิติด้วยวิธีนี้ จะทาให้ ได้ข้อมูลในระดับรวม เช่น จังหวัด ภาค เขตการปกครอง และรวมทั่วประเทศ และข้อมูลที่ได้จะเป็นค่า โดยประมาณ การสารวจเป็นวิธีการเก็บรวบรวมข้อมูลที่ใช้งบประมาณ เวลา และกาลังคนไม่มากนักจึง สามารถจัดทาได้เป็นประจาทุกปี หรือ ทุก 2 ปี ปัจจุบันการสารวจเป็นวิธีการเก็บรวบรวมข้อมูลสถิติที่มี ความสาคัญ และใช้กันอย่างแพร่หลายมากที่สุด ทั้งในวงการราชการและเอกชน Tanapat LimsaipromBigData101 Chapter8
8.
การเก็บรวบรวมข้อมูลโดยวิธีสารวจ (Sample Survey) Tanapat
LimsaipromBigData101 Chapter8
9.
Tanapat Limsaiprom BigData101 Chapter8
10.
กรณีที่มีจำนวนคำถำมในแบบสอบถำมมากๆ ผู้ใส่รหัสอาจจะจารหัสได้ไม่ครบจึงจาเป็นต้องจัดทา คู่มือลงรหัส อันประกอบด้วย 1.
เลขที่แบบสอบถาม หมายถึงเลขที่ของแบบสอบถามที่ได้รับคืนกลับมา การใส่เลขที่แบบสอบถามจะ ทำให้สำมำรถตรวจสอบข้อมูลจำกแบบสอบถำมได้ง่ำย ในกรณีที่มีการพิมพ์ข้อมูล เช่น ถ้าพบว่าอายุ ของผู้ตอบจากแบบสอบถามชุดที่ 150 เป็น 99 ปี ทำให้สำมำรถตรวจสอบว่ำพิมพ์ผิดหรือไม่ โดย ตรวจสอบจากแบบสอบถามชุดที่ 150 Tanapat LimsaipromBigData101 Chapter8
11.
2. เลขที่คาถาม
( Question Number ) เป็นเลขที่คาถามในแบบสอบถาม ผู้วิจัยจะกาหนดรหัสให้ตรงกับเลขที่ข้อในแบบสอบถาม 3. ชื่อตัวแปร ( Variable Name ) ส่วนใหญ่มักจะกาหนดให้ชื่อตัวแปรสอดคล้องกับความหมายของข้อมูล เช่น เพศ มักจะ ใช้ SEX รายได้ เป็น INCOME เป็นต้น 4. รายการของข้อมูล เป็นส่วนที่ระบุถึงคาถามในแต่ละข้อ Tanapat LimsaipromBigData101 Chapter8
12.
5. ขนาดของตัวแปร เป็นการกาหนดความกว้างของตัวแปร
ถ้าเป็นตัวแปรเชิงปริมาณ เช่น คะแนน สอบ ตัวแปรอาจจะมีจุดทศนิยม ต้องกาหนดจานวนหลักหลังจุดทศนิยม ด้วย เช่น ถ้าความกว้างของตัวแปร คะแนนสอบ เป็น 8.2 หมายถึงมีจานวนจุด หน้าจุดทศนิยม 5 หลัก และจานวนหลักหลังจุดทศนิยม 2 หลัก ( เลข 8 รวม หมายถึงจานวนหลักหน้าจุดทศนิยม จุดทศนิยมและจานวนหลักหลังจุดทศนิยม ) Tanapat LimsaipromBigData101 Chapter8
13.
6. ค่าที่เป็นไปได้พร้อมคาอธิบายความหมาย
( Possible Values or Label ) หมายถึงส่วนที่จะระบุค่าที่เป็นไปได้ของตัวแปร เช่น ตัวแปร SEX มีค่า “ 0 ” หมายถึง ชาย และค่า “ 1 ” หมายถึงหญิง ส่วนเลข 9 หมายถึง ผู้ตอบไม่ ตอบคาถามนี้ ( missing values ) ตัวอย่างการจัดทาคู่มือการกาหนดรหัสของแบบสอบถามเรื่องความพึงพอใจของ การให้บริการของบริษัทดีทัวร์ ซึ่งจะสอบถามจากลูกค้าที่เคยใช้บริการของบริษัท ฯ Tanapat LimsaipromBigData101 Chapter8
14.
Tanapat LimsaipromBigData101 Chapter8
15.
Tanapat LimsaipromBigData101 Chapter8
16.
Tanapat LimsaipromBigData101 Chapter8
17.
Tanapat LimsaipromBigData101 Chapter8
18.
Tanapat LimsaipromBigData101 Chapter8
19.
Tanapat LimsaipromBigData101 Chapter8
20.
Tanapat LimsaipromBigData101 Chapter8
21.
1. การเก็บรวบรวมข้อมูลจากรายงานหรือข้อมูลในระบบ ถ้าเป็นข้อมูลในระบบจะเข้า
สู่กระบวนการ ETL เพื่อเตรียมข้อมูลต่อไป 2.การเก็บรวบรวมข้อมูลโดยวิธีสารวจ (Sample Survey) ถ้าเป็นข้อมูลจากการสารวจจะต้องนาข้อมูลมาลงรหัส และทาความสะอาด ข้อมูลก่อนเข้าสู่กระบวนการวิเคราห์ต่อไป Tanapat LimsaipromBigData101 Chapter8
22.
ETL ย่อมาจาก
Extract-Transform-Load เป็นการนาข้อมูล (Extract) จากหลากหลาย แหล่งข้อมูล เช่น จากฝ่าย Marketing, จากฝ่าย Sale, จากฝ่าย Customer Service ฯลฯ มา แปลงรูปแบบให้เหมาะสม (Transform) แล้วเก็บ (Load) เข้าไปใน Data Warehouse หรือ Data Lake ที่มาภาพ : DataTH.com Tanapat LimsaipromBigData101 Chapter8
23.
เป็นการนาข้อมูล (Extract)
จากหลากหลายแหล่งข้อมูล เช่น จากฝ่ายขายแล การตลาด Marketing, จากฝ่ายชาย Sale, จากฝ่ายบริการลูกค้า Customer Service มาเพื่อรวบรวมข้อมูลไปมาในขั้นตอนต่อไป ในขั้นตอนนี้จะเลือกข้อมูลจากแหล่งต่างๆที่ต้องการนามาวิเคราะห์ Tanapat LimsaipromBigData101 Chapter8
24.
นามาแปลงรูปแบบให้เหมาะสม (Transform)เช่น -
เปลี่ยนประเภทข้อมูล เช่น จาก ตัวอักษร เป็น ตัวเลข - ทาความสะอาดข้อมูล เช่น ที่พิมพ์ผิด Tanapat LimsaipromBigData101 Chapter8
25.
เป็นขั้นตอนนาข้อมูลที่ได้จากการ Transform
โหลดข้อมูลเข้าไปใน Data Warehouse หรือ Data Lake Tanapat LimsaipromBigData101 Chapter8
26.
โปรดติดตามโมดูลถัดไป Tanapat LimsaipromBigData101 Chapter8
Download