บทที่ 3
การวิเคราะห์ข้อมูล
เดอะโกโก้ทีชชิ่ง
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
บทที่ 3 การวิเคราะห์ข้อมูล
3.1 การวิเคราะห์เชิงพรรณนา
3.2 การวิเคราะห์เชิงทานาย
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
การวิเคราะห์ข้อมูล
การวิเคราะห์ข้อมูล
- การทาความเข้าใจรูปแบบ
ความสัมพันธ์ แนวโน้ม ของ
ข้อมูล
- เพื่อเอาไปประกอบการตัดสินใจ
ตอบคาถามต่างๆ
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
ประเภทการวิเคราะห์ข้อมูล
1. Descriptive Analytics (การวิเคราะห์เชิงพรรณา).
- การวิเคราะห์พื้นฐาน ทาให้เห็นภาพรวมข้อมูลและความสัมพันธ์ของข้อมูล
- ตอบคาถามว่า เกิดอะไรขึ้นในอดีต (What happened?)
- เช่น รายงานสรุปยอดขายในอดีต (รายได้ขึ้นหรือลง) ความสัมพันธ์ระหว่างยอดขายกับเทศกาล/ฤดูกาล
2. Predictive Analytics (การวิเคราะห์เชิงทานาย)
- การวิเคราะห์ที่ช่วยคาดการณ์หรือทานายสิ่งที่เกิดขึ้นในอนาคต
- ตอบคาถามว่า อะไรที่สามารถเป็นไปได้/จะเกิดอะไรขึ้นในอนาคต (What will happen?)
- เช่น การคาดการณ์ยอดขายในเทศกาลต่างๆ (จะได้สั่งซื้อเตรียมวัตถุดิบได้พอ) พรุ่งนี้ฝนตกรึเปล่า
3. Prescriptive Analytics (การวิเคราะห์เชิงแนะนา)
- การวิเคราะห์ที่ช่วยแนะนาทางเลือกที่เป็นไปได้ของสถานการณ์และคาดการณ์ผลที่เป็นไปได้ของแต่ละ
สถานการณ์
- ตอบคาถามว่า ควรทาอะไรในอนาคต (What should we do?)
- เช่น การเลือกวิธีการโฆษณาสินค้าที่ทาให้ยอดขายสูงสุด
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
การเพิ่มมูลค่า
ความซับซ้อน
รายงานสรุป
ยอดขายในอดีต
วิเคราะห์ว่าเดือนนี้
ทาไม แชมพูขายดี
เป็นพิเศษ
ทานายว่าเดือนหน้า
อะไรขายดีบ้าง อะไร
ขายไม่ได้เลย
แนะนาว่าควรตั้งราคา
สินค้าเท่าไหร่ ถึงได้
กาไรสูงสุด
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
1. Descriptive Analytics (การวิเคราะห์เชิงพรรณา).
- การวิเคราะห์พื้นฐาน ทาให้เห็นภาพรวมข้อมูลและ
ความสัมพันธ์ของข้อมูล
- ตอบคาถามว่า เกิดอะไรขึ้นในอดีต (What happened?)
- เช่น รายงานสรุปยอดขายในอดีต (รายได้ขึ้นหรือลง)
ความสัมพันธ์ระหว่างยอดขายกับเทศกาล/ฤดูกาล
1
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
1. Descriptive Analytics (การวิเคราะห์เชิงพรรณา).
- การวิเคราะห์พื้นฐาน ทาให้เห็นภาพรวมข้อมูลและ
ความสัมพันธ์ของข้อมูล
- ตอบคาถามว่า เกิดอะไรขึ้นในอดีต (What happened?)
- เช่น รายงานสรุปยอดขายในอดีต (รายได้ขึ้นหรือลง)
ความสัมพันธ์ระหว่างยอดขายกับเทศกาล/ฤดูกาล
1
2
2. Predictive Analytics (การวิเคราะห์เชิงทานาย)
- การวิเคราะห์ที่ช่วยคาดการณ์หรือทานายสิ่งที่เกิดขึ้นในอนาคต
- ตอบคาถามว่า อะไรที่สามารถเป็นไปได้/จะเกิดอะไรขึ้นในอนาคต (What will happen?)
- เช่น การคาดการณ์ยอดขายในเทศกาลต่างๆ (จะได้สั่งซื้อเตรียมวัตถุดิบได้พอ) พรุ่งนี้ฝน
ตกรึเปล่า
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
1. Descriptive Analytics (การวิเคราะห์เชิงพรรณา).
- การวิเคราะห์พื้นฐาน ทาให้เห็นภาพรวมข้อมูลและ
ความสัมพันธ์ของข้อมูล
- ตอบคาถามว่า เกิดอะไรขึ้นในอดีต (What happened?)
- เช่น รายงานสรุปยอดขายในอดีต (รายได้ขึ้นหรือลง)
ความสัมพันธ์ระหว่างยอดขายกับเทศกาล/ฤดูกาล
1
2
3
2. Predictive Analytics (การวิเคราะห์เชิงทานาย)
- การวิเคราะห์ที่ช่วยคาดการณ์หรือทานายสิ่งที่เกิดขึ้นในอนาคต
- ตอบคาถามว่า อะไรที่สามารถเป็นไปได้/จะเกิดอะไรขึ้นในอนาคต (What will happen?)
- เช่น การคาดการณ์ยอดขายในเทศกาลต่างๆ (จะได้สั่งซื้อเตรียมวัตถุดิบได้พอ) พรุ่งนี้ฝน
ตกรึเปล่า
3. Prescriptive Analytics (การวิเคราะห์เชิง
แนะนา)
- การวิเคราะห์ที่ช่วยแนะนาทางเลือกที่เป็นไปได้
ของสถานการณ์และคาดการณ์ผลที่เป็นไปได้
ของแต่ละสถานการณ์
- ตอบคาถามว่า ควรทาอะไรในอนาคต
(What should we do?)
- เช่น การเลือกวิธีการโฆษณาสินค้าที่ทาให้
ยอดขายสูงสุด
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
1. Descriptive Analytics (การวิเคราะห์เชิงพรรณา).
- การวิเคราะห์พื้นฐาน ทาให้เห็นภาพรวมข้อมูลและ
ความสัมพันธ์ของข้อมูล
- ตอบคาถามว่า เกิดอะไรขึ้นในอดีต (What happened?)
- เช่น รายงานสรุปยอดขายในอดีต (รายได้ขึ้นหรือลง)
ความสัมพันธ์ระหว่างยอดขายกับเทศกาล/ฤดูกาล
1
2
3
2. Predictive Analytics (การวิเคราะห์เชิงทานาย)
- การวิเคราะห์ที่ช่วยคาดการณ์หรือทานายสิ่งที่เกิดขึ้นในอนาคต
- ตอบคาถามว่า อะไรที่สามารถเป็นไปได้/จะเกิดอะไรขึ้นในอนาคต (What will happen?)
- เช่น การคาดการณ์ยอดขายในเทศกาลต่างๆ (จะได้สั่งซื้อเตรียมวัตถุดิบได้พอ) พรุ่งนี้ฝน
ตกรึเปล่า
3. Prescriptive Analytics (การวิเคราะห์เชิง
แนะนา)
- การวิเคราะห์ที่ช่วยแนะนาทางเลือกที่เป็นไปได้
ของสถานการณ์และคาดการณ์ผลที่เป็นไปได้
ของแต่ละสถานการณ์
- ตอบคาถามว่า ควรทาอะไรในอนาคต
(What should we do?)
- เช่น การเลือกวิธีการโฆษณาสินค้าที่ทาให้
ยอดขายสูงสุด
(การวิเคราะห์แบบเชิงวินิจฉัย
(Diagnostic Analytics)
- อธิบายถึงสาเหตุของสิ่งที่เกิดขึ้น
- ทาไมถึงเกิด (Why did happened?)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
3.1 การ
วิเคราะห์เชิง
พรรณา
3.2 การ
วิเคราะห์เชิง
ทานาย
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.1 การวิเคราะห์เชิงพรรณา
- การวิเคราะห์พื้นฐาน ทาให้เห็นภาพรวมข้อมูลและความสัมพันธ์ของข้อมูล
- ใช้ความรู้ทางคณิตศาสตร์และสถิติ
3.1.1 การหาสัดส่วนหรือร้อยละ (%)
3.1.2 การวัดค่ากลางของข้อมูล (ค่าเฉลี่ย mean, ค่ามัธยฐาน median, ค่าฐานนิยม mode,
ค่าส่วนเบี่ยงเบนมาตรฐาน standard deviation)
3.1.3 การหาความสัมพันธ์ของชุดข้อมูล
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.1.1 การหาสัดส่วนหรือร้อยละ (%)
- จัดการข้อมูลเพื่อแสดงอยู่ในรูปเศษส่วน
ทศนิยม ร้อยละ
- นาเสนอในรูปแบบแผนภูมิแท่ง หรือแผนภูมิ
รูปภาพ (รายละเอียดอยู่บทที่4)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.1.2 การวัดค่ากลางของข้อมูล
- เป็นการหาค่าตัวแทนของข้อมูลทั้งหมด เพื่อ
สะดวกในการสรุปข้อมูลชุดนั้นๆ
- ค่ากลางเช่น...
- ค่าเฉลี่ย mean
- ค่ามัธยฐาน median
- ค่าฐานนิยม mode
- ค่าส่วนเบี่ยงเบนมาตรฐาน standard deviation (SD)
(ค่าที่บอกการกระจายของข้อมูล มีค่าบวกเสมอ
ค่าน้อย=ข้อมูลเกาะกลุ่มกันเยอะ
ค่ามาก=ข้อมูลกระจายกันเยอะ)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
อธิบาย
ลักษณะข้อมูล
สรุปรายงาน
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.1.3 การหาความสัมพันธ์ของชุดข้อมูล
- เมื่อนาข้อมูล 2 ชุด (x และ y)
เอาค่ามา plot เป็นกราฟแกน
x และแกน y จะเห็น
1. ทิศทางความสัมพันธ์ และ
2. ระดับความสัมพันธ์
สร้างแผนภาพการกระจาย
(Scatter Plot)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
- ในโปรแกรม Excel สามารถหาค่าความสัมพันธ์ (Correlation) ผ่านสูตร
=CORREL(ชุดข้อมูลx,ชุดข้อมูลy)
ค่าความสัมพันธ์ระหว่างจานวนวัวป่า
และม้าลายมีค่าเป็นบวก มีค่า = 0.813
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
ค่าความสัมพันธ์ระหว่างจานวนวัวป่า
และม้าลายมีค่าเป็นบวก มีค่า = 0.813
แปลว่า จานวนวัวป่าและม้าลายจะเพิ่ม
หรือลดในทิศทางเดียวกัน
แต่ไม่สามารถสรุปสาเหตุได้ว่าสิ่งหนึ่ง
ทาให้เกิดสิ่งหนึ่ง
1. วัวป่าเป็นสาเหตุที่ทาให้ม้าลาย
เพิ่มขึ้นหรือลดลง 
2. ม้าลายเป็นสาเหตุที่ทาให้วัวป่า
เพิ่มขึ้นหรือลดลง 
3. มีสาเหตุใดที่ทาให้จานวนวัวป่าและ
ม้าลายเพิ่มขึ้นหรือลดลงเหมือนกัน 
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
มีความสัมพันธ์กัน (correlation) ไม่ได้หมายความว่าเป็นเหตุผลซึ่งกันและกัน
(Correlation Does Not Imply Causation)
https://www.statology.org/correlation-does-not-imply-causation-examples/
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
https://www.scnsoft.com/blog/4-types-of-data-analytics
3.1 การ
วิเคราะห์เชิง
พรรณา
3.2 การ
วิเคราะห์เชิง
ทานาย
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2 การวิเคราะห์เชิงทานาย
- วิเคราะห์ข้อมูลในอดีตเพื่อหารูปแบบความสัมพันธ์ของชุดข้อมูลที่สามารถนามาทานาย การ
คาดการณ์ผล หรือสิ่งที่น่าจะเกิดในอนาคต
3.2.1 การทานายเชิงตัวเลข (numeric prediction)
3.2.2 การทานายเชิงหมวดหมู่ (classification)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2.1 การทานายเชิงตัวเลข
- นาข้อมูลในอดีตมาวิเคราะห์
แนวโน้มเพื่อทานายอนาคต
โดยผลลัพธ์ออกมาเป็น
ตัวเลข
- เริ่มโดยการนาข้อมูลในอดีต
มาวิเคราะห์หาความสัมพันธ์
ระหว่างชุดข้อมูลและสร้าง
แบบจาลอง (Model)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
- โดยทั่วไปการทานาย ทาได้ 2 วิธีคือ
1. ใช้กราฟ
2. ใช้สมการเส้นตรง y=mx+c
- เมื่อข้อมูล 2 ชุด มีความสัมพันธ์เชิงเส้นกัน
เราสามารถทานายข้อมูลที่เราสนใจ (ค่า y)
เมื่อทราบค่าข้อมูลอีกชุดหนึ่ง (ค่า x)
- จากภาพ เมื่อต้องการประมาณจานวนม้า
ลาย (y) เมื่อเรารู้จานวนวัวป่า (x) เราจะ
ลากเส้นแนวโน้ม ในการประมาณค่าม้าลาย
(y) ได้
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
1. สร้างแผนภาพการกระจาย (scatter plot)
2. ลากเส้นแนวโน้ม = เส้นตรงที่ลากผ่าน/ใกล้เคียงจุดทุกจุดมากที่สุด (line of best fit)
มักแบ่งปริมาณจุดเหนือเส้นและใต้เส้นพอๆกัน
การทานายค่าจากเส้นแนวโน้ม
3. ทานายค่าจากเส้นแนวโน้ม
3.1 ใช้กราฟ 3.2 ใช้สมการเชิงเส้น
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
1. สร้างแผนภาพการกระจาย (scatter plot)
2. ลากเส้นแนวโน้ม = เส้นตรงที่ลากผ่าน/ใกล้เคียงจุดทุกจุดมากที่สุด (line of best fit)
มักแบ่งปริมาณจุดเหนือเส้นและใต้เส้นพอๆกัน
การทานายค่าจากเส้นแนวโน้ม
เส้นแนวโน้ม
3. ทานายค่าจากเส้นแนวโน้ม
3.1 ใช้กราฟ 3.2 ใช้สมการเชิงเส้น
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.1 ใช้กราฟ
- หากต้องการทราบว่า ถ้ามีจานวนวัวป่า (x) 85000 ตัว จานวนม้าลาย (y) จะมีเท่าไร
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.1 ใช้กราฟ
- หากต้องการทราบว่า ถ้ามีจานวนวัวป่า (x) 85000 ตัว จานวนม้าลาย (y) จะมีเท่าไร
85
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.1 ใช้กราฟ
- หากต้องการทราบว่า ถ้ามีจานวนวัวป่า (x) 85000 ตัว จานวนม้าลาย (y) จะมีเท่าไร
85
ประมาณ 115
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.1 ใช้กราฟ
- หากต้องการทราบว่า ถ้ามีจานวนวัวป่า (x) 85000 ตัว จานวนม้าลาย (y) จะมีเท่าไร
85
ประมาณ 115
จำนวนม้ำลำยเมื่อมีวัวป่ำ 85,000
ตัว แล้วจำนวนม้ำลำยมีประมำณ
115,000 ตัว
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
*หมายเหตุ* คาตอบในหนังสือเรียนคือ 110 ตัว คาดว่าทางหนังสือเรียนทาให้เข้าใจง่าย
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2 ใช้สมการเชิงเส้นตรง 𝑦 = 𝑚𝑥 + 𝑐
สมการเส้นตรงที่มีความชัน 𝑚 และมีค่าจุดตัดแกน y ที่ 𝑐 คือ
𝑦 = 𝑚𝑥 + 𝑐
หาสมการเส้นตรงที่ เมื่อรู้ความชัน และผ่านจุด 1 จุด
𝑦 − 𝑦1 = 𝑚(𝑥 − 𝑥1)
หาความชันเมื่อรู้จุดที่ตัดผ่าน 2 จุด
𝑚 =
𝑦2 − 𝑦1
𝑥2 − 𝑥1
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2 ใช้สมการเชิงเส้น 𝑦=𝑚𝑥+𝑐
- เริ่มด้วยหาค่าความชัน (m) โดยเลือกจากจุด 2 จุด
จากตาราง
𝑚 =
𝑦2 − 𝑦1
𝑥2 − 𝑥1
𝒙𝟐
𝒙𝟏
𝒚𝟐
𝒚𝟏
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2 ใช้สมการเชิงเส้น 𝑦=𝑚𝑥+𝑐
- เริ่มด้วยหาค่าความชัน (m) โดยเลือกจากจุด 2 จุด
จากตาราง
𝑚 =
𝑦2 − 𝑦1
𝑥2 − 𝑥1
𝑚 =
105 − 124
106 − 118
𝑚 = 1.58
𝒙𝟐
𝒙𝟏
𝒚𝟐
𝒚𝟏
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2 ใช้สมการเชิงเส้น 𝑦=𝑚𝑥+𝑐
- เริ่มด้วยหาค่าความชัน (m) โดยเลือกจากจุด 2 จุด
จากตาราง
𝑚 =
𝑦2 − 𝑦1
𝑥2 − 𝑥1
𝑚 =
105 − 124
106 − 118
𝑚 = 1.58
- นาค่า 𝑚, 𝑥1, 𝑦1 แทนในสมการ
𝑦 − 𝑦1 = 𝑚(𝑥 − 𝑥1)
𝒙𝟐
𝒙𝟏
𝒚𝟐
𝒚𝟏
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2 ใช้สมการเชิงเส้น 𝑦=𝑚𝑥+𝑐
- เริ่มด้วยหาค่าความชัน (m) โดยเลือกจากจุด 2 จุด
จากตาราง
𝑚 =
𝑦2 − 𝑦1
𝑥2 − 𝑥1
𝑚 =
105 − 124
106 − 118
𝑚 = 1.58
- นาค่า 𝑚, 𝑥1, 𝑦1 แทนในสมการ
𝑦 − 124 = 1.58 𝑥 − 118
𝑦 − 𝑦1 = 𝑚(𝑥 − 𝑥1)
𝑦 = 1.58𝑥 − 62.44
𝒙𝟐
𝒙𝟏
𝒚𝟐
𝒚𝟏
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2 ใช้สมการเชิงเส้น 𝑦=𝑚𝑥+𝑐
- เริ่มด้วยหาค่าความชัน (m) โดยเลือกจากจุด 2 จุด
จากตาราง
𝑚 =
𝑦2 − 𝑦1
𝑥2 − 𝑥1
𝑚 =
105 − 124
106 − 118
𝑚 = 1.58
- นาค่า 𝑚, 𝑥1, 𝑦1 แทนในสมการ
𝑦 − 124 = 1.58 𝑥 − 118
𝑦 − 𝑦1 = 𝑚(𝑥 − 𝑥1)
𝑦 = 1.58𝑥 − 62.44
𝒙𝟐
𝒙𝟏
𝒚𝟐
𝒚𝟏
- ค่า c (จุดตัดแกน y) คือ -62.44
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝑦 = 1.58𝑥 − 62.44
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝑦 = 1.58𝑥 − 62.44
เนื่องจาก y = จานวนม้าลาย
x = จานวนวัวป่า
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝑦 = 1.58𝑥 − 62.44
เนื่องจาก y = จานวนม้าลาย
x = จานวนวัวป่า
จานวนม้าลาย = 1.58(จานวนวัวป่า) − 62.44
สมการเส้นตรงนี้อธิบายได้ว่า จานวนม้าลาย (y) เท่ากับ
1.58 เท่าของจานวนวัวป่า บวกกับ -62.44 (หรือลบ
62.44)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝑦 = 1.58𝑥 − 62.44
หากต้องการทราบว่า ถ้ามีจานวนวัวป่า (x)
85,000 ตัว จานวนม้าลาย (y) จะมีเท่าไร
เนื่องจาก y = จานวนม้าลาย
x = จานวนวัวป่า
จานวนม้าลาย = 1.58(จานวนวัวป่า) − 62.44
สมการเส้นตรงนี้อธิบายได้ว่า จานวนม้าลาย (y) เท่ากับ
1.58 เท่าของจานวนวัวป่า บวกกับ -62.44 (หรือลบ
62.44)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝑦 = 1.58𝑥 − 62.44
𝑦 = 1.58 85 − 62.44
𝑦 = 71.86
หากต้องการทราบว่า ถ้ามีจานวนวัวป่า (x)
85,000 ตัว จานวนม้าลาย (y) จะมีเท่าไร
เมื่อมีวัวป่า 85,000 ตัว แล้วจานวนม้าลายมี
ประมาณ 71,860 ตัว
เนื่องจาก y = จานวนม้าลาย
x = จานวนวัวป่า
จานวนม้าลาย = 1.58(จานวนวัวป่า) − 62.44
สมการเส้นตรงนี้อธิบายได้ว่า จานวนม้าลาย (y) เท่ากับ
1.58 เท่าของจานวนวัวป่า บวกกับ -62.44 (หรือลบ
62.44)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝑦 = 1.58𝑥 − 62.44
𝑦 = 1.58 85 − 62.44
𝑦 = 71.86
หากต้องการทราบว่า ถ้ามีจานวนวัวป่า (x)
85,000 ตัว จานวนม้าลาย (y) จะมีเท่าไร
เมื่อมีวัวป่า 85,000 ตัว แล้วจานวนม้าลายมี
ประมาณ 71,860 ตัว
เนื่องจาก y = จานวนม้าลาย
x = จานวนวัวป่า
จานวนม้าลาย = 1.58(จานวนวัวป่า) − 62.44
สมการเส้นตรงนี้อธิบายได้ว่า จานวนม้าลาย (y) เท่ากับ
1.58 เท่าของจานวนวัวป่า บวกกับ -62.44 (หรือลบ
62.44)
แต่คาถามคือ แน่ใจได้อย่างไรว่าสมการเส้นตรงที่ได้มา พอจะใช้ทานายได้?
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
การตรวจสอบความคลาดเคลื่อน
- ก่อนนาสมการเส้นแนวโน้มไปใช้ในการทานาย เราต้องตรวจสอบค่าความคลาดเคลื่อนก่อน
- เส้นตรงที่ว่าควรผ่านจุดหลายๆจุดในแผนภาพการกระจาย (scatter plot) ให้ได้มากที่สุด
- การคานวณค่าความคลาดเคลื่อน (D) ทาได้โดยคานวณผลรวมของ “ผลต่างของค่าจริงและ
ค่าทานาย (y − ෡
Y) ที่ยกกาลัง2”
- ค่าความคาดเคลื่อนยิ่งน้อยยิ่งดี แปลว่าสมการเส้นแนวโน้มใช้ทานายได้แม่นยามากขึ้น
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
เส้นแนวโน้ม
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
ค่าจริง (y)
เส้นแนวโน้ม
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
ค่าจริง (y)
ค่าทานาย
(෡
Y)
เส้นแนวโน้ม
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝒅𝟏
ค่าจริง (y)
ค่าทานาย
(෡
Y) 𝒅𝟏 = y- ෡
Y
เส้นแนวโน้ม
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝒅𝟏
𝒅𝟐
𝒅𝟑
𝒅𝟒
𝒅𝟓
ค่าจริง (y)
ค่าทานาย
(෡
Y) 𝒅𝟏 = y- ෡
Y
เส้นแนวโน้ม
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝒅𝟏
𝒅𝟐
𝒅𝟑
𝒅𝟒
𝒅𝟓
ค่าจริง (y)
ค่าทานาย
(෡
Y) 𝒅𝟏 = y- ෡
Y
𝐷 = 𝑑1+ 𝑑2+ 𝑑3+ 𝑑4+ 𝑑5
เส้นแนวโน้ม
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
𝒅𝟏
𝟐
ค่าจริง (y)
ค่าทานาย
(෡
Y) 𝒅𝟏 = y- ෡
Y
𝑫 = 𝑑1
2
+ 𝑑2
2
+ 𝑑3
2
+ 𝑑4
2
+ 𝑑5
2
เส้นแนวโน้ม
เนื่องจากค่า d ที่ได้มีทั้งบวกและลบ (ค่า d ที่อยู่ใต้เส้นแนวโน้มจะติดลบ) ถ้าเอาค่า d มารวมกัน
ตรงๆ ค่าจะหักล้างกันและผิด จึงต้องเอาค่า d ที่ได้มายกกาลัง 2 เพื่อกาจัดค่าลบออกก่อน
𝒅𝟐
𝟐
𝒅𝟑
𝟐
𝒅𝟒
𝟐
𝒅𝟓
𝟐
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
การตรวจสอบความคลาดเคลื่อน
ด้วยโปรแกรม Excel
𝑦 = 1.58𝑥 − 62.44
สมการเส้นตรง
ใช้ทานายจานวน จานวนม้าลาย
(y) เมื่อรู้จานวนวัวป่า (x) ได้
โดยมีค่า Sum of squared
errors = 42,732.42
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Sum of squared errors = 42,732.42
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Sum of squared errors = 42,732.42
ไม่น่าใช่เส้นแนวโน้ม ดูไม่ค่อย
แบ่งครึ่งเท่าไหร่
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
สมการไหนให้ค่า Error น้อยที่สุด?
แล้วสมการเส้นตรงอันไหนที่เป็นเส้นแนวโน้มที่ดีที่สุดล่ะ?
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Sum of squared errors = 3,426.49 (และนี่คือค่า error น้อยที่สุดเท่าที่ได้แล้ว)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
ต้องให้โปรแกรมคอมพิวเตอร์ช่วยคานวณค่านี้ออกมา
จะให้มานั่งทดลองแทนค่าลงสมการเรื่อยๆคงไม่ไหว
𝑦 = 0.8391𝑥 − 38.504
สมการนี้ให้ค่า Error น้อยที่สุด
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Demo – หาสมการแนวโน้มโดยใช้ภาษา python
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
3.2.2 การทานายเชิงหมวดหมู่
- นาข้อมูลที่มีการระบุหมวดหมู่ในอดีตมา
ทานายข้อมูลชุดใหม่ที่ไม่ทราบหมวดหมู่
- เช่นทานายว่า ฝนตกหรือไม่ (ตก/ไม่ตก)
ประเภทเครื่องดื่ม (น้าอัดลม/น้าผลไม้)
- เทคนิคการจัดหมวดหมู่ที่จะใช้ชื่อว่า
“วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K
ตัว” (K-Nearest Neighbors หรือ K-NN)
เครื่องดื่มใหม่ที่จะทานาย
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=1
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=1
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=1
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=1
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=3
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=3
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=3
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=6
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=6
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
วิธีการค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว (K-Nearest Neighbors / K-NN)
- เป็นการนาข้อมูลใหม่เทียบกับข้อมูลเดิมที่ถูกจัด
หมวดหมู่ไว้อยู่แล้ว โดยนาข้อมูลใหม่เทียบ
ระยะห่างใกล้ที่สุดกับข้อมูลเดิมจานวน K ตัว
แล้วนับจานวนว่าส่วนใหญ่อยู่หมวดหมู่ใด
k=6
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
ขั้นตอนวิธีของ K-Nearest Neighbors
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
การทานายการเกิดไฟป่า
- เราจะใช้ข้อมูลการสารวจข้อมูลสภาพอากาศในป่า 13
ครั้ง มาทานายโอกาสการเกิดไฟป่าในอนาคต
- คาถามคือ ในวันที่อุณหภูมิ 21.2°C ความชื้นสัมพัทธ์
32% จะเปิดไฟป่าหรือไม่
- เริ่มต้นด้วยการวาดแผนภาพการกระจาย (scatter
plot) ก่อน
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
ข้อมูลใหม่ที่จะทานาย
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
พิกัด (21.2,32)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
พิกัด (21.2,32)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
คาถาม
ถ้าให้ค่า k=4 ผลลัพธ์จะเป็นอย่างไร?
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
คาถาม
ถ้าให้ค่า k=4 ผลลัพธ์จะเป็นอย่างไร?
แยกไม่ได้
เพราะจานวน yes และ no เท่ากัน
(ดังนั้นค่า k เลยควรเป็นเลขคี่)
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
การประเมินความถูกต้องในการจาแนกข้อมูล
- ทดสอบโดยการแยกข้อมูลตั้งต้นออกมาส่วนนึงก่อน
- สร้างรูปแบบการทานายเสร็จ ก็เอาไปตรวจสอบความถูกต้องกับข้อมูลอีกชุด
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA
บทที่ 3
การวิเคราะห์ข้อมูล
เดอะโกโก้ทีชชิ่ง
Youtube เดอะโกโก้ทีชชิ่ง - https://www.youtube.com/channel/UC9cMSHw5r2-rB8ajMWx9nmA

วิทยาการคำนวณ ม.5 - บทที่ 3 การวิเคราะห์ข้อมูล