SlideShare a Scribd company logo
1 of 3
Download to read offline
จัดทำโดยพิษณุ ดวงกระโทก
การวิเคราะห์เชิงพยากรณ์
ใช้ข้อมูลในอดีตในการทํานายค่าในอนาคต อาศัยองค์ความรู้ด้าน Machine Learning
การสร้างตัวแบบโดยอาศัยชุดข้อมูลฝึกสอน (Training dataset) ว่า การเรียนรู้แบบมีผู้สอน (Supervised
Learning)
ตัวแบบทํานาย (Prediction Model) เป็นฟังก์ชันในการแปลงข้อมูลไปเป็นค่าข้อมูลของตัวแปร
เป้าหมาย (Target Variable)
ชุดข้อมูลฝึกสอน (Training dataset) เป็นข้อมูลสำหรับสอนตัวแบบให้สามารถทํานายค่าของข้อมูลได้
อย่างถูกต้อง ถ้าข้อมูลฝึกสอนปริมาณมากพอ จะให้ผลลัพธ์การทํานายค่ามีความถูกต้องมากที่สุด
ชุดข้อมูลทดสอบ (Test dataset) ใช้ประเมินความสามารถในการทํานายของตัวแบบ
ตัวชี้วัดประสิทธิภาพ ช่วยให้สามารถประเมินประสิทธิภาพ และเลือกสรรตัวแบบที่เหมาะสมเพื่อนําไปใช้
ประโยชน์
การสร้างตัวแบบสามารถแบ่งออกได้เป็น 2 ระยะหลัก คือ
ระยะฝึกสอนและระยะทดสอบ ข้อมูลจะถูกแบ่งออกเป็น 2 ชุด คือ ชุดฝึกสอนและชุดทดสอบ (70:30) เรา
จะเลือกตัวแบบที่มีความซับซ้อนน้อยที่สุดไปใช้งาน หรือหากต้องการใช้ตัวแบบที่มีความซับซ้อนสูง ต้องฝึกสอน
ตัวแบบด้วยข้อมูลชุดฝึกสอนปริมาณมากและสามารถเป็นตัวแทนของข้อมูลทั้งหมดที่เป็นไปได้
การวิเคราะห์การจําแนกประเภท (Classification Analysis) แบ่งออกได้เป็น 2 ประเภท
แบบทวิภาค (Binary Classification) จําแนกสิ่งต่างๆ ออกเป็น 2 คลาส เท่านั้น
แบบหลายคลาส (Multi-class Classification) จําแนกประเภทที่มีคลาสมากกว่า 2 คลาส
การวิเคราะห์การจําแนก
วิธีเพื่อนบ้านใกล้สุด (𝑘-Nearest Neighbours)
พิจารณาจากคลาสของข้อมูลรอบๆ ข้างที่ใกล้ที่สุด 𝑘 ข้อมูล
ต้นไม้ตัดสินใจ (Decision Tree)
แสดงเส้นทางการตัดสินใจที่นําไปสู่ผลลัพธ์สุดท้าย ประกอบด้วย 2 องค์ประกอบ คือ โหนด (Node) และ
กิ่ง (Branch) โหนดสามารถแบ่งได้เป็น 2 ประเภท โหนดราก (Root Node) จะอยู่บนสุดของต้นไม้ เป็น
คําถามข้อแรกของต้นไม้ตัดสินใจ โหนดใบ (Leaf Node) เป็นปลายทางของการตัดสินใจ
ค่าเอนโทรปี (Entropy) ซึ่งแสดงถึงความไม่บริสุทธิ์ของข้อมูล เอน
โทรปีจะมีค่าน้อยเมื่อข้อมูลมีความบริสุทธิ์มาก
เกนความรู้ (Information Gain) เป็นค่าคาดหวังของการลดลง
ของเอโทรปี หลังจากชุดข้อมูลถูกแบ่งออกเป็นชุดๆ
จัดทำโดยพิษณุ ดวงกระโทก
ตัวแบบเบย์ชนิดนาอีฟ (Naïve Bayes Classifier)
เกิดเหตุการณ์ 𝐴 เมื่อมีเหตุการณ์ 𝐵 เกิดขึ้นก่อน (𝑃(𝐴|𝐵))
𝑃(𝐴) และ 𝑃(𝐵) คือ ความน่าจะเป็นของการเกิดเหตุการณ์ 𝐴 และ 𝐵 ตามลำดับ เราเรียก 𝑃(𝐴) ว่า
ความน่าจะเป็นเบื้องต้น (Prior Probability) เรียก 𝑃(𝐵) ว่าหลักฐาน (Evidence) และ 𝑃(𝐵|𝐴) คือ
ความน่าจะเป็นของการเกิดเหตุการณ์ 𝐵 เมื่อมีเหตุการณ์ 𝐴 เกิดขึ้น เรียกว่า ไลค์ลิฮูด (Likelihood)
𝑃(𝐴|𝐵) เราเรียกว่า ความน่าจะเป็นภายหลัง (Posterior Probability) ซึ่งเป็นความน่าจะเป็นที่ต้องการ
ทราบค่า
ตัวชี้วัดประสิทธิภาพการจําแนกประเภท
Confusion Matrix เป็นเมทริกซ์แสดงจำนวนข้อมูลที่เกิดจากการเปรียบเทียบระหว่างค่าคลาสที่ถูก
ทํานายและค่าคลาสจริง สำหรับปัญหาการจําแนกประเภทแบบทวิภาค
ความถูกต้องของการจําแนก (Classification Accuracy) เป็นมาตรวัดสัดส่วนของตัวแบบสามารถจําแนก
คลาสได้อย่างถูกต้องต่อจํานวนข้อมูลที่นํามาทดสอบทั้งหมด สามารถคํานวณได้โดย
เราคาดหวังตัวแบบที่ให้ค่าอัตราความถูกต้องของการจําแนกที่มีค่าสูงใกล้เคียง 1 มากที่สุด
ความผิดพลาดของการจําแนก (Misclassification) เป็นมาตรวัดสัดส่วนของจํานวนข้อมูลที่ตัวแบบจําแนก
คลาสผิดต่อจํานวนข้อมูลที่นํามาทดสอบทั้งหมด
เราคาดหวังตัวแบบที่ให้ค่าอัตราความผิดพลาดของการจําแนกที่มีค่าตํ่าใกล้เคียง 0 มากที่สุด
ความไว (Sensitivity) เป็นค่าสัดส่วนของผลบวกจริงต่อจํานวนข้อมูลที่มีค่าคลาสจริงเป็นค่าบวก ซึ่งแสดง
อัตราความถูกต้องของการจําแนกโดยสนใจเฉพาะข้อมูลที่มีคลาสจริงเป็นค่าบวก
ตัวแบบสามารถทํานายค่า
คลาสได้อย่างถูกต้อง
ตัวแบบทํานายค่า
คลาสผิดพลาด
จัดทำโดยพิษณุ ดวงกระโทก
ค่าความไวมีค่าเท่ากับ 1 เมื่อข้อมูลที่มีคลาสจริงเป็นค่าบวก ตัวแบบสามารถทํานายค่าคลาสของข้อมูลเหล่านั้นได้อย่าง
ถูกต้องทั้งหมด
ความจําเพาะ (Specificity) เป็นค่าสัดส่วนของผลลบจริงต่อจํานวนข้อมูลที่มีค่าคลาสจริง เป็นค่าลบ แสดง
อัตราความถูกต้องของการจําแนกโดยสนใจเฉพาะข้อมูลที่มีคลาสจริงเป็นค่าลบ
ค่าความจําเพาะมีค่าเท่ากับ 1 ก็ต่อเมื่อตัวแบบสามารถทํานายค่าคลาสของข้อมูลที่มีคลาสจริงเป็นค่าลบได้ถูกต้องทั้งหมด
ความเที่ยง (Precision) เป็นค่าสัดส่วนของผลบวกจริงต่อจํานวนข้อมูลที่ตัวแบบทํานายค่าคลาสเป็นค่าบวก
ค่าความเที่ยงมีค่าเท่ากับ 1 เมื่อข้อมูลที่ตัวแบบทํานายค่าคลาสเป็นค่าบวกมีค่าคลาสจริงเป็นค่าบวกทั้งหมด
ออกสอบ* ปัญหาการจําแนกแบบหลายคลาส
Cross Validation คือเครื่องมือที่ช่วยให้เราตัดสินใจได้ว่าเราควรแบ่งข้อมูลส่วนไหนไปเป็นชุดฝึกสอน ส่วน
ไหนไปเป็นชุดทดสอบ โดยที่เราสามารถดูได้จากค่า Accuracy

More Related Content

What's hot

Fusion apps receivables
Fusion apps   receivablesFusion apps   receivables
Fusion apps receivablesHasan Shabbir
 
SQL Server Integration Services – Enterprise Manageability
SQL Server Integration Services – Enterprise ManageabilitySQL Server Integration Services – Enterprise Manageability
SQL Server Integration Services – Enterprise ManageabilityDan English
 
Websphere interview Questions
Websphere interview QuestionsWebsphere interview Questions
Websphere interview Questionsgummadi1
 
Oracle property manager
Oracle property managerOracle property manager
Oracle property managerGOT1
 
Secondary Ledgers: The Benefits of Adjustment Ledgers for GAAP Reporting and ...
Secondary Ledgers: The Benefits of Adjustment Ledgers for GAAP Reporting and ...Secondary Ledgers: The Benefits of Adjustment Ledgers for GAAP Reporting and ...
Secondary Ledgers: The Benefits of Adjustment Ledgers for GAAP Reporting and ...eprentise
 
Netty 세미나
Netty 세미나Netty 세미나
Netty 세미나Jang Hoon
 
Multi-tenancy in Java
Multi-tenancy in JavaMulti-tenancy in Java
Multi-tenancy in Javaseges
 
Oracle SOA Suite Overview - Integration in a Service-Oriented World
Oracle SOA Suite Overview - Integration in a Service-Oriented WorldOracle SOA Suite Overview - Integration in a Service-Oriented World
Oracle SOA Suite Overview - Integration in a Service-Oriented WorldOracleContractors
 
OAF Developer Guide 13.1.3
OAF Developer Guide 13.1.3OAF Developer Guide 13.1.3
OAF Developer Guide 13.1.3crwanare
 
Demystifying Oracle Cloud ERP Financials
Demystifying Oracle Cloud ERP FinancialsDemystifying Oracle Cloud ERP Financials
Demystifying Oracle Cloud ERP FinancialsPerficient, Inc.
 
E-Business Suite on Oracle Cloud
E-Business Suite on Oracle CloudE-Business Suite on Oracle Cloud
E-Business Suite on Oracle CloudKeith Kiattipong
 
Javax.servlet,http packages
Javax.servlet,http packagesJavax.servlet,http packages
Javax.servlet,http packagesvamsi krishna
 

What's hot (20)

Spring batch
Spring batchSpring batch
Spring batch
 
Fusion apps receivables
Fusion apps   receivablesFusion apps   receivables
Fusion apps receivables
 
Arunkumar Resume
Arunkumar ResumeArunkumar Resume
Arunkumar Resume
 
SQL Server Integration Services – Enterprise Manageability
SQL Server Integration Services – Enterprise ManageabilitySQL Server Integration Services – Enterprise Manageability
SQL Server Integration Services – Enterprise Manageability
 
Connection Pooling
Connection PoolingConnection Pooling
Connection Pooling
 
Agric Business In Ekiti State
Agric Business In Ekiti StateAgric Business In Ekiti State
Agric Business In Ekiti State
 
Websphere interview Questions
Websphere interview QuestionsWebsphere interview Questions
Websphere interview Questions
 
Oracle Receivables
Oracle ReceivablesOracle Receivables
Oracle Receivables
 
Oracle property manager
Oracle property managerOracle property manager
Oracle property manager
 
Secondary Ledgers: The Benefits of Adjustment Ledgers for GAAP Reporting and ...
Secondary Ledgers: The Benefits of Adjustment Ledgers for GAAP Reporting and ...Secondary Ledgers: The Benefits of Adjustment Ledgers for GAAP Reporting and ...
Secondary Ledgers: The Benefits of Adjustment Ledgers for GAAP Reporting and ...
 
Netty 세미나
Netty 세미나Netty 세미나
Netty 세미나
 
Oracle fixed assets
Oracle fixed assetsOracle fixed assets
Oracle fixed assets
 
Multi-tenancy in Java
Multi-tenancy in JavaMulti-tenancy in Java
Multi-tenancy in Java
 
Oracle SOA Suite Overview - Integration in a Service-Oriented World
Oracle SOA Suite Overview - Integration in a Service-Oriented WorldOracle SOA Suite Overview - Integration in a Service-Oriented World
Oracle SOA Suite Overview - Integration in a Service-Oriented World
 
OAF Developer Guide 13.1.3
OAF Developer Guide 13.1.3OAF Developer Guide 13.1.3
OAF Developer Guide 13.1.3
 
Ssis 2008
Ssis 2008Ssis 2008
Ssis 2008
 
Demystifying Oracle Cloud ERP Financials
Demystifying Oracle Cloud ERP FinancialsDemystifying Oracle Cloud ERP Financials
Demystifying Oracle Cloud ERP Financials
 
E-Business Suite on Oracle Cloud
E-Business Suite on Oracle CloudE-Business Suite on Oracle Cloud
E-Business Suite on Oracle Cloud
 
Jdbc
Jdbc   Jdbc
Jdbc
 
Javax.servlet,http packages
Javax.servlet,http packagesJavax.servlet,http packages
Javax.servlet,http packages
 

Similar to การวิเคราะห์เชิงพยากรณ์ ส่วนที่ 1

Data driven financial sector 2020
Data driven financial sector 2020Data driven financial sector 2020
Data driven financial sector 2020manupat sriboonlue
 
แผนการสอนหลักสูตรระยะสั้น
แผนการสอนหลักสูตรระยะสั้นแผนการสอนหลักสูตรระยะสั้น
แผนการสอนหลักสูตรระยะสั้นComcmpoly
 
Data analytics for fraud detection 2021 manupat sriboonlue
Data analytics for fraud detection 2021 manupat sriboonlueData analytics for fraud detection 2021 manupat sriboonlue
Data analytics for fraud detection 2021 manupat sriboonluemanupat sriboonlue
 
งาน เทคโนโลยีสื่อสารการศึกษา
งาน เทคโนโลยีสื่อสารการศึกษางาน เทคโนโลยีสื่อสารการศึกษา
งาน เทคโนโลยีสื่อสารการศึกษาTawatchai Sangpukdee
 
1 สถิติ (statistics)
1 สถิติ (statistics)1 สถิติ (statistics)
1 สถิติ (statistics)noinasang
 
1 สถิติ (statistics)
1 สถิติ (statistics)1 สถิติ (statistics)
1 สถิติ (statistics)noinasang
 
เอกสารประกอบการอบรม Analysis
เอกสารประกอบการอบรม Analysisเอกสารประกอบการอบรม Analysis
เอกสารประกอบการอบรม Analysisdnavaroj
 
ความรู้เบื้องต้นเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึม
ความรู้เบื้องต้นเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึมความรู้เบื้องต้นเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึม
ความรู้เบื้องต้นเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึมwaradakhantee
 
การออกแบบระบบสารสนเทศในสถานศึกษา
การออกแบบระบบสารสนเทศในสถานศึกษาการออกแบบระบบสารสนเทศในสถานศึกษา
การออกแบบระบบสารสนเทศในสถานศึกษาteacher253
 
บทที่6
บทที่6บทที่6
บทที่6somjit003
 

Similar to การวิเคราะห์เชิงพยากรณ์ ส่วนที่ 1 (18)

Data driven financial sector 2020
Data driven financial sector 2020Data driven financial sector 2020
Data driven financial sector 2020
 
5 การประเมินโครงการ 5
5 การประเมินโครงการ 55 การประเมินโครงการ 5
5 การประเมินโครงการ 5
 
แผนการสอนหลักสูตรระยะสั้น
แผนการสอนหลักสูตรระยะสั้นแผนการสอนหลักสูตรระยะสั้น
แผนการสอนหลักสูตรระยะสั้น
 
Data analytics for fraud detection 2021 manupat sriboonlue
Data analytics for fraud detection 2021 manupat sriboonlueData analytics for fraud detection 2021 manupat sriboonlue
Data analytics for fraud detection 2021 manupat sriboonlue
 
งาน เทคโนโลยีสื่อสารการศึกษา
งาน เทคโนโลยีสื่อสารการศึกษางาน เทคโนโลยีสื่อสารการศึกษา
งาน เทคโนโลยีสื่อสารการศึกษา
 
Static excel
Static excelStatic excel
Static excel
 
1 สถิติ (statistics)
1 สถิติ (statistics)1 สถิติ (statistics)
1 สถิติ (statistics)
 
1 สถิติ (statistics)
1 สถิติ (statistics)1 สถิติ (statistics)
1 สถิติ (statistics)
 
งานนำเสนอ8
งานนำเสนอ8งานนำเสนอ8
งานนำเสนอ8
 
Ai
AiAi
Ai
 
Ai
AiAi
Ai
 
เอกสารประกอบการอบรม Analysis
เอกสารประกอบการอบรม Analysisเอกสารประกอบการอบรม Analysis
เอกสารประกอบการอบรม Analysis
 
E learning system
E learning systemE learning system
E learning system
 
ความรู้เบื้องต้นเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึม
ความรู้เบื้องต้นเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึมความรู้เบื้องต้นเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึม
ความรู้เบื้องต้นเกี่ยวกับโครงสร้างข้อมูลและอัลกอริทึม
 
งานนำเสนอ8
งานนำเสนอ8งานนำเสนอ8
งานนำเสนอ8
 
การออกแบบระบบสารสนเทศในสถานศึกษา
การออกแบบระบบสารสนเทศในสถานศึกษาการออกแบบระบบสารสนเทศในสถานศึกษา
การออกแบบระบบสารสนเทศในสถานศึกษา
 
บทที่6
บทที่6บทที่6
บทที่6
 
Ch3
Ch3Ch3
Ch3
 

More from pitsanu duangkartok

cancer therapy by pitsanu_duangkartok ...
cancer therapy by pitsanu_duangkartok ...cancer therapy by pitsanu_duangkartok ...
cancer therapy by pitsanu_duangkartok ...pitsanu duangkartok
 
บทนำเกี่ยวกับโรคมะเร็ง (Cancer introduction).pdf
บทนำเกี่ยวกับโรคมะเร็ง (Cancer introduction).pdfบทนำเกี่ยวกับโรคมะเร็ง (Cancer introduction).pdf
บทนำเกี่ยวกับโรคมะเร็ง (Cancer introduction).pdfpitsanu duangkartok
 
การลดลงของ MHC Class I ในมะเร็ง ตอนที่ 2.pdf
การลดลงของ MHC Class I ในมะเร็ง ตอนที่ 2.pdfการลดลงของ MHC Class I ในมะเร็ง ตอนที่ 2.pdf
การลดลงของ MHC Class I ในมะเร็ง ตอนที่ 2.pdfpitsanu duangkartok
 
MHC Class I Downregulation in Cancer Part 1
MHC Class I Downregulation in Cancer Part 1MHC Class I Downregulation in Cancer Part 1
MHC Class I Downregulation in Cancer Part 1pitsanu duangkartok
 
Melatonin a New Way to Reduce Self-Harm.pdf
Melatonin a New Way to Reduce Self-Harm.pdfMelatonin a New Way to Reduce Self-Harm.pdf
Melatonin a New Way to Reduce Self-Harm.pdfpitsanu duangkartok
 
Carbohydrates และ Glycobiology.pdf
Carbohydrates และ Glycobiology.pdfCarbohydrates และ Glycobiology.pdf
Carbohydrates และ Glycobiology.pdfpitsanu duangkartok
 
โครงสร้างและคุณสมบัติของคาร์โบไฮเดรตและไขมัน.pdf
โครงสร้างและคุณสมบัติของคาร์โบไฮเดรตและไขมัน.pdfโครงสร้างและคุณสมบัติของคาร์โบไฮเดรตและไขมัน.pdf
โครงสร้างและคุณสมบัติของคาร์โบไฮเดรตและไขมัน.pdfpitsanu duangkartok
 
มลพิษทางน้ำ (Water pollution).pdf
มลพิษทางน้ำ (Water pollution).pdfมลพิษทางน้ำ (Water pollution).pdf
มลพิษทางน้ำ (Water pollution).pdfpitsanu duangkartok
 
อาหารกับสารเคมีที่ก่อให้เกิดมะเร็ง.pdf
อาหารกับสารเคมีที่ก่อให้เกิดมะเร็ง.pdfอาหารกับสารเคมีที่ก่อให้เกิดมะเร็ง.pdf
อาหารกับสารเคมีที่ก่อให้เกิดมะเร็ง.pdfpitsanu duangkartok
 
Cellular Pathology พิษณุ ดวงกระโทก.pdf
Cellular Pathology พิษณุ ดวงกระโทก.pdfCellular Pathology พิษณุ ดวงกระโทก.pdf
Cellular Pathology พิษณุ ดวงกระโทก.pdfpitsanu duangkartok
 
การศึกษาโครงสร้างของหัวใจหมู โครงสร้างอวัยวะแลกเปลี่ยนแก๊ส และการวัดปริมาตรปอด
การศึกษาโครงสร้างของหัวใจหมู โครงสร้างอวัยวะแลกเปลี่ยนแก๊ส และการวัดปริมาตรปอดการศึกษาโครงสร้างของหัวใจหมู โครงสร้างอวัยวะแลกเปลี่ยนแก๊ส และการวัดปริมาตรปอด
การศึกษาโครงสร้างของหัวใจหมู โครงสร้างอวัยวะแลกเปลี่ยนแก๊ส และการวัดปริมาตรปอดpitsanu duangkartok
 
สรีรวิทยา (part 3)
สรีรวิทยา (part 3)สรีรวิทยา (part 3)
สรีรวิทยา (part 3)pitsanu duangkartok
 

More from pitsanu duangkartok (20)

cancer therapy by pitsanu_duangkartok ...
cancer therapy by pitsanu_duangkartok ...cancer therapy by pitsanu_duangkartok ...
cancer therapy by pitsanu_duangkartok ...
 
บทนำเกี่ยวกับโรคมะเร็ง (Cancer introduction).pdf
บทนำเกี่ยวกับโรคมะเร็ง (Cancer introduction).pdfบทนำเกี่ยวกับโรคมะเร็ง (Cancer introduction).pdf
บทนำเกี่ยวกับโรคมะเร็ง (Cancer introduction).pdf
 
steroid.pdf
steroid.pdfsteroid.pdf
steroid.pdf
 
Hormone exercise
Hormone exerciseHormone exercise
Hormone exercise
 
การลดลงของ MHC Class I ในมะเร็ง ตอนที่ 2.pdf
การลดลงของ MHC Class I ในมะเร็ง ตอนที่ 2.pdfการลดลงของ MHC Class I ในมะเร็ง ตอนที่ 2.pdf
การลดลงของ MHC Class I ในมะเร็ง ตอนที่ 2.pdf
 
MHC Class I Downregulation in Cancer Part 1
MHC Class I Downregulation in Cancer Part 1MHC Class I Downregulation in Cancer Part 1
MHC Class I Downregulation in Cancer Part 1
 
Melatonin a New Way to Reduce Self-Harm.pdf
Melatonin a New Way to Reduce Self-Harm.pdfMelatonin a New Way to Reduce Self-Harm.pdf
Melatonin a New Way to Reduce Self-Harm.pdf
 
Carbohydrates และ Glycobiology.pdf
Carbohydrates และ Glycobiology.pdfCarbohydrates และ Glycobiology.pdf
Carbohydrates และ Glycobiology.pdf
 
โครงสร้างและคุณสมบัติของคาร์โบไฮเดรตและไขมัน.pdf
โครงสร้างและคุณสมบัติของคาร์โบไฮเดรตและไขมัน.pdfโครงสร้างและคุณสมบัติของคาร์โบไฮเดรตและไขมัน.pdf
โครงสร้างและคุณสมบัติของคาร์โบไฮเดรตและไขมัน.pdf
 
มลพิษทางน้ำ (Water pollution).pdf
มลพิษทางน้ำ (Water pollution).pdfมลพิษทางน้ำ (Water pollution).pdf
มลพิษทางน้ำ (Water pollution).pdf
 
อาหารกับสารเคมีที่ก่อให้เกิดมะเร็ง.pdf
อาหารกับสารเคมีที่ก่อให้เกิดมะเร็ง.pdfอาหารกับสารเคมีที่ก่อให้เกิดมะเร็ง.pdf
อาหารกับสารเคมีที่ก่อให้เกิดมะเร็ง.pdf
 
Pharmaceutical Suspensions.pptx
Pharmaceutical Suspensions.pptxPharmaceutical Suspensions.pptx
Pharmaceutical Suspensions.pptx
 
Metabolism and Energy.pdf
Metabolism and Energy.pdfMetabolism and Energy.pdf
Metabolism and Energy.pdf
 
Ecosystem part 2
Ecosystem part 2Ecosystem part 2
Ecosystem part 2
 
ecosystem
ecosystemecosystem
ecosystem
 
Photosynthesis
PhotosynthesisPhotosynthesis
Photosynthesis
 
Cellular Pathology พิษณุ ดวงกระโทก.pdf
Cellular Pathology พิษณุ ดวงกระโทก.pdfCellular Pathology พิษณุ ดวงกระโทก.pdf
Cellular Pathology พิษณุ ดวงกระโทก.pdf
 
การศึกษาโครงสร้างของหัวใจหมู โครงสร้างอวัยวะแลกเปลี่ยนแก๊ส และการวัดปริมาตรปอด
การศึกษาโครงสร้างของหัวใจหมู โครงสร้างอวัยวะแลกเปลี่ยนแก๊ส และการวัดปริมาตรปอดการศึกษาโครงสร้างของหัวใจหมู โครงสร้างอวัยวะแลกเปลี่ยนแก๊ส และการวัดปริมาตรปอด
การศึกษาโครงสร้างของหัวใจหมู โครงสร้างอวัยวะแลกเปลี่ยนแก๊ส และการวัดปริมาตรปอด
 
Common Chemotherapy Drugs.pdf
Common Chemotherapy Drugs.pdfCommon Chemotherapy Drugs.pdf
Common Chemotherapy Drugs.pdf
 
สรีรวิทยา (part 3)
สรีรวิทยา (part 3)สรีรวิทยา (part 3)
สรีรวิทยา (part 3)
 

การวิเคราะห์เชิงพยากรณ์ ส่วนที่ 1

  • 1. จัดทำโดยพิษณุ ดวงกระโทก การวิเคราะห์เชิงพยากรณ์ ใช้ข้อมูลในอดีตในการทํานายค่าในอนาคต อาศัยองค์ความรู้ด้าน Machine Learning การสร้างตัวแบบโดยอาศัยชุดข้อมูลฝึกสอน (Training dataset) ว่า การเรียนรู้แบบมีผู้สอน (Supervised Learning) ตัวแบบทํานาย (Prediction Model) เป็นฟังก์ชันในการแปลงข้อมูลไปเป็นค่าข้อมูลของตัวแปร เป้าหมาย (Target Variable) ชุดข้อมูลฝึกสอน (Training dataset) เป็นข้อมูลสำหรับสอนตัวแบบให้สามารถทํานายค่าของข้อมูลได้ อย่างถูกต้อง ถ้าข้อมูลฝึกสอนปริมาณมากพอ จะให้ผลลัพธ์การทํานายค่ามีความถูกต้องมากที่สุด ชุดข้อมูลทดสอบ (Test dataset) ใช้ประเมินความสามารถในการทํานายของตัวแบบ ตัวชี้วัดประสิทธิภาพ ช่วยให้สามารถประเมินประสิทธิภาพ และเลือกสรรตัวแบบที่เหมาะสมเพื่อนําไปใช้ ประโยชน์ การสร้างตัวแบบสามารถแบ่งออกได้เป็น 2 ระยะหลัก คือ ระยะฝึกสอนและระยะทดสอบ ข้อมูลจะถูกแบ่งออกเป็น 2 ชุด คือ ชุดฝึกสอนและชุดทดสอบ (70:30) เรา จะเลือกตัวแบบที่มีความซับซ้อนน้อยที่สุดไปใช้งาน หรือหากต้องการใช้ตัวแบบที่มีความซับซ้อนสูง ต้องฝึกสอน ตัวแบบด้วยข้อมูลชุดฝึกสอนปริมาณมากและสามารถเป็นตัวแทนของข้อมูลทั้งหมดที่เป็นไปได้ การวิเคราะห์การจําแนกประเภท (Classification Analysis) แบ่งออกได้เป็น 2 ประเภท แบบทวิภาค (Binary Classification) จําแนกสิ่งต่างๆ ออกเป็น 2 คลาส เท่านั้น แบบหลายคลาส (Multi-class Classification) จําแนกประเภทที่มีคลาสมากกว่า 2 คลาส การวิเคราะห์การจําแนก วิธีเพื่อนบ้านใกล้สุด (𝑘-Nearest Neighbours) พิจารณาจากคลาสของข้อมูลรอบๆ ข้างที่ใกล้ที่สุด 𝑘 ข้อมูล ต้นไม้ตัดสินใจ (Decision Tree) แสดงเส้นทางการตัดสินใจที่นําไปสู่ผลลัพธ์สุดท้าย ประกอบด้วย 2 องค์ประกอบ คือ โหนด (Node) และ กิ่ง (Branch) โหนดสามารถแบ่งได้เป็น 2 ประเภท โหนดราก (Root Node) จะอยู่บนสุดของต้นไม้ เป็น คําถามข้อแรกของต้นไม้ตัดสินใจ โหนดใบ (Leaf Node) เป็นปลายทางของการตัดสินใจ ค่าเอนโทรปี (Entropy) ซึ่งแสดงถึงความไม่บริสุทธิ์ของข้อมูล เอน โทรปีจะมีค่าน้อยเมื่อข้อมูลมีความบริสุทธิ์มาก เกนความรู้ (Information Gain) เป็นค่าคาดหวังของการลดลง ของเอโทรปี หลังจากชุดข้อมูลถูกแบ่งออกเป็นชุดๆ
  • 2. จัดทำโดยพิษณุ ดวงกระโทก ตัวแบบเบย์ชนิดนาอีฟ (Naïve Bayes Classifier) เกิดเหตุการณ์ 𝐴 เมื่อมีเหตุการณ์ 𝐵 เกิดขึ้นก่อน (𝑃(𝐴|𝐵)) 𝑃(𝐴) และ 𝑃(𝐵) คือ ความน่าจะเป็นของการเกิดเหตุการณ์ 𝐴 และ 𝐵 ตามลำดับ เราเรียก 𝑃(𝐴) ว่า ความน่าจะเป็นเบื้องต้น (Prior Probability) เรียก 𝑃(𝐵) ว่าหลักฐาน (Evidence) และ 𝑃(𝐵|𝐴) คือ ความน่าจะเป็นของการเกิดเหตุการณ์ 𝐵 เมื่อมีเหตุการณ์ 𝐴 เกิดขึ้น เรียกว่า ไลค์ลิฮูด (Likelihood) 𝑃(𝐴|𝐵) เราเรียกว่า ความน่าจะเป็นภายหลัง (Posterior Probability) ซึ่งเป็นความน่าจะเป็นที่ต้องการ ทราบค่า ตัวชี้วัดประสิทธิภาพการจําแนกประเภท Confusion Matrix เป็นเมทริกซ์แสดงจำนวนข้อมูลที่เกิดจากการเปรียบเทียบระหว่างค่าคลาสที่ถูก ทํานายและค่าคลาสจริง สำหรับปัญหาการจําแนกประเภทแบบทวิภาค ความถูกต้องของการจําแนก (Classification Accuracy) เป็นมาตรวัดสัดส่วนของตัวแบบสามารถจําแนก คลาสได้อย่างถูกต้องต่อจํานวนข้อมูลที่นํามาทดสอบทั้งหมด สามารถคํานวณได้โดย เราคาดหวังตัวแบบที่ให้ค่าอัตราความถูกต้องของการจําแนกที่มีค่าสูงใกล้เคียง 1 มากที่สุด ความผิดพลาดของการจําแนก (Misclassification) เป็นมาตรวัดสัดส่วนของจํานวนข้อมูลที่ตัวแบบจําแนก คลาสผิดต่อจํานวนข้อมูลที่นํามาทดสอบทั้งหมด เราคาดหวังตัวแบบที่ให้ค่าอัตราความผิดพลาดของการจําแนกที่มีค่าตํ่าใกล้เคียง 0 มากที่สุด ความไว (Sensitivity) เป็นค่าสัดส่วนของผลบวกจริงต่อจํานวนข้อมูลที่มีค่าคลาสจริงเป็นค่าบวก ซึ่งแสดง อัตราความถูกต้องของการจําแนกโดยสนใจเฉพาะข้อมูลที่มีคลาสจริงเป็นค่าบวก ตัวแบบสามารถทํานายค่า คลาสได้อย่างถูกต้อง ตัวแบบทํานายค่า คลาสผิดพลาด
  • 3. จัดทำโดยพิษณุ ดวงกระโทก ค่าความไวมีค่าเท่ากับ 1 เมื่อข้อมูลที่มีคลาสจริงเป็นค่าบวก ตัวแบบสามารถทํานายค่าคลาสของข้อมูลเหล่านั้นได้อย่าง ถูกต้องทั้งหมด ความจําเพาะ (Specificity) เป็นค่าสัดส่วนของผลลบจริงต่อจํานวนข้อมูลที่มีค่าคลาสจริง เป็นค่าลบ แสดง อัตราความถูกต้องของการจําแนกโดยสนใจเฉพาะข้อมูลที่มีคลาสจริงเป็นค่าลบ ค่าความจําเพาะมีค่าเท่ากับ 1 ก็ต่อเมื่อตัวแบบสามารถทํานายค่าคลาสของข้อมูลที่มีคลาสจริงเป็นค่าลบได้ถูกต้องทั้งหมด ความเที่ยง (Precision) เป็นค่าสัดส่วนของผลบวกจริงต่อจํานวนข้อมูลที่ตัวแบบทํานายค่าคลาสเป็นค่าบวก ค่าความเที่ยงมีค่าเท่ากับ 1 เมื่อข้อมูลที่ตัวแบบทํานายค่าคลาสเป็นค่าบวกมีค่าคลาสจริงเป็นค่าบวกทั้งหมด ออกสอบ* ปัญหาการจําแนกแบบหลายคลาส Cross Validation คือเครื่องมือที่ช่วยให้เราตัดสินใจได้ว่าเราควรแบ่งข้อมูลส่วนไหนไปเป็นชุดฝึกสอน ส่วน ไหนไปเป็นชุดทดสอบ โดยที่เราสามารถดูได้จากค่า Accuracy