SlideShare a Scribd company logo
1 of 41
Download to read offline
การถดถอยเชิงเส้นอย่างง่ายและสหสัมพันธ์
(Simple linear regression and correlation)
Miss.Phimmat Kalawong
หัวข้อ
บทนา1
การถดถอยเชิงเส้นอย่างง่าย2
การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด3
ค่าสัมประสิทธิ์การตัดสินใจ6
การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น5
ตัวอย่างงานวิจัย8
สหสัมพันธ์7
คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด4
การนาไปใช้ในงานวิจัยที่สนใจ9
-2-
การวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย (Simple linear regression analysis)
1. บทนา
ตัวแปรอิสระ (Independent variable: x) และตัวแปรตาม (Dependent variable: y)
การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรสองตัว หรือมากกว่า
-3-
วิเคราะห์สหสัมพันธ์ (Correlation analysis)
การวิเคราะห์ว่าตัวแปร 2 ตัวแปรใด ๆ มีความสัมพันธ์หรือไม่นั้น สามารถใช้วิธีการด้านสถิติ
การวิเคราะห์ความถดถอย (Regression analysis)
หาก 2 ตัวแปรมีความสัมพันธ์กัน พบว่าตัวแปร x มีผลต่อตัวแปร y หากศึกษาวิธีการนาตัวแปร x
ใช้คาดคะเนผลที่อาจจะเกิดขึ้นได้ของตัวแปร y ด้วยวิธีการทางสถิติ
การวิเคราะห์การถดถอยเชิงเส้น (Linear regression analysis)
หากตัวแปรต่าง ๆ มีความสัมพันธ์กันในเชิงเส้นตรงจะ เรียกว่า
2. การถดถอยเชิงเส้นอย่างง่าย
รูปที่ 1 แผนภาพการกระจายของการอัด(y) กับแรงดัน(x)
ตัวอย่าง ในการพัฒนาวัสดุแผ่นฉนวนชนิดใหม่ ต้องการคาดคะเนการอัด
(y: หน่วยเป็น 0.1 นิ้ว) ของแผ่นฉนวนหนา 2 นิ้ว ภายใต้แรงดัน (x: หน่วย
เป็น 10 ปอนด์/ตารางนิ้ว) ในระดับต่างๆ โดยทาการทดสอบชิ้นงาน 5 ชิ้น
ชิ้นงาน
(Specimen)
ความดัน
(Pressure)
การอัด
(Compression)
1 1 1
2 2 1
3 3 2
4 4 2
5 5 4
ตารางที่ 1 ข้อมูลการทดสอบวัสดุแผ่นฉนวน
การศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระ (x) และตัว
แปรตาม (y) โดยจะศึกษาตัวแปรอิสระเพียงตัวเดียวที่มีผล
ต่อตัวแปรตาม
ใช้แผนภาพการกระจาย ในการวิเคราะห์ความสัมพันธ์
ความสัมพันธ์ของ 2 แปร และบนแผนภาพการกระจาย
แรงดัน (ตัวแปรอิสระ: x)
การอัด (ตัวแปรตาม: y) -4-
2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ)
ตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย (Simple linear regression model)
โดย
ตัวแบบแสดงดังสมการ
0 1y x    
y
x
= ตัวแปรตาม (Dependent variable)
= ตัวแปรอิสระ (Independentvariable)
= ค่าความคลาดเคลื่อนสุ่ม (Random error)
= จุดตัดแกนบน y (y-intercept)
= ความชัน (Slope)

0
1
และ เป็นค่าพารามิเตอร์ที่ไม่ทราบค่า
เรียกว่า สัมประสิทธิ์การถดถอย (Regression coefficient)
0 1เมื่อ
-5-
04 ความคลาดเคลื่อนกระจายตัวแบบอิสระ
ปราศจากอิทธิพลใดๆ
2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ)
สมมติฐานเฉพาะเกี่ยวกับความคลาดเคลื่อน: ( )
01
การแจกแจงความน่าจะเป็นค่าเฉลี่ยของความ
คลาดเคลื่อนเท่ากับศูนย์นั้นคือ ค่าเฉลี่ยของ
ความคลาดเคลื่อนเท่ากับศูนย์
( ) 0E  
02 ความแปรปรวนการแจกแจงความน่าจะเป็น
คลาดเคลื่อนของตัวแปรอิสระ (x) นั้นมีค่าคงที่
ทั้งหมด หมายความว่าความแปรปรวนของความ
คลาดเคลื่อนสุ่มมีค่าคงที่เท่ากับ
2
( )V  
2

03 ค่าความคลาดเคลื่อน มีการแจกแจงความ
น่าจะแบบปกติ
~ N
-6-
2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ)
รูปที่ 2 เส้นสมมติของ 0 1(y)E x  
เมื่อ x เพิ่มขึ้น 1 หน่วย
y จะเปลี่ยนไป หน่วย1
ซึ่งในความเป็นจริงค่า , และ
ไม่สามารถระบุค่าได้จึงต้องทาการประมาณ
จากข้อมูลตัวอย่าง
1 0 2

0 1(y)E x  
เมื่อ
ค่าเฉลี่ยของเส้นถดถอย อยู่ในรูป
( ) 0E  
-7-
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด
รูปที่ 3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย
3.1 การประมาณค่าจุดตัด และความชัน ( และ )0 1
เส้นที่เหมาะสม (Best-fitting line)
ประมาณค่า ( และ )
วิธีกาลังสองน้อยที่สุด
(Method of least squares)
0 1
ค่าผลรวมของผลต่าง ระหว่าง
ค่าของข้อมูลจริงกับเส้นสมมติ
มีค่าน้อยที่สุด
-8-
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
2 2
0 1
1 1
( )
n n
i i i
i i
L y x  
 
    
ค่าความคลาดเคลื่อน นั้นสามารถเป็นได้ทั้งค่าบวกและค่า
ลบ จึงต้องทาให้อยู่ในรูปผลรวมกาลังสองของความ
คลาดเคลื่อน (Sum of squaresfor error: L )
0 1
0 1
1ˆ ˆ0 ,
ˆ ˆ2 ( ) 0
n
i i
i
L
y x
 
 
 

    


0 1
0 1
1ˆ ˆ1 ,
ˆ ˆ2 ( ) 0
n
i i i
i
L
y x x
 
 
 

    


การประมาณค่า และ เขียนแทนด้วย และ
โดยวิธีกาลังสองน้อยที่สุด ด้วยการหาค่าอนุพันธ์เชิงส่วน
เทียบกับ และ แล้วกาหนดให้สมการเท่ากับศูนย์
0 1 1
ˆ0
ˆ
0 1
สามารถคานวณหาค่าจุดตัดแกนและความชัน ได้ดังนี้
0 1
ˆ ˆy x   (1)
1 1
1
1 2
2 1
1
ˆ
n n
i in
i i
i i
i
n
in
i
i
i
y x
y x
n
x
x
n

 



  
  
  

 
 
 
 



(2)
0 1
1 1
ˆ ˆ
n n
i i
i i
n x y 
 
  
2
0 1
1 1 1
ˆ ˆ
n n n
i i i i
i i i
x x y x 
  
   
เมื่อจัดรูปสมการทั้งสองใหม่จะได้รูปสมการปกติ คือ
-9-
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
ดังนั้น เส้นประมาณการถดถอยที่เหมาะสม คือจากสมการหาความชัน นาแสดงใหม่โดยใช้
สัญลักษณ์แทนได้ดังนี้
1
ˆ( )
2
12 2
1 1
( )
n
in n
i
xx i i i
i i
x
S x x x
n

 
 
 
    

 
1 1
1 1
( )( )
n n
i in n
i i
xy i i i i
i i
x y
S y y x x x y
n
 
 
  
  
      
 
 
1
ˆ xy
xx
S
S
  (3)
0 1
ˆ ˆˆ iy x   (4)
สาหรับ แต่ละคู่ลาดับของข้อมูล(x, y) ที่ได้จากการ
สังเกตจริง แสดงดังสมการต่อไปนี้
0 1
ˆ ˆˆi i iy x e    i = 1,2,…,n
โดยที่ เรียกว่า ค่าเรสซิดวล (Residual)
หรือค่าความคลาดเคลื่อน
ˆi ie y y 
-10-
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
3.2 การประมาณค่าความแปรปรวน: 2

รูปที่ 4 ตัวอย่างความแปรปรวนของข้อมูล
การประมาณค่าความแปรปรวนโดยที่เรสซิดวล ถูกใช้เพื่อให้ได้ค่าประมาณ
ซึ่งค่าเรสซิดวลจะมีค่าเป็นไปได้ทั้งบวกและลบ จึงต้องกาหนดค่าให้อยู่ในรูปของ
ผลรวมกาลังสองของเรสซิดวล (Error sum of squares: )
2
1
n
E i
i
SS e

  2
1
ˆ( )
n
i
i
y y

 
โดยองศาอิสระ (Degrees of freedom) คือ
ค่าเฉลี่ยของผลรวมกาลังสองของเรสซิดวล คือ 2
ˆ( ) ( 2)EE SS n  
ดังนั้น ค่าประมาณความแปรปรวนของเรสซิดวลที่ไม่เอนเอียง คือ
ESS
2

2n 
2 2
ˆ
2
E
E
SS
MS S
n
   
 (5)
2
ˆ
2
ˆ
สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมน้อย
สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมมาก -11-
ตัวอย่าง
ตัวอย่างที่ 1 โรงงานผลิตกระดาษเพื่อใช้ทากล่องบรรจุชิ้นงานด้านอุตสาหกรรม ทาการศึกษาข้อมูลระหว่าง ค่าความต้านทานต่อการ
ฉีกขาดของกระดาษ (y: หน่วยเป็น 10 นิวตัน/ตารางมิลลิเมตร) กับเปอร์เซ็นต์ของกาวอัด (x) ที่ใช้เป็นส่วนผสมในการผลิตกระดาษ
โดยสุ่มเก็บรวบรวมข้อมูล มา 10 ตัวอย่างดังนี้คือ
ตัวอย่างที่ 1 2 3 4 5 6 7 8 9 10
x 1.6 1.5 1.5 1.4 2.0 2.0 2.2 2.4 2.5 2.5
y 10.1 11.7 11.7 11.5 13.1 13.2 14.2 14.0 13.7 14.1
จากข้อมูลข้างต้น หากต้องการทราบความสัมพันธ์ระหว่างกับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิต
กระดาษ กับความต้านทานต่อการฉีกขาดของกระดาษ จะทาการพิจารณาตัวแบบเชิงเส้นอย่างง่ายดังต่อไปนี้
0 1y x    
โดยที่
x = เปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ (ตัวแปรอิสระ)
y = ค่าความต้านทานต่อการฉีกขาดของกระดาษ (ตัวแปรตาม)
-12-
ตัวอย่าง (ต่อ)
รูปที่ 5 แผนภาพการกระจายของค่าความต้านทานต่อการฉีกขาดของกระดาษ(y)
กับเปอร์เซ็นต์กาวอัด (x)
เมื่อ x มีค่าสูงขึ้น y จะมีค่าสูงขึ้นด้วย
การใช้ค่าของข้อมูลวิเคราะห์ความสัมพันธ์ของตัวแปรต้นและตัว
แปรตาม ซึ่งมีข้อมูลดังต่อไปนี้
10n 
10
1
19.60i
i
x


10
1
127.30i
i
y


10
1
254.30i i
i
y x


10
2
1
40.12i
i
x


10
2
1
1638.03
i
y

 1.96x 12.73y 
คานวณค่าสัมประสิทธิ์ของสมการถดถอยเชิงเส้นอย่างง่าย
 
210
2
10
12
1
19.60
40.12 1.704
10
i
i
xx i
i
x
S x
n


 
 
     


  
10 10
10
1 1
1
19.60 127.30
254.3 4.7
10
0 92
i i
i i
xy i i
i
x y
S x y
n
 

  
  
      
 

ค่าความชัน และค่าจุดตัด
1
4.792ˆ 2.812
1.704
xy
xx
S
S
   
0 1
ˆ ˆ 12.73 (2.812 1.96) 7.218y x      
-13-
ตัวอย่าง (ต่อ)
รูปที่ 6 พล็อตของสมการถดถอยเชิงเส้นของตัวอย่างที่ 1
จากสมการถดถอยที่ได้อธิบายได้ว่า เมื่อ
จะได้ หมายความว่าถ้าไม่มี
อิทธิพลของกาวอัดเลย ค่าความต้านทานต่อการฉีกขาด
ของกระดาษจะเท่ากับ 72. 18 นิวตันต่อตารางมิลลิเมตร
(เนื่องจากหน่วยของค่าความต้านทานในตัวอย่างที่ 1
เท่ากับ 10 นิวตันต่อตารางมิลลิเมตร ดังนั้น
ˆ 7.218 2.812y x 
ดังนั้น สมการถดถอยเชิงเส้นอย่างง่ายที่ประมาณได้
0x 
ˆ 7.218 2.812(0) 7.218y   
7.218 10 72.18 
-14-
ตัวอย่าง (ต่อ)
ตัวอย่างที่ x y
1 1.60 10.10 11.72 -1.62 2.62
2 1.50 11.70 11.44 0.26 0.07
3 1.50 11.70 11.44 0.26 0.07
4 1.40 11.50 11.16 0.34 0.12
5 2.00 13.10 12.84 0.26 0.07
6 2.00 13.20 12.84 0.36 0.13
7 2.20 14.20 13.40 0.80 0.63
8 2.40 14.00 13.97 0.03 0.00
9 2.50 13.70 14.25 -0.55 0.30
10 2.50 14.10 14.25 -0.15 0.02
ผลรวม 19.60 127.30 127.30 0.00 4.02
ieˆiy 2
ie
ตารางที่ 2 ข้อมูลความคลาดเคลื่อนที่เกิดขึ้นจากตัวแบบและค่าสังเกตจากตัวอย่าง
ค่าความต้านทานต่อการฉีกขาดของกระดาษ แสดงดังนี้
ค่าประมาณความแปรปรวนของเรสซิดวล
2
2
2 1 (4.02)
ˆ 0.503
2 10 2
n
i
i
e
n
 
  
 

สามารถคานวณได้ดังนี้
-15-
ดังนั้น และ คือค่าประมาณที่ไม่เอนเอียงในตัวแบบการถดถอยเชิงเส้น
4. คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด
( ) 0E  
2
( )V  
คุณสมบัติทางสถิติของค่าประมาณพารามิเตอร์ และ
ของตัวแบบความสัมพันธ์เชิงเส้นด้วยวิธีกาลังสองน้อยที่สุด อธิบายได้
จากข้อสมมติฐานของความคลาดเคลื่อน
0 1
 1 1
ˆE  
ค่าเฉลี่ยของความชันและจุดตัด คือ
ค่าความแปรปรวนความชันและจุดตัด คือ
 
2
1
ˆ
xx
V
S

 
 0 0
ˆE  
 
2
2
0
1ˆ
xx
x
V
n S
 
 
  
 
ประมาณการความแปรปรวนของความชันและ
จุดตัด ผลจากการคานวณหารากที่สองของความแปรปรวน
เรียกว่า ความคลาดเคลื่อนมาตรฐานโดยประมาณ (Estimated
standard error) ของความชันและจุดตัด หาได้จาก
โดยที่ค่าความคลาดเคลื่อนมาตรฐานโดยประมาณเป็นค่าที่
ใช้ในการวัดความถูกต้องแม่นยาของการประมาณค่าสัมประสิทธิ์
ตัวแบบความสัมพันธ์ด้วยวิธีกาลังสองน้อยที่สุด นั่นคือค่าความ
คลาดเคลื่อนยิ่งน้อยยิ่งดีนั่นเอง1
ˆ 0
ˆ
 
2
1
ˆˆ
xx
se
S

  (6)
 
2
2
0
1ˆ ˆ
xx
x
se
n S
   (7)
-16-
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น
5.1 การทดสอบสมมติฐานโดยการใช้ t-Test
การทดสอบสมมติฐานว่าความชัน เท่ากับค่าคงที่ สมมติฐานคือ
โดยที่ ตัวสถิติทดสอบความชัน ใช้การทดสอบแบบที
0 1 1,0:H  
1 1 1,0:H  
ซึ่งการแจกแจงแบบทีด้วยองศาอิสระ
จะปฏิเสธสมมติฐานหลัก เมื่อ 0 2, 2nt t 
2n
การวิเคราะห์ความเหมาะสมของตัวแบบถดถอยเชิงเส้นต้องทาการทดสอบสมมติฐานทางสถิติของค่าความชันและจุดตัดก่อนนาไปใช้
โดยมีข้อสมมติฐานคือ ความคลาดเคลื่อนกระจายตัวแบบอิสระ, , และ~ N ( ) 0E   2
( )V  
-17-
 
1 1,0 1 1,0
0 2
1
ˆ ˆ
ˆˆ xx
T
seS
   

 
  (8)
0 2, 2nt t 
การทดสอบสมมติฐานของจุดตัด
ปฏิเสธสมมติฐานหลักเมื่อ
 
0 0,0 0 0,0
0
2
02
ˆ ˆ
ˆ1
ˆ
xx
T
sex
n S
   


 
 
 
 
 
(9)
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ)
5.1 การทดสอบสมมติฐานโดยการใช้ t-Test
0 1: 0H  
1 1: 0H  
โดยการทดสอบสมมติฐานนั้นมีความสาคัญ เนื่องเป็นการทดสอบเพื่อศึกษานัยสาคัญของความสัมพันธ์มีสมมติฐานคือ
(ไม่มีความสัมพันธ์ระหว่าง x และ y)
(มีความสัมพันธ์ระหว่าง x และ y)
รูปที่ 7 ไม่ปฏิเสธสมมติฐานหลัก (ไม่มีความสัมพันธ์ระหว่าง x และ y)0 1: 0H   รูปที่ 8 ปฏิเสธสมมติฐานหลัก (มีความสัมพันธ์ระหว่าง x และ y)
ค่าแปรปรวนน้อย ค่าแปรปรวนของข้อมูลมาก
0 1: 0H  
ดังนั้น การปฏิเสธสมมติฐานหลัก อาจหมายถึงว่ารูปแบบความสัมพันธ์เชิงตรงนั้นมีความเหมาะสม ดังรูปที่ 8 (a)
-18-
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ)
5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
เป็นการวิเคราะห์ความแปรปรวนที่ใช้เพื่อทดสอบนัยสาคัญของการ
ถดถอย ซึ่งการวิเคราะห์ความแปรปรวนมีดังนี้
2 2 2
1 1 1
ˆ ˆ( ) ( ) ( )
n n n
i i i i
i i i
y y y y y y
  
      
2
1
ˆ( )
n
R i
i
SS y y

 
2
1
ˆ( )
n
E i i
i
SS y y

 
ผลรวมกาลังสองของความคลาดเคลื่อนจากการถดถอย
(Regression sum of squares)
ผลรวมกาลังสองของความคลาดเคลื่อน
(Error sum of squares)
เขียนสมการใหม่ได้ว่า
โดยที่
2
1
( )
n
T i
i
SS y y

 
2
12
1
n
in
i
i
i
y
y
n


 
 
  


-19-
T R ESS SS SS  (10)
1
ˆ
R xySS S (11)
E T RSS SS SS  (12)
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ)
5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
ตัวสถิติที่ใช้ในการทดสอบ คือ
0
1
( 2)
R R
E E
SS MS
F
SS n MS
 

ซึ่งการแจกแจงแบบเอฟ ด้วยองศาอิสระ จะปฏิเสธสมมติฐานหลัก ถ้า พบว่าค่าสถิติเอฟ
ที่ได้จากการคานวณมากกว่าค่าที่เกิดจากการเปิดตารางเอฟ
2n 0 ,1, 2nF f 
แหล่งที่มา
(Source of variation)
ผลบวกกาลังสอง
(Sum of Squares)
องศาอิสระ
(Degrees of
Freedom)
ค่าเฉลี่ย
(Mean
Square)
ค่าสถิติ
0( )F
ตัวแบบ (Regression) RSS 1 RMS 0 R EF MS MS
ค่าความคลาดเคลื่อน (Error) ESS 2n  EMS
ทั้งหมด (Total) TSS 1n 
ตารางที่ 3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย
-20-
(13)
ตัวอย่าง
ตัวอย่างที่ 2 จากตัวอย่างที่ 1 ทดสอบสมมติฐานว่าความสัมพันธ์ของความต้านทานต่อการฉีกขาดของกระดาษกับเปอร์เซ็นต์ของกาวอัดที่ใช้
เป็นส่วนผสมในการผลิตกระดาษเป็นแบบเชิงเส้นที่ระดับนัยสาคัญ 5% หรือไม่
สมการถดถอยเชิงเส้นอย่างง่ายที่ได้จากตัวอย่างที่ 1 คือ ˆ 7.218 2.812y x 
การทดสอบสมมติฐานโดยการใช้ t-Test
10n  1
ˆ 2.812  1.704xxS  2
ˆ 0.503 
สมมติฐาน
0 1: 0H  
1 1: 0H  
(ไม่มีความสัมพันธ์ระหว่าง x และ y)
(มีความสัมพันธ์ระหว่าง x และ y)
0.05 
2
1 1,0
0
ˆ ˆ 0 2.812
5.176
0.503
1.704
ˆ
xx
T
S


  
   ตัวสถิติทดสอบ
ปฏิเสธ ถ้า0H 0 0.025,8 2.306T t 
0.0250.025
0.025,8 2.306t   0.025,8 2.306t 
สรุป เนื่องจาก ดังนั้น ปฏิเสธ
ที่ระดับนัยสาคัญ 0.05 มีหลักฐานแสดงว่า ค่าความต้านทานต่อการฉีก
ขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่ใช้
เป็นส่วนผสมในการผลิตกระดาษ
0 0.025,8( 5.176) 2.306T t   0 1: 0H  
-21-
0.05
0.05,1,8 5.32f 
ตัวอย่าง (ต่อ)
ทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
10n 
10
1
127.30i
i
y


10
2
1
1638.03
i
y

 12.73y 
ˆ 127.3iy  1
ˆ 2.812  4.792xyS 
สมมติฐาน
0 1: 0H  
1 1: 0H  
(ไม่มีความสัมพันธ์ระหว่าง x และ y)
(มีความสัมพันธ์ระหว่าง x และ y)
0.05 
2
1
ˆ( ) 4.02
n
E i i
i
SS y y

  
1
ˆ 2.812 4.792 13.475R xySS S   
2
2
12
1
127.3
1638.03 17.501
10
n
in
i
T i
i
y
SS y
n


 
 
     


13.475
13.475
1 1
R
R
SS
MS   
4.02
0.503
( 2) 10 2
E
E
SS
MS
n
  
 
0
13.475
26.78
0.5025
R
E
MS
F
MS
  
0 ,1, 2nF f ปฏิเสธ ถ้า0H
0 0.05,1,8( 5.32)F f 
-22-
แหล่งที่มา
(Source of variation)
ผลบวกกาลังสอง
(Sum of
Squares)
องศาอิสระ
(Degrees of
Freedom)
ค่าเฉลี่ย
(Mean
Square)
ค่าสถิติ
0( )F
ตัวแบบ (Regression) 13.475 1 13.475 26.78
ค่าความคลาดเคลื่อน (Error) 4.020 8 0.503
ทั้งหมด (Total) 17.501 9
ตัวอย่าง (ต่อ)
สรุป เนื่องจาก ดังนั้นปฏิเสธ ที่ระดับนัยสาคัญ 0.05 มี
หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาว
อัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ
0 0.05,1,8( 26.78) ( 5.32)F f   0 1: 0H  
-23-
สมการถดถอยสามารถพยากรณ์ค่าของตัวแปรตาม (Y) ได้ดีมากยิ่งขึ้น
สมการถดถอยพยากรณ์ค่าของตัวแปรตาม (Y) ได้ไม่ดี
(เนื่องจากตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันน้อย)
6. ค่าสัมประสิทธิ์การตัดสินใจ
สมการถดถอยที่ใช้ในการพยากรณ์นี้อาจพยากรณ์ค่าตัวแปรตาม (Y) ได้ดีหรือไม่ดีก็ได้ โดยที่ ค่าสัมประสิทธิ์การตัดสินใจ (Coefficient
of Determination; ) เป็นค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y ซึ่งค่าสัมประสิทธิ์การตัดสินใจนี้เป็น
ค่าที่ใช้บอกเปอร์เซ็นต์การเปลี่ยนแปลงของตัวแปรตาม (Y) ที่สามารถอธิบายได้ด้วยตัวแปรอิสระ (X) ในสมการถดถอย
2
R
2 2 1
1
ˆ
ˆ XX XY R
T T T
S S SS
R
SS SS SS

  
โดยที่ ค่า จะมีค่าอยู่ระหว่าง 0 ถึง 12
R
ค่าสัมประสิทธิ์การตัดสินใจ: 2
R
2
R
2
R
(14)
-24-
ตัวอย่าง
ตัวอย่างที่ 3 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้ คือ คานวณค่าสัมประสิทธิ์ของการตัดสินใจ
จากมูลในตัวอย่างที่ 2 ได้ค่าต่าง ๆ ดังนี้ และ
ˆ 7.218 2.812y x 
13.475RSS  17.501TSS 
2 13.475
0.77
17.501
R
T
SS
R
SS
  
สรุปได้ว่า ค่า หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษขึ้นอยู่กับเปอร์เซ็นต์
ของกาวอัดประมาณ 77% ส่วนอีก 23% จะขึ้นอยู่กับปัจจัยอื่น ๆ ที่ไม่ได้นามาศึกษาหรือสมการถดถอย
สามารถพยากรณ์ค่าค่าความต้านทานต่อการฉีกขาดของกระดาษได้ถูกต้อง 77%
2
0.77R 
ˆ 7.218 2.812y x 
-25-
7. สหสัมพันธ์
สมมติว่า การแจกแจงร่วมของ และ เป็นการแจกแจงแบบปกติของสองตัวแปรสุ่ม (Bivariatenormal distribution)
โดยมีค่าเฉลี่ยของตัวแปรคือ และ ความแปรปรวนของตัวแปรคือ และ และกาหนดให้ คือสัมประสิทธิ์
สหสัมพันธ์ระหว่างตัวแปร X และ Y ได้ว่า
iX iY
X Y 2
X 2
Y 
• สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม
• ใช้สาหรับการทดสอบความสัมพันธ์เชิงเส้นตรง
• สามารถระบุระดับความสัมพันธ์ได้ เช่น สูงกับน้าหนักว่ามีความสัมพันธ์กันมากหรือน้อย
• สามารถระบุทิศทางความสัมพันธ์ได้ เช่น สูงกับน้าหนักมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้าม
• ตรวจสอบด้วยการใช้แผนภาพการกระจายและค่าสัมประสิทธิ์สหสัมพันธ์ (correlation coefficient)
การวิเคราะห์สหสัมพันธ์
XY
X Y


 

โดยที่ คือความแปรปรวนร่วมระหว่าง X และ YXY
-26-
7. สหสัมพันธ์ (ต่อ)
1
1 2 1 2
2 2
1 1
( )
ˆ
( SS )
( ) (Y )
n
i i
i XY
n n
XX T
i i
i i
Y X X
S
R
S
X X Y
 
 

  
 
  
 

 
โดยการประมาณของสัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Sample Correlation Coefficient: R)
1. ค่าของ R ไม่ได้ขึ้นอยู่กับการศึกษาภายใต้ตัวแปรสองตัว
2. ค่า R เป็นอิสระจากการตรวจวัดของ x และ y
3. ค่า R จะ มีค่าอยู่ในช่วง
4. R = 1 เมื่อ x มีค่ามาก y มีค่ามาก หรือเมื่อ x มีค่าน้อย y มีค่าน้อย (มีความสัมพันธ์เชิงเส้นเชิงบวก)
R = -1 เมื่อ x มีค่ามาก y มีค่าน้อย หรือเมื่อ x มีค่าน้อย y มีค่ามาก (มีความสัมพันธ์เชิงเส้นเชิงลบ)
5. ค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าค่าสัมประสิทธิ์การตัดสินใจ:
คุณสมบัติที่สาคัญที่สุดของ R คือ:
1 1R  
2
R
-27-
(15)
7. สหสัมพันธ์ (ต่อ)
รูปที่ 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R
ซึ่งการตรวจสอบความสัมพันธ์ ทาการตรวจสอบโดย
แผนภาพกระจายข้อมูล รูปที่ 9 แสดงสถานการณ์ที่เป็นไปได้
สาหรับค่าของ R
•รูปที่ 9 (a) R>1 ความสัมพันธ์เชิงเส้น มีความชันเป็นบวก
•รูปที่ 9 (b) R<1 ความสัมพันธ์เชิงเส้น มีความชันเป็นลบ
•รูปที่ 9 (c) R=0 ไม่เป็นความสัมพันธ์เชิงเส้นโค้ง
•รูปที่ 9 (d) R=0 แสดงให้เห็นความสัมพันธ์ระหว่าง
x และ y ซึ่งเป็นความสัมพันธ์เชิงเส้นโค้ง
จะเห็นได้ว่า R=0 จะไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y
ดังนั้น การพิจารณาข้อมูลด้วยแผนภาพการกระจายจึงเป็นสิ่งที่
มีความสาคัญ
-28-
ตัวอย่าง
ตัวอย่างที่ 4 จงหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์
กาวอัด จากข้อมูลในตัวอย่างที่ 1 และ2 ได้ค่าต่าง ๆ ดังนี้
1 2 1 2
4.792
ˆ 0.878
( SS ) (1.704 17.501)
XY
XX T
S
R
S
    

ดังนั้น ค่า R=0.878 นี้หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ของกาวอัด
มีความสัมพันธ์กันสูงประมาณ 87. 8% และเนื่องจากค่า R เป็นบวกจะแสดงว่ามีความสัมพันธ์กันในทิศทาง
เดียวกัน คือถ้าเปอร์เซ็นต์กาวอัดมีค่าสูงค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะสูงตามไปด้วยและ
ในทางตรงกันข้ามถ้าเปอร์เซ็นต์กาวอัดมีค่าต่าค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะต่าตามไปด้วย
4.792xyS  1.704xxS  17.501TSS 
-29-
สรุป
-30-
สหสัมพันธ์
(Correlation)
การถดถอยเชิงเส้นอย่างง่าย
(Simple linear regression)
จุดมุ่งหมาย การศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม หาเส้นที่เหมาะสมที่สุดในการทานาย Y
ตัวแปร2ตัว ไม่คานึงถึงปัจจัยสาเหตุและผลกระทบ Xเป็นสาเหตุ และYให้เป็นผลกระทบ
ตรวจสอบ
ค่าสัมประสิทธิ์สหสัมพันธ์
(มีค่าอยู่ในช่วง -1 ถึง 1)
ค่าสัมประสิทธิ์การตัดสินใจ
(มีค่าอยู่ระหว่าง 0 ถึง 1)
8. ตัวอย่างงานวิจัย
Title: Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model
Authors:Yan-ming YANG, Yue TENG and Rui-li ZHANG
1.วัตถุประสงค์ของการวิจัย
การพยากรณ์ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินเป็นสิ่งที่มีความสาคัญ และช่วย
ในการตัดสินใจการใช้ประโยชน์จากทรัพยากรที่มีอยู่เพื่อปรับปรุงความสามารถในการบารุงรักษา ใน
งานวิจัยนี้มุ่งเน้นไปที่ปัจจัยหลักที่มีอิทธิพลต่อการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน โดยใช้
แบบจาลองการทานายถดถอยเชิงเส้นของการใช้วัสดุในการบารุงรักษาอุปกรณ์ สร้างขึ้นโดยใช้ข้อมูล
ตัวอย่างที่เกิดขึ้นจริง บนพื้นฐานการวิเคราะห์จากตัวอย่าง วิธีการถดถอยเชิงเส้นอย่างง่ายใช้ในการ
ทานาย และการทดสอบการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน
-31-
8. ตัวอย่างงานวิจัย (ต่อ)
2.ขั้นตอนการวิจัย
2.1 เก็บสถิติข้อมูล
เก็บสถิติข้อมูลรายเดือนของชั่วโมงการบิน แสดงดังในตารางที่ 4 และข้อมูลของการใช้วัสดุในการ
บารุงรักษา แสดงดังในตารางที่ 5 ในปี ค.ศ. 2015-2016 เป็นเวลาสองปี สร้างแบบจาลองการถดถอยเชิงเส้นอย่าง
ง่าย เพื่อทานายปริมาณการใช้วัสดุในการบารุงรักษา
ตารางที่ 4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016
ตารางที่ 5 ปริมาณการใช้วัสดุบารุงรักษาเครื่องบินในปี ค.ศ. 2015-2016
-32-
2.2 แบบจาลองการถดถอย
งานวิจัยนี้เลือกแบบจาลองการถดถอยเชิงเส้นอย่างง่ายที่อยู่บนพื้นฐานการประมาณความสัมพันธ์เชิงเส้น
ระหว่างตัวแปรอิสระ และตัวแปรตาม สร้างสมการเชิงเส้นเพื่อทานาย ตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย คือ
y a bx 
โดยกาหนดให้ y คือ ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน (ตัวแปรตาม)
x คือ ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ)
a คือ จุดตัดแกนบน y (สัมประสิทธิ์การถดถอย)
b คือ ความชัน (สัมประสิทธิ์การถดถอย)
โดยการประมาณค่าสัมประสิทธิ์การถดถอย (a, b) และทาการทดสอบแบบจาลองการถดถอยโดยการทดสอบการ
ประมาณค่าความแปรปรวน และการทดสอบสัมประสิทธิ์สหสัมพันธ์โดยใช้ระดับนัยสาคัญ 0.05 ในการตรวจสอบ
8. ตัวอย่างงานวิจัย (ต่อ)
-33-
8. ตัวอย่างงานวิจัย (ต่อ)
3. ผลการวิจัย ใช้ซอฟต์แวร์ Minitab ในการวิเคราะห์การถดถอย แสดงดังรูปที่ 10 สมการถดถอยเชิงเส้นอย่างง่ายที่
ได้คือ 4.173 0.09901y x 
รูปที่ 10 พล็อตเส้นถดถอยของสายชั่วโมงของเครื่องบิน และปริมาณการใช้วัสดุในการบารุงรักษาหลัก
-34-
8. ตัวอย่างงานวิจัย (ต่อ)
3.1 การทดสอบนัยสาคัญของสมการถดถอย การวิเคราะห์ผลในตาราง ANOVA ตารางที่ 5 การวิเคราะห์ผล
ในตาราง ANOVA กาหนดระดับนัยสาคัญที่ 0.05 หรือที่ระดับความเชื่อมั่น 95 % โดยในงานวิจัยนี้ได้ใช้โปรแกรม
Mimitab ช่วยในการวิเคราะห์ จึงใช้ค่า P-value เป็นตัวช่วยในการตัดสินใจ เพราะค่า P-value คือระดับนัยสาคัญที่
น้อยที่สุดหรือโอกาสที่น้อยที่สุดที่จะสามารถปฎิเสธสมมติฐานหลัก จะเห็นได้ว่าค่า เนื่องจาก
ดังนั้น ปัจจัยอื่นๆ ไม่มีผลกระทบต่อปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน อย่างมี
นัยสาคัญ สมการการถดถอยโดยรวมจึงมีประสิทธิภาพอย่างมาก
ตารางที่ 5 การวิเคราะห์ความแปรปรวน
0.000P 
( 0.05) ( 0.00)P   
-35-
8. ตัวอย่างงานวิจัย (ต่อ)
3.2 การวัดของผลรวมของผลกระทบสมการการถดถอย ตารางที่ 6 R-Sq คือ 91.24% แสดงให้เห็นว่า ปริมาณ
การใช้วัสดุในการบารุงรักษาเครื่องบินขึ้นอยู่กับชั่วโมงการบิน ประมาณ 91.24% ส่วนอีก 8.76% จะขึ้นอยู่กับปัจจัย
อื่น ๆ ดังนั้นเส้นถดถอยสามารถอธิบายความสัมพันธ์เชิงเส้นได้ 91.24% สามารถพยากรณ์การใช้วัสดุในการ
บารุงรักษาเครื่องบิน (y) ได้ถูกต้อง 91.24% ดังนั้นการตัวแบบถดถอยที่ได้ จึงให้ผลที่ดี
ตารางที่ 6 สรุปผลของแบบจาลองถดถอย
-36-
8. ตัวอย่างงานวิจัย (ต่อ)
สมมติฐาน
0 1: 0H   1 1: 0H  (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) 0.05 
3.3 การทดสอบนัยสาคัญของสัมประสิทธิ์การถดถอย ตารางที่ 7 แสดงให้เห็นว่า สัมประสิทธิ์ชั่วโมงบินของ
เครื่องบิน (ตัวแปรอิสระ x) โดยเกณฑ์ในการปฏิเสธสมมติฐานหลัก โดยใช้ค่าพี คือ จะปฎิเสธ เมื่อระดับ
นัยสาคัญมากกว่าเท่ากับค่าพี P Value  
0H
ตารางที่ 7 สัมประสิทธิ์
ในตารางที่ 7 จะเห็นได้ว่า เนื่องจาก ดังนั้นปฏิเสธ แสดงว่า
ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบินมีความสัมพันธ์เชิงเส้นกับชั่วโมงบินของเครื่องบิน ซึ่งบ่งชี้ว่าชั่วโมงบิน
ของเครื่องบินเป็นปัจจัยที่มีนัยสาคัญ
0.000P  ( 0.05) ( 0.00)P    0 1: 0H  
4.173 0.09901y x 
-37-
8. ตัวอย่างงานวิจัย (ต่อ)
3.4 การวิเคราะห์เรสซิดวล เพื่อตรวจสอบความเหมาะสมของตัวแบบถดถอยและANOVA การตรวจสอบพล็อตจะช่วยให้
ทราบว่า ข้อสมมติกาลังสองน้อยที่สุดเป็นไปตามเงื่อนไขหรือไม่ หากสมมติฐานเป็นไปตามเงื่อนไข จากนั้นการถดถอยกาลัง
สองน้อยสุด จะประมาณค่าสัมประสิทธิ์ที่ไม่เอนเอียงที่มีความแปรปรวนน้อยที่สุด ใช้ Minitab พล็อตเรสซิดวล (ดังแสดงในรูป
ที่ 11)
รูปที่ 11 พล็อตเรสซิดวลของชั่วโมงบินเครื่องบินและการใช้วัสดุในการบารุงรักษาหลัก -38-
• เรสซิดวลแปรผันแบบสุ่ม และเป็นอิสระจากกัน
• รูปที่ 11 (ขวา) เรสซิดวลมีความแปรปรวนคงที่
• รูปที่ 11 (ซ้าย) เรสซิดวลมีการแจกแจงแบบปกติ
8. ตัวอย่างงานวิจัย (ต่อ)
4. สรุปผลการวิจัย
ดังนั้นงานวิจัยนี้ได้นาวิธีการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย ในการพยากรณ์ของปริมาณการใช้วัสดุใน
การบารุงรักษาอุปกรณ์การบิน พบว่า ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินกับชั่วการบินของ
เครื่องบินมีความสัมพันธ์เชิงเส้นกันที่ระดับความเชื่อมั่น 95 % และสามารถนาสมการถดถอยที่ได้ไปพยากรณ์การ
ใช้วัสดุในการบารุงรักษาเครื่องบินได้ถูกต้อง 91.24% คาดคะเนได้อย่างที่มีประสิทธิภาพ
-39-
1. Mendenhall, W. M., & Sincich, T. L. (2016). Statistics for Engineering and the Sciences. Chapman and
Hall/CRC.
2. Montgomery, D. C., & Runger, G. C. (2014). Applied statistics and probability for engineers. John Wiley
and Sons.
3. Devore, J. L. (2011). Probability and Statistics for Engineering and the Sciences. Cengage learning.
4. Ott, R. L., & Longnecker, M. T. (2015). An introduction to statistical methods and data analysis. Nelson
Education.
5. Yang, Y. M., Yue, T. E. N. G., & Zhang, R. L. (2018). Prediction of Maintenance Material Consumption
for Aviation Equipment Using Linear Regression Model. DEStech Transactions on Computer Science
and Engineering, (mso).
อ้างอิง
Thank You

More Related Content

What's hot

เฉลยค่ากลางของข้อมูล
เฉลยค่ากลางของข้อมูลเฉลยค่ากลางของข้อมูล
เฉลยค่ากลางของข้อมูลkrurutsamee
 
การวัดตำแหน่งที่และการกระจาย
การวัดตำแหน่งที่และการกระจายการวัดตำแหน่งที่และการกระจาย
การวัดตำแหน่งที่และการกระจายkrurutsamee
 
การวัดตำแหน่งที่ของข้อมูลม.6
การวัดตำแหน่งที่ของข้อมูลม.6การวัดตำแหน่งที่ของข้อมูลม.6
การวัดตำแหน่งที่ของข้อมูลม.6KruGift Girlz
 
สมการเชิงเส้นตัวแปรเดียว
สมการเชิงเส้นตัวแปรเดียวสมการเชิงเส้นตัวแปรเดียว
สมการเชิงเส้นตัวแปรเดียวkroojaja
 
ชุดที่ 6
ชุดที่ 6 ชุดที่ 6
ชุดที่ 6 krurutsamee
 
โครงสร้างข้อมูลแบบต้นไม้
โครงสร้างข้อมูลแบบต้นไม้โครงสร้างข้อมูลแบบต้นไม้
โครงสร้างข้อมูลแบบต้นไม้tumetr
 
แบบฝึกหัดการวัดตำแหน่งของข้อมูล (สถิติ)
แบบฝึกหัดการวัดตำแหน่งของข้อมูล (สถิติ)แบบฝึกหัดการวัดตำแหน่งของข้อมูล (สถิติ)
แบบฝึกหัดการวัดตำแหน่งของข้อมูล (สถิติ)Math and Brain @Bangbon3
 
ไฟฟ้าเคมี1 ppt
ไฟฟ้าเคมี1 pptไฟฟ้าเคมี1 ppt
ไฟฟ้าเคมี1 ppt10846
 
สูตรสถิติ
สูตรสถิติสูตรสถิติ
สูตรสถิติTaew Nantawan
 
แบบฝึกหัด เรื่อง สมการและอสมการพหุนาม ชุดที่ 2
แบบฝึกหัด เรื่อง สมการและอสมการพหุนาม ชุดที่ 2แบบฝึกหัด เรื่อง สมการและอสมการพหุนาม ชุดที่ 2
แบบฝึกหัด เรื่อง สมการและอสมการพหุนาม ชุดที่ 2คุณครูพี่อั๋น
 
บทที่ 4
บทที่ 4บทที่ 4
บทที่ 4Janova Kknd
 
ข้อสอบโอลิมปิก ม.ต้น(Ijso) เรื่องพหุนามและเศษส่วนของพหุนาม
ข้อสอบโอลิมปิก ม.ต้น(Ijso) เรื่องพหุนามและเศษส่วนของพหุนามข้อสอบโอลิมปิก ม.ต้น(Ijso) เรื่องพหุนามและเศษส่วนของพหุนาม
ข้อสอบโอลิมปิก ม.ต้น(Ijso) เรื่องพหุนามและเศษส่วนของพหุนามsawed kodnara
 
การพยากรณ์และการวางแผนทางการเงิน
การพยากรณ์และการวางแผนทางการเงินการพยากรณ์และการวางแผนทางการเงิน
การพยากรณ์และการวางแผนทางการเงินtumetr1
 
นำเสนอธนาคารขยะโรงเรียนบ้านห้วยยาง [โหมดความเข้ากันได้]
นำเสนอธนาคารขยะโรงเรียนบ้านห้วยยาง [โหมดความเข้ากันได้]นำเสนอธนาคารขยะโรงเรียนบ้านห้วยยาง [โหมดความเข้ากันได้]
นำเสนอธนาคารขยะโรงเรียนบ้านห้วยยาง [โหมดความเข้ากันได้]อบต. เหล่าโพนค้อ
 
เฉลยแคลคูลัส
เฉลยแคลคูลัสเฉลยแคลคูลัส
เฉลยแคลคูลัสkrurutsamee
 

What's hot (20)

เฉลยค่ากลางของข้อมูล
เฉลยค่ากลางของข้อมูลเฉลยค่ากลางของข้อมูล
เฉลยค่ากลางของข้อมูล
 
การวัดตำแหน่งที่และการกระจาย
การวัดตำแหน่งที่และการกระจายการวัดตำแหน่งที่และการกระจาย
การวัดตำแหน่งที่และการกระจาย
 
การวัดตำแหน่งที่ของข้อมูลม.6
การวัดตำแหน่งที่ของข้อมูลม.6การวัดตำแหน่งที่ของข้อมูลม.6
การวัดตำแหน่งที่ของข้อมูลม.6
 
สมการเชิงเส้นตัวแปรเดียว
สมการเชิงเส้นตัวแปรเดียวสมการเชิงเส้นตัวแปรเดียว
สมการเชิงเส้นตัวแปรเดียว
 
ชุดที่ 6
ชุดที่ 6 ชุดที่ 6
ชุดที่ 6
 
โครงสร้างข้อมูลแบบต้นไม้
โครงสร้างข้อมูลแบบต้นไม้โครงสร้างข้อมูลแบบต้นไม้
โครงสร้างข้อมูลแบบต้นไม้
 
แบบฝึกหัดการวัดตำแหน่งของข้อมูล (สถิติ)
แบบฝึกหัดการวัดตำแหน่งของข้อมูล (สถิติ)แบบฝึกหัดการวัดตำแหน่งของข้อมูล (สถิติ)
แบบฝึกหัดการวัดตำแหน่งของข้อมูล (สถิติ)
 
บทเรียน1 สถิติ
บทเรียน1  สถิติบทเรียน1  สถิติ
บทเรียน1 สถิติ
 
ไฟฟ้าเคมี1 ppt
ไฟฟ้าเคมี1 pptไฟฟ้าเคมี1 ppt
ไฟฟ้าเคมี1 ppt
 
สูตรสถิติ
สูตรสถิติสูตรสถิติ
สูตรสถิติ
 
แบบฝึกหัด เรื่อง สมการและอสมการพหุนาม ชุดที่ 2
แบบฝึกหัด เรื่อง สมการและอสมการพหุนาม ชุดที่ 2แบบฝึกหัด เรื่อง สมการและอสมการพหุนาม ชุดที่ 2
แบบฝึกหัด เรื่อง สมการและอสมการพหุนาม ชุดที่ 2
 
อนุกรมเรขาคณิต
อนุกรมเรขาคณิตอนุกรมเรขาคณิต
อนุกรมเรขาคณิต
 
บทที่ 4
บทที่ 4บทที่ 4
บทที่ 4
 
Math5
Math5Math5
Math5
 
สถิติ เบื้องต้น ตอนที่1
สถิติ เบื้องต้น ตอนที่1สถิติ เบื้องต้น ตอนที่1
สถิติ เบื้องต้น ตอนที่1
 
ข้อสอบโอลิมปิก ม.ต้น(Ijso) เรื่องพหุนามและเศษส่วนของพหุนาม
ข้อสอบโอลิมปิก ม.ต้น(Ijso) เรื่องพหุนามและเศษส่วนของพหุนามข้อสอบโอลิมปิก ม.ต้น(Ijso) เรื่องพหุนามและเศษส่วนของพหุนาม
ข้อสอบโอลิมปิก ม.ต้น(Ijso) เรื่องพหุนามและเศษส่วนของพหุนาม
 
69 การนับและความน่าจะเป็น ตอนที่4_ทฤษฎีบททวินาม
69 การนับและความน่าจะเป็น ตอนที่4_ทฤษฎีบททวินาม69 การนับและความน่าจะเป็น ตอนที่4_ทฤษฎีบททวินาม
69 การนับและความน่าจะเป็น ตอนที่4_ทฤษฎีบททวินาม
 
การพยากรณ์และการวางแผนทางการเงิน
การพยากรณ์และการวางแผนทางการเงินการพยากรณ์และการวางแผนทางการเงิน
การพยากรณ์และการวางแผนทางการเงิน
 
นำเสนอธนาคารขยะโรงเรียนบ้านห้วยยาง [โหมดความเข้ากันได้]
นำเสนอธนาคารขยะโรงเรียนบ้านห้วยยาง [โหมดความเข้ากันได้]นำเสนอธนาคารขยะโรงเรียนบ้านห้วยยาง [โหมดความเข้ากันได้]
นำเสนอธนาคารขยะโรงเรียนบ้านห้วยยาง [โหมดความเข้ากันได้]
 
เฉลยแคลคูลัส
เฉลยแคลคูลัสเฉลยแคลคูลัส
เฉลยแคลคูลัส
 

Similar to Simple linear regression and correlation

Simple linear regression and correlation
Simple linear regression and correlationSimple linear regression and correlation
Simple linear regression and correlationPhim Phimmat
 
คำตอบของระบบสมการเชิงเส้น
คำตอบของระบบสมการเชิงเส้นคำตอบของระบบสมการเชิงเส้น
คำตอบของระบบสมการเชิงเส้นChokchai Puatanachokchai
 
พื้นที่ใต้โค้ง
พื้นที่ใต้โค้งพื้นที่ใต้โค้ง
พื้นที่ใต้โค้งkrurutsamee
 
บทที่10.pdf
บทที่10.pdfบทที่10.pdf
บทที่10.pdfsewahec743
 
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้นการคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้นChokchai Puatanachokchai
 
Discrete-Chapter 09 Algorithms
Discrete-Chapter 09 AlgorithmsDiscrete-Chapter 09 Algorithms
Discrete-Chapter 09 AlgorithmsWongyos Keardsri
 
สรุปเนื้อหา O- net ม.6
สรุปเนื้อหา O- net ม.6 สรุปเนื้อหา O- net ม.6
สรุปเนื้อหา O- net ม.6 sensehaza
 
Pre 7 วิชา ครั้งที่ 1
Pre  7 วิชา ครั้งที่ 1Pre  7 วิชา ครั้งที่ 1
Pre 7 วิชา ครั้งที่ 1Wanutchai Janplung
 
สรุปตรีโกณมิติ
สรุปตรีโกณมิติสรุปตรีโกณมิติ
สรุปตรีโกณมิติThphmo
 
คณิตศาสตร์ม.34
คณิตศาสตร์ม.34คณิตศาสตร์ม.34
คณิตศาสตร์ม.34krookay2012
 
กฎของเลขยกกำลัง
กฎของเลขยกกำลังกฎของเลขยกกำลัง
กฎของเลขยกกำลังNiwat Namisa
 
ตัวกำหนด(Determinant)
ตัวกำหนด(Determinant)ตัวกำหนด(Determinant)
ตัวกำหนด(Determinant)kroojaja
 
Ch3 high order_od_es
Ch3 high order_od_esCh3 high order_od_es
Ch3 high order_od_esWk Kal
 
ข้อสอบ O net คณิต ม.3 ชุด 2
ข้อสอบ O net คณิต ม.3 ชุด 2ข้อสอบ O net คณิต ม.3 ชุด 2
ข้อสอบ O net คณิต ม.3 ชุด 2Manas Panjai
 
ขอสอบ O net-คณต_ม.3_ชด_2
ขอสอบ O net-คณต_ม.3_ชด_2ขอสอบ O net-คณต_ม.3_ชด_2
ขอสอบ O net-คณต_ม.3_ชด_2Anawat Supappornchai
 
ว เคราะห แบบทดสอบ 5 ข_อ
ว เคราะห แบบทดสอบ 5 ข_อว เคราะห แบบทดสอบ 5 ข_อ
ว เคราะห แบบทดสอบ 5 ข_อ4821010054
 

Similar to Simple linear regression and correlation (20)

Simple linear regression and correlation
Simple linear regression and correlationSimple linear regression and correlation
Simple linear regression and correlation
 
4339
43394339
4339
 
คำตอบของระบบสมการเชิงเส้น
คำตอบของระบบสมการเชิงเส้นคำตอบของระบบสมการเชิงเส้น
คำตอบของระบบสมการเชิงเส้น
 
พื้นที่ใต้โค้ง
พื้นที่ใต้โค้งพื้นที่ใต้โค้ง
พื้นที่ใต้โค้ง
 
บทที่10.pdf
บทที่10.pdfบทที่10.pdf
บทที่10.pdf
 
Pre 7-วิชา 3
Pre  7-วิชา 3Pre  7-วิชา 3
Pre 7-วิชา 3
 
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้นการคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น
การคำนวณปรับแก้ระบบสมการที่ไม่เป็นเชิงเส้น
 
ลอการิทึม
ลอการิทึมลอการิทึม
ลอการิทึม
 
Discrete-Chapter 09 Algorithms
Discrete-Chapter 09 AlgorithmsDiscrete-Chapter 09 Algorithms
Discrete-Chapter 09 Algorithms
 
สรุปเนื้อหา O- net ม.6
สรุปเนื้อหา O- net ม.6 สรุปเนื้อหา O- net ม.6
สรุปเนื้อหา O- net ม.6
 
Pre 7 วิชา ครั้งที่ 1
Pre  7 วิชา ครั้งที่ 1Pre  7 วิชา ครั้งที่ 1
Pre 7 วิชา ครั้งที่ 1
 
สรุปตรีโกณมิติ
สรุปตรีโกณมิติสรุปตรีโกณมิติ
สรุปตรีโกณมิติ
 
คณิตศาสตร์ม.34
คณิตศาสตร์ม.34คณิตศาสตร์ม.34
คณิตศาสตร์ม.34
 
กฎของเลขยกกำลัง
กฎของเลขยกกำลังกฎของเลขยกกำลัง
กฎของเลขยกกำลัง
 
ตัวกำหนด(Determinant)
ตัวกำหนด(Determinant)ตัวกำหนด(Determinant)
ตัวกำหนด(Determinant)
 
Ch3 high order_od_es
Ch3 high order_od_esCh3 high order_od_es
Ch3 high order_od_es
 
ข้อสอบ O net คณิต ม.3 ชุด 2
ข้อสอบ O net คณิต ม.3 ชุด 2ข้อสอบ O net คณิต ม.3 ชุด 2
ข้อสอบ O net คณิต ม.3 ชุด 2
 
ขอสอบ O net-คณต_ม.3_ชด_2
ขอสอบ O net-คณต_ม.3_ชด_2ขอสอบ O net-คณต_ม.3_ชด_2
ขอสอบ O net-คณต_ม.3_ชด_2
 
Epi info unit09
Epi info unit09Epi info unit09
Epi info unit09
 
ว เคราะห แบบทดสอบ 5 ข_อ
ว เคราะห แบบทดสอบ 5 ข_อว เคราะห แบบทดสอบ 5 ข_อ
ว เคราะห แบบทดสอบ 5 ข_อ
 

Simple linear regression and correlation

  • 3. การวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย (Simple linear regression analysis) 1. บทนา ตัวแปรอิสระ (Independent variable: x) และตัวแปรตาม (Dependent variable: y) การวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรสองตัว หรือมากกว่า -3- วิเคราะห์สหสัมพันธ์ (Correlation analysis) การวิเคราะห์ว่าตัวแปร 2 ตัวแปรใด ๆ มีความสัมพันธ์หรือไม่นั้น สามารถใช้วิธีการด้านสถิติ การวิเคราะห์ความถดถอย (Regression analysis) หาก 2 ตัวแปรมีความสัมพันธ์กัน พบว่าตัวแปร x มีผลต่อตัวแปร y หากศึกษาวิธีการนาตัวแปร x ใช้คาดคะเนผลที่อาจจะเกิดขึ้นได้ของตัวแปร y ด้วยวิธีการทางสถิติ การวิเคราะห์การถดถอยเชิงเส้น (Linear regression analysis) หากตัวแปรต่าง ๆ มีความสัมพันธ์กันในเชิงเส้นตรงจะ เรียกว่า
  • 4. 2. การถดถอยเชิงเส้นอย่างง่าย รูปที่ 1 แผนภาพการกระจายของการอัด(y) กับแรงดัน(x) ตัวอย่าง ในการพัฒนาวัสดุแผ่นฉนวนชนิดใหม่ ต้องการคาดคะเนการอัด (y: หน่วยเป็น 0.1 นิ้ว) ของแผ่นฉนวนหนา 2 นิ้ว ภายใต้แรงดัน (x: หน่วย เป็น 10 ปอนด์/ตารางนิ้ว) ในระดับต่างๆ โดยทาการทดสอบชิ้นงาน 5 ชิ้น ชิ้นงาน (Specimen) ความดัน (Pressure) การอัด (Compression) 1 1 1 2 2 1 3 3 2 4 4 2 5 5 4 ตารางที่ 1 ข้อมูลการทดสอบวัสดุแผ่นฉนวน การศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระ (x) และตัว แปรตาม (y) โดยจะศึกษาตัวแปรอิสระเพียงตัวเดียวที่มีผล ต่อตัวแปรตาม ใช้แผนภาพการกระจาย ในการวิเคราะห์ความสัมพันธ์ ความสัมพันธ์ของ 2 แปร และบนแผนภาพการกระจาย แรงดัน (ตัวแปรอิสระ: x) การอัด (ตัวแปรตาม: y) -4-
  • 5. 2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ) ตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย (Simple linear regression model) โดย ตัวแบบแสดงดังสมการ 0 1y x     y x = ตัวแปรตาม (Dependent variable) = ตัวแปรอิสระ (Independentvariable) = ค่าความคลาดเคลื่อนสุ่ม (Random error) = จุดตัดแกนบน y (y-intercept) = ความชัน (Slope)  0 1 และ เป็นค่าพารามิเตอร์ที่ไม่ทราบค่า เรียกว่า สัมประสิทธิ์การถดถอย (Regression coefficient) 0 1เมื่อ -5-
  • 6. 04 ความคลาดเคลื่อนกระจายตัวแบบอิสระ ปราศจากอิทธิพลใดๆ 2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ) สมมติฐานเฉพาะเกี่ยวกับความคลาดเคลื่อน: ( ) 01 การแจกแจงความน่าจะเป็นค่าเฉลี่ยของความ คลาดเคลื่อนเท่ากับศูนย์นั้นคือ ค่าเฉลี่ยของ ความคลาดเคลื่อนเท่ากับศูนย์ ( ) 0E   02 ความแปรปรวนการแจกแจงความน่าจะเป็น คลาดเคลื่อนของตัวแปรอิสระ (x) นั้นมีค่าคงที่ ทั้งหมด หมายความว่าความแปรปรวนของความ คลาดเคลื่อนสุ่มมีค่าคงที่เท่ากับ 2 ( )V   2  03 ค่าความคลาดเคลื่อน มีการแจกแจงความ น่าจะแบบปกติ ~ N -6-
  • 7. 2. การถดถอยเชิงเส้นอย่างง่าย (ต่อ) รูปที่ 2 เส้นสมมติของ 0 1(y)E x   เมื่อ x เพิ่มขึ้น 1 หน่วย y จะเปลี่ยนไป หน่วย1 ซึ่งในความเป็นจริงค่า , และ ไม่สามารถระบุค่าได้จึงต้องทาการประมาณ จากข้อมูลตัวอย่าง 1 0 2  0 1(y)E x   เมื่อ ค่าเฉลี่ยของเส้นถดถอย อยู่ในรูป ( ) 0E   -7-
  • 8. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด รูปที่ 3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย 3.1 การประมาณค่าจุดตัด และความชัน ( และ )0 1 เส้นที่เหมาะสม (Best-fitting line) ประมาณค่า ( และ ) วิธีกาลังสองน้อยที่สุด (Method of least squares) 0 1 ค่าผลรวมของผลต่าง ระหว่าง ค่าของข้อมูลจริงกับเส้นสมมติ มีค่าน้อยที่สุด -8-
  • 9. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ) 2 2 0 1 1 1 ( ) n n i i i i i L y x          ค่าความคลาดเคลื่อน นั้นสามารถเป็นได้ทั้งค่าบวกและค่า ลบ จึงต้องทาให้อยู่ในรูปผลรวมกาลังสองของความ คลาดเคลื่อน (Sum of squaresfor error: L ) 0 1 0 1 1ˆ ˆ0 , ˆ ˆ2 ( ) 0 n i i i L y x               0 1 0 1 1ˆ ˆ1 , ˆ ˆ2 ( ) 0 n i i i i L y x x               การประมาณค่า และ เขียนแทนด้วย และ โดยวิธีกาลังสองน้อยที่สุด ด้วยการหาค่าอนุพันธ์เชิงส่วน เทียบกับ และ แล้วกาหนดให้สมการเท่ากับศูนย์ 0 1 1 ˆ0 ˆ 0 1 สามารถคานวณหาค่าจุดตัดแกนและความชัน ได้ดังนี้ 0 1 ˆ ˆy x   (1) 1 1 1 1 2 2 1 1 ˆ n n i in i i i i i n in i i i y x y x n x x n                            (2) 0 1 1 1 ˆ ˆ n n i i i i n x y       2 0 1 1 1 1 ˆ ˆ n n n i i i i i i i x x y x         เมื่อจัดรูปสมการทั้งสองใหม่จะได้รูปสมการปกติ คือ -9-
  • 10. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ) ดังนั้น เส้นประมาณการถดถอยที่เหมาะสม คือจากสมการหาความชัน นาแสดงใหม่โดยใช้ สัญลักษณ์แทนได้ดังนี้ 1 ˆ( ) 2 12 2 1 1 ( ) n in n i xx i i i i i x S x x x n                1 1 1 1 ( )( ) n n i in n i i xy i i i i i i x y S y y x x x y n                      1 ˆ xy xx S S   (3) 0 1 ˆ ˆˆ iy x   (4) สาหรับ แต่ละคู่ลาดับของข้อมูล(x, y) ที่ได้จากการ สังเกตจริง แสดงดังสมการต่อไปนี้ 0 1 ˆ ˆˆi i iy x e    i = 1,2,…,n โดยที่ เรียกว่า ค่าเรสซิดวล (Residual) หรือค่าความคลาดเคลื่อน ˆi ie y y  -10-
  • 11. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ) 3.2 การประมาณค่าความแปรปรวน: 2  รูปที่ 4 ตัวอย่างความแปรปรวนของข้อมูล การประมาณค่าความแปรปรวนโดยที่เรสซิดวล ถูกใช้เพื่อให้ได้ค่าประมาณ ซึ่งค่าเรสซิดวลจะมีค่าเป็นไปได้ทั้งบวกและลบ จึงต้องกาหนดค่าให้อยู่ในรูปของ ผลรวมกาลังสองของเรสซิดวล (Error sum of squares: ) 2 1 n E i i SS e    2 1 ˆ( ) n i i y y    โดยองศาอิสระ (Degrees of freedom) คือ ค่าเฉลี่ยของผลรวมกาลังสองของเรสซิดวล คือ 2 ˆ( ) ( 2)EE SS n   ดังนั้น ค่าประมาณความแปรปรวนของเรสซิดวลที่ไม่เอนเอียง คือ ESS 2  2n  2 2 ˆ 2 E E SS MS S n      (5) 2 ˆ 2 ˆ สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมน้อย สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมมาก -11-
  • 12. ตัวอย่าง ตัวอย่างที่ 1 โรงงานผลิตกระดาษเพื่อใช้ทากล่องบรรจุชิ้นงานด้านอุตสาหกรรม ทาการศึกษาข้อมูลระหว่าง ค่าความต้านทานต่อการ ฉีกขาดของกระดาษ (y: หน่วยเป็น 10 นิวตัน/ตารางมิลลิเมตร) กับเปอร์เซ็นต์ของกาวอัด (x) ที่ใช้เป็นส่วนผสมในการผลิตกระดาษ โดยสุ่มเก็บรวบรวมข้อมูล มา 10 ตัวอย่างดังนี้คือ ตัวอย่างที่ 1 2 3 4 5 6 7 8 9 10 x 1.6 1.5 1.5 1.4 2.0 2.0 2.2 2.4 2.5 2.5 y 10.1 11.7 11.7 11.5 13.1 13.2 14.2 14.0 13.7 14.1 จากข้อมูลข้างต้น หากต้องการทราบความสัมพันธ์ระหว่างกับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิต กระดาษ กับความต้านทานต่อการฉีกขาดของกระดาษ จะทาการพิจารณาตัวแบบเชิงเส้นอย่างง่ายดังต่อไปนี้ 0 1y x     โดยที่ x = เปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ (ตัวแปรอิสระ) y = ค่าความต้านทานต่อการฉีกขาดของกระดาษ (ตัวแปรตาม) -12-
  • 13. ตัวอย่าง (ต่อ) รูปที่ 5 แผนภาพการกระจายของค่าความต้านทานต่อการฉีกขาดของกระดาษ(y) กับเปอร์เซ็นต์กาวอัด (x) เมื่อ x มีค่าสูงขึ้น y จะมีค่าสูงขึ้นด้วย การใช้ค่าของข้อมูลวิเคราะห์ความสัมพันธ์ของตัวแปรต้นและตัว แปรตาม ซึ่งมีข้อมูลดังต่อไปนี้ 10n  10 1 19.60i i x   10 1 127.30i i y   10 1 254.30i i i y x   10 2 1 40.12i i x   10 2 1 1638.03 i y   1.96x 12.73y  คานวณค่าสัมประสิทธิ์ของสมการถดถอยเชิงเส้นอย่างง่าย   210 2 10 12 1 19.60 40.12 1.704 10 i i xx i i x S x n                  10 10 10 1 1 1 19.60 127.30 254.3 4.7 10 0 92 i i i i xy i i i x y S x y n                    ค่าความชัน และค่าจุดตัด 1 4.792ˆ 2.812 1.704 xy xx S S     0 1 ˆ ˆ 12.73 (2.812 1.96) 7.218y x       -13-
  • 14. ตัวอย่าง (ต่อ) รูปที่ 6 พล็อตของสมการถดถอยเชิงเส้นของตัวอย่างที่ 1 จากสมการถดถอยที่ได้อธิบายได้ว่า เมื่อ จะได้ หมายความว่าถ้าไม่มี อิทธิพลของกาวอัดเลย ค่าความต้านทานต่อการฉีกขาด ของกระดาษจะเท่ากับ 72. 18 นิวตันต่อตารางมิลลิเมตร (เนื่องจากหน่วยของค่าความต้านทานในตัวอย่างที่ 1 เท่ากับ 10 นิวตันต่อตารางมิลลิเมตร ดังนั้น ˆ 7.218 2.812y x  ดังนั้น สมการถดถอยเชิงเส้นอย่างง่ายที่ประมาณได้ 0x  ˆ 7.218 2.812(0) 7.218y    7.218 10 72.18  -14-
  • 15. ตัวอย่าง (ต่อ) ตัวอย่างที่ x y 1 1.60 10.10 11.72 -1.62 2.62 2 1.50 11.70 11.44 0.26 0.07 3 1.50 11.70 11.44 0.26 0.07 4 1.40 11.50 11.16 0.34 0.12 5 2.00 13.10 12.84 0.26 0.07 6 2.00 13.20 12.84 0.36 0.13 7 2.20 14.20 13.40 0.80 0.63 8 2.40 14.00 13.97 0.03 0.00 9 2.50 13.70 14.25 -0.55 0.30 10 2.50 14.10 14.25 -0.15 0.02 ผลรวม 19.60 127.30 127.30 0.00 4.02 ieˆiy 2 ie ตารางที่ 2 ข้อมูลความคลาดเคลื่อนที่เกิดขึ้นจากตัวแบบและค่าสังเกตจากตัวอย่าง ค่าความต้านทานต่อการฉีกขาดของกระดาษ แสดงดังนี้ ค่าประมาณความแปรปรวนของเรสซิดวล 2 2 2 1 (4.02) ˆ 0.503 2 10 2 n i i e n         สามารถคานวณได้ดังนี้ -15-
  • 16. ดังนั้น และ คือค่าประมาณที่ไม่เอนเอียงในตัวแบบการถดถอยเชิงเส้น 4. คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด ( ) 0E   2 ( )V   คุณสมบัติทางสถิติของค่าประมาณพารามิเตอร์ และ ของตัวแบบความสัมพันธ์เชิงเส้นด้วยวิธีกาลังสองน้อยที่สุด อธิบายได้ จากข้อสมมติฐานของความคลาดเคลื่อน 0 1  1 1 ˆE   ค่าเฉลี่ยของความชันและจุดตัด คือ ค่าความแปรปรวนความชันและจุดตัด คือ   2 1 ˆ xx V S     0 0 ˆE     2 2 0 1ˆ xx x V n S          ประมาณการความแปรปรวนของความชันและ จุดตัด ผลจากการคานวณหารากที่สองของความแปรปรวน เรียกว่า ความคลาดเคลื่อนมาตรฐานโดยประมาณ (Estimated standard error) ของความชันและจุดตัด หาได้จาก โดยที่ค่าความคลาดเคลื่อนมาตรฐานโดยประมาณเป็นค่าที่ ใช้ในการวัดความถูกต้องแม่นยาของการประมาณค่าสัมประสิทธิ์ ตัวแบบความสัมพันธ์ด้วยวิธีกาลังสองน้อยที่สุด นั่นคือค่าความ คลาดเคลื่อนยิ่งน้อยยิ่งดีนั่นเอง1 ˆ 0 ˆ   2 1 ˆˆ xx se S    (6)   2 2 0 1ˆ ˆ xx x se n S    (7) -16-
  • 17. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น 5.1 การทดสอบสมมติฐานโดยการใช้ t-Test การทดสอบสมมติฐานว่าความชัน เท่ากับค่าคงที่ สมมติฐานคือ โดยที่ ตัวสถิติทดสอบความชัน ใช้การทดสอบแบบที 0 1 1,0:H   1 1 1,0:H   ซึ่งการแจกแจงแบบทีด้วยองศาอิสระ จะปฏิเสธสมมติฐานหลัก เมื่อ 0 2, 2nt t  2n การวิเคราะห์ความเหมาะสมของตัวแบบถดถอยเชิงเส้นต้องทาการทดสอบสมมติฐานทางสถิติของค่าความชันและจุดตัดก่อนนาไปใช้ โดยมีข้อสมมติฐานคือ ความคลาดเคลื่อนกระจายตัวแบบอิสระ, , และ~ N ( ) 0E   2 ( )V   -17-   1 1,0 1 1,0 0 2 1 ˆ ˆ ˆˆ xx T seS          (8) 0 2, 2nt t  การทดสอบสมมติฐานของจุดตัด ปฏิเสธสมมติฐานหลักเมื่อ   0 0,0 0 0,0 0 2 02 ˆ ˆ ˆ1 ˆ xx T sex n S                 (9)
  • 18. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ) 5.1 การทดสอบสมมติฐานโดยการใช้ t-Test 0 1: 0H   1 1: 0H   โดยการทดสอบสมมติฐานนั้นมีความสาคัญ เนื่องเป็นการทดสอบเพื่อศึกษานัยสาคัญของความสัมพันธ์มีสมมติฐานคือ (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) รูปที่ 7 ไม่ปฏิเสธสมมติฐานหลัก (ไม่มีความสัมพันธ์ระหว่าง x และ y)0 1: 0H   รูปที่ 8 ปฏิเสธสมมติฐานหลัก (มีความสัมพันธ์ระหว่าง x และ y) ค่าแปรปรวนน้อย ค่าแปรปรวนของข้อมูลมาก 0 1: 0H   ดังนั้น การปฏิเสธสมมติฐานหลัก อาจหมายถึงว่ารูปแบบความสัมพันธ์เชิงตรงนั้นมีความเหมาะสม ดังรูปที่ 8 (a) -18-
  • 19. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ) 5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน เป็นการวิเคราะห์ความแปรปรวนที่ใช้เพื่อทดสอบนัยสาคัญของการ ถดถอย ซึ่งการวิเคราะห์ความแปรปรวนมีดังนี้ 2 2 2 1 1 1 ˆ ˆ( ) ( ) ( ) n n n i i i i i i i y y y y y y           2 1 ˆ( ) n R i i SS y y    2 1 ˆ( ) n E i i i SS y y    ผลรวมกาลังสองของความคลาดเคลื่อนจากการถดถอย (Regression sum of squares) ผลรวมกาลังสองของความคลาดเคลื่อน (Error sum of squares) เขียนสมการใหม่ได้ว่า โดยที่ 2 1 ( ) n T i i SS y y    2 12 1 n in i i i y y n            -19- T R ESS SS SS  (10) 1 ˆ R xySS S (11) E T RSS SS SS  (12)
  • 20. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ) 5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน ตัวสถิติที่ใช้ในการทดสอบ คือ 0 1 ( 2) R R E E SS MS F SS n MS    ซึ่งการแจกแจงแบบเอฟ ด้วยองศาอิสระ จะปฏิเสธสมมติฐานหลัก ถ้า พบว่าค่าสถิติเอฟ ที่ได้จากการคานวณมากกว่าค่าที่เกิดจากการเปิดตารางเอฟ 2n 0 ,1, 2nF f  แหล่งที่มา (Source of variation) ผลบวกกาลังสอง (Sum of Squares) องศาอิสระ (Degrees of Freedom) ค่าเฉลี่ย (Mean Square) ค่าสถิติ 0( )F ตัวแบบ (Regression) RSS 1 RMS 0 R EF MS MS ค่าความคลาดเคลื่อน (Error) ESS 2n  EMS ทั้งหมด (Total) TSS 1n  ตารางที่ 3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย -20- (13)
  • 21. ตัวอย่าง ตัวอย่างที่ 2 จากตัวอย่างที่ 1 ทดสอบสมมติฐานว่าความสัมพันธ์ของความต้านทานต่อการฉีกขาดของกระดาษกับเปอร์เซ็นต์ของกาวอัดที่ใช้ เป็นส่วนผสมในการผลิตกระดาษเป็นแบบเชิงเส้นที่ระดับนัยสาคัญ 5% หรือไม่ สมการถดถอยเชิงเส้นอย่างง่ายที่ได้จากตัวอย่างที่ 1 คือ ˆ 7.218 2.812y x  การทดสอบสมมติฐานโดยการใช้ t-Test 10n  1 ˆ 2.812  1.704xxS  2 ˆ 0.503  สมมติฐาน 0 1: 0H   1 1: 0H   (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) 0.05  2 1 1,0 0 ˆ ˆ 0 2.812 5.176 0.503 1.704 ˆ xx T S         ตัวสถิติทดสอบ ปฏิเสธ ถ้า0H 0 0.025,8 2.306T t  0.0250.025 0.025,8 2.306t   0.025,8 2.306t  สรุป เนื่องจาก ดังนั้น ปฏิเสธ ที่ระดับนัยสาคัญ 0.05 มีหลักฐานแสดงว่า ค่าความต้านทานต่อการฉีก ขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่ใช้ เป็นส่วนผสมในการผลิตกระดาษ 0 0.025,8( 5.176) 2.306T t   0 1: 0H   -21-
  • 22. 0.05 0.05,1,8 5.32f  ตัวอย่าง (ต่อ) ทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน 10n  10 1 127.30i i y   10 2 1 1638.03 i y   12.73y  ˆ 127.3iy  1 ˆ 2.812  4.792xyS  สมมติฐาน 0 1: 0H   1 1: 0H   (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) 0.05  2 1 ˆ( ) 4.02 n E i i i SS y y     1 ˆ 2.812 4.792 13.475R xySS S    2 2 12 1 127.3 1638.03 17.501 10 n in i T i i y SS y n               13.475 13.475 1 1 R R SS MS    4.02 0.503 ( 2) 10 2 E E SS MS n      0 13.475 26.78 0.5025 R E MS F MS    0 ,1, 2nF f ปฏิเสธ ถ้า0H 0 0.05,1,8( 5.32)F f  -22-
  • 23. แหล่งที่มา (Source of variation) ผลบวกกาลังสอง (Sum of Squares) องศาอิสระ (Degrees of Freedom) ค่าเฉลี่ย (Mean Square) ค่าสถิติ 0( )F ตัวแบบ (Regression) 13.475 1 13.475 26.78 ค่าความคลาดเคลื่อน (Error) 4.020 8 0.503 ทั้งหมด (Total) 17.501 9 ตัวอย่าง (ต่อ) สรุป เนื่องจาก ดังนั้นปฏิเสธ ที่ระดับนัยสาคัญ 0.05 มี หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาว อัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ 0 0.05,1,8( 26.78) ( 5.32)F f   0 1: 0H   -23-
  • 24. สมการถดถอยสามารถพยากรณ์ค่าของตัวแปรตาม (Y) ได้ดีมากยิ่งขึ้น สมการถดถอยพยากรณ์ค่าของตัวแปรตาม (Y) ได้ไม่ดี (เนื่องจากตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันน้อย) 6. ค่าสัมประสิทธิ์การตัดสินใจ สมการถดถอยที่ใช้ในการพยากรณ์นี้อาจพยากรณ์ค่าตัวแปรตาม (Y) ได้ดีหรือไม่ดีก็ได้ โดยที่ ค่าสัมประสิทธิ์การตัดสินใจ (Coefficient of Determination; ) เป็นค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y ซึ่งค่าสัมประสิทธิ์การตัดสินใจนี้เป็น ค่าที่ใช้บอกเปอร์เซ็นต์การเปลี่ยนแปลงของตัวแปรตาม (Y) ที่สามารถอธิบายได้ด้วยตัวแปรอิสระ (X) ในสมการถดถอย 2 R 2 2 1 1 ˆ ˆ XX XY R T T T S S SS R SS SS SS     โดยที่ ค่า จะมีค่าอยู่ระหว่าง 0 ถึง 12 R ค่าสัมประสิทธิ์การตัดสินใจ: 2 R 2 R 2 R (14) -24-
  • 25. ตัวอย่าง ตัวอย่างที่ 3 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้ คือ คานวณค่าสัมประสิทธิ์ของการตัดสินใจ จากมูลในตัวอย่างที่ 2 ได้ค่าต่าง ๆ ดังนี้ และ ˆ 7.218 2.812y x  13.475RSS  17.501TSS  2 13.475 0.77 17.501 R T SS R SS    สรุปได้ว่า ค่า หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษขึ้นอยู่กับเปอร์เซ็นต์ ของกาวอัดประมาณ 77% ส่วนอีก 23% จะขึ้นอยู่กับปัจจัยอื่น ๆ ที่ไม่ได้นามาศึกษาหรือสมการถดถอย สามารถพยากรณ์ค่าค่าความต้านทานต่อการฉีกขาดของกระดาษได้ถูกต้อง 77% 2 0.77R  ˆ 7.218 2.812y x  -25-
  • 26. 7. สหสัมพันธ์ สมมติว่า การแจกแจงร่วมของ และ เป็นการแจกแจงแบบปกติของสองตัวแปรสุ่ม (Bivariatenormal distribution) โดยมีค่าเฉลี่ยของตัวแปรคือ และ ความแปรปรวนของตัวแปรคือ และ และกาหนดให้ คือสัมประสิทธิ์ สหสัมพันธ์ระหว่างตัวแปร X และ Y ได้ว่า iX iY X Y 2 X 2 Y  • สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม • ใช้สาหรับการทดสอบความสัมพันธ์เชิงเส้นตรง • สามารถระบุระดับความสัมพันธ์ได้ เช่น สูงกับน้าหนักว่ามีความสัมพันธ์กันมากหรือน้อย • สามารถระบุทิศทางความสัมพันธ์ได้ เช่น สูงกับน้าหนักมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้าม • ตรวจสอบด้วยการใช้แผนภาพการกระจายและค่าสัมประสิทธิ์สหสัมพันธ์ (correlation coefficient) การวิเคราะห์สหสัมพันธ์ XY X Y      โดยที่ คือความแปรปรวนร่วมระหว่าง X และ YXY -26-
  • 27. 7. สหสัมพันธ์ (ต่อ) 1 1 2 1 2 2 2 1 1 ( ) ˆ ( SS ) ( ) (Y ) n i i i XY n n XX T i i i i Y X X S R S X X Y                   โดยการประมาณของสัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Sample Correlation Coefficient: R) 1. ค่าของ R ไม่ได้ขึ้นอยู่กับการศึกษาภายใต้ตัวแปรสองตัว 2. ค่า R เป็นอิสระจากการตรวจวัดของ x และ y 3. ค่า R จะ มีค่าอยู่ในช่วง 4. R = 1 เมื่อ x มีค่ามาก y มีค่ามาก หรือเมื่อ x มีค่าน้อย y มีค่าน้อย (มีความสัมพันธ์เชิงเส้นเชิงบวก) R = -1 เมื่อ x มีค่ามาก y มีค่าน้อย หรือเมื่อ x มีค่าน้อย y มีค่ามาก (มีความสัมพันธ์เชิงเส้นเชิงลบ) 5. ค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าค่าสัมประสิทธิ์การตัดสินใจ: คุณสมบัติที่สาคัญที่สุดของ R คือ: 1 1R   2 R -27- (15)
  • 28. 7. สหสัมพันธ์ (ต่อ) รูปที่ 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R ซึ่งการตรวจสอบความสัมพันธ์ ทาการตรวจสอบโดย แผนภาพกระจายข้อมูล รูปที่ 9 แสดงสถานการณ์ที่เป็นไปได้ สาหรับค่าของ R •รูปที่ 9 (a) R>1 ความสัมพันธ์เชิงเส้น มีความชันเป็นบวก •รูปที่ 9 (b) R<1 ความสัมพันธ์เชิงเส้น มีความชันเป็นลบ •รูปที่ 9 (c) R=0 ไม่เป็นความสัมพันธ์เชิงเส้นโค้ง •รูปที่ 9 (d) R=0 แสดงให้เห็นความสัมพันธ์ระหว่าง x และ y ซึ่งเป็นความสัมพันธ์เชิงเส้นโค้ง จะเห็นได้ว่า R=0 จะไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y ดังนั้น การพิจารณาข้อมูลด้วยแผนภาพการกระจายจึงเป็นสิ่งที่ มีความสาคัญ -28-
  • 29. ตัวอย่าง ตัวอย่างที่ 4 จงหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ กาวอัด จากข้อมูลในตัวอย่างที่ 1 และ2 ได้ค่าต่าง ๆ ดังนี้ 1 2 1 2 4.792 ˆ 0.878 ( SS ) (1.704 17.501) XY XX T S R S       ดังนั้น ค่า R=0.878 นี้หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ของกาวอัด มีความสัมพันธ์กันสูงประมาณ 87. 8% และเนื่องจากค่า R เป็นบวกจะแสดงว่ามีความสัมพันธ์กันในทิศทาง เดียวกัน คือถ้าเปอร์เซ็นต์กาวอัดมีค่าสูงค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะสูงตามไปด้วยและ ในทางตรงกันข้ามถ้าเปอร์เซ็นต์กาวอัดมีค่าต่าค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะต่าตามไปด้วย 4.792xyS  1.704xxS  17.501TSS  -29-
  • 30. สรุป -30- สหสัมพันธ์ (Correlation) การถดถอยเชิงเส้นอย่างง่าย (Simple linear regression) จุดมุ่งหมาย การศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม หาเส้นที่เหมาะสมที่สุดในการทานาย Y ตัวแปร2ตัว ไม่คานึงถึงปัจจัยสาเหตุและผลกระทบ Xเป็นสาเหตุ และYให้เป็นผลกระทบ ตรวจสอบ ค่าสัมประสิทธิ์สหสัมพันธ์ (มีค่าอยู่ในช่วง -1 ถึง 1) ค่าสัมประสิทธิ์การตัดสินใจ (มีค่าอยู่ระหว่าง 0 ถึง 1)
  • 31. 8. ตัวอย่างงานวิจัย Title: Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model Authors:Yan-ming YANG, Yue TENG and Rui-li ZHANG 1.วัตถุประสงค์ของการวิจัย การพยากรณ์ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินเป็นสิ่งที่มีความสาคัญ และช่วย ในการตัดสินใจการใช้ประโยชน์จากทรัพยากรที่มีอยู่เพื่อปรับปรุงความสามารถในการบารุงรักษา ใน งานวิจัยนี้มุ่งเน้นไปที่ปัจจัยหลักที่มีอิทธิพลต่อการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน โดยใช้ แบบจาลองการทานายถดถอยเชิงเส้นของการใช้วัสดุในการบารุงรักษาอุปกรณ์ สร้างขึ้นโดยใช้ข้อมูล ตัวอย่างที่เกิดขึ้นจริง บนพื้นฐานการวิเคราะห์จากตัวอย่าง วิธีการถดถอยเชิงเส้นอย่างง่ายใช้ในการ ทานาย และการทดสอบการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน -31-
  • 32. 8. ตัวอย่างงานวิจัย (ต่อ) 2.ขั้นตอนการวิจัย 2.1 เก็บสถิติข้อมูล เก็บสถิติข้อมูลรายเดือนของชั่วโมงการบิน แสดงดังในตารางที่ 4 และข้อมูลของการใช้วัสดุในการ บารุงรักษา แสดงดังในตารางที่ 5 ในปี ค.ศ. 2015-2016 เป็นเวลาสองปี สร้างแบบจาลองการถดถอยเชิงเส้นอย่าง ง่าย เพื่อทานายปริมาณการใช้วัสดุในการบารุงรักษา ตารางที่ 4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016 ตารางที่ 5 ปริมาณการใช้วัสดุบารุงรักษาเครื่องบินในปี ค.ศ. 2015-2016 -32-
  • 33. 2.2 แบบจาลองการถดถอย งานวิจัยนี้เลือกแบบจาลองการถดถอยเชิงเส้นอย่างง่ายที่อยู่บนพื้นฐานการประมาณความสัมพันธ์เชิงเส้น ระหว่างตัวแปรอิสระ และตัวแปรตาม สร้างสมการเชิงเส้นเพื่อทานาย ตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย คือ y a bx  โดยกาหนดให้ y คือ ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน (ตัวแปรตาม) x คือ ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ) a คือ จุดตัดแกนบน y (สัมประสิทธิ์การถดถอย) b คือ ความชัน (สัมประสิทธิ์การถดถอย) โดยการประมาณค่าสัมประสิทธิ์การถดถอย (a, b) และทาการทดสอบแบบจาลองการถดถอยโดยการทดสอบการ ประมาณค่าความแปรปรวน และการทดสอบสัมประสิทธิ์สหสัมพันธ์โดยใช้ระดับนัยสาคัญ 0.05 ในการตรวจสอบ 8. ตัวอย่างงานวิจัย (ต่อ) -33-
  • 34. 8. ตัวอย่างงานวิจัย (ต่อ) 3. ผลการวิจัย ใช้ซอฟต์แวร์ Minitab ในการวิเคราะห์การถดถอย แสดงดังรูปที่ 10 สมการถดถอยเชิงเส้นอย่างง่ายที่ ได้คือ 4.173 0.09901y x  รูปที่ 10 พล็อตเส้นถดถอยของสายชั่วโมงของเครื่องบิน และปริมาณการใช้วัสดุในการบารุงรักษาหลัก -34-
  • 35. 8. ตัวอย่างงานวิจัย (ต่อ) 3.1 การทดสอบนัยสาคัญของสมการถดถอย การวิเคราะห์ผลในตาราง ANOVA ตารางที่ 5 การวิเคราะห์ผล ในตาราง ANOVA กาหนดระดับนัยสาคัญที่ 0.05 หรือที่ระดับความเชื่อมั่น 95 % โดยในงานวิจัยนี้ได้ใช้โปรแกรม Mimitab ช่วยในการวิเคราะห์ จึงใช้ค่า P-value เป็นตัวช่วยในการตัดสินใจ เพราะค่า P-value คือระดับนัยสาคัญที่ น้อยที่สุดหรือโอกาสที่น้อยที่สุดที่จะสามารถปฎิเสธสมมติฐานหลัก จะเห็นได้ว่าค่า เนื่องจาก ดังนั้น ปัจจัยอื่นๆ ไม่มีผลกระทบต่อปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน อย่างมี นัยสาคัญ สมการการถดถอยโดยรวมจึงมีประสิทธิภาพอย่างมาก ตารางที่ 5 การวิเคราะห์ความแปรปรวน 0.000P  ( 0.05) ( 0.00)P    -35-
  • 36. 8. ตัวอย่างงานวิจัย (ต่อ) 3.2 การวัดของผลรวมของผลกระทบสมการการถดถอย ตารางที่ 6 R-Sq คือ 91.24% แสดงให้เห็นว่า ปริมาณ การใช้วัสดุในการบารุงรักษาเครื่องบินขึ้นอยู่กับชั่วโมงการบิน ประมาณ 91.24% ส่วนอีก 8.76% จะขึ้นอยู่กับปัจจัย อื่น ๆ ดังนั้นเส้นถดถอยสามารถอธิบายความสัมพันธ์เชิงเส้นได้ 91.24% สามารถพยากรณ์การใช้วัสดุในการ บารุงรักษาเครื่องบิน (y) ได้ถูกต้อง 91.24% ดังนั้นการตัวแบบถดถอยที่ได้ จึงให้ผลที่ดี ตารางที่ 6 สรุปผลของแบบจาลองถดถอย -36-
  • 37. 8. ตัวอย่างงานวิจัย (ต่อ) สมมติฐาน 0 1: 0H   1 1: 0H  (ไม่มีความสัมพันธ์ระหว่าง x และ y) (มีความสัมพันธ์ระหว่าง x และ y) 0.05  3.3 การทดสอบนัยสาคัญของสัมประสิทธิ์การถดถอย ตารางที่ 7 แสดงให้เห็นว่า สัมประสิทธิ์ชั่วโมงบินของ เครื่องบิน (ตัวแปรอิสระ x) โดยเกณฑ์ในการปฏิเสธสมมติฐานหลัก โดยใช้ค่าพี คือ จะปฎิเสธ เมื่อระดับ นัยสาคัญมากกว่าเท่ากับค่าพี P Value   0H ตารางที่ 7 สัมประสิทธิ์ ในตารางที่ 7 จะเห็นได้ว่า เนื่องจาก ดังนั้นปฏิเสธ แสดงว่า ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบินมีความสัมพันธ์เชิงเส้นกับชั่วโมงบินของเครื่องบิน ซึ่งบ่งชี้ว่าชั่วโมงบิน ของเครื่องบินเป็นปัจจัยที่มีนัยสาคัญ 0.000P  ( 0.05) ( 0.00)P    0 1: 0H   4.173 0.09901y x  -37-
  • 38. 8. ตัวอย่างงานวิจัย (ต่อ) 3.4 การวิเคราะห์เรสซิดวล เพื่อตรวจสอบความเหมาะสมของตัวแบบถดถอยและANOVA การตรวจสอบพล็อตจะช่วยให้ ทราบว่า ข้อสมมติกาลังสองน้อยที่สุดเป็นไปตามเงื่อนไขหรือไม่ หากสมมติฐานเป็นไปตามเงื่อนไข จากนั้นการถดถอยกาลัง สองน้อยสุด จะประมาณค่าสัมประสิทธิ์ที่ไม่เอนเอียงที่มีความแปรปรวนน้อยที่สุด ใช้ Minitab พล็อตเรสซิดวล (ดังแสดงในรูป ที่ 11) รูปที่ 11 พล็อตเรสซิดวลของชั่วโมงบินเครื่องบินและการใช้วัสดุในการบารุงรักษาหลัก -38- • เรสซิดวลแปรผันแบบสุ่ม และเป็นอิสระจากกัน • รูปที่ 11 (ขวา) เรสซิดวลมีความแปรปรวนคงที่ • รูปที่ 11 (ซ้าย) เรสซิดวลมีการแจกแจงแบบปกติ
  • 39. 8. ตัวอย่างงานวิจัย (ต่อ) 4. สรุปผลการวิจัย ดังนั้นงานวิจัยนี้ได้นาวิธีการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย ในการพยากรณ์ของปริมาณการใช้วัสดุใน การบารุงรักษาอุปกรณ์การบิน พบว่า ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินกับชั่วการบินของ เครื่องบินมีความสัมพันธ์เชิงเส้นกันที่ระดับความเชื่อมั่น 95 % และสามารถนาสมการถดถอยที่ได้ไปพยากรณ์การ ใช้วัสดุในการบารุงรักษาเครื่องบินได้ถูกต้อง 91.24% คาดคะเนได้อย่างที่มีประสิทธิภาพ -39-
  • 40. 1. Mendenhall, W. M., & Sincich, T. L. (2016). Statistics for Engineering and the Sciences. Chapman and Hall/CRC. 2. Montgomery, D. C., & Runger, G. C. (2014). Applied statistics and probability for engineers. John Wiley and Sons. 3. Devore, J. L. (2011). Probability and Statistics for Engineering and the Sciences. Cengage learning. 4. Ott, R. L., & Longnecker, M. T. (2015). An introduction to statistical methods and data analysis. Nelson Education. 5. Yang, Y. M., Yue, T. E. N. G., & Zhang, R. L. (2018). Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model. DEStech Transactions on Computer Science and Engineering, (mso). อ้างอิง