SlideShare a Scribd company logo
1 of 30
Download to read offline
สารบัญ
หน้า
1 บทนา 1
2 การถดถอยเชิงเส้นอย่างง่าย 1
3 การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด 4
3.1 การประมาณค่าจุดตัด และความชัน: 0 และ 1 4
3.2 การประมาณค่าความแปรปรวน: 2
 7
4 คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด 11
5 การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น 13
5.1 การทดสอบสมมติฐานโดยการใช้ t-Test 13
5.2 การทดสอบสมมติฐานนัยสาคัญการถดถอยโดยใช้การวิเคราะห์ความแปรปรวน 15
6 ค่าสัมประสิทธิ์การตัดสินใจ 18
7 สหสัมพันธ์ 19
8 ตัวอย่างงานวิจัย 22
สารบัญรูป
รูปที่ หน้า
1 แผนภาพการกระจายของการอัด (y) กับแรงดัน(x) 2
2 เส้นสมมติของ 0 1( )E y x   4
3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย 5
4 ตัวอย่างความแปรปรวนของข้อมูล 7
5 แผนภาพการกระจายของค่าความต้านทาน (y) กับเปอร์เซ็นต์กาวอัด (x) 9
6 พล็อตของสมการถดถอยเชิงเส้นของตัวอย่างที่ 1 10
7 ไม่ปฏิเสธสมมติฐานหลัก 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y) 14
8 ปฏิเสธสมมติฐานหลัก 0 1: 0H   (มีความสัมพันธ์เชิงเส้นระหว่าง x และ y) 14
9 แผนภาพการกระจายของข้อมูลอธิบายค่า R 21
10 พล็อตเส้นถดถอยของสายชั่วโมงของเครื่องบินและปริมาณการใช้วัสดุในการบารุงรักษา 23
11 พล็อตเรสซิดวลของชั่วโมงบินเครื่องบิน และการใช้วัสดุในการบารุงรักษาหลัก 25
สารบัญตาราง
ตารางที่ หน้า
1 ข้อมูลการทดสอบวัสดุแผ่นฉนวน 2
2 ข้อมูลความคลาดเคลื่อนที่เกิดขึ้นจากตัวอย่างค่าความต้านทานต่อการฉีกขาดของกระดาษ 11
3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย 16
4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016 22
5 การวิเคราะห์ความแปรปรวน 24
6 สรุปผลของแบบจาลองถดถอย 24
7 สัมประสิทธิ์ 25
-1-
การถดถอยเชิงเส้นอย่างง่ายและสหสัมพันธ์
(Simple linear regression and correlation)
1. บทนา
การศึกษาความสัมพันธ์ของตัวแปรต่าง ๆ เป็นสิ่งที่มีความสาคัญในด้านวิศวกรรมและวิทยาศาสตร์
ตัวอย่างเช่น การศึกษาการใช้น้ามันเชื้อเพลิงของรถยนต์เกี่ยวข้องกับน้าหนักของรถยนต์หรือไม่ อายุการใช้งาน
ของคมมีดที่ใช้ตัดเฉือนโลหะขึ้นอยู่กับความเร็วในการตัดเฉือนหรือไม่ ความต้านทานแรงดึงของเหล็กกับ
ปริมาณคาร์บอนที่ผสมอยู่มีความสัมพันธ์กันหรือไม่ เป็นต้น ซึ่งการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรสอง
ตัว หรือมากกว่า หากกาหนดตัวแปรอิสระ (Independent variable: x) และตัวแปรตาม (Dependent variable:y)
การวิเคราะห์ว่าตัวแปร 2 ตัวแปรใด ๆ มีความสัมพันธ์หรือไม่นั้น สามารถใช้วิธีการด้านสถิติที่เรียกว่า การ
วิเคราะห์สหสัมพันธ์ (Correlation analysis) หากพบว่าทั้ง 2 ตัวแปรมีความสัมพันธ์กัน โดยพบว่าตัวแปร x มีผล
ต่อตัวแปร y หากต้องการศึกษาวิธีการนาตัวแปร x ใช้คาดคะเนผลที่อาจจะเกิดขึ้นได้ของตัวแปร y ด้วยวิธีการ
ทางสถิติ เรียกว่า การวิเคราะห์ความถดถอย (Regression analysis) และหากตัวแปรต่าง ๆ มีความสัมพันธ์กันใน
เชิงเส้นตรงจะเรียกว่า การวิเคราะห์การถดถอยเชิงเส้น (Linear regression analysis) โดยรายงานฉบับนี้จะเสนอ
เนื้อหาที่เกี่ยวข้องกับการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย (Simple linear regression analysis) และ
สหสัมพันธ์ (Correlation)
2. การถดถอยเชิงเส้นอย่างง่าย
การวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระ (x) และตัว
แปรตาม (y) โดยจะศึกษาตัวแปรอิสระเพียงตัวเดียวที่มีผลต่อตัวแปรตาม โดยใช้แผนภาพการกระจาย (Scatter
diagram) ในการวิเคราะห์ความสัมพันธ์ เช่น ในการพัฒนาวัสดุแผ่นฉนวนชนิดใหม่ ต้องการคาดคะเนการอัด
(y: หน่วยเป็น 0.1 นิ้ว) ของแผ่นฉนวนหนา 2 นิ้ว ภายใต้แรงดัน (x: หน่วยเป็น 10 ปอนด์/ตารางนิ้ว) ในระดับ
ต่างๆ โดยทาการทดสอบชิ้นงาน 5 ชิ้น แสดงข้อมูลการทดสอบแสดงดังตารางที่ 1 จากข้อมูลสามารถสร้าง
แผนภาพการกระจายได้ดังรูปที่ 1 (Mendenhall and Sincich, 2016, pp.485-486)
-2-
ตารางที่ 1 ข้อมูลการทดสอบวัสดุแผ่นฉนวน
รูปที่ 1 แผนภาพการกระจายของการอัด (y) กับแรงดัน(x)
(Mendenhall and Sincich, 2016, p.486)
จากแผนภาพการกระจายแสดงในรูปที่ 1 สมมติว่าความสัมพันธ์ระหว่างการอัดชิ้นงาน (y) กับแรงดัน
(x) มีแนวโน้มการเพิ่มขึ้นลักษณะเป็นเชิงเส้น ซึ่งตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย (Simple linear
regression model) จะมีรูปแบบแสดงดังสมการที่ (1)
0 1y x     (1)
โดย
y = ตัวแปรตาม (Dependent variable)
x = ตัวแปรอิสระ (Independent variable)
 = ค่าความคลาดเคลื่อนสุ่ม (Random error)
0 = จุดตัดแกนบน y (y-intercept)
1 = ความชัน (Slope)
เมื่อ 0 และ 1 เป็นค่าพารามิเตอร์ที่ไม่ทราบค่า เรียกว่า สัมประสิทธิ์การถดถอย (Regression coefficient)
เพื่อให้ได้เส้นที่เหมาะสมของตัวแบบถดถอยของชุดข้อมูลจะต้องประมาณค่าพารามิเตอร์ที่ไม่ทราบค่า
ของเส้นถดถอยเฉลี่ย นั้นคือ 0 และ 1 การอนุมานที่ถูกต้องเกี่ยวกับ 0 และ 1 จะขึ้นอยู่กับการกระจายตัว
ของข้อมูล ซึ่งจะขึ้นอยู่กับการแจกแจงความน่าจะเป็นของความคลาดเคลื่อนสุ่ม ( ) ดังนั้น ก่อนอื่นต้อง
ตั้งสมมติฐานเฉพาะเกี่ยวกับ  ซึ่งเป็นพื้นฐานของการวิเคราะห์การถดถอยเชิงสถิติสามารถสรุปได้ดังนี้
ชิ้นงาน
(Specimen)
ความดัน
(Pressure)
การอัด
(Compression)
1 1 1
2 2 1
3 3 2
4 4 2
5 5 4
-3-
สมมติฐานที่ 1 การแจกแจงความน่าจะเป็ นค่าเฉลี่ยของความคลาดเคลื่อนเท่ากับศูนย์: 0 
นั้นคือ ค่าเฉลี่ยของความคลาดเคลื่อนเท่ากับศูนย์: ( ) 0E  
สมมติฐานที่ 2 ความแปรปรวนของการแจกแจงความน่าจะเป็นของ ของตัวแปรอิสระ (x) นั้นมี
ค่าคงที่ทั้งหมด สาหรับตัวแบบเส้นตรง สมมติฐานนี้หมายความว่าความแปรปรวน
ของความคลาดเคลื่อนสุ่มมีค่าค่าคงที่เท่ากับ 2

สมมติฐานที่ 3 ค่าความคลาดเคลื่อน ( ) มีการแจกแจงความน่าจะแบบปกติ
สมมติฐานที่ 4 ความคลาดเคลื่อนกระจายตัวแบบอิสระ ปราศจากอิทธิพลใด ๆ
(Mendenhall and Sincich, 2016, p.487)
หากมีการสมมติว่า ค่าเฉลี่ยของความคลาดเคลื่อนสุ่มเท่ากับศูนย์ : ( ) 0E   ดังนั้นค่าเฉลี่ยของ y คือ
0 1(Y ) ( )E x E x    
0 1 ( )x E    
0 1x   (2)
และความแปรปรวนของค่าความคลาดเคลื่อนสุ่มคงที่เท่ากับ 2
 : 2
( )V  
0 1(Y ) ( )V x V x    
0 1( ) ( )V x V    
2
0  
2
 (3)
ค่าเฉลี่ยของ y ที่ระดับใดของ x แทนด้วยสัญลักษณ์ ( )E Y x จากข้อมูลในตารางที่ 1 ค่าเฉลี่ยของการอัด
ชิ้นงาน (y) ที่เกิดขึ้นมีความสัมพันธ์กับแรงดัน (x) กราฟเส้นตรงที่มีจุดตัดแกนบน y ( 0 ) และความชัน ( 1 ) เมื่อ
x เพิ่มขึ้น 1 หน่วย y จะเปลี่ยนไป 1 หน่วย และค่าเฉลี่ยของเส้นถดถอยอยู่ในรูป 0 1(y)E x   แสดงดังรูป
ที่ 2
-4-
รูปที่ 2 เส้นสมมติของ 0 1(y)E x   (Mendenhall and Sincich, 2016, p.487)
ดังนั้น รูปแบบการถดถอย 0 1(Y )E x x   เป็นเส้นตรงของค่าเฉลี่ยตัวแปรตาม (y) ที่ค่าใด ๆ ของ
ตัวแปรอิสระ (x) การเปลี่ยนแปลงของค่าตัวแปรตาม (y) ที่เกิดขึ้นจริง และค่าที่เกิดจากการประมาณผ่านตัว
แบบจาลองการถดถอยเชิงเส้น จะขึ้นอยู่กับความแปรปรวนของค่าความคลาดเคลื่อนสุ่ม ซึ่งในความเป็นจริงค่า
ความชัน( 1 ) ค่าจุดตัดแกนบน y ( 0 ) และความแปรปรวนของค่าความคลาดเคลื่อนสุ่ม ( 2
 ) ไม่สามารถระบุ
ค่าได้จึงต้องทาการประมาณจากข้อมูลตัวอย่าง (Montgomery and Runger, 2014, pp.428-430)
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด
3.1 การประมาณค่าจุดตัดบนแกน y และความชัน ( 0 และ 1 )
ในการเลือกเส้นที่เหมาะสม (Best-fitting line) สาหรับชุดข้อมูลเพื่อประมาณค่า 0 และ 1 ซึ่งเป็น
พารามิเตอร์ที่ไม่ทราบค่าของตัวแบบจาลองการถดถอยเชิงเส้น วิธีที่ง่ายและน่าสนใจที่สุด คือวิธีกาลังสองน้อย
ที่สุด (Method of least squares) แสดงดังรูปที่ 3 เส้นที่เหมาะสมบนแผนภาพการกระจายของข้อมูลจากตารางที่
1 โดยทาให้เส้นที่เหมาะสมมีค่าผลรวมของผลต่างระหว่างค่าของข้อมูลจริงกับเส้นประมาณค่าถดถอยมีค่าน้อย
ที่สุด (Mendenhall and Sincich, 2016, p.489)
เมื่อทาการเก็บข้อมูล n ตัวอย่าง โดยมีคู่ลาดับของค่า x และค่า y กล่าวคือ 1 1( , ),x y 2 2( , ),x y ...,
( , )n nx y ดังนั้นค่ารูปแบบจาลองการถดถอยเชิงเส้น มี n ตัวอย่างที่ค่า iy ณ คู่อันดับ ix แสดงดังสมการ
0 1i i iy x     , i = 1,2,…,n (4)
-5-
เนื่องจากค่าความคลาดเคลื่อนนั้นสามารถเป็นได้ทั้งค่าบวกและค่าลบ ดังนั้นจึงต้องทาให้อยู่ในรูป
ผลรวมกาลังสองของความคลาดเคลื่อน (Sum of squares for error: L ) ที่ได้จากการสังเกตจริง คือ
2 2
0 1
1 1
( )
n n
i i i
i i
L y x  
 
     (5)
การประมาณค่า 0 และ 1 เขียนแทนด้วย 1
ˆ และ 0
ˆ โดยวิธีกาลังสองน้อยที่สุด ด้วยการหาค่าอนุพันธ์
เชิงส่วน เทียบกับ 0 และ 1 แล้วกาหนดให้สมการเท่ากับศูนย์ได้ดังนี้ (Devore, 2011, pp.478-479)
0 1
0 1
1ˆ ˆ0 ,
ˆ ˆ2 ( ) 0
n
i i
i
L
y x
 
 
 

    

 (6)
0 1
0 1
1ˆ ˆ1 ,
ˆ ˆ2 ( ) 0
n
i i i
i
L
y x x
 
 
 

    

 (7)
เมื่อจัดรูปสมการที่ (6) และ (7) จะได้รูปสมการปกติ คือ
0 1
1 1
ˆ ˆ
n n
i i
i i
n x y 
 
   (8)
2
0 1
1 1 1
ˆ ˆ
n n n
i i i i
i i i
x x y x 
  
    (9)
รูปที่ 3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย (Mendenhall and Sincich, 2016, p.489)
-6-
จากสมการที่ (8) และ (9) คือสมการกาลังสองน้อยที่สุด สามารถคานวณหาค่าจุดตัดแกนบน y ( 0
ˆ )
และความชัน ( 1
ˆ ) ได้ดังนี้
0 1
ˆ ˆy x   (10)
1 1
1
1 2
2 1
1
ˆ
n n
i in
i i
i i
i
n
in
i
i
i
y x
y x
n
x
x
n

 



  
  
  

 
 
 
 



(11)
โดยที่
1
1 n
i
i
y y
n 
  และ
1
1 n
i
i
x x
n 
 
ดังนั้นเส้นประมาณการถดถอย (Estimated regression line) ที่เหมาะสม คือ
0 1
ˆ ˆˆ iy x   (12)
สาหรับแต่ละคู่ลาดับของข้อมูล (x, y) ที่ได้จากการสังเกตจริง แสดงดังสมการต่อไปนี้
0 1
ˆ ˆ
i i iy x e    , i = 1,2,…,n (13)
โดยที่ ˆi ie y y  เรียกว่า ค่าเรสซิดวล (Residual) หรือค่าความคลาดเคลื่อน เป็นค่าความแตกต่างระหว่างค่า
ของข้อมูลจริงกับเส้นประมาณค่าถดถอย
จากสมการที่ (11) ความชัน ( 1
ˆ ) สามารถแสดงใหม่ได้ดังนี้
2
12 2
1 1
( )
n
in n
i
xx i i i
i i
x
S x x x
n

 
 
 
    

 
(14)
1 1
1 1
( )( )
n n
i in n
i i
xy i i i i
i i
x y
S y y x x x y
n
 
 
  
  
      
 
 
(15)
ดังนั้น
1
ˆ xy
xx
S
S
  (16)
(Montgomery and Runger, 2014, pp.431-433)
-7-
3.2 การประมาณค่าความแปรปรวน: 2

การประมาณค่าเส้นถดถอยนั้นจะถูกต้องใกล้เคียงค่าจริงมากเพียงใดสามารถทราบได้จาก ค่าความคลาด
เคลื่อนที่เกิดขึ้นระหว่างค่าของข้อมูลที่ได้จากการสังเกต และค่าที่ได้รับจากเส้นถดถอย หากค่า 2
 มีค่ามากจะ
สังเกตได้ว่าคู่อันดับ (x, y) มีค่าที่ค่อนข้างกระจายออกไปจากเส้นถดถอย ในขณะที่ 2
 มีค่าน้อยการสังเกตได้ว่า
การกระจายของข้อมูลจะอยู่ใกล้กับเส้นถดถอย แสดงดังรูปที่ 4 ดังนั้นหากค่า 2
 มีค่าน้อย ข้อมูลมีค่าการกระจาย
ใกล้กับเส้นถดถอยมากเพียงใด แสดงว่าสมการถดถอยที่ได้สามารถนาไปพยากรณ์ค่า y ได้ถูกต้องมากเท่านั้น
รูปที่ 4 ตัวอย่างความแปรปรวนของข้อมูล (Devore, 2011, p.481)
การประมาณค่าความแปรปรวนของความคลาดเคลื่อนเป็นค่าพารามิเตอร์อีกตัวที่ไม่ทราบค่าของตัว
แบบถดถอยคือ 2
 โดยที่เรสซิดวล ˆi ie y y  ถูกใช้เพื่อให้ได้ค่าประมาณ 2
 ซึ่งค่าเรสซิดวลจะมีค่าเป็นไป
ได้ทั้งบวกและลบ จึงต้องกาหนดค่าให้อยู่ในรูปของผลรวมกาลังสองของเรสซิดวล (Error sum of squares: ESS )
สามารถคานวณได้ (Ott and Longnecker, 2015, p.546)
2
1
n
E i
i
SS e

 
(17)
2
1
ˆ( )
n
i
i
y y

 
โดยองศาอิสระ (Degrees of freedom) คือ 2n  เนื่องจาก ตัวแบบความสัมพันธ์ถดถอยเชิงเส้น
0 1
ˆ ˆˆ iy x   มีค่าประมาณของพารามิเตอร์ประกอบด้วย 1
ˆ และ 0
ˆ จะเห็นได้ว่าค่าเฉลี่ยของผลรวมกาลังสอง
ของเรสซิดวล คือ 2
ˆ( ) ( 2)EE SS n   ดังนั้นค่าประมาณความแปรปรวนของเรสซิดวลที่ไม่เอนเอียงคือ
(Montgomery and Runger, 2014, p.435)
-8-
2
2 1
ˆ
2
n
i
i
e
n
 



(18)
2 2
ˆ
2
E
E
SS
MS S
n
   

หากค่า 2
ˆ มีค่ามากแสดงว่าสมการถดถอยที่ประมาณได้นี้มีความเหมาะสมน้อย เนื่องจากค่า y จะอยู่
ห่างจากเส้นถดถอยมากแต่ถ้าค่า 2
ˆ มีค่าน้อยแสดงว่าสมการถดถอยที่ประมาณได้นี้มีความเหมาะสมมาก
เนื่องจากค่า y จะอยู่ใกล้เส้นถดถอยมาก
ตัวอย่างที่ 1 โรงงานผลิตกระดาษแห่งหนึ่ง ได้ทาการศึกษาข้อมูลระหว่างค่าความต้านทานการฉีกขาดของ
กระดาษ (y: 10 นิวตัน/ตารางมิลลิเมตร) กับเปอร์เซ็นต์ของกาวอัด (x) ที่ใช้เป็นส่วนผสมในการ
ผลิตกระดาษ โดยสุ่มเก็บรวบรวมข้อมูลมา 10 ตัวอย่างดังนี้คือ
จากข้อมูลข้างต้น หากต้องการทราบความสัมพันธ์ระหว่างกับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสม
ในการผลิตกระดาษ กับความต้านทานต่อการฉีกขาดของกระดาษ จะทาการพิจารณาตัวแบบเชิงเส้นอย่างง่าย
ดังต่อไปนี้
0 1y x    
โดยที่ x = เปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ (ตัวแปรอิสระ)
y = ค่าความต้านทานต่อการฉีกขาดของกระดาษ (ตัวแปรตาม)
ทั้งนี้สามารถทาการศึกษาเบื้องต้นถึงความสัมพันธ์ที่เกิดขึ้นระหว่าง x และ y โดยการใช้แผนภูมิการ
กระจายซึ่งสามารถแสดงต่อไปนี้
ตัวอย่างที่ 1 2 3 4 5 6 7 8 9 10
x 1.6 1.5 1.5 1.4 2.0 2.0 2.2 2.4 2.5 2.5
y 10.1 11.7 11.7 11.5 13.1 13.2 14.2 14.0 13.7 14.1
-9-
รูปที่ 5 แผนภาพการกระจายของค่าความต้านทานต่อการฉีกขาดของกระดาษ (y) กับเปอร์เซ็นต์กาวอัด (x)
จากแผนภาพการกระจายในรูปที่ 5 จะสามารถเห็นถึงความสัมพันธ์ระหว่าง 2 ตัวแปรได้ว่าน่าจะมี
ความสัมพันธ์กันในเชิงเส้นตรง และมีความสัมพันธ์ในทิศทางเดียวกัน เนื่องจากเมื่อพิจารณาจากลักษณะของจุด
พบว่าเมื่อ x มีค่าสูงขึ้น y จะมีค่าสูงขึ้นด้วย ดังนั้นในการใช้ค่าของข้อมูลวิเคราะห์ความสัมพันธ์ของตัวแปรต้น
และตัวแปรตาม ซึ่งมีข้อมูลดังต่อไปนี้
10n  ,
10
1
19.60i
i
x

 ,
10
1
127.30i
i
y

 ,
10
1
254.30i i
i
y x

 ,
10
2
1
40.12i
i
x

 ,
10
2
1
1638.03
i
y

 ,
1.96x  และ 12.73y 
จากข้อมูลคานวณค่าสัมประสิทธิ์ของสมการ การถดถอยเชิงเส้นอย่างง่าย ได้ดังนี้
 
210
2
10
12
1
19.60
40.12 1.704
10
i
i
xx i
i
x
S x
n


 
 
     


  
10 10
10
1 1
1
19.60 127.30
254.3 4.7
10
0 92
i i
i i
xy i i
i
x y
S x y
n
 

  
  
      
 

-10-
ค่าความชัน และค่าจุดตัดบนแกน y
1
4.792ˆ 2.812
1.704
xy
xx
S
S
   
0 1
ˆ ˆ 12.73 (2.812 1.96) 7.218y x      
ดังนั้น สมการถดถอยเชิงเส้นอย่างง่ายที่ประมาณได้ ˆ 7.218 2.812y x  แสดงดังรูปที่ 6
รูปที่ 6 พล็อตของสมการถดถอยเชิงเส้นของตัวอย่างที่ 1
จากสมการถดถอยที่ได้อธิบายได้ว่า เมื่อ 0x  จะได้ ˆ 7.218 2.812(0) 7.218y    หมายความว่า
ถ้าไม่มีอิทธิพลของกาวอัดเลย ค่าความต้านทานต่อการฉีกขาดของกระดาษจะเท่ากับ 72. 18 นิวตันต่อตาราง
มิลลิเมตร (เนื่องจากหน่วยของค่าความต้านทานในตัวอย่างที่ 1 เท่ากับ 10 นิวตันต่อตารางมิลลิเมตร ดังนั้น
7.218 10 72.18  )
-11-
ตารางที่ 2 ข้อมูลความคลาดเคลื่อนที่เกิดขึ้นจากตัวแบบและค่าสังเกตจากตัวอย่างค่าความต้านทานต่อการฉีก
ขาดของกระดาษ แสดงดังนี้
โดยมี ค่าประมาณความแปรปรวนของเรสซิดวล สามารถคานวณได้ดังนี้
2
2
2 1 (4.02)
ˆ 0.503
2 10 2
n
i
i
e
n
 
  
 

4. คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด
คุณสมบัติทางสถิติของค่าประมาณพารามิเตอร์ (สัมประสิทธิ์) 0
ˆ และ 1
ˆ ของตัวแบบความสัมพันธ์เชิง
เส้นด้วยวิธีกาลังสองน้อยที่สุด อธิบายได้จากข้อสมมติของข้อมูลความคลาดเคลื่อน ( ) ในตัวแบบ
0 1y x     ที่มีค่าเฉลี่ยของความคลาดเคลื่อนสุ่มเท่ากับศูนย์ และความแปรปรวนมีค่าคงที่ 2
 เมื่อตัว
แปรสุ่ม y มีค่าเฉลี่ย 0 1( )E Y x x   และความแปรปรวนมีค่าคงที่ 2
 โดยที่ค่าของ 0
ˆ และ 1
ˆ ขึ้นอยู่กับ
ค่าที่ได้จากการสังเกต ดังนั้นค่าประมาณกาลังสองน้อยที่สุดของสัมประสิทธิ์การถดถอยอาจถูกมองว่าเป็นตัว
แปรสุ่ม พิจารณา 1
ˆ เป็นส่วนประกอบเชิงเส้นของค่าสังเกต iy แสดงค่าเฉลี่ยของ 1
ˆ คือ
 1 1
ˆE   (19)
ตัวอย่างที่ x y
1 1.60 10.10 11.72 -1.62 2.62
2 1.50 11.70 11.44 0.26 0.07
3 1.50 11.70 11.44 0.26 0.07
4 1.40 11.50 11.16 0.34 0.12
5 2.00 13.10 12.84 0.26 0.07
6 2.00 13.20 12.84 0.36 0.13
7 2.20 14.20 13.40 0.80 0.63
8 2.40 14.00 13.97 0.03 0.00
9 2.50 13.70 14.25 -0.55 0.30
10 2.50 14.10 14.25 -0.15 0.02
ผลรวม 19.60 127.30 127.30 0.00 4.02
ieˆiy 2
ie
-12-
ดังนั้น 1
ˆ คือค่าประมาณที่ไม่เอนเอียง (Unbiased estimator)ในตัวแบบการถดถอยเชิงเส้นของความชันจริง
เมื่อพิจารณาความแปรปรวนของค่าประมาณพารามิเตอร์ 1
ˆ เนื่องจากข้อสมมติความแปรปรวนของค่า
ความคลาดเคลื่อนสุ่มคือ 2
( )V   ก็จะได้ว่า 2
( )iV y  เนื่องจาก 1
ˆ ส่วนประกอบเชิงเส้นของค่าสังเกต
iy ดังนั้นจะได้ความแปรปรวนความชันคือ
 
2
1
ˆ
xx
V
S

  (20)
สาหรับจุดตัดบนแกน y สามารถแสดงในลักษณะที่คล้ายกัน ได้ว่า
 0 0
ˆE   (21)
 
2
2
0
1ˆ
xx
x
V
n S
 
 
  
 
(22)
ดังนั้น 0
ˆ เป็นค่าประมาณที่ไม่เอนเอียงของจุดตัด 0
การประมาณ 2
 ในสมการ (20) และ (22) เพื่อประมาณการความแปรปรวนของความชันและจุดตัด
ผลจากการคานวณหารากที่สองของความแปรปรวนเรียกว่า ความคลาดเคลื่อนมาตรฐานโดยประมาณ
(Estimated standard error) ของความชันและจุดตัด ดังนั้นในการถดถอยเชิงเส้นความคลาดเคลื่อนมาตรฐาน
โดยประมาณของความชันได้จาก
 
2
1
ˆˆ
xx
se
S

 
(23)
และความคลาดเคลื่อนมาตรฐานโดยประมาณของจุดตัด สามารถหาได้จาก
 
2
2
0
1ˆ ˆ
xx
x
se
n S
  
(24)
โดยที่ค่าความคลาดเคลื่อนมาตรฐานโดยประมาณเป็นค่าที่ใช้ในการวัดความถูกต้องแม่นยาของการ
ประมาณค่าสัมประสิทธิ์ตัวแบบความสัมพันธ์ด้วยวิธีกาลังสองน้อยที่สุด นั่นคือค่าความคลาดเคลื่อนยิ่งน้อยยิ่งดี
นั่นเอง (Montgomery and Runger, 2014, pp.440-441)
-13-
5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น
สิ่งที่สาคัญในการวิเคราะห์ความเหมาะสมของตัวแบบถดถอยเชิงเส้นคือ การทดสอบสมมติฐานทาง
สถิติของค่าประมาณพารามิเตอร์ ได้แก่ค่าความชันและจุดตัด โดยมีสมมติฐานคือ ค่าความคลาดเคลื่อน ( ) และ
ตัวแบบถดถอยมีการแจกแจงแบบปกติ ค่าความคลาดเคลื่อนมีความเป็นอิสระต่อกันที่มีค่าเฉลี่ยเท่ากับศูนย์และ
มีความแปรปรวนคงที่ 2

5.1 การทดสอบสมมติฐานโดยการใช้ t-Test
การทดสอบสมมติฐานว่าความชันเท่ากับค่าคงที่ นั้นคือ 1,0 สมมติฐานคือ
สมมติฐานหลัก 0 1 1,0:H  
สมมติฐานรอง 1 1 1,0:H  
โดยที่ตัวสถิติทดสอบความชัน ใช้การทดสอบแบบที จะได้ว่า
 
1 1,0 1 1,0
0 2
1
ˆ ˆ
ˆˆ xx
T
seS
   

 
 
(25)
ซึ่งการแจกแจงแบบทีด้วยองศาอิสระ 2n ภายใต้ 0 1 1,0:H   จะปฏิเสธสมมติฐานหลัก เมื่อ
0 2, 2nt t  (26)
สาหรับการทดสอบสมมติฐานค่าคงที่ของจุดตัด ( 0,0 ) ดังนี้
 
0 0,0 0 0,0
0
2
02
ˆ ˆ
ˆ1
ˆ
xx
T
sex
n S
   


 
 
 
 
 
(27)
และปฏิเสธสมมติฐานหลักค่าที่คานวณได้ของตัวสถิติการทดสอบ เมื่อ 0 2, 2nt t 
โดยการทดสอบสมมติฐานนั้นมีความสาคัญ เนื่องเป็นการทดสอบเพื่อศึกษานัยสาคัญของความสัมพันธ์
มีสมมติฐานคือ
0 1: 0H   (ค่าคงที่เท่ากับศูนย์แสดงว่าแสดงว่าไม่มีความสัมพันธ์ระหว่าง x และ y)
1 1: 0H   (ค่าคงที่ไม่เท่ากับศูนย์แสดงว่า มีความสัมพันธ์ระหว่าง x และ y)
-14-
หากไม่ปฏิเสธสมมติฐานหลัก 0 1: 0H   สรุปได้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y แสดง
ดังรูป 7 เมื่อข้อมูลมีค่าแปรปรวนน้อยและการประมาณค่า y ที่ x ใดๆ คือ ˆy y ดังรูปที่ 7 (a) หรือในกรณีที่
ความสัมพันธ์ที่แท้จริงระหว่าง x และ yไม่ใช่ความสัมพันธ์เชิงเส้นมีค่าแปรปรวนของข้อมูลมาก ดังรูปที่ 7 (b)
และในกรณีหากปฏิเสธสมมติฐานหลัก 0 1: 0H   ก็หมายความว่า มีความสัมพันธ์ระหว่าง x และ y รูปที่ 8
การปฏิเสธสมมติฐานหลักอาจหมายถึงว่ารูปแบบความสัมพันธ์เชิงตรงนั้นมีความเหมาะสม ดังรูปที่ 8 (a)
รูปที่ 7 ไม่ปฏิเสธสมมติฐานหลัก 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y)
(Montgomery and Runger, 2014, p.442)
รูปที่ 8 ปฏิเสธสมมติฐานหลัก 0 1: 0H   (มีความสัมพันธ์เชิงเส้นระหว่าง x และ y)
(Montgomery and Runger, 2014, p.443)
-15-
5.2 การทดสอบสมมติฐานนัยสาคัญการถดถอยโดยใช้การวิเคราะห์ความแปรปรวน
เป็นการวิเคราะห์ความแปรปรวนที่ใช้เพื่อทดสอบนัยสาคัญของการถดถอย ซึ่งการวิเคราะห์ความ
แปรปรวนมีดังนี้
2 2 2
1 1 1
ˆ ˆ( ) ( ) ( )
n n n
i i i i
i i i
y y y y y y
  
       (28)
2
1
ˆ( )
n
R i
i
SS y y

  ผลรวมกาลังสองของความคลาดเคลื่อนจากการถดถอย (Regression sum of squares)
2
1
ˆ( )
n
E i i
i
SS y y

  ผลรวมกาลังสองของความคลาดเคลื่อน (Error sum of squares)
เขียนสมการใหม่ได้ว่า
T R ESS SS SS  (29)
โดยที่
2
1
( )
n
T i
i
SS y y

 
2
12
1
n
in
i
i
i
y
y
n


 
 
  


(30)
1
ˆ
R xySS S (31)
E T RSS SS SS  (32)
หากสมมติฐานหลัก 0 1: 0H   เป็นจริง จะได้ว่า
0
1
( 2)
R R
E E
SS MS
F
SS n MS
 

(33)
การแจกแจงแบบเอฟ โดยมีองศาอิสระ 2n จะปฏิเสธสมมติฐานหลัก ถ้า 0 ,1, 2nf f  พบว่าค่าสถิติ
เอฟที่ได้จากการคานวณมากกว่าค่าที่เกิดจากการเปิดตารางเอฟ (Montgomery and Runger, 2014, p.443)
-16-
ตารางที่ 3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย
แหล่งที่มา
(Source of variation)
ผลบวกกาลังสอง
(Sum of
Squares)
องศาอิสระ
(Degrees of
Freedom)
ค่าเฉลี่ย
(Mean
Square)
ค่าสถิติ
0( )F
ตัวแบบ (Regression) RSS 1 RMS 0 R EF MS MS
ค่าความคลาดเคลื่อน
(Error)
ESS 2n  EMS
ทั้งหมด (Total) TSS 1n 
ตัวอย่างที่ 2 จากตัวอย่างที่ 1 ทดสอบสมมติฐานว่าความสัมพันธ์ของความต้านทานต่อการฉีกขาดของกระดาษ
กับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษเป็นแบบเชิงเส้นที่ระดับนัยสาคัญ 5% หรือไม่
สมการถดถอยเชิงเส้นอย่างง่ายที่ได้จากตัวอย่างที่ 1 คือ ˆ 7.218 2.812y x 
การทดสอบสมมติฐานโดยการใช้ t-Test
10n  , 1
ˆ 2.812  , 1.704xxS  , 2
ˆ 0.503 
สมมติฐาน 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้น)
0 1: 0H   (มีความสัมพันธ์เชิงเส้น)
0.05 
ตัวสถิติทดสอบ 2
1 1,0
0
ˆ ˆ 0 2.812
5.176
0.503
1.704
ˆ
xx
T
S


  
   
ปฏิเสธ 0H ถ้า 0T > ( 0.025,8 2.306t  )
สรุป เนื่องจาก ( 0 5.176T  ) > ( 0.025,8 2.306t  ) ดังนั้น ปฏิเสธ 0 1: 0H   ที่ระดับนัยสาคัญ 0.05 มี
หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่
ใช้เป็นส่วนผสมในการผลิตกระดาษ
-17-
ทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
10n  ,
10
1
127.30i
i
y

 ,
10
2
1
1638.03
i
y

 , 12.73y  , ˆ 127.3iy  , 1
ˆ 2.812  และ 4.792xyS 
สมมติฐาน 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้น)
0 1: 0H   (มีความสัมพันธ์เชิงเส้น)
0.05 
ปฏิเสธ 0H ถ้า 0 ,1, 2nF f  = 0 0.05,1,8( 5.32)F f 
2
1
ˆ( ) 4.02
n
E i i
i
SS y y

  
13.475
13.475
1 1
R
R
SS
MS   
1
ˆ 2.812 4.792 13.475R xySS S   
4.02
0.503
( 2) 10 2
E
E
SS
MS
n
  
 
2
2
12
1
127.3
1638.03 17.501
10
n
in
i
T i
i
y
SS y
n


 
 
     

 0
13.475
26.78
0.5025
R
E
MS
F
MS
  
แหล่งที่มา
(Source of variation)
ผลบวกกาลังสอง
(Sum of
Squares)
องศาอิสระ
(Degrees of
Freedom)
ค่าเฉลี่ย
(Mean
Square)
ค่าสถิติ
0( )F
ตัวแบบ (Regression) 13.475 1 13.475 26.78
ค่าความคลาดเคลื่อน
(Error)
4.020 8 0.503
ทั้งหมด (Total) 17.501 9
สรุป เนื่องจาก 0 0.05,1,8( 26.78) ( 5.32)F f   ดังนั้น ปฏิเสธ 0 1: 0H   ที่ระดับนัยสาคัญ 0.05 มี
หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่
ใช้เป็นส่วนผสมในการผลิตกระดาษ
-18-
6. ค่าสัมประสิทธิ์การตัดสินใจ
เมื่อทาการวิเคราะห์การถดถอยของข้อมูลตัวแปรอิสระ (X) และตัวแปรตาม (Y) แล้วสมการถดถอยที่
ประมาณได้จะนาไปใช้ประโยชน์ในการพยากรณ์ค่าของตัวแปรตาม (Y) เมื่อกาหนดค่าของตัวแปรอิสระ (X) มา
ให้แต่สมการถดถอยที่ใช้ในการพยากรณ์นี้อาจพยากรณ์ค่าตัวแปรตาม (Y) ได้ดีหรือไม่ดีก็ได้ โดยที่ ค่า
สัมประสิทธิ์การตัดสินใจ (Coefficient of Determination; 2
R ) เป็ นค่ายกกาลังสองของค่าสัมประสิทธิ์
สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y ซึ่งค่าสัมประสิทธิ์การตัดสินใจนี้เป็นค่าที่ใช้บอกเปอร์เซ็นต์การ
เปลี่ยนแปลงของตัวแปรตาม (Y) ที่สามารถอธิบายได้ด้วยตัวแปรอิสระ (X) ในสมการถดถอย
หาค่า 2
R ได้จาก
2 2 1
1
ˆ
ˆ XX XY R
T T T
S S SS
R
SS SS SS

  
(34)
โดยที่ (ค่า 2
R จะมีค่าอยู่ระหว่าง 0 ถึง 1) ยิ่งค่าของ 2
R สูงขึ้นเท่าไร แสดงว่าสมการถดถอยสามารถ
พยากรณ์ค่าของตัวแปรตาม (Y) ได้ดีมากยิ่งขึ้น และหาก 2
R มีค่าน้อย สมการถดถอยพยากรณ์ค่าของตัวแปร
ตาม (Y) ได้ไม่ดี หรือตัวแปรอิสระ (X) ในสมการถดถอยนั้นอธิบายการเปลี่ยนแปลงของตัวแปรตาม (Y) ได้ไม่ดี
เนื่องจากตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันน้อย (Devore, 2011, p.485)
ตัวอย่างที่ 3 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้ คือ ˆ 7.218 2.812y x  คานวณค่าสัมประสิทธิ์ของการ
ตัดสินใจ จากมูลในตัวอย่างที่ 2 ได้ค่าต่าง ๆ ดังนี้ 13.475RSS  และ 17.501TSS 
2 13.475
0.77
17.501
R
T
SS
R
SS
  
จึงสรุปได้ว่า ค่า 2
0.77R  หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษขึ้นอยู่กับ
เปอร์เซ็นต์ของกาวอัดประมาณ 77% ส่วนอีก 23% จะขึ้นอยู่กับปัจจัยอื่น ๆ ที่ไม่ได้นามาศึกษาหรือสมการ
ถดถอย ˆ 7.218 2.812y x  สามารถพยากรณ์ค่าค่าความต้านทานต่อการฉีกขาดของกระดาษได้ถูกต้อง 77%
-19-
7. สหสัมพันธ์
สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างข้อมูลหรือตัวแปรตั้งแต่ 2 ตัวขึ้นไป ใช้สาหรับการ
ทดสอบความสัมพันธ์เชิงเส้นตรงว่ามีความสัมพันธ์กันในระดับใด และมีความสัมพันธ์ในทิศทางใด เช่นความ
สูงกับน้าหนักว่ามีความสัมพันธ์กันมากหรือน้อย และมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้ามโดยใน
การตรวจสอบนั้นจะตรวจสอบด้วยการใช้แผนภาพการกระจายและค่าสัมประสิทธิ์สหสัมพันธ์ (correlation
coefficient) โดยในการวิเคราะห์การถดถอยนั้นได้มีสมมติฐานว่า X เป็นตัวแปรที่ควบคุมได้ ด้วยความคลาด
เคลื่อนเล็กน้อย และ Y เป็นตัวแปรสุ่ม การศึกษาค่าของข้อมูลจากสังเกตที่ได้รับเป็นคู่ระหว่าง ( , )i iX Y จึงเป็น
การศึกษาการแจกแจงตัวแปรสุ่มร่วม โดยมีฟังก์ชั่นการแจกแจง  ,f x y ตัวอย่างเช่นการศึกษาความสัมพันธ์
ความต้านทานแรงดึงของรอยเชื่อม ซึ่งในตัวอย่างนี้เราไม่สามารถควบคุมขนาดการเชื่อมได้ จึงต้องทาการสุ่ม
รอยเชื่อม n ตัวอย่าง และเก็บข้อมูลจากสังเกตขนาดรอยเชื่อม ( )iX และความต้านทานแรงดึง ( )iY ดังนั้น
( , )i iX Y จึงเป็นการแจกแจงตัวแปรสุ่มร่วม (Montgomery and Runger, 2014, pp.457-458)
สมมติว่า การแจกแจงร่วมของ iX และ iY เป็นการแจกแจงแบบปกติของสองตัวแปรสุ่ม (Bivariate
normal distribution) โดยมีค่าเฉลี่ยของตัวแปรคือ X และ Y ความแปรปรวนของตัวแปรคือ 2
X และ 2
Y
และกาหนดให้  คือสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปร X และ Y ได้ว่า
XY
X Y


 
 (35)
โดยที่ XY คือความแปรปรวนร่วมระหว่าง X และ Y
การแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y กาหนดให้ X x คือ
2
0 11 1
( ) exp
22
x
Y x
Y xY x
y
f y
 

      
  
  
(36)
เมื่อ
0
Y
Y X
X

   

  (37)
1
Y
X

 

 (38)
และความแปรปรวนของการแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y กาหนดให้ X x คือ
-20-
2 2 2
(1 )YY x
    (39)
ดังนั้นการแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y ให้ X x เป็นการแจกแจงแบบปกติด้วยค่าเฉลี่ย
0 1E( )Y x x   (40)
และความแปรปรวน 2
Y x
 ดังนั้นค่าเฉลี่ยของการแจกแจงแบบมีเงื่อนไขของ Y ให้ X x เป็นแบบจาลองการ
ถดถอยเชิงเส้นอย่างง่าย นอกจากนี้ค่าสัมประสิทธิ์สหสัมพันธ์( ) และสัมประสิทธิ์ความชัน 1( ) จากสมการ 38
จะเห็นว่าหาก 0  ดังนั้น 1 0  ซึ่งหมายความว่าไม่มีการถดถอยของ Y บน X
สาหรับการประมาณค่าพารามิเตอร์ 0 และ 1 แสดงดังสมการ (10 และ 16) โดยวิธีกาลังสองน้อย
ที่สุด เช่นเดียวกับกรณีการวิเคราะห์การถดถอยที่มีสมมติฐานว่า X เป็นตัวแปรที่ควบคุมได้
โดยการประมาณของ  สัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Sample Correlation Coefficient: R)
1
1 2 1 2
2 2
1 1
( )
ˆ
( SS )
( ) (Y )
n
i i
i XY
n n
XX T
i i
i i
Y X X
S
R
S
X X Y
 
 

  
 
  
 

 
(41)
คุณสมบัติที่สาคัญที่สุดของ R คือ:
1. ค่าของ R ไม่ได้ขึ้นอยู่กับการศึกษาภายใต้ตัวแปรสองตัว
2. ค่า R เป็นอิสระจากการตรวจวัดของ x และ y
3. ค่า R จะ มีค่าอยู่ในช่วง 1 1R  
4. 1R  เมื่อ x มีค่ามาก y มีค่ามาก หรือเมื่อ x มีค่าน้อย y มีค่าน้อย (มีความสัมพันธ์เชิงเส้นเชิงบวก)
1R   เมื่อ x มีค่ามาก y มีค่าน้อย หรือเมื่อ x มีค่าน้อย y มีค่ามาก (มีความสัมพันธ์เชิงเส้นเชิงลบ)
5. ค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าค่าสัมประสิทธิ์การตัดสินใจ
(Devore, 2011, p.510)
ซึ่งการตรวจสอบความสัมพันธ์ ทาการตรวจสอบโดยแผนภาพกระจายข้อมูล รูปที่ 9 แสดงสถานการณ์
ที่เป็นไปได้สาหรับค่าของ R ในรูปที่ 9 (d) แสดงให้เห็นความสัมพันธ์ระหว่าง x และ y แต่ R=0 ซึ่งเป็น
ความสัมพันธ์เชิงเส้นโค้ง ดังนั้นเมื่อ R=0 จะไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y ซึ่งจะแสดงให้เห็นถึง
ความสาคัญของการพิจารณาข้อมูลด้วยแผนภาพการกระจาย (Ott and Longnecker, 2015, p.591)
-21-
รูปที่ 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R (Ott and Longnecker, 2015, p.591)
ตัวอย่างที่ 4 จงหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าความต้านทานต่อการฉีกขาดของกระดาษและ
เปอร์เซ็นต์กาวอัด จากข้อมูลในตัวอย่างที่ 1 และ2 ได้ค่าต่าง ๆ ดังนี้ 4.792xyS  , 1.704xxS  และ
17.501TSS 
1 2 1 2
4.792
ˆ 0.878
( SS ) (1.704 17.501)
XY
XX T
S
R
S
    

ดังนั้นค่า 0.878R  นี้หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ของ
กาวอัดมีความสัมพันธ์กันสูงประมาณ 87. 8% และเนื่องจากค่า R เป็นบวกจะแสดงว่ามีความสัมพันธ์กันใน
ทิศทางเดียวกัน คือถ้าเปอร์เซ็นต์กาวอัดมีค่าสูงค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะสูงตามไปด้วย
และในทางตรงกันข้ามถ้าเปอร์เซ็นต์กาวอัดมีค่าต่าค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะต่าตามไป
ด้วย
-22-
8. ตัวอย่างงานวิจัย
Title : Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear
Regression Model
หัวข้อ : การทานายการใช้วัสดุในการบารุงรักษาเครื่องบินโดยใช้แบบจาลองถดถอยเชิงเส้น
ปี : 2018
ผู้วิจัย : Yan-ming YANG, Yue TENG and Rui-li ZHANG
1.วัตถุประสงค์ของการวิจัย
การพยากรณ์ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินเป็นสิ่งที่มีความสาคัญ และช่วยในการ
ตัดสินใจการใช้ประโยชน์จากทรัพยากรที่มีอยู่เพื่อปรับปรุงความสามารถในการบารุงรักษา ในงานวิจัยนี้ มุ่งเน้น
ไปที่ปัจจัยหลักที่มีอิทธิพลต่อการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน โดยใช้แบบจาลองการทานายถดถอย
เชิงเส้นของการใช้วัสดุในการบารุงรักษาอุปกรณ์ สร้างขึ้นโดยใช้ข้อมูลตัวอย่างที่เกิดขึ้นจริง บนพื้นฐานการ
วิเคราะห์จากตัวอย่าง วิธีการถดถอยเชิงเส้นอย่างง่ายใช้ในการทานาย และการทดสอบการใช้วัสดุในการ
บารุงรักษาอุปกรณ์การบิน
2.ขั้นตอนการวิจัย
2.1 เก็บสถิติข้อมูล
เก็บสถิติข้อมูลรายเดือนของชั่วโมงการบิน แสดงดังในตารางที่ 4 และข้อมูลของการใช้วัสดุในการ
บารุงรักษา แสดงดังในตารางที่ 5 ในปี ค.ศ. 2015-2016 เป็นเวลาสองปี สร้างแบบจาลองการถดถอยเชิงเส้นอย่าง
ง่าย เพื่อทานายปริมาณการใช้วัสดุในการบารุงรักษา
ตารางที่ 4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016
ตารางที่ 5 ปริมาณการใช้วัสดุบารุงรักษาเครื่องบินในปี ค.ศ. 2015-2016
-23-
2.2 แบบจาลองการถดถอย
งานวิจัยนี้เลือกแบบจาลองการถดถอยเชิงเส้นอย่างง่ายที่อยู่บนพื้นฐานการประมาณความสัมพันธ์เชิง
เส้นระหว่างตัวแปรอิสระ และตัวแปรตาม สร้างสมการเชิงเส้นเพื่อทานาย ตัวแบบจาลองการถดถอยเชิงเส้น
อย่างง่าย คือ y a bx 
โดยกาหนดให้ y คือ ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน (ตัวแปรตาม)
x คือ ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ)
a คือ จุดตัดแกนบน y (สัมประสิทธิ์การถดถอย)
b คือ ความชัน (สัมประสิทธิ์การถดถอย)
โดยการประมาณค่าสัมประสิทธิ์การถดถอย (a, b) แสดงดังสมการที่ (10) และ (16) และทาการทดสอบ
แบบจาลองการถดถอยโดยการทดสอบการประมาณค่าความแปรปรวนดังสมการที่ (18) และการทดสอบ
สัมประสิทธิ์สหสัมพันธ์ดังสมการที่ (41) โดยใช้ระดับนัยสาคัญ 0.05 ในการตรวจสอบ
3. ผลการวิจัย
ใช้ซอฟต์แวร์ Minitab ในการวิเคราะห์การถดถอย แสดงดังรูปที่ 10 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้
คือ 4.173 0.09901y x 
รูปที่ 10 พล็อตเส้นถดถอยของ สายชั่วโมงของเครื่องบิน และปริมาณการใช้วัสดุในการบารุงรักษาหลัก
-24-
3.1 การทดสอบนัยสาคัญของสมการถดถอย การวิเคราะห์ผลในตาราง ANOVA ตารางที่ 5 การวิเคราะห์
ผลในตาราง ANOVA กาหนดระดับนัยสาคัญที่ 0.05 หรือที่ระดับความเชื่อมั่น 95 % โดยในงานวิจัยนี้ได้ใช้
โปรแกรม Mimitab ช่วยในการวิเคราะห์ จึงใช้ค่า P-value เป็นตัวช่วยในการตัดสินใจ เพราะค่า P-value คือ
ระดับนัยสาคัญที่น้อยที่สุดหรือโอกาสที่น้อยที่สุดที่จะสามารถปฎิเสธสมมติฐานหลัก จะเห็นได้ว่าค่า
0.000P  เนื่องจาก( 0.05) ( 0.00)P    ดังนั้น ปัจจัยอื่นๆ ไม่มีผลกระทบต่อปริมาณการใช้วัสดุในการ
บารุงรักษาเครื่องบิน อย่างมีนัยสาคัญ สมการการถดถอยโดยรวมจึงมีประสิทธิภาพอย่างมาก
ตารางที่ 5 การวิเคราะห์ความแปรปรวน
3.2 การวัดของผลรวมของผลกระทบสมการการถดถอย ตารางที่ 6 R-Sq คือ 91.24% แสดงให้เห็นว่า
ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบินต่อชั่วโมงการบิน ประมาณ 91.24% ส่วนอีก 8.76% จะขึ้นอยู่กับ
ปัจจัยอื่น ๆ ดังนั้นเส้นถดถอยสามารถอธิบายความสัมพันธ์เชิงเส้นได้ 91.24% สามารถพยากรณ์การใช้วัสดุใน
การบารุงรักษาเครื่องบิน (y)ได้ถูกต้อง 91.24% ดังนั้นการตัวแบบถดถอยที่ได้จึงให้ผลที่ดี
ตารางที่ 6 สรุปผลของแบบจาลองถดถอย
3.3 การทดสอบนัยสาคัญของสัมประสิทธิ์การถดถอย ตารางที่ 7 แสดงให้เห็นว่า สัมประสิทธิ์
ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ x) โดยเกณฑ์ในการปฏิเสธสมมติฐานหลัก โดยใช้ค่าพี คือ จะปฎิเสธ
0H เมื่อระดับนัยสาคัญมากกว่าเท่ากับค่าพี P Value  
สมมติฐาน 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้น)
0 1: 0H   (มีความสัมพันธ์เชิงเส้น)
ที่ระดับนัยสาคัญ 0.05 
-25-
ในตารางที่ 7 จะเห็นได้ว่า 0.000P  เนื่องจาก ( 0.05) ( 0.00)P    ดังนั้นปฏิเสธ 0 1: 0H  
แสดงว่า ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบินมีความสัมพันธ์เชิงเส้นกับชั่วโมงบินของเครื่องบิน ซึ่ง
บ่งชี้ว่าชั่วโมงบินของเครื่องบินเป็นปัจจัยที่มีนัยสาคัญ
ตารางที่ 7 สัมประสิทธิ์
3.4 การวิเคราะห์เรสซิดวล เพื่อตรวจสอบความเหมาะสมของตัวแบบถดถอยและ ANOVA การ
ตรวจสอบพล็อตจะช่วยให้ทราบว่า ข้อสมมติกาลังสองน้อยที่สุดเป็นไปตามเงื่อนไขหรือไม่ หากสมมติฐาน
เป็นไปตามเงื่อนไข จากนั้นการถดถอยกาลังสองน้อยสุด จะประมาณค่าสัมประสิทธิ์ที่ไม่เอนเอียงที่มีความ
แปรปรวนน้อยที่สุด ใช้ Minitab พล็อตเรสซิดวล (ดังแสดงในรูปที่ 11)
รูปที่ 11 พล็อตเรสซิดวลของชั่วโมงบินเครื่องบิน และการใช้วัสดุในการบารุงรักษาหลัก
เรสซิดวลกับข้อมูล รูปที่ 11 คือพล็อตของเรสซิดวลทั้งหมด ที่ถูกรวบรวมข้อมูลและสามารถนามาใช้ใน
การหาความคลาดเคลื่อน พล็อตนี้ช่วยให้ตรวจสอบสมมติฐานที่เรสซิดวลที่ไม่เกี่ยวข้องกับปัจจัยอื่น ๆ รูปที่ 11
แสดงให้เห็นว่าเรสซิดวลแปรผันแบบสุ่ม และเป็นอิสระจากกัน
-26-
เรสซิดวลกับค่าเส้นมาตราฐาน รูปที่ 11 (ขวา) พล็อตนี้แสดงรูปแบบสุ่มของเรสซิดวล หากจุดอยู่ไกล
จากจุดส่วนใหญ่ อาจจะเป็นค่าผิดปกติ รูปแบบที่ไม่สามารถยอมรับได้ในพล็อตเรสซิดวล ตัวอย่างเช่น หากการ
แพร่กระจายของเรสซิดวลมีแนวโน้มที่จะเพิ่มขึ้นตามค่าเส้นมาตราฐานที่เพิ่มขึ้นนั้นอาจละเมิดสมมติฐานความ
แปรปรวนคงที่ ซึ่งในตัวอย่างนี้กราฟของข้อมูลมีการแจกแจงปกติ และเรสซิดวลมีความแปรปรวนคงที่
พล็อตความน่าจะเป็นปกติของเรสซิดวล รูปที่ 11 (ซ้าย) จุดในพล็อตนี้โดยทั่วไปควรเป็นไปตามเส้น
มาตราฐาน ถ้าเรสซิดวลมีการแจกแจงแบบปกติ หากจุดบนพล็อตออกห่างจากเส้นมาตราฐาน ข้อสมมติฐาน
ความปกติอาจไม่ถูกต้อง ในตัวอย่างนี้ จุดต่าง ๆ เป็นไปตามเส้นมาตราฐาน และเรสซิดวลถือได้ว่าเป็นการแจก
แจงแบบปกติ ฮิสโตแกรมเรสซิดวลมีที่มุมซ้ายล่าง สามารถใช้ในการตรวจสอบการกระจายของเรสซิดวล หากมี
หนึ่งหรือสองแท่งที่อยู่ห่างออกไป จากแถบอื่น ๆ สิ่งเหล่านี้อาจผิดปกติ
4. สรุปผลการวิจัย
วิธีการวิเคราะห์การถดถอย และวิธีการทานายนั้นง่ายต่อการเข้าใจ และใช้กันอย่างแพร่หลายมากขึ้น ใน
การใช้งานจริง สามารถวิเคราะห์รายละเอียดของข้อมูล เลือกวิธีการและตัวแบบที่เหมาะสม การสังเกตและการ
วิเคราะห์แผนภูมิกระจายอย่างรอบคอบ และระมัดระวังเพื่อให้ได้ผลการทานายจะเป็นที่ดี เมื่อใช้วิธีการทานาย
การถดถอย มีความจาเป็นต้องตรวจต้องว่ามีความสัมพันธ์ระหว่างตัวแปรหรือไม่ หากไม่มีความสัมพันธ์ระหว่าง
ตัวแปร วิธีการทานายการถดถอยของตัวแปรเหล่านี้จะส่งผลให้เกิดผลลัพธ์ที่ไม่ถูกต้อง เมื่อเราใช้การวิเคราะห์
การถดถอยอย่างถูกต้อง ควรใส่ใจกับการวิเคราะห์เชิงคุณภาพของความสัมพันธ์ระหว่างเหตุการณ์ หลีกเลี่ยงการ
อนุมานการทานายการถดถอย ใช้ข้อมูลที่เหมาะสม ในขณะเดียวกันวิธีการทานายการถดถอยเชิงเส้นที่นาเสนอ
ในงานวิจัยนี้ไม่เพียง แต่นาไปใช้กับการทานายการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน แต่ยังรวมถึงดัชนี
หรือพารามิเตอร์อุปกรณ์อื่น ๆ ซึ่งเป็นวิธีการทางวิทยาศาสตร์ และวิธีการสาหรับการพยากรณ์อุปกรณ์สนับสนุน
อื่นๆ ดังนั้นงานวิจัยนี้ได้นาวิธีการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย ในการพยากรณ์ของปริมาณการใช้วัสดุ
ในการบารุงรักษาอุปกรณ์การบิน พบว่า ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินกับชั่วการบินของ
เครื่องบินมีความสัมพันธ์เชิงเส้นกันที่ระดับความเชื่อมั่น 95 % และสามารถนาสมการถดถอยที่ได้ไปพยากรณ์
การใช้วัสดุในการบารุงรักษาเครื่องบินได้ถูกต้อง 91.24% คาดคะเนได้อย่างที่มีประสิทธิภาพ
อ้างอิง
1. Mendenhall, W. M., & Sincich, T. L. (2016). Statistics for Engineering and the Sciences. Chapman and
Hall/CRC.
2. Montgomery, D. C., &Runger, G. C. (2014). Applied statisticsand probabilityforengineers. John Wiley and
Sons.
3. Devore, J. L. (2011). Probability and Statistics for Engineering and the Sciences. Cengage learning.
4. Ott, R. L., & Longnecker, M. T. (2015). An introduction to statistical methods and data analysis. Nelson
Education.
5. Yang, Y. M., Yue, T. E. N. G., & Zhang, R. L. (2018). Prediction of Maintenance Material Consumption for
Aviation Equipment Using Linear Regression Model. DEStech Transactions on Computer Science and
Engineering, (mso).

More Related Content

What's hot

วงกลมหนึ่งหน่วย
วงกลมหนึ่งหน่วยวงกลมหนึ่งหน่วย
วงกลมหนึ่งหน่วยJiraprapa Suwannajak
 
ลำดับเลขคณิตในชีวิตประจำวัน
ลำดับเลขคณิตในชีวิตประจำวันลำดับเลขคณิตในชีวิตประจำวัน
ลำดับเลขคณิตในชีวิตประจำวันpoii
 
การแจกแจงความน่าจะเป็น
การแจกแจงความน่าจะเป็นการแจกแจงความน่าจะเป็น
การแจกแจงความน่าจะเป็นSariffuddeen Samoh
 
6 อนุกรมอนันต์
6 อนุกรมอนันต์6 อนุกรมอนันต์
6 อนุกรมอนันต์Toongneung SP
 
ระบบสัทอักษรภาษาจีน(พินอิน)
ระบบสัทอักษรภาษาจีน(พินอิน)ระบบสัทอักษรภาษาจีน(พินอิน)
ระบบสัทอักษรภาษาจีน(พินอิน)Siriya Khaosri
 
1.4 สถิติเชิงอนุมาน
1.4 สถิติเชิงอนุมาน1.4 สถิติเชิงอนุมาน
1.4 สถิติเชิงอนุมานSomporn Amornwech
 
พื้นที่ใต้เส้นโค้งปกติม.6
พื้นที่ใต้เส้นโค้งปกติม.6พื้นที่ใต้เส้นโค้งปกติม.6
พื้นที่ใต้เส้นโค้งปกติม.6KruGift Girlz
 
คู่มือSpss
คู่มือSpssคู่มือSpss
คู่มือSpsskuankaaw
 
สรุปตรีโกณมิติ
สรุปตรีโกณมิติสรุปตรีโกณมิติ
สรุปตรีโกณมิติThphmo
 
04 การเคลื่อนที่แบบต่างๆ
04 การเคลื่อนที่แบบต่างๆ04 การเคลื่อนที่แบบต่างๆ
04 การเคลื่อนที่แบบต่างๆwiriya kosit
 
ประวัตินักคณิตศาสตร์ที่สำคัญของโลก
ประวัตินักคณิตศาสตร์ที่สำคัญของโลกประวัตินักคณิตศาสตร์ที่สำคัญของโลก
ประวัตินักคณิตศาสตร์ที่สำคัญของโลกMuntana Pannil
 
สื่อPptยกกำลัง00
สื่อPptยกกำลัง00สื่อPptยกกำลัง00
สื่อPptยกกำลัง00kroojaja
 
ใบงานสมการ
ใบงานสมการใบงานสมการ
ใบงานสมการkanjana2536
 

What's hot (20)

60 ลำดับและอนุกรม ตอนที่2_การประยุกต์ลำดับเลขคณิตและเรขาคณิต
60 ลำดับและอนุกรม ตอนที่2_การประยุกต์ลำดับเลขคณิตและเรขาคณิต60 ลำดับและอนุกรม ตอนที่2_การประยุกต์ลำดับเลขคณิตและเรขาคณิต
60 ลำดับและอนุกรม ตอนที่2_การประยุกต์ลำดับเลขคณิตและเรขาคณิต
 
Gas genchem
Gas genchemGas genchem
Gas genchem
 
วงกลมหนึ่งหน่วย
วงกลมหนึ่งหน่วยวงกลมหนึ่งหน่วย
วงกลมหนึ่งหน่วย
 
ลำดับเลขคณิตในชีวิตประจำวัน
ลำดับเลขคณิตในชีวิตประจำวันลำดับเลขคณิตในชีวิตประจำวัน
ลำดับเลขคณิตในชีวิตประจำวัน
 
32 ความสัมพันธ์และฟังก์ชัน ตอนที่3_อินเวอร์สของความสัมพันธ์และบทนิยามของฟังก์ชัน
32 ความสัมพันธ์และฟังก์ชัน ตอนที่3_อินเวอร์สของความสัมพันธ์และบทนิยามของฟังก์ชัน32 ความสัมพันธ์และฟังก์ชัน ตอนที่3_อินเวอร์สของความสัมพันธ์และบทนิยามของฟังก์ชัน
32 ความสัมพันธ์และฟังก์ชัน ตอนที่3_อินเวอร์สของความสัมพันธ์และบทนิยามของฟังก์ชัน
 
การแจกแจงความน่าจะเป็น
การแจกแจงความน่าจะเป็นการแจกแจงความน่าจะเป็น
การแจกแจงความน่าจะเป็น
 
6 อนุกรมอนันต์
6 อนุกรมอนันต์6 อนุกรมอนันต์
6 อนุกรมอนันต์
 
ระบบสัทอักษรภาษาจีน(พินอิน)
ระบบสัทอักษรภาษาจีน(พินอิน)ระบบสัทอักษรภาษาจีน(พินอิน)
ระบบสัทอักษรภาษาจีน(พินอิน)
 
Thai1
Thai1Thai1
Thai1
 
1.4 สถิติเชิงอนุมาน
1.4 สถิติเชิงอนุมาน1.4 สถิติเชิงอนุมาน
1.4 สถิติเชิงอนุมาน
 
พื้นที่ใต้เส้นโค้งปกติม.6
พื้นที่ใต้เส้นโค้งปกติม.6พื้นที่ใต้เส้นโค้งปกติม.6
พื้นที่ใต้เส้นโค้งปกติม.6
 
คู่มือSpss
คู่มือSpssคู่มือSpss
คู่มือSpss
 
สรุปตรีโกณมิติ
สรุปตรีโกณมิติสรุปตรีโกณมิติ
สรุปตรีโกณมิติ
 
ค่ามาตรฐาน
ค่ามาตรฐานค่ามาตรฐาน
ค่ามาตรฐาน
 
04 การเคลื่อนที่แบบต่างๆ
04 การเคลื่อนที่แบบต่างๆ04 การเคลื่อนที่แบบต่างๆ
04 การเคลื่อนที่แบบต่างๆ
 
ประวัตินักคณิตศาสตร์ที่สำคัญของโลก
ประวัตินักคณิตศาสตร์ที่สำคัญของโลกประวัตินักคณิตศาสตร์ที่สำคัญของโลก
ประวัตินักคณิตศาสตร์ที่สำคัญของโลก
 
สื่อPptยกกำลัง00
สื่อPptยกกำลัง00สื่อPptยกกำลัง00
สื่อPptยกกำลัง00
 
42 ฟังก์ชันชี้กำลังและฟังก์ชันลอการิทึม ตอนที่5_อสมการลอการิทึม
42 ฟังก์ชันชี้กำลังและฟังก์ชันลอการิทึม ตอนที่5_อสมการลอการิทึม42 ฟังก์ชันชี้กำลังและฟังก์ชันลอการิทึม ตอนที่5_อสมการลอการิทึม
42 ฟังก์ชันชี้กำลังและฟังก์ชันลอการิทึม ตอนที่5_อสมการลอการิทึม
 
ใบงานสมการ
ใบงานสมการใบงานสมการ
ใบงานสมการ
 
Titration
TitrationTitration
Titration
 

Similar to Simple linear regression and correlation

Similar to Simple linear regression and correlation (20)

บทที่10.pdf
บทที่10.pdfบทที่10.pdf
บทที่10.pdf
 
เรขาคณิตวิเคราะห์
เรขาคณิตวิเคราะห์เรขาคณิตวิเคราะห์
เรขาคณิตวิเคราะห์
 
Matrix
MatrixMatrix
Matrix
 
สมการของเส้นตรง
สมการของเส้นตรงสมการของเส้นตรง
สมการของเส้นตรง
 
กฎของเลขยกกำลัง
กฎของเลขยกกำลังกฎของเลขยกกำลัง
กฎของเลขยกกำลัง
 
Ch3 high order_od_es
Ch3 high order_od_esCh3 high order_od_es
Ch3 high order_od_es
 
ตัวกำหนด(Determinant)
ตัวกำหนด(Determinant)ตัวกำหนด(Determinant)
ตัวกำหนด(Determinant)
 
พื้นที่ใต้โค้ง
พื้นที่ใต้โค้งพื้นที่ใต้โค้ง
พื้นที่ใต้โค้ง
 
43040989[1]
43040989[1]43040989[1]
43040989[1]
 
323232
323232323232
323232
 
43040989[1]
43040989[1]43040989[1]
43040989[1]
 
43040989[1]
43040989[1]43040989[1]
43040989[1]
 
Dk
DkDk
Dk
 
43040989[1]
43040989[1]43040989[1]
43040989[1]
 
43040989[1]
43040989[1]43040989[1]
43040989[1]
 
43040989[1]
43040989[1]43040989[1]
43040989[1]
 
43040989[1]
43040989[1]43040989[1]
43040989[1]
 
43040989
4304098943040989
43040989
 
43040989
4304098943040989
43040989
 
Contraction Mapping
Contraction MappingContraction Mapping
Contraction Mapping
 

Simple linear regression and correlation

  • 1. สารบัญ หน้า 1 บทนา 1 2 การถดถอยเชิงเส้นอย่างง่าย 1 3 การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด 4 3.1 การประมาณค่าจุดตัด และความชัน: 0 และ 1 4 3.2 การประมาณค่าความแปรปรวน: 2  7 4 คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด 11 5 การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น 13 5.1 การทดสอบสมมติฐานโดยการใช้ t-Test 13 5.2 การทดสอบสมมติฐานนัยสาคัญการถดถอยโดยใช้การวิเคราะห์ความแปรปรวน 15 6 ค่าสัมประสิทธิ์การตัดสินใจ 18 7 สหสัมพันธ์ 19 8 ตัวอย่างงานวิจัย 22
  • 2. สารบัญรูป รูปที่ หน้า 1 แผนภาพการกระจายของการอัด (y) กับแรงดัน(x) 2 2 เส้นสมมติของ 0 1( )E y x   4 3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย 5 4 ตัวอย่างความแปรปรวนของข้อมูล 7 5 แผนภาพการกระจายของค่าความต้านทาน (y) กับเปอร์เซ็นต์กาวอัด (x) 9 6 พล็อตของสมการถดถอยเชิงเส้นของตัวอย่างที่ 1 10 7 ไม่ปฏิเสธสมมติฐานหลัก 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y) 14 8 ปฏิเสธสมมติฐานหลัก 0 1: 0H   (มีความสัมพันธ์เชิงเส้นระหว่าง x และ y) 14 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R 21 10 พล็อตเส้นถดถอยของสายชั่วโมงของเครื่องบินและปริมาณการใช้วัสดุในการบารุงรักษา 23 11 พล็อตเรสซิดวลของชั่วโมงบินเครื่องบิน และการใช้วัสดุในการบารุงรักษาหลัก 25
  • 3. สารบัญตาราง ตารางที่ หน้า 1 ข้อมูลการทดสอบวัสดุแผ่นฉนวน 2 2 ข้อมูลความคลาดเคลื่อนที่เกิดขึ้นจากตัวอย่างค่าความต้านทานต่อการฉีกขาดของกระดาษ 11 3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย 16 4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016 22 5 การวิเคราะห์ความแปรปรวน 24 6 สรุปผลของแบบจาลองถดถอย 24 7 สัมประสิทธิ์ 25
  • 4. -1- การถดถอยเชิงเส้นอย่างง่ายและสหสัมพันธ์ (Simple linear regression and correlation) 1. บทนา การศึกษาความสัมพันธ์ของตัวแปรต่าง ๆ เป็นสิ่งที่มีความสาคัญในด้านวิศวกรรมและวิทยาศาสตร์ ตัวอย่างเช่น การศึกษาการใช้น้ามันเชื้อเพลิงของรถยนต์เกี่ยวข้องกับน้าหนักของรถยนต์หรือไม่ อายุการใช้งาน ของคมมีดที่ใช้ตัดเฉือนโลหะขึ้นอยู่กับความเร็วในการตัดเฉือนหรือไม่ ความต้านทานแรงดึงของเหล็กกับ ปริมาณคาร์บอนที่ผสมอยู่มีความสัมพันธ์กันหรือไม่ เป็นต้น ซึ่งการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรสอง ตัว หรือมากกว่า หากกาหนดตัวแปรอิสระ (Independent variable: x) และตัวแปรตาม (Dependent variable:y) การวิเคราะห์ว่าตัวแปร 2 ตัวแปรใด ๆ มีความสัมพันธ์หรือไม่นั้น สามารถใช้วิธีการด้านสถิติที่เรียกว่า การ วิเคราะห์สหสัมพันธ์ (Correlation analysis) หากพบว่าทั้ง 2 ตัวแปรมีความสัมพันธ์กัน โดยพบว่าตัวแปร x มีผล ต่อตัวแปร y หากต้องการศึกษาวิธีการนาตัวแปร x ใช้คาดคะเนผลที่อาจจะเกิดขึ้นได้ของตัวแปร y ด้วยวิธีการ ทางสถิติ เรียกว่า การวิเคราะห์ความถดถอย (Regression analysis) และหากตัวแปรต่าง ๆ มีความสัมพันธ์กันใน เชิงเส้นตรงจะเรียกว่า การวิเคราะห์การถดถอยเชิงเส้น (Linear regression analysis) โดยรายงานฉบับนี้จะเสนอ เนื้อหาที่เกี่ยวข้องกับการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย (Simple linear regression analysis) และ สหสัมพันธ์ (Correlation) 2. การถดถอยเชิงเส้นอย่างง่าย การวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรอิสระ (x) และตัว แปรตาม (y) โดยจะศึกษาตัวแปรอิสระเพียงตัวเดียวที่มีผลต่อตัวแปรตาม โดยใช้แผนภาพการกระจาย (Scatter diagram) ในการวิเคราะห์ความสัมพันธ์ เช่น ในการพัฒนาวัสดุแผ่นฉนวนชนิดใหม่ ต้องการคาดคะเนการอัด (y: หน่วยเป็น 0.1 นิ้ว) ของแผ่นฉนวนหนา 2 นิ้ว ภายใต้แรงดัน (x: หน่วยเป็น 10 ปอนด์/ตารางนิ้ว) ในระดับ ต่างๆ โดยทาการทดสอบชิ้นงาน 5 ชิ้น แสดงข้อมูลการทดสอบแสดงดังตารางที่ 1 จากข้อมูลสามารถสร้าง แผนภาพการกระจายได้ดังรูปที่ 1 (Mendenhall and Sincich, 2016, pp.485-486)
  • 5. -2- ตารางที่ 1 ข้อมูลการทดสอบวัสดุแผ่นฉนวน รูปที่ 1 แผนภาพการกระจายของการอัด (y) กับแรงดัน(x) (Mendenhall and Sincich, 2016, p.486) จากแผนภาพการกระจายแสดงในรูปที่ 1 สมมติว่าความสัมพันธ์ระหว่างการอัดชิ้นงาน (y) กับแรงดัน (x) มีแนวโน้มการเพิ่มขึ้นลักษณะเป็นเชิงเส้น ซึ่งตัวแบบจาลองการถดถอยเชิงเส้นอย่างง่าย (Simple linear regression model) จะมีรูปแบบแสดงดังสมการที่ (1) 0 1y x     (1) โดย y = ตัวแปรตาม (Dependent variable) x = ตัวแปรอิสระ (Independent variable)  = ค่าความคลาดเคลื่อนสุ่ม (Random error) 0 = จุดตัดแกนบน y (y-intercept) 1 = ความชัน (Slope) เมื่อ 0 และ 1 เป็นค่าพารามิเตอร์ที่ไม่ทราบค่า เรียกว่า สัมประสิทธิ์การถดถอย (Regression coefficient) เพื่อให้ได้เส้นที่เหมาะสมของตัวแบบถดถอยของชุดข้อมูลจะต้องประมาณค่าพารามิเตอร์ที่ไม่ทราบค่า ของเส้นถดถอยเฉลี่ย นั้นคือ 0 และ 1 การอนุมานที่ถูกต้องเกี่ยวกับ 0 และ 1 จะขึ้นอยู่กับการกระจายตัว ของข้อมูล ซึ่งจะขึ้นอยู่กับการแจกแจงความน่าจะเป็นของความคลาดเคลื่อนสุ่ม ( ) ดังนั้น ก่อนอื่นต้อง ตั้งสมมติฐานเฉพาะเกี่ยวกับ  ซึ่งเป็นพื้นฐานของการวิเคราะห์การถดถอยเชิงสถิติสามารถสรุปได้ดังนี้ ชิ้นงาน (Specimen) ความดัน (Pressure) การอัด (Compression) 1 1 1 2 2 1 3 3 2 4 4 2 5 5 4
  • 6. -3- สมมติฐานที่ 1 การแจกแจงความน่าจะเป็ นค่าเฉลี่ยของความคลาดเคลื่อนเท่ากับศูนย์: 0  นั้นคือ ค่าเฉลี่ยของความคลาดเคลื่อนเท่ากับศูนย์: ( ) 0E   สมมติฐานที่ 2 ความแปรปรวนของการแจกแจงความน่าจะเป็นของ ของตัวแปรอิสระ (x) นั้นมี ค่าคงที่ทั้งหมด สาหรับตัวแบบเส้นตรง สมมติฐานนี้หมายความว่าความแปรปรวน ของความคลาดเคลื่อนสุ่มมีค่าค่าคงที่เท่ากับ 2  สมมติฐานที่ 3 ค่าความคลาดเคลื่อน ( ) มีการแจกแจงความน่าจะแบบปกติ สมมติฐานที่ 4 ความคลาดเคลื่อนกระจายตัวแบบอิสระ ปราศจากอิทธิพลใด ๆ (Mendenhall and Sincich, 2016, p.487) หากมีการสมมติว่า ค่าเฉลี่ยของความคลาดเคลื่อนสุ่มเท่ากับศูนย์ : ( ) 0E   ดังนั้นค่าเฉลี่ยของ y คือ 0 1(Y ) ( )E x E x     0 1 ( )x E     0 1x   (2) และความแปรปรวนของค่าความคลาดเคลื่อนสุ่มคงที่เท่ากับ 2  : 2 ( )V   0 1(Y ) ( )V x V x     0 1( ) ( )V x V     2 0   2  (3) ค่าเฉลี่ยของ y ที่ระดับใดของ x แทนด้วยสัญลักษณ์ ( )E Y x จากข้อมูลในตารางที่ 1 ค่าเฉลี่ยของการอัด ชิ้นงาน (y) ที่เกิดขึ้นมีความสัมพันธ์กับแรงดัน (x) กราฟเส้นตรงที่มีจุดตัดแกนบน y ( 0 ) และความชัน ( 1 ) เมื่อ x เพิ่มขึ้น 1 หน่วย y จะเปลี่ยนไป 1 หน่วย และค่าเฉลี่ยของเส้นถดถอยอยู่ในรูป 0 1(y)E x   แสดงดังรูป ที่ 2
  • 7. -4- รูปที่ 2 เส้นสมมติของ 0 1(y)E x   (Mendenhall and Sincich, 2016, p.487) ดังนั้น รูปแบบการถดถอย 0 1(Y )E x x   เป็นเส้นตรงของค่าเฉลี่ยตัวแปรตาม (y) ที่ค่าใด ๆ ของ ตัวแปรอิสระ (x) การเปลี่ยนแปลงของค่าตัวแปรตาม (y) ที่เกิดขึ้นจริง และค่าที่เกิดจากการประมาณผ่านตัว แบบจาลองการถดถอยเชิงเส้น จะขึ้นอยู่กับความแปรปรวนของค่าความคลาดเคลื่อนสุ่ม ซึ่งในความเป็นจริงค่า ความชัน( 1 ) ค่าจุดตัดแกนบน y ( 0 ) และความแปรปรวนของค่าความคลาดเคลื่อนสุ่ม ( 2  ) ไม่สามารถระบุ ค่าได้จึงต้องทาการประมาณจากข้อมูลตัวอย่าง (Montgomery and Runger, 2014, pp.428-430) 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด 3.1 การประมาณค่าจุดตัดบนแกน y และความชัน ( 0 และ 1 ) ในการเลือกเส้นที่เหมาะสม (Best-fitting line) สาหรับชุดข้อมูลเพื่อประมาณค่า 0 และ 1 ซึ่งเป็น พารามิเตอร์ที่ไม่ทราบค่าของตัวแบบจาลองการถดถอยเชิงเส้น วิธีที่ง่ายและน่าสนใจที่สุด คือวิธีกาลังสองน้อย ที่สุด (Method of least squares) แสดงดังรูปที่ 3 เส้นที่เหมาะสมบนแผนภาพการกระจายของข้อมูลจากตารางที่ 1 โดยทาให้เส้นที่เหมาะสมมีค่าผลรวมของผลต่างระหว่างค่าของข้อมูลจริงกับเส้นประมาณค่าถดถอยมีค่าน้อย ที่สุด (Mendenhall and Sincich, 2016, p.489) เมื่อทาการเก็บข้อมูล n ตัวอย่าง โดยมีคู่ลาดับของค่า x และค่า y กล่าวคือ 1 1( , ),x y 2 2( , ),x y ..., ( , )n nx y ดังนั้นค่ารูปแบบจาลองการถดถอยเชิงเส้น มี n ตัวอย่างที่ค่า iy ณ คู่อันดับ ix แสดงดังสมการ 0 1i i iy x     , i = 1,2,…,n (4)
  • 8. -5- เนื่องจากค่าความคลาดเคลื่อนนั้นสามารถเป็นได้ทั้งค่าบวกและค่าลบ ดังนั้นจึงต้องทาให้อยู่ในรูป ผลรวมกาลังสองของความคลาดเคลื่อน (Sum of squares for error: L ) ที่ได้จากการสังเกตจริง คือ 2 2 0 1 1 1 ( ) n n i i i i i L y x          (5) การประมาณค่า 0 และ 1 เขียนแทนด้วย 1 ˆ และ 0 ˆ โดยวิธีกาลังสองน้อยที่สุด ด้วยการหาค่าอนุพันธ์ เชิงส่วน เทียบกับ 0 และ 1 แล้วกาหนดให้สมการเท่ากับศูนย์ได้ดังนี้ (Devore, 2011, pp.478-479) 0 1 0 1 1ˆ ˆ0 , ˆ ˆ2 ( ) 0 n i i i L y x               (6) 0 1 0 1 1ˆ ˆ1 , ˆ ˆ2 ( ) 0 n i i i i L y x x               (7) เมื่อจัดรูปสมการที่ (6) และ (7) จะได้รูปสมการปกติ คือ 0 1 1 1 ˆ ˆ n n i i i i n x y       (8) 2 0 1 1 1 1 ˆ ˆ n n n i i i i i i i x x y x         (9) รูปที่ 3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย (Mendenhall and Sincich, 2016, p.489)
  • 9. -6- จากสมการที่ (8) และ (9) คือสมการกาลังสองน้อยที่สุด สามารถคานวณหาค่าจุดตัดแกนบน y ( 0 ˆ ) และความชัน ( 1 ˆ ) ได้ดังนี้ 0 1 ˆ ˆy x   (10) 1 1 1 1 2 2 1 1 ˆ n n i in i i i i i n in i i i y x y x n x x n                            (11) โดยที่ 1 1 n i i y y n    และ 1 1 n i i x x n    ดังนั้นเส้นประมาณการถดถอย (Estimated regression line) ที่เหมาะสม คือ 0 1 ˆ ˆˆ iy x   (12) สาหรับแต่ละคู่ลาดับของข้อมูล (x, y) ที่ได้จากการสังเกตจริง แสดงดังสมการต่อไปนี้ 0 1 ˆ ˆ i i iy x e    , i = 1,2,…,n (13) โดยที่ ˆi ie y y  เรียกว่า ค่าเรสซิดวล (Residual) หรือค่าความคลาดเคลื่อน เป็นค่าความแตกต่างระหว่างค่า ของข้อมูลจริงกับเส้นประมาณค่าถดถอย จากสมการที่ (11) ความชัน ( 1 ˆ ) สามารถแสดงใหม่ได้ดังนี้ 2 12 2 1 1 ( ) n in n i xx i i i i i x S x x x n                (14) 1 1 1 1 ( )( ) n n i in n i i xy i i i i i i x y S y y x x x y n                      (15) ดังนั้น 1 ˆ xy xx S S   (16) (Montgomery and Runger, 2014, pp.431-433)
  • 10. -7- 3.2 การประมาณค่าความแปรปรวน: 2  การประมาณค่าเส้นถดถอยนั้นจะถูกต้องใกล้เคียงค่าจริงมากเพียงใดสามารถทราบได้จาก ค่าความคลาด เคลื่อนที่เกิดขึ้นระหว่างค่าของข้อมูลที่ได้จากการสังเกต และค่าที่ได้รับจากเส้นถดถอย หากค่า 2  มีค่ามากจะ สังเกตได้ว่าคู่อันดับ (x, y) มีค่าที่ค่อนข้างกระจายออกไปจากเส้นถดถอย ในขณะที่ 2  มีค่าน้อยการสังเกตได้ว่า การกระจายของข้อมูลจะอยู่ใกล้กับเส้นถดถอย แสดงดังรูปที่ 4 ดังนั้นหากค่า 2  มีค่าน้อย ข้อมูลมีค่าการกระจาย ใกล้กับเส้นถดถอยมากเพียงใด แสดงว่าสมการถดถอยที่ได้สามารถนาไปพยากรณ์ค่า y ได้ถูกต้องมากเท่านั้น รูปที่ 4 ตัวอย่างความแปรปรวนของข้อมูล (Devore, 2011, p.481) การประมาณค่าความแปรปรวนของความคลาดเคลื่อนเป็นค่าพารามิเตอร์อีกตัวที่ไม่ทราบค่าของตัว แบบถดถอยคือ 2  โดยที่เรสซิดวล ˆi ie y y  ถูกใช้เพื่อให้ได้ค่าประมาณ 2  ซึ่งค่าเรสซิดวลจะมีค่าเป็นไป ได้ทั้งบวกและลบ จึงต้องกาหนดค่าให้อยู่ในรูปของผลรวมกาลังสองของเรสซิดวล (Error sum of squares: ESS ) สามารถคานวณได้ (Ott and Longnecker, 2015, p.546) 2 1 n E i i SS e    (17) 2 1 ˆ( ) n i i y y    โดยองศาอิสระ (Degrees of freedom) คือ 2n  เนื่องจาก ตัวแบบความสัมพันธ์ถดถอยเชิงเส้น 0 1 ˆ ˆˆ iy x   มีค่าประมาณของพารามิเตอร์ประกอบด้วย 1 ˆ และ 0 ˆ จะเห็นได้ว่าค่าเฉลี่ยของผลรวมกาลังสอง ของเรสซิดวล คือ 2 ˆ( ) ( 2)EE SS n   ดังนั้นค่าประมาณความแปรปรวนของเรสซิดวลที่ไม่เอนเอียงคือ (Montgomery and Runger, 2014, p.435)
  • 11. -8- 2 2 1 ˆ 2 n i i e n      (18) 2 2 ˆ 2 E E SS MS S n      หากค่า 2 ˆ มีค่ามากแสดงว่าสมการถดถอยที่ประมาณได้นี้มีความเหมาะสมน้อย เนื่องจากค่า y จะอยู่ ห่างจากเส้นถดถอยมากแต่ถ้าค่า 2 ˆ มีค่าน้อยแสดงว่าสมการถดถอยที่ประมาณได้นี้มีความเหมาะสมมาก เนื่องจากค่า y จะอยู่ใกล้เส้นถดถอยมาก ตัวอย่างที่ 1 โรงงานผลิตกระดาษแห่งหนึ่ง ได้ทาการศึกษาข้อมูลระหว่างค่าความต้านทานการฉีกขาดของ กระดาษ (y: 10 นิวตัน/ตารางมิลลิเมตร) กับเปอร์เซ็นต์ของกาวอัด (x) ที่ใช้เป็นส่วนผสมในการ ผลิตกระดาษ โดยสุ่มเก็บรวบรวมข้อมูลมา 10 ตัวอย่างดังนี้คือ จากข้อมูลข้างต้น หากต้องการทราบความสัมพันธ์ระหว่างกับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสม ในการผลิตกระดาษ กับความต้านทานต่อการฉีกขาดของกระดาษ จะทาการพิจารณาตัวแบบเชิงเส้นอย่างง่าย ดังต่อไปนี้ 0 1y x     โดยที่ x = เปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ (ตัวแปรอิสระ) y = ค่าความต้านทานต่อการฉีกขาดของกระดาษ (ตัวแปรตาม) ทั้งนี้สามารถทาการศึกษาเบื้องต้นถึงความสัมพันธ์ที่เกิดขึ้นระหว่าง x และ y โดยการใช้แผนภูมิการ กระจายซึ่งสามารถแสดงต่อไปนี้ ตัวอย่างที่ 1 2 3 4 5 6 7 8 9 10 x 1.6 1.5 1.5 1.4 2.0 2.0 2.2 2.4 2.5 2.5 y 10.1 11.7 11.7 11.5 13.1 13.2 14.2 14.0 13.7 14.1
  • 12. -9- รูปที่ 5 แผนภาพการกระจายของค่าความต้านทานต่อการฉีกขาดของกระดาษ (y) กับเปอร์เซ็นต์กาวอัด (x) จากแผนภาพการกระจายในรูปที่ 5 จะสามารถเห็นถึงความสัมพันธ์ระหว่าง 2 ตัวแปรได้ว่าน่าจะมี ความสัมพันธ์กันในเชิงเส้นตรง และมีความสัมพันธ์ในทิศทางเดียวกัน เนื่องจากเมื่อพิจารณาจากลักษณะของจุด พบว่าเมื่อ x มีค่าสูงขึ้น y จะมีค่าสูงขึ้นด้วย ดังนั้นในการใช้ค่าของข้อมูลวิเคราะห์ความสัมพันธ์ของตัวแปรต้น และตัวแปรตาม ซึ่งมีข้อมูลดังต่อไปนี้ 10n  , 10 1 19.60i i x   , 10 1 127.30i i y   , 10 1 254.30i i i y x   , 10 2 1 40.12i i x   , 10 2 1 1638.03 i y   , 1.96x  และ 12.73y  จากข้อมูลคานวณค่าสัมประสิทธิ์ของสมการ การถดถอยเชิงเส้นอย่างง่าย ได้ดังนี้   210 2 10 12 1 19.60 40.12 1.704 10 i i xx i i x S x n                  10 10 10 1 1 1 19.60 127.30 254.3 4.7 10 0 92 i i i i xy i i i x y S x y n                   
  • 13. -10- ค่าความชัน และค่าจุดตัดบนแกน y 1 4.792ˆ 2.812 1.704 xy xx S S     0 1 ˆ ˆ 12.73 (2.812 1.96) 7.218y x       ดังนั้น สมการถดถอยเชิงเส้นอย่างง่ายที่ประมาณได้ ˆ 7.218 2.812y x  แสดงดังรูปที่ 6 รูปที่ 6 พล็อตของสมการถดถอยเชิงเส้นของตัวอย่างที่ 1 จากสมการถดถอยที่ได้อธิบายได้ว่า เมื่อ 0x  จะได้ ˆ 7.218 2.812(0) 7.218y    หมายความว่า ถ้าไม่มีอิทธิพลของกาวอัดเลย ค่าความต้านทานต่อการฉีกขาดของกระดาษจะเท่ากับ 72. 18 นิวตันต่อตาราง มิลลิเมตร (เนื่องจากหน่วยของค่าความต้านทานในตัวอย่างที่ 1 เท่ากับ 10 นิวตันต่อตารางมิลลิเมตร ดังนั้น 7.218 10 72.18  )
  • 14. -11- ตารางที่ 2 ข้อมูลความคลาดเคลื่อนที่เกิดขึ้นจากตัวแบบและค่าสังเกตจากตัวอย่างค่าความต้านทานต่อการฉีก ขาดของกระดาษ แสดงดังนี้ โดยมี ค่าประมาณความแปรปรวนของเรสซิดวล สามารถคานวณได้ดังนี้ 2 2 2 1 (4.02) ˆ 0.503 2 10 2 n i i e n         4. คุณสมบัติของตัวประมาณค่าโดยวิธีกาลังสองน้อยที่สุด คุณสมบัติทางสถิติของค่าประมาณพารามิเตอร์ (สัมประสิทธิ์) 0 ˆ และ 1 ˆ ของตัวแบบความสัมพันธ์เชิง เส้นด้วยวิธีกาลังสองน้อยที่สุด อธิบายได้จากข้อสมมติของข้อมูลความคลาดเคลื่อน ( ) ในตัวแบบ 0 1y x     ที่มีค่าเฉลี่ยของความคลาดเคลื่อนสุ่มเท่ากับศูนย์ และความแปรปรวนมีค่าคงที่ 2  เมื่อตัว แปรสุ่ม y มีค่าเฉลี่ย 0 1( )E Y x x   และความแปรปรวนมีค่าคงที่ 2  โดยที่ค่าของ 0 ˆ และ 1 ˆ ขึ้นอยู่กับ ค่าที่ได้จากการสังเกต ดังนั้นค่าประมาณกาลังสองน้อยที่สุดของสัมประสิทธิ์การถดถอยอาจถูกมองว่าเป็นตัว แปรสุ่ม พิจารณา 1 ˆ เป็นส่วนประกอบเชิงเส้นของค่าสังเกต iy แสดงค่าเฉลี่ยของ 1 ˆ คือ  1 1 ˆE   (19) ตัวอย่างที่ x y 1 1.60 10.10 11.72 -1.62 2.62 2 1.50 11.70 11.44 0.26 0.07 3 1.50 11.70 11.44 0.26 0.07 4 1.40 11.50 11.16 0.34 0.12 5 2.00 13.10 12.84 0.26 0.07 6 2.00 13.20 12.84 0.36 0.13 7 2.20 14.20 13.40 0.80 0.63 8 2.40 14.00 13.97 0.03 0.00 9 2.50 13.70 14.25 -0.55 0.30 10 2.50 14.10 14.25 -0.15 0.02 ผลรวม 19.60 127.30 127.30 0.00 4.02 ieˆiy 2 ie
  • 15. -12- ดังนั้น 1 ˆ คือค่าประมาณที่ไม่เอนเอียง (Unbiased estimator)ในตัวแบบการถดถอยเชิงเส้นของความชันจริง เมื่อพิจารณาความแปรปรวนของค่าประมาณพารามิเตอร์ 1 ˆ เนื่องจากข้อสมมติความแปรปรวนของค่า ความคลาดเคลื่อนสุ่มคือ 2 ( )V   ก็จะได้ว่า 2 ( )iV y  เนื่องจาก 1 ˆ ส่วนประกอบเชิงเส้นของค่าสังเกต iy ดังนั้นจะได้ความแปรปรวนความชันคือ   2 1 ˆ xx V S    (20) สาหรับจุดตัดบนแกน y สามารถแสดงในลักษณะที่คล้ายกัน ได้ว่า  0 0 ˆE   (21)   2 2 0 1ˆ xx x V n S          (22) ดังนั้น 0 ˆ เป็นค่าประมาณที่ไม่เอนเอียงของจุดตัด 0 การประมาณ 2  ในสมการ (20) และ (22) เพื่อประมาณการความแปรปรวนของความชันและจุดตัด ผลจากการคานวณหารากที่สองของความแปรปรวนเรียกว่า ความคลาดเคลื่อนมาตรฐานโดยประมาณ (Estimated standard error) ของความชันและจุดตัด ดังนั้นในการถดถอยเชิงเส้นความคลาดเคลื่อนมาตรฐาน โดยประมาณของความชันได้จาก   2 1 ˆˆ xx se S    (23) และความคลาดเคลื่อนมาตรฐานโดยประมาณของจุดตัด สามารถหาได้จาก   2 2 0 1ˆ ˆ xx x se n S    (24) โดยที่ค่าความคลาดเคลื่อนมาตรฐานโดยประมาณเป็นค่าที่ใช้ในการวัดความถูกต้องแม่นยาของการ ประมาณค่าสัมประสิทธิ์ตัวแบบความสัมพันธ์ด้วยวิธีกาลังสองน้อยที่สุด นั่นคือค่าความคลาดเคลื่อนยิ่งน้อยยิ่งดี นั่นเอง (Montgomery and Runger, 2014, pp.440-441)
  • 16. -13- 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น สิ่งที่สาคัญในการวิเคราะห์ความเหมาะสมของตัวแบบถดถอยเชิงเส้นคือ การทดสอบสมมติฐานทาง สถิติของค่าประมาณพารามิเตอร์ ได้แก่ค่าความชันและจุดตัด โดยมีสมมติฐานคือ ค่าความคลาดเคลื่อน ( ) และ ตัวแบบถดถอยมีการแจกแจงแบบปกติ ค่าความคลาดเคลื่อนมีความเป็นอิสระต่อกันที่มีค่าเฉลี่ยเท่ากับศูนย์และ มีความแปรปรวนคงที่ 2  5.1 การทดสอบสมมติฐานโดยการใช้ t-Test การทดสอบสมมติฐานว่าความชันเท่ากับค่าคงที่ นั้นคือ 1,0 สมมติฐานคือ สมมติฐานหลัก 0 1 1,0:H   สมมติฐานรอง 1 1 1,0:H   โดยที่ตัวสถิติทดสอบความชัน ใช้การทดสอบแบบที จะได้ว่า   1 1,0 1 1,0 0 2 1 ˆ ˆ ˆˆ xx T seS          (25) ซึ่งการแจกแจงแบบทีด้วยองศาอิสระ 2n ภายใต้ 0 1 1,0:H   จะปฏิเสธสมมติฐานหลัก เมื่อ 0 2, 2nt t  (26) สาหรับการทดสอบสมมติฐานค่าคงที่ของจุดตัด ( 0,0 ) ดังนี้   0 0,0 0 0,0 0 2 02 ˆ ˆ ˆ1 ˆ xx T sex n S                 (27) และปฏิเสธสมมติฐานหลักค่าที่คานวณได้ของตัวสถิติการทดสอบ เมื่อ 0 2, 2nt t  โดยการทดสอบสมมติฐานนั้นมีความสาคัญ เนื่องเป็นการทดสอบเพื่อศึกษานัยสาคัญของความสัมพันธ์ มีสมมติฐานคือ 0 1: 0H   (ค่าคงที่เท่ากับศูนย์แสดงว่าแสดงว่าไม่มีความสัมพันธ์ระหว่าง x และ y) 1 1: 0H   (ค่าคงที่ไม่เท่ากับศูนย์แสดงว่า มีความสัมพันธ์ระหว่าง x และ y)
  • 17. -14- หากไม่ปฏิเสธสมมติฐานหลัก 0 1: 0H   สรุปได้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y แสดง ดังรูป 7 เมื่อข้อมูลมีค่าแปรปรวนน้อยและการประมาณค่า y ที่ x ใดๆ คือ ˆy y ดังรูปที่ 7 (a) หรือในกรณีที่ ความสัมพันธ์ที่แท้จริงระหว่าง x และ yไม่ใช่ความสัมพันธ์เชิงเส้นมีค่าแปรปรวนของข้อมูลมาก ดังรูปที่ 7 (b) และในกรณีหากปฏิเสธสมมติฐานหลัก 0 1: 0H   ก็หมายความว่า มีความสัมพันธ์ระหว่าง x และ y รูปที่ 8 การปฏิเสธสมมติฐานหลักอาจหมายถึงว่ารูปแบบความสัมพันธ์เชิงตรงนั้นมีความเหมาะสม ดังรูปที่ 8 (a) รูปที่ 7 ไม่ปฏิเสธสมมติฐานหลัก 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y) (Montgomery and Runger, 2014, p.442) รูปที่ 8 ปฏิเสธสมมติฐานหลัก 0 1: 0H   (มีความสัมพันธ์เชิงเส้นระหว่าง x และ y) (Montgomery and Runger, 2014, p.443)
  • 18. -15- 5.2 การทดสอบสมมติฐานนัยสาคัญการถดถอยโดยใช้การวิเคราะห์ความแปรปรวน เป็นการวิเคราะห์ความแปรปรวนที่ใช้เพื่อทดสอบนัยสาคัญของการถดถอย ซึ่งการวิเคราะห์ความ แปรปรวนมีดังนี้ 2 2 2 1 1 1 ˆ ˆ( ) ( ) ( ) n n n i i i i i i i y y y y y y           (28) 2 1 ˆ( ) n R i i SS y y    ผลรวมกาลังสองของความคลาดเคลื่อนจากการถดถอย (Regression sum of squares) 2 1 ˆ( ) n E i i i SS y y    ผลรวมกาลังสองของความคลาดเคลื่อน (Error sum of squares) เขียนสมการใหม่ได้ว่า T R ESS SS SS  (29) โดยที่ 2 1 ( ) n T i i SS y y    2 12 1 n in i i i y y n            (30) 1 ˆ R xySS S (31) E T RSS SS SS  (32) หากสมมติฐานหลัก 0 1: 0H   เป็นจริง จะได้ว่า 0 1 ( 2) R R E E SS MS F SS n MS    (33) การแจกแจงแบบเอฟ โดยมีองศาอิสระ 2n จะปฏิเสธสมมติฐานหลัก ถ้า 0 ,1, 2nf f  พบว่าค่าสถิติ เอฟที่ได้จากการคานวณมากกว่าค่าที่เกิดจากการเปิดตารางเอฟ (Montgomery and Runger, 2014, p.443)
  • 19. -16- ตารางที่ 3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย แหล่งที่มา (Source of variation) ผลบวกกาลังสอง (Sum of Squares) องศาอิสระ (Degrees of Freedom) ค่าเฉลี่ย (Mean Square) ค่าสถิติ 0( )F ตัวแบบ (Regression) RSS 1 RMS 0 R EF MS MS ค่าความคลาดเคลื่อน (Error) ESS 2n  EMS ทั้งหมด (Total) TSS 1n  ตัวอย่างที่ 2 จากตัวอย่างที่ 1 ทดสอบสมมติฐานว่าความสัมพันธ์ของความต้านทานต่อการฉีกขาดของกระดาษ กับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษเป็นแบบเชิงเส้นที่ระดับนัยสาคัญ 5% หรือไม่ สมการถดถอยเชิงเส้นอย่างง่ายที่ได้จากตัวอย่างที่ 1 คือ ˆ 7.218 2.812y x  การทดสอบสมมติฐานโดยการใช้ t-Test 10n  , 1 ˆ 2.812  , 1.704xxS  , 2 ˆ 0.503  สมมติฐาน 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้น) 0 1: 0H   (มีความสัมพันธ์เชิงเส้น) 0.05  ตัวสถิติทดสอบ 2 1 1,0 0 ˆ ˆ 0 2.812 5.176 0.503 1.704 ˆ xx T S          ปฏิเสธ 0H ถ้า 0T > ( 0.025,8 2.306t  ) สรุป เนื่องจาก ( 0 5.176T  ) > ( 0.025,8 2.306t  ) ดังนั้น ปฏิเสธ 0 1: 0H   ที่ระดับนัยสาคัญ 0.05 มี หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่ ใช้เป็นส่วนผสมในการผลิตกระดาษ
  • 20. -17- ทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน 10n  , 10 1 127.30i i y   , 10 2 1 1638.03 i y   , 12.73y  , ˆ 127.3iy  , 1 ˆ 2.812  และ 4.792xyS  สมมติฐาน 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้น) 0 1: 0H   (มีความสัมพันธ์เชิงเส้น) 0.05  ปฏิเสธ 0H ถ้า 0 ,1, 2nF f  = 0 0.05,1,8( 5.32)F f  2 1 ˆ( ) 4.02 n E i i i SS y y     13.475 13.475 1 1 R R SS MS    1 ˆ 2.812 4.792 13.475R xySS S    4.02 0.503 ( 2) 10 2 E E SS MS n      2 2 12 1 127.3 1638.03 17.501 10 n in i T i i y SS y n               0 13.475 26.78 0.5025 R E MS F MS    แหล่งที่มา (Source of variation) ผลบวกกาลังสอง (Sum of Squares) องศาอิสระ (Degrees of Freedom) ค่าเฉลี่ย (Mean Square) ค่าสถิติ 0( )F ตัวแบบ (Regression) 13.475 1 13.475 26.78 ค่าความคลาดเคลื่อน (Error) 4.020 8 0.503 ทั้งหมด (Total) 17.501 9 สรุป เนื่องจาก 0 0.05,1,8( 26.78) ( 5.32)F f   ดังนั้น ปฏิเสธ 0 1: 0H   ที่ระดับนัยสาคัญ 0.05 มี หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่ ใช้เป็นส่วนผสมในการผลิตกระดาษ
  • 21. -18- 6. ค่าสัมประสิทธิ์การตัดสินใจ เมื่อทาการวิเคราะห์การถดถอยของข้อมูลตัวแปรอิสระ (X) และตัวแปรตาม (Y) แล้วสมการถดถอยที่ ประมาณได้จะนาไปใช้ประโยชน์ในการพยากรณ์ค่าของตัวแปรตาม (Y) เมื่อกาหนดค่าของตัวแปรอิสระ (X) มา ให้แต่สมการถดถอยที่ใช้ในการพยากรณ์นี้อาจพยากรณ์ค่าตัวแปรตาม (Y) ได้ดีหรือไม่ดีก็ได้ โดยที่ ค่า สัมประสิทธิ์การตัดสินใจ (Coefficient of Determination; 2 R ) เป็ นค่ายกกาลังสองของค่าสัมประสิทธิ์ สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y ซึ่งค่าสัมประสิทธิ์การตัดสินใจนี้เป็นค่าที่ใช้บอกเปอร์เซ็นต์การ เปลี่ยนแปลงของตัวแปรตาม (Y) ที่สามารถอธิบายได้ด้วยตัวแปรอิสระ (X) ในสมการถดถอย หาค่า 2 R ได้จาก 2 2 1 1 ˆ ˆ XX XY R T T T S S SS R SS SS SS     (34) โดยที่ (ค่า 2 R จะมีค่าอยู่ระหว่าง 0 ถึง 1) ยิ่งค่าของ 2 R สูงขึ้นเท่าไร แสดงว่าสมการถดถอยสามารถ พยากรณ์ค่าของตัวแปรตาม (Y) ได้ดีมากยิ่งขึ้น และหาก 2 R มีค่าน้อย สมการถดถอยพยากรณ์ค่าของตัวแปร ตาม (Y) ได้ไม่ดี หรือตัวแปรอิสระ (X) ในสมการถดถอยนั้นอธิบายการเปลี่ยนแปลงของตัวแปรตาม (Y) ได้ไม่ดี เนื่องจากตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันน้อย (Devore, 2011, p.485) ตัวอย่างที่ 3 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้ คือ ˆ 7.218 2.812y x  คานวณค่าสัมประสิทธิ์ของการ ตัดสินใจ จากมูลในตัวอย่างที่ 2 ได้ค่าต่าง ๆ ดังนี้ 13.475RSS  และ 17.501TSS  2 13.475 0.77 17.501 R T SS R SS    จึงสรุปได้ว่า ค่า 2 0.77R  หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษขึ้นอยู่กับ เปอร์เซ็นต์ของกาวอัดประมาณ 77% ส่วนอีก 23% จะขึ้นอยู่กับปัจจัยอื่น ๆ ที่ไม่ได้นามาศึกษาหรือสมการ ถดถอย ˆ 7.218 2.812y x  สามารถพยากรณ์ค่าค่าความต้านทานต่อการฉีกขาดของกระดาษได้ถูกต้อง 77%
  • 22. -19- 7. สหสัมพันธ์ สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างข้อมูลหรือตัวแปรตั้งแต่ 2 ตัวขึ้นไป ใช้สาหรับการ ทดสอบความสัมพันธ์เชิงเส้นตรงว่ามีความสัมพันธ์กันในระดับใด และมีความสัมพันธ์ในทิศทางใด เช่นความ สูงกับน้าหนักว่ามีความสัมพันธ์กันมากหรือน้อย และมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้ามโดยใน การตรวจสอบนั้นจะตรวจสอบด้วยการใช้แผนภาพการกระจายและค่าสัมประสิทธิ์สหสัมพันธ์ (correlation coefficient) โดยในการวิเคราะห์การถดถอยนั้นได้มีสมมติฐานว่า X เป็นตัวแปรที่ควบคุมได้ ด้วยความคลาด เคลื่อนเล็กน้อย และ Y เป็นตัวแปรสุ่ม การศึกษาค่าของข้อมูลจากสังเกตที่ได้รับเป็นคู่ระหว่าง ( , )i iX Y จึงเป็น การศึกษาการแจกแจงตัวแปรสุ่มร่วม โดยมีฟังก์ชั่นการแจกแจง  ,f x y ตัวอย่างเช่นการศึกษาความสัมพันธ์ ความต้านทานแรงดึงของรอยเชื่อม ซึ่งในตัวอย่างนี้เราไม่สามารถควบคุมขนาดการเชื่อมได้ จึงต้องทาการสุ่ม รอยเชื่อม n ตัวอย่าง และเก็บข้อมูลจากสังเกตขนาดรอยเชื่อม ( )iX และความต้านทานแรงดึง ( )iY ดังนั้น ( , )i iX Y จึงเป็นการแจกแจงตัวแปรสุ่มร่วม (Montgomery and Runger, 2014, pp.457-458) สมมติว่า การแจกแจงร่วมของ iX และ iY เป็นการแจกแจงแบบปกติของสองตัวแปรสุ่ม (Bivariate normal distribution) โดยมีค่าเฉลี่ยของตัวแปรคือ X และ Y ความแปรปรวนของตัวแปรคือ 2 X และ 2 Y และกาหนดให้  คือสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปร X และ Y ได้ว่า XY X Y      (35) โดยที่ XY คือความแปรปรวนร่วมระหว่าง X และ Y การแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y กาหนดให้ X x คือ 2 0 11 1 ( ) exp 22 x Y x Y xY x y f y                 (36) เมื่อ 0 Y Y X X         (37) 1 Y X      (38) และความแปรปรวนของการแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y กาหนดให้ X x คือ
  • 23. -20- 2 2 2 (1 )YY x     (39) ดังนั้นการแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y ให้ X x เป็นการแจกแจงแบบปกติด้วยค่าเฉลี่ย 0 1E( )Y x x   (40) และความแปรปรวน 2 Y x  ดังนั้นค่าเฉลี่ยของการแจกแจงแบบมีเงื่อนไขของ Y ให้ X x เป็นแบบจาลองการ ถดถอยเชิงเส้นอย่างง่าย นอกจากนี้ค่าสัมประสิทธิ์สหสัมพันธ์( ) และสัมประสิทธิ์ความชัน 1( ) จากสมการ 38 จะเห็นว่าหาก 0  ดังนั้น 1 0  ซึ่งหมายความว่าไม่มีการถดถอยของ Y บน X สาหรับการประมาณค่าพารามิเตอร์ 0 และ 1 แสดงดังสมการ (10 และ 16) โดยวิธีกาลังสองน้อย ที่สุด เช่นเดียวกับกรณีการวิเคราะห์การถดถอยที่มีสมมติฐานว่า X เป็นตัวแปรที่ควบคุมได้ โดยการประมาณของ  สัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Sample Correlation Coefficient: R) 1 1 2 1 2 2 2 1 1 ( ) ˆ ( SS ) ( ) (Y ) n i i i XY n n XX T i i i i Y X X S R S X X Y                   (41) คุณสมบัติที่สาคัญที่สุดของ R คือ: 1. ค่าของ R ไม่ได้ขึ้นอยู่กับการศึกษาภายใต้ตัวแปรสองตัว 2. ค่า R เป็นอิสระจากการตรวจวัดของ x และ y 3. ค่า R จะ มีค่าอยู่ในช่วง 1 1R   4. 1R  เมื่อ x มีค่ามาก y มีค่ามาก หรือเมื่อ x มีค่าน้อย y มีค่าน้อย (มีความสัมพันธ์เชิงเส้นเชิงบวก) 1R   เมื่อ x มีค่ามาก y มีค่าน้อย หรือเมื่อ x มีค่าน้อย y มีค่ามาก (มีความสัมพันธ์เชิงเส้นเชิงลบ) 5. ค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าค่าสัมประสิทธิ์การตัดสินใจ (Devore, 2011, p.510) ซึ่งการตรวจสอบความสัมพันธ์ ทาการตรวจสอบโดยแผนภาพกระจายข้อมูล รูปที่ 9 แสดงสถานการณ์ ที่เป็นไปได้สาหรับค่าของ R ในรูปที่ 9 (d) แสดงให้เห็นความสัมพันธ์ระหว่าง x และ y แต่ R=0 ซึ่งเป็น ความสัมพันธ์เชิงเส้นโค้ง ดังนั้นเมื่อ R=0 จะไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y ซึ่งจะแสดงให้เห็นถึง ความสาคัญของการพิจารณาข้อมูลด้วยแผนภาพการกระจาย (Ott and Longnecker, 2015, p.591)
  • 24. -21- รูปที่ 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R (Ott and Longnecker, 2015, p.591) ตัวอย่างที่ 4 จงหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าความต้านทานต่อการฉีกขาดของกระดาษและ เปอร์เซ็นต์กาวอัด จากข้อมูลในตัวอย่างที่ 1 และ2 ได้ค่าต่าง ๆ ดังนี้ 4.792xyS  , 1.704xxS  และ 17.501TSS  1 2 1 2 4.792 ˆ 0.878 ( SS ) (1.704 17.501) XY XX T S R S       ดังนั้นค่า 0.878R  นี้หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ของ กาวอัดมีความสัมพันธ์กันสูงประมาณ 87. 8% และเนื่องจากค่า R เป็นบวกจะแสดงว่ามีความสัมพันธ์กันใน ทิศทางเดียวกัน คือถ้าเปอร์เซ็นต์กาวอัดมีค่าสูงค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะสูงตามไปด้วย และในทางตรงกันข้ามถ้าเปอร์เซ็นต์กาวอัดมีค่าต่าค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะต่าตามไป ด้วย
  • 25. -22- 8. ตัวอย่างงานวิจัย Title : Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model หัวข้อ : การทานายการใช้วัสดุในการบารุงรักษาเครื่องบินโดยใช้แบบจาลองถดถอยเชิงเส้น ปี : 2018 ผู้วิจัย : Yan-ming YANG, Yue TENG and Rui-li ZHANG 1.วัตถุประสงค์ของการวิจัย การพยากรณ์ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินเป็นสิ่งที่มีความสาคัญ และช่วยในการ ตัดสินใจการใช้ประโยชน์จากทรัพยากรที่มีอยู่เพื่อปรับปรุงความสามารถในการบารุงรักษา ในงานวิจัยนี้ มุ่งเน้น ไปที่ปัจจัยหลักที่มีอิทธิพลต่อการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน โดยใช้แบบจาลองการทานายถดถอย เชิงเส้นของการใช้วัสดุในการบารุงรักษาอุปกรณ์ สร้างขึ้นโดยใช้ข้อมูลตัวอย่างที่เกิดขึ้นจริง บนพื้นฐานการ วิเคราะห์จากตัวอย่าง วิธีการถดถอยเชิงเส้นอย่างง่ายใช้ในการทานาย และการทดสอบการใช้วัสดุในการ บารุงรักษาอุปกรณ์การบิน 2.ขั้นตอนการวิจัย 2.1 เก็บสถิติข้อมูล เก็บสถิติข้อมูลรายเดือนของชั่วโมงการบิน แสดงดังในตารางที่ 4 และข้อมูลของการใช้วัสดุในการ บารุงรักษา แสดงดังในตารางที่ 5 ในปี ค.ศ. 2015-2016 เป็นเวลาสองปี สร้างแบบจาลองการถดถอยเชิงเส้นอย่าง ง่าย เพื่อทานายปริมาณการใช้วัสดุในการบารุงรักษา ตารางที่ 4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016 ตารางที่ 5 ปริมาณการใช้วัสดุบารุงรักษาเครื่องบินในปี ค.ศ. 2015-2016
  • 26. -23- 2.2 แบบจาลองการถดถอย งานวิจัยนี้เลือกแบบจาลองการถดถอยเชิงเส้นอย่างง่ายที่อยู่บนพื้นฐานการประมาณความสัมพันธ์เชิง เส้นระหว่างตัวแปรอิสระ และตัวแปรตาม สร้างสมการเชิงเส้นเพื่อทานาย ตัวแบบจาลองการถดถอยเชิงเส้น อย่างง่าย คือ y a bx  โดยกาหนดให้ y คือ ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน (ตัวแปรตาม) x คือ ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ) a คือ จุดตัดแกนบน y (สัมประสิทธิ์การถดถอย) b คือ ความชัน (สัมประสิทธิ์การถดถอย) โดยการประมาณค่าสัมประสิทธิ์การถดถอย (a, b) แสดงดังสมการที่ (10) และ (16) และทาการทดสอบ แบบจาลองการถดถอยโดยการทดสอบการประมาณค่าความแปรปรวนดังสมการที่ (18) และการทดสอบ สัมประสิทธิ์สหสัมพันธ์ดังสมการที่ (41) โดยใช้ระดับนัยสาคัญ 0.05 ในการตรวจสอบ 3. ผลการวิจัย ใช้ซอฟต์แวร์ Minitab ในการวิเคราะห์การถดถอย แสดงดังรูปที่ 10 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้ คือ 4.173 0.09901y x  รูปที่ 10 พล็อตเส้นถดถอยของ สายชั่วโมงของเครื่องบิน และปริมาณการใช้วัสดุในการบารุงรักษาหลัก
  • 27. -24- 3.1 การทดสอบนัยสาคัญของสมการถดถอย การวิเคราะห์ผลในตาราง ANOVA ตารางที่ 5 การวิเคราะห์ ผลในตาราง ANOVA กาหนดระดับนัยสาคัญที่ 0.05 หรือที่ระดับความเชื่อมั่น 95 % โดยในงานวิจัยนี้ได้ใช้ โปรแกรม Mimitab ช่วยในการวิเคราะห์ จึงใช้ค่า P-value เป็นตัวช่วยในการตัดสินใจ เพราะค่า P-value คือ ระดับนัยสาคัญที่น้อยที่สุดหรือโอกาสที่น้อยที่สุดที่จะสามารถปฎิเสธสมมติฐานหลัก จะเห็นได้ว่าค่า 0.000P  เนื่องจาก( 0.05) ( 0.00)P    ดังนั้น ปัจจัยอื่นๆ ไม่มีผลกระทบต่อปริมาณการใช้วัสดุในการ บารุงรักษาเครื่องบิน อย่างมีนัยสาคัญ สมการการถดถอยโดยรวมจึงมีประสิทธิภาพอย่างมาก ตารางที่ 5 การวิเคราะห์ความแปรปรวน 3.2 การวัดของผลรวมของผลกระทบสมการการถดถอย ตารางที่ 6 R-Sq คือ 91.24% แสดงให้เห็นว่า ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบินต่อชั่วโมงการบิน ประมาณ 91.24% ส่วนอีก 8.76% จะขึ้นอยู่กับ ปัจจัยอื่น ๆ ดังนั้นเส้นถดถอยสามารถอธิบายความสัมพันธ์เชิงเส้นได้ 91.24% สามารถพยากรณ์การใช้วัสดุใน การบารุงรักษาเครื่องบิน (y)ได้ถูกต้อง 91.24% ดังนั้นการตัวแบบถดถอยที่ได้จึงให้ผลที่ดี ตารางที่ 6 สรุปผลของแบบจาลองถดถอย 3.3 การทดสอบนัยสาคัญของสัมประสิทธิ์การถดถอย ตารางที่ 7 แสดงให้เห็นว่า สัมประสิทธิ์ ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ x) โดยเกณฑ์ในการปฏิเสธสมมติฐานหลัก โดยใช้ค่าพี คือ จะปฎิเสธ 0H เมื่อระดับนัยสาคัญมากกว่าเท่ากับค่าพี P Value   สมมติฐาน 0 1: 0H   (ไม่มีความสัมพันธ์เชิงเส้น) 0 1: 0H   (มีความสัมพันธ์เชิงเส้น) ที่ระดับนัยสาคัญ 0.05 
  • 28. -25- ในตารางที่ 7 จะเห็นได้ว่า 0.000P  เนื่องจาก ( 0.05) ( 0.00)P    ดังนั้นปฏิเสธ 0 1: 0H   แสดงว่า ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบินมีความสัมพันธ์เชิงเส้นกับชั่วโมงบินของเครื่องบิน ซึ่ง บ่งชี้ว่าชั่วโมงบินของเครื่องบินเป็นปัจจัยที่มีนัยสาคัญ ตารางที่ 7 สัมประสิทธิ์ 3.4 การวิเคราะห์เรสซิดวล เพื่อตรวจสอบความเหมาะสมของตัวแบบถดถอยและ ANOVA การ ตรวจสอบพล็อตจะช่วยให้ทราบว่า ข้อสมมติกาลังสองน้อยที่สุดเป็นไปตามเงื่อนไขหรือไม่ หากสมมติฐาน เป็นไปตามเงื่อนไข จากนั้นการถดถอยกาลังสองน้อยสุด จะประมาณค่าสัมประสิทธิ์ที่ไม่เอนเอียงที่มีความ แปรปรวนน้อยที่สุด ใช้ Minitab พล็อตเรสซิดวล (ดังแสดงในรูปที่ 11) รูปที่ 11 พล็อตเรสซิดวลของชั่วโมงบินเครื่องบิน และการใช้วัสดุในการบารุงรักษาหลัก เรสซิดวลกับข้อมูล รูปที่ 11 คือพล็อตของเรสซิดวลทั้งหมด ที่ถูกรวบรวมข้อมูลและสามารถนามาใช้ใน การหาความคลาดเคลื่อน พล็อตนี้ช่วยให้ตรวจสอบสมมติฐานที่เรสซิดวลที่ไม่เกี่ยวข้องกับปัจจัยอื่น ๆ รูปที่ 11 แสดงให้เห็นว่าเรสซิดวลแปรผันแบบสุ่ม และเป็นอิสระจากกัน
  • 29. -26- เรสซิดวลกับค่าเส้นมาตราฐาน รูปที่ 11 (ขวา) พล็อตนี้แสดงรูปแบบสุ่มของเรสซิดวล หากจุดอยู่ไกล จากจุดส่วนใหญ่ อาจจะเป็นค่าผิดปกติ รูปแบบที่ไม่สามารถยอมรับได้ในพล็อตเรสซิดวล ตัวอย่างเช่น หากการ แพร่กระจายของเรสซิดวลมีแนวโน้มที่จะเพิ่มขึ้นตามค่าเส้นมาตราฐานที่เพิ่มขึ้นนั้นอาจละเมิดสมมติฐานความ แปรปรวนคงที่ ซึ่งในตัวอย่างนี้กราฟของข้อมูลมีการแจกแจงปกติ และเรสซิดวลมีความแปรปรวนคงที่ พล็อตความน่าจะเป็นปกติของเรสซิดวล รูปที่ 11 (ซ้าย) จุดในพล็อตนี้โดยทั่วไปควรเป็นไปตามเส้น มาตราฐาน ถ้าเรสซิดวลมีการแจกแจงแบบปกติ หากจุดบนพล็อตออกห่างจากเส้นมาตราฐาน ข้อสมมติฐาน ความปกติอาจไม่ถูกต้อง ในตัวอย่างนี้ จุดต่าง ๆ เป็นไปตามเส้นมาตราฐาน และเรสซิดวลถือได้ว่าเป็นการแจก แจงแบบปกติ ฮิสโตแกรมเรสซิดวลมีที่มุมซ้ายล่าง สามารถใช้ในการตรวจสอบการกระจายของเรสซิดวล หากมี หนึ่งหรือสองแท่งที่อยู่ห่างออกไป จากแถบอื่น ๆ สิ่งเหล่านี้อาจผิดปกติ 4. สรุปผลการวิจัย วิธีการวิเคราะห์การถดถอย และวิธีการทานายนั้นง่ายต่อการเข้าใจ และใช้กันอย่างแพร่หลายมากขึ้น ใน การใช้งานจริง สามารถวิเคราะห์รายละเอียดของข้อมูล เลือกวิธีการและตัวแบบที่เหมาะสม การสังเกตและการ วิเคราะห์แผนภูมิกระจายอย่างรอบคอบ และระมัดระวังเพื่อให้ได้ผลการทานายจะเป็นที่ดี เมื่อใช้วิธีการทานาย การถดถอย มีความจาเป็นต้องตรวจต้องว่ามีความสัมพันธ์ระหว่างตัวแปรหรือไม่ หากไม่มีความสัมพันธ์ระหว่าง ตัวแปร วิธีการทานายการถดถอยของตัวแปรเหล่านี้จะส่งผลให้เกิดผลลัพธ์ที่ไม่ถูกต้อง เมื่อเราใช้การวิเคราะห์ การถดถอยอย่างถูกต้อง ควรใส่ใจกับการวิเคราะห์เชิงคุณภาพของความสัมพันธ์ระหว่างเหตุการณ์ หลีกเลี่ยงการ อนุมานการทานายการถดถอย ใช้ข้อมูลที่เหมาะสม ในขณะเดียวกันวิธีการทานายการถดถอยเชิงเส้นที่นาเสนอ ในงานวิจัยนี้ไม่เพียง แต่นาไปใช้กับการทานายการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน แต่ยังรวมถึงดัชนี หรือพารามิเตอร์อุปกรณ์อื่น ๆ ซึ่งเป็นวิธีการทางวิทยาศาสตร์ และวิธีการสาหรับการพยากรณ์อุปกรณ์สนับสนุน อื่นๆ ดังนั้นงานวิจัยนี้ได้นาวิธีการวิเคราะห์การถดถอยเชิงเส้นอย่างง่าย ในการพยากรณ์ของปริมาณการใช้วัสดุ ในการบารุงรักษาอุปกรณ์การบิน พบว่า ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินกับชั่วการบินของ เครื่องบินมีความสัมพันธ์เชิงเส้นกันที่ระดับความเชื่อมั่น 95 % และสามารถนาสมการถดถอยที่ได้ไปพยากรณ์ การใช้วัสดุในการบารุงรักษาเครื่องบินได้ถูกต้อง 91.24% คาดคะเนได้อย่างที่มีประสิทธิภาพ
  • 30. อ้างอิง 1. Mendenhall, W. M., & Sincich, T. L. (2016). Statistics for Engineering and the Sciences. Chapman and Hall/CRC. 2. Montgomery, D. C., &Runger, G. C. (2014). Applied statisticsand probabilityforengineers. John Wiley and Sons. 3. Devore, J. L. (2011). Probability and Statistics for Engineering and the Sciences. Cengage learning. 4. Ott, R. L., & Longnecker, M. T. (2015). An introduction to statistical methods and data analysis. Nelson Education. 5. Yang, Y. M., Yue, T. E. N. G., & Zhang, R. L. (2018). Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model. DEStech Transactions on Computer Science and Engineering, (mso).