7. -4-
รูปที่ 2 เส้นสมมติของ 0 1(y)E x (Mendenhall and Sincich, 2016, p.487)
ดังนั้น รูปแบบการถดถอย 0 1(Y )E x x เป็นเส้นตรงของค่าเฉลี่ยตัวแปรตาม (y) ที่ค่าใด ๆ ของ
ตัวแปรอิสระ (x) การเปลี่ยนแปลงของค่าตัวแปรตาม (y) ที่เกิดขึ้นจริง และค่าที่เกิดจากการประมาณผ่านตัว
แบบจาลองการถดถอยเชิงเส้น จะขึ้นอยู่กับความแปรปรวนของค่าความคลาดเคลื่อนสุ่ม ซึ่งในความเป็นจริงค่า
ความชัน( 1 ) ค่าจุดตัดแกนบน y ( 0 ) และความแปรปรวนของค่าความคลาดเคลื่อนสุ่ม ( 2
) ไม่สามารถระบุ
ค่าได้จึงต้องทาการประมาณจากข้อมูลตัวอย่าง (Montgomery and Runger, 2014, pp.428-430)
3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด
3.1 การประมาณค่าจุดตัดบนแกน y และความชัน ( 0 และ 1 )
ในการเลือกเส้นที่เหมาะสม (Best-fitting line) สาหรับชุดข้อมูลเพื่อประมาณค่า 0 และ 1 ซึ่งเป็น
พารามิเตอร์ที่ไม่ทราบค่าของตัวแบบจาลองการถดถอยเชิงเส้น วิธีที่ง่ายและน่าสนใจที่สุด คือวิธีกาลังสองน้อย
ที่สุด (Method of least squares) แสดงดังรูปที่ 3 เส้นที่เหมาะสมบนแผนภาพการกระจายของข้อมูลจากตารางที่
1 โดยทาให้เส้นที่เหมาะสมมีค่าผลรวมของผลต่างระหว่างค่าของข้อมูลจริงกับเส้นประมาณค่าถดถอยมีค่าน้อย
ที่สุด (Mendenhall and Sincich, 2016, p.489)
เมื่อทาการเก็บข้อมูล n ตัวอย่าง โดยมีคู่ลาดับของค่า x และค่า y กล่าวคือ 1 1( , ),x y 2 2( , ),x y ...,
( , )n nx y ดังนั้นค่ารูปแบบจาลองการถดถอยเชิงเส้น มี n ตัวอย่างที่ค่า iy ณ คู่อันดับ ix แสดงดังสมการ
0 1i i iy x , i = 1,2,…,n (4)
8. -5-
เนื่องจากค่าความคลาดเคลื่อนนั้นสามารถเป็นได้ทั้งค่าบวกและค่าลบ ดังนั้นจึงต้องทาให้อยู่ในรูป
ผลรวมกาลังสองของความคลาดเคลื่อน (Sum of squares for error: L ) ที่ได้จากการสังเกตจริง คือ
2 2
0 1
1 1
( )
n n
i i i
i i
L y x
(5)
การประมาณค่า 0 และ 1 เขียนแทนด้วย 1
ˆ และ 0
ˆ โดยวิธีกาลังสองน้อยที่สุด ด้วยการหาค่าอนุพันธ์
เชิงส่วน เทียบกับ 0 และ 1 แล้วกาหนดให้สมการเท่ากับศูนย์ได้ดังนี้ (Devore, 2011, pp.478-479)
0 1
0 1
1ˆ ˆ0 ,
ˆ ˆ2 ( ) 0
n
i i
i
L
y x
(6)
0 1
0 1
1ˆ ˆ1 ,
ˆ ˆ2 ( ) 0
n
i i i
i
L
y x x
(7)
เมื่อจัดรูปสมการที่ (6) และ (7) จะได้รูปสมการปกติ คือ
0 1
1 1
ˆ ˆ
n n
i i
i i
n x y
(8)
2
0 1
1 1 1
ˆ ˆ
n n n
i i i i
i i i
x x y x
(9)
รูปที่ 3 แผนภาพการเบี่ยงเบนจุดของข้อมูลกับเส้นถดถอย (Mendenhall and Sincich, 2016, p.489)
9. -6-
จากสมการที่ (8) และ (9) คือสมการกาลังสองน้อยที่สุด สามารถคานวณหาค่าจุดตัดแกนบน y ( 0
ˆ )
และความชัน ( 1
ˆ ) ได้ดังนี้
0 1
ˆ ˆy x (10)
1 1
1
1 2
2 1
1
ˆ
n n
i in
i i
i i
i
n
in
i
i
i
y x
y x
n
x
x
n
(11)
โดยที่
1
1 n
i
i
y y
n
และ
1
1 n
i
i
x x
n
ดังนั้นเส้นประมาณการถดถอย (Estimated regression line) ที่เหมาะสม คือ
0 1
ˆ ˆˆ iy x (12)
สาหรับแต่ละคู่ลาดับของข้อมูล (x, y) ที่ได้จากการสังเกตจริง แสดงดังสมการต่อไปนี้
0 1
ˆ ˆ
i i iy x e , i = 1,2,…,n (13)
โดยที่ ˆi ie y y เรียกว่า ค่าเรสซิดวล (Residual) หรือค่าความคลาดเคลื่อน เป็นค่าความแตกต่างระหว่างค่า
ของข้อมูลจริงกับเส้นประมาณค่าถดถอย
จากสมการที่ (11) ความชัน ( 1
ˆ ) สามารถแสดงใหม่ได้ดังนี้
2
12 2
1 1
( )
n
in n
i
xx i i i
i i
x
S x x x
n
(14)
1 1
1 1
( )( )
n n
i in n
i i
xy i i i i
i i
x y
S y y x x x y
n
(15)
ดังนั้น
1
ˆ xy
xx
S
S
(16)
(Montgomery and Runger, 2014, pp.431-433)
10. -7-
3.2 การประมาณค่าความแปรปรวน: 2
การประมาณค่าเส้นถดถอยนั้นจะถูกต้องใกล้เคียงค่าจริงมากเพียงใดสามารถทราบได้จาก ค่าความคลาด
เคลื่อนที่เกิดขึ้นระหว่างค่าของข้อมูลที่ได้จากการสังเกต และค่าที่ได้รับจากเส้นถดถอย หากค่า 2
มีค่ามากจะ
สังเกตได้ว่าคู่อันดับ (x, y) มีค่าที่ค่อนข้างกระจายออกไปจากเส้นถดถอย ในขณะที่ 2
มีค่าน้อยการสังเกตได้ว่า
การกระจายของข้อมูลจะอยู่ใกล้กับเส้นถดถอย แสดงดังรูปที่ 4 ดังนั้นหากค่า 2
มีค่าน้อย ข้อมูลมีค่าการกระจาย
ใกล้กับเส้นถดถอยมากเพียงใด แสดงว่าสมการถดถอยที่ได้สามารถนาไปพยากรณ์ค่า y ได้ถูกต้องมากเท่านั้น
รูปที่ 4 ตัวอย่างความแปรปรวนของข้อมูล (Devore, 2011, p.481)
การประมาณค่าความแปรปรวนของความคลาดเคลื่อนเป็นค่าพารามิเตอร์อีกตัวที่ไม่ทราบค่าของตัว
แบบถดถอยคือ 2
โดยที่เรสซิดวล ˆi ie y y ถูกใช้เพื่อให้ได้ค่าประมาณ 2
ซึ่งค่าเรสซิดวลจะมีค่าเป็นไป
ได้ทั้งบวกและลบ จึงต้องกาหนดค่าให้อยู่ในรูปของผลรวมกาลังสองของเรสซิดวล (Error sum of squares: ESS )
สามารถคานวณได้ (Ott and Longnecker, 2015, p.546)
2
1
n
E i
i
SS e
(17)
2
1
ˆ( )
n
i
i
y y
โดยองศาอิสระ (Degrees of freedom) คือ 2n เนื่องจาก ตัวแบบความสัมพันธ์ถดถอยเชิงเส้น
0 1
ˆ ˆˆ iy x มีค่าประมาณของพารามิเตอร์ประกอบด้วย 1
ˆ และ 0
ˆ จะเห็นได้ว่าค่าเฉลี่ยของผลรวมกาลังสอง
ของเรสซิดวล คือ 2
ˆ( ) ( 2)EE SS n ดังนั้นค่าประมาณความแปรปรวนของเรสซิดวลที่ไม่เอนเอียงคือ
(Montgomery and Runger, 2014, p.435)
11. -8-
2
2 1
ˆ
2
n
i
i
e
n
(18)
2 2
ˆ
2
E
E
SS
MS S
n
หากค่า 2
ˆ มีค่ามากแสดงว่าสมการถดถอยที่ประมาณได้นี้มีความเหมาะสมน้อย เนื่องจากค่า y จะอยู่
ห่างจากเส้นถดถอยมากแต่ถ้าค่า 2
ˆ มีค่าน้อยแสดงว่าสมการถดถอยที่ประมาณได้นี้มีความเหมาะสมมาก
เนื่องจากค่า y จะอยู่ใกล้เส้นถดถอยมาก
ตัวอย่างที่ 1 โรงงานผลิตกระดาษแห่งหนึ่ง ได้ทาการศึกษาข้อมูลระหว่างค่าความต้านทานการฉีกขาดของ
กระดาษ (y: 10 นิวตัน/ตารางมิลลิเมตร) กับเปอร์เซ็นต์ของกาวอัด (x) ที่ใช้เป็นส่วนผสมในการ
ผลิตกระดาษ โดยสุ่มเก็บรวบรวมข้อมูลมา 10 ตัวอย่างดังนี้คือ
จากข้อมูลข้างต้น หากต้องการทราบความสัมพันธ์ระหว่างกับเปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสม
ในการผลิตกระดาษ กับความต้านทานต่อการฉีกขาดของกระดาษ จะทาการพิจารณาตัวแบบเชิงเส้นอย่างง่าย
ดังต่อไปนี้
0 1y x
โดยที่ x = เปอร์เซ็นต์ของกาวอัดที่ใช้เป็นส่วนผสมในการผลิตกระดาษ (ตัวแปรอิสระ)
y = ค่าความต้านทานต่อการฉีกขาดของกระดาษ (ตัวแปรตาม)
ทั้งนี้สามารถทาการศึกษาเบื้องต้นถึงความสัมพันธ์ที่เกิดขึ้นระหว่าง x และ y โดยการใช้แผนภูมิการ
กระจายซึ่งสามารถแสดงต่อไปนี้
ตัวอย่างที่ 1 2 3 4 5 6 7 8 9 10
x 1.6 1.5 1.5 1.4 2.0 2.0 2.2 2.4 2.5 2.5
y 10.1 11.7 11.7 11.5 13.1 13.2 14.2 14.0 13.7 14.1
12. -9-
รูปที่ 5 แผนภาพการกระจายของค่าความต้านทานต่อการฉีกขาดของกระดาษ (y) กับเปอร์เซ็นต์กาวอัด (x)
จากแผนภาพการกระจายในรูปที่ 5 จะสามารถเห็นถึงความสัมพันธ์ระหว่าง 2 ตัวแปรได้ว่าน่าจะมี
ความสัมพันธ์กันในเชิงเส้นตรง และมีความสัมพันธ์ในทิศทางเดียวกัน เนื่องจากเมื่อพิจารณาจากลักษณะของจุด
พบว่าเมื่อ x มีค่าสูงขึ้น y จะมีค่าสูงขึ้นด้วย ดังนั้นในการใช้ค่าของข้อมูลวิเคราะห์ความสัมพันธ์ของตัวแปรต้น
และตัวแปรตาม ซึ่งมีข้อมูลดังต่อไปนี้
10n ,
10
1
19.60i
i
x
,
10
1
127.30i
i
y
,
10
1
254.30i i
i
y x
,
10
2
1
40.12i
i
x
,
10
2
1
1638.03
i
y
,
1.96x และ 12.73y
จากข้อมูลคานวณค่าสัมประสิทธิ์ของสมการ การถดถอยเชิงเส้นอย่างง่าย ได้ดังนี้
210
2
10
12
1
19.60
40.12 1.704
10
i
i
xx i
i
x
S x
n
10 10
10
1 1
1
19.60 127.30
254.3 4.7
10
0 92
i i
i i
xy i i
i
x y
S x y
n
17. -14-
หากไม่ปฏิเสธสมมติฐานหลัก 0 1: 0H สรุปได้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y แสดง
ดังรูป 7 เมื่อข้อมูลมีค่าแปรปรวนน้อยและการประมาณค่า y ที่ x ใดๆ คือ ˆy y ดังรูปที่ 7 (a) หรือในกรณีที่
ความสัมพันธ์ที่แท้จริงระหว่าง x และ yไม่ใช่ความสัมพันธ์เชิงเส้นมีค่าแปรปรวนของข้อมูลมาก ดังรูปที่ 7 (b)
และในกรณีหากปฏิเสธสมมติฐานหลัก 0 1: 0H ก็หมายความว่า มีความสัมพันธ์ระหว่าง x และ y รูปที่ 8
การปฏิเสธสมมติฐานหลักอาจหมายถึงว่ารูปแบบความสัมพันธ์เชิงตรงนั้นมีความเหมาะสม ดังรูปที่ 8 (a)
รูปที่ 7 ไม่ปฏิเสธสมมติฐานหลัก 0 1: 0H (ไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y)
(Montgomery and Runger, 2014, p.442)
รูปที่ 8 ปฏิเสธสมมติฐานหลัก 0 1: 0H (มีความสัมพันธ์เชิงเส้นระหว่าง x และ y)
(Montgomery and Runger, 2014, p.443)
18. -15-
5.2 การทดสอบสมมติฐานนัยสาคัญการถดถอยโดยใช้การวิเคราะห์ความแปรปรวน
เป็นการวิเคราะห์ความแปรปรวนที่ใช้เพื่อทดสอบนัยสาคัญของการถดถอย ซึ่งการวิเคราะห์ความ
แปรปรวนมีดังนี้
2 2 2
1 1 1
ˆ ˆ( ) ( ) ( )
n n n
i i i i
i i i
y y y y y y
(28)
2
1
ˆ( )
n
R i
i
SS y y
ผลรวมกาลังสองของความคลาดเคลื่อนจากการถดถอย (Regression sum of squares)
2
1
ˆ( )
n
E i i
i
SS y y
ผลรวมกาลังสองของความคลาดเคลื่อน (Error sum of squares)
เขียนสมการใหม่ได้ว่า
T R ESS SS SS (29)
โดยที่
2
1
( )
n
T i
i
SS y y
2
12
1
n
in
i
i
i
y
y
n
(30)
1
ˆ
R xySS S (31)
E T RSS SS SS (32)
หากสมมติฐานหลัก 0 1: 0H เป็นจริง จะได้ว่า
0
1
( 2)
R R
E E
SS MS
F
SS n MS
(33)
การแจกแจงแบบเอฟ โดยมีองศาอิสระ 2n จะปฏิเสธสมมติฐานหลัก ถ้า 0 ,1, 2nf f พบว่าค่าสถิติ
เอฟที่ได้จากการคานวณมากกว่าค่าที่เกิดจากการเปิดตารางเอฟ (Montgomery and Runger, 2014, p.443)
20. -17-
ทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
10n ,
10
1
127.30i
i
y
,
10
2
1
1638.03
i
y
, 12.73y , ˆ 127.3iy , 1
ˆ 2.812 และ 4.792xyS
สมมติฐาน 0 1: 0H (ไม่มีความสัมพันธ์เชิงเส้น)
0 1: 0H (มีความสัมพันธ์เชิงเส้น)
0.05
ปฏิเสธ 0H ถ้า 0 ,1, 2nF f = 0 0.05,1,8( 5.32)F f
2
1
ˆ( ) 4.02
n
E i i
i
SS y y
13.475
13.475
1 1
R
R
SS
MS
1
ˆ 2.812 4.792 13.475R xySS S
4.02
0.503
( 2) 10 2
E
E
SS
MS
n
2
2
12
1
127.3
1638.03 17.501
10
n
in
i
T i
i
y
SS y
n
0
13.475
26.78
0.5025
R
E
MS
F
MS
แหล่งที่มา
(Source of variation)
ผลบวกกาลังสอง
(Sum of
Squares)
องศาอิสระ
(Degrees of
Freedom)
ค่าเฉลี่ย
(Mean
Square)
ค่าสถิติ
0( )F
ตัวแบบ (Regression) 13.475 1 13.475 26.78
ค่าความคลาดเคลื่อน
(Error)
4.020 8 0.503
ทั้งหมด (Total) 17.501 9
สรุป เนื่องจาก 0 0.05,1,8( 26.78) ( 5.32)F f ดังนั้น ปฏิเสธ 0 1: 0H ที่ระดับนัยสาคัญ 0.05 มี
หลักฐานแสดงว่า ค่าความต้านทานต่อการฉีกขาดของกระดาษมีความสัมพันธ์เชิงเส้นกับเปอร์เซ็นต์ของกาวอัดที่
ใช้เป็นส่วนผสมในการผลิตกระดาษ
21. -18-
6. ค่าสัมประสิทธิ์การตัดสินใจ
เมื่อทาการวิเคราะห์การถดถอยของข้อมูลตัวแปรอิสระ (X) และตัวแปรตาม (Y) แล้วสมการถดถอยที่
ประมาณได้จะนาไปใช้ประโยชน์ในการพยากรณ์ค่าของตัวแปรตาม (Y) เมื่อกาหนดค่าของตัวแปรอิสระ (X) มา
ให้แต่สมการถดถอยที่ใช้ในการพยากรณ์นี้อาจพยากรณ์ค่าตัวแปรตาม (Y) ได้ดีหรือไม่ดีก็ได้ โดยที่ ค่า
สัมประสิทธิ์การตัดสินใจ (Coefficient of Determination; 2
R ) เป็ นค่ายกกาลังสองของค่าสัมประสิทธิ์
สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y ซึ่งค่าสัมประสิทธิ์การตัดสินใจนี้เป็นค่าที่ใช้บอกเปอร์เซ็นต์การ
เปลี่ยนแปลงของตัวแปรตาม (Y) ที่สามารถอธิบายได้ด้วยตัวแปรอิสระ (X) ในสมการถดถอย
หาค่า 2
R ได้จาก
2 2 1
1
ˆ
ˆ XX XY R
T T T
S S SS
R
SS SS SS
(34)
โดยที่ (ค่า 2
R จะมีค่าอยู่ระหว่าง 0 ถึง 1) ยิ่งค่าของ 2
R สูงขึ้นเท่าไร แสดงว่าสมการถดถอยสามารถ
พยากรณ์ค่าของตัวแปรตาม (Y) ได้ดีมากยิ่งขึ้น และหาก 2
R มีค่าน้อย สมการถดถอยพยากรณ์ค่าของตัวแปร
ตาม (Y) ได้ไม่ดี หรือตัวแปรอิสระ (X) ในสมการถดถอยนั้นอธิบายการเปลี่ยนแปลงของตัวแปรตาม (Y) ได้ไม่ดี
เนื่องจากตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันน้อย (Devore, 2011, p.485)
ตัวอย่างที่ 3 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้ คือ ˆ 7.218 2.812y x คานวณค่าสัมประสิทธิ์ของการ
ตัดสินใจ จากมูลในตัวอย่างที่ 2 ได้ค่าต่าง ๆ ดังนี้ 13.475RSS และ 17.501TSS
2 13.475
0.77
17.501
R
T
SS
R
SS
จึงสรุปได้ว่า ค่า 2
0.77R หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษขึ้นอยู่กับ
เปอร์เซ็นต์ของกาวอัดประมาณ 77% ส่วนอีก 23% จะขึ้นอยู่กับปัจจัยอื่น ๆ ที่ไม่ได้นามาศึกษาหรือสมการ
ถดถอย ˆ 7.218 2.812y x สามารถพยากรณ์ค่าค่าความต้านทานต่อการฉีกขาดของกระดาษได้ถูกต้อง 77%
22. -19-
7. สหสัมพันธ์
สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างข้อมูลหรือตัวแปรตั้งแต่ 2 ตัวขึ้นไป ใช้สาหรับการ
ทดสอบความสัมพันธ์เชิงเส้นตรงว่ามีความสัมพันธ์กันในระดับใด และมีความสัมพันธ์ในทิศทางใด เช่นความ
สูงกับน้าหนักว่ามีความสัมพันธ์กันมากหรือน้อย และมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้ามโดยใน
การตรวจสอบนั้นจะตรวจสอบด้วยการใช้แผนภาพการกระจายและค่าสัมประสิทธิ์สหสัมพันธ์ (correlation
coefficient) โดยในการวิเคราะห์การถดถอยนั้นได้มีสมมติฐานว่า X เป็นตัวแปรที่ควบคุมได้ ด้วยความคลาด
เคลื่อนเล็กน้อย และ Y เป็นตัวแปรสุ่ม การศึกษาค่าของข้อมูลจากสังเกตที่ได้รับเป็นคู่ระหว่าง ( , )i iX Y จึงเป็น
การศึกษาการแจกแจงตัวแปรสุ่มร่วม โดยมีฟังก์ชั่นการแจกแจง ,f x y ตัวอย่างเช่นการศึกษาความสัมพันธ์
ความต้านทานแรงดึงของรอยเชื่อม ซึ่งในตัวอย่างนี้เราไม่สามารถควบคุมขนาดการเชื่อมได้ จึงต้องทาการสุ่ม
รอยเชื่อม n ตัวอย่าง และเก็บข้อมูลจากสังเกตขนาดรอยเชื่อม ( )iX และความต้านทานแรงดึง ( )iY ดังนั้น
( , )i iX Y จึงเป็นการแจกแจงตัวแปรสุ่มร่วม (Montgomery and Runger, 2014, pp.457-458)
สมมติว่า การแจกแจงร่วมของ iX และ iY เป็นการแจกแจงแบบปกติของสองตัวแปรสุ่ม (Bivariate
normal distribution) โดยมีค่าเฉลี่ยของตัวแปรคือ X และ Y ความแปรปรวนของตัวแปรคือ 2
X และ 2
Y
และกาหนดให้ คือสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปร X และ Y ได้ว่า
XY
X Y
(35)
โดยที่ XY คือความแปรปรวนร่วมระหว่าง X และ Y
การแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y กาหนดให้ X x คือ
2
0 11 1
( ) exp
22
x
Y x
Y xY x
y
f y
(36)
เมื่อ
0
Y
Y X
X
(37)
1
Y
X
(38)
และความแปรปรวนของการแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y กาหนดให้ X x คือ
23. -20-
2 2 2
(1 )YY x
(39)
ดังนั้นการแจกแจงแบบมีเงื่อนไขของตัวแปรสุ่ม Y ให้ X x เป็นการแจกแจงแบบปกติด้วยค่าเฉลี่ย
0 1E( )Y x x (40)
และความแปรปรวน 2
Y x
ดังนั้นค่าเฉลี่ยของการแจกแจงแบบมีเงื่อนไขของ Y ให้ X x เป็นแบบจาลองการ
ถดถอยเชิงเส้นอย่างง่าย นอกจากนี้ค่าสัมประสิทธิ์สหสัมพันธ์( ) และสัมประสิทธิ์ความชัน 1( ) จากสมการ 38
จะเห็นว่าหาก 0 ดังนั้น 1 0 ซึ่งหมายความว่าไม่มีการถดถอยของ Y บน X
สาหรับการประมาณค่าพารามิเตอร์ 0 และ 1 แสดงดังสมการ (10 และ 16) โดยวิธีกาลังสองน้อย
ที่สุด เช่นเดียวกับกรณีการวิเคราะห์การถดถอยที่มีสมมติฐานว่า X เป็นตัวแปรที่ควบคุมได้
โดยการประมาณของ สัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Sample Correlation Coefficient: R)
1
1 2 1 2
2 2
1 1
( )
ˆ
( SS )
( ) (Y )
n
i i
i XY
n n
XX T
i i
i i
Y X X
S
R
S
X X Y
(41)
คุณสมบัติที่สาคัญที่สุดของ R คือ:
1. ค่าของ R ไม่ได้ขึ้นอยู่กับการศึกษาภายใต้ตัวแปรสองตัว
2. ค่า R เป็นอิสระจากการตรวจวัดของ x และ y
3. ค่า R จะ มีค่าอยู่ในช่วง 1 1R
4. 1R เมื่อ x มีค่ามาก y มีค่ามาก หรือเมื่อ x มีค่าน้อย y มีค่าน้อย (มีความสัมพันธ์เชิงเส้นเชิงบวก)
1R เมื่อ x มีค่ามาก y มีค่าน้อย หรือเมื่อ x มีค่าน้อย y มีค่ามาก (มีความสัมพันธ์เชิงเส้นเชิงลบ)
5. ค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าค่าสัมประสิทธิ์การตัดสินใจ
(Devore, 2011, p.510)
ซึ่งการตรวจสอบความสัมพันธ์ ทาการตรวจสอบโดยแผนภาพกระจายข้อมูล รูปที่ 9 แสดงสถานการณ์
ที่เป็นไปได้สาหรับค่าของ R ในรูปที่ 9 (d) แสดงให้เห็นความสัมพันธ์ระหว่าง x และ y แต่ R=0 ซึ่งเป็น
ความสัมพันธ์เชิงเส้นโค้ง ดังนั้นเมื่อ R=0 จะไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y ซึ่งจะแสดงให้เห็นถึง
ความสาคัญของการพิจารณาข้อมูลด้วยแผนภาพการกระจาย (Ott and Longnecker, 2015, p.591)
24. -21-
รูปที่ 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R (Ott and Longnecker, 2015, p.591)
ตัวอย่างที่ 4 จงหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าความต้านทานต่อการฉีกขาดของกระดาษและ
เปอร์เซ็นต์กาวอัด จากข้อมูลในตัวอย่างที่ 1 และ2 ได้ค่าต่าง ๆ ดังนี้ 4.792xyS , 1.704xxS และ
17.501TSS
1 2 1 2
4.792
ˆ 0.878
( SS ) (1.704 17.501)
XY
XX T
S
R
S
ดังนั้นค่า 0.878R นี้หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ของ
กาวอัดมีความสัมพันธ์กันสูงประมาณ 87. 8% และเนื่องจากค่า R เป็นบวกจะแสดงว่ามีความสัมพันธ์กันใน
ทิศทางเดียวกัน คือถ้าเปอร์เซ็นต์กาวอัดมีค่าสูงค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะสูงตามไปด้วย
และในทางตรงกันข้ามถ้าเปอร์เซ็นต์กาวอัดมีค่าต่าค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะต่าตามไป
ด้วย
25. -22-
8. ตัวอย่างงานวิจัย
Title : Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear
Regression Model
หัวข้อ : การทานายการใช้วัสดุในการบารุงรักษาเครื่องบินโดยใช้แบบจาลองถดถอยเชิงเส้น
ปี : 2018
ผู้วิจัย : Yan-ming YANG, Yue TENG and Rui-li ZHANG
1.วัตถุประสงค์ของการวิจัย
การพยากรณ์ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินเป็นสิ่งที่มีความสาคัญ และช่วยในการ
ตัดสินใจการใช้ประโยชน์จากทรัพยากรที่มีอยู่เพื่อปรับปรุงความสามารถในการบารุงรักษา ในงานวิจัยนี้ มุ่งเน้น
ไปที่ปัจจัยหลักที่มีอิทธิพลต่อการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน โดยใช้แบบจาลองการทานายถดถอย
เชิงเส้นของการใช้วัสดุในการบารุงรักษาอุปกรณ์ สร้างขึ้นโดยใช้ข้อมูลตัวอย่างที่เกิดขึ้นจริง บนพื้นฐานการ
วิเคราะห์จากตัวอย่าง วิธีการถดถอยเชิงเส้นอย่างง่ายใช้ในการทานาย และการทดสอบการใช้วัสดุในการ
บารุงรักษาอุปกรณ์การบิน
2.ขั้นตอนการวิจัย
2.1 เก็บสถิติข้อมูล
เก็บสถิติข้อมูลรายเดือนของชั่วโมงการบิน แสดงดังในตารางที่ 4 และข้อมูลของการใช้วัสดุในการ
บารุงรักษา แสดงดังในตารางที่ 5 ในปี ค.ศ. 2015-2016 เป็นเวลาสองปี สร้างแบบจาลองการถดถอยเชิงเส้นอย่าง
ง่าย เพื่อทานายปริมาณการใช้วัสดุในการบารุงรักษา
ตารางที่ 4 ชั่วโมงบินของเครื่องบิน ในปี ค.ศ. 2015-2016
ตารางที่ 5 ปริมาณการใช้วัสดุบารุงรักษาเครื่องบินในปี ค.ศ. 2015-2016
26. -23-
2.2 แบบจาลองการถดถอย
งานวิจัยนี้เลือกแบบจาลองการถดถอยเชิงเส้นอย่างง่ายที่อยู่บนพื้นฐานการประมาณความสัมพันธ์เชิง
เส้นระหว่างตัวแปรอิสระ และตัวแปรตาม สร้างสมการเชิงเส้นเพื่อทานาย ตัวแบบจาลองการถดถอยเชิงเส้น
อย่างง่าย คือ y a bx
โดยกาหนดให้ y คือ ปริมาณการใช้วัสดุในการบารุงรักษาเครื่องบิน (ตัวแปรตาม)
x คือ ชั่วโมงบินของเครื่องบิน (ตัวแปรอิสระ)
a คือ จุดตัดแกนบน y (สัมประสิทธิ์การถดถอย)
b คือ ความชัน (สัมประสิทธิ์การถดถอย)
โดยการประมาณค่าสัมประสิทธิ์การถดถอย (a, b) แสดงดังสมการที่ (10) และ (16) และทาการทดสอบ
แบบจาลองการถดถอยโดยการทดสอบการประมาณค่าความแปรปรวนดังสมการที่ (18) และการทดสอบ
สัมประสิทธิ์สหสัมพันธ์ดังสมการที่ (41) โดยใช้ระดับนัยสาคัญ 0.05 ในการตรวจสอบ
3. ผลการวิจัย
ใช้ซอฟต์แวร์ Minitab ในการวิเคราะห์การถดถอย แสดงดังรูปที่ 10 สมการถดถอยเชิงเส้นอย่างง่ายที่ได้
คือ 4.173 0.09901y x
รูปที่ 10 พล็อตเส้นถดถอยของ สายชั่วโมงของเครื่องบิน และปริมาณการใช้วัสดุในการบารุงรักษาหลัก
30. อ้างอิง
1. Mendenhall, W. M., & Sincich, T. L. (2016). Statistics for Engineering and the Sciences. Chapman and
Hall/CRC.
2. Montgomery, D. C., &Runger, G. C. (2014). Applied statisticsand probabilityforengineers. John Wiley and
Sons.
3. Devore, J. L. (2011). Probability and Statistics for Engineering and the Sciences. Cengage learning.
4. Ott, R. L., & Longnecker, M. T. (2015). An introduction to statistical methods and data analysis. Nelson
Education.
5. Yang, Y. M., Yue, T. E. N. G., & Zhang, R. L. (2018). Prediction of Maintenance Material Consumption for
Aviation Equipment Using Linear Regression Model. DEStech Transactions on Computer Science and
Engineering, (mso).