9. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
2 2
0 1
1 1
( )
n n
i i i
i i
L y x
ค่าความคลาดเคลื่อน นั้นสามารถเป็นได้ทั้งค่าบวกและค่า
ลบ จึงต้องทาให้อยู่ในรูปผลรวมกาลังสองของความ
คลาดเคลื่อน (Sum of squaresfor error: L )
0 1
0 1
1ˆ ˆ0 ,
ˆ ˆ2 ( ) 0
n
i i
i
L
y x
0 1
0 1
1ˆ ˆ1 ,
ˆ ˆ2 ( ) 0
n
i i i
i
L
y x x
การประมาณค่า และ เขียนแทนด้วย และ
โดยวิธีกาลังสองน้อยที่สุด ด้วยการหาค่าอนุพันธ์เชิงส่วน
เทียบกับ และ แล้วกาหนดให้สมการเท่ากับศูนย์
0 1 1
ˆ0
ˆ
0 1
สามารถคานวณหาค่าจุดตัดแกนและความชัน ได้ดังนี้
0 1
ˆ ˆy x (1)
1 1
1
1 2
2 1
1
ˆ
n n
i in
i i
i i
i
n
in
i
i
i
y x
y x
n
x
x
n
(2)
0 1
1 1
ˆ ˆ
n n
i i
i i
n x y
2
0 1
1 1 1
ˆ ˆ
n n n
i i i i
i i i
x x y x
เมื่อจัดรูปสมการทั้งสองใหม่จะได้รูปสมการปกติ คือ
-9-
10. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
ดังนั้น เส้นประมาณการถดถอยที่เหมาะสม คือจากสมการหาความชัน นาแสดงใหม่โดยใช้
สัญลักษณ์แทนได้ดังนี้
1
ˆ( )
2
12 2
1 1
( )
n
in n
i
xx i i i
i i
x
S x x x
n
1 1
1 1
( )( )
n n
i in n
i i
xy i i i i
i i
x y
S y y x x x y
n
1
ˆ xy
xx
S
S
(3)
0 1
ˆ ˆˆ iy x (4)
สาหรับ แต่ละคู่ลาดับของข้อมูล(x, y) ที่ได้จากการ
สังเกตจริง แสดงดังสมการต่อไปนี้
0 1
ˆ ˆˆi i iy x e i = 1,2,…,n
โดยที่ เรียกว่า ค่าเรสซิดวล (Residual)
หรือค่าความคลาดเคลื่อน
ˆi ie y y
-10-
11. 3. การประมาณค่าพารามิเตอร์โดยวิธีกาลังสองน้อยที่สุด (ต่อ)
3.2 การประมาณค่าความแปรปรวน: 2
รูปที่ 4 ตัวอย่างความแปรปรวนของข้อมูล
การประมาณค่าความแปรปรวนโดยที่เรสซิดวล ถูกใช้เพื่อให้ได้ค่าประมาณ
ซึ่งค่าเรสซิดวลจะมีค่าเป็นไปได้ทั้งบวกและลบ จึงต้องกาหนดค่าให้อยู่ในรูปของ
ผลรวมกาลังสองของเรสซิดวล (Error sum of squares: )
2
1
n
E i
i
SS e
2
1
ˆ( )
n
i
i
y y
โดยองศาอิสระ (Degrees of freedom) คือ
ค่าเฉลี่ยของผลรวมกาลังสองของเรสซิดวล คือ 2
ˆ( ) ( 2)EE SS n
ดังนั้น ค่าประมาณความแปรปรวนของเรสซิดวลที่ไม่เอนเอียง คือ
ESS
2
2n
2 2
ˆ
2
E
E
SS
MS S
n
(5)
2
ˆ
2
ˆ
สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมน้อย
สมการถดถอยที่ประมาณได้นี้มีความเหมาะสมมาก -11-
13. ตัวอย่าง (ต่อ)
รูปที่ 5 แผนภาพการกระจายของค่าความต้านทานต่อการฉีกขาดของกระดาษ(y)
กับเปอร์เซ็นต์กาวอัด (x)
เมื่อ x มีค่าสูงขึ้น y จะมีค่าสูงขึ้นด้วย
การใช้ค่าของข้อมูลวิเคราะห์ความสัมพันธ์ของตัวแปรต้นและตัว
แปรตาม ซึ่งมีข้อมูลดังต่อไปนี้
10n
10
1
19.60i
i
x
10
1
127.30i
i
y
10
1
254.30i i
i
y x
10
2
1
40.12i
i
x
10
2
1
1638.03
i
y
1.96x 12.73y
คานวณค่าสัมประสิทธิ์ของสมการถดถอยเชิงเส้นอย่างง่าย
210
2
10
12
1
19.60
40.12 1.704
10
i
i
xx i
i
x
S x
n
10 10
10
1 1
1
19.60 127.30
254.3 4.7
10
0 92
i i
i i
xy i i
i
x y
S x y
n
ค่าความชัน และค่าจุดตัด
1
4.792ˆ 2.812
1.704
xy
xx
S
S
0 1
ˆ ˆ 12.73 (2.812 1.96) 7.218y x
-13-
19. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ)
5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
เป็นการวิเคราะห์ความแปรปรวนที่ใช้เพื่อทดสอบนัยสาคัญของการ
ถดถอย ซึ่งการวิเคราะห์ความแปรปรวนมีดังนี้
2 2 2
1 1 1
ˆ ˆ( ) ( ) ( )
n n n
i i i i
i i i
y y y y y y
2
1
ˆ( )
n
R i
i
SS y y
2
1
ˆ( )
n
E i i
i
SS y y
ผลรวมกาลังสองของความคลาดเคลื่อนจากการถดถอย
(Regression sum of squares)
ผลรวมกาลังสองของความคลาดเคลื่อน
(Error sum of squares)
เขียนสมการใหม่ได้ว่า
โดยที่
2
1
( )
n
T i
i
SS y y
2
12
1
n
in
i
i
i
y
y
n
-19-
T R ESS SS SS (10)
1
ˆ
R xySS S (11)
E T RSS SS SS (12)
20. 5. การทดสอบสมมติฐานในการวิเคราะห์ถดถอยเชิงเส้น (ต่อ)
5.2 การทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
ตัวสถิติที่ใช้ในการทดสอบ คือ
0
1
( 2)
R R
E E
SS MS
F
SS n MS
ซึ่งการแจกแจงแบบเอฟ ด้วยองศาอิสระ จะปฏิเสธสมมติฐานหลัก ถ้า พบว่าค่าสถิติเอฟ
ที่ได้จากการคานวณมากกว่าค่าที่เกิดจากการเปิดตารางเอฟ
2n 0 ,1, 2nF f
แหล่งที่มา
(Source of variation)
ผลบวกกาลังสอง
(Sum of Squares)
องศาอิสระ
(Degrees of
Freedom)
ค่าเฉลี่ย
(Mean
Square)
ค่าสถิติ
0( )F
ตัวแบบ (Regression) RSS 1 RMS 0 R EF MS MS
ค่าความคลาดเคลื่อน (Error) ESS 2n EMS
ทั้งหมด (Total) TSS 1n
ตารางที่ 3 การวิเคราะห์ความแปรปรวนของการทดสอบนัยสาคัญการถดถอย
-20-
(13)
22. 0.05
0.05,1,8 5.32f
ตัวอย่าง (ต่อ)
ทดสอบสมมติฐานโดยใช้การวิเคราะห์ความแปรปรวน
10n
10
1
127.30i
i
y
10
2
1
1638.03
i
y
12.73y
ˆ 127.3iy 1
ˆ 2.812 4.792xyS
สมมติฐาน
0 1: 0H
1 1: 0H
(ไม่มีความสัมพันธ์ระหว่าง x และ y)
(มีความสัมพันธ์ระหว่าง x และ y)
0.05
2
1
ˆ( ) 4.02
n
E i i
i
SS y y
1
ˆ 2.812 4.792 13.475R xySS S
2
2
12
1
127.3
1638.03 17.501
10
n
in
i
T i
i
y
SS y
n
13.475
13.475
1 1
R
R
SS
MS
4.02
0.503
( 2) 10 2
E
E
SS
MS
n
0
13.475
26.78
0.5025
R
E
MS
F
MS
0 ,1, 2nF f ปฏิเสธ ถ้า0H
0 0.05,1,8( 5.32)F f
-22-
24. สมการถดถอยสามารถพยากรณ์ค่าของตัวแปรตาม (Y) ได้ดีมากยิ่งขึ้น
สมการถดถอยพยากรณ์ค่าของตัวแปรตาม (Y) ได้ไม่ดี
(เนื่องจากตัวแปรตามและตัวแปรอิสระมีความสัมพันธ์กันน้อย)
6. ค่าสัมประสิทธิ์การตัดสินใจ
สมการถดถอยที่ใช้ในการพยากรณ์นี้อาจพยากรณ์ค่าตัวแปรตาม (Y) ได้ดีหรือไม่ดีก็ได้ โดยที่ ค่าสัมประสิทธิ์การตัดสินใจ (Coefficient
of Determination; ) เป็นค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y ซึ่งค่าสัมประสิทธิ์การตัดสินใจนี้เป็น
ค่าที่ใช้บอกเปอร์เซ็นต์การเปลี่ยนแปลงของตัวแปรตาม (Y) ที่สามารถอธิบายได้ด้วยตัวแปรอิสระ (X) ในสมการถดถอย
2
R
2 2 1
1
ˆ
ˆ XX XY R
T T T
S S SS
R
SS SS SS
โดยที่ ค่า จะมีค่าอยู่ระหว่าง 0 ถึง 12
R
ค่าสัมประสิทธิ์การตัดสินใจ: 2
R
2
R
2
R
(14)
-24-
26. 7. สหสัมพันธ์
สมมติว่า การแจกแจงร่วมของ และ เป็นการแจกแจงแบบปกติของสองตัวแปรสุ่ม (Bivariatenormal distribution)
โดยมีค่าเฉลี่ยของตัวแปรคือ และ ความแปรปรวนของตัวแปรคือ และ และกาหนดให้ คือสัมประสิทธิ์
สหสัมพันธ์ระหว่างตัวแปร X และ Y ได้ว่า
iX iY
X Y 2
X 2
Y
• สหสัมพันธ์เป็นการศึกษาความสัมพันธ์ระหว่างตัวแปรสุ่ม
• ใช้สาหรับการทดสอบความสัมพันธ์เชิงเส้นตรง
• สามารถระบุระดับความสัมพันธ์ได้ เช่น สูงกับน้าหนักว่ามีความสัมพันธ์กันมากหรือน้อย
• สามารถระบุทิศทางความสัมพันธ์ได้ เช่น สูงกับน้าหนักมีความสัมพันธ์ในทิศทางเดียวกันหรือตรงกันข้าม
• ตรวจสอบด้วยการใช้แผนภาพการกระจายและค่าสัมประสิทธิ์สหสัมพันธ์ (correlation coefficient)
การวิเคราะห์สหสัมพันธ์
XY
X Y
โดยที่ คือความแปรปรวนร่วมระหว่าง X และ YXY
-26-
27. 7. สหสัมพันธ์ (ต่อ)
1
1 2 1 2
2 2
1 1
( )
ˆ
( SS )
( ) (Y )
n
i i
i XY
n n
XX T
i i
i i
Y X X
S
R
S
X X Y
โดยการประมาณของสัมประสิทธิ์สหสัมพันธ์อย่างง่าย (Sample Correlation Coefficient: R)
1. ค่าของ R ไม่ได้ขึ้นอยู่กับการศึกษาภายใต้ตัวแปรสองตัว
2. ค่า R เป็นอิสระจากการตรวจวัดของ x และ y
3. ค่า R จะ มีค่าอยู่ในช่วง
4. R = 1 เมื่อ x มีค่ามาก y มีค่ามาก หรือเมื่อ x มีค่าน้อย y มีค่าน้อย (มีความสัมพันธ์เชิงเส้นเชิงบวก)
R = -1 เมื่อ x มีค่ามาก y มีค่าน้อย หรือเมื่อ x มีค่าน้อย y มีค่ามาก (มีความสัมพันธ์เชิงเส้นเชิงลบ)
5. ค่ายกกาลังสองของค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าค่าสัมประสิทธิ์การตัดสินใจ:
คุณสมบัติที่สาคัญที่สุดของ R คือ:
1 1R
2
R
-27-
(15)
28. 7. สหสัมพันธ์ (ต่อ)
รูปที่ 9 แผนภาพการกระจายของข้อมูลอธิบายค่า R
ซึ่งการตรวจสอบความสัมพันธ์ ทาการตรวจสอบโดย
แผนภาพกระจายข้อมูล รูปที่ 9 แสดงสถานการณ์ที่เป็นไปได้
สาหรับค่าของ R
•รูปที่ 9 (a) R>1 ความสัมพันธ์เชิงเส้น มีความชันเป็นบวก
•รูปที่ 9 (b) R<1 ความสัมพันธ์เชิงเส้น มีความชันเป็นลบ
•รูปที่ 9 (c) R=0 ไม่เป็นความสัมพันธ์เชิงเส้นโค้ง
•รูปที่ 9 (d) R=0 แสดงให้เห็นความสัมพันธ์ระหว่าง
x และ y ซึ่งเป็นความสัมพันธ์เชิงเส้นโค้ง
จะเห็นได้ว่า R=0 จะไม่มีความสัมพันธ์เชิงเส้นระหว่าง x และ y
ดังนั้น การพิจารณาข้อมูลด้วยแผนภาพการกระจายจึงเป็นสิ่งที่
มีความสาคัญ
-28-
29. ตัวอย่าง
ตัวอย่างที่ 4 จงหาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์
กาวอัด จากข้อมูลในตัวอย่างที่ 1 และ2 ได้ค่าต่าง ๆ ดังนี้
1 2 1 2
4.792
ˆ 0.878
( SS ) (1.704 17.501)
XY
XX T
S
R
S
ดังนั้น ค่า R=0.878 นี้หมายความว่าค่าความต้านทานต่อการฉีกขาดของกระดาษและเปอร์เซ็นต์ของกาวอัด
มีความสัมพันธ์กันสูงประมาณ 87. 8% และเนื่องจากค่า R เป็นบวกจะแสดงว่ามีความสัมพันธ์กันในทิศทาง
เดียวกัน คือถ้าเปอร์เซ็นต์กาวอัดมีค่าสูงค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะสูงตามไปด้วยและ
ในทางตรงกันข้ามถ้าเปอร์เซ็นต์กาวอัดมีค่าต่าค่าความต้านทานต่อการฉีกขาดของกระดาษก็จะต่าตามไปด้วย
4.792xyS 1.704xxS 17.501TSS
-29-
31. 8. ตัวอย่างงานวิจัย
Title: Prediction of Maintenance Material Consumption for Aviation Equipment Using Linear Regression Model
Authors:Yan-ming YANG, Yue TENG and Rui-li ZHANG
1.วัตถุประสงค์ของการวิจัย
การพยากรณ์ปริมาณการใช้วัสดุในการบารุงรักษาอุปกรณ์การบินเป็นสิ่งที่มีความสาคัญ และช่วย
ในการตัดสินใจการใช้ประโยชน์จากทรัพยากรที่มีอยู่เพื่อปรับปรุงความสามารถในการบารุงรักษา ใน
งานวิจัยนี้มุ่งเน้นไปที่ปัจจัยหลักที่มีอิทธิพลต่อการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน โดยใช้
แบบจาลองการทานายถดถอยเชิงเส้นของการใช้วัสดุในการบารุงรักษาอุปกรณ์ สร้างขึ้นโดยใช้ข้อมูล
ตัวอย่างที่เกิดขึ้นจริง บนพื้นฐานการวิเคราะห์จากตัวอย่าง วิธีการถดถอยเชิงเส้นอย่างง่ายใช้ในการ
ทานาย และการทดสอบการใช้วัสดุในการบารุงรักษาอุปกรณ์การบิน
-31-
40. 1. Mendenhall, W. M., & Sincich, T. L. (2016). Statistics for Engineering and the Sciences. Chapman and
Hall/CRC.
2. Montgomery, D. C., & Runger, G. C. (2014). Applied statistics and probability for engineers. John Wiley
and Sons.
3. Devore, J. L. (2011). Probability and Statistics for Engineering and the Sciences. Cengage learning.
4. Ott, R. L., & Longnecker, M. T. (2015). An introduction to statistical methods and data analysis. Nelson
Education.
5. Yang, Y. M., Yue, T. E. N. G., & Zhang, R. L. (2018). Prediction of Maintenance Material Consumption
for Aviation Equipment Using Linear Regression Model. DEStech Transactions on Computer Science
and Engineering, (mso).
อ้างอิง