2. V. Ví dụ minh họa.
2
VD. Cho bảng số liệu về mặt hàng xuất khẩu dầu thô trong nước:
Trong đó
• Y: sản lượng dầu thô ( nghìn tấn ).
• X: Kim ngạch xuất khẩu dầu thô (nghìn tấn).
• Z: Vốn đầu tư khai thác ( trăn triệu đồng ).
• Yêu câu: Hãy phát hiện và khắc phục hiện tượng Đa Cộng Tuyến. Cho
α = 5%
4. Tiến hành ước lượng hàm hồi quy mẫu ta được:
Ta thu hàm hồi quy mẫu:
𝑌𝑖 = 12.47549 + 0.228322Xi + 0.001431Zi
4
5. I. Phát hiện hiện tượng đa cộng tuyến.
1. R2 nhưng tỷ số t thấp
Từ bảng số liệu ta có:
• R2 = 0,990379 > 0,8
• tx = 2.167852 < 𝑡α
2
(𝑛−𝑘)
= 𝑡0,025
12
= 2,179
• tz = 1.547751 < 2.179
=> R2 cao tỷ số t thấp
Vậy nghi nghờ có hiện tượng Cộng Đa Tuyến trong mô hình đã cho.
5
6. 2. Hệ số tương quan cặp giữa các biến giải thích cao .
=> r23 = r32 = 0,994412 > 0,8
=> Ta có cơ thêm cơ sở kết luận có hiện tượng Đa Cộng Tuyến trong mô
hình.
6
7. 3. Hồi quy phụ.
Ta hồi quy biến X theo biến Z thu được kết quả sau:
7
8. • Ta có α = 0.05. KĐGT
𝐻0: 𝐾ℎô𝑛𝑔 𝑐ó ℎ𝑖ệ𝑛 𝑡ượ𝑛𝑔 Đ𝑎 𝐶ộ𝑛𝑔 𝑇𝑢𝑦ế𝑛
𝐻1: 𝐶ó ℎ𝑖ệ𝑛 𝑡ượ𝑛𝑔 đ𝑎 𝑐ộ𝑛𝑔 𝑡𝑢𝑦ế𝑛 𝑥ả𝑦 𝑟𝑎
• Nhận xét
Ta thấy TK F có p-value = 0.000000 < α = 0.05
Bác bỏ H0 chấp nhận H1
Vậy càng có cơ sở để khẳng định mô hình trên có hiện tượng Đa Cộng Tuyến
8
9. 4. Độ đo Theil
Để tình được độ đo Theil ta phải tính được 𝑅2
, 𝑅12,3
2
, 𝑅13,2
2
. ADCT
𝑟12,3
2
= 𝑟13,2
2
=
𝑟13
−𝑟12
𝑟23
2
1−𝑟12
2 (1−𝑟23
2 )
=
0,993283−0,994213 𝑥 0,994412 2
(1−0,9942132
)(1−0,9944122)
≈ 0,16636.
𝑟13
2
= 0,9932832 ≈ 0,98661
𝑅2=𝑟12
2
+(1-𝑟12
2
) 𝑟13
2
=(0,994213)2 + (1-0,9942132)0,16636 ≈0,99038
m=𝑅2-[(1-𝑟12
2
) 𝑟13
2
= 0,99038 – 2(1-0,98846)0,16636=0,9865
Vậy chứng tỏ có hiện tượng đa cộng tuyến sảy ra. Và mức độ đa cộng tuyến là
0.98654
9
10. II. Khắc phục hiện tượng đa cộng tuyến.
1. Bỏ biến.
Các bước cần tiến hành:
Bước 1 : hồi quy Y theo X => 𝑅1
2
, 𝑅1
2
.
Bước 2 : hồi quy Y theo Z => 𝑅2
2
, 𝑅2
2
.
Bước 3 : so sánh 𝑅2
2
𝑣à 𝑅2
2
trong các hồi quy trên.
Bước 4 : Kết luận
10
13. Bước 3 : Từ kết quả hồi qu ở trên ta có:
• 𝑅2 = 0.990379 𝑅2 = 0.988776
• 𝑅1
2
= 0.988459 𝑅1
2
= 0.987571
• 𝑅2
2
= 0.986612 𝑅2
2
= 0.985582
Bước 4: Kết luận
=> Ta loại bỏ biến Z ra khỏi mô hình.
13
14. 2. Sử dụng sai phân cấp 1.
Chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa biến Y và các biến phụ
thuộc X,Z theo mô hình sau:
𝑌𝑡 = 𝛽1 + 𝛽2X2 + 𝛽3X3 + Ut (*)
Với t là thời gian. Phương pháp trên đúng với t thì cũng đúng với t-1 nghĩa là:
Yt-1 = 𝛽1 + 𝛽2X2t-1 + 𝛽3X3t-1 + Ut-1 (**)
Trừ (*) cho (**) và đặt yt = Yt – Yt-1
xt = Xt – Xt-1
zt = Zt – Zt-1
14
17. Hồi quy phụ của biến sai phân xt theo zt ta được:
`Hệ số tương quan giữa các biến
giải thích:
17
18. Nhận Xét:
R2 = 0.318112 < 0.8
r12 = r21=0.582640 < 0.8
Khi ta tiến hành hồi quy phụ xt theo zt, mặc dù vẫn còn hiện tượng Đa Cộng Tuyến
nhưng mức độ cộng tuyến giảm vì p-value = 0,28779 đã gần với α = 0,05. => Khi sử
dụng sai phân cấp 1 mức độ phù hợp của mô hình đã bị suy giảm.
18
19. Bỏ biến sai phân
Hồi quy Y theo X Hồi
quy Y theo Z
Từ kết quả hồi quy của yt theo xt và zt ta sẽ loại bỏ biến zt ra khỏi mô hình
19
20. Mặt khác ta có t là số quan sát. Phương trình cũng đúng với t quan sát thì cũng đúng
với t-1 quan sát.
Ta có MHHQ gốc ban đầu:
𝑌𝑖 = 12.47549 + 0.228322Xi + 0.001431Zi (1)
Xây dựng hàm hồi quy thứ 2 mà khi ta đã bỏ đi quan sát đâu tiên
20
22. Ta có hàm hồi quy mới sau khi bỏ đi quan sát đầu tiên:
𝑌𝑖 = 12.53141 + 0.222474Xi + 0.001445Zi (2)
Lấy (2) – (1) ta được mô hình sai phân cấp 1:
𝑌𝑖 = −0,05592 + 0.00585Xi − 0,000014Zi
=> Mô hình này cũng cũng có thể làm giảm đa cộng tuyến của các biến dộc lập
22
23. Kết luận.
Có nhiều cách phát hiện và khắc phục hiện tượng đa cộng tuyến khác nhau. Mỗi
phương pháp có những hạn chế nhất định. Vì vậy, khi áp dụng một phương pháp
nào ta cần cân nhắc kĩ lượng để mang lại kết quả tin cậy nhất.
23