SlideShare a Scribd company logo
1 of 42
CHƯƠNG 6
HIỆN TƯỢNG ĐA CỘNG TUYẾN
(MULTICOLLINEARITY)
2
1. Hiểu bản chất và hậu quả
của đa cộng tuyến
2. Biết cách phát hiện đa cộng
tuyến và biện pháp khắc
phục
MỤC
TIÊU
ĐA CỘNG TUYẾN
NỘI DUNG
3
Bản chất, nguyên nhân của đa cộng tuyến
1
Ước lượng các tham số
2
3
Phát hiện đa cộng tuyến
4
Khắc phục đa cộng tuyến
5
Hậu quả
4
Thu nhập Sự giàu có Chi tiêu
80 810 70
100 1009 65
120 1273 90
140 1425 95
160 1633 110
180 1876 115
200 2052 120
220 2201 140
240 2435 155
260 2686 150
Nguồn: Ramu Ramanathan
5
6
7
8
Khi lập mô hình hồi quy bội
Có sự phụ thuộc tuyến tính cao giữa các biến
giải thích gọi là đa cộng tuyến.
a. Đa cộng tuyến hoàn hảo
Tồn tại 2, 3,… k không đồng thời bằng 0
sao cho
2X2 + 3X3 + …+ kXk = 0
Nói cách khác là xảy ra trường hợp một biến giải
thích nào đó được biểu diễn dưới dạng một tổ
hợp tuyến tính của các biến còn lại.
ki
k
i
i
i X
X
X
Y 


 ˆ
...
ˆ
ˆ
ˆ
ˆ
3
3
2
2
1 




6.1 Bản chất của đa cộng tuyến
9
b. Đa cộng tuyến không hoàn hảo
2X2 + 3X3 + …+ kXk + vi= 0
Với vi là sai số ngẫu nhiên thì ta có hiện tượng đa
cộng tuyến không hoàn hảo giữa các biến giải thích.
Nói cách khác là một biến giải thích nào đó có tương
quan với một số biến giải thích khác.
6.1 Bản chất của đa cộng tuyến
10
X3i = 5X2i, vì vậy có cộng tuyến hoàn hảo giữa X2
và X3 ; r23 = 1
X2 và X3* không có cộng tuyến hoàn hảo, nhưng
hai biến này có tương quan chặt chẽ.
X2 10 15 18 24 30
X3 50 75 90 120 150
X*
3
V
52
2
75
0
97
7
129
9
152
2
6.1 Bản chất của đa cộng tuyến
VD
11
6.1 Bản chất của đa cộng tuyến
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
12
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
6.1 Bản chất của đa cộng tuyến
13
Một số nguyên nhân gây ra hiện tượng
đa cộng tuyến
- Khi chọn các biến độc lập mối quan có
quan hệ nhân quả hay có tương quan
cao vì đồng phụ thuộc vào một điều kiện
khác.
- Khi số quan sát nhỏ hơn số biến độc lập.
- Cách thu thập mẫu: mẫu không đặc
trưng cho tổng thể
- Chọn biến Xi có độ biến thiên nhỏ.
6.1 Nguyên nhân của đa cộng tuyến
6.2 Ước lượng khi có đa cộng tuyến
1. Trường hợp có đa cộng tuyến hoàn hảo
Xét mô hình hồi qui 3 biến dưới dạng sau:
Yi = 2 X2i + 3 X3i + ei
giả sử X3i = X2i, mô hình được biến đổi thành:
Yi = (2+ 3)X2i + ei = 0 X2i + ei
Phương pháp OLS
14




 2
2
2
3
2 )
ˆ
ˆ
(
ˆ
i
i
i
o
x
y
x




 Không thể tìm được lời giải duy nhất cho 3
2
ˆ
,
ˆ 

6.2 Ước lượng khi có đa cộng tuyến
 Các hệ số ước lượng không xác định
 Phương sai và sai số chuẩn của 2 và 3 là
vô hạn
15
2
3
2
2
3
2
2
3
2
3
2
3
2
2
)
(
ˆ

 
   



i
i
i
i
i
i
i
i
i
i
i
x
x
x
x
x
x
x
y
x
x
y

0
0
ˆ
2
3
2
3
2
2
3
2
3
2
3
3
3
2
3
3
2 





 
   
i
i
i
i
i
i
i
i
i
i
i
x
x
x
x
x
x
x
y
x
x
y





6.2 Ước lượng các tham số khi có đa cộng tuyến
 Các hệ số ước lượng không xác định: chúng ta không
tách rời tác động của từng biến Xi lên Y do không thể
giả định X2 thay đổi trong khi X3 không đổi.
16
2
3
2
2
3
2
2
3
2
3
2
3
2
2
)
(
ˆ

 
   



i
i
i
i
i
i
i
i
i
i
i
x
x
x
x
x
x
x
y
x
x
y

0
0
ˆ
2
3
2
3
2
2
3
2
3
2
3
3
3
2
3
3
2 





 
   
i
i
i
i
i
i
i
i
i
i
i
x
x
x
x
x
x
x
y
x
x
y





6.2 Ước lượng các tham số khi có đa cộng tuyến
2. Trường hợp có đa cộng tuyến không hoàn hảo
• Đa cộng tuyến hoàn hảo thường không xảy ra trong
thực tế.
• Xét mô hình hồi qui 3 biến dưới dạng sau:
yi = 2 x2i + 3 x3i + ei
Giả định x3i =  x2i + vi
Với   0 và vi là sai số ngẫu nhiên.
• Trong trường hợp này, các hệ số hồi qui 2 và 3
có thể ước lượng được:
17
Ta có thể ước lượng được các này nhưng s.e.
sẽ rất lớn.
6.2 Ước lượng các tham số khi có đa cộng tuyến
18

ˆ
6.3 Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
• Các ước lượng vẫn BLUE, nhưng:
1. Phương sai và hiệp phương sai của các ước lượng
OLS lớn.
19
r23 là hệ số tương
quan giữa X2 và X3.
Khi r23  1, các giá
trị trên  
6.3 Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
2. Khoảng tin cậy rộng hơn.
• Khoảng tin cậy của 2 và 3 (với độ tin cậy 1 – )
là:
2 =  t /2 se ( );
3 =  t /2 se ( );
trong đó:
se ( ) = se ( ) =
20
^
2

^
2

^
3

^
2

^
3


 2
2
2
23)
1
( i
x
r

^
3


 2
3
2
23)
1
( i
x
r

21
Giá trị của r23 Khoảng tin cậy 95% của B2
0
0.5
0.95
0.995
0.999
A
*
96
.
1
ˆ
2 

A
*
33
.
1
*
96
.
1
ˆ
2 

A
*
26
.
10
*
96
.
1
ˆ
2 

A
*
100
*
96
.
1
ˆ
2 

A
*
500
*
96
.
1
ˆ
2 


 2
2
2
i
x
A

6.3 Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
3. Tỉ số t "không có ý nghĩa".
Khi kiểm định giả thuyết H0: 2 = 0, chúng ta sử dụng
tỷ số t.
và so sánh giá trị ước lượng của t với giá trị tra bảng
(tới hạn) của t.
Trong trường hợp cộng tuyến cao thì sai số chuẩn sẽ
rất lớn và do đó làm cho giá trị t sẽ nhỏ đi, kết quả
là sẽ làm tăng chấp nhận giả thuyết H0.
22
)
ˆ
(
se
ˆ
t
2
2



6.3 Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
4. R2 cao nhưng tỉ số t ít có ý nghĩa.
• Đa cộng tuyến cao:
• - một hoặc một số tham số tương quan (hệ số
góc riêng) không có ý nghĩa về mặt thống kê
• - R2 trong những trường hợp này lại rất cao
(trên 0,9).
• - kiểm định F thì có thể bác bỏ giả thuyết cho
rằng 2 = 3 = … = k = 0.
23
6.3 Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo:
5. Các ước lượng OLS và sai số chuẩn của chúng trở
nên rất nhạy với những thay đổi nhỏ trong dữ liệu.
6. Dấu của các ước lượng của các hệ số hồi qui có
thể sai
7. Thêm vào hay bớt đi các biến cộng tuyến với các
biến khác, mô hình sẽ thay đổi về dấu hoặc thay
đổi về độ lớn của các ước lượng.
24
Ví dụ: Bảng 2 do nhập sai số liệu nên
xảy ra đa cộng tuyến
25
Bảng 1
Y X2 X3
1 2 4
2 0 2
3 4 12
4 6 0
5 8 16
Bảng 2
Y X2 X3
1 2 4
2 0 2
3 4 0
4 6 12
5 8 16
00868
.
0
)
ˆ
,
ˆ
cov(
;
5523
.
0
;
81
.
0
003
.
0
446
.
0
193
.
1
ˆ
3
2
23
2
3
2









r
R
X
X
Y i
i
i
Se (0.7736) (0.1848) (0.0850)
t (1.543) (2.415) (0.0358)
0282
.
0
)
ˆ
,
ˆ
cov(
;
8285
.
0
;
81
.
0
027
.
0
401
.
0
210
.
1
ˆ
3
2
23
2
3
2









r
R
X
X
Y i
i
i
Se (0.7480) (0.2720) (0.1252)
t (1.618) (1.4752) (0.2152)
26
Đa cộng tuyến là một hiện tượng theo
mẫu, nghĩa là cho dù các biến độc lập
Xi không tương quan tuyến tính trong
tổng thể nhưng chúng có thể tương
quan tuyến tính trong một mẫu cụ thể
nào đó. Do đó cỡ mẫu lớn thì hiện
tượng đa cộng tuyến ít nghiêm trọng
hơn cỡ mẫu nhỏ
27
1. Hệ số R2 lớn nhưng tỷ số t nhỏ
2. Tương quan cặp giữa các biến giải thích cao
3. Sử dụng mô hình hồi qui phụ
4. Sử dụng yếu tố phóng đại phương sai (VIF)
6.4 Cách phát hiện đa cộng tuyến
28
1. R2 lớn nhưng tỷ số t nhỏ
Nếu R2 cao, chẳng hạn, >0,8 và F test bác bỏ giả
thuyết 2 = 3 = … = k = 0, nhưng t test cho
từng i lại chấp nhận H0.
2. Tương quan cặp giữa các biến giải thích cao
Trong đó X, Z là 2 biến giải thích trong mô hình







2
2
)
(
)
(
)
)(
(
Z
Z
X
X
Z
Z
X
X
r
i
i
i
i
XZ
6.4 Cách phát hiện đa cộng tuyến
29
3. Sử dụng mô hình hồi quy phụ
Hồi qui một biến giải thích X nào đó theo các biến
còn lại.
Tính R2 và F cho mỗi mô hình theo công thức:
Lập giả thiết H0: R2 = 0 ~ H0: không có đa cộng tuyến
Nếu F > F(m-1,n-m): bác bỏ H0 => có đa cộng tuyến
Nếu F < F(m-1,n-m): chấp nhận H0 => không có đa
cộng tuyến
mi
k
i
i X
X
X 

 ˆ
...
ˆ
ˆ
ˆ
3
3
1
2 



)
1
)(
1
(
)
(
2
2




m
R
m
n
R
F
6.4 Cách phát hiện đa cộng tuyến
30
VD: Cho doanh số bán (Y), chi phí chào hàng (X2)
và chi phí quảng cáo (X3) trong năm 2001 ở 12
khu vực bán hàng của 1 công ty. Có hiện tượng
đa cộng tuyến không?
Hồi quy biến chi phí chào hàng với chi phí quảng
cáo, ta có kết quả
X2 =42,012 + 0,387 *X3
R2 = 0,22922 F= 2,9738
Với mức ý nghĩa α=5%, tra bảng F0.05 (1,10)=
4,96. Ta thấy F < F0.05 (1,10) nên chấp nhận Ho
hay không có đa cộng tuyến.
6.4 Cách phát hiện đa cộng tuyến
31
4. Sử dụng nhân tử phóng đại phương sai (VIF)
Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa
như sau:
Đối với trường hợp tổng quát, có (k-1) biến giải thích thì:
R2
j: là giá trị R2 trong hàm hồi quy của Xj theo (k-1) biến giải
thích còn lại. Thông thường khi VIF > 10, thì biến này được
coi là có cộng tuyến cao
)
1
(
1
2
23
r
VIF


)
1
(
1
2
j
R
VIF


6.4 Cách phát hiện đa cộng tuyến
VIF
x i
.
)
ˆ
var( 2
2
2
2




32
Giá trị của r23 VIF
0 1 1A 0
0.5 1.33 1.33A 0.67B
0.7 1.96 1.96A 1.37B
0.8 2.78 2.78A 2.22B
0.9 5.76 5.76A 4.73B
0.95 10.26 10.26A 9.74B
0.97 16.26 16.92A 16.4B
0.99 50.25 50.25A 49.75B
0.995 100 100A 99.5B
0.999 500 500A 499.5B
)
ˆ
( 2

Var )
ˆ
,
ˆ
( 3
2 

Cov
 




2
3
2
2
2
2
2
2
;
i
i
i x
x
B
x
A


33
1. Dùng thông tin tiên nghiệm
Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas
Ln(Yi)=1 + 2ln(Ki)+ 3ln(Li) + ui
Có thể gặp hiện tượng đa cộng tuyến do K và L
cùng tăng theo quy mô sản xuất. Nếu ta biết là hiệu
suất không đổi theo quy mô tức là 2+3=1.
Ln(Yi)=1 + 2ln(Ki)+ (1-2)ln(Li) + ui
Ln(Yi) – Ln(Li) = 1 + 2[ln(Ki) - ln(Li)] + ui
Ln(Yi /Li ) = 1 + 2ln(Ki /Li) + ui
=> mất đa cộng tuyến (vì đây là mô hình hồi quy
đơn).
i
u
i
i
i e
K
AL
Y 2
3 


6.5 Cách khắc phục
34
1. Dùng thông tin tiên nghiệm
Ví dụ
Yi=1 + 2X2i+ 3X3i + ui
Biết 3=0.12
Biến đổi Yi=1 + 2X2i+ 0.12X3i + ui
Yi=1 + 2Xi+ ui
Với Xi=X2i+ 0.1X3i
6.5 Cách khắc phục
35
2. Loại trừ một biến giải thích ra khỏi mô
hình
B1: Xem cặp biến giải thích nào có quan hệ
chặt chẽ. Giả sử X2, X3…Xk là các biến độc lập, Y
là biến phụ thuộc và X2, X3 có tương quan chặt
chẽ với nhau.
B2: Tính R2 đối với các hàm hồi quy: có mặt cả
2 biến; không có mặt một trong 2 biến
B3: Loại biến mà giá trị R2 tính được khi không
có mặt biến đó là lớn hơn.
6.5 Cách khắc phục
36
6.5 Cách khắc phục
3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới
37
4. Dùng sai phân cấp 1
Ví dụ từ hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut
ta suy ra
yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1
Trừ hai vế cho nhau, ta được:
yt – yt – 1 = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut – ut – 1)
Hay:
yt = 1  x1,t + 2  x2,t + et,
Mặc dù, x1 và x2 có quan hệ tuyến tính, nhưng
không có nghĩa sai phân của chúng cũng như
vậy.
6.5 Cách khắc phục
38
5. Đổi biến
Ví dụ : yt = 1 + 1x1t + 2x2t + ut
Với Y: tiêu dùng
X1: GDP
X2: dân số
Vì GDP và dân số theo thời gian có xu hướng
tăng nên có thể cộng tuyến.
Biện pháp: chia các biến cho dân số
6.5 Cách khắc phục
t
t
t
t
t
t
X
u
X
X
X
Y
2
2
2
1
2
1
2



 


39
Khảo sát chi tiêu tiêu dùng, thu nhập và sự giàu có,
ta có bảng số liệu sau.
Gọi Y: chi tiêu tiêu dùng (USD) X2: thu nhập (USD)
X3: sự giàu có (USD)
Yêu cầu:
1. Ước lượng mô hình hồi quy Y= β1 + β2. X2 +
β3.X3 +U
2. Mô hình có xảy ra đa cộng tuyến không? Vì
sao?
3. Nếu xảy ra đa cộng tuyến, hãy tìm cách khắc
phục.
Ví dụ 1
40
X2 X3 Y
80 810 70
100 1009 65
120 1273 90
140 1425 95
160 1633 110
180 1876 115
200 2052 120
220 2201 140
240 2435 155
260 2686 150
Nguồn: Ramu Ramanathan
41
1. Ước lượng mô hình hồi quy Y= β1 + β2.
X2 + β3.X3 +U
Nhận xét ban đầu: Theo lý thuyết kinh tế thì
chi tiêu cho tiêu dùng (Y) có xu hướng
tăng theo thu nhập (X2) và sự giàu có
(X3) nên dấu của các hệ số hồi quy riêng
là dương.
Kết quả hồi quy trên Eviews như sau:
42

More Related Content

Similar to chuong-6_hien-tuong-da-cong-tuyen (1).ppt

Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...vietlod.com
 
Th kinh-te-luong1
Th kinh-te-luong1Th kinh-te-luong1
Th kinh-te-luong1Anh Đỗ
 
02 cuc tri ham bac ba tlbg_p1
02 cuc tri ham bac ba tlbg_p102 cuc tri ham bac ba tlbg_p1
02 cuc tri ham bac ba tlbg_p1Huynh ICT
 
Chuyên đề phương trình vô tỷ
Chuyên đề phương trình vô tỷChuyên đề phương trình vô tỷ
Chuyên đề phương trình vô tỷtuituhoc
 
BàI ThảO LuậN ktl
BàI ThảO LuậN  ktlBàI ThảO LuậN  ktl
BàI ThảO LuậN ktlRatleback
 
Lua chon dang ham so va kiem dinh dac trung mo hinh
Lua chon dang ham so va kiem dinh dac trung mo hinhLua chon dang ham so va kiem dinh dac trung mo hinh
Lua chon dang ham so va kiem dinh dac trung mo hinhKhuong Vo
 
bo-de-tham-khao-giua-hoc-ky-2-toan-8-nam-2023-2024-phong-gddt-tp-hai-duong.pdf
bo-de-tham-khao-giua-hoc-ky-2-toan-8-nam-2023-2024-phong-gddt-tp-hai-duong.pdfbo-de-tham-khao-giua-hoc-ky-2-toan-8-nam-2023-2024-phong-gddt-tp-hai-duong.pdf
bo-de-tham-khao-giua-hoc-ky-2-toan-8-nam-2023-2024-phong-gddt-tp-hai-duong.pdfLinhTrnTh14
 
Báo cáo thảo luận nhóm 14
Báo cáo thảo luận nhóm 14Báo cáo thảo luận nhóm 14
Báo cáo thảo luận nhóm 14huongdangyeu91
 
Đề Tài kinh tế lượng về sản lượng lúa
Đề Tài kinh tế lượng về sản lượng lúaĐề Tài kinh tế lượng về sản lượng lúa
Đề Tài kinh tế lượng về sản lượng lúaPhahamy Phahamy
 
Chương 2 kinh tế lượng_Hồi quy đơn biến.pptx
Chương 2 kinh tế lượng_Hồi quy đơn biến.pptxChương 2 kinh tế lượng_Hồi quy đơn biến.pptx
Chương 2 kinh tế lượng_Hồi quy đơn biến.pptxnellyteapls11
 
Slide Kinh tế lượng
Slide Kinh tế lượngSlide Kinh tế lượng
Slide Kinh tế lượngTran Dat
 
đA cộng tuyến star
đA cộng tuyến   starđA cộng tuyến   star
đA cộng tuyến starStar II
 
Excel giai bai toan qhtt
Excel giai bai toan qhttExcel giai bai toan qhtt
Excel giai bai toan qhttHieu Dinh
 
Mpp04 521-r1201 v
Mpp04 521-r1201 vMpp04 521-r1201 v
Mpp04 521-r1201 vTrí Công
 
10 tvu sta301_bai8_v1.00131012140
10 tvu sta301_bai8_v1.0013101214010 tvu sta301_bai8_v1.00131012140
10 tvu sta301_bai8_v1.00131012140Yen Dang
 
Hướng dẫn một số dạng cơ bản Hồi quy hai biến
Hướng dẫn một số dạng cơ bản Hồi quy hai biếnHướng dẫn một số dạng cơ bản Hồi quy hai biến
Hướng dẫn một số dạng cơ bản Hồi quy hai biếncaoxuanthang
 

Similar to chuong-6_hien-tuong-da-cong-tuyen (1).ppt (20)

Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
 
Th kinh-te-luong1
Th kinh-te-luong1Th kinh-te-luong1
Th kinh-te-luong1
 
Th kinh-te-luong1
Th kinh-te-luong1Th kinh-te-luong1
Th kinh-te-luong1
 
02 cuc tri ham bac ba tlbg_p1
02 cuc tri ham bac ba tlbg_p102 cuc tri ham bac ba tlbg_p1
02 cuc tri ham bac ba tlbg_p1
 
Chuyên đề phương trình vô tỷ
Chuyên đề phương trình vô tỷChuyên đề phương trình vô tỷ
Chuyên đề phương trình vô tỷ
 
BàI ThảO LuậN ktl
BàI ThảO LuậN  ktlBàI ThảO LuậN  ktl
BàI ThảO LuậN ktl
 
Đề tài: Một số phương pháp giải hệ phương trình đại số, HAY
Đề tài: Một số phương pháp giải hệ phương trình đại số, HAYĐề tài: Một số phương pháp giải hệ phương trình đại số, HAY
Đề tài: Một số phương pháp giải hệ phương trình đại số, HAY
 
Lua chon dang ham so va kiem dinh dac trung mo hinh
Lua chon dang ham so va kiem dinh dac trung mo hinhLua chon dang ham so va kiem dinh dac trung mo hinh
Lua chon dang ham so va kiem dinh dac trung mo hinh
 
bo-de-tham-khao-giua-hoc-ky-2-toan-8-nam-2023-2024-phong-gddt-tp-hai-duong.pdf
bo-de-tham-khao-giua-hoc-ky-2-toan-8-nam-2023-2024-phong-gddt-tp-hai-duong.pdfbo-de-tham-khao-giua-hoc-ky-2-toan-8-nam-2023-2024-phong-gddt-tp-hai-duong.pdf
bo-de-tham-khao-giua-hoc-ky-2-toan-8-nam-2023-2024-phong-gddt-tp-hai-duong.pdf
 
Báo cáo thảo luận nhóm 14
Báo cáo thảo luận nhóm 14Báo cáo thảo luận nhóm 14
Báo cáo thảo luận nhóm 14
 
Đề Tài kinh tế lượng về sản lượng lúa
Đề Tài kinh tế lượng về sản lượng lúaĐề Tài kinh tế lượng về sản lượng lúa
Đề Tài kinh tế lượng về sản lượng lúa
 
Chương 2 kinh tế lượng_Hồi quy đơn biến.pptx
Chương 2 kinh tế lượng_Hồi quy đơn biến.pptxChương 2 kinh tế lượng_Hồi quy đơn biến.pptx
Chương 2 kinh tế lượng_Hồi quy đơn biến.pptx
 
Bai tap giai tich 12 htv
Bai tap giai tich 12 htvBai tap giai tich 12 htv
Bai tap giai tich 12 htv
 
Slide Kinh tế lượng
Slide Kinh tế lượngSlide Kinh tế lượng
Slide Kinh tế lượng
 
đA cộng tuyến star
đA cộng tuyến   starđA cộng tuyến   star
đA cộng tuyến star
 
Chuyen de pt vo ti
Chuyen de pt vo tiChuyen de pt vo ti
Chuyen de pt vo ti
 
Excel giai bai toan qhtt
Excel giai bai toan qhttExcel giai bai toan qhtt
Excel giai bai toan qhtt
 
Mpp04 521-r1201 v
Mpp04 521-r1201 vMpp04 521-r1201 v
Mpp04 521-r1201 v
 
10 tvu sta301_bai8_v1.00131012140
10 tvu sta301_bai8_v1.0013101214010 tvu sta301_bai8_v1.00131012140
10 tvu sta301_bai8_v1.00131012140
 
Hướng dẫn một số dạng cơ bản Hồi quy hai biến
Hướng dẫn một số dạng cơ bản Hồi quy hai biếnHướng dẫn một số dạng cơ bản Hồi quy hai biến
Hướng dẫn một số dạng cơ bản Hồi quy hai biến
 

chuong-6_hien-tuong-da-cong-tuyen (1).ppt

  • 1. CHƯƠNG 6 HIỆN TƯỢNG ĐA CỘNG TUYẾN (MULTICOLLINEARITY)
  • 2. 2 1. Hiểu bản chất và hậu quả của đa cộng tuyến 2. Biết cách phát hiện đa cộng tuyến và biện pháp khắc phục MỤC TIÊU ĐA CỘNG TUYẾN
  • 3. NỘI DUNG 3 Bản chất, nguyên nhân của đa cộng tuyến 1 Ước lượng các tham số 2 3 Phát hiện đa cộng tuyến 4 Khắc phục đa cộng tuyến 5 Hậu quả
  • 4. 4 Thu nhập Sự giàu có Chi tiêu 80 810 70 100 1009 65 120 1273 90 140 1425 95 160 1633 110 180 1876 115 200 2052 120 220 2201 140 240 2435 155 260 2686 150 Nguồn: Ramu Ramanathan
  • 5. 5
  • 6. 6
  • 7. 7
  • 8. 8 Khi lập mô hình hồi quy bội Có sự phụ thuộc tuyến tính cao giữa các biến giải thích gọi là đa cộng tuyến. a. Đa cộng tuyến hoàn hảo Tồn tại 2, 3,… k không đồng thời bằng 0 sao cho 2X2 + 3X3 + …+ kXk = 0 Nói cách khác là xảy ra trường hợp một biến giải thích nào đó được biểu diễn dưới dạng một tổ hợp tuyến tính của các biến còn lại. ki k i i i X X X Y     ˆ ... ˆ ˆ ˆ ˆ 3 3 2 2 1      6.1 Bản chất của đa cộng tuyến
  • 9. 9 b. Đa cộng tuyến không hoàn hảo 2X2 + 3X3 + …+ kXk + vi= 0 Với vi là sai số ngẫu nhiên thì ta có hiện tượng đa cộng tuyến không hoàn hảo giữa các biến giải thích. Nói cách khác là một biến giải thích nào đó có tương quan với một số biến giải thích khác. 6.1 Bản chất của đa cộng tuyến
  • 10. 10 X3i = 5X2i, vì vậy có cộng tuyến hoàn hảo giữa X2 và X3 ; r23 = 1 X2 và X3* không có cộng tuyến hoàn hảo, nhưng hai biến này có tương quan chặt chẽ. X2 10 15 18 24 30 X3 50 75 90 120 150 X* 3 V 52 2 75 0 97 7 129 9 152 2 6.1 Bản chất của đa cộng tuyến VD
  • 11. 11 6.1 Bản chất của đa cộng tuyến Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
  • 12. 12 Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến 6.1 Bản chất của đa cộng tuyến
  • 13. 13 Một số nguyên nhân gây ra hiện tượng đa cộng tuyến - Khi chọn các biến độc lập mối quan có quan hệ nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện khác. - Khi số quan sát nhỏ hơn số biến độc lập. - Cách thu thập mẫu: mẫu không đặc trưng cho tổng thể - Chọn biến Xi có độ biến thiên nhỏ. 6.1 Nguyên nhân của đa cộng tuyến
  • 14. 6.2 Ước lượng khi có đa cộng tuyến 1. Trường hợp có đa cộng tuyến hoàn hảo Xét mô hình hồi qui 3 biến dưới dạng sau: Yi = 2 X2i + 3 X3i + ei giả sử X3i = X2i, mô hình được biến đổi thành: Yi = (2+ 3)X2i + ei = 0 X2i + ei Phương pháp OLS 14      2 2 2 3 2 ) ˆ ˆ ( ˆ i i i o x y x      Không thể tìm được lời giải duy nhất cho 3 2 ˆ , ˆ  
  • 15. 6.2 Ước lượng khi có đa cộng tuyến  Các hệ số ước lượng không xác định  Phương sai và sai số chuẩn của 2 và 3 là vô hạn 15 2 3 2 2 3 2 2 3 2 3 2 3 2 2 ) ( ˆ           i i i i i i i i i i i x x x x x x x y x x y  0 0 ˆ 2 3 2 3 2 2 3 2 3 2 3 3 3 2 3 3 2             i i i i i i i i i i i x x x x x x x y x x y     
  • 16. 6.2 Ước lượng các tham số khi có đa cộng tuyến  Các hệ số ước lượng không xác định: chúng ta không tách rời tác động của từng biến Xi lên Y do không thể giả định X2 thay đổi trong khi X3 không đổi. 16 2 3 2 2 3 2 2 3 2 3 2 3 2 2 ) ( ˆ           i i i i i i i i i i i x x x x x x x y x x y  0 0 ˆ 2 3 2 3 2 2 3 2 3 2 3 3 3 2 3 3 2             i i i i i i i i i i i x x x x x x x y x x y     
  • 17. 6.2 Ước lượng các tham số khi có đa cộng tuyến 2. Trường hợp có đa cộng tuyến không hoàn hảo • Đa cộng tuyến hoàn hảo thường không xảy ra trong thực tế. • Xét mô hình hồi qui 3 biến dưới dạng sau: yi = 2 x2i + 3 x3i + ei Giả định x3i =  x2i + vi Với   0 và vi là sai số ngẫu nhiên. • Trong trường hợp này, các hệ số hồi qui 2 và 3 có thể ước lượng được: 17
  • 18. Ta có thể ước lượng được các này nhưng s.e. sẽ rất lớn. 6.2 Ước lượng các tham số khi có đa cộng tuyến 18  ˆ
  • 19. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: • Các ước lượng vẫn BLUE, nhưng: 1. Phương sai và hiệp phương sai của các ước lượng OLS lớn. 19 r23 là hệ số tương quan giữa X2 và X3. Khi r23  1, các giá trị trên  
  • 20. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: 2. Khoảng tin cậy rộng hơn. • Khoảng tin cậy của 2 và 3 (với độ tin cậy 1 – ) là: 2 =  t /2 se ( ); 3 =  t /2 se ( ); trong đó: se ( ) = se ( ) = 20 ^ 2  ^ 2  ^ 3  ^ 2  ^ 3    2 2 2 23) 1 ( i x r  ^ 3    2 3 2 23) 1 ( i x r 
  • 21. 21 Giá trị của r23 Khoảng tin cậy 95% của B2 0 0.5 0.95 0.995 0.999 A * 96 . 1 ˆ 2   A * 33 . 1 * 96 . 1 ˆ 2   A * 26 . 10 * 96 . 1 ˆ 2   A * 100 * 96 . 1 ˆ 2   A * 500 * 96 . 1 ˆ 2     2 2 2 i x A 
  • 22. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: 3. Tỉ số t "không có ý nghĩa". Khi kiểm định giả thuyết H0: 2 = 0, chúng ta sử dụng tỷ số t. và so sánh giá trị ước lượng của t với giá trị tra bảng (tới hạn) của t. Trong trường hợp cộng tuyến cao thì sai số chuẩn sẽ rất lớn và do đó làm cho giá trị t sẽ nhỏ đi, kết quả là sẽ làm tăng chấp nhận giả thuyết H0. 22 ) ˆ ( se ˆ t 2 2   
  • 23. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: 4. R2 cao nhưng tỉ số t ít có ý nghĩa. • Đa cộng tuyến cao: • - một hoặc một số tham số tương quan (hệ số góc riêng) không có ý nghĩa về mặt thống kê • - R2 trong những trường hợp này lại rất cao (trên 0,9). • - kiểm định F thì có thể bác bỏ giả thuyết cho rằng 2 = 3 = … = k = 0. 23
  • 24. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: 5. Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ trong dữ liệu. 6. Dấu của các ước lượng của các hệ số hồi qui có thể sai 7. Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng. 24
  • 25. Ví dụ: Bảng 2 do nhập sai số liệu nên xảy ra đa cộng tuyến 25 Bảng 1 Y X2 X3 1 2 4 2 0 2 3 4 12 4 6 0 5 8 16 Bảng 2 Y X2 X3 1 2 4 2 0 2 3 4 0 4 6 12 5 8 16 00868 . 0 ) ˆ , ˆ cov( ; 5523 . 0 ; 81 . 0 003 . 0 446 . 0 193 . 1 ˆ 3 2 23 2 3 2          r R X X Y i i i Se (0.7736) (0.1848) (0.0850) t (1.543) (2.415) (0.0358) 0282 . 0 ) ˆ , ˆ cov( ; 8285 . 0 ; 81 . 0 027 . 0 401 . 0 210 . 1 ˆ 3 2 23 2 3 2          r R X X Y i i i Se (0.7480) (0.2720) (0.1252) t (1.618) (1.4752) (0.2152)
  • 26. 26 Đa cộng tuyến là một hiện tượng theo mẫu, nghĩa là cho dù các biến độc lập Xi không tương quan tuyến tính trong tổng thể nhưng chúng có thể tương quan tuyến tính trong một mẫu cụ thể nào đó. Do đó cỡ mẫu lớn thì hiện tượng đa cộng tuyến ít nghiêm trọng hơn cỡ mẫu nhỏ
  • 27. 27 1. Hệ số R2 lớn nhưng tỷ số t nhỏ 2. Tương quan cặp giữa các biến giải thích cao 3. Sử dụng mô hình hồi qui phụ 4. Sử dụng yếu tố phóng đại phương sai (VIF) 6.4 Cách phát hiện đa cộng tuyến
  • 28. 28 1. R2 lớn nhưng tỷ số t nhỏ Nếu R2 cao, chẳng hạn, >0,8 và F test bác bỏ giả thuyết 2 = 3 = … = k = 0, nhưng t test cho từng i lại chấp nhận H0. 2. Tương quan cặp giữa các biến giải thích cao Trong đó X, Z là 2 biến giải thích trong mô hình        2 2 ) ( ) ( ) )( ( Z Z X X Z Z X X r i i i i XZ 6.4 Cách phát hiện đa cộng tuyến
  • 29. 29 3. Sử dụng mô hình hồi quy phụ Hồi qui một biến giải thích X nào đó theo các biến còn lại. Tính R2 và F cho mỗi mô hình theo công thức: Lập giả thiết H0: R2 = 0 ~ H0: không có đa cộng tuyến Nếu F > F(m-1,n-m): bác bỏ H0 => có đa cộng tuyến Nếu F < F(m-1,n-m): chấp nhận H0 => không có đa cộng tuyến mi k i i X X X    ˆ ... ˆ ˆ ˆ 3 3 1 2     ) 1 )( 1 ( ) ( 2 2     m R m n R F 6.4 Cách phát hiện đa cộng tuyến
  • 30. 30 VD: Cho doanh số bán (Y), chi phí chào hàng (X2) và chi phí quảng cáo (X3) trong năm 2001 ở 12 khu vực bán hàng của 1 công ty. Có hiện tượng đa cộng tuyến không? Hồi quy biến chi phí chào hàng với chi phí quảng cáo, ta có kết quả X2 =42,012 + 0,387 *X3 R2 = 0,22922 F= 2,9738 Với mức ý nghĩa α=5%, tra bảng F0.05 (1,10)= 4,96. Ta thấy F < F0.05 (1,10) nên chấp nhận Ho hay không có đa cộng tuyến. 6.4 Cách phát hiện đa cộng tuyến
  • 31. 31 4. Sử dụng nhân tử phóng đại phương sai (VIF) Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa như sau: Đối với trường hợp tổng quát, có (k-1) biến giải thích thì: R2 j: là giá trị R2 trong hàm hồi quy của Xj theo (k-1) biến giải thích còn lại. Thông thường khi VIF > 10, thì biến này được coi là có cộng tuyến cao ) 1 ( 1 2 23 r VIF   ) 1 ( 1 2 j R VIF   6.4 Cách phát hiện đa cộng tuyến VIF x i . ) ˆ var( 2 2 2 2    
  • 32. 32 Giá trị của r23 VIF 0 1 1A 0 0.5 1.33 1.33A 0.67B 0.7 1.96 1.96A 1.37B 0.8 2.78 2.78A 2.22B 0.9 5.76 5.76A 4.73B 0.95 10.26 10.26A 9.74B 0.97 16.26 16.92A 16.4B 0.99 50.25 50.25A 49.75B 0.995 100 100A 99.5B 0.999 500 500A 499.5B ) ˆ ( 2  Var ) ˆ , ˆ ( 3 2   Cov       2 3 2 2 2 2 2 2 ; i i i x x B x A  
  • 33. 33 1. Dùng thông tin tiên nghiệm Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas Ln(Yi)=1 + 2ln(Ki)+ 3ln(Li) + ui Có thể gặp hiện tượng đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu ta biết là hiệu suất không đổi theo quy mô tức là 2+3=1. Ln(Yi)=1 + 2ln(Ki)+ (1-2)ln(Li) + ui Ln(Yi) – Ln(Li) = 1 + 2[ln(Ki) - ln(Li)] + ui Ln(Yi /Li ) = 1 + 2ln(Ki /Li) + ui => mất đa cộng tuyến (vì đây là mô hình hồi quy đơn). i u i i i e K AL Y 2 3    6.5 Cách khắc phục
  • 34. 34 1. Dùng thông tin tiên nghiệm Ví dụ Yi=1 + 2X2i+ 3X3i + ui Biết 3=0.12 Biến đổi Yi=1 + 2X2i+ 0.12X3i + ui Yi=1 + 2Xi+ ui Với Xi=X2i+ 0.1X3i 6.5 Cách khắc phục
  • 35. 35 2. Loại trừ một biến giải thích ra khỏi mô hình B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ. Giả sử X2, X3…Xk là các biến độc lập, Y là biến phụ thuộc và X2, X3 có tương quan chặt chẽ với nhau. B2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt một trong 2 biến B3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn. 6.5 Cách khắc phục
  • 36. 36 6.5 Cách khắc phục 3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới
  • 37. 37 4. Dùng sai phân cấp 1 Ví dụ từ hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut ta suy ra yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1 Trừ hai vế cho nhau, ta được: yt – yt – 1 = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut – ut – 1) Hay: yt = 1  x1,t + 2  x2,t + et, Mặc dù, x1 và x2 có quan hệ tuyến tính, nhưng không có nghĩa sai phân của chúng cũng như vậy. 6.5 Cách khắc phục
  • 38. 38 5. Đổi biến Ví dụ : yt = 1 + 1x1t + 2x2t + ut Với Y: tiêu dùng X1: GDP X2: dân số Vì GDP và dân số theo thời gian có xu hướng tăng nên có thể cộng tuyến. Biện pháp: chia các biến cho dân số 6.5 Cách khắc phục t t t t t t X u X X X Y 2 2 2 1 2 1 2       
  • 39. 39 Khảo sát chi tiêu tiêu dùng, thu nhập và sự giàu có, ta có bảng số liệu sau. Gọi Y: chi tiêu tiêu dùng (USD) X2: thu nhập (USD) X3: sự giàu có (USD) Yêu cầu: 1. Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3.X3 +U 2. Mô hình có xảy ra đa cộng tuyến không? Vì sao? 3. Nếu xảy ra đa cộng tuyến, hãy tìm cách khắc phục. Ví dụ 1
  • 40. 40 X2 X3 Y 80 810 70 100 1009 65 120 1273 90 140 1425 95 160 1633 110 180 1876 115 200 2052 120 220 2201 140 240 2435 155 260 2686 150 Nguồn: Ramu Ramanathan
  • 41. 41 1. Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3.X3 +U Nhận xét ban đầu: Theo lý thuyết kinh tế thì chi tiêu cho tiêu dùng (Y) có xu hướng tăng theo thu nhập (X2) và sự giàu có (X3) nên dấu của các hệ số hồi quy riêng là dương. Kết quả hồi quy trên Eviews như sau:
  • 42. 42