Bài thảo luận
Hiện tượng Đa cộngtuyến
Nhóm 3
Bảng số liệu
Năm Y X Z T
1990 650 1000 250 17000
1991 800 1500 300 20500
1992 1350 2000 440 35354
1993 3250 2700 670 43210
1994 5200 3500 1018 51510
1995 8000 5500 1351.3 81760
1996 9500 6500 1607.2 98700
1997 8500 8500 1715.6 150000
1998 14000 9600 1520.1 150300
1999 15600 10700 1781.8 160900
2000 17000 11200 2140.1 180000
2001 20500 11700 2330.8 190000
2002 28500 13000 2628.2 220000
2003 35160 13500 2429.6 225000
2004 40200 14500 2927.9 227500
2005 46810 16000 3467.8 230000
2006 51000 17500 3583.5 234000
2007 56000 19200 4171.6 250000
Y: Thu nhập từ du lịch (tỷ đồng)
X: Lượng khách nội địa (ngàn người)
Z: Lượng khách quốc tế (ngàn người)
T: Lực lượng lao động trong ngành du lịch (người)
n=18
Y = -7154.341848 + 3.522295X + 8.510220Z - 0.153362T
Lập mô hìnhhàm hồiquy
Với 𝛼 = 0.05 ta có 𝑡0.025
14
=2.145
Nhận xét
 𝑅2
= 0.941418 (> 0.8)
 𝑡1= -2.853439
 𝑡2= 1.621886 (< 2.145)
 𝑡3= 1,357088 (< 2.145)
 𝑡4= -1,732066 (< 2.145)
Xây dựng ma trậnhệsố tương quan cặp
giữa cácbiếngiải thích
Hệ số tương quan giữa X và T là 0.982561
Hệ số tương quan giữa X và Z là 0.982100
Xét hồi quy phụ
 Tiến hành hồi quy X theo Z và T
Sửdụng nhân tửphóng đạiphương sai
 Tiến hành hồi quy X theo Z và T
Sửdụng nhân tửphóng đạiphương sai
VIF =
1
1−𝑅2 =
1
1−0.990976
= 110,8 > 10
 Tiến hành hồi quy X theo Z và T
Thu thậpthêmsố liệuđể làm tăng kíchthước
mẫu
Dependent Variable: Y
Method: Least Squares
Date: 04/08/15 Time: 13:22
Sample: 1 27
Included observations: 27
Variable Coefficient Std. Error t-Statistic Prob.
C -11327.12 2293.608 -4.938558 0.0001
X 0.665255 0.354903 1.874470 0.0736
Z 17.00844 2.850686 5.966437 0.0000
T -0.046844 0.040038 -1.169999 0.2540
R-squared 0.956872 Mean dependent var 30667.41
Adjusted R-squared 0.951247 S.D. dependent var 21302.64
S.E. of regression 4703.642 Akaike info criterion 19.88602
Sum squared resid 5.09E+08 Schwarz criterion 20.07799
Log likelihood -264.4612 Hannan-Quinn criter. 19.94310
F-statistic 170.1000 Durbin-Watson stat 1.114994
Prob(F-statistic) 0.000000
𝑅2
= 0.956872
t1 =-4.938558
t2=1.874470
t3= 5.966437
t4=-1.169999
Y= -11327.12 + 0.665255X +17.00844Z - 0.046844T
Bỏ biến khỏi mô hình
 Khi bỏ biến X ta có 𝑅2
= 0.930411
 Khi bỏ biến Z ta có 𝑅2
= 0.933712
 Khi bỏ biến T ta có 𝑅2
= 0.928865
Đa cộng tuyến

Đa cộng tuyến

  • 1.
    Bài thảo luận Hiệntượng Đa cộngtuyến Nhóm 3
  • 2.
    Bảng số liệu NămY X Z T 1990 650 1000 250 17000 1991 800 1500 300 20500 1992 1350 2000 440 35354 1993 3250 2700 670 43210 1994 5200 3500 1018 51510 1995 8000 5500 1351.3 81760 1996 9500 6500 1607.2 98700 1997 8500 8500 1715.6 150000 1998 14000 9600 1520.1 150300 1999 15600 10700 1781.8 160900 2000 17000 11200 2140.1 180000 2001 20500 11700 2330.8 190000 2002 28500 13000 2628.2 220000 2003 35160 13500 2429.6 225000 2004 40200 14500 2927.9 227500 2005 46810 16000 3467.8 230000 2006 51000 17500 3583.5 234000 2007 56000 19200 4171.6 250000 Y: Thu nhập từ du lịch (tỷ đồng) X: Lượng khách nội địa (ngàn người) Z: Lượng khách quốc tế (ngàn người) T: Lực lượng lao động trong ngành du lịch (người) n=18
  • 3.
    Y = -7154.341848+ 3.522295X + 8.510220Z - 0.153362T Lập mô hìnhhàm hồiquy Với 𝛼 = 0.05 ta có 𝑡0.025 14 =2.145
  • 4.
    Nhận xét  𝑅2 =0.941418 (> 0.8)  𝑡1= -2.853439  𝑡2= 1.621886 (< 2.145)  𝑡3= 1,357088 (< 2.145)  𝑡4= -1,732066 (< 2.145)
  • 5.
    Xây dựng matrậnhệsố tương quan cặp giữa cácbiếngiải thích Hệ số tương quan giữa X và T là 0.982561 Hệ số tương quan giữa X và Z là 0.982100
  • 6.
    Xét hồi quyphụ  Tiến hành hồi quy X theo Z và T
  • 7.
    Sửdụng nhân tửphóngđạiphương sai  Tiến hành hồi quy X theo Z và T
  • 8.
    Sửdụng nhân tửphóngđạiphương sai VIF = 1 1−𝑅2 = 1 1−0.990976 = 110,8 > 10  Tiến hành hồi quy X theo Z và T
  • 10.
    Thu thậpthêmsố liệuđểlàm tăng kíchthước mẫu Dependent Variable: Y Method: Least Squares Date: 04/08/15 Time: 13:22 Sample: 1 27 Included observations: 27 Variable Coefficient Std. Error t-Statistic Prob. C -11327.12 2293.608 -4.938558 0.0001 X 0.665255 0.354903 1.874470 0.0736 Z 17.00844 2.850686 5.966437 0.0000 T -0.046844 0.040038 -1.169999 0.2540 R-squared 0.956872 Mean dependent var 30667.41 Adjusted R-squared 0.951247 S.D. dependent var 21302.64 S.E. of regression 4703.642 Akaike info criterion 19.88602 Sum squared resid 5.09E+08 Schwarz criterion 20.07799 Log likelihood -264.4612 Hannan-Quinn criter. 19.94310 F-statistic 170.1000 Durbin-Watson stat 1.114994 Prob(F-statistic) 0.000000 𝑅2 = 0.956872 t1 =-4.938558 t2=1.874470 t3= 5.966437 t4=-1.169999 Y= -11327.12 + 0.665255X +17.00844Z - 0.046844T
  • 11.
    Bỏ biến khỏimô hình  Khi bỏ biến X ta có 𝑅2 = 0.930411  Khi bỏ biến Z ta có 𝑅2 = 0.933712  Khi bỏ biến T ta có 𝑅2 = 0.928865

Editor's Notes

  • #14 Loại bỏ biến Z ra khỏi mô hình khiến cho R2 cao hơn nên mô hình phù hợp hơn, do đó loại bỏ biến Z ra khỏi mô hình sẽ hợp lý hơn