Đa cộng tuyến
- 2. Bảng số liệu
Năm Y X Z T
1990 650 1000 250 17000
1991 800 1500 300 20500
1992 1350 2000 440 35354
1993 3250 2700 670 43210
1994 5200 3500 1018 51510
1995 8000 5500 1351.3 81760
1996 9500 6500 1607.2 98700
1997 8500 8500 1715.6 150000
1998 14000 9600 1520.1 150300
1999 15600 10700 1781.8 160900
2000 17000 11200 2140.1 180000
2001 20500 11700 2330.8 190000
2002 28500 13000 2628.2 220000
2003 35160 13500 2429.6 225000
2004 40200 14500 2927.9 227500
2005 46810 16000 3467.8 230000
2006 51000 17500 3583.5 234000
2007 56000 19200 4171.6 250000
Y: Thu nhập từ du lịch (tỷ đồng)
X: Lượng khách nội địa (ngàn người)
Z: Lượng khách quốc tế (ngàn người)
T: Lực lượng lao động trong ngành du lịch (người)
n=18
- 3. Y = -7154.341848 + 3.522295X + 8.510220Z - 0.153362T
Lập mô hìnhhàm hồiquy
Với 𝛼 = 0.05 ta có 𝑡0.025
14
=2.145
- 4. Nhận xét
𝑅2
= 0.941418 (> 0.8)
𝑡1= -2.853439
𝑡2= 1.621886 (< 2.145)
𝑡3= 1,357088 (< 2.145)
𝑡4= -1,732066 (< 2.145)
- 5. Xây dựng ma trậnhệsố tương quan cặp
giữa cácbiếngiải thích
Hệ số tương quan giữa X và T là 0.982561
Hệ số tương quan giữa X và Z là 0.982100
- 8. Sửdụng nhân tửphóng đạiphương sai
VIF =
1
1−𝑅2 =
1
1−0.990976
= 110,8 > 10
Tiến hành hồi quy X theo Z và T
- 10. Thu thậpthêmsố liệuđể làm tăng kíchthước
mẫu
Dependent Variable: Y
Method: Least Squares
Date: 04/08/15 Time: 13:22
Sample: 1 27
Included observations: 27
Variable Coefficient Std. Error t-Statistic Prob.
C -11327.12 2293.608 -4.938558 0.0001
X 0.665255 0.354903 1.874470 0.0736
Z 17.00844 2.850686 5.966437 0.0000
T -0.046844 0.040038 -1.169999 0.2540
R-squared 0.956872 Mean dependent var 30667.41
Adjusted R-squared 0.951247 S.D. dependent var 21302.64
S.E. of regression 4703.642 Akaike info criterion 19.88602
Sum squared resid 5.09E+08 Schwarz criterion 20.07799
Log likelihood -264.4612 Hannan-Quinn criter. 19.94310
F-statistic 170.1000 Durbin-Watson stat 1.114994
Prob(F-statistic) 0.000000
𝑅2
= 0.956872
t1 =-4.938558
t2=1.874470
t3= 5.966437
t4=-1.169999
Y= -11327.12 + 0.665255X +17.00844Z - 0.046844T
- 11. Bỏ biến khỏi mô hình
Khi bỏ biến X ta có 𝑅2
= 0.930411
Khi bỏ biến Z ta có 𝑅2
= 0.933712
Khi bỏ biến T ta có 𝑅2
= 0.928865
Editor's Notes
- Loại bỏ biến Z ra khỏi mô hình khiến cho R2 cao hơn nên mô hình phù hợp hơn, do đó loại bỏ biến Z ra khỏi mô hình sẽ hợp lý hơn