1. BÀI TẬP HỒI QUY ĐƠN 03
Có kết quả khảo sát một số doanh nghiệp như sau :
Trong đó :
Y : Doanh thu của các doanh nghiệp (tỷ đồng/năm)
X : Chi phí quảng cáo (tỷ đồng/năm)
1. Tìm hàm hồi quy mẫu (SRF) từ số liệu trên ?
2. Chi phí quảng cáo có thực sự ảnh hưởng đến doanh thu
không, với độ tin cậy 95% ?
3. Nếu tăng chi phí quảng cáo 1 tỷ đồng thì doanh thu tăng tối đa
là bao nhiêu, mức ý nghĩa 5% ?
1
2. 4. Tìm khoảng tin cậy cho phương sai nhiễu, có thể kết luận
phương sai nhiễu = 7 được không, độ tin cậy 95% ?
5. Mô hình trên có phù hợp với dữ liệu khảo sát hay không, mức
ý nghĩa 5% ?
6. Thành lập bảng phân tích phương sai của mô hình (ANOVA)
và giải thích ý nghĩa các hệ số ?
7. Dự báo doanh thu trung bình cho các doanh nghiệp có chi phí
quảng cáo 6 tỷ/năm, mức ý nghĩa 5% ?
8. Dự báo doanh thu cá biệt cho một doanh nghiệp có chi phí
quảng cáo 6 tỷ/năm, độ tin cậy 95% ?
9. Nếu doanh nghiệp thay đổi đơn vị tính doanh thu thành triệu
đồng/tháng thì hàm SRF thay đổi thế nào ?
10. Chi phí quảng cáo thay đổi 1% thì doanh thu thay đổi thế
nào?
2
3. 1. Tìm hàm hồi quy mẫu :
Từ số liệu đã cho ta lập bảng như sau :
3
4. Áp dụng công thức ta có :
β1 = Y - β2X = 63,5 - 9,1915*4,25 = 24,4361
Hàm hồi quy mẫu có dạng : Ŷ = 24,4361 + 9,1915X.
4
β2 =
YX - n*Y *X
X2 - n(X)2
=
2375 – 8*63,5*4,25
168 - 8*(4,25)2
= 9,1915
5. 2. Chi phí quảng cáo có thực sự ảnh hưởng đến doanh thu
không, với độ tin cậy 95% ?
Kiểm định giả thiết : Ho : β2 = 0
H1 : β2 ≠ 0
Ta cần tính các hệ số :
TSS = Y2 - n(Y)2 = 2034 – 8(63,5)2 = 2034
ESS = β22x2 = (9,1915)2*23,5 = 1985,4
RSS = TSS – ESS = 48,6
2 = = = 8,1
5
x2 = X2 - n(X)2 = 168 - 8*(4,25)2 = 23,5
RSS
n - k
48,6
6
6. Var(β2) = = = 0,3447 Se(β2) = 0,5871
Độ tin cậy 95% → tα/2(n-k) = t0,025(6) = 2,447
Tiêu chuẩn kiểm định :
t = = = 15,6556
Ta thấy : | t | = 15,6556 > t0,025(6) = 2,447 nên bác bỏ giả
thiết Ho.
Vậy với độ tin cậy 95%, chi phí quảng cáo thực sự ảnh
hưởng đến doanh thu.
6
2
x2
8,1
23,5
β2
Se(β2)
9,1915
0,5871
7. * Có ý kiến cho rằng khi tăng chi phí quảng cáo 1 tỷ đồng/năm
thì doanh số tăng hơn 10 tỷ/năm. Tuy nhiên, một số ý kiến khác
lại cho rằng tăng chi phí quảng cáo 1 tỷ/năm thì doanh số tăng
không quá 9 tỷ/năm. Cả hai ý kiến trên có chính xác không, hãy
kết luận với độ tin cậy 95% ?
Kiểm định các giả thiết sau :
+ Ý kiến thứ nhất : Ho : β2 ≤ 10
H1 : β2 > 10
+ Ý kiến thứ hai : Ho : β2 ≥ 9
H1 : β2 < 9
Đây là kiểm định 1 phía nên giá trị tới hạn :
tα(n-k) = t0,05(6) = 1,943
7
8. Tính toán các tiêu chuẩn kiểm định :
t = = = - 1,3771
Nếu : t > tα(n-k) thì bác bỏ Ho.
Ta thấy, t = - 1,3771 < t0,05(6) = 1,943 nên chấp nhận Ho. Vậy ý
kiến đầu tiên không chính xác với độ tin cậy 95%.
t = = = 0,3262
Nếu : t < - tα(n-k) thì bác bỏ Ho.
Ta thấy, t = 0,3262 > - t0,05(6) = - 1,943 nên chấp nhận Ho. Vậy
ý kiến thứ hai cũng không chính xác với độ tin cậy 95%.
8
β2 - β2*
Se(β2)
9,1915 - 10
0,5871
β2 - β2*
Se(β2)
9,1915 - 9
0,5871
9. 3. Nếu tăng chi phí quảng cáo 1 tỷ đồng thì doanh thu tăng tối
đa là bao nhiêu, mức ý nghĩa 5% ?
Tìm khoảng tin cậy cho hệ số góc :
Mức ý nghĩa 5% → tα/2(n-k) = t0,025(6) = 2,447
Ta có công thức tính khoảng tin cậy :
[ β2 - tα/2(n-k)Se(β2) ≤ β2 ≤ β2 + tα/2(n-k)Se(β2)]
[9,1915 - 2,447*0,5871 ≤ β2 ≤ 9,1915 + 2,447*0,5871]
[ 7,7549 ; 10,4366]
Với độ tin cậy 95%, nếu tăng chi phí quảng cáo 1 tỷ
đồng/năm thì doanh thu tăng thấp nhất là 7,76 tỷ và cao nhất
là 10,44 tỷ.
9
10. 4. Tìm khoảng tin cậy cho phương sai nhiễu, có thể kết luận
phương sai nhiễu = 7 được không, độ tin cậy 95% ?
** Khoảng tin cậy phương sai nhiễu :
Khoảng tin cậy của Var(Ui) = 2 là :
;
Ta có α = 5% → 2 (n-k) = 2(6) = 14,4494 ;
2 (n-k) = 2(6) = 1,2373
; [ 3,3635 ; 39,2791]
10
(n – k) 2
2 (n-k)
(n – k) 2
2 (n-k)
α/2 1 - α/2
α/2
1 - α/2 0,975
0,025
6*8,1
14,4494
6*8,1
1,2373
11. ** Kiểm định giả thiết :
Ho : 2 = 7
H1 : 2 ≠ 7
Tiêu chuẩn kiểm định : 2 = = = 6,943
Ta thấy , 2 = 6,943 thuộc khoảng (1,2373 ; 14,4494) nên
chấp nhận Ho.
Vậy, với độ tin cậy 95%, có thể xem phương sai nhiễu = 15.
Hoặc ta có thể so sánh 2 = 7 với khoảng tin cậy tìm được
[ 3,3635 ; 39,2791 ]. Giá trị 7 nằm trong khoảng tin cậy của
phương sai nhiễu nên chấp nhận Ho.
11
(n – k) 2
2
6*8,1
7
12. 5. Mô hình trên có phù hợp với dữ liệu khảo sát hay không,
mức ý nghĩa 5% ?
Kiểm định giả thiết : Ho : R2 = 0 ; H1 : R2 > 0
Mức ý nghĩa α = 0,05 → F0,05(k-1, n-k) = F0,05(1,6) = 5,987
R2 = = = 0,9761
Tiêu chuẩn kiểm định :
F = = = 245,046
Ta thấy : F = 245,046 > F0,05(1, 6) = 5,987, nên bác bỏ Ho. Vậy
với độ tin cậy 95%, mô hình phù hợp với dữ liệu khảo sát.
12
ESS
TSS
1985,4
2034
R2
1 - R2
n - k
k - 1
0,9761*6
1 – 0,9761
13. 6. Thành lập bảng phân tích phương sai của mô hình
(ANOVA) và giải thích ý nghĩa các hệ số ?
13
14. 7. Dự báo doanh thu trung bình cho các doanh nghiệp có chi
phí quảng cáo 6 tỷ/năm, mức ý nghĩa 5% ?
Dự báo điểm :
Độ tin cậy 95% → tα/2(n-k) = t0,025(6) = 2,447
Ta có hàm hồi quy : Ŷo = 24,4361 + 9,1915X*6 = 79,5851
Công thức ước lượng khoảng tin cậy :
[Ŷo - tα/2(n-k)Se(Ŷo) ≤ E(Y/Xo) ≤ Ŷo + tα/2(n-k)Se(Ŷo)]
Var(Ŷo) = 2 [ + ] = 8,1 [ + ]
= 2,0681 Se(Yo) = 1,4381
[79,58 - 2,447*1,4381 ≤ E(Y/Xo=6) ≤ 79,58 + 2,447*1,4381]
[76,061 ; 83,099]
14
1
n
(Xo – X)2
x2
1
8
(6 – 4,25)2
23,5
15. 8. Dự báo doanh thu cá biệt cho một doanh nghiệp có chi phí
quảng cáo 6 tỷ/năm, độ tin cậy 95% ?
Ta cần tìm khoảng tin cậy cá biệt :
Var(Y) = 2 [ 1 + + ] =
= 8,1 [ 1 + + ] = 10,1681
Se(Y) = 3,1887
[79,58 - 2,447*3,1887 ≤ Y ≤ 79,58 + 2,447*3,1887]
[ 71,7772 ; 87,3828]
Khoảng dự báo cá biệt rộng hơn dự báo trung bình.
15
1
n
(Xo – X)2
x2
1
8
(6 – 4,25)2
23,5
16. 9. Nếu doanh nghiệp thay đổi đơn vị tính doanh thu thành
triệu đồng/tháng thì hàm SRF thay đổi thế nào ?
Đơn vị tính của Y chuyển từ tỷ sang triệu, tức là :
Y* = 1000Y , do đó k1 = 1000
Đơn vị tính của X không thay đổi, tức là :
X* = X , do đó k2 = 1
Vậy : β1* = k1*β1 = 24,436*1000 = 24436
β2* = *β2 = *9,192 = 9192
Ta có : năm tháng nên Ko = 12
Vậy hàm hồi quy mới :
Y* = 24436/12 + 9192/12X* = 2036,33 + 766X*
16
k1
k2
1000
1
17. 10. Chi phí quảng cáo thay đổi 1% thì doanh thu thay đổi thế
nào?
Hệ số co giãn cho biết thay đổi tương đối (%) của Y khi X
thay đổi 1%.
Ta có : E = f’(X) = 2 = 9,1915 = 0,6152
Chi phí quảng cáo và doanh thu đồng biến. Do đó, khi khi chi
phí quảng cáo tăng (giảm) 1% thì doanh thu tăng (giảm)
0,6152%.
17
YX
X
Y
X
Y
4,25
63,5
19. * Phần chú thích :
1. Hệ số S.D.dependent Var = 17,046 : là độ lệch chuẩn của Y.
Mối quan hệ của nó với các tham số khác trong mô hình như
sau:
- Phương sai của Y : Var(Y) =
Tử số chính là TSS, nên : Var(Y) = = = 290,5714
Ký hiệu : Var(Y) = S2y = 290,5714 Sy = 17,046
Trong trường hợp chưa biết TSS nhưng có được hệ số này ta
có thể tính được TSS :
TSS = (Sy)2(n-1) = (17.046)2*(7) = 2034
19
∑Y2 – n(Y)2
n - 1
TSS
n - 1
2034
7
20. 2. Hệ số xác định bội trong mô hình chính là hệ số tương quan
giữa Y và Ŷ , cụ thể tính như sau :
Ta tính được hàm hồi quy mẫu : Ŷ = 6,2979 + 9,2766X
Từ hàm SRF này ta tính được Y và Ŷ như bảng sau :
Từ bảng tính toán, ta tính hệ số tương quan giữa Y và Ŷ theo
công thức :
R2 = = = 0,976 = = (0,9879)2
20
ryŷ =
∑YŶ – n(Y)(Ŷ)
∑Y2 –n(Y)2 ∑Ŷ2 –n(Ŷ)2
=
34243 – 8(63,5)(63,5)
34292 – 8(63,5)2 34243 – 8(63,5)2
= 0,9879
ESS
TSS
1985,4
2034
(ryŷ )2
22. Từ kết quả tính trên, ta có một lưu ý :
- Hệ số xác định bội cho biết độ mạnh của đường tuyến tính (Ŷ)
và số liệu quan sát (Y). Do đó, mô hình có hệ số R2 lớn không có
nghĩa là mối quan hệ giữa Y (biến phụ thuộc) và X (biến độc
lập) mạnh.
- Một mô hình có R2 nhỏ không đồng nghĩa là giữa X và Y có
mối quan hệ yếu hoặc không có mối quan hệ. Có thể giữa X và
Y có mối quan hệ phi tuyến (Hệ số xác định bội trong mô hình
hồi quy đo độ mạnh của mối liên hệ tuyến tính – đường thẳng).
22