2. NỘI DUNG CHƯƠNG 2
1. Giới thiệu mô hình hồi quy tuyến tính đơn
2. Phương pháp ước lượng bình phương nhỏ nhất (OLS)
3. Tính không chệch và độ chính xác của OLS
4. Khoảng tin cậy của hệ số hồi quy
5. Kiểm định giả thuyết về hệ số hồi quy
6. Hệ số xác định của mô hình
7. Kiểm định sự phù hợp của mô hình
8. Dự báo
3. 1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
1.1. Mô hình hồi quy tuyến tính đơn của tổng thể
Trong quan hệ hồi quy, một biến phụ thuộc có thể được giải thích
bởi nhiều biến độc lập
Nếu chỉ nghiên cứu một biến phụ thuộc bị ảnh hưởng bởi một biến
độc lập => Mô hình hồi quy đơn
Nếu mối quan hệ giữa hai biến này là tuyến tính => Mô hình hồi
quy tuyến tính đơn
Hàm hồi quy tổng thể (𝑃𝑅𝐹): 𝐸 𝑌 𝑋𝑖 = 𝛽0 + 𝛽1𝑋𝑖
Mô hình hồi quy tổng thể (𝑃𝑅𝑀): 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖
4. 𝒀 = 𝜷𝟎 + 𝜷𝟏𝑿 + 𝒖
1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
Biến phụ thuộc
Biến được giải thích
Biến phản ứng…
Biến độc lập
Biến giải thích
Biến hồi quy…
Sai số
Nhiễu
Các yếu tố không quan sát được
Hệ số chặn Hệ số góc
5. 1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
Cách diễn giải mô hình hồi quy tuyến tính đơn
Nghiên cứu sự thay đổi của Y tương ứng với sự thay đổi của X
𝑌 = 𝛽0 + 𝛽1𝑋 + 𝑢
• β1 cho biết Biến phụ thuộc thay đổi bao nhiêu nếu biến độc lập tăng lên 1 đơn vị
• Việc giải thích chỉ đúng khi tất cả các yếu tố khác giữ nguyên khi X tăng 1 đơn vị
7. 1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
Ví dụ: Sản lượng đậu nành và phân bón
𝑆ả𝑛 𝑙ượ𝑛𝑔 = 𝛽0 + 𝛽1𝑃ℎâ𝑛 𝑏ó𝑛 + 𝑢
Đo lường tác động của phân bón lên
sản lượng trong điều kiện các yếu tố
khác không đổi
Lượng mưa, chất lượng đất, sâu bọ…
8. 1.2. Mô hình hồi quy tuyến tính đơn của mẫu
Trong mẫu tồn tại một hàm số gọi là hàm hồi quy mẫu (Sample
Regression Function - SRF) có dạng giống như PRF mô tả xu thế biến
động của trung bình biến phụ thuộc theo biến độc lập.
Thực chất nó là một ước lượng điểm của PRF
Nếu PRF có dạng: E(Y|Xi) = 0 + 1Xi
SRF có dạng: 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖
Trong đó:
𝛽0, 𝛽1 (Estimated regression coefficients) là các ước lượng điểm của 𝛽0, 𝛽1
𝑌𝑖 là ước điểm của E(Y|Xi).
1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
9. 1.2. Mô hình hồi quy tuyến tính đơn của mẫu
Tại một giá trị cá biệt của Y ta có
𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖
là mô hình hồi quy mẫu (Sample Regression Model – SRM)
Đặt 𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖 gọi là phần dư (Residual)
Phần dư 𝑢𝑖 là sai số ngẫu nhiên của mẫu, thực chất chúng là các ước lượng
điểm của các sai số ngẫu nhiên ui trong tổng thể.
Bản chất của 𝑢𝑖 giống như các sai số ngẫu nhiên ui
1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
10. 1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
Y
.
.
. .
.
.
.
.
.
X
.
.
.
.
.
0
SRF
Tiêu
dùng
Y
(Triệu
đồng/tháng)
Thu nhập X (Triệu đồng/tháng)
Yi= 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖
𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖
𝛽0
𝛽1
𝑢𝑖
11. 1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
Ví dụ: tiền lương CEO và lợi nhuận trên vốn chủ sở hữu
𝑇𝑖ề𝑛 𝑙ươ𝑛𝑔 = 𝛽0 + 𝛽1𝐿ợ𝑖 𝑛ℎ𝑢ậ𝑛 𝑡𝑟ê𝑛 𝑣ố𝑛 + 𝑢
Hàm hồi quy mẫu được ước lượng
𝑇𝑖ề𝑛 𝑙ươ𝑛𝑔 = 963,191 + 18,501 𝐿ợ𝑖 𝑛ℎ𝑢ậ𝑛 𝑡𝑟ê𝑛 𝑣ố𝑛
Tiền lương (ngàn USD) Lợi nhuận trên vốn chủ sở hữu
(Return on equity) của DN mà CEO
đang làm việc (%)
Hệ số chặn
12. Tổng thể (Population) Mẫu (Sample)
𝑃𝑅𝐹: 𝐸(𝑌/𝑋𝑖) = 𝛽0 + 𝛽1𝑋𝑖
𝑆𝑅𝐹: 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖
𝑃𝑅𝑀: 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖 (𝑖 = 1 ÷ 𝑁) 𝑆𝑅𝑀: 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖 (𝑖 = 1 ÷ 𝑛)
Sai số ngẫu nhiên ui Phần dư 𝑢𝑖
1. GIỚI THIỆU MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
13. Giá trị thực tế: 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖
Giá trị ước lượng: 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖
Phần dư: 𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖 = 𝑌𝑖 − 𝛽0 − 𝛽1𝑋𝑖
Tìm 𝛽0, 𝛽1 sao cho tổng bình phương phần dư là nhỏ nhất, tức là
𝑄 =
𝑖=1
𝑛
𝑢𝑖
2
=
𝑖=1
𝑛
(𝑌𝑖 − 𝑌𝑖)2=
𝑖=1
𝑛
(𝑌𝑖 − 𝛽0 − 𝛽1𝑋𝑖)2 → 𝑚𝑖𝑛
2. PHƯƠNG PHÁP ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT (OLS)
14. Giải bài toán cực trị hàm hai biến, ta có:
𝛽1 =
𝑋𝑖𝑌𝑖−𝑛𝑋𝑌
𝑋𝑖
2−𝑛(𝑋)2 =
(𝑋𝑖−𝑋)(𝑌𝑖−𝑌)
(𝑋𝑖−𝑋)2 =
𝑥𝑖𝑦𝑖
𝑥𝑖
2
𝛽0 = 𝑌 − 𝛽1𝑋
Trong đó: 𝑥𝑖 = 𝑋𝑖 − 𝑋 𝑦𝑖 = 𝑌𝑖 − 𝑌
2. PHƯƠNG PHÁP ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT (OLS)
(1) (3)
(2)
15. 2. PHƯƠNG PHÁP ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Bài tập 2.1:
Quan sát về thu nhập (X – triệu đồng/năm) và
chi tiêu (Y–triệu đồng/năm) của 16 người, ta
được các số liệu sau:
a. Ước lượng hàm hồi quy mẫu: 𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖
và cho biết ý nghĩa của hệ số hồi quy
Stt X Y
1 2 220
2 2.5 245
3 2.9 310
4 3.2 340
5 3.6 350
6 4.1 380
7 4.7 410
8 5.2 430
9 5.5 445
10 6.3 480
11 6.8 495
12 7.5 510
13 7.8 535
14 7.9 545
15 8.4 570
16 8.9 600
16. Tính:
𝜷𝟎 = 𝒀 − 𝜷𝟏𝑿 = 157.22 𝒀𝒊 = 𝜷𝟎 + 𝜷𝟏𝑿𝒊 = 157.22 + 49.82*Xi
𝜷𝟏 =
𝑿𝒊𝒀𝒊 − 𝒏𝑿𝒀
𝑿𝒊
𝟐
− 𝒏(𝑿)𝟐
= 𝟒𝟗. 𝟖𝟐
• 𝜷𝟎 = 𝟏𝟓𝟕. 𝟐𝟐: Với mẫu số liệu trên, khi các yếu tố khác không đổi, nếu X=0
thì 𝑌𝑖 = 157.22. Nghĩa là, khi thu nhập bằng không thì chi tiêu tối thiểu
bình quân là 157.22 triệu đồng/ năm.
• 𝜷𝟏 = 𝟒𝟗. 𝟖𝟐: 𝜷𝟏> 0, biến X và biến Y có mối quan hệ đồng biến, với mẫu dữ
liệu trên, khi các yếu tố khác không đổi, nếu thu nhập tăng thêm (hay
giảm) 1 triệu đồng thì chi tiêu sẽ tăng thêm (hay giảm) 49.82 triệu đồng.
Mô hình hồi qui:
Ý nghĩa kinh tế các tham số hồi qui:
17.
18. Tính chất đại số của OLS
Tổng các phần dư OLS bằng 0: 𝑢𝑖 = 0
Hiệp phương sai mẫu giữa các biến độc lập và phần dư bằng 0:
𝑋𝑖𝑢𝑖 = 0
Điểm trung bình mẫu (𝑋, 𝑌) luôn nằm trên đường hồi quy mẫu: 𝑌 = 𝛽0 + 𝛽1𝑋
2. PHƯƠNG PHÁP ƯỚC LƯỢNG BÌNH PHƯƠNG NHỎ NHẤT (OLS)
19. 3. TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA OLS
3.1. Các giả thiết của phương pháp OLS
Giả thiết 1: Mô hình hồi quy có dạng tuyến tính với tham số (βj)
Giả thiết 2: Mẫu ngẫu nhiên
Giả thiết 3: Sự biến động trong mẫu của biến độc lập
𝑌 = 𝛽0 + 𝛽1𝑋 + 𝑢 𝐿𝑛𝑌 = 𝛽0 + 𝛽1𝐿𝑛𝑋 + 𝑢
20. 3. TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA OLS
3.1. Các giả thiết của phương pháp OLS
Giả thiết 4: Các sai số ui có giá trị trung bình bằng 0
𝐸 𝑢𝑖 𝑋𝑖 = 0 𝑣ớ𝑖 ∀𝑖
21. 3. TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA OLS
3.1. Các giả thiết của phương pháp OLS
Giả thiết 5: Các sai số ui có phương sai không thay đổi
𝑉𝑎𝑟 𝑢𝑖 𝑋𝑖 = 𝜎2
; ∀𝑖
22. 3. TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA OLS
3.1. Các giả thiết của phương pháp OLS
Định lý Gauss – Markov
Khi các giả thiết này được đảm bảo thì các ước lượng tính được bằng
phương pháp OLS là các ước lượng tuyến tính không chệch tốt nhất của hàm
hồi quy tổng thể. Ước lượng OLS là BLUE (Best Linear Unbiased
Estimator)
Ước lượng không chệch tuyến tính tốt nhất (Best Linear Unbiased
Estimator - BLUE) là ước lượng có phương sai nhỏ nhất trong tất cả các công
thức ước lượng tuyến tính và không chệch (tức giá trị kỳ vọng của nó bằng giá
trị chân thực của tham số). Thuộc tính này thường dùng để chỉ ra rằng kết quả
ước lượng thu được là đáng mong muốn nhất.
23. 3. TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA OLS
3.2. Tính không chệch của các ước lượng OLS
𝛽𝑗 là ước lượng không chệch cho các hệ số 𝛽𝑗 tương ứng. Khi lấy mẫu khác
nhau, các 𝛽𝑗 là khác nhau nhưng trung bình sẽ xấp xỉ 𝛽𝑗.
Nếu giả thiết 1 đến giả thiết 4 được thỏa mãn, thì 𝛽0, 𝛽1 là ước lượng không
chệch của 𝛽0, 𝛽1, nghĩa là:
𝐸(𝛽0) = 𝛽0; 𝐸(𝛽1) = 𝛽1
24. 3. TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA OLS
3.3. Độ chính xác của các ước lượng OLS
Tính không chệch cho biết trung bình các sai lệch 𝛽𝑗 sẽ xấp xỉ 𝛽𝑗 (E(𝛽𝑗) = 𝛽𝑗).
Tuy nhiên, không biết sai lệch lớn như thế nào. Nếu sai lệch nhỏ, thì khi lấy
mẫu bất kỳ, 𝛽𝑗 sẽ không quá khác biệt 𝛽𝑗. Khi đó độ chính xác của 𝛽𝑗 là cao.
Độ chính xác chính là phương sai của ước lượng:
𝐸(𝛽𝑗 − 𝛽𝑗)2
= 𝐸[(𝛽𝑗 − E 𝛽𝑗 )2
] = 𝑣𝑎𝑟(𝛽𝑗)
Để đánh giá biến động của các ước lượng 𝛽𝑗 quanh giá trị trung bình của nó, ta
tính phương sai (Var – Variance) và Sai số chuẩn (Se – Standard error).
25. 3. TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA OLS
3.3. Độ chính xác của các ước lượng OLS
Khi giả thiết 1 đến 5 được thỏa mãn:
𝑣𝑎𝑟(𝛽1) =
𝜎2
𝑥𝑖
2
var(𝛽0) =
𝜎2
𝑥𝑖
2
𝑋𝑖
2
𝑛
𝑠𝑒(𝛽1) = var( 𝛽1)
𝑠𝑒(𝛽0) = var( 𝛽0)
Trong đó: var - phương sai; se - sai số chuẩn và 2 - phương
sai của sai số, có thể được ước lượng bằng công thức:
𝜎2
=
𝑢𝑖
2
𝑛−2
=
𝑅𝑆𝑆
𝑛−2
𝑢𝑖
2
: Tổng bình phương của các sai số (Residual sum of
squares – RSS)
𝑢𝑖
2
= (𝑌𝑖 − 𝑌𝑖)2 = 𝑦𝑖
2
− 𝛽1
2
𝑥𝑖
2
𝑉Ớ𝐼 𝑦𝐼
2
= 𝑌𝑖
2
− 𝑛. (𝑌)2
26. Bài tập 2.1:
Cũng bài tập này, yêu cầu:
b. Tính phương sai (Var_Variance) và sai số chuẩn (se_Standardzied error) của hệ
số hồi quy.
𝑢𝑖
2
= (𝑌𝑖 − 𝑌𝑖)2 = 𝑦𝑖
2
− 𝛽1
2
𝑥𝑖
2
= 5272.586521 𝜎2 =
𝑢𝑖
2
𝑛−2
=376.61332
𝑣𝑎𝑟(𝛽1) =
𝜎2
𝑥𝑖
2=4.89621
𝑠𝑒(𝛽1) = var( 𝛽1)=2.21274
var( 𝛽0) =
𝜎2
𝑥𝑖
2
𝑋𝑖
2
𝑛
=169.3017
𝑠𝑒(𝛽0) = var( 𝛽0)=13.0116
27. 4. KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
Khoảng tin cậy của hệ số hồi quy là khoảng giá trị ước lượng của
chính nó.
Độ chính xác của ước lượng điểm được đo bằng sai số chuẩn của nó
(Se). Thay vì chỉ dựa vào 1 điểm, ta có thể xây dựng một khoảng tin
cậy xung quanh giá trị ước lượng điểm, để xác suất mà giá trị đúng
của tham số nằm trong khoảng này là một giá trị cho trước (ví dụ
95%).
Pr(𝛽𝑗 − 𝜀 ≤ 𝛽𝑗 ≤ 𝛽𝑗 + 𝜀) = 1 − 𝛼
Khoảng tin cậy Hệ số tin cậy
Mức ý nghĩa
28. 4. KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
Ta có khoảng tin cậy của 1 :
𝛽0 − 𝑠𝑒(𝛽0). 𝑡𝛼
2
(𝑛−2)
≤ 𝛽0 ≤ 𝛽0 + 𝑠𝑒 (𝛽0). 𝑡𝛼
2
(𝑛−2)
𝑡 =
𝛽𝑗 − 𝛽𝑗
𝑠𝑒(𝛽𝑗)
~𝑡 𝑛 − 2 𝑗 = 1,2
Sử dụng giá trị của thống kê t:
Ta có khoảng tin cậy của 0 :
𝛽1 − 𝑠𝑒(𝛽1). 𝑡𝛼
2
(𝑛−2)
≤ 𝛽1 ≤ 𝛽1 + 𝑠𝑒 (𝛽1). 𝑡𝛼
2
(𝑛−2)
1 - : hệ số tin cậy,
với (0 < < 1): là
mức ý nghĩa.
Ví dụ: nếu = 0,05
= 5%, ta đọc “xác
suất để khoảng tin
cậy chứa giá trị thực
của 1 là 95%.
Pr(−𝑡𝛼
2
(𝑛−2)
≤ 𝑡 ≤ 𝑡𝛼
2
(𝑛−2)
) = 1 − 𝛼
29. Bài tập 2.1:
c. Tính khoảng tin cậy của hệ số hồi quy với độ tin cậy 95%
𝛽0 − 𝑠𝑒(𝛽0). 𝑡𝛼
2
(𝑛−2)
≤ 𝛽0 ≤ 𝛽0 + 𝑠𝑒 (𝛽0). 𝑡𝛼
2
(𝑛−2)
𝛽1 − 𝑠𝑒(𝛽1). 𝑡𝛼
2
(𝑛−2)
≤ 𝛽1 ≤ 𝛽1 + 𝑠𝑒 (𝛽1). 𝑡𝛼
2
(𝑛−2)
129.3094 ≤ 0 ≤ 185.1236
45.0770 ≤ 1 ≤ 54.5687
30. Bài tập 2.1:
c. Tính khoảng tin cậy của hệ số hồi quy với độ tin cậy 95%
Ý nghĩa kinh tế:
Với mẫu số liệu trên, xét trong trường hợp các yếu tố khác không đổi,
khi biến X = 0, chi tiêu tối thiểu từ 129.3094 -> 185.1236 (triệu
đồng/năm), khoảng tin cậy 95%.
Với mẫu số liệu trên, xét trong trường hợp các yếu tố khác không đổi,
khi biến X tăng thêm 1 đơn vị, chi tiêu tăng thêm từ 45.0770 -> 54.5687
(triệu đồng/năm), khoảng tin cậy 95%.
31. 5. KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY
Kiểm định hệ số hồi quy nhằm xác nhận giá trị ước lượng của các
tham số có khả năng bằng hay không một giá trị cho trước (βj=a).
Các phương pháp kiểm định phổ biến:
Sử dụng khoảng ước lượng của các tham số hồi quy
Sử dụng giá trị tới hạn
Sử dụng P-value (Sig.)
32. 5. KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY
Trường hợp 1: Kiểm định giả thuyết β1 = 0
Giả thuyết: H0: β1 = 0
H1: β1 ≠ 0
Phương pháp 1: Dùng khoảng ước lượng với độ tin cậy (1-α) để
kiểm định
=> Quy tắc bác bỏ: Nếu giá trị 0 không thuộc khoảng tin cậy trên, ta
bác bỏ giả thuyết H0
𝛽1 − 𝑠𝑒(𝛽1). 𝑡𝛼
2
(𝑛−2)
≤ 𝛽1 ≤ 𝛽1 + 𝑠𝑒 (𝛽1). 𝑡𝛼
2
(𝑛−2)
33. 5. KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY
Trường hợp 1: Kiểm định giả thuyết β1 = 0
Phương pháp 2: Sử dụng giá trị tới hạn
Tính trị thống kê
Quy tắc bác bỏ
Bác bỏ H0 nếu |t| > 𝑡𝛼/2
𝑛−2
𝑡 =
𝛽1 − 𝛽1
𝑠𝑒(𝛽1)
=
𝛽1
𝑠𝑒(𝛽1)
34. 5. KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY
Trường hợp 1: Kiểm định giả thuyết β1 = 0
Phương pháp 3: Sử dụng P-value (Sig.)
Tính trị thống kê
Tính P-value = p = P(t< |𝑡𝛼/2
𝑛−2
|)
Quy tắc bác bỏ
Bác bỏ H0 nếu p-value < α
𝑡 =
𝛽1 − 𝛽1
𝑠𝑒(𝛽1)
=
𝛽1
𝑠𝑒(𝛽1)
35. 5. KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY
Trường hợp 2: Kiểm định 2 phía
Giả thuyết: H0: β1 = a (a = const)
H1: β1 ≠ a
Tính trị thống kê t
Quy tắc bác bỏ
Bác bỏ H0 nếu |t| > 𝑡𝛼/2
𝑛−2
𝑡 =
𝛽1 − 𝛽1
𝑠𝑒(𝛽1)
=
𝛽1 − 𝑎
𝑠𝑒(𝛽1)
36. 5. KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY
Trường hợp 3: Kiểm định đuôi trái
Giả thuyết: H0: β1 ≥ a (a = const)
H1: β1 < a
Tính trị thống kê t
Quy tắc bác bỏ
Bác bỏ H0 nếu t < −𝑡𝛼
𝑛−2
𝑡 =
𝛽1 − 𝛽1
𝑠𝑒(𝛽1)
=
𝛽1 − 𝑎
𝑠𝑒(𝛽1)
t < -tα
37. 5. KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY
Trường hợp 4: Kiểm định đuôi phải
Giả thuyết: H0: β1 ≤ a (a = const)
H1: β1 > a
Tính trị thống kê t
Quy tắc bác bỏ
Bác bỏ H0 nếu t > 𝑡𝛼
𝑛−2
𝑡 =
𝛽1 − 𝛽1
𝑠𝑒(𝛽1)
=
𝛽1 − 𝑎
𝑠𝑒(𝛽1)
Chú ý:
Đề bài cho độ tin cậy 95%, hay mức ý nghĩa 5% thì tra t tới hạn dùng hàm TINV với = 0.05
nếu dùng kiểm định hai phía, với = 0.05*2 = 0.1 nếu dùng kiểm định một phía,
38. Bài tập 2.1:
Sử dụng tiếp ví dụ trên:
d. Ở mức ý nghĩa 5%, chi tiêu của hộ gia đình có thực sự phụ thuộc vào thu
nhập không?
e. Hệ số chặn của mô hình có ý nghĩa thống kê không? Với mức ý nghĩa 5%.
f. Nếu cho rằng: khi không có thu thập thì chi tiêu tối thiểu là 200 triệu đồng /
năm. Với mức ý nghĩa 5%, nhận định này có đúng không?
g. Nếu cho rằng: khi thu thập tăng thêm 1 triệu đồng/năm thì chi tiêu trong năm
tăng thêm tối đa là 40 triệu đồng. Với mức ý nghĩa 5%, nhận định này có đúng
không?
39. d. Ở mức ý nghĩa 5%, chi tiêu của hộ gia đình có thực sự phụ thuộc vào thu nhập
không?
Ta thực hiện kiểm định giả thiết:
H0: 1 = 0; H1: 1 0
Kiểm định hai phía, tính t1 = 22.5164
Tra bảng: 𝑡∝
2
𝑛−2
= 2.1448
Từ kết quả trên cho thấy: t > 𝑡∝
2
𝑛−2
ta bác bỏ H0, vậy 1 0 và có ý
nghĩa thống kê, nói cách khác, biến X thực sự có ảnh hưởng đến biến
Y. Hay thu nhập có ảnh hưởng đến chi tiêu, ở mức ý nghĩa 5%.
𝑡 =
𝛽1
𝑠𝑒(𝛽1)
40. Ta thực hiện kiểm định giả thiết:
H0: 0 = 0; H1: 0 0
Kiểm định hai phía, tính t0 = 4.0244
Tra bảng: 𝑡∝
2
𝑛−2
= 2.1448
Từ kết quả trên cho thấy: t > 𝑡∝
2
𝑛−2
ta bác bỏ H0, vậy 0 0 và có ý
nghĩa thống kê, nói cách khác, hệ số chặn của mô hình có ý nghĩa
thống kê, ở mức ý nghĩa 5%.
𝑡 =
𝛽0
𝑠𝑒(𝛽0)
e. Hệ số chặn của mô hình có ý nghĩa thống kê không? Với mức ý nghĩa 5%.
41. f. Nếu cho rằng: khi không có thu thập thì chi tiêu tối thiểu là 200 triệu đồng/
năm. Với mức ý nghĩa 5%, nhận định này có đúng không?
Để chấp nhận hay bác bỏ giả thiết này, ta thực hiện kiểm định sau với mức ý
nghĩa 5%.
H0: 0 200; H1: 0 200
Sử dụng kiểm định bên trái:
Tính trị thống kê t0 = -3.2881;
Tra t tới hạn (một phía)−𝑡𝛼
𝑛−2
= −1.7613
Kết quả cho thấy: t < −𝑡𝛼
𝑛−2
nên bác bỏ giả thiết H0, chấp nhận H1.
Nghĩa là, chi tiêu tối thiểu là 200 triệu năm ở mức ý nghĩa 5%. Vậy nhận
định này là đúng.
𝑡 =
𝛽0 − 𝑎
𝑠𝑒(𝛽0)
42. Để chấp nhận hay bác bỏ giả thiết này, ta thực hiện kiểm định sau với mức ý
nghĩa 5%.
H0: 1 ≤ 40; H1: 1 40
Sử dụng kiểm định bên phải:
Tính trị thống kê t1 = 4.4392
Tra t tới hạn (một phía) 𝑡𝛼
𝑛−2
= 1.7613
Kết quả cho thấy: t > 𝑡𝛼
𝑛−2
nên bác bỏ giả thiết H0, chấp nhận H1.
Nghĩa là, thu nhập tăng thêm 1 triệu năm ở mức ý nghĩa 5% thì chi tiêu
trong năm sẽ tăng thêm tối đa là 40 triệu đồng . Vậy nhận định
này là đúng.
𝑡 =
𝛽1 − 𝑎
𝑠𝑒(𝛽1)
g. Nếu cho rằng: khi thu thập tăng thêm 1 triệu đồng/năm thì chi tiêu trong năm
thêm tối đa là 40 triệu đồng. Với mức ý nghĩa 5%, nhận định này có đúng không?
43. 6. HỆ SỐ XÁC ĐỊNH CỦA MÔ HÌNH (R2)
R2 cho biết mô hình hồi quy giải thích được bao nhiêu % sự biến động
của biến phụ thuộc Y bởi biến giải thích X
Ví dụ: R2 = 0,6 = 60% Hàm hồi quy phù hợp 60%: biến X giải thích
được 60% sự biến động của biến Y. 40% còn lại do các yếu tố ngẫu
nhiên khác gây ra
𝑌 = 𝛽0 + 𝛽1𝑋 + 𝑢
44. 6. HỆ SỐ XÁC ĐỊNH CỦA MÔ HÌNH (R2)
Tổng bình phương toàn phần TSS (Total Sum of Square): tổng bình phương
biến thiên của biến phụ thuộc Y
𝑇𝑆𝑆 = (𝑌𝑖 − 𝑌)2
= 𝑌𝑖
2
− 𝑛(𝑌)2
Tổng bình phương hồi quy ESS (Explained Sum of Squares): Tổng bình
phương phần biến thiên của Y được giải thích bởi hàm hồi quy
𝐸𝑆𝑆 =
𝑖=1
𝑛
(𝑌𝑖 − 𝑌)2
= 𝛽1
2
𝑖=1
𝑛
𝑥𝑖
2
= 𝛽1
2
𝑖=1
𝑛
𝑋𝑖
2
− 𝑛𝑋2
Tổng bình phương phần dư RSS (Residual Sum of Squares): Tổng bình
phương phần biến thiên của Y không được giải thích bởi hàm hồi quy
𝑅𝑆𝑆 = (𝑌𝑖 − 𝑌𝑖)2= 𝑢𝑖
2
45. 6. HỆ SỐ XÁC ĐỊNH CỦA MÔ HÌNH (R2)
Hệ số xác định R2 (Coefficient of Determination) – Đo mức độ phù hợp
của hàm hồi quy
𝑇𝑆𝑆 = 𝐸𝑆𝑆 + 𝑅𝑆𝑆 → 1 =
𝐸𝑆𝑆
𝑇𝑆𝑆
+
𝑅𝑆𝑆
𝑇𝑆𝑆
𝑅2
=
𝐸𝑆𝑆
𝑇𝑆𝑆
= 1 −
𝑅𝑆𝑆
𝑇𝑆𝑆
0 ≤ R2 ≤ 1
R2 = 1 : mô hình phù hợp hoàn toàn với mẫu nghiên cứu
R2 = 0 : mô hình hoàn toàn không phù hợp với mẫu nghiên cứu
46. 7. KIỂM ĐỊNH SỰ PHÙ HỢP CỦA MÔ HÌNH
R2
tổng thể = 0: mô hình hồi qui không phù hợp
Kiểm định cặp giả thuyết
𝐻0: 𝑅2
= 0
𝐻1: 𝑅2
> 0
Ta có
𝐹 =
𝐸𝑆𝑆/(𝑘 − 1)
𝑅𝑆𝑆/(𝑛 − 𝑘)
=
𝑅2
/(𝑘 − 1)
(1 − 𝑅2)/(𝑛 − 𝑘)
=
𝑅2
1 − 𝑅2
(𝑛 − 2) ∼ 𝐹(1, 𝑛 − 2)
Hồi quy tuyến tính đơn thì k=2 (số tham số trong mô hình)
Quy tắc bác bỏ H0
Bác bỏ H0 khi F > Fα,k-1,n-k hoặc P-value < α
47. Ví dụ
Sử dụng tiếp ví dụ trên.
h. Tính hệ số xác định của mô hình và nêu ý nghĩa.
i. Kiểm định sự phù hợp của mô hình với độ tin cậy 95%
Tra trị phân phối F dùng hàm FINV; F(k-1;n-k) = 4.6001
48. h. Tính hệ số xác định của mô hình và nêu ý nghĩa.
Hệ số xác định:
R2 =
ESS
TSS
R2 = 0.9731
Ý nghĩa, biến X giải thích được 97.31% sự biến động của biến Y.
2.69% còn lại là do các yếu tố ngẫu nhiên gây ra.
Hay nói cách khác: Sự biến thiên của thu nhập giải thích được
97.31% sự biến thiên của chi tiêu.
49. Kiểm định sự phù hợp của mô hình.
H0: R2 = 0; H1: R2 0
Tính hệ số F:
F =
R2
1 − R2
(n − 2)
F = 506.99
Tra trị phân phối F dùng hàm FINV: F(k-1;n-k) = 4.6001
Ta thấy: F > F nên bác bỏ H0. Kết luận: mô hình hồi qui là phù hợp.
i. Kiểm định sự phù hợp của mô hình với độ tin cậy 95%
50. 8. DỰ BÁO
Vấn đề: sử dụng SRF ước lượng được để dự báo biến phụ thuộc.
Dự báo điểm: Với giá trị cho trước X0, thay vào phương trình hồi
quy mẫu, ta được giá trị dự báo điểm (𝑌0)
Dự báo khoảng: bổ sung sai số vào ước lượng điểm để mở rộng
khoảng tin cậy của Y
Dự báo giá trị trung bình của biến phụ thuộc (biết X = X0 cần dự
báo giá trị E(Y/X0)).
Dự báo giá trị cá biệt của biến phụ thuộc (biết X = X0 cần dự báo
giá trị (Y0 = Y/X0))
51. 8. DỰ BÁO
SRF cho ta một ước lượng điểm của E(Y/X0) trên mẫu
𝑌0 = 𝛽0 + 𝛽1𝑋0
Để dự báo E(Y/X0) cho tổng thể ta ước lượng khoảng tin cậy. Ta có
𝑡 =
𝑌0 − 𝐸(𝑌/𝑋0)
𝑆𝑒(𝑌0)
∼ 𝑡𝛼/2
𝑛−2
𝑆𝑒(𝑌0) = 𝜎
1
𝑛
+
(𝑋0 − 𝑋)2
Σ𝑥𝑖
2
Do đó với độ tin cậy (1-) cho trước
𝑌0 − 𝑆𝑒(𝑌0)𝑡𝛼
2
(𝑛−2)
≤ 𝐸(𝑌/𝑋0) ≤ 𝑌0 + 𝑆𝑒(𝑌0)𝑡𝛼
2
(𝑛−2)
8.1. Dự báo khoảng giá trị trung bình của biến phụ thuộc
52. 8. DỰ BÁO
8.2. Dự báo khoảng giá trị cá biệt của biến phụ thuộc
Để dự báo Y0 của tổng thể ta ước lượng khoảng tin cậy của nó
𝑡 =
𝑌0 − 𝑌0
𝑆𝑒(𝑌0 − 𝑌0)
∼ 𝑡𝛼/2
𝑛−2
𝑆𝑒(𝑌0 − 𝑌0) = 𝜎 1 +
1
𝑛
+
(𝑋0 − 𝑋)2
Σ𝑥𝑖
2
Do đó với độ tin cậy (1-) cho trước
𝑌0 − 𝑆𝑒(𝑌0 − 𝑌0)𝑡𝛼
2
(𝑛−2)
≤ 𝑌0 ≤ 𝑌0 + 𝑆𝑒(𝑌0 − 𝑌0)𝑡𝛼
2
(𝑛−2)
53. Ví dụ
Sử dụng tiếp ví dụ trên:
j. Với thu nhập 10 triệu, hãy ước lượng các dự báo điểm, dự báo khoảng
và dự báo khoảng giá trị cá biệt về chi tiêu, với độ tin cậy 95%. Giải thích
sự khác biệt của các giá trị dự báo.
54. Dự báo điểm của Y0 khi X0 = 10
Thế X0=10 vào phương trình hồi qui:
𝑌0 = 𝛽0 + 𝛽1𝑋0
Tính được
𝑌0 = 655.4451
Ý nghĩa: khi thu nhập bằng 10 triệu thì mức chi tiêu trung bình
là 655.4451 triệu đồng/ năm.
55. Dự báo khoảng của Y0 khi X0 = 10
Ta cần tính các chỉ số sau:
𝑉𝑎𝑟 𝑌0 = 𝜎2
1
𝑛
+
(𝑋0 − 𝑋)2
𝑥𝑖
2 = 124.6238
𝑠𝑒 𝑌0 = 𝑉𝑎𝑟 𝑌0 = 11.1635
Tra bảng t tới hạn: 𝑡∝
2
𝑛−2
= 2.1448
𝑌0 − 𝑆𝑒(𝑌0)𝑡𝛼
2
(𝑛−2)
≤ 𝑌0 ≤ 𝑌0 + 𝑆𝑒(𝑌0)𝑡𝛼
2
(𝑛−2)
631.5018 ≤ 𝑌0 ≤ 679.3885
Ý nghĩa: từ mẫu số liệu trên, với độ tin cậy 95%, khi các yếu tố khác
không đổi, nếu thu nhập bằng 10 triệu thì mức chi tiêu trung bình trong
khoảng 631.5018 triệu đồng đến 679.3885 triệu đồng.
56. Dự báo khoảng giá trị cá biệt của Y0 khi X0 = 10
Ta cần tính các chỉ số sau:
𝑉𝑎𝑟 𝑌0 − 𝑌0 = 𝜎2
+ 𝑉𝑎𝑟 𝑌0 = 501.2371
𝑠𝑒 𝑌0 − 𝑌0 = 𝑉𝑎𝑟 𝑌0 − 𝑌0 = 22.3883
Tra bảng t tới hạn: 𝑡∝
2
𝑛−2
= 2.1448
𝑌0 − 𝑠𝑒 𝑌0 − 𝑌0 𝑡𝛼
2
(𝑛−2)
≤ 𝑌0 ≤ 𝑌0 + 𝑠𝑒 𝑌0 − 𝑌0 𝑡𝛼
2
(𝑛−2)
607.427 ≤ 𝑌0 ≤ 703.4633
Ý nghĩa: từ mẫu số liệu trên, với độ tin cậy 95%, trong trường hợp cá biệt,
khi các yếu tố khác không đổi, nếu thu nhập bằng 10 triệu thì mức chi tiêu
trung bình trong khoảng 607.427 triệu đồng đến 703.4633 triệu đồng.
57. Giải thích sự khác biệt của các giá trị dự báo
Dự báo điểm
Dự báo khoảng
Dự báo trung bình Dự báo cá biệt
Kết quả 655.4451 triệu đồng 631.5018≤Y≤679.3885 607.427≤Y≤703.4633
Giải thích Không tính đến sai số Phạm vi sai số nhỏ hơn,
do: 𝑠𝑒 𝑌0
Phạm vi sai số rộng hơn
do: 𝑠𝑒 𝑌0 − 𝑌0
58. Ví dụ
Sử dụng tiếp ví dụ trên:
k. Với thu nhập 5 triệu, hãy ước lượng giá trị dự báo về mức chi tiêu thấp
nhất và cao nhất là bao nhiêu? với độ tin cậy 90%.
59. Dự báo khoảng giá trị cá biệt của Y0 khi X0 = 5, độ tin cậy 90%
Ta cần tính các chỉ số sau:
𝑉𝑎𝑟 𝑌0 − 𝑌0 = 𝜎2
+ 𝑉𝑎𝑟 𝑌0 = 401.1709
𝑠𝑒 𝑌0 − 𝑌0 = 𝑉𝑎𝑟 𝑌0 − 𝑌0 = 20.0292
Tra bảng t tới hạn (90%): 𝑡∝
2
𝑛−2
= 1.7613
𝑌0 − 𝑠𝑒 𝑌0 − 𝑌0 𝑡𝛼
2
(𝑛−2)
≤ 𝑌0 ≤ 𝑌0 + 𝑠𝑒 𝑌0 − 𝑌0 𝑡𝛼
2
(𝑛−2)
371.0531 ≤ 𝑌0 ≤ 441.6085
Ý nghĩa: từ mẫu số liệu trên, với độ tin cậy 90%, trong trường hợp cá biệt,
khi các yếu tố khác không đổi, nếu thu nhập bằng 5 triệu thì mức chi tiêu
trung bình trong khoảng thấp nhất là 371.0531 triệu đồng; cao nhất là
441.6085 triệu đồng.
66. BÀI TẬP 2.2
Quan sát X1i Yi Quan sát X1i Yi
1 6 650 9 11,0 498
2 6,3 632 10 11,7 483
3 6,8 602 11 12,5 462
4 7,5 586 12 14,0 424
5 7,9 578 13 14,5 410
6 8,4 548 14 15,0 387
7 9,0 520 15 15,5 369
8 9,7 518 16 16,0 350
Giả sử mẫu số liệu trên được khảo sát năm 2020 về mức tiêu thụ điện bình quân tháng hộ gia
đình tại một thị trấn vào mùa đông, trong đó:
- Biến X – nhiệt độ môi trường (t0C)
- Biến Y – mức điện tiêu thụ (kW/h).
67. 1. Cho rằng biến X và biến Y có mối quan hệ tuyến tính theo phương trình hồi quy: 𝑌𝑖 =
𝛽0 + 𝛽1 ∗ 𝑋1𝑖, bạn dự đoán dấu của 𝛽1 là âm hay dương, tại sao?
2. Ước lượng phương trình hồi quy
3. Nêu ý nghĩa kinh tế của các tham số hồi quy 𝛽0𝑣à 𝛽1.
4. Ước lượng khoảng tin cậy của các tham số hồi quy ở mức ý nghĩa 5%.
5. Biến X có thực sự ảnh hưởng lên biến Y không ở độ tin cậy 95%
6. Có ý kiến cho rằng khi nhiệt độ môi trường tăng (giảm) 10C, lượng điện tiêu thụ có thể
chỉ giảm (tăng) tối đa 15kW/hộ/tháng, bạn nhận thấy thế nào?
7. Kiểm định sự phù hợp của mô hình ở độ tin cậy 95%
8. Với nhiệt độ môi trường là 50C, hãy ước lượng các dự báo, độ tin cậy 95%.
68. BÀI TẬP 2.3
Quan sát X1i Yi Quan sát X1i Yi
1 2 220 9 5.5 445
2 2.5 245 10 6.3 480
3 2.9 310 11 6.8 495
4 3.2 340 12 7.5 510
5 3.6 350 13 7.8 535
6 4.1 380 14 7.9 545
7 4.7 410 15 8.4 570
8 5.2 430 16 8.9 600
Giả sử mẫu số liệu trên khảo sát năm 2020 tại một thành phố, trong đó:
- Biến X – khoảng cách từ nhà đến nhà máy xử lý rác (đơn vị: km)
- Biến Y – Giá bán nhà (đơn vị: nghìn USD)
69. 1. Nhập dữ liệu và ước lượng mô hình hồi quy bằng SPSS. Sử dụng kết quả thu được để trả
lời các câu hỏi tiếp theo
2. Ước lượng phương trình hồi quy 𝑌𝑖 = 𝛽0 + 𝛽1 ∗ 𝑋1𝑖
3. Nêu ý nghĩa kinh tế của các tham số hồi quy 𝛽0𝑣à 𝛽1.
4. Hãy ước lượng khoảng tin cậy của các tham số hồi quy ở mức ý nghĩa 5%
5. Biến X có thực sự ảnh hưởng lên biến Y không ở độ tin cậy 95%
6. Kiểm định sự phù hợp của mô hình ở độ tin cậy 95%
7. Nếu khoảng cách từ nhà tới lò xử lý rác là 10 km, bạn hãy ước lượng các giá trị dự báo
giá nhà bình quân là bao nhiêu khi các yếu tố khác không đổi, độ tin cậy 95%? So sánh các
giá trị dự báo, giải thích sự khác biệt.