1. 3.2 phuong pháp turng bình động
1 phuong pháp trung bình giản đơn(tr56)
Vd: doanh thu của doanh nghiệp sản xuất lốp xe ôtô.
𝐹𝑡+1 =
∑ 𝐴𝑖𝑛
𝑖=1
𝑛
Ai là giá trị thực tế của đại lượng xét ở thời kỳ t
Ft+1 là giá trị dự báo của đại lượng xét ở thời kỳ t+1
giả định người ta đang ở thời kỳ t=12
dùng phương pháp gảin đơnđể dự báo số lượng lốp ôtô bán được ở quý 1 năm 2003 (t kỳ t+1=13)
𝐹13 =
𝐴1 + 𝐴2 + 𝐴3 … . +𝐴1 + 𝐴12
12
Dự báo số lượng lốp ôtô bán được ở qu1y 2 năm 2003, kết hợp thêm sử dụng số lượng năm 2003
𝐹14 =
𝐴1 + 𝐴2 + 𝐴3 … . +𝐴1 + 𝐴12 + 𝐴13
13
Quan sát sai số et giữa giá trị thực tế và giá trị dự báo có chênh lệnh khá lớn giữa giá trị thực tế và giá trị dự báo. Cũng
như giữa các sai số với nhau.
𝑒13 = 𝐴13 − 𝐹13 = 358
𝑒14 = 𝐴14 − 𝐹14 = 81
KL: pp trung bình giản đơn chỉ nên dùng cho các dữ liệu dạng tịnh(khả năng thay đổi ít), cho cấp dữ liệu không có tính xu
hướng(ta8ng hay gia3) và không chuyễn vận theo một hệ thống nào cả( nghĩa là không có một quy luật xát định cụ thể
cho sự thay đổi số liệu).
2)Phương pháp trung bình động(quan trọng trong đờ sống thực tế, kinh tế kỷ thuật)
- có cách tiếp cận làm cho cái tính thời sự của dữ liệu luôn luôn xuất hiện để khắc phục những khiếm khuyết của pp trung
bình giản đơn nói trên ta cần xát định số lượng quan xát không đổi và tính trung bình cho các dữ liệu từ các quan sát gần
nhất này.
- khi dữ liệu có được từ một quan sát mới trong thực tế thì nó sẽ thế cho các dữ liệu từ các quan sát củ trước làm cho số
liệu luôn luôn được “cập nhật”, sau đó tính giá trị trung bình để dự báo cho gia đoạn tiếp theo.
𝐹𝑡 =
𝐴 𝑡−1 +𝐴 𝑡−2 +𝐴 𝑡−3 + ⋯ . +𝐴 𝑡−𝑘
𝑘
At-1 là giá trị thực tế của đại lượng xét ở thời kỳ t-1
At-2 là giá trị thực tế của đại lượng xét ở thời kỳ t-2
.
.
2. .
At-k là giá trị thực tế của đại lượng xét ở thời kỳ t-k
Ft là giá trị dự báo của đại lượng xét ở thời kỳ t
k số lượng thời kỳ quan sát gần nhất gọi là hệ số trung bình động
Vd: bảng tỷ giá hối doái giữa đồng USD(Mỹ) và đồng JPY(Nhật)
𝑀𝑆𝐸5𝑡/𝑘ỳ =
∑ |𝐴 𝑡−𝐹𝑡|28
𝑡=6
3
=
∑ |𝑒𝑡
∗|28
𝑡=6
3
19-12-2012
3.3 Trung bình có trọng số
Cơ sở: lợi thế của một dự đoán số trung bình động là nó dễ dàng tính toán và dễ hiểu. một bất lợi có thể có là tất cả những
giá trị trọng số trung bình được coi trọng như nhau
Ví dụ: một trung bình động ba thời kỳ mỗi giá trị có trọng lượng là 1/3, do đó giá trị của đại lượng xét ở thời kỳ củ nhất
cũng được coi trọng như ở thời kỳ mới nhất nếu xảy ra. Một thay đổi trong chuổi thì việc dự đoán trung bình động có thể
bị chậm phản ứng, đặc biệt nếu có một số lớn những giá trị trọng số trung bình. Để các khắc phục tình trạng này người ta
dùng pp trung bình động có trọng số, thể hiện việc coi trọng cho các số liệu ở các thời kỳ gần nhất rồi mới đến ở thời kỳ
tiếp sau và giảm dần cho thời kỳ tiếp sau nữa. việc chọn các trọng số phụ thuộc vào sự kinh nghiệm và sự nhạy cảm nghề
nghiệp của người dự báo
𝐹𝑡+1 =
∑ 𝐴𝑖 𝑞𝑖
𝑡
𝑡−𝑘
∑ 𝑞𝑖
𝑡
𝑖=𝑡−𝑘
k= số lượng thời kỳ được hcọn để tính trung bình động
Ai= là số liệu thực của đại lượng xét ở thời kỳ i
Ft+1= là số liệu dự báo của đại lượng xét ở thời kỳ i+1
Qi là trọng số tại thời kỳ i
Ví dụ: lợi nhuận của một cơ sở sản xuất gỗ gia dụng qua các thời kỳ(VD6)
3.4 PP hàm số mũ(sang bằng mũ) pp hàm mũ đơn
Cơ sở: pp hàm mũ đơn chỉ sử dụng những giá trị trong quá khứ để dự báo các giá trị trong tương lai của đại lượng xét khi
mà dữ liệu không có tính xu hướng, không có tính thời vụ hiện diện trong dãi số thời gian.
𝐹𝑡 =∝ 𝐴 𝑡 −1 + (1−∝)𝐹𝑡−1
= 𝐹𝑡 −1+∝ (𝐴 𝑡−1−𝐹𝑡−1)
Dự báo ở thời kỳ tiếp theo = dự báo ở thời kỳ trước đó + ∝ lần(thực tế-dự báo)thời kỳ trước đó
=dự báo + anpha(tỷ lệ%) độ sai lệch dự đoán ở thời kỳ trước.
At-1 giá trị thực của đại lượng xét ở tkỳ t-1
3. Ft-1 giá dự báo của đại lượng xét ở tkỳ t-1
Ft giá dự báo của đại lượng xét ở tkỳ t
∝ phần trăm sai số(hay còn gọi là hằng số san bằng)
Ví dụ: dự báo chỉ số tiêu dùng bằng pp hàm mũ đơn(VD7)
25-12-2012
3.5 Phương pháp hàm mũ Holt
Cơ sở: khi dữ liệu có tính xu hướng thì dự báo bằng pp hàm mũ đơn thường cho ra sai số dự báo lớn, chúng ta cải thiện
đáng kể tình hình này nếu điều chỉnh tính khuynh hướng chúng theo pp hàm số mũ Holt, bằng cách thêm yếu tố “tăng
trưởng” như là cách phân tích riêng tính xu hướng trong dữ liệu
𝐅𝐭+𝟏 = ∝ 𝐴 𝑡 + (1−∝)(𝐹𝑡 + 𝑇𝑡)
Tt+1 = 𝛾(𝐹𝑡+1 − 𝐹𝑡 ) + (1 − 𝛾)𝑇𝑡
Ht+m = 𝑇𝑡+1 + 𝑚𝑇𝑡+1
𝐴 𝑡 giá trị thực của đại lượng xét ở thời kỳ t
𝐹𝑡 giá trị dự báo của đại lượng xét ởi thời kỳ t
𝐹𝑡+1 giá trị dự báo của đại lượng xét ởi thời kỳ t+1
𝑇𝑡+1 giá trị thể hiện tính xu hướng của dữ liệu
∝ hằng số mũ (0< ∝< 1)
𝛾 hằng số mũ cho việc ước lượng tính xu hướng thể hiện trên dữ liệu
m thời kỳ dự báo trong tương lai
𝐻𝑡+𝑚 giá trị dự báo của đại lượng xét theo phương pháp holt ở thời kỳ t+m
𝐻𝑡+1 giá trị dự báo của đại lượng xét theo phương pháp holt ở thời kỳ t+1
*Tt yếu tố gia 1trị thể hiện xu hướng thay đổi dữ liệu, tuỳ đại lượng cần dự báo, trong thời kỳ t (tồn tại) không thể đưa
vào trong giá trị thực At mà có thể đưa vào giá trị dự báo Ft vì dự báo cần quan tâm thêm đến sự thay đổi có tính xu
hướng của dữ liệu đối với đại lượng xét cụ thể
* giá trị thể hiện tính xu hướngở thời kỳ t+1, phụ thuộc vào một phần tỷ lệ của giá trị xu hướng thời kỳ trước ở mức (1-𝛾)
(1100%)
* phần tỷ lệ còn lại là ∝ thể hiện ảnh hưởng của tính xu hướng dữ liệu làm cho giá trị dự báo ở thời kỳ t+1 là Ft+1 khác
xo với giá trị dự báo thời kỳ t là Ft
𝑇𝑡+1 = (1 − 𝛾)𝑇𝑡 + 𝛾(𝐹𝑡+1 − 𝐹𝑡)
xét m=1
4. 𝐻𝑡+1 = 𝐹𝑡+1 + 2𝑇𝑡+1
Xét m=2
𝐻𝑡+2 = 𝐹𝑡+1 + 2𝑇𝑡+1
Xét m=3
𝐻𝑡+3 = 𝐹𝑡+1 + 3𝑇𝑡+1
Xét m=4
𝐻𝑡+4 = 𝐹𝑡+1 + 4𝑇𝑡+1
.
.
.
Xét m-1
𝐻𝑡+(𝑚−1) = 𝐹𝑡+1 + (𝑚 − 1)𝑇𝑡+1
Xét m
𝐻𝑡+𝑚 = 𝐹𝑡+1 + 𝑚𝑇𝑡+1
t: thời kỳ t
t+m: thời kỳ t+m sau thời kỳ t là m giai đoạn(thời kỳ)
pp holt cho ta dự báo ở thời kỳ t+1 khi mà hiện tại ta ở thời kỳ t, có số liệu thực AT và các đại lượng liên quan đã biết (Ft,
Tt, ∝ 𝛾), do đó ta có thể tìm thấy dự báo ở thời kỳ t+1 là Ft+1 là có cơ sở khoa học và có thể tin cậy được, đại lượng giá
trị xu hướng Tt+1 có được nhờ công thức số 2. Từ đó ta có dự báo holt cho thời kỳ t+1. Nếu như ta xem như tình hình
không thay đổi nhiều ở thời kỳ tiếp sau nữa ở thời kỳ t+2 nên ta cũng có dự báo ban đầu là t+1 nhưng sau 1 thời kỳ thì xu
hướng thì đại lượng tăng lên 1(t+1) nữa là 2T+1, tương tự cho đến thời kỳ t+m ta vẫn có dự báo ban đầu là Ft+1 và xem
như tình hình không biến đổi quá nhiều, nhưng sau m thời kỳ nên tăng lên mT+1.
Lưu ý: càng dự báo càng xa thì độ chính xác càng giãm vì có nhiều biến có xảy ra không tính hết được mà chỉ đưa vào
trong đại lượng xu hướng Tt+1 mà thôi. Tuy nhiên nó cũng là một cơ sở cho việc lập kế hoạch nhiều thời kỳ sau, dài hạn
VD: dự báo doanh thu của cty S & P 500 bằng pp holt (VD8)
Xét t=1: A1=88.58, F1=88.58, T1=0
Xét t=2 tacó2 = 0
F2=0.64*A1+(1-0.64)*(F1+T1)=0.64*88.58+(1-0.64)*(88.58+0)=88.58
Tt+1=T2= (1-0.24)*T1+0.24(F2-F1)=0
Ht+1=H2=Ft+1+1Tt+1=F2+T2=88.58+0=88.58
5. Xem bảng excel VD8
Kết luận: so với kq trong tài liệu H1 H2, H3,H4 có sự khác biệt nhất định, lý do là việc chọn lựa giá trị ban đầu của chúng
ta:F1=A1, T1= 0 là khác với giá trị chọn lựa của phần mềm chạy cho ra kq trong tài liệu này. Tuy nhiêncũng nhận thấy
rằng số thời kỳ càng nhiều thì khác biệt càng ít đi, nếu số thời kỳ đủ lớn(1-122thời kỳ) thì sai lệch của hai phép tính về kq
dự báo là không đáng kể
3.6 pp holt-winter
Pp hàm mũ holt dự báo rất chính xác cho trường hợp dữ liệu thể hiện tính xu hướng đơn(trong ví dụ này người ta dự báo
với m=1 vì dữ liệu theo từng thời kỳ đã cho đủ. Trường hợp đang ở thời kỳ hiện tại, kô có số liệu cho các thời kỳ tiếp theo
mà vẫn dự báo cho m thời kỳ tiếp theo thì ta dùng công thức Ht+m= Ft+mTt+1) tuy nhiên pp hàm mũ holt không thể áp
dụng tốt cho trường hợp dữ liệu có tính thời vụ. để khắc phục tình trạng này người ta đã mở rộng hàm số mũ Holt-winter,
được sử dụng khi dữ liệu thể hiện cà tính xu hướng và thời vụ, so với pp holt pp holt-winter có thêm ptrình điều chỉnh
tính thời vụ
𝐹𝑡 = 𝛼
𝐴 𝑡
𝑆𝑡−𝑝
+ (1 − 𝛼)(𝐹𝑡−1 + 𝑇𝑡−1)
𝑆𝑡 = 𝛽
𝐴1
𝐹1
+ (1 − 𝛽)𝑆𝑡−𝑝
𝑇𝑡 = 𝛾(𝐹𝑡 − 𝐹𝑡−1) + (1 − 𝛾)𝑇𝑡−1
𝑊𝑡+1 = (𝐹𝑡 + 1𝑇𝑡+1)𝑆𝑡+1−𝑝
At giá trị thực của đại lượng xét ở thời kỳ t
Ft giá trị dự báo của đại lượng xét ở thời kỳ t
Ft-1 giá trị dự báo của đại lượng xét ở thời kỳ t-1
Tt giá trị thể hiện tính xu hướng ở thời kỳ t
Tt-1 giá trị thể hiện tính xu hướng ở thời kỳ t-1
St hệ số thể hiện sự tác động của tính thời vụ lên dữ liệu hiện ở thời kỳ t
St-p hệ số thể hiện sự tác động của tính thời vụ lên dữ liệu hiện ở thời kỳ t-p
St+m-p hệ số thể hiện sự tác động của tính thời vụ lên dữ liệu hiện ở thời kỳ t+m-p
𝛼 hằng số mũ (0< 𝛼<1)
𝛾 hằng số mũ thể hiện ảnh hưởng của tính xu hướng của dữ liệu ( 0< 𝛾<1)
𝛽 hằng số mũ thể hiện ảnh hưởng của tính thời vụ của dữ liệu (0< 𝛽 < 1)
M thời kỳ dự báo ở tương lai
P số thời kỳ trong 1 thời vụ
Wt+m giá trị dự báo đại lượng xét theo pp holt winter ở t thời kỳ t+m
6. Ví dụ: xem xét bộ dữ liệu có tính thời vụ(mùa) về tình hình xuất khẩu qua các quý của một cty, dữ liệu đc lưu trữ
qua 6 năm(VD9)
27-12-2012
Vì khó hoặc không thể điều tra hếtt toàn bộ dữ liệu cho nên chúng ta chỉ điều tra mẫu sau cho mẫu này đại diện được cho
tổng thể vì vậy mà ta có phương trình
𝑌̂ = 𝑏1 𝑋 + 𝑏0
𝑏 ≅ 𝛽1
Đây là phương trình hồi quy ước lượng.
Khi có b1 thì ta tìm được 𝛽1
Khi có b0 thì ta tìm được 𝛽0
Ý nghĩa: biếtđại lượng X ta có thể dự báo đại lượng Y với độ tin cậy khá cao nào đó(hầu như xảy ra )
IV.4
19-09-2013
Cách hồi quy theo phương trình đường thẳng
𝑦 = 𝑎𝑥 + 𝑏
Với bộ dữ liệu 2 biến X và Y
Thu từ thực tế (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), (𝑥3 , 𝑦3 ), … . , (𝑥 𝑛 , 𝑦1𝑛)
Khi các điểm xi yi càng nằm gần đường thẳng y=ax+b thì độ tương quan của x và y càng cao, để đo độ tương quan người
ta dùng hệ số r được chứng minh theo công thức như sau:
𝑟 =
∑ ⌊(𝑋𝑖 − 𝑋̅) ∗ (𝑌𝑖 − 𝑌̅)⌋𝑛
𝑖=1
√⌊∑ (𝑋𝑖 − 𝑋̅)2𝑛
𝑖=1 ⌋ ∗ ⌊∑ (𝑌𝑖 − 𝑌̅)2𝑛
𝑖=1 ⌋
Ví dụ(trang 201 chương 14 Hồi quy tuyến tính đơn): Armand’s là một hệ thống dây chuyển các quán ăn Ý,
𝑌̂ = 𝐴𝑋 + 𝐵 + 𝜀 = 𝛽1 𝑋 + 𝛽0 + 𝜀
𝑌̂ = 𝑏0 + 𝑏1 𝑋
𝛽0 → 𝑏0
𝛽1 → 𝑏1
{
∑ (𝑋𝑖 − 𝑋̅ )(𝑌𝑖 − 𝑌̅)𝑛
𝑖=1
∑ (𝑋𝑖 −𝑛
𝑖=1 𝑋̅)2
7. 𝜀 sai số
𝑋 biến độc lập
𝛽1, 𝛽0 tham số mô hình
Y biến phụ thuộc
Tại quan sát thứ (i)
𝑌𝑖 = 𝛽1 + 𝛽0 𝑋𝑖 + 𝜀𝑖
Ngày 03-01-2013
Kết luận:đại đa số ei nằm trong khoảng phù hợp, sai số lúc dương lúc âm nhưng giao động xung quanh giá trị trung bình
e(tb)=0(sai số trung bình bằng 0 là hợp lý), đồ thị điểm phần dư nó phân bố trải nằm ngang trong khoảng cho phép nên có
thể coi là triển vọng tốt( xem hình vẽ trường hợp A trang 222), theo kq nghiên cứu thống kê đồ thị phần dư có phân bố
giống như trường hợp A nói trên thì kl được rằng không có chứng cứ để nói rằng mô hình là chưa đạt, hay nói cách khác
mô hình hồi quy tuyến tính là hợp lý đáng tin cậy và dễ ứng dụng.
B/ hồi quy bội
Nó nghiên cứu một biến phụ thuộc y liên quan tới 2 hay nhiều biến độc lập khác ký hiệu chung là b biến
Mô hình hồi quy bội
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 + ⋯ + 𝛽 𝑝−1 𝑥 𝑝−1 + 𝛽 𝑝 𝑥 𝑝 + 𝜀
y biến phụ thuộc
x1, x2, xp biến độc lập
𝛽 các tham số mô hình
Phương trình hồi quy bội
𝑦̂ = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 + ⋯ + 𝛽 𝑝 𝑥 𝑝
Xét cho cả tổng thể nhiều quan sát i
Tại quan sát i
𝑦𝑖̂ = 𝛽0 + 𝛽1 𝑥1𝑖 + 𝛽2 𝑥2𝑖 + 𝛽3 𝑥3𝑖 + ⋯ + 𝛽 𝑝 𝑥 𝑝𝑖
Xét mẫu đại diện cho tổng th, chỉ xét đến các quan sát I mà ta khảo sát được nên ta có
𝑦𝑖̂ = 𝑏0 + 𝑏1 𝑥1𝑖 + 𝑏2 𝑥2𝑖 + 𝑏3 𝑥3𝑖 + ⋯ + 𝑏 𝑝 𝑥 𝑝𝑖 *
Ta có b0 gần bằng 𝛽0, b1 gần bằng 𝛽1…
Ta co công thức đánh giá được 𝛽 𝑘 khi biết 𝑏 𝑘
‘* gọi là phương trình hồi quy bội ước lượng
8. 𝑦𝑖 gọi là biến phụ thuộc thực tế khảo sát được lien quan bởi 𝑥1𝑖, 𝑥2𝑖,…, 𝑥 𝑝𝑖…. Tại quan sát i
𝑦̂𝑖 giá trị hồi qui tìm được từ phương trình hồi quy bội ước lượng gần đúng 𝑦𝑖 vì đc giải thích bởi 𝑥1𝑖, 𝑥2𝑖,…, 𝑥 𝑝𝑖
𝑦𝑖̂ = 𝑏0 + 𝑏1 𝑋(𝑦𝑖̂ = 𝑏0 + 𝑏1 𝑋𝑖)
Tại quan sát i
KL: trong chương hồi quy tuyến tính đơn chúng ta đã tìm đc công thức tính cụ thề của b0, b1 để đưa vào phương trình hồi
quy tuyến tính đơn là, ở đây chúng ta có mô hình hồi quy bội việc tính toán không phải chỉ 2 thống số b0 và b1 mà đến bp
để đưa vào phương trình hội quy bội ước lượng.
𝑦̂ = 𝑏0 + 𝑏1 𝑥1𝑖 + 𝑏2 𝑥2𝑖 + 𝑏3 𝑥3𝑖 + ⋯ + 𝑏 𝑝 𝑥 𝑝
vì thế chúng ta phải dùng các công thức toán phức tạp hơn, các ma trận đại số và đả có các chuyên gia đã lập ra các phần
mềm ứng dụng như excel solver, POM, SPSS, ở đây ta dùng phần mềm excel solver
ví dụ: công ty vận tải chuyên chở hàng hoá ở các khách hàng địa phương và lân cận. lảnh đạo tin rằng thời gian đi lại của
các xe lien quan mật thiết đến độ dài từng lộ trình và số lượng chuyến giao nhận hàng trên mỗi lộ trình. Công ty lấy mẫu
10 lộ trình trong ngày cho trong bảng sau đây(tr229)
a) anh chị hãy xây dựng phương trình hồi quy bội ước lượng giữa thời gian đi lại của xe và các yếu tố độ dài lộ
trình cùng với số chuyến giao nhận hàng trên lộ trình, dựa trên kết quả đem lại được từ phần mềm excel
solver trong bài toán này
lời giải:
biến phụ thuộc y: thời gian đi lại trên lộ trình
biến độc lập x1 độ dài lộ trình(km)
biến độc lập x2 số chuyến giao nhận hàng trên lộ trình(chuyến)
dùng mô hình hồi quy bộ chạy bằng phần mềm excel solver(data analysis) ta được kết quả
𝑦̂ = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2
𝑦̂ = −0.867 + 0.0611𝑥1 + 0.9234𝑥2
Tại quan sát thứ i(lộ trình i)
𝑦𝑖̂ = −0.867 + 0.0611𝑥1𝑖 + 0.9234𝑥2
Khi số chuyến giao nhận hàng giữ nguyên tứ là x2i không đổi, còn độ dài lộ trình x1i tăng lên 1 đơn vị(1km) thì thời gian
đi lại sẽ tăng lên b1=0.0611(giờ)
Khi độ dài lộ trình x1i không đổi, số chuyến giao nhận hàng x2i tăng lên 1 đơn vị(1 chuyến) thì thời gian đi lại yi tăng
b2=0.9234 giờ
b) tìm hệ số xác định có điều chỉnh(vì loại bỏ ảnh hưởng lẫn nhau giữa các biến độc lập)
giải thích ý nghĩa:
R2
(R square) : hệ số xác định 0.9038
9. R2
có điều chỉnh (Adjusted R square) :0.8763 (87.63%)
Nghĩa là thời gian đi lại trên lội trình yi được giải thích bởi độ dài lộ trình x1i và số chuyến giao nhận hàn trên lộ trình x2i ở
mức 87.63%( còn phụ thuộc vào các yếu tố khác ở mức 12.37%)
c) với độ tin cậy 95% hãy xét xem mối quan hệ giữa thời gian đi lại yi và từng biến độc lập x1i x2i có ý nghĩa
thống kê hay không?
X1i :độ dài lộ trình
X2i : số chuyến giao nhận hàng
x1
Giả thuyết H0:
𝜷 𝟏=0 (độ dài lộ trình x1 không ảnh hưởng đến thời gian đi lại)
Giả thuyết đối H1: 𝜷 𝟏khác 0 (độ dài lộ trình x1 có ảnh hưởng đến thời gian đi lại)
x2
Giả thuyết H0:
𝛽2=0 (độ dài lộ trình x1 không ảnh hưởng đến thời gian đi lại)
Giả thuyết đối H1: 𝛽2khác 0 (độ dài lộ trình x1 có ảnh hưởng đến thời gian đi lại)
Thống kê kiểm định
t1 = 6.1824
t2 = 4.1763
quy tắc kiểm định
nếu t1 < -tapha/2 hoặc t1 > tapha/2
với (n-p-1)
bác bỏ H0 ngược lại chưa đủ chứng cớ bỏ H0
nếu t2 < -tapha/2 hoặc t2 > tapha/2
với (n-p-1)
bác bỏ H0 ngược lại chưa đủ chứng cớ bỏ H0
tra bảng phân phối t ta có:
10. 1-alpha=0.95, alpha=0.05 alpha/2=0.025
Độ lệch tự do n=10, p=2
n-p-1=7
talpha/2=t0.025(n-p-1=7)=2.365
-talpha/2=-2.365
t1=6.1824> talpha/2=2.365
bác bỏ H0
t2> 2.365
bác bỏ H0
KL: biến x1 x điều có ảnh hưởng đến thời gian đi lại y
Lưu ý : nếu đổi từng biến thành các biến ta giải như sau
Giải thuyết H0 𝛽1 = 𝛽2 = 0
Giải thuyết H1 𝛽1 và 𝛽2 không đồng thời bằng 0 có ít nhất 1 biến độc lập là có ảnh hưởng thật sự đến
biến phụ thuộc y
Thống kê
𝐹 =
𝑀𝑆𝐸
𝑀𝑆𝑅
= 32.8784
Quy tắc kiểm định: với độ tin cậy (1-alpha) tức với ý nghĩa alpha
Nếu F>Falpha : bác bỏ H0 (với Falpha p và n-p-1)
Ngược lại chưa đủ chứng cứ
Tra bảng Fisher với n1=2 và n2=7 ta có F=4.74
F=32.8784 > Falpha=4.74 bác bỏ H0
Vậy có ít nhất 1 trong 2 biến là độ dài lộ trình x1
11. d) sử dụng phương trình hồi ước bộ để tìm dự báo cho thời gian đi lại với lộ trình là 80km và số
chuyến giao nhận hàng là 3 chuyến
𝑦𝑖̂ = −0.867 + 0.0611 ∗ 80 + 0.9234 ∗ 3
Với x1=80km và x2=3 chuyến
e) hãy xét tính đa cộng tuyến trong mô hình
chú thích: là mối quan hệ giữa chính các biến độc lập với nhau. Mối quan hệ này làm cho mô hình
có sai số vì các biến này vốn được xét là các biến độc lập với nhau thì không phụ thuộc lẩn nhau
được. tuy nhiên có thể xét mức độ phụ thuộc yếu thì được
giải:
𝑥1 = 𝑏0
∗
+ 𝑏1
∗
𝑥2
Với x1 là biến phụ thuộc, x2 là biến độc lập
x1=69.4928+3.8232x2
R2
=0.026
‘r= √𝑅2=√0.026 =0.16 (<0.7 là chấp nhận)
Rằng x1 x2 là độc lập hoặc nếu có phụ thuộc thì phụ thuộc yếu. mô hình có thể chấp nhận được
f) phân tích phần dư
chương 6: phân tích dãy số thời gian
là phân tích các thành phần dãy số thời gian: thời vụ, xu hướng, chu kỳ, ngẩu nhiên
pp phân tích dãi số thời gian, tìm ra các thành phần chính trong dãy số: thời vụ, xu hướng, chu kỳ,
ngẩu nhiên nhằm có hiểu biết tốt hơn về sự chuyển vận của dữ liệu được chi phối bởi các thành
phần chính trong dữ liệu, sau đó tích hợp các thành phần này trở lại để xây dựng một mô hình dự
báo cho các thời kỳ tiếp theo.
nội dung chính của pp này sẽ bao gồm các mục tiêu sau đây
a) môi hình phân tích thành phần dãy số thời gian cơ bản
Y= T.S.C.I
Y: biến phụ thuộc chỉ giá trị dữ liệu cần dự báo của đại lượng xét
T: biến độc lập chỉ giá trị của dữ liệu đại diện cho tính xu hướng của dữ liệu của đại lượng xét
S: hệ số thời vụ( chỉ số điều chỉnh thời vụ), thể hiện tác động của tính thời vụ lên dữ liệu của
đại lượng xét.
C: hệ số chu kỳ thể hiện cho tác động của tính chu kỳ lên dữ liệu của đại lượng xét.
I: là hệ số ngẩu nhiên thể hiện tác động của các biến động ngẩu nhiên, thất thường lên dữ liệu
của đại lượng xét.
b) Phân tích dữ liệu và tìm chỉ số thời vụ:
Bước đầu tiên trong sử dụng mô hình phân tích dãy số thời gian là loại bỏ các giao động ngắn
hạn trong dữ liệu, từ đó xu hướng dài hạn, các yếu tố chu kỳ sẽ dễ dàng nhận dạng hơn
các giao động ngắn hạn bao gồm tính chuyển vận thời vụ và các biến động ngẩu nhiên thất
thường sẽ được loại bỏ bằng việc tính trung bình động cho dãy số
giá trị trung bình động được tính từ hệ số trung bình động bằng số lượng quan sát trong 1 vòng
thời vụ. nếu tính theo quý và xét tính biến động thời vụ thì tính trung bình động có hệ số 4 là
thích hợp. nếu tính theo tháng và muốn xát định tính chuyển vận các dữ liệu theo tháng thì hệ số
trung bình động là 12
12. công thức theo quý k=4
MAt =
𝑦𝑡−2 + 𝑦𝑡−1 + 𝑦𝑡+𝑦𝑡+1
4
công thức theo tháng k=12
MAt =
𝑦𝑡−6 + 𝑦𝑡−5 + 𝑦𝑡−4 + 𝑦𝑡−3 + 𝑦𝑡−2 + 𝑦𝑡−1 + 𝑦𝑡+𝑦𝑡+1+𝑦𝑡+2+𝑦𝑡+3+𝑦𝑡+4+𝑦𝑡+5
12
Lưu ý: trung bình động tại 1 quan xát bất kỳ phải có sự tham gia của tất cả các quan sát trong 1
vòng thời vụ, nhưng không nhất thiết phải theo thứ tự từ bé tới lớn. từ đó trung bình động sẽ chỉ
ra cái giá trị Y tiêu biểu cho 1 năm như là 1 vòng thời vụ nhờ việc loại bỏ được tính chu kỳ
Ví dụ: để xem xét tính chất hoạt động theo thời vụ, doanh số bán hàng theo quý của 1 siêu thị từ
2007 tới 2011 được thu thập. các tính toán về doanh số trung bình di động và chỉ số thời vụ
được thể hiện theo bảng sau đây.
XEM BẢNG EXCEL
Doanh số thực
Doanh số TB
> 1 thời kỳ này là mùa vụ tốt
Doanh số thực
Doanh số TB
< 1 thời kỳ này là mùa vụ xấu
𝑌
𝑆
= 𝑇. 𝐶. 𝐼 doanh số đã loại bỏ yếu tố thời vụ
Tìm T: giá trị xu hướng dữ liệu bằng mô hình hồi quy tuyến tính đơn
Ŷ = b0 + b1t (phần mềm excel solver data analysis)
Ŷ = 51.42 + 19.909t
(
Y
S
)
T
= C. I : C.I đại lượng chỉ tác động biến động chu kỳ và ngẩu nhiên
C.I loại bỏ I(hệ số ngẩu nhiên) bằng pp trungbình động thì tìm được C
CI
C
= I
Kết luận: dùng mô hình dự báo Y=T.S.C.T
ở thời kỳ t
Yt
Tt là xu hướng dài hạn dự trên dữ liệu đã loại bỏ …
St là chỉ số thời vụ, là giá trị chuẩn trung bình của các yếu tố thời vụ tại mỗi quan sát
Ct là hệ số chu kỳ thể hiện tính chuyển vận dần điều hình xoán của dãy số xung quanh dg xu hướng
13. It là hệ số ngẩu nhiên thất thường, thông thường là 1, nếu như kô có quan sát nào đáng chú ý
Cụ thể ta dự báo doanh số của quý 1 năm 2012 như sau
YQI,2012= Y21=T21* S21* C21* T21
Người ta xđ bằng biểu đồ giao động của Ct để tìm ra Ct ở thời kỳ cần dự báo