1. CHƯƠNG 5: SUY LUẬN THỐNG KÊ
1. Giới thiệu
2. Ƣớc lƣợng điểm
3. Ƣớc lƣợng khoảng tin cậy
4. Phƣơng pháp ƣớc lƣợng
5. Kiểm định giả thuyết
6. Những vấn đề khác của kiểm định
7, Hồi qui tuyến tính
8, Phƣơng pháp phi tham số
2. CHƯƠNG 5: SUY LUẬN THỐNG KÊ
1. Giới thiệu
2. Ƣớc lƣợng điểm
3.Ƣớc lƣợng khoảng tin cậy
4. Phƣơng pháp ƣớc lƣợng
5. Kiểm định giả thuyết
6. Những vấn đề khác của kiểm định
7, Hồi qui tuyến tính
8, Phƣơng pháp phi tham số
3. 1. GIỚI THIỆU
Ta đã học:
Phân tích hiện tượng ngẫu nhiên:
Biến ngẫu nhiên
Các qui luật phân phối xác suất:
Mối liên quan
Với các quan sát trong cuộc sống & số liệu
thực:
4. 1. GIỚI THIỆU
Ví dụ:
Số cơn lốc xoáy ~
Poisson(15) : 15
??
Số liệu thực 15?:
Suy luận thống kê
Mô hình xác suất &
Tập hợp dữ liệu
5. CHƯƠNG 5: SUY LUẬN THỐNG KÊ
1. Giới thiệu
2. Ước lượng điểm
3.Ƣớc lƣợng khoảng tin cậy
4. Phƣơng pháp ƣớc lƣợng
5. Kiểm định giả thuyết
6. Những vấn đề khác của kiểm định
7, Hồi qui tuyến tính
8, Phƣơng pháp phi tham số
6. 2. ƯỚC LƯỢNG ĐIỂM
Ví dụ:
5 quan sát tuổi thọ của bóng đèn( Đo bằng
giờ)
983, 1063, 1241, 1040, 1103 Mẫu
Tuổi thọ trung bình là 1086
18. BÀI 5: SUY LUẬN THỐNG KÊ
1. Giới thiệu
2. Ƣớc lƣợng điểm
3. Ƣớc lƣợng khoảng tin cậy
4. Phƣơng pháp ƣớc lƣợng
5. Kiểm định giả thuyết
6. Những vấn đề khác của kiểm định
7, Hồi qui tuyến tính
8, Phƣơng pháp phi tham số
34. 3.ƯỚC LƯỢNG KHOẢNG TIN CẬY
Ví dụ: Đo trọng lượng Tôm của hai trang trại ở
Louisiana và Arizona. Tính 95% khoảng tin cậy của
hiệu số trọng lượng tôm của hai trang trại.
Lousiana: 15.5, 12.7, 12.1 ,14.4, 16.1 ,15.0 ,16.2
Arizona: 11.9, 13.3, 15.8, 11.6, 10.4, 13.6, 13.8,
12.4, 13.6,13.0
36. 3.ƯỚC LƯỢNG KHOẢNG TIN CẬY
Trường hợp 2:
Trọng lượng tôm sau 1 tháng như sau:
Trước: X: 11.9, 13.3,15.8, 11.6,10.4,13.6, 13.8
,12.4, 13.6, 13.0
Sau: Y: 20.9, 18.1, 20.9, 13.6, 11.3, 17.2, 20.4,
16.4, 15.5, 21.5.
Hiệu số của sự thay đổi: D= Y- X
9.0, 4.8, 5.1, 2.0, 0.9, 3.6, 6.6, 4.0, 1.9, 8.5
44. 3.ƯỚC LƯỢNG KHOẢNG TIN CẬY
Ví dụ:Điều tra Tháng 10 năm
2010, về cuộc bầu cử Tổng
thống Mỹ. 2207 người được hỏi
xem bầu cho ai: 47% Bush,
44%Al Gore, Ralf Nader:2% và
Pat Buchanan:1%. Những
người còn lại chưa quyết định
hoặc bầu cho người khác.
Báo cáo chỉ ra có 2 % sai lệch.
Với mức tin cậy là q=0.95,
Khoảng tin cậy của tỉ lệ p là bao
nhiêu?
53. 4. CÁC PHƢƠNG PHÁP ƢỚC LƢỢNG
Phương pháp ước lượng hợp lý tối đa
Maximum Likelihood
Ví dụ: Một hệ thống kĩ thuật số truyền hai mã 0 và
1. Ta biết rằng có 1 trong 2 mã trên truyền nhiều
gấp đôi mã còn lại. Để khẳng định điều đó, ta lấy
và có đƣợc 4 quan sát: 1,1,0,1.
Rõ ràng,1 nhiều hơn 0 và ta tin rằng 1 là mã đƣợc
truyền nhiều hơn. Công thức hóa nó.
54. 4. CÁC PHƢƠNG PHÁP ƢỚC LƢỢNG
Gọi p là Xác suất mã 1 đƣợc gửi. p bằng 1/3 hoặc 2/3
Xác suất để có 4 kết quả trên:
P(1,1,0,1) = p.p.p.(1-p) = p3. (1-p)
Nếu p=1/3: P(1,1,0,1) = 0.025
Nếu p=2/3: P(1,1,0,1) = 0.099 : Có vẻ hợp lý hơn
more likely
60. 5. KIỂM ĐỊNH GIẢ THUYẾT
Kiểm định giả thuyết thống kê là bài toán xác định
có nên chấp nhận hay bác bỏ một khẳng định nào
đó về giá trị của một tham số
63. 5. KIỂM ĐỊNH GIẢ THUYẾT
Ví dụ : Thử nghiệm cho 1 mẫu thuốc điều trị huyết
áp mới. Huyết áp của 10 cá nhận đƣợc ghi lại trƣớc
và sau khi sử dụng loại thuốc này. Với từng cá
nhân, sự biến đổi ( lấy trƣớc- sai)đƣợc tính và ghi
lại với mẫu sau:
-8, 0, 2, 4, 9, 14, 19, 22, 32, 35
Vậy thuốc có làm giảm huyết áp không ?
70. 5. KIỂM ĐỊNH GIẢ THUYẾT
Ví dụ: Một máy phát điện phát ra dòng điện 220V. Nguồn
điện này đƣợc kiểm tra hàng giờ.Vào cuối ngày, chuyên gia
kĩ thuật sẽ quyết định xem có phải điều chỉnh lại máy không..
Kiểm định ở mức ý nghĩa 5% :Phải chăng giá trị kì vọng
toán của hiệu điện thế là 220V với các giá trị ghi lại dƣới
đây:
213 , 223 , 225 , 232 , 232, 233 , 237 , 238
Vậy máy phát điện có cần phải điều chỉnh không ?
73. 5. KIỂM ĐỊNH GIẢ THUYẾT
Ví dụ : Một công ty sản xuất kẹp giấy nhựa. Hệ thống kĩ thuật cần
thay đổi nếu tỉ lệ kẹp giấy có lỗi là 10%. Để điều tra hệ thống, 500
kẹp giấy lấy ngẫu nhiên đã đƣợc kiểm tra và phát hiện 55 chiếc có
lỗi Kiểm định mức ý nghĩa 5% xem hệ thống có cần thay đổi không
?
75. 5. KIỂM ĐỊNH GIẢ THUYẾT
Ví dụ: Để xác định phải chăng thuốc lá có liên quan
đến việc tăng huyết áp, một nhóm ngƣời đƣợc điều tra
chia làm hai nhóm nhỏ, hút thuốc và không hút thuốc .
Mức huyết áp của nhóm hút thuốc là: 128,
131,137,138,139,141,150,156.Và nhóm không thuốc:
101, 125,129,130,130,136,138,140,143,146
Với mức ý nghĩa 5%, kiểm định phải chăng hút thuốc
gây huyết áp cao hơn.
77. 6. MỘT SỐ VẤN ĐỀ KHÁC
CỦA KIỂM ĐỊNH
P-values
Định nghĩa: Giá trị P- values của 1 kiểm định là mức ý
nghĩa thấp nhất mà ta có thể bác bỏ giả thiết H0