Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Giới thiệu về thống kê
DEPOCEN
Chương 6
Cơ bản về kiểm định giả thuyết:
kiểm định một mẫu
Chủ đề
•Các phương pháp kiểm định giả thuyết
•Z -test trung bình (σ biết)
• p-Value trong kiểm định giả thuyết
•Liên hệ vớ...
Một giả thuyết là một điều
giả sử về tham số tổng thể.
 Một tham số là một
trung bình hoặc tỉ lệ
tổng thể
 Tham số phải ...
 Là câu giả sử trong phép kiểm định
e.g. trung bình số TV bán được trong 1h ít nhất
là 3 (H0: µ ≥ 3)
 Bắt đầu với giả sử...
 Là ngược lại với giả thuyết “trống”
e.g. trung bình số TV bán được trong 1h nhỏ
hơn 3 (H1: µ < 3)
 Đối thuyết có thể ch...
Các bước:
 Đặt giả thuyết “trống” (H0: µ ≥ 3)
 Xác định đối thuyết (H1: µ < 3)
 Trong một vài tình huống, đối thuyết sẽ...
Tổng thể
Giả sử
Tuổi trung bình
Tổng thể là 50
Giả thuyết “trống”
Loại bỏ
Trung bình
Mẫu là 20
MẫuGiả thuyết trống
50?20 =...
Sample Meanµ = 50
Sampling Distribution
Ta có một
mẫu có trung
bình là ...
... Trong tình huống
này, đây là trung bình
tổn...
 Xác định giá trị của thống kê mẫu mà khả năng
giả thuyết “trống” không xảy ra là đúng, còn
được gọi là miền bác bỏ phân ...
Mức ý nghĩa, α và miền
bác bỏ
H0: µ ≥ 3
H1: µ < 3
0
0
0
H0: µ ≤ 3
H1: µ > 3
H0: µ = 3
H1: µ ≠ 3
α
α
α/2
Giá trị
giới hạn
M...
 Sai lầm loại I:
 Loại bỏ giả thuyết trống khi nó đúng
 Đưa đến một hậu quả nghiêm trọng
 Xác suất của sai lầm loại I ...
H0
Hypothesis Test
Trường hợp
Quyết định H0 True H0 False
Không
Bác bỏ
H0
1 - α
Type II
Error (β )
Bác bỏ
H0
Type I
Error
...
α
β
Reduce probability of one error
and the other one goes up.
α & β có quan hệ
ngược nhau
 Giá trị thực của tham số tổng thể
 Tăng khi sự sai khác giữa tham số giả thuyết trống và
giá trị thực giảm
 Mức ý nghĩ...
 Chuyển từ thống kê mẫu(e.g., ) sang biến
ngẫu nhiên chuẩn tắc Z
 So sánh với giá trị giới hạn của Z
 Nếu thống kê Z nằ...
• Là giá trị nhỏ nhất mà H0 có thể bị bác bỏ, gọi là mức
ý nghĩa quan sát:
P-giá trị = P(D | H1 đúng), với D: là 1 miền
 ...
1. Xác định H0 H0: µ ≥ 3
2. Xác định H1 H1 : µ < 3
3. Chọn α α = .05
4. Chọn cỡ mẫu n n = 100
5. Chọn kiểm định Z Test (or...
6. Xác định giá trị giới hạn Z = -1.645
7. thu thập số liệu 100 values
8. tính toán thống kê kiểm định Computed Test Stat....
 Giả sử:
 Tổng thể có phân phối chuẩn
 Nếu không chuẩn, ta dùng cỡ mẫu lớn
 Giả thuyết trống chỉ có dấu ≤ or ≥
 Thống...
Z0
α
Reject H0
Z0
Reject H0
α
H0: µ ≥ 0
H1: µ < 0
H0: µ ≤ 0
H1: µ > 0
Mức ý nghĩa phải nhỏ
hơn µ = 0
Giá trị nhỏ nhất khôn...
Có trung bình bao nhiêu hộp
ngũ cốc chứa nhiều hơn 368
grams? Một mẫu ngẫu nhiên
gồm 25 có X = 372.5. Công
ty có độ sai lệ...
Z .04 .06
1.6 .5495 .5505 .5515
1.7 .5591 .5599 .5608
1.8 .5671 .5678 .5686
.5738 .5750
Z0
σZ = 1
1.645
.50
-.05
.45
.05
1...
α = 0.05
n = 25
Giá trị giới hạn: 1.645
Thống kê kiểm định:
Kết luận:
Tức là:
Không bác bỏ với α = .05
Không có chứng cớ x...
Z0 1.50
p Value
.0668
Z Value of Sample
Statistic
From Z Table:
Lookup 1.50
.9332
Sử dụng đối
thuyết để
tính trực
tiếp phé...
0 1.50 Z
Reject
(p Value = 0.0668) ≥ (α = 0.05).
Không thể bác bỏ.
p Value = 0.0668
α = 0.05
Test Statistic Is In the Do N...
Có bao nhiêu hộp ngũ cốc có
trọng lượng 368 gram? Một
mẫu ngẫu nhiên gồm 25 hộp
có X = 372.5. Công ty có
độ sai lệch lý th...
α = 0.05
n = 25
Giá trị giới hạn: ±1.96
Thống kê kiểm định:
Kết luận:
Tức là:
Không thể bác bỏ với α = .05
Không có chứng ...
Liên hệ với khoảng tin cậy
Cho X = 372.5, σ = 15 and n = 25,
The 95% Confidence Interval is:
372.5 - (1.96) 15/ 25 to 372....
Giả sử:
 Tổng thể có phân phối chuẩn
 Nếu không chuẩn, ta chỉ sử dụng được khi biết phân
phối hơi nghiêng & cỡ mẫu lớn
K...
Ví dụ: kiểm định 1-phía với t-Test
Có bao nhiêu hộp ngũ cốc chứa
nhiều hơn 368 grams? Biết một
mẫu ngẫu nhiên gồm 36 hộp c...
α = 0.01
n = 36, df = 35
Giá trị giới hạn: 2.4377
Test Statistic:
Kết luận:
Tức là:
Không thể bác bỏ với α = .01
Không có ...
 Liên quan đến các biến định tính
 Là % của biến định tính trong tổng thể
 Nếu xuất hiện 2 biến định tính, ta có phân p...
Ví dụ: dùng kiểm định Z cho tỉ lệ
•Bài toán: một công ty marketing nhận
được 4% phản hồi từ dịch vụ Mail.
•Cách tiếp cận: ...
α = .05
n = 500
Không thể bác bỏ vớiKhông thể bác bỏ với α = .05
Z Test for Proportion:
H0: p = .04
H1: p ≠ .04
Critical V...
Upcoming SlideShare
Loading in …5
×

(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm định giả thuyết

947 views

Published on

Bài giảng 4 dưới đây sẽ cung cấp những nguyên tắc cơ bản cũng như cách kiểm định giả thuyết với các phạm trù dữ liệu khác nhau.

Nguyên tắc cơ bản của kiểm định giả thuyết
Phương pháp kiểm định giả thuyết
Z - Kiểm định giá trị trung bình (biết σ)
P – giá trị tiếp cận để kiểm định giả thiết
Ước lượng khoảng tin cậy
Kiểm định 1 tail
T-test giả thuyết cho giá trị trung bình
Z-test giả thuyết cho tỉ lệ
2. Kiểm định giả thuyết với các phạm trù dữ liệu
X2 kiểm định sự khác biệt giữa 2 tỷ lệ (biến độc lập)
X2 kiểm định khác biệt giữa các tỷ lệ (biến độc lập)
X2 kiểm định Độc lập

Các tài liệu tham khảo sau đây là kiến thức cơ bản, giúp hiểu nội dung của bài giảng:
_ Patrick Dattalo, Xác định kích thước mẫu: Sự cân bằng về , sự chính xác, và tính thực tiễn, Oxford University Press Hoa Kỳ, 2008 (Chương 2 và Chương 3)
_ JAMES T. McCLAVE, P. GEORGE BENSON, TERRY SlNClCH, Khóa học đầu tiên trong số liệu thống kê kinh doanh, Prentice Hall; 8 ấn bản năm 2000 (Chương 1 và Chương 2)
_ Mario F. Triola, Thống kê cơ bản, Addison Wesley; 9 ấn bản, 2003 (Chương 6 và Chương 7)

Để biết thêm chi tiết về các hoạt động và nghiên cứu của DEPOCEN truy cập:
Website: http://depocen.org/vn/
LinkedIn: http://linkd.in/1GnHrHB
Facebook: DEPOCEN

Published in: Data & Analytics
  • Login to see the comments

(4) Giới thiệu về thống kê cho các ngành khoa học xã hội_Bài giảng 4: Kiểm định giả thuyết

  1. 1. Giới thiệu về thống kê DEPOCEN Chương 6 Cơ bản về kiểm định giả thuyết: kiểm định một mẫu
  2. 2. Chủ đề •Các phương pháp kiểm định giả thuyết •Z -test trung bình (σ biết) • p-Value trong kiểm định giả thuyết •Liên hệ với ước lượng khoảng tin cậy •Kiểm định một phía • t -test cho trung bình •Z -test cho tỉ lệ
  3. 3. Một giả thuyết là một điều giả sử về tham số tổng thể.  Một tham số là một trung bình hoặc tỉ lệ tổng thể  Tham số phải được định nghĩa trước khi phân tích. I assume the money VND income of this class is VND 3.5 million © 1984-1994 T/Maker Co. Giả thuyết là gì?
  4. 4.  Là câu giả sử trong phép kiểm định e.g. trung bình số TV bán được trong 1h ít nhất là 3 (H0: µ ≥ 3)  Bắt đầu với giả sử rằng giả thuyết “trống” là đúng TRUE. Giả thuyết “trống”, H0 •Giả thuyết “trống” có thể chấp nhận hoặc bác bỏ
  5. 5.  Là ngược lại với giả thuyết “trống” e.g. trung bình số TV bán được trong 1h nhỏ hơn 3 (H1: µ < 3)  Đối thuyết có thể chấp nhận hoặc không Đối thuyết, H1
  6. 6. Các bước:  Đặt giả thuyết “trống” (H0: µ ≥ 3)  Xác định đối thuyết (H1: µ < 3)  Trong một vài tình huống, đối thuyết sẽ dễ được xác định trước tiên. Định nghĩa bài toán
  7. 7. Tổng thể Giả sử Tuổi trung bình Tổng thể là 50 Giả thuyết “trống” Loại bỏ Trung bình Mẫu là 20 MẫuGiả thuyết trống 50?20 =≅= µXIs Quy trình kiểm định giả thuyết No, not likely!
  8. 8. Sample Meanµ = 50 Sampling Distribution Ta có một mẫu có trung bình là ... ... Trong tình huống này, đây là trung bình tổng thể ... Tuy nhiên, ta loại bỏ giả thuyết vì µ = 50. 20 H0 Lí do loại bỏ H0
  9. 9.  Xác định giá trị của thống kê mẫu mà khả năng giả thuyết “trống” không xảy ra là đúng, còn được gọi là miền bác bỏ phân phối mẫu (bác bỏ giả thuyết)  Kí hiệu: α (alpha)  Một vài giá trị cụ thể: 0.01, 0.05, 0.10  Được chọn bởi người nghiên cứu ngay lúc bắt đầu  Cho ta giá trị giới hạn của phép kiểm định Mức ý nghĩa, α
  10. 10. Mức ý nghĩa, α và miền bác bỏ H0: µ ≥ 3 H1: µ < 3 0 0 0 H0: µ ≤ 3 H1: µ > 3 H0: µ = 3 H1: µ ≠ 3 α α α/2 Giá trị giới hạn Miền bác bỏ
  11. 11.  Sai lầm loại I:  Loại bỏ giả thuyết trống khi nó đúng  Đưa đến một hậu quả nghiêm trọng  Xác suất của sai lầm loại I là α  Gọi là mức ý nghĩa  Sai lầm loại II:  Không bác bỏ khi giả thuyết trống sai  Xác suất của sai lầm loại II là β (Beta) Các sai lầm khi lựa chọn
  12. 12. H0 Hypothesis Test Trường hợp Quyết định H0 True H0 False Không Bác bỏ H0 1 - α Type II Error (β ) Bác bỏ H0 Type I Error (α ) Power (1 - β) Các khả năng
  13. 13. α β Reduce probability of one error and the other one goes up. α & β có quan hệ ngược nhau
  14. 14.  Giá trị thực của tham số tổng thể  Tăng khi sự sai khác giữa tham số giả thuyết trống và giá trị thực giảm  Mức ý nghĩa α  Tăng khi α giảm  Độ lệch chuẩn tổng thể σ  Tăng khi σ tăng  Cỡ mẫu n  Tăng khi n giảm Các tác nhân ảnh hưởng sai lầm loại II: β α β β σ β n
  15. 15.  Chuyển từ thống kê mẫu(e.g., ) sang biến ngẫu nhiên chuẩn tắc Z  So sánh với giá trị giới hạn của Z  Nếu thống kê Z nằm trong miền giới hạn, bác bỏ H0; ngược lại không bác bỏ H0 Thống kê Z-Test (σ biết) Thống kê Z X n XX Z X X σ µ σ µ − = − =
  16. 16. • Là giá trị nhỏ nhất mà H0 có thể bị bác bỏ, gọi là mức ý nghĩa quan sát: P-giá trị = P(D | H1 đúng), với D: là 1 miền  Không tr c ti p cho ta k t lu n v giự ế ế ậ ề ả thuy t mà ch gián ti p cho ta k t lu n v  ế ỉ ế ế ậ ề vi c ch p nh n và bác b đ i thuy tệ ấ ậ ỏ ố ế  Được sử dụng khi đưa ra quyết định:  Nếu p-giá trị ≥ α, không bác bỏ H0  Nếu p-giá trị < α, bác bỏ H0 Kiểm định p-giá trị
  17. 17. 1. Xác định H0 H0: µ ≥ 3 2. Xác định H1 H1 : µ < 3 3. Chọn α α = .05 4. Chọn cỡ mẫu n n = 100 5. Chọn kiểm định Z Test (or p Value) Kiểm định giả thuyết: các bước trung bình số TV bán được trong 1h ít nhất là 3 (H0: µ ≥ 3)
  18. 18. 6. Xác định giá trị giới hạn Z = -1.645 7. thu thập số liệu 100 values 8. tính toán thống kê kiểm định Computed Test Stat.= -2 9. đưa ra kết luận thống kê bác bỏ giả thuyết 10. Thể hiện kết luận thống kê trung bình số TV bán được trong 1h nhỏ hơn 3 Kiểm định giả thuyết: các bước (continued)
  19. 19.  Giả sử:  Tổng thể có phân phối chuẩn  Nếu không chuẩn, ta dùng cỡ mẫu lớn  Giả thuyết trống chỉ có dấu ≤ or ≥  Thống kê kiểm định Z: Kiểm định Z 1-phía đối với trung bình (σ biết) n xx z x x σ µ σ µ − = − =
  20. 20. Z0 α Reject H0 Z0 Reject H0 α H0: µ ≥ 0 H1: µ < 0 H0: µ ≤ 0 H1: µ > 0 Mức ý nghĩa phải nhỏ hơn µ = 0 Giá trị nhỏ nhất không mâu thuẫn H0! Miền bác bỏ
  21. 21. Có trung bình bao nhiêu hộp ngũ cốc chứa nhiều hơn 368 grams? Một mẫu ngẫu nhiên gồm 25 có X = 372.5. Công ty có độ sai lệch lý thuyết là σ = 15 grams. Hãy kiểm định với mức ý nghĩa α=0.05. 368 gm. Ví dụ kiểm định 1-phía H0: µ ≤ 368 H1: µ > 368 _
  22. 22. Z .04 .06 1.6 .5495 .5505 .5515 1.7 .5591 .5599 .5608 1.8 .5671 .5678 .5686 .5738 .5750 Z0 σZ = 1 1.645 .50 -.05 .45 .05 1.9 .5744 Standardized Normal Probability Table (Portion) What Is Z Given α = 0.05? α = .05 Tìm giá trị giới hạn: 1-phía Giá trị giới hạn= 1.645
  23. 23. α = 0.05 n = 25 Giá trị giới hạn: 1.645 Thống kê kiểm định: Kết luận: Tức là: Không bác bỏ với α = .05 Không có chứng cớ xác thực là trung bình lớn hơn hoặc bằng 368 Z0 1.645 .05 Reject Example Solution: One Tail H0: µ ≤ 368 H1: µ > 368 50.1= − = n X Z σ µ
  24. 24. Z0 1.50 p Value .0668 Z Value of Sample Statistic From Z Table: Lookup 1.50 .9332 Sử dụng đối thuyết để tính trực tiếp phép kiểm định 1.0000 - .9332 .0668 p –giá trị = P(Z ≥ 1.50) = 0.0668 p Value Solution
  25. 25. 0 1.50 Z Reject (p Value = 0.0668) ≥ (α = 0.05). Không thể bác bỏ. p Value = 0.0668 α = 0.05 Test Statistic Is In the Do Not Reject Region p Value Solution
  26. 26. Có bao nhiêu hộp ngũ cốc có trọng lượng 368 gram? Một mẫu ngẫu nhiên gồm 25 hộp có X = 372.5. Công ty có độ sai lệch lý thuyết là σ = 15 grams. Hãy kiểm định với mức ý nghĩa α=0.05. 368 gm. Ví dụ kiểm định hai phía H0: µ = 368 H1: µ ≠ 368
  27. 27. α = 0.05 n = 25 Giá trị giới hạn: ±1.96 Thống kê kiểm định: Kết luận: Tức là: Không thể bác bỏ với α = .05 Không có chứng cứ rõ ràng khẳng định trung bình không bằng 368 Z0 1.96 .025 Reject Example Solution: Two Tail -1.96 .025 H0: µ = 386 H1: µ ≠ 386 50.1 25 15 3685.372 = − = − = n X Z σ µ
  28. 28. Liên hệ với khoảng tin cậy Cho X = 372.5, σ = 15 and n = 25, The 95% Confidence Interval is: 372.5 - (1.96) 15/ 25 to 372.5 + (1.96) 15/ 25 or 366.62 ≤ µ ≤ 378.38 nếu khoảng tin cậy chứa trung bình của giả thuyết (368), ta không thể bác bỏ giả thuyết trống, nếu ngược lại thì ta bác bỏ. _
  29. 29. Giả sử:  Tổng thể có phân phối chuẩn  Nếu không chuẩn, ta chỉ sử dụng được khi biết phân phối hơi nghiêng & cỡ mẫu lớn Kiểm định tham số: Thống kê t: t-kiểm định: σ không biết n S X t µ− =
  30. 30. Ví dụ: kiểm định 1-phía với t-Test Có bao nhiêu hộp ngũ cốc chứa nhiều hơn 368 grams? Biết một mẫu ngẫu nhiên gồm 36 hộp có X = 372.5, và S = 15. hãy kiểm định với α=0.01. 368 gm. H0: µ ≤ 368 H1: µ > 368 σ is not given, _
  31. 31. α = 0.01 n = 36, df = 35 Giá trị giới hạn: 2.4377 Test Statistic: Kết luận: Tức là: Không thể bác bỏ với α = .01 Không có chứng cứ rõ ràng khẳng định trung bình thực tế lớn hơn 368 Z0 2.4377 .01 Reject Example Solution: One Tail H0: µ ≤ 368 H1: µ > 368 80.1 36 15 3685.372 = − = − = n S X t µ
  32. 32.  Liên quan đến các biến định tính  Là % của biến định tính trong tổng thể  Nếu xuất hiện 2 biến định tính, ta có phân phối 2 chiều.  Mẫu tỉ lệ(ps): Tỉ lệ sizesample successesofnumber n X ps ==
  33. 33. Ví dụ: dùng kiểm định Z cho tỉ lệ •Bài toán: một công ty marketing nhận được 4% phản hồi từ dịch vụ Mail. •Cách tiếp cận: để kiểm tra, họ tiến hành khảo sát 500 người với 25 phản hồi. •Yêu cầu: kiểm định với α = .05
  34. 34. α = .05 n = 500 Không thể bác bỏ vớiKhông thể bác bỏ với α = .05 Z Test for Proportion: H0: p = .04 H1: p ≠ .04 Critical Values: ± 1.96 Thống kê kiểm định: Kết luận: Tức là: Không đủ chứng cứ khẳng định rằng tỉ lệ công ty nhận được phản hồi là 4% . Z ≅ p - p p (1 - p) n s = .04 -.05 .04 (1 - .04) 500 = 1.14 Z0 Reject Reject .025.025

×