Ung dung excel trong phan tich hoi quy va tuong quan
TKSD - TKCKHXH.pptx
1.
2. Khoa Xã hội học - Trường Đại học Khoa học Xã hội và Nhân Văn
nguyenhuubinh@hcmussh.edu.vn
3. Kiểm định giả thuyết là một công cụ của thống kê suy diễn.
Mục đích chính của hầu hết các nghiên cứu là để kiểm tra
có hay không việc những dữ liệu thu thập từ các cuộc điều
tra phù hợp với những dự báo về một vấn đề cụ thể. Những
dự báo này chính là các giả thuyết (hypothesis) về tham số
được đo lường trong nghiên cứu.
Giả thuyết là một phát biểu về những đặc trưng của một
tham số (biến) hay tập hợp của nhiều tham số.
1. KHÁI NIỆM
4. a. Kiểu dữ liệu: tương tự như các phương pháp thống kê mô
tả, mỗi kiểm định đều chứa trong nó hoặc là dữ liệu định
tính hoặc là dữ liệu định lượng.
b. Phương pháp chọn mẫu: các kiểm định thường đòi hỏi
các phương pháp chọn mẫu xác suất.
c. Dung lượng mẫu: Tính giá trị của các kiểm định càng
cao khi dung lượng mẫu càng lớn.
d. Mức độ tin cậy: thông thường mức độ tin cậy của một
kiểm định sẽ ở mức 95% (=0,05) hoặc 99% (=0,01)
2. NHỮNG YẾU TỐ CỦA MỘT KIỂM ĐỊNH Ý NGHĨA
5. • e. Giả thuyết: một kiểm định ý nghĩa xem xét hai loại
giả thuyết về giá trị của một tham số:
- Giả thuyết H0 (null hypothesis): là giả thuyết được
kiểm định trực tiếp. Giả thuyết này là một phát biểu
“không” về mối liên hệ giữa hai biến. Nói cụ thể,
một biến này không có quan hệ với biến kia.
- Giả thuyết đối Ha (alternative hypothesis): là giả
thuyết đối của giả thuyết H0. Giả thuyết này phát
biểu rằng có tồn tại một mối quan hệ giữa hai biến.
2. NHỮNG YẾU TỐ CỦA MỘT KIỂM ĐỊNH Ý NGHĨA
6. Giá trị P value
• P-value là viết tắt của từ probability value. Đây là một con số xác suất
và được gọi là trị số P. Hiểu một cách đơn giản, đây là trị giá xác suất
và nó là một đại lượng giúp các nhà khoa học quyết định giả thuyết
của họ đúng hay sai.
• Trị số P càng nhỏ thì độ tin cậy của kết luận càng cao và giá trị ảnh
hưởng của nó càng lớn. Đây là một trị số có điều kiện và được cho
trước, khi tính toán, có thể tra bảng p value để áp dụng.
7. Giá trị P value
• Trong kinh tế lượng, P value có vai trò quan trọng.
Đặc biệt là khi được sử dụng để kiểm định giả thuyết
và xác định độ tin cậy của giả thuyết đó hay còn gọi là
ngưỡng mắc sai lầm cho phép tối đa với giả thuyết Ho
• Phân phối xác suất của X được chia làm 2 miền đối
nghịch là miền chấp nhận và miền bác bỏ đối với giả
thuyết H0. Miền bác bỏ có xác suất xảy ra là P-value.
Đây cũng chính là xác suất tối đa được phép mắc sai
lầm của H0.
8. Giá trị P value
• P = sig. (trong bảng phân phối tần suất của phần mềm thống kê)
• Để đánh giá các kết quả của quá trình kiểm định giả thuyết, người ta sẽ dùng mức
ý nghĩa trong thống kê (gọi là a)
• Khi p nhỏ hơn hoặc bằng mức ý nghĩa, ví dụ a = 0,05 (độ tin cậy 95%) thì người ta có thể
kết luận đủ chứng cứ để bác bỏ giả thuyết đó.
• Khi p lớn hơn mức ý nghĩa, ví dụ a = 0,05 (độ tin cậy 95%) thì ta có thể kết luận chưa có
đủ chứng cứ để bác bỏ giả thuyết đó
9. Giả thuyết:
H0 : Không có sự khác biệt ý nghĩa về trung
bình giữa hai biến
2
1 = hay µ = (µ: giá trị trung
bình của tổng thể)
Ha: Có sự khác biệt giữa hai giá trị trung bình
2
1 hay µ
Yêu cầu:
Mẫu xác suất (ngẫu nhiên)
Biến định lượng
3. KIỂM ĐỊNH Ý NGHĨA CHO GIÁ TRỊ TRUNG BÌNH
10. Ví dụ về tai nạn giao thông, giả sử rằng chúng ta có
số vụ tai nạn giao thông xảy ra trung bình mỗi ngày
của TP.HCM là 10 và của cả nước là 7. Kết quả chỉ
ra rằng số vụ tai nạn giao thông xảy ra trung bình
mỗi ngày của TPHCM cao hơn của cả nước.
Do vậy, chúng ta có thể suy ra rằng TPHCM xảy ra
tai nạn giao thông cao hơn cả nước nói chung
không?
Nếu giả thuyết H0 được kiểm định ở mức tin cậy là
95%, có 5% sai số trong kiểm định này.
3. KIỂM ĐỊNH Ý NGHĨA CHO GIÁ TRỊ TRUNG BÌNH
11. H0 : µ=
µ : số lượng các vụ tai nạn giao thông xảy ra trung bình
một ngày của cả nước
: số lượng các vụ tai nạn giao thông xảy ra trung bình
một ngày tại TP.HCM
Ha: µ
Trong kiểm định này, chúng ta cố gắng tìm xem liệu có
hay không sự khác biệt có ý nghĩa thống kê giữa hai giá
trị trung bình này.
Để kết luận điều này, kết quả kiểm định sẽ dựa trên cơ sở
việc “bác bỏ” hay “chấp nhận” giả thuyết H0
3. KIỂM ĐỊNH Ý NGHĨA CHO GIÁ TRỊ TRUNG BÌNH
12. Nếu giả thuyết H0 bị bác bỏ, tức là chúng ta có bằng
chứng thống kê để cho rằng Ha đúng
-> có sự khác biệt ý nghĩa giữa hai giá trị trung bình
Nếu giả thuyết H0 được chấp nhận, tức là chúng ta chưa
có đủ bằng chứng thống kê để cho rằng Ha đúng.
Chú ý: Chấp nhận H0 không có nghĩa là chúng ta đã
chứng minh được H0 đúng và vội vàng kết luận rằng:
Không có sự khác biệt giữa hai giá trị trung bình.
Chấp nhận H0 chỉ có nghĩa là chúng ta không đủ bằng
chứng thống kê để bác bỏ nó mà thôi.
3. KIỂM ĐỊNH Ý NGHĨA CHO GIÁ TRỊ TRUNG BÌNH
13. - Kiểm định t-test cho mẫu phụ thuộc (nghĩa là hai nhóm
so sánh phụ thuộc vào nhau nghĩa là nhóm này phụ thuộc
vào nhóm kia, thường là nhóm lấy mẫu và tổng thể);
- Kiểm định t-test cho mẫu độc lập (nghĩa là hai nhóm so
sánh tách biệt độc lập với nhau nhưng có xu hướng cùng
tính chất, đặc điểm).
3. KIỂM ĐỊNH Ý NGHĨA CHO GIÁ TRỊ TRUNG BÌNH
14. Kiểm định t được sử dụng khi chúng ta biết các giá trị:
(1) trung bình tổng thể (µ:miu);
(2) trung bình mẫu;
(3) độ lệch chuẩn mẫu (s);
(4) dung lượng mẫu (n)
Kiểm định t dùng để xác định có hay không sự khác biệt
giữa hai trung bình mang ý nghĩa thống kê.
3.1 KIỂM ĐỊNH T-TEST CHO MẪU PHỤ THUỘC
Công thức
15. Quy trình:
Bước 1/ Xác định các tham số muốn kiểm định
Bước 2/ Đặt giả thuyết không (H0) và giả thuyết đối (Ha)
Bước 3/ Xác định mức ý nghĩa của bài toán kiểm định ()
Bước 4/ Tính toán giá trị kiểm định theo công thức (tobtained=
to)
Công thức:
3.1 KIỂM ĐỊNH T-TEST CHO MẪU PHỤ THUỘC
16. Bước 5/ So sánh giá trị kiểm định to với giá trị tới hạn (tcritical =
tC)
Trong kiểm định t-Test, chúng ta sẽ sử dụng bảng dò tìm giá trị
phân phối t để xác định giá trị tới hạn tcritical, rồi so sánh với giá
trị tobtained.
Để dò tìm giá trị phân phối t trong bảng, trước tiên ta cần xác
định số bậc tự do (degrees of freedom -df) của mẫu cũng như giá
trị level.
Bước 6/ Kết luận
Nếu to ≥ tc-> bác bỏ H0 : có sự khác biệt ý nghĩa thống kê giữa 2
biến
Nếu to < tc -> chấp nhận H0: Chưa đủ bằng chứng thống kê
chứng minh có sự khác biệt có ý nghĩa giữa hai biến
3.1 KIỂM ĐỊNH T-TEST CHO MẪU PHỤ THUỘC
17. Chúng ta quan tâm đến sự khác biệt về tổng chi phí trung bình mỗi
tháng dành cho việc mua sắm quần áo của (1) sinh viên nữ lớp
TKXH với (2) SV nữ trường ĐH KHXH&NV.
Biết rằng:
Chi phí trung bình mỗi tháng dành cho việc mua sắm quần áo của
sinh viên nữ trường ĐH KHXH&NV là 50.000đ (µ=50.000)
Chi phí trung bình mỗi tháng dành cho việc mua sắm quần áo của
sinh viên nữ lớp TKXH là 60.000đ
( = 60.000) và độ lệch chuẩn s= 20.000đ
Độ tin cậy là 99% (=0,01)
Tổng số SV nữ lớp TKXH được chọn ngẫu nhiên là 25.
BÀI TẬP VÍ DỤ
18. Bước 2: tobtained =(60.000-50.000):(20.000 : √25) = 10/4 = 2,5
BÀI TẬP VÍ DỤ
Không có sự khác biệt về chi phí mua quần áo
giữa SV nữ lớp TKXH với SV nữ trường ĐH
KHXH&NV
Có sự khác biệt về chi phí mua quần áo giữa SV
nữ lớp TKXH với SV nữ trường ĐH
KHXH&NV
Bước 1: Đặt giả thuyết
19. CÁCH TRA BẢNG T-TEST ĐỂ TÌM T-CRITICAL
Bước 1: Phải tính được bậc tự do (df)
Bước 2: Công thức: df = n-1
Bước 3: Dựa vào cột đầu tiên để xác định vị trí hàng
Bước 4: Dựa vào hàng cuối cùng để xác định vị trí cột
Bước 5: Giao điểm chính là tcritical cần tìm.
20. Dựa vào giá trị df vừa tính, dựa vào cột đầu tiên để
xem sẽ sử dụng dữ liệu hàng nào
21. Thông qua giá trị “Độ tin cậy” => Dựa vào hàng cuối cùng
để xác định cột sẽ sử dụng. Giao điểm chính là tcritical
22.
23. Bước 3: df = n-1 = 25-1 = 24 (tra bảng B) -> tcritical =2,797
Bước 4: Ta có: to =2,5 ; tc =2,797 to < tc
Bước 5: kết luận : chấp nhận H0
Ở độ tin cậy 99%, chúng ta chưa đủ bằng chứng thống kê để kết
luận rằng SV nữ lớp TKXH chi tiêu cho sắm sửa quần áo nhiều
hơn SV của Trường.
Làm lại ví dụ với mức tin cậy 95%
BÀI TẬP VÍ DỤ
24. Điểm trung bình của các học sinh phổ thông trung
học ở Hoa Kỳ thi vào đại học là 500. Một nghiên
cứu được tiến hành để xem xét có hay không sự
khác biệt về số điểm trung bình của những học
sinh quốc tế và học sinh trong nước trong kì thi
vào đại học. Một mẫu ngẫu nhiên 100 học sinh
quốc tế được chọn, với điểm trung bình và độ lệch
chuẩn lần lượt là 508 và 100.
a. Trình bày giả thuyết cho kiểm định ý nghĩa
b. Tiến hành kiểm định thống kê
c. Trình bày kết luận với độ tin cậy 95% và 99%
BÀI TẬP 1
25. Một nhà tâm lý học xã hội dự kiến thực hiện một nghiên cứu với
49 trẻ em được chọn ngẫu nhiên từ các trường trong thành phố.
Trước khi tiến hành cuộc nghiên cứu, nhà tâm lý học này tiến
hành xem xét để kiểm tra một số biến số có thể ảnh hưởng đến
kết quả của cuộc nghiên cứu.
Chỉ số IQ trung bình của 49 đứa trẻ được chọn ngẫu nhiên từ
trường học của thành phố là 103 và độ lệch chuẩn s=14. Trong
khi đó, chỉ số IQ trung bình của tổng thể dân số trẻ em là 100.
Vấn đề đặt ra là liệu có đáng tin cậy không khi xác định chỉ số
IQ trung bình của trẻ em trong cả trường học này cũng là 100?
a. Trình bày giả thuyết H0 và Ha cho kiểm định ý nghĩa
b. Trình bày kết luận với độ tin cậy 95% và 99%
c. Những kết luận gì sẽ được đưa ra ứng với từng mức ý nghĩa sau:
i) = 0,20 ii) = 0,10 iii) = 0,01
BÀI TẬP 2
26. Tuổi kết hôn trung bình lần đầu của nam tại
một cộng đồng New England là 28,0 vào năm
1970. Một mẫu ngẫu nhiên 40 nam kết hôn
cũng ở tại cộng đồng này năm 1990 có kết
quả như sau: tuổi trung bình kết hôn lần đầu
là 26,0 và độ lệch chuẩn là 9,0.
a. Trình bày giả thuyết
b. Trình bày kết luận với độ tin cậy 95% và 99%
BÀI TẬP 3
27. Kiểm định t-Test cho mẫu độc lập được dùng để xem xét sự khác
biệt ý nghĩa về trung bình giữa hai mẫu nghiên cứu độc lập
Ví dụ:
Nghiên cứu sự khác biệt về điểm trung bình môn Thống kê Xã
hội giữa sinh viên lớp Xã hội học và lớp Nhân học
Nghiên cứu sự khác biệt về tỷ lệ đến trường giữa trẻ em Quận 1
và trẻ em Quận Bình Thạnh
Nghiên cứu sự khác biệt về số tiền trung bình được chu cấp hằng
tháng của sinh viên Trường Đại học Bách Khoa và sinh viên
Trường Đại học Quốc tế.
3.2 KIỂM ĐỊNH CHO MẪU ĐỘC LẬP
Kiểm định mẫu độc lập
T-TEST Dung lượng mẫu n<30
Z-TEST Dung lượng mẫu n>30
28. Kiểm định t-Test cho mẫu độc lập được dùng để xem xét sự
khác biệt ý nghĩa về trung bình giữa hai mẫu nghiên cứu độc
lập
Dung lượng mẫu nhỏ (n< 30)
Trong trường hợp có ít nhất một trong hai mẫu nghiên cứu
có dung lượng nhỏ hơn 30, chúng ta sẽ sử dụng công thức
sau:
Công thức:
Trong đó:
3.2 KIỂM ĐỊNH T-TEST CHO MẪU ĐỘC LẬP
29. Các bước tiến hành kiểm định:
Bước 1: Xây dựng giả thuyết
Bước 2: Tìm tobtained theo côngthức
3.2.1 KIỂM ĐỊNH T-TEST CHO MẪU ĐỘC LẬP (n<30)
30. Bước 3: Xác định giá trị tới hạn tcritical
Vì có ít nhất một mẫu với dung lượng n < 30, giá trị
tới hạn tcritical được tính dựa trên bậc tự do df
df = n1 + n2 - 2
Tra bảng B (tr.669) để xác định giá trị tới hạn t
Bước 4: So sánh với giá trị tcritical
to ≥ tc => bác bỏ H0
to < tc => chấp nhận H0
Bước 5: Kết luận
3.2.1 KIỂM ĐỊNH T-TEST CHO MẪU ĐỘC LẬP (n<30)
31. Ví dụ 2: Nghiên cứu số lượng tiểu cầu của 2 nhóm bệnh nhân
(n=10) mắc sốt dengue (SD) và sốt xuất huyết dengue (SXH).
Kết quả thu được như sau (x103 /mm3 )
Nhóm SD: 150, 140, 170, 160, 90, 240, 100, 140, 120, 90
Nhóm SXH: 100, 130, 80, 70, 40, 30, 120, 130, 20, 80
TB SD = 140 (n=10)
TB SXH = 80 (n=10) 1774
S SD = 45 (2044)
S SXH = 39 (1504)
BÀI TẬP VÍ DỤ
32. Một nghiên cứu quan tâm sự khác biệt về mức độ tham gia các sự
kiện xã hội được tổ chức hàng tháng giữa nhóm SV có tham gia sinh
hoạt Đoàn với nhóm SV không tham gia sinh hoạt Đoàn trong một
Trường ĐH, kết quả khảo sát như sau:
BÀI TẬP VÍ DỤ
Nhóm SH Đoàn Không SH Đoàn
Số sự kiện XH tham gia trung bình 1 =15 2 =11
Độ lệch chuẩn s1 =3 s2 =3
Dung lượng mẫu chọn n1 =19 n2 = 30
=0,01
33. Dung lượng mẫu lớn (n≥ 30)
Trong trường hợp ta có dung lượng của cả hai mẫu
nghiên cứu đều lớn hơn hoặc bằng 30, công thức để
kiểm định t-Test sẽ thay đổi, công thức mới này
được gọi là kiểm định z-Test cho hai mẫu độc lập
Công thức:
3.2.1 KIỂM ĐỊNH Z-TEST CHO MẪU ĐỘC LẬP (n>30)
34. Các bước tiến hành kiểm định
Bước 1: Xây dựng giả thuyết
Không có sự khác biệt giữa 2 biến
Có sự khác biệt có ý nghĩa thống kê
giữa 2 biến
Bước 2: Tìm zobtained theo côngthức
3.2.1 KIỂM ĐỊNH Z-TEST CHO MẪU ĐỘC LẬP (n>30)
35. Bước 3: Xác định df = n1 + n2 - 2
Xác định giá trị tới hạn zcritical
zc = 2.58 & p99%= 0,01 với 99% độ tin cậy
zc = 1.96 & p95%= 0,05 với 95% độ tincậy
Bước 4: So sánh với giá trị zcritical
zo ≥ zc => bác bỏ H0
zo < zc => chấp nhận H0
Bước 5: Kết luận
3.2.1 KIỂM ĐỊNH Z-TEST CHO MẪU ĐỘC LẬP (n>30)
36.
37. Một nghiên cứu quan tâm sự khác biệt về mức độ tham gia các sự
kiện xã hội được tổ chức hàng tháng giữa nhóm SV có tham gia sinh
hoạt Đoàn với nhóm SV không tham gia sinh hoạt Đoàn trong một
Trường ĐH, kết quả khảo sát như sau:
BÀI TẬP VÍ DỤ
Nhóm SH Đoàn Không SH Đoàn
Số sự kiện XH tham gia trung bình 1 =15 2 =11
Độ lệch chuẩn s1 =3 s2 =3
Dung lượng mẫu chọn n1 =33 n2 =30
=0,01
38. Trong cuộc tổng điều tra XH của Hoa Kỳ năm 1982, 350
người tham gia trả lời thời gian mỗi ngày dành cho việc xem
truyền hình. Thời gian trung bình của mẫu là 4,1 giờ, với độ
lệch chuẩn là 3,3. Năm 1994, có 1965 người trả lời câu hỏi
này với kết quả: thời gian trung bình là 2,8 giờ và độ lệch
chuẩn là 2,0.
a. Trình bày giả thuyết H0 và Ha cho kiểm định ý nghĩa về sự
khác biệt trung bình giữa thời gian xem truyền hình năm
1982 và 1994
b. Trình bày kết luận với độ tin cậy 95% và 99%
BÀI TẬP 1
39. 10 sinh viên năm I được chọn ngẫu nhiên để tham gia
kiểm tra năng khiếu toán trước và sau khi trải qua một
khóa tập huấn nâng cao. Điểm của mỗi sinh viên được ghi
nhận trước và sau khóa học như sau:
BÀI TẬP 2
Sinh viên Trước Sau
1
2
3
4
5
6
7
8
9
10
60
73
42
88
66
77
90
63
55
96
70
80
40
94
79
86
93
71
70
97
a. So sánh điểm trung bình
trước và sau khóa tập huấn
i) sự khác biệt của trung bình
mẫu, ii) trung bình của điểm
khác biệt
b. Xây dựng giả thuyết và kiểm
định ý nghĩa sự khác biệt về
điểm trung bình trước và sau
khóa học với khoảng tin cậy
90% và 99%. Kết luận gì?
40. 30 nữ trợ lý giáo sư được chọn ngẫu nhiên từ Khoa Nghệ
thuật và Khoa học của một trường ĐH lớn Hoa Kỳ, có
mức lương trung bình một năm học là 41.800 USD.
Cũng tương tự vậy, 50 nam trợ lý giáo sư cùng đơn vị có
mức lương trung bình là 41.000 USD. Độ lệch chuẩn
mẫu lần lượt là 3.000 USD và 3.400 USD.
a. Trình bày kiểm định ý nghĩa để xác định có hay không sự
khác biệt mức lương trung bình giữa nam và nữ, với độ
tin cậy = 0,05
b. Ở độ tin cậy 99%, có thể kết luận điều gì?
BÀI TẬP 3
41. Kiểm định độc lập hay còn gọi là kiểm định
Chi-Square được sử dụng để xem xét có hay
không tồn tại mối quan hệ giữa hai biến định
tính.
Yêu cầu:
- Biến định tính
- Các giá trị của biến loại trừ lẫn nhau
4. KIỂM ĐỊNH SỰ ĐỘC LẬP CHI - SQUARE
42. Một ví dụ minh hoạ về Vai trò của Kiểm định
Chi-Square
4. KIỂM ĐỊNH SỰ ĐỘC LẬP CHI - SQUARE
P value = 0,000…
Nguyễn Hữu Bình (2017). “Vai trò của mạng lưới xã hội trong đời sống của người dân tại tỉnh
Bến Tre (Nghiên cứu trường hợp xã Thạnh Phong, huyện Thạnh Phú)”. Khoá luận tốt nghiệp
Xã hội học. Trường ĐH KHXH&NV, ĐHQG-HCM.
43. Một ví dụ minh hoạ về Vai trò của Kiểm định
Chi-Square
4. KIỂM ĐỊNH SỰ ĐỘC LẬP CHI - SQUARE
P value = 0,000…
Nguyễn Hữu Bình (2017). “Vai trò của mạng lưới xã hội trong đời sống của người dân tại tỉnh
Bến Tre (Nghiên cứu trường hợp xã Thạnh Phong, huyện Thạnh Phú)”. Khoá luận tốt nghiệp
Xã hội học. Trường ĐH KHXH&NV, ĐHQG-HCM.
44. Quy trình kiểm định
Bước 1: Xây dựng giả thuyết
H0: Không có mối quan hệ giữa hai biến
Ha: Hai biến có mối quan hệ ý nghĩa với nhau
Bước 2: Tính giá trị tần suất mong đợi (fe)
Công thức:fe = (tổng dòng) x (tổng cột)/tổng mẫu
Trong đó:
fe: tần suất mong đợi (expected frequency), là giá trị tần
suất giả định rằng hai biến kiểm định là độc lập
4. KIỂM ĐỊNH SỰ ĐỘC LẬP CHI - SQUARE
45. Bước 3: Tìm giá trị χ2 theo công thức:
Trong đó:
fo : Tần suất quan sát (observed frequency), là giá trị quan sát
thực tế
Bước 4: Tính giá trị χ2 thông qua bậc tự do
df = (số dòng – 1) x (số cột – 1)
Tra bảng phân bố Chi-Square để tìm giá trị tới hạn tương ứng
với từng mức độ tin cậy cụ thể.
4. KIỂM ĐỊNH SỰ ĐỘC LẬP CHI- SQUARE
critical
obtained
46. Bước 5: So sánh χ2 với χ2
obtained critical
χ2
obtained critical
≥ χ2
=> bác bỏ H0
χ2
obtained critical
< χ2
=> chấp nhận H0
4. KIỂM ĐỊNH SỰ ĐỘC LẬP CHI - SQUARE
Bước 6: Kết luận
-Bác bỏ H0 : tồn tại mối quan hệ có ý nghĩa thống kê giữa hai biến.
Nói một cách khác, biến nghiên cứu này có quan hệ với biến
nghiên cứu kia.
- Chấp nhận H0 : chúng ta chưa có đủ bằng chứng thống kê để bác
bỏ H0. Nói một cách khác, chưa có đủ bằng chứng để kết luận hai
biến có quan hệ với nhau.
47. Thích ăn món KFC
Thích Không thích Tổng
Giới tính Nam
Nữ
38
7
15
40
53
47
Tổng 45 55 100
Bảng 4.1 Tương quan giữa giới tính và thích ănmónKFC
BÀI TẬP VÍ DỤ
Dữ liệu trên được trình bày dưới dạng bảng tương quan 2x2
Bảng 2x2 biểu thị một biến gồm 2 nhóm (nam và nữ) trong mối
quan hệ với một biến khác cũng bao gồm 2 phương án trả lời
(thích hay không thích)
Cần xác định rõ mối quan hệ giữa hai biến: độc lập – phụ
thuộc
48. Thích ăn món KFC
Thích Không thích Tổng
Giới tính Nam
Nữ
38
7
15
40
53
47
Tổng 45 55 100
Bảng 4.1 Tương quan giữa giới tính và thích ănmónKFC
BÀI TẬP VÍ DỤ
Tìm 4 thông số Fo
Tính toán 4 thông số Fe
Dựa vào đó tính được χ2
49. Thích ăn món KFC
Thích Không thích Tổng
Giới tính Nam
Nữ
38 (Fo11)
7 (Fo21)
15 (Fo12)
40 (Fo22)
53
47
Tổng 45 55 100
Bảng 4.1 Tương quan giữa giới tính và thích ănmónKFC
TìM FO
50. Thích ăn món KFC
Thích Không thích Tổng
Giới tính Nam
Nữ
38 (Fo11)
7 (Fo21)
15 (Fo12)
40 (Fo22)
53
47
Tổng 45 55 100
Bảng 4.1 Tương quan giữa giới tính và thích ănmónKFC
TÌM FE11
Fe11 = (tổng dòng 1 x tổng cột 1) / tổng mẫu
Fe11 = 53 x 45 / 100 = 23,85
51. Thích ăn món KFC
Thích Không thích Tổng
Giới tính Nam
Nữ
38 (Fo11)
7 (Fo21)
15 (Fo12)
40 (Fo22)
53
47
Tổng 45 55 100
Bảng 4.1 Tương quan giữa giới tính và thích ănmónKFC
TÌM FE12
Fe12 = (tổng dòng 1 x tổng cột 2) / tổng mẫu
Fe12 = 53 x 55 / 100 = 29,15
52. Thích ăn món KFC
Thích Không thích Tổng
Giới tính Nam
Nữ
38 (Fo11)
7 (Fo21)
15 (Fo12)
40 (Fo22)
53
47
Tổng 45 55 100
Bảng 4.1 Tương quan giữa giới tính và thích ănmónKFC
TÌM FE21
Fe21 = (tổng dòng 2 x tổng cột 1) / tổng mẫu
Fe21 = 47 x 45 / 100 = 21,15
53. Thích ăn món KFC
Thích Không thích Tổng
Giới tính Nam
Nữ
38 (Fo11)
7 (Fo21)
15 (Fo12)
40 (Fo22)
53
47
Tổng 45 55 100
Bảng 4.1 Tương quan giữa giới tính và thích ănmónKFC
TÌM FE22
Fe22 = (tổng dòng 2 x tổng cột 2) / tổng mẫu
Fe22 = 47 x 55 / 100 = 25,85
54. BÀI TẬP VÍ DỤ
Bước 1: Xây dựng giả thuyết
Ho: Không có sự khác biệt giữa nam và nữ trong sở thích ăn KFC
Ha: Có sự khác biệt giữa nam và nữ trong sở thích ăn KFC
Từ bảng 4.1 đọc tìm fo (dòng và cột):
Fo11 = 38 ; Fo12=15 ; Fo21 =7 ; Fo22=40
Từ bảng 4.1 đọc tìm fe (dòng và cột):
Tổng dòng là 53 và 47
Tổng cột là 45 và 55
Tổng mẫu là 100
Fe11 = (tổng dòng 1) x (tổng cột 1)/tổng mẫu = (53 x 45)/100= 23,85
Fe12= (tổng dòng 1) x (tổng cột 2)/tổng mẫu = (53 x 55)/100 = 29,15
Fe21 = (tổng dòng 2) x (tổng cột 1)/tổng mẫu = (47 x 45)/100= 21,15
Fe22= (tổng dòng 2) x (tổng cột 2)/tổng mẫu = (47 x 55)/100 = 25,85
56. BÀI TẬP VÍ DỤ
Bước 4: Tìm χ2 critical
df= (2-1) x (2-1)=1
và anpha = 0,05, tra bảng C (Cột 3 từ phải qua - Dòng 1)
=> χ2 = 3,84
So sánh ta có: 32,47 > 3,84
critical
χ2
obtained critical
≥ χ2 -> Bác bỏ Ho
Ở mức độ tin cậy 95%, Có sự khác biệt có ý nghĩa
thống kê giữa nam và nữ trong sở thích ăn KFC
57.
58. Bảng 4.2 Trình bày kết quả cuộc khảo sát thực hiện năm 1992 học sinh lớp 12
ở thành phố Dayton, bang Ohio, Hoa Kỳ
a. Lập bảng tương quan tỉ lệ phần trăm với biến “Hút thuốc” được xem
như là biến trả lời (biến phụ thuộc)
b. Lập bảng tương quan tỉ lệ phần trăm với biến “Uống rượu bia” được
xem như là biến trả lời (biến phụ thuộc)
c. Thực hiện kiểm định để xác định có hay không hút thuốc và uống rượu
bia có mối quan hệ ý nghĩa, ở mức tin cậy 95%.
d. Thực hiện kiểm định để xác định có hay không hút thuốc và uống rượu
bia có mối quan hệ ý nghĩa, ở mức tin cậy 99%.
Hút thuốc
Có Không
Uống rượu bia Có
Không
1449
46
500
281
Nguồn: Nghiên cứu thực hiện bởi trường ĐH Y khoa và Chăm sóc sứckhỏe,
Dayton, Ohio
BÀI TẬP 1
59. Giới tính nạn nhân
Nữ Nam
Giới tính người
phạm tội
Nữ
Nam
290
2765
1004
7487
Nguồn: Bộ Tư pháp Hoa Kỳ năm 2003
Bảng 4.3. trình bày kết quả tổng hợp về mối quan hệ giữa người
phạm tội và nạn nhân theo giới tính của Bộ Tư pháp Hoa Kỳ
năm 2003
a. Lập bảng tương quan tỉ lệ phần trăm với biến “Giới tính nạn
nhân” được xem như là biến trả lời (biến phụ thuộc)
b. Thực hiện kiểm định để xác định có hay không mối quan
hệ về giới tính giữa người phạm tội và nạn nhân.
BÀI TẬP 2
60. ThS. Nguyễn Hữu Bình
Khoa Xã hội học
Trường Đại học Khoa học Xã hội và Nhân Văn, ĐHQG-HCM
nguyenhuubinh@hcmussh.edu.vn