2. Khái niệm và quá trình chọn mẫu
Chọn mẫu theo xác suất
Chọn mẫu phi xác suất
Xác định cỡ mẫu
3. Khái niệm và quá trình chọn mẫu
Chọn mẫu theo xác suất
Chọn mẫu phi xác suất
Xác định cỡ mẫu
4. Tiết kiệm thời gian
Tiết kiệm chi phí
VÌ SAO PHẢI
CHỌN MẪU
???
Nghiên cứu Rất cần thiết trong
trên mẫu nhiều lúc những khảo sát dẫn
chính xác hơn đến sự phá hoại hoặc
thay đổi thuộc tính
của đối tượng.
5. Phần tử (element): đơn vị
mà nhà NC cần quan sát và Phần
thu thập dữ liệu (cá nhân, hộ tử
gia đình, tổ chức,…)
Tổng thể (population): tập
hợp tất cả phần tử được định
nghĩa là thuộc phạm vi NC. Tổng thể
Tổng thể nghiên cứu (study population): tập hợp
các phần tử mà thực tế có thể nhận dạng và lấy mẫu.
6. Đơn vị lấy mẫu (sampling unit): một hay
một nhóm các phần tử để từ đó thực hiện
việc lấy mẫu trong mỗi giai đoạn của quá
trình chọn mẫu.
Khung mẫu (sampling frame): Danh
sách các đơn vị lấy mẫu có sẵn để phục
vụ cho việc lấy mẫu.
7. Xác định tổng thể NC và phần tử
Xác định khung mẫu
Xác định kích thước mẫu
Xác định phương pháp chọn mẫu
Chọn mẫu
8. Khái niệm và quá trình chọn mẫu
Chọn mẫu theo xác suất
Chọn mẫu phi xác suất
Xác định cỡ mẫu
10. Chọn mẫu
xác suất
• Biết trước xác suất xuất hiện của các phần tử vào
trong mẫu
• Quá trình chọn mẫu tuân theo quy luật toán,
không thể tự ý thay đổi
• Các thông số của mẫu có thể dùng để ước lượng/
kiểm nghiệm các thông số của tổng thể
11. • Nhà NC chọn các phần tử vào mẫu không theo
quy luật ngẫu nhiên
• Không biết xác suất xuất hiện của các phần tử.
Chọn mẫu tùy thuộc vào nhà nghiên cứu.
• Không thể dùng các thông số của mẫu để ước
lượng/kiểm nghiệm các thông số của tổng thể.
Chọn mẫu
phi xác suất
12. Chọn mẫu
Chọn mẫu xác suất
phi xác suất
• Ngẫu nhiên đơn giản • Lấy mẫu thuận tiện
(simple random) (convenience)
• Hệ thống • Lấy mẫu phán đoán
(systematic) (judgment)
• Phân tầng • Lấy mẫu theo lớp
(stratified random) (quota)
• Theo nhóm • Lấy mẫu theo mầm
(cluster) (snow ball)
13. Về độ chính xác của hai phương pháp chọn mẫu:
“There is no guarantee that the results obtained with
a probability sample will be more accurate than
those obtained with a non-probability sample. What
the former allows the researcher to do is to measure
the amount of sampling error likely to occur in the
sample. This provides a measure of the accuracy of
the sample result. With non-probability sampling no
such error measure exists” (Kinnear & Taylor,
p.207).
14. Chọn mẫu
Chọn mẫu xác suất
phi xác suất
• Ngẫu nhiên đơn giản • Lấy mẫu thuận tiện
(simple random) (convenience)
• Hệ thống • Lấy mẫu phán đoán
(systematic) (judgment)
• Phân tầng • Lấy mẫu theo lớp
(stratified random) (quota)
• Theo nhóm • Lấy mẫu theo mầm
(cluster) (snow ball)
15. Chọn mẫu
Chọn mẫu xác suất
phi xác suất
• Ngẫu nhiên đơn giản • Lấy mẫu thuận tiện
(simple random) (convenience)
• Hệ thống • Lấy mẫu phán đoán
(systematic) (judgment)
• Phân tầng • Lấy mẫu theo lớp
(stratified random) (quota)
• Theo nhóm • Lấy mẫu theo mầm
(cluster) (snow ball)
16. • Các phần tử được
Chọn mẫu xác suất chọn vào mẫu có xác
suất là như nhau và
• Ngẫu nhiên đơn giản biết trước
(simple random) • Dùng bảng ngẫu nhiên
để chọn phần tử cho
mẫu
• Ưu điểm: Đơn giản
nếu có 1 khung mẫu
đầy đủ
• Nhược điểm: Khó khả
thi khi tổng thể lớn
17. • Chọn ngẫu nhiên một
Chọn mẫu xác suất điểm xuất phát (starting
point), dựa vào bước
nhảy (sampling interval)
để xác định các phần tử
• Hệ thống tiếp theo từ khung mẫu.
(systematic)
• Đây là phương pháp
sử dụng phổ biến hơn
phương pháp ngẫu
nhiên đơn giản.
18. Chọn mẫu xác suất •Ưu điểm: không cần
khung mẫu hoàn chỉnh.
• Nhược điểm: Mẫu sẽ
• Hệ thống bị lệch khi khung mẫu
(systematic) xếp theo chu kỳ và tần
số bằng với bước nhảy
19. • Tổng thể được chia ra
Chọn mẫu xác suất nhiều tầng theo nguyên
tắc: “cùng tầng đồng
nhất, khác tầng dị biệt”.
• Để chọn phần tử trong
mỗi tầng: có thể dùng
phương pháp hệ thống.
• Phân tầng • Số phần tử trong mỗi
(stratified random) tầng được xác định theo tỷ
lệ hoặc không theo tỷ lệ
với kích thước tổng thể.
20. • Phân tầng ngẫu nhiên
Chọn mẫu xác suất theo tỷ lệ: Số phần tử trong
mỗi tầng tỷ lệ với quy mô của
mỗi tầng trong tổng thể.
• Phân tầng ngẫu nhiên
không theo tỷ lệ: Sử dụng
khi độ phân tán các phần tử
trong mỗi tầng khác nhau
• Phân tầng
(stratified random) đáng kể. Số phần tử trong
mỗi tầng được chọn phụ
thuộc vào độ phân tán của
biến quan sát trong các tầng.
21. • Tổng thể được chia làm
Chọn mẫu xác suất nhiều nhóm (mỗi nhóm mang
tính đại diện cho tổng thể) và
tuân theo nguyên tắc: “cùng
nhóm dị biệt, khác nhóm
đồng nhất”.
• Các nhóm sẽ được chọn
một cách ngẫu nhiên để tạo
thành mẫu.
• Theo nhóm
(cluster)
22. • Có thể phân nhóm nhiều
Chọn mẫu xác suất bước: tiếp tục chọn nhóm
con trong nhóm và các phần
tử trong nhóm con, v.v.
(multi–stage cluster
sampling)
• Chọn mẫu theo khu vực
(area sampling): một dạng
của chọn mẫu theo nhóm,
với các nhóm được chia theo
• Theo nhóm khu vực địa lý.
(cluster) Ví dụ:
23. Chọn mẫu • Chọn phần tử dựa trên
sự thuận tiện, dễ tiếp cận,
phi xác suất
dễ lấy thông tin.
• Lấy mẫu thuận tiện • Nhược điểm: Không xác
(convenience) định được sai số lấy mẫu
và không thể kết luận cho
tổng thể từ kết quả mẫu.
• Sử dụng phổ biến khi bị
giới hạn về thời gian và chi
phí.
Ví dụ:
24. Chọn mẫu • Nhà nghiên cứu tự phán
đoán sự thích hợp của các
phi xác suất
phần tử để mời họ tham
gia vào mẫu.
• Lấy mẫu phán đoán • Đặc điểm giống như chọn
(judgment) mẫu thuận tiện, nhưng nếu
khả năng/ kinh nghiệm
phán đoán tốt sẽ cho mẫu
tốt hơn thuận tiện.
Ví dụ:
25. Chọn mẫu • Dựa vào một số thuộc tính
kiểm soát xác định một số
phi xác suất
phần tử sao cho chúng đảm
bảo tỷ lệ của tổng thể và
các đặc trưng kiểm soát.
• Sử dụng phổ biến nhất
trong thực tiễn nghiên cứu.
• Có thể dùng một hoặc
• Lấy mẫu theo lớp
(quota) nhiều thuộc tính kiểm soát
như tuổi, giới tính, thu nhập,
loại hình DN, v.v.
Ví dụ:
26. Chọn mẫu • Chọn ngẫu nhiên những
người phỏng vấn ban đầu,
phi xác suất
những người tiếp theo
được chọn dựa trên sự
giới thiệu của người trước.
Sử dụng thích hợp khi:
tổng thể ít, khó nhận ra các
đối tượng cần thu thập
• Lấy mẫu theo mầm thông tin.
(snow ball)
Ví dụ:
27. Khái niệm và quá trình chọn mẫu
Chọn mẫu theo xác suất
Chọn mẫu phi xác suất
Xác định cỡ mẫu
28. Xác định sai số e Xác định độ tin cậy Xác định giá trị Z
chấp nhận được
giữa ước lượng α muốn có trong tương ứng với
ước lượng mẫu độ tin cậy muốn có
của mẫu và
nằm trong sai số e đã quyết định
tổng thể
Bước 1 Bước 2 Bước 3
Dùng công thức Ước tính
Tính cỡ mẫu thống kê độ lệch chuẩn
tương ứng của tổng thể
Bước 6 Bước 5 Bước 4
29. Trường hợp tính theo biến liên tục (4 bước)
Bước 1: Xác định sai số e cho phép: phụ thuộc
vào độ nhạy của kết quả quyết định đối với biến
ước lượng đang khảo sát. (Thường 1/10-2/10
của đơn vị đo nhỏ nhất)
Bước 2: Xác định độ tin cậy α muốn có (thường
chọn 95% Z=1.96)
30. Bước 3: Ước tính độ lệch chuẩn của mẫu (s)
bằng một trong 3 cách sau:
◦ Tiến hành nghiên cứu thí điểm, sử dụng độ lệch
chuẩn của kết quả nghiên cứu thí điểm.
◦ Dựa vào kết quả của những nghiên cứu trước đó
có mẫu tương tự
◦ Sử dụng công thức theo quy tắc 3 σ:
Max − Min
δ =
6
31. Bước 4: Sử dụng công thức tính mẫu:
2
(Z * S )
n= 2
e
Nếu n>10% tổng thể thì tính lại theo công thức:
2 2
N *Z *S
n=
N * e2 + S 2 * Z 2
32. Ví dụ:
Bài toán cỡ mẫu trong khảo sát bình quân mỗi
tháng người dân Tp.HCM chi tiêu bao nhiêu tiền
cho thực phẩm.
Bài toán cỡ mẫu trong khảo sát sự thỏa mãn
của khách hàng với thang đo 1-7
33. Trường hợp tính theo tỷ lệ của mẫu
Z và e: Xác định tương tự như trên
Cỡ mẫu được tính theo công thức:
2
Z
n = p * q * eø
e
34. Nếu n >10% tổng thể:
2
N * p*q*Z
n=
N * e2 + p * q * Z 2
Trong đó:
p: ước lượng tần số xuất hiện của hiện tượng
q = 1-p
Ước lượng sơ bộ giá trị p ?
35. Ví dụ:
Bài toán cỡ mẫu trong khảo sát xem bao nhiêu
% số hộ Tp.HCM có internet.
36. Cỡ mẫu trong chọn mẫu phi xác suất
Quyết định chọn mẫu phi xác suất thường được
thực hiện một cách chủ quan.
Yếu tố then chốt cho việc lựa chọn là thời gian
và tài chính.
37. Những lưu ý khi xác định cỡ mẫu
Khảo sát một và nhiều yếu tố/biến.
Tỷ lệ hồi đáp.
Phương pháp phân tích dữ liệu.
Sai lệch liên quan đến việc chọn mẫu gồm sai
lệch do chọn mẫu (do tính đại diện của mẫu) và
sai lệch không do chọn mẫu (xảy ra trong quá
trình phỏng vấn, hiệu chỉnh, nhập data,..).
38. Chọn người trả lời khi khảo sát một tổ chức.
Phương pháp chọn mẫu và kích thước mẫu
trong nghiên cứu cơ bản/lý thuyết.