2. Khái niệm và quá trình chọn mẫu
Chọn mẫu theo xác suất
Chọn mẫu phi xác suất
Xác định cỡ mẫu
3. Khái niệm và quá trình chọn mẫu
Chọn mẫu theo xác suất
Chọn mẫu phi xác suất
Xác định cỡ mẫu
4. VÌ SAO PHẢI
CHỌN MẪU
???
Tiết kiệm chi phí Tiết kiệm thời gian
Nghiên cứu
trên mẫu nhiều lúc
chính xác hơn
Rất cần thiết trong
những khảo sát dẫn
đến sự phá hoại hoặc
thay đổi thuộc tính
của đối tượng.
5. Tổng thể
Phần
tử
Phần tử (element): đơn vị
mà nhà NC cần quan sát và
thu thập dữ liệu (cá nhân, hộ
gia đình, tổ chức,…)
Tổng thể (population): tập
hợp tất cả phần tử được định
nghĩa là thuộc phạm vi NC.
Tổng thể nghiên cứu (study population): tập hợp
các phần tử mà thực tế có thể nhận dạng và lấy mẫu.
6. Đơn vị lấy mẫu (sampling unit): một hay
một nhóm các phần tử để từ đó thực hiện
việc lấy mẫu trong mỗi giai đoạn của quá
trình chọn mẫu.
Khung mẫu (sampling frame): Danh
sách các đơn vị lấy mẫu có sẵn để phục
vụ cho việc lấy mẫu.
7. Xác định tổng thể NC và phần tử
Xác định khung mẫu
Xác định kích thước mẫu
Xác định phương pháp chọn mẫu
Chọn mẫu
8. Khái niệm và quá trình chọn mẫu
Chọn mẫu theo xác suất
Chọn mẫu phi xác suất
Xác định cỡ mẫu
10. • Biết trước xác suất xuất hiện của các phần tử vào
trong mẫu
• Quá trình chọn mẫu tuân theo quy luật toán,
không thể tự ý thay đổi
• Các thông số của mẫu có thể dùng để ước lượng/
kiểm nghiệm các thông số của tổng thể
Chọn mẫu
xác suất
11. Chọn mẫu
phi xác suất
• Nhà NC chọn các phần tử vào mẫu không theo
quy luật ngẫu nhiên
• Không biết xác suất xuất hiện của các phần tử.
Chọn mẫu tùy thuộc vào nhà nghiên cứu.
• Không thể dùng các thông số của mẫu để ước
lượng/kiểm nghiệm các thông số của tổng thể.
12. Chọn mẫu xác suất
• Ngẫu nhiên đơn giản
(simple random)
• Hệ thống
(systematic)
• Phân tầng
(stratified random)
• Theo nhóm
(cluster)
Chọn mẫu
phi xác suất
• Lấy mẫu thuận tiện
(convenience)
• Lấy mẫu phán đoán
(judgment)
• Lấy mẫu theo lớp
(quota)
• Lấy mẫu theo mầm
(snow ball)
13. Về độ chính xác của hai phương pháp chọn mẫu:
“There is no guarantee that the results obtained with
a probability sample will be more accurate than
those obtained with a non-probability sample. What
the former allows the researcher to do is to measure
the amount of sampling error likely to occur in the
sample. This provides a measure of the accuracy of
the sample result. With non-probability sampling no
such error measure exists” (Kinnear & Taylor,
p.207).
14. Chọn mẫu xác suất
• Ngẫu nhiên đơn giản
(simple random)
• Hệ thống
(systematic)
• Phân tầng
(stratified random)
• Theo nhóm
(cluster)
Chọn mẫu
phi xác suất
• Lấy mẫu thuận tiện
(convenience)
• Lấy mẫu phán đoán
(judgment)
• Lấy mẫu theo lớp
(quota)
• Lấy mẫu theo mầm
(snow ball)
15. Chọn mẫu xác suất
• Ngẫu nhiên đơn giản
(simple random)
• Hệ thống
(systematic)
• Phân tầng
(stratified random)
• Theo nhóm
(cluster)
Chọn mẫu
phi xác suất
• Lấy mẫu thuận tiện
(convenience)
• Lấy mẫu phán đoán
(judgment)
• Lấy mẫu theo lớp
(quota)
• Lấy mẫu theo mầm
(snow ball)
16. Chọn mẫu xác suất
• Ngẫu nhiên đơn giản
(simple random)
• Các phần tử được
chọn vào mẫu có xác
suất là như nhau và
biết trước
• Dùng bảng ngẫu nhiên
để chọn phần tử cho
mẫu
• Ưu điểm: Đơn giản
nếu có 1 khung mẫu
đầy đủ
• Nhược điểm: Khó khả
thi khi tổng thể lớn
17. Chọn mẫu xác suất
• Hệ thống
(systematic)
• Chọn ngẫu nhiên một
điểm xuất phát (starting
point), dựa vào bước
nhảy (sampling interval)
để xác định các phần tử
tiếp theo từ khung mẫu.
• Đây là phương pháp
sử dụng phổ biến hơn
phương pháp ngẫu
nhiên đơn giản.
18. Chọn mẫu xác suất
• Hệ thống
(systematic)
•Ưu điểm: không cần
khung mẫu hoàn chỉnh.
• Nhược điểm: Mẫu sẽ
bị lệch khi khung mẫu
xếp theo chu kỳ và tần
số bằng với bước nhảy
19. Chọn mẫu xác suất
• Phân tầng
(stratified random)
• Tổng thể được chia ra
nhiều tầng theo nguyên
tắc: “cùng tầng đồng
nhất, khác tầng dị biệt”.
• Để chọn phần tử trong
mỗi tầng: có thể dùng
phương pháp hệ thống.
• Số phần tử trong mỗi
tầng được xác định theo tỷ
lệ hoặc không theo tỷ lệ
với kích thước tổng thể.
20. Chọn mẫu xác suất
• Phân tầng
(stratified random)
• Phân tầng ngẫu nhiên
theo tỷ lệ: Số phần tử trong
mỗi tầng tỷ lệ với quy mô của
mỗi tầng trong tổng thể.
• Phân tầng ngẫu nhiên
không theo tỷ lệ: Sử dụng
khi độ phân tán các phần tử
trong mỗi tầng khác nhau
đáng kể. Số phần tử trong
mỗi tầng được chọn phụ
thuộc vào độ phân tán của
biến quan sát trong các tầng.
21. Chọn mẫu xác suất
• Theo nhóm
(cluster)
• Tổng thể được chia làm
nhiều nhóm (mỗi nhóm mang
tính đại diện cho tổng thể) và
tuân theo nguyên tắc: “cùng
nhóm dị biệt, khác nhóm
đồng nhất”.
• Các nhóm sẽ được chọn
một cách ngẫu nhiên để tạo
thành mẫu.
22. Chọn mẫu xác suất
• Theo nhóm
(cluster)
• Có thể phân nhóm nhiều
bước: tiếp tục chọn nhóm
con trong nhóm và các phần
tử trong nhóm con, v.v.
(multi–stage cluster
sampling)
• Chọn mẫu theo khu vực
(area sampling): một dạng
của chọn mẫu theo nhóm,
với các nhóm được chia theo
khu vực địa lý.
Ví dụ:
23. Chọn mẫu
phi xác suất
• Lấy mẫu thuận tiện
(convenience)
• Chọn phần tử dựa trên
sự thuận tiện, dễ tiếp cận,
dễ lấy thông tin.
• Nhược điểm: Không xác
định được sai số lấy mẫu
và không thể kết luận cho
tổng thể từ kết quả mẫu.
• Sử dụng phổ biến khi bị
giới hạn về thời gian và chi
phí.
Ví dụ:
24. Chọn mẫu
phi xác suất
• Lấy mẫu phán đoán
(judgment)
• Nhà nghiên cứu tự phán
đoán sự thích hợp của các
phần tử để mời họ tham
gia vào mẫu.
• Đặc điểm giống như chọn
mẫu thuận tiện, nhưng nếu
khả năng/ kinh nghiệm
phán đoán tốt sẽ cho mẫu
tốt hơn thuận tiện.
Ví dụ:
25. Chọn mẫu
phi xác suất
• Lấy mẫu theo lớp/hạn
ngạch (quota)
• Dựa vào một số thuộc tính
kiểm soát xác định một số
phần tử sao cho chúng đảm
bảo tỷ lệ của tổng thể và
các đặc trưng kiểm soát.
• Sử dụng phổ biến nhất
trong thực tiễn nghiên cứu.
• Có thể dùng một hoặc
nhiều thuộc tính kiểm soát
như tuổi, giới tính, thu nhập,
loại hình DN, v.v.
Ví dụ:
26. Chọn mẫu
phi xác suất
• Lấy mẫu theo mầm
(snow ball)
• Chọn ngẫu nhiên những
người phỏng vấn ban đầu,
những người tiếp theo
được chọn dựa trên sự
giới thiệu của người trước.
Sử dụng thích hợp khi:
tổng thể ít, khó nhận ra các
đối tượng cần thu thập
thông tin.
Ví dụ:
27. Khái niệm và quá trình chọn mẫu
Chọn mẫu theo xác suất
Chọn mẫu phi xác suất
Xác định cỡ mẫu
28. Xác định sai số e
chấp nhận được
giữa ước lượng
của mẫu và
tổng thể
Xác định độ tin cậy
muốn có trong
ước lượng mẫu
nằm trong sai số e
Xác định giá trị Z
tương ứng với
độ tin cậy muốn có
đã quyết định
Ước tính
độ lệch chuẩn
của tổng thể
Dùng công thức
thống kê
tương ứng
Tính cỡ mẫu
Bước 1
Bước 5 Bước 4
Bước 6
Bước 3
Bước 2
29. Trường hợp tính theo biến liên tục (4 bước)
Bước 1: Xác định sai số e cho phép: phụ thuộc
vào độ nhạy của kết quả quyết định đối với biến
ước lượng đang khảo sát. (Thường 1/10-2/10
của đơn vị đo nhỏ nhất)
Bước 2: Xác định độ tin cậy muốn có (thường
chọn 95% Z=1.96)
30. Bước 3: Ước tính độ lệch chuẩn của mẫu (s)
bằng một trong 3 cách sau:
◦ Tiến hành nghiên cứu thí điểm, sử dụng độ lệch
chuẩn của kết quả nghiên cứu thí điểm.
◦ Dựa vào kết quả của những nghiên cứu trước đó
có mẫu tương tự
◦ Sử dụng công thức theo quy tắc 3 :
6
Min
Max
31. Bước 4: Sử dụng công thức tính mẫu:
Nếu n>10% tổng thể thì tính lại theo công thức:
2
2
)
*
(
e
S
Z
n
2
2
2
2
2
*
*
*
*
Z
S
e
N
S
Z
N
n
32. Ví dụ:
Bài toán cỡ mẫu trong khảo sát bình quân mỗi
tháng người dân Tp.HCM chi tiêu bao nhiêu tiền
cho thực phẩm.
Bài toán cỡ mẫu trong khảo sát sự thỏa mãn
của khách hàng với thang đo 1-7
33. Trường hợp tính theo tỷ lệ của mẫu
Z và e: Xác định tương tự như trên
Cỡ mẫu được tính theo công thức:
eø
e
Z
q
p
n
2
*
*
34. Nếu n >10% tổng thể:
Trong đó:
p: ước lượng tần số xuất hiện của hiện tượng
q = 1-p
Ước lượng sơ bộ giá trị p ?
2
2
2
*
*
*
*
*
*
Z
q
p
e
N
Z
q
p
N
n
35. Ví dụ:
Bài toán cỡ mẫu trong khảo sát xem bao nhiêu
% số hộ Tp.HCM có internet.
36. Cỡ mẫu trong chọn mẫu phi xác suất
Quyết định chọn mẫu phi xác suất thường được
thực hiện một cách chủ quan.
Yếu tố then chốt cho việc lựa chọn là thời gian
và tài chính.
37. Những lưu ý khi xác định cỡ mẫu
Khảo sát một và nhiều yếu tố/biến.
Tỷ lệ hồi đáp.
Phương pháp phân tích dữ liệu.
Sai lệch liên quan đến việc chọn mẫu gồm sai
lệch do chọn mẫu (do tính đại diện của mẫu) và
sai lệch không do chọn mẫu (xảy ra trong quá
trình phỏng vấn, hiệu chỉnh, nhập data,..).
38. Chọn người trả lời khi khảo sát một tổ chức.
Phương pháp chọn mẫu và kích thước mẫu
trong nghiên cứu cơ bản/lý thuyết.