Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Tạo form - Chuẩn bị dữ liệu
1. 11/23/20
1
TẠO FORM NHẬP SỐ LIỆU
KIẾM TRA, LÀM SẠCH VÀ MÃ HÓA SỐ LIỆU
BGTH1 TIN HỌC ỨNG DỤNG
KHOA Y TẾ CÔNG CỘNG
BỘ MÔN THỐNG KÊ Y TẾ – DÂN SỐ - SỨC KHỎE SINH SẢN
1
1
MỤC TIÊU
1. Cài đặt, làm quen với các màn hình chính trên SPSS.
2. Thực hành tạo form nhập liệu và nhập số liệu dựa vào các
thông tin trên phiếu thu thập thông tin giả định.
3. Thực hành nhập số liệu một số phiếu thu thập thông tin giả
định.
4. Thực hành làm sạch số liệu dựa trên một bộ số liệu có sẵn.
5. Thực hành mã hóa lại biến số từ những biến ban đầu dựa
trên một bộ số liệu có sẵn.
2
2
Cài đặt và giới thiệu phần mềm SPSS
Lịch sử
Ra đời 1968 à tập đoàn IBM mua lại vào 2009 à tiếp tục phát
triển cho đến nay.
Các phiên bản cài đặt
HĐH Windows:
- Máy tính cấu hình yếu: SPSS 11.5 à SPSS 15
- Máy tính cấu hình mạnh: SPSS 16 à SPSS 24
HĐH MacOS: SPSS for Mac
HĐH khác (linux,…): cài đặt trên máy ảo.
3
3
üMàn hình quản lý số liệu : Data view
üMàn hình quản lý biến số : Variable view
üMàn hình hiển thị kết quả : Output
üMàn hình cú pháp : Syntax
CÁC MÀN HÌNH CHÍNH TRÊN SPSS
4
4
2. 11/23/20
2
Màn hình quản lý số liệu (Data view)
Mỗi ô chứa giá trị quan sát
tương ứng với một biến và
một trường hợp
Mỗi hàng thể hiện một
trường hợp quan sát/
nghiên cứu
Mỗi cột thể hiện
1 biến số của
mẫu NC
5
5
Màn hình quản lý biến số (Variable view)
Mỗi hàng là
một biến số
Mỗi cột là 1
thông số
của biến số
6
6
Màn hình hiển thị kết quả (Output)
Nơi hiển thị kết
quả
Lệnh phân
tích File kết quả sẽ được lưu dưới
dạng .spo hoặc .spv tùy thuộc
phiên bản SPSS
7
7
Màn hình cú pháp (Syntax)
Nơi nhập, lưu trữ và thực hiện câu
lệnh
8
Lệnh phân
tích
8
3. 11/23/20
3
CÁC MENU CHÍNH TRONG SPSS
1. File: Lưu, mở, xuất số liệu
2. Edit: cắt, dán sao chép số liệu, biến số…
3. Data: lọc, sắp xếp số liệu, biến số…
4. Transform: mã hóa tạo biến số mới..
5. Analyze: phân tích số liệu
6. Graphs: vẽ biểu đồ
9
Thanh Menu
9
TẠO FORM NHẬP LIỆU
10
10
Phân loại biến số
Biến số định tính (Qualitative variable)
• Biến số danh mục (Nominal variable)
• Biến số thứ hạng (Ordinal variable)
• Biến số nhị phân (Binomial variable)
Biến số định lượng (Quantitative variable)
• Biến số định lượng rời rạc (Discrete variable/Non-continuous
variable)
• Biến số định lượng liên tục (Continuous variable)
• Biến số tỷ suất (Ratio variable)
• Biến số khoảng chia (Interval variable)
Quan hệ giữa các biến số
• Biến số độc lập (Independent variable)
• Biến số phụ thuộc (Dependent variable)
• Biến số gây nhiễu (Confounding variable)
11
11
• Câu hỏi một lựa chọn
Ø Người trả lời chỉ được chọn một trong những đáp án đã liệt
kê sẵn.
Ø Chỉ cần khai báo một biến duy nhất.
• Câu hỏi nhiều lựa chọn
Ø Người trả lời có thể chọn nhiều đáp án cùng lúc.
Ø Khai báo câu hỏi này trên SPSS lần lượt từng đáp án
một, mỗi đáp án là một biến số nhị phân.
12
Các dạng câu hỏi
12
4. 11/23/20
4
13
Các dạng câu hỏi
Câu hỏi
một lựa chọn
Câu hỏi
nhiều lựa chọn
13
• Các câu hỏi ràng buộc về mặt logic: Từ 2 câu hỏi trở lên có
ràng buộc với nhau về mặt logic từ đơn giản đến phức tạp.
• Câu hỏi có đáp án khác, ghi rõ: Ngoài những câu trả lời đã
được mã hóa trong phiếu điều tra, đối tượng nghiên cứu còn có
thể trả lời những đáp án khác không có trong phần được mã
hóa và ghi vào mục ghi rõ.
• Câu hỏi mở: là những câu hỏi chỉ có phần ghi chú để người trả
lời có thể ghi bất kỳ ý kiến nào liên quan đến câu hỏi.
14
Các dạng câu hỏi
14
15
Các dạng câu hỏi
Câu hỏi
Có đáp án
khác, ghi rõ
Câu hỏi
ràng buộc
về mặt logic
15
TẠO FORM NHẬP SỐ LIỆU
• Sử dụng màn hình quản lý biến số (Variable view)
• Mỗi hàng quản lý 1 biến số, mỗi cột chứa thông số liên quan đến
biến số đó
16
16
5. 11/23/20
5
Vari
1. Name (tên biến số): đại diện cho một biến số, lưu ý các quy tắc đặt
tên biến số.
2. Type (kiểu số liệu): cho biết biến số thuộc kiểu số, ký tự hay ngày
tháng…
3. Width (độ rộng): Giới hạn con số hoặc số ký tự được phép nhập vào
trong biến số hiện tại.
4. Decimals (số thập phân): Thể hiện phần thập phân ở những biến số
định lượng liên tục.
5. Label (nhãn biến số): giúp mô tả tên biến số rõ hơn, hiển thị trong các
câu lệnh và trong phần kết quả.
6. Values (Nhãn giá trị biến số): sử dụng đối với các biến số định tính đã
mã hóa.
Các thông số của biến số
17
17
7. Missing (giá trị khuyết): giá trị không thu thập được. Phân biệt giá trị
khuyết do người tạo form nhập liệu khai báo (User missing) và giá trị
khuyết do bỏ trống số liệu (System missing).
8. Columns (độ rộng cột): độ rộng của cột hiển thị tại màn hình Data view.
9. Align (canh lề số liệu): canh lề số liệu trái, phải, giữa tại màn hình Data
View.
10. Measures (thang đo): hiển thị dạng thang đo giá trị:
q Thang đo định danh (Nominal)
q Thang đo thứ bậc (Ordinal)
q Thang đo định lượng (Scale)
18
Các thông số của biến số
18
19
Form nhập liệu hoàn chỉnh
19
20
Nhập số liệu
Ô cần nhập
20
6. 11/23/20
6
LÀM SẠCH SỐ LIỆU
21
21
1) Lỗi bỏ trống số liệu (Missing): những ô bắt buộc phải nhập số liệu thì
lại bỏ trống; không có giá trị (phân biệt với trường hợp bỏ trống do sự
ràng buộc giữa các biến số).
2) Lỗi nhập sai giá trị đã mã hóa (Ví dụ: biến giới tính được mã hóa 1:
nam, 2: nữ nhưng số liệu lại có những giá trị 3, 4, 5…).
3) Lỗi logic giữa các biến số. (Ví dụ: Tình trạng hút thuốc là không hút
nhưng số điếu hút là 10 điếu/ngày. Bệnh nhân không có BHYT nhưng
mục thanh toán lại ghi là thanh toán bằng BHYT. Tuổi của đối tượng
nghiên cứu là 5 nhưng nghề nghiệp là cán bộ công chức).
Một số lỗi thông thường
22
Lọc số liệu
22
23
Lọc số liệu
Lỗi bỏ trống số liệu
Lỗi nhập sai giá trị đã mã hóa
23
24
Lọc số liệu
Lỗi logic
24
7. 11/23/20
7
25
Các bước làm sạch số liệu
Xác định vị trí
lỗi trong bộ
số liệu
Sử dụng các kỹ
thuật để phát hiện
lỗi trong bộ số liệu
Kiểm tra lại số liệu trên
phiếu phỏng vấn và sửa
lỗi số liệu trên phần mềm
25
• Sắp xếp số liệu (Sort Cases)
• Sử dụng bảng phân bố tần số (Frequencies)
• Sử dụng bảng mô tả (Descriptives)
• Sử dụng bảng chéo (Crosstabs)
• Lựa chọn các trường hợp (Select Cases)
• Tách tập số liệu (Split File)
• Lệnh tìm kiếm (Find)
26
Một số kỹ thuật làm sạch số liệu
26
Sắp xếp số liệu (Sort Cases)
§ Có thể sắp xếp giá trị của biến số theo thứ tự tăng dần hoặc giảm dần.
§ Phát hiện giá trị bỏ trống hoặc giá trị nhập sai.
§ Chọn lệnh Sort Cases theo đường dẫn Data à Sort Cases.
Biến số cần sắp xếp
Tăng dần
Giảm dần
27
Sắp xếp số liệu (Sort Cases)
Ví dụ 1: Sử dụng bộ số liệu thiếu máu ở vùng A, sắp xếp giá trị biến số tuổi
theo thứ tự tăng dần, các giá trị bỏ trống xuất hiện ở trên cùng hiển thị tại
màn hình Data View:
Ví dụ 2: Sử dụng bộ số liệu thiếu máu ở vùng A, sắp xếp giá trị biến số giới
tính theo thứ tự giảm dần, phát hiện giá trị nhập sai là 3 so với giá trị mã
hóa ban đầu (1. Nam và 2. Nữ) hiển thị tại màn hình Data View:
28
8. 11/23/20
8
Sử dụng bảng phân bố tần số (Frequencies)
§ Kiểm tra số liệu cho biến số định tính.
§ Phát hiện lỗi bỏ trống số liệu, lỗi nhập sai giá trị đã mã hóa.
§ Sử dụng câu lệnh Frequencies theo đường dẫn Analyze à
Descriptive Statistics à Frequencies. Đưa biến số cần kiểm tra vào
ô Variable(s) rồi nhấn OK.
§ Kết quả hiển thị ở màn hình Output:
Giá trị nhập sai
Giá trị bỏ trống
(trường hợp kiểu
biến số là String)
29
Sử dụng bảng mô tả (Descriptives)
§ Kiểm tra sơ bộ các biến số định lượng.
§ Phát hiện lỗi bỏ trống số liệu hay giá trị quá lớn hoặc quá bé so với
trung bình chung của tổng thể.
§ Sử dụng câu lệnh Descriptives theo đường dẫn Analyze à Descriptive
Statistics à Descriptives. Đưa biến số cần kiểm tra vào ô Variable(s)
rồi nhấn OK.
§ Kết quả hiển thị ở màn hình Output:
Bỏ trống 2 trường
hợp (so với mẫu
nghiên cứu là 600)
Giá trị quá lớn so với
trung bình độ tuổi là 5,88
30
Sử dụng bảng chéo (Crosstabs)
Biến số ở hàng
Biến số ở cột
§ Kiểm tra lỗi logic giữa các biến số.
§ Sử dụng câu lệnh Crosstabs theo đường dẫn Analyze à Descriptive Statistics à
Crosstabs.
Ø Đưa biến số Biết cân nặng lúc sinh của trẻ (bietcnls) vào cột (Column).
Ø Đưa biến số Cân nặng lúc sinh của trẻ (cnls) vào hàng (Row).
Ø Nhấn OK.
31
Sử dụng bảng chéo (Crosstabs)
Lỗi logic
32
9. 11/23/20
9
Lệnh tìm kiếm (Find)
33
Lệnh tìm kiếm (Find)
Bôi đen
biến cần tìm
Nhập giá trị
cần tìm
Chọn Entire cell nếu
muốn tìm chính xác giá
trị trong ô Find
Nhấn Find Next cho
đến khi tìm ra giá trị
cần tìm
34
1. Lựa chọn các trường hợp (Select Cases)
2. Chia tách số liệu (Split File)
à 2 lệnh này sẽ chỉ hiển thị trên màn hình chứa kết quả (Output) khi phân
tích số liệu
35
Lọc số liệu
35
36
Lựa chọn các trường hợp (Select Cases)
Tích chọn If
condition is
satisfied
Tích chọn
If…
36
10. 11/23/20
10
Lựa chọn các trường hợp (Select Cases)
Ô nhập điều kiện
cần lựa chọn
Lưu ý: nếu loại biến là string
thì giá trị đưa vào cần có
dấu ngoặc kép “ “
Các biểu thức so
sánh
37
38
Lựa chọn các trường hợp (Select Cases)
Lưu ý: nếu không sử
dụng Select Cases ta
trở lại lệnh Select
Cases và chọn All
cases hoặc nhấn nút
Reset.
38
39
Lọc số liệu
Chia tách dữ liệu (Split File)
Đưa biến vào
ô này để tách
nhóm dữ liệu
Kết quả sẽ được tách
theo nhóm nhưng nằm
trong một bảng
Kết quả sẽ được tách
theo nhóm và nằm ở các
bảng khác nhau
Nếu không dùng lệnh
Split File thì chọn lại
Analyze all cases
39
MÃ HÓA LẠI BIẾN SỐ
(RECODE)
40
40
11. 11/23/20
11
Có 2 phương pháp chủ yếu:
1. Mã hóa số liệu cũ (Old value) à số liệu mới (New value) à lưu trữ trên biến số
gốc (số liệu cũ bị mất).
(Recode into same variable)
2. Mã hóa số liệu cũ à số liệu mới à lưu trữ trên biến số mới (lưu ý khai báo biến
số mới ở phần Output Variable)
(Recode into different variable)
41
Mã hóa lại biến số (Recode)
ØThường sử dụng phương pháp 2 để tránh mất số liệu cũ.
41
Mã hóa lại biến số (Recode)
Recode into same variable Recode into different variable
Khai báo biến số
mới
42
Ví dụ: Chia chiều cao thành 4 nhóm
Nhóm 1: <75cm Nhóm 2: 75- <100cm
Nhóm 3: 100- <125cm Nhóm 4: ≥ 125cm
Sử dụng lệnh: Recode into different variable
43
Mã hóa lại biến số (Recode)
Ô chứa biến số
cần mã hóa
Đặt tên biến
số mới (lưu ý
quy định đặt
tên biến số)
Đặt nhãn biến
số
43
Mã hóa lại biến số (Recode)
Giá trị cũ Giá trị mới
44
12. 11/23/20
12
Mã hóa lại biến số (Recode)
Mã hóa một giá trị
nhất định (1, 2, 3, 4…)
Mã hóa từ …đến…
(VD: 10-15 tuổi)
Mã hóa giá trị nhỏ nhất đến…
(VD: < 5 tuổi ta nhập vào 4
hoặc 4.9999)
Mã hóa từ… đến giá trị lớn nhất
(VD: > 10 tuổi ta nhập vào 11 hoặc 10.0001)
Mã hóa những
giá trị còn lại
Nhập giá trị mới
Ô chứa các giá trị đã mã hóa
Sau khi khai báo giá trị cũ và
mới ta nhấn Add để đưa vào ô
này, nhấn Change để thay đổi,
nhấn Remove để xóa
Tích chọn để biến số mới có
dạng chuỗi (string)
45
Mã hóa lại biến số (Recode)
46
Mã hóa lại biến số (Recode)
47
Mã hóa lại biến số (Recode)
Sử dụng bảng tần suất (Frequencies để kiểm tra lại biến số mới sau khi mã hóa
- Tổng số trường hợp có đúng so với biến số cũ?
- Số nhóm có đúng như mã hóa?
48
13. 11/23/20
13
• Về nguyên tắc thực hiện giống với Recode into different
variable.
• Không khai báo biến số mới.
• Số liệu cũ sẽ bị mất.
Recode into same variables
49
Mã hóa lại biến số (Recode)
49