2. Mô tả biến số định tính(nominal)/có thứ
tự(ordinal)
• Bảng tần suất, Tỷ lệ %, KTC 95% của tỷ lệ
• Biểu đồ cột, pie
• AnalyseDescriptiveFrequency:
• Charts: Bar chart (hoặc Pie chart)
• Thực hành:
• race
• ht, smoke
• nhecan
• KTC 95%: bootstrapperform
• Nhecan: tỷ lệ 31,2%, KTC 95% 24,9 – 38,1
3. KTC 95% của tỷ lệ theo Wald
• p +/- 1.96*sqrt(p*(1-p)/N)
• Ví dụ:
• N = 189, p = 31.2
• Tính KTC95% của ht:
• N=189, p=6.3
5. Mô tả biến số định lượng
• AnalyzeDescriptiveFrequencies:
• Chọn biến số: bwt
• Statistics:
• Charts: Histogram, check Normal curve
Đánh giá phân bố chuẩn:
Tỷ số |skewness|/SE skewness <2 và
Tỷ số |kurtosis|/SE kurtosis <2
Nếu phân bố chuẩn, báo cáo trung bình và độ lệch chuẩn: 2945 ± 729
Nếu phân bố không chuẩn, báo cáo thêm trung vị
6.
7. Ví dụ báo cáo tuổi (age)
Phân bố không chuẩn vì tỷ số skewness > 2
Báo cáo 23,2 +/- 5,3 ; trung vị 23
8. Mô tả biến số định lượng bằng Explore
• AnalyzeDescriptiveExplore
• Statistics: percentiles
• Plots: Histogram và Normality plot with test
Kiểm định phân bố chuẩn: Shapiro có p>0,05 thì phân bố chuẩn
12. KTC 95% của trung bình (công thức Wald)
• Mean ± 1.96*SE hoặc
• Mean ± 1.96*SD/sqrt(N)
• Ví dụ: KTC 95% của bwt
• Có mean = 2944.656085, SD = 729.022417, N = 189
• Tính KTC95%:
• Lower bound =2840.72
• Upper bound =2944.656085+1.96*729.022417/sqrt(189) = 3048.59
• Ví dụ: KTC 95% của lwt biết mean=129.81, SD=30.579, N=189
• 125.45 – 134.17
13. Compute
• LOWBW.sav: Chia tuổi mẹ (age) làm 3 nhóm tuổi
• <18 1
• 18 – 34 2
• >=35 3
• Cho biết số bà mẹ ở mỗi nhóm tuổi: 25, 159, 5
• Cho biết số bà mẹ da trắng ở mỗi nhóm tuổi: 7, 85, 4
• Transformcompute
• Target: nhomtuoi
• Expression: (age<18)*1+….
• AnalyzeDescriptiveFrequencies: nhomtuoi
14. Compute
• Chia cân nặng sơ sinh bwt làm 3 nhóm (nhombwt):
• <2500 1
• 2500 – 3000 2
• >3000 3
• Cho biết số ss ở mỗi nhóm cân nặng: 59, 38, 92
• Cho biết số ss da đen ở mỗi nhóm cân nặng: 11, 7, 8
• Cho biết số ss da đen bà mẹ không cao huyết áp ở mỗi nhóm cân nặng:
• DataSelect: if: race=2 & ht=0
• AnalyzeDescriptiveFrequencies: nhombwt
• 9, 7, 7
15. So sánh tỷ lệ
• Lowbw.sav
• So sánh tỷ lệ hút thuốc (smoke) ở các chủng tộc (race)
• AnalyzeDescriptiveCrosstab
• Row race (biến độc lập/nguyên nhân/có trước)
• Column smoke
• Cells: Percentages: row
• Statistis: Chi square, Risk
• Exact: Exact
• Display clustered bar chart
• 0 cells (0.0%) have expected count less than 5. The minimum expected count is 10.18. Thỏa điều kiện X2
<20% >1
16. Bài tập so sánh tỷ lệ
• So sánh tỷ lệ nhẹ cân (nhecan) ở người da trắng và người da
đen(race~=3 hay race=1 | race =2), chỉ xét bà mẹ không hút
thuốc(smoke=0)
• Select : if race~=3 & smoke=0
• Select : if (race=1 | race=2) & smoke=0
• Crosstab: nhecan, race row
• Không thỏa điều kiện X2 nên đọc Fisher Exact: p = 0.048 < 0.05
• Đây là bảng 2x2 nên đọc OR: OR= 4.55, KTC 95% của OR: 1.04 – 19.86
17. Bài tập so sánh tỷ lệ
• So sánh tỷ lệ nhẹ cân giữa các chủng tộc?
• Trả lời: p = 0.082 ? (X2) khác biệt giữa các tỷ lệ không có YNTK
• So sánh tỷ lệ nhẹ cân giữa các chủng tộc chỉ xét bà mẹ không hút?
• Trả lời: p = 0.007? (X2) khác biệt giữa các tỷ lệ có YNTK
• Hút thuốc là yếu tố nhiễu khi so sánh nhẹ cân với chủng tộc
• Các yếu tố nhiễu khác: cao huyết áp, cân nặng của mẹ,…
• Để tránh ảnh hưởng các yếu tố nhiễu dùng phân tích đa biến
18.
19. So sánh trung bình
• So sánh tuổi bà mẹ da trắng và da đen?
• Explore:
• 0.002 < 0.05: ko PBC
• NonParametric:
• P=0.019 (Mann Whitney)
• khác biệt có YNTK
20. So sánh trung bình
• So sánh cân nặng sơ sinh (bwt) của bà mẹ da trắng(race=1) và da
đen(race=2)?
• Explore:
• 0.486>0.05: pbc
• 0.804>0.05: pbc
• T-test:
• Levene: p=0.367>0.05
• hàng trên:
• t=2.446,df=120, p=0.016
• có YNTK
21. So sánh > 2 trung bình
• So sánh cân nặng sơ sinh (bwt) ở 3 chủng tộc (race) ở các bà mẹ
không cao huyết áp
• Select case: ht=0
• Explore:
• Các kiểm định Shapiro Wilk đều
có p >0.05
• One Way ANOVA:
• ANOVA có p = 0.022 khác biệt có YNTK cần đọc Post Hoc
• Kiểm định phương sai có p=0.292 >0.05 phương sai đồng nhất (đọc Tukey hoặc LSD)
• LSD cho biết:
• White~Balck: p = 0.028
• White~Other: p= 0.024
22. So sánh >3 trung bình
• Lọc ht=0.
• So sánh Lwt ở 3 chủng tộc
• Explore:
• Shapiro Wilk có p<0.05
• NonParaLegacyK independent:
• Kruskal Wallis có p = 0.006 khác biệt có YNTK
23. Hồi quy tuyến tính
• IVF2.sav
• Trực quan hồi quy tuyến tính:
• GraphLegacyScatter-Dot (đồ thị điểm, đồ thị phân tán): SimpleDefine
Tính r và cho biết chiều hướng, mức độ
tương quan
r = sqrt(0.544) = 0.738
Chiều hướng: thuận
Mức độ: mạnh
Lưu ý: nếu đồ thị đi xuống, thêm dấu – (dấu
trừ) cho hệ số r
24. Hồi quy tuyến tính đa biến
• Tlssinh với tuoithai, tang_ha, gioi
• Hệ số tương quan Pearson:
25. Đánh giá mô hình
• Adj R^2 < R^2
• Diễn giải: R^2 = 0.565 được diễn giải là “56,5% biến thiên của tlssinh
được giải thích bởi tuoithai, tang_ha, gioi”
• nghĩa còn 45,5% do các yếu tố khác như cân nặng mẹ, nghề
nghiệp, … và yếu tố ngẫu nhiên.
26. Điều kiện áp dụng hồi quy tuyến tính
• ANOVA có p < 0.05
28. • Tlssinh với tuoithai, tang_ha, gioi, tudo, congnhan
• Tlssinh với tuoithai, tang_ha, gioi, vienchuc, congnhan
29. Phương trình dự báo
• Tuổi thai = 39
• Tăng ha
• Bé gái
• 2985 gr
30. OR và RR
• Giáo trình: trang 101
• Tính OR và RR về ảnh hưởng cao huyết áp lên nhẹ cân
• Số chênh ở bà mẹ không cao huyết áp: odd1 =52/125=0.416
• Số chênh ở bà mẹ cao huyết áp: odd2 =7/5=1.400
• Tỷ số chênh OR = odd2/odd1 =3.365
• Tỷ lệ nhẹ cân ở bà mẹ không cao huyết áp: p1=52/177=0.294
• Tỷ lệ nhẹ cân ở bà mẹ cao huyết áp: p2=7/12=0.583
• Tỷ số nguy cơ RR=p2/p1=1.986
31. Ý nghĩa RR = risk ratio
• Xác suất nhẹ cân ở bà mẹ cao HA gấp 1.98 lần so với xs nhẹ cân ở bà
mẹ không cao HA nguy cơ nhẹ cân ở bà mẹ cao HA gấp 1.98 lần so
với bà mẹ kho cao HA
• Giống RR và OR:
• RR > 1 OR >1
• RR < 1 OR < 1
• RR = 1 OR = 1
• Diễn giải OR: nguy cơ nhẹ cân ở bà mẹ cao HA hơn so với bà mẹ không cao
HA với tỷ số chênh OR = 3,37
• Nếu tỷ lệ mắc bệnh rất thấp thì RR bằng với OR
33. • Omnibus test có p < 0.05: mô hình phù hợp
• Classification table: khả năng dự báo mô hình
• Độ nhạy: 8/(28+8)=22.2%
• Độ đặc hiệu: 95/(95+6)=94.1%
• Tỷ lệ đúng: (95+8)/(95+6+28+8)
• =75.2%
34. • Bmd có OR=0.030 OR<1: bmd tăng (tăng 1 đơn vị) thì nguy cơ gãy
xương giảm (vì thấy OR<1) với tỷ số chênh là 0.030
• Hay nếu bmd giảm đi 1 đơn vị thì nguy cơ gãy xương tăng lên với tỷ
số chênh OR=33,3
36. Tính OR khi thay đổi đơn vị đo
• Nếu bmd tăng 0.1 đơn vị thì nguy cơ gãy xương giảm với tỷ số chênh
OR = exp(B*0.1) = 0.705
• Nếu bmd giảm 0.1 đơn vị thì nguy cơ gãy xương tăng với tỷ số chênh
OR = 1.42
37. Dự báo gãy xương
• Bmd=0.4 và ictp=10 tính xác suất gãy xương (=0,988 ở L9)
38. Dự báo gãy xương
• Bmd=1.4 và ictp=2 tính xác suất gãy xương (=0.01 ở M3)
39. Khả năng dự báo
• ROC của bmd và ictp trong dự báo gãy xương?
• Ictp: AUC = 0.722, KTC 95% 0.623 – 0.822
• Bmd: AUC = 0.585, KTC 95% 0.474 – 0.696
• Ngưỡng Ictp để kết luận gãy xương?
40. So sánh AUC
• Hình trái: có thể so sánh Hình phải: không so sánh được