Data presentation short version

567 views
471 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
567
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
13
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Data presentation short version

  1. 1. TRÌNH BÀY DỮ KIỆN Đại học Y Dược Tp.HCM Bộ môn Dịch tễ học Nguyễn Văn Kính
  2. 2. Thế giới đã thay đổi như thế nào?Phương TâyÍt con, tuổi thọ cao?Thế giới thứ 3Đông con, tuổi thọ thấp?
  3. 3. MỤC TIÊU1. Mục đích của trình bày dữ kiện2. Hiểu bản chất của biến số và dữ kiện3. Kể tên, chọn đúng các phương tiện trình bày • Bảng • Đồ thị: tổ chức đồ, đa giác tần số, phân tán đồ • Biểu đồ: thanh, bánh, cột chồng, bản đồ. • Bản đồ4. Các lỗi thường gặp
  4. 4. Trình bày dữ kiện dịch tễ học{ CÁC KHÁI NIỆM CƠ BẢN
  5. 5. Giới thiệu Xác định, tìm hiểu,Trả lời câu hỏi Tổ chức, tóm nắm rõ sự phân bố, xu hướng và nghiên cứu tắt, và mô tả các mối liên quan So sánh các Các phát hiệnTruyền thông kếtquả nghiên cứu  nghiên cứu ngoài câu hỏidễ hiểu, dễ sử dụng khác, lí do nghiên cứu, khác biệt? âm tính
  6. 6. Biến số• Những hiện tượng, hoặc đặc tính, thay đổi từ người này sang người khác, hoặc thay đổi trên một người ở những thời điểm khác nhau.• Biến số định tính: – Biến số danh định: dân tộc, tôn giáo,… – Biến số nhị giá: bệnh, phơi nhiễm… – Biến số thứ tự: trình độ, thu nhập…• Biến số định lượng: – Biến số không liên tục: số con,… – Biến số liên tục: chiều cao,…
  7. 7. Biến số• Tên biến số, bản chất của biến số, các giá trị, định nghĩa các giá trị “Ngủ mùng (trong việc phòng chống sốt xuất huyết dengue) là một biến số không liên tục, có hai giá trị là đúng và không đúng. Một bà mẹ có thực hành ngủ mùng đúng khi cho con ngủ mùng cả ban ngày lẫn ban đêm; và sai khi không cho con ngủ mùng, hoặc cho con ngủ mùng chỉ ban đêm hoặc ban ngày” Nguyễn Đỗ Nguyên – NCKH trong Y Khoa
  8. 8. Chia nhóm biến số• Phụ thuộc câu hỏi nghiên cứu – Tỉ lệ hay trung bình – Nhóm tuổi với HC Down và mang thai.• Loại trừ• Bỏ sót thông tin/sai lệch
  9. 9. Chia nhóm biến số Cholesterol máu Tần số Phần trăm 100-119 2 0.96 120-139 2 0.96 140-159 6 2.87 160-179 33 15.79Cholesterol máu Tần số Phần trăm100-199 79 37.8 180-199 36 17.22200-299 118 56.46 200-219 40 19.14300-399 12 5.74 220-239 29 13.88Tổng 209 100 240-259 27 12.92 260-279 13 6.22 280-299 9 4.31 300-319 11 5.26 320-339 0 0 340-359 0 0 360-379 1 0.48 Tổng 209 100
  10. 10. Chia nhóm biến số• Dựa vào cách phổ biến• Có ý nghĩa về mặt tự nhiên, sinh học (hút thuốc lá)• Chia theo – Số lượng bằng nhau, – Dựa vào TB và SD – Theo phạm vi dãy số
  11. 11. Trình bày số đo thống kê{105, 110, 112, 115, 227}• Trung bình• Độ lệch chuẩn (SD)• Hệ số biến thiên (CV)• Trung vị• Tứ phân vị• Sai số chuẩn (SE)
  12. 12. Trình bày dữ kiện dịch tễ học{ CÁC PHƢƠNG TIỆN TRÌNH BÀY
  13. 13. Bản đồ• Thể hiện sự phân bố theo địa dư• Phát hiện các ổ dịch.• Có hai loại: – Bản đồ điểm: ghi nhận số ca bệnh theo nơi chốn – Bản đồ vùng: tỷ suất mắc bệnh ở những vùng khác nhau.
  14. 14. Bản đồ điểmPhân bố bệnh phổi do Histoplasmosis tại Austin, USA, 1984
  15. 15. Tóm tắt Loại Công dụng Gấp khúc Biến thiên số liệu định lượng theo thời gian Tổ chức đồ Biểu thị biến liên tụcĐồ thị Đa giác tần số Dạng đặc biệt của tổ chức đồ Phân tán Tương quan giữa hai biến định lượng So sánh tần số, tỷ lệ giữa các nhóm của một biến định tính Hình thanh So sánh giá trị trung bình của các biến định lượngBiểu đồ Hình bánh So sánh các tỷ lệ các loại của một biến định tính Hình cột chồng So sánh tỷ lệ các loại của biến định tính ở nhiều quần thểBản đồ Phân bố bệnh, hiện tượng sức khỏe theo địa dư.
  16. 16. Ba cách trình bày dữ kiện• Nguyên văn• Bảng• Hình ảnhCPCordero 20 11/16/2011
  17. 17. Trình bày dữ kiện dịch tễ học{ TRÌNH BÀY NGUYÊN VĂN
  18. 18. Xem cách trình bày sau STT Bệnh nhân Kháng Isoniazid (INH) Rifampicin 1 (-) (-) 2 (+) (+) 3 (+) (+) 4 (+) (+) 5 (-) (-) 6 (+) (-) 7 (+) (+) 8 (+) (+) 9 (-) (+) 10 (+) (-)11/16/2011 Nguồn: CPCordero 22
  19. 19. …cách tốt hơn “Ba trong số mười bệnh nhân được kiểm tra kháng với INH, bốn bệnh nhân kháng với Rifam. Có hai bệnh nhân kháng với cả INH and Rifam.”23 Nguồn: CPCordero 11/16/2011
  20. 20. Trình bày nguyên văn• Bộ dữ kiện nhỏ (ít biến số, đối tượng)• Nhấn mạnh và đưa ra so sánh.• Đơn giản và thích hợp khi chỉ có 1 vài số liệuCPCordero 24 11/16/2011
  21. 21. Trình bày dữ kiện{ BẢNG
  22. 22. Đặc điểm• Trình bày dữ kiện định tính, định lượng• Mô tả phân bố, ngoại lệ, khác biệt, mối liên quan• Không bị bỏ sót dữ kiện.• Cơ sở cho các phương tiện khác
  23. 23. Bảng• Đơn giản• Tự giải thích – Tiêu đề: Số thứ tự, cái gì, ở đâu, khi nào, (thế nào) – Mô tả dữ kiện trình bày (không phải mục tiêu trình bày) – Đặt trên bảng• Cột và hàng có tựa đề, đơn vị đo lường, tổng• Chú thích ký hiệu, viết tắt, mã hóa, nguồn dữ kiện thứ cấp• Có thể so sánh với các báo cáo khácCPCordero 27 11/16/2011
  24. 24. Bảng 1 biến sốBảng n. Tình trạng mắc giang mai sơ cấp và thứ cấp theo tuổi, USA, 1989 BệnhNhóm tuổi Tần số Phần trăm≤14 230 0.515-19 4378 9.920-24 10405 23.625-29 9610 21.830-34 8648 19.635-44 6901 15.745-54 2631 6.0≥55 1278 2.9Tổng 44081 100**Khác 100% do làm tròn Nguồn: CDC – Epi. course
  25. 25. Bảng 1 biến sốBảng n. Tình trạng mắc giang mai sơ cấp và thứ cấp theo tuổi, USA, 1989 BệnhNhóm tuổi Tần số Phần trăm Phần trăm cộng dồn≤14 230 0.5 0.515-19 4378 9.9 10.420-24 10405 23.6 3425-29 9610 21.8 55.830-34 8648 19.6 75.435-44 6901 15.7 91.145-54 2631 6.0 97.1≥55 1278 2.9 100Tổng 44081 100* 100*Khác 100% do làm tròn Nguồn: CDC – Epi. course
  26. 26. Bảng 2,3 biến số
  27. 27. Bảng n biến số
  28. 28. Bảng 2x2Mô tả, tính toán mối liên quan, kiểm định ý nghĩa thống kê BỆNH TỔNG Có KhôngPHƠI Có a b a+bNHIỄM Không c d c+d a+c b+d a+b+c+d
  29. 29. Bảng 2x2
  30. 30. Bảng câm• Dummy/Shells table BỆNH p PR(KTC 95%) Có Không Có - - -- -- (-- - ---)PHƠI NHIỄM Không - - - -
  31. 31. Trình bày dữ kiện dịch tễ học{ BIỂU ĐỒ - ĐỒ THỊ
  32. 32. Các bước vẽ• Xác định biến số trình bày• Xác định thang đo cho biến số – Trục tung: biến độc lập – Trục hoành: biến phụ thuộc• Xác định loại đồ thị/ biểu đồ – thể hiện mối liên quan hay mô tả – Phân độ đo lường của các biến số• Dán nhãn, không quên tiêu đề11/16/2011 CPCordero 36
  33. 33. ĐỒ THỊ• Trình bày dữ kiện định lượng• Tổng thể, tính khuynh hướng, tương quan.• Các loại thường dùng: 1. Đồ thị gấp khúc 2. Tổ chức đồ 3. Đa giác tần suất 4. Phân tán đồ. 5. Tần số tích lũy 6. Đường cong sống
  34. 34. Đồ thị gấp khúc 100 Biểu diễn thay đổi của số đo theo thời giansố mới mắc 90 90 80 73 70 60 58 50 42 40 30 16 24 20 15 14 8 10 2 10 7 0 1 2 3 4 5 6 7 8 9 10 11 12 tháng Hình 6.2. Số ca mới mắc SXH Dengue tại thị xã, phân bố theo tháng, năm 1997
  35. 35. Đồ thị gấp khúcSố ca mắc /100.000 dân Tỉ suất mắc sởi theo thời gian, USA, 1950-1989 Sử dụng Vắc xin Năm
  36. 36. Tổ chức đồ (histogram)60 • Tần số của biến số liên tục. • Cột không có khoảng cách40 • Cho biết phân bố của biến số20 0 5,000 10,000 15,000 20,000 25,000 Volume (thousands)
  37. 37. Đa giác tần số (frequency polygon) Số ca mắc bệnh giống cúm theo tuần khởi bệnh Tổ chức đồ Đa giác tần suất Số ca Điểm giữa tổ chức đồ Tuần khởi bệnhĐiểm nối với giữa khoảng trước Điểm nối với giữa khoảng tiếp theo
  38. 38. Nhân trắc trẻ Haiti tử 24-59.9 tháng so với dân số tham chiếu của CDC, 1990 Dân số tham chiếuPhần trăm Cân nặng theo chiều cao Chiều cao theo tuổi Cân nặng theo tuổi Điểm Z tham chiếu
  39. 39. Đồ thị tần số tích lũy(Cumulative frequency) Số mới mắc tích lũy VGSVB theo thời gian có hành vi nguy cơ cao Phần trăm nhiễm Tiêm chích ma túy Quan hệ đồng giới NVYT-Tiếp xúc máu thường xuyên Quan hệ đồng giới với nhiều bạn tình Số năm nguy cơ
  40. 40. Đường cong sống (Survival Curves)Đường cong sống của đoàn hệ bệnh nhân mắc các động mạch ngoại vi(PAD) và không mắc PAD, Pittsburgh, Pennsylvania, 1977-1985 (n=262)Xác suất sống (%) Không PAD Có PAD Năm
  41. 41. Đồ thị phân tánNồng độ huyết thanh của tetrachlorodibenzo-p-dioxon (TCDD) điều chỉnh theo lipid,trên 253 công nhân, theo số năm phơi nhiễm với 12 hóa chất nông nghiệp, USA,1987 • Tương quan hai biến Nồng độ TCDD (pg/g lipid) số định lượng không xếp nhóm.
  42. 42. 50 60 70 80 0 50 100 4 Avg. annual % 2 growth 0 80 70 Life expectancy 60 at birth 50 40000 GNP per 20000 capita 0100 50 safewater 0 0 2 4 0 20000 40000
  43. 43. Nguyên tắc trình bày đồ thị• Không lạm dụng• Có tựa rõ ràng đặt ở dưới đồ thị.• Các trị số phải có tên gọi và đơn vị• Chú thích rõ ràng, cụ thể về nguồn gốc dữ kiện, thang đo.• Tần số trình bày trên trục đứng, xếp lớp trên trục ngang• Thang đo lường biểu thị bởi đơn vị bằng nhau trên các trục.• Trục tần số phải bắt đầu bằng 0. Dùng (---) nếu không trình bày vị trí của 0.
  44. 44. BIỂU ĐỒ• Trình bày dữ kiện không liên tục• Biến danh định, thứ tự• 4 loại thường gặp: – Hình thanh – Hình bánh – Hình cột chồng – Hình hộp
  45. 45. Biểu đồ hình thanh120 Tăng huyết áp10080 Hút thuốc lá60 Nam40 Nữ Uống rượu20 Béo phì 0 <5 năm 6-7 8-11 >11 năm năm năm 0 2 4 6 Hình 29. Tỷ lệ cao huyết áp theo trình độ học Hình 30. Gánh nặng của các yếu tố nguy cơ tử vong vấn, Nam Phi.1998, số liệu giả định ở nhóm nước đang phát triển, số liệu giả định
  46. 46. Biểu đồ cột chồngChi tieu cong va tu cho giáo dục cấp III, USA, 1999Chi tieu cong va tu trong giao duc cap III, 1999 Chi tiêu công-tư trong giao duc cap III, 1999 So sánh tỷ lệ của một United States United States biến số Sweden Sweden giữa các Netherlands Netherlands Ireland Ireland nhóm Germany Germany khác nhau France France Denmark Denmark Canada Canada Britain Britain Australia Australia 0 20 40 60 80 100 percent 0 .5 1 1.5 2 2.5 Public Private Public PrivateNguon: OECD, Tong quan Giao duc 2002Nguon: OECD, Tong quan Giao duc 2002
  47. 47. Biểu đồ hình bánh (pie chart) 5% • Tỉ lệ các giá trị thành 27% phần của một 30% nhóm/biến số. 38% Cấp 1 Cấp 2 Cấp 3 Đại học
  48. 48. Biểu đồ hình hộp (Box-plot) Đáp ứng điều tri theo gioi Dap ung dieu trị theo giới 120 benh nhan tien phau Phân phối dữ180 kiện của biến số160 định lượng liên tục140 (trung vị, độ120 Before After Before After lệch) Male Female Nguon: Thu nghiem thuoc, Stata Corp, 2003
  49. 49. Chọn phương tiệnLoại biến số Dạng số liệu thu thập Cách trình bày Số ca (vụ dịch, ghi nhận Số liệu của 1-2 Tổ chức đồ sau một thời gian theo nhómGhi nhận theo thời dõi) 2 nhóm trở lên Đa giác tần sốgian Tỷ suất Đồ thị gấp khúcBiến liên tục, ghi Tổ chức đồnhận không theo thời Phân bố theo tần suất Đa giác tần sốgian Biểu đồ hìnhBiến không liên tục (danh định, thứ tự) thanhGhi nhận không theo nơi chốn Biểu đồ hình bánh Biểu đồ hình Không cần xác định thanh trên bản đồGhi nhận theo nơi Số ca bệnh Cần xác định trên bản Bản đồ điểmchốn đồ Bản đồ vùng Tỷ suất Bản đồ vùng
  50. 50. Trình bày dữ kiện dịch tễ học{ MỘT SỐ LỜI KHUYÊN
  51. 51. • Chọn màu thể hiện bản chất biến số nếu có thể• Tránh tương phản đỏ và xanh lá cây (10% khán giả nam có mức độ mù màu nhất định)* *Epi Course, CDC
  52. 52. Phân nhóm quá nhiều• 4-8 cho bảng• 3-6 cho đồ thị, biểu đồ• Nhiều hơn 5 hoặc 7 thông tin là quá nhiều – liên quan đến trí nhớ ngắn hạn 57
  53. 53. Sử dụng 3DCa báo cáo và ca xác định bại liệt theo năm, châu Mỹ, 1985-1989 Xác định Số ca Báo cáo Năm
  54. 54. Sử dụng 3DCa báo cáo và ca xác định bại liệt theo năm, châu Mỹ, 1985-1989 Xác định Số ca Báo cáo Năm
  55. 55. Sử dụng 3DPhần trăm mắc lao theo chủng tộc, USA, 1989 (n=23.495) Gốc Ấn và Bản địa Gốc Á, TBD Non-Hispanic Da đen Hispanic Non-Hispanic Da trắng (32.6)
  56. 56. Sử dụng 3DPhần trăm mắc lao theo chủng tộc, USA, 1989 (n=23.495) Gốc Ấn và Bản địa Gốc Á, TBD Non-Hispanic Da đen Hispanic Non-Hispanic Da trắng (32.6)
  57. 57. Không có cơ sởtƣơng đối khi so sánhTần số % 300 80 70 250 60 200 50 150 40 30 100 20 50 10 0 0 1 2 3 4 Năm học 1 2 3 4 Năm học Số sinh viên đạt loại khá các năm học
  58. 58. “Nén” số liệu trên trục tung $ $250 80 70200 60150 50 40100 30 2050 10 0 0 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4
  59. 59. Sử dụng kí hiệu• Đọc kí hiệu luôn khó hơn đọc chữ• Phải tìm thông tin giải thích về số liệu Y=1 1 job/sec Service rate Y=3 3 jobs/sec  Y=5 5 jobs/sec  Arrival rate 64
  60. 60. KẾT LUẬN• Không có chuẩn tuyệt đối & cứng nhắc• Nên tuân thủ theo 1 số nguyên tắc chung• Tùy đối tượng phục vụ, tùy mức độ nội dung muốn truyền tải  chọn phương tiện & văn phong
  61. 61. Trình bày dữ kiện dịch tễ học{ THẮC MẮC

×