Your SlideShare is downloading. ×
0
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
0103 a
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
583
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
10
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 2013/01/03 SAS實習課許景淳 honli1027@gmail.com
  • 2. Outline• PROC FREQ語法• CHISQ – 獨立性檢定 & 適合度考驗• Fisher’s exact test• 二項分配比例檢定• Kappa一致性係數
  • 3. 常用格式PROC FREQ; TABLES a*b / options; RUN; 選擇要用的檢定 選擇要分析的變數
  • 4. options• CHISQ: 計算卡方檢定的統計量• FISHER: 進行Fisher’s exact test• BINOMINAL: 檢定二項分配的比例值• AGREE: 計算Kappa一致性係數
  • 5. CHISQ的功用• 獨立性檢定• 適合度考驗 – CHISQ TESTP=(P1 P2 P3) 輸入理論值的機率 – CHISQ TESTF=(N1 N2 N3) 輸入期望值
  • 6. 例題-獨立性檢定• 隨機抽取200位已婚男子,根據其教育程度與子女 個數進行分類,結果如下: 0~1個 2~3個 4個以上國中及以下 14 39 30 高中職 19 42 17大學及以上 12 12 15• 試檢定教育程度與子女個數是否有關
  • 7. PROC FORMAT; VALUE IF 1="國中及以下" 2="高中(職)" 3="大學及以上"; VALUE JF 1="0-1個" 2="2-3個" 3="4個以上";RUN;DATA A; DO i = 1 TO 3; DO j = 1 TO 3; 分別定義量化後的 INPUT number @@; OUTPUT; 教育程度和子女個數 END; END; LABEL i="教育程度" j="子女數目"; FORMAT i IF. j JF.;CARDS;14 39 30 19 42 17 12 12 15;RUN;PROC FREQ; TABLES i*j / CHISQ; WEIGHT number; TITLE "父親教育程度與其擁有子女數的卡方統計量";RUN;
  • 8. DATA A; DO i = 1 TO 3; DO j = 1 TO 3; INPUT number @@; OUTPUT; END; i j number END; 1 1 14LABEL i="教育程度" j="子女數目"; 1 2 39 FORMAT i IF. j JF.; 1 3 30CARDS; 2 1 1914 39 30 19 42 17 12 12 15 2 2 42;RUN; 2 3 17 3 1 12 3 2 12 3 3 15
  • 9. Results
  • 10. Pr > 0.05 代表沒有顯著差異,Retain H0
  • 11. 例題-適合度考驗• 某兩種生物交配可產生三種基因型的後代(AA, Aa, aa),根據遺傳理論可知此三類型比例應為1:2:1, 某研究員使此兩生物交配後所得100隻後代的基因 型如下表: 基因型 AA Aa aa 觀察值 18 55 27• 試考驗這些資料是否符合遺傳理論
  • 12. DATA temp1;INPUT type $ number @@;CARDS;A 18 B 55 C 27;RUN;PROC FREQ; TABLES type / chisq testp=(0.25 0.50 0.25); WEIGHT number; TITLE 基因型比例之適合度考驗;RUN; 輸入理論值的機率 若使用期望值,則改用 testf=(25 50 25)
  • 13. Results Pr > 0.05 表示沒有顯著差異 Retain H0
  • 14. EXACT的功用• 當樣本數較少(<20)或細格期望值<5時 傳統的檢定統計量可能無法趨近卡方分配 此時可用Fisher’s exact test求得精確統計量• 若有發生上述現象,SAS 系統會顯示警告
  • 15. 例題-Fisher’s exact test• 研究員想探討果蠅眼睛顏色與食物種類是否有關, 他記錄了57隻果蠅,結果如下: 白眼 紅眼 玉米粉培養基 2 23 洋菜粉培養基 2 30• 試考驗果蠅眼睛顏色與食物種類是否有關
  • 16. DATA a; INPUT food $ color $ number;CARDS;corn white 2corn red 23agar white 2agar red 30;RUN;PROC FREQ; TABLES food*color / chisq; 可改為fisher,結果不變 WEIGHT number;RUN; 目前的SAS版本偵測到 細格期望值< 5時,會自 動進行Fisher’s exact test
  • 17. Results
  • 18. Pr > 0.05表示沒有顯著差異Retain H0
  • 19. 例題-BINOMINAL• 某社區管理委員會想了解居民對某政策的 贊成比例,因此隨機調查100位居民,結果 有45人贊成• 試推估贊成比例的95%信賴區間,以及贊成 比例是否超過四成?
  • 20. DATA a; INPUT answer count; 如果沒輸入此選項CARDS; 會有不同的結果1 450 55;RUN;PROC FREQ order=data; WEIGHT count; TABLES answer / binomial(p=0.40) alpha=0.05;RUN;題目敘述四成比例 因為95%區間 故使用0.05
  • 21. ResultsPr > 0.05表示沒有顯著差異Retain H0
  • 22. DATA a; INPUT answer count; 拿掉order=data此選項CARDS; 比較兩次分析的結果1 450 55;RUN;PROC FREQ order=data; WEIGHT count; TABLES answer / binomial(p=0.40) alpha=0.05;RUN; order=data 將資料依照輸入時的順序輸出 order=freq 將資料依照次數多寡排列輸出 (系統預設使用 order=freq)
  • 23. Results變成檢定不贊成的比例因為預設的變數排列順序是根據次數由多到少,而不贊成的次數較多 ,故會產生此不同結果Pr < 0.05表示有顯著差異Reject H0
  • 24. AGREE的功用• Kappa可以用來評估評分者間的一致性 例如醫生對病人的診斷• 然而我們會懷疑這個醫生是否會誤診 這時可以請另一位醫生對同一病人進行診斷• 如果這兩位醫生(沒有互相影響的狀況下)的 診斷完全一致,便意味著評分者偏誤存在的 可能變小了
  • 25. 例題-AGREE• 兩位醫師對 39 位高燒病人的診斷結果如下: 醫師B 流感 瘧疾 醫師A 流感 22 2 瘧疾 4 11• 試計算兩位醫師診斷的一致性
  • 26. DATA a; INPUT Dr_A$ Dr_B$ count;CARDS;Influenza Influenza 22Influenza Malaria 2Malaria Influenza 4Malaria Malaria 11;RUN; 表示醫師A和醫師B皆診斷為流感PROC FREQ; 的人數有22人,以下以此類推 WEIGHT count; TABLES Dr_A*Dr_B / agree;RUN;
  • 27. ResultsFleiss(1971):
  • 28. 練習題
  • 29. • 研究員想了解某種寄生蟲是不是對特定種類的螃 蟹有偏好,以下是從 Yaquina Bay (Oregon, US)採集 的紅蟹(Red crab)和黃金蟹(Dungeness crab)樣本: 寄生蟲 有 無 紅蟹 5 312 黃金蟹 0 503• 這兩種螃蟹身上發現該種寄生蟲的機率是否相同
  • 30. DATA a; INPUT crab $ parasite $ number;CARDS;Red yes 5Red no 312Dungeness yes 0Dungeness no 503;RUN;PROC FREQ; TABLES crab*parasite / chisq; WEIGHT number;RUN;
  • 31. ResultsPr < 0.05表示有顯著差異Reject H0
  • 32. • 研究者以 100 名學童為受試者,每人都接受左右 腦側化測驗和左右利手測驗,結果如下表所示: 左利手 右利手 左腦型 12 6 右腦型 17 65• 請考驗腦側化和左右利手之間是否獨立。• 若兩個變項間並非獨立,則兩者關聯性是多少?
  • 33. DATA a; INPUT brain $ hand $ number;CARDS;Left Left 12Left Right 6Right Left 17Right Right 65;RUN;PROC FREQ; TABLES brain*hand / chisq; WEIGHT number;RUN;
  • 34. Results Pr < 0.05 表示兩者並非獨立相關程度約為 0.39
  • 35. • 根據某遺傳理論,某種果蠅的四種亞型在母群中 呈現多項分配,其比例為 9 : 3 : 3 : 1 。• 若研究者觀察到的記錄如下:亞型 退化翅(R) 截短翅(T) 微型翅(M) 粉紅眼(P)觀察值 59 20 11 10• 試檢驗是否符合該比例
  • 36. DATA a;INPUT mutation$ number@@;CARDS;R 59 T 20 M 11 P 10;RUN;PROC FREQ order=data; TABLES mutation / chisq testf=(56.25 18.75 18.75 6.25); WEIGHT number;RUN;
  • 37. Results Pr > 0.05 表示沒有顯著差異 Retain H0
  • 38. PROC FREQ order=data; TABLES mutation / chisq testf=(56.25 18.75 18.75 6.25); WEIGHT number;RUN; 會造成完全相反的推論 要注意資料排列是否有誤
  • 39. • 下表為烏克蘭兩地區於1987~1995年間,銫-137 (137 C s )在大氣中的濃度變化: 1987 1988 1989 1990 1991 1992 1993 1994 1995L36 2.1 1.8 1.8 1.7 1.7 1.6 1.5 1.5 1.5M16 4.5 3.0 2.3 1.9 1.6 1.4 1.3 1.2 1.1• 這兩個地區 137 C s 濃度的變化情形是否相同? 將其中一個地區當做理論值 另一個地區當做觀察值即可
  • 40. Results
  • 41. • 虛骨龍、嗜鳥龍和長臂獵龍的外表相似,過去曾 使古生物學家混淆過,兩名古生物學家對一系列 化石做了鑑定,結果如下: 古生物學家B 虛骨龍 嗜鳥龍 長臂獵龍古生物學家 虛骨龍 21 6 3 A 嗜鳥龍 9 15 4 長臂獵龍 1 9 12• 請計算兩人的鑑定一致性
  • 42. PROC FORMAT; VALUE IF 1="虛骨龍" 2="嗜鳥龍" 3="長臂獵龍"; VALUE JF 1="虛骨龍" 2="嗜鳥龍" 3="長臂獵龍";RUN;DATA A; DO i = 1 TO 3; DO j = 1 TO 3; INPUT number @@; OUTPUT; END; END; LABEL i="古生物學家A" j="古生物學家B"; FORMAT i IF. j JF.;CARDS;21 6 3 9 15 4 1 9 12;RUN;PROC FREQ; WEIGHT number; TABLES i*j / agree;RUN;
  • 43. Results一致性尚可Landis, J. & Koch, G. G. (1977):
  • 44. END

×