神戸大学政治学研究会2015年12月例会報告資料
一部の表が見にくい場合は
http://www.JaySong.net/wp-content/uploads/2015/12/Kobepolisci_Conjoint.pdf
をご参照下さい。
( PDF version is also available in http://www.jaysong.net )
神戸大学政治学研究会2015年12月例会報告資料
一部の表が見にくい場合は
http://www.JaySong.net/wp-content/uploads/2015/12/Kobepolisci_Conjoint.pdf
をご参照下さい。
( PDF version is also available in http://www.jaysong.net )
15. 検定力分析における効果量の設定
母集団効果量の設定がもっとも難しく,検定力
分析の肝になる。
① 先行研究やメタ分析から効果量を設定する
② 実践的・理論的な観点から,必要とされる効果
量を設定する
③ パイロットスタディから効果量を設定する
④ Cohenの効果量の大きさの基準(小・中・大)
から効果量を設定する
※①〜③が推奨されている。
Murphy, K.R. et al. (2009). Statistical power analysis;Aberson, C.L. (2010).
Applied power analysis for the behavioral sciences.
15
16. 検定力分析はしなきゃだめですか?
YES!!!
CONSORT声明(RCT)
Item7a How sample size was determined.
STROBE声明(観察研究)
Item10 Explain how the study size was
arrived at.
日本のうつ研究は5本に1本しか適切な検定力
を有してない!(Okumura & Sakamoto,
2011)
16
21. 例数設計
論文記載例
Using χ2 statistic, power estimates for detecting differences in
treatment response in the 4 groups・・・(検定力分析での仮定) (1)
Ha:P(fluoxetine)=.60, P(CBT)=.60, P(fluoxetine+CBT)=.80, and P(placebo)=.40; (2)no
adjustment for loss to follow up; (3)no adjustment for multiple
comparisons; and (4)α level of .05 for a 2-tailed test. Under these
assumptions, 108 patients per treatment group (N=432) were needed to
achieve 80% or greater power to detect a difference of .20 in response
rates between any 2 treatment groups.
検定力分析
想定を元に,効果量を出すとw=0.2886751だった。
pwr.chisq.test(w = 0.2886751, N = NULL, df = 3, sig.level = 0.05, power =
0.8) →N = 130.8308 あれ?432名もいらないぞ。
しかし,下線を考慮すると97名以上欲しい。
power.prop.test(n=NULL,p1=0.60,p2=0.40,sig.level=0.05, power=0.80)
→n = 96.92364
21
26. 解析事例:青年期うつ病の薬物療法に心
理療法を追加する効果について
(BMJ, 335(7611), 2007)
TADSの結果からNational Institute for Health
and Clinical Excellence (NICE)では,青年期
うつ病には認知行動療法(CBT)が選択肢の
1つになっている。
抗うつ薬単独より,認知行動療法併用が良
いようだけど,結果が一貫してない。
今回は、青年期のうつ病に対する認知行動
療法の併用効果について無作為化比較試
験(薬物単独vsCBT併用)を行った。
26
27. 例数設計
論文記載例
We used the outcome score to determine sample size. Data from
the development study and overdose study suggested that 3
points on the total score scale was clinically important
difference(先行研究より3点差に臨床的な意味がある). With a
sample size of 100 in each arm we would have 94% power to
detect a difference of this magnitude with a two tailed 0.05
significant level, assuming a common SD of 6.0 points(d=3/6=0.5
になる).
検定力分析
pwr.t.test(n=100,d=0.5,sig.level=0.05,power=NULL)
→power = 0.9404272
確かに、サンプルサイズが100あれば、検定力は0.94になる。
27
36. 例数設計
論文記載例
(前提として、頭部外傷による死亡は15%)Because even a 2%
survival difference would be clinical important(効果量の決定
根拠),・・・・A trial of 20000 patients would have a good chance
of showing a 2% survival difference at covincing levels of
significance - ie, more than 90% power to achieve p<0.01(検
定力分析により2万人が必要).
検定力分析
power.prop.test(n=NULL,p1=0.15,p2=0.13,sig.level=0.01,
power=0.90) →n = 8954.919
各群8955名必要で、全体で17910必要。特に記載してないけど、2万
名だと全体の10%ほど脱落しても、17910名おり、上記の検定力が保
証される。
36
40. 参考文献
書籍
① Cohen, J. (1988). Statistical power analysis for the behavioral
sciences, Psychology Press.
② Murphy, K.R. et al. (2009). Statistical power analysis, Routledge.
③ Aberson, C.L. (2010). Applied power analysis for the behavioral
sciences, Routledge.
④ 永田靖 (2003). サンプルサイズの決め方, 朝倉書店.
*①が読みにくかったので,②と③を結構参考にしました。そして安いです。
論文
Cohen,J.(1992). A power primer, Psychological Bulletin, 112 (1),
155-159.
Okumura, Y. & Sakamoto, S. (2011). Statistical power and effect
sizes of depression research in Japan. Psychiatry and Clinical
Neurosciences, 65 (4), 356-364.
40