Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

20170225_Sample size determination

947 views

Published on

2017年2月25日
第9回医療者教育研究・臨床研究ネットワークリサーチ合宿
量的研究ワークショップ
九州大学 Kyusyu University, Fukuoka, JAPAN

Published in: Science

20170225_Sample size determination

  1. 1. 2017/02/25 医療者教育・臨床研究ネットワーク 量的研究WS サンプルサイズ設計の理論と実際 Sample size determination 12017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 京都⼤学⼤学院医学研究科 Kyoto University Graduate School of Medicine 医療統計学分野 / 医学教育推進センター Department of Biostatistics / Center for Medical Education 廣江 貴則 Takanori Hiroe(t-hiroe[at]umin.ac.jp)
  2. 2. Outline 1. Introduction 2. 要約統計量と効果量 ◦ 分散・標準偏差ってなんでしたっけ? ◦ 効果量と有意⽔準と検出⼒と 3. とりあえずソフトに慣れてみる ◦ G*PowerとRと… 4. ソフトがあっても難しいわけです ◦ 感度解析をやってみよう 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 2
  3. 3. Outline 1. Introduction 2. 要約統計量と効果量 ◦ 分散・標準偏差ってなんでしたっけ? ◦ 効果量と有意⽔準と検出⼒と 3. とりあえずソフトに慣れてみる ◦ G*PowerとRと… 4. ソフトがあっても難しいわけです ◦ 感度解析をやってみよう 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 3
  4. 4. Introduction(1/2) •昔はいい時代があった(らしい) • 「有意差が出ない?対象者を増やせ!」 • いまはそんなことは許されない • 増やせば精度が上がるので⼩さな差でも有意になる •現在は,事前に決めておくのがルール • 事後的に検証することも(実際どうだったか?) • サンプルサイズが既に決まっていることも • 決めるにはそれなりの根拠と度胸が必要 • 外したら… • てへぺろ☆(・ω<) 42017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  5. 5. Introduction(2/2) •数式だけでどうにか…なりません • パラメータのいくつかは当該分野の専⾨家が判断 • 臨床的・倫理的妥当性を⽰す⽅程式はない • 絶対的な「正解」は存在しない •サンプルサイズ設計は検定⼒分析の⼀⼿法 • α(有意⽔準),1-β(検出⼒),効果量, n • 4つのうち3つが決まれば1つが決まる • 実際にはもう少し計算は⾯倒ですけど • α,β,効果量を決めればサンプルサイズは計算可能 52017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  6. 6. 結局どんなことしてるの? •結論から先にいえば… • (プライマリー・エンドポイントに着⽬した) • 仮説検証のために必要な最低の数 を⾒積もりと計算によって求める作業 • 予想的中ならα=p(=0.05)となる • 最近はMultiple Endpointにも対応するけれど •複数のパラメータと統計的検定の⽅法に依存 • 検定統計量を求める式から逆算するイメージ • α,1-β,効果量がわかれば計算できる • 効果量は期待される差や標準偏差を⽤いて計算 62017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  7. 7. でも… •あくまでも計算結果です! •計算しただけですから,そのまま使えません •必要最低限の数なので,積み増す必要あり •最終的な数は計算結果とは異なります!! (念のため) 72017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  8. 8. Outline 1. Introduction 2. 要約統計量と効果量 ◦ 分散・標準偏差ってなんでしたっけ? ◦ 効果量と有意⽔準と検出⼒と 3. とりあえずソフトに慣れてみる ◦ G*PowerとRと… 4. ソフトがあっても難しいわけです ◦ 感度解析をやってみよう 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 8
  9. 9. 要約統計量 •平均値と中央値 • 加重平均とか2乗平均平⽅根(RMS)とか • 偶数個の場合の中央値はどう求める? •IQRは? • 最近よく論⽂でみかけますが • Interquartile range •となりの⼈同⼠で説明してみてください •認識は⼀致しましたか? 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 9
  10. 10. さて,と; •ところで,標準偏差ってなに? • 説明してみよう! • 正規分布で±2σが95%なのは「特性」 • 標準偏差が10ってどういうこと? •x={1,3,5,7,9}の分散と標準偏差 102017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH さ、教えてっ!
  11. 11. 効果量(1/4) •結構曖昧な概念(なので説明が難しい) •モノサシで測定可能な数字ではない •効果量そのものが意味を持つ場合はわずか • e.g. メタアナリシスの⼀部 •効果量:読んで字の如く,効果の⼤きさ • p値,信頼区間と並んで論⽂で報告が求められる • p値は効果の⼤きさを⽰さない! 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 11
  12. 12. 効果量(2/4) •80種類以上が提案されている • しかも同じ記号でも計算⽅法や意味が違ったり… • とりうる範囲は0以上,上限なし •効果量は経験的な「⽬安」 Cohen(1969) •誰の提唱したどの効果量なのか把握しておく • …と⾔いたいのだが,書いていないことも •効果量は「⼤」「中」「⼩」の3区分が多い • それぞれの場合の効果量がどこかに書いてある 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 12
  13. 13. 効果量(3/4) •効果量って必要? • 必要です(あると便利です) •あるテストをAクラスとBクラスで実施したところ 20点の差がありました。 • このテストが100点満点の場合と,1000点満点の 場合では,20点の重みは全く違う •p値だけではこの重みの違いを判断できない •標準化された指標が必要:そこで効果量を使う 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 13
  14. 14. 効果量(4/4) •効果量は80種類以上あるといったが… •諸説あるものの,⼤まかな分類は可能 1. d族 群間差(e.g.2変量の関係)に関する効果量 Cohenʼs d や Hedgeʼs g が有名 2. r族 変数間の関係の⼤きさに関する効果量 相関係数rが代表的 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 14
  15. 15. Cohenʼs d •2標本の差の効果量 •「平均値の差を⽣じさせる効果の⼤きさ」 •記述統計に基づく標準偏差を⽤いる 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 15
  16. 16. Hedgeʼs g •2標本の差の効果量 •推測統計に基づくPoolされた標準偏差 • でもdと書いてある⽂献が多い 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 16
  17. 17. 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 17 ⽔本・⽵内 (2008)より
  18. 18. αエラーとβエラー αエラー:Type Ⅰ errorとも ◦ 帰無仮説が正しいときに棄却してしまう ◦ ⼀般には研究実施側に有利 ◦ 研究を規制する側はこちらを⼩さくしたい βエラー:Type Ⅱ errorとも ◦ 帰無仮説が誤りなのに棄却できないと判定してしまう ◦ ⼀般には研究実施側に不利 ◦ 研究者はこちらを⼩さくしたい ◦ 1-βをとくに「検出⼒」と呼ぶ 2017/02/25 18 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  19. 19. 表で⽰すとこうなる 2017/02/25 19 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH αエラーの確率は有意水準を設定して制御 ◦ 一般的には5%がよく使われる ◦ 違う数字を使う場合はそれなりの根拠が必要 1−βを検出力と呼ぶ ◦ 帰無仮説が誤りのときに正しく棄却できる確率 検定の結果 帰無仮説採択 帰無仮説棄却 実際の状態 帰無仮説が正しい OK αエラー 帰無仮説が誤り βエラー(見落とし) 1−β(検出力)
  20. 20. α → 0,1­β → 1 は可能か α:帰無仮説が正しいのに(誤って)棄却する確率 1­β:帰無仮説が誤っているときに棄却できる確率 αを0にして,1­βを1にできれば理想 ◦ そんなことは可能か ◦ できなくとも近づけることはできないか 有意⽔準αと検出⼒1-βの関係って? 2017/02/25 20 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  21. 21. 有意⽔準αを0にする αを0にすることそのものは可能 帰無仮説が正しいのに誤って棄却する確率を0に ◦ 帰無仮説に関係なく,棄却しない(採択する) 問題が起きる 帰無仮説が誤っていても棄却されない ◦ βの値が1になるので,検出⼒(1­β)は⼩さくなる ◦ αを0にすると検出⼒が極端に低くなる 2017/02/25 21 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  22. 22. 検出⼒1­βを1にする 1­βを1にすることそのものは可能 つまり,βを0にすればよい 帰無仮説が誤っているのに採択してしまうのがβ ◦ 帰無仮説に関係なく,とにかく棄却する 問題が起きる 帰無仮説が正しくても棄却してしまう ◦ 有意⽔準αの値が⼤きくなる ◦ 検出⼒を上げることで,第⼀種の過誤確率が上がる 2017/02/25 22 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  23. 23. 有意⽔準と検出⼒の関係 有意⽔準を0にすると,検出⼒が下がる 検出⼒を上げると,有意⽔準が1となる ◦ 有意⽔準は⼩さい⽅がよい ◦ 検出⼒は⼤きい⽅がよい でも,結局トレードオフ ◦ どちらかをとれば,どちらかが失われる ◦ ⼀般に,αは5%でコンセンサスがとれている ◦ 検出⼒には限界があると覚えておけばよい 2017/02/25 23 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  24. 24. ここでクイズ •検出⼒0.2(かなり低い)で統計的検定をした ところ,p=0.020で有意となった。 •この結果の解釈のうち正しいものを全て選べ 1. 検出⼒が低いので結果の信⽤性は低い 2. 検出⼒が低くても有意なら帰無仮説を棄却 3. 検出⼒が低いのでα=0.01とすべき 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 24
  25. 25. それで… •ところで,標準偏差ってなんでしたっけ • 説明してみよう! 252017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH さ、教えてっ!
  26. 26. Outline 1. Introduction 2. 要約統計量と効果量 ◦ 分散・標準偏差ってなんでしたっけ? ◦ 効果量と有意⽔準と検出⼒と 3. とりあえずソフトに慣れてみる ◦ G*PowerとRと… 4. ソフトがあっても難しいわけです ◦ 感度解析をやってみよう 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 26
  27. 27. 計算に必要な情報 たとえば2群⽐較をやってみる 1. 有意⽔準 α:0.05が⼀般的 2. 検出⼒ 1­β:0.7〜0.9が⼀般的(だが,場合による) 3. ⽤いる検定の⽅法 4. それぞれの集団で予測される平均値/割合など 5. 効果量(必要な場合) 【平均の⽐較の場合】(これで効果量を計算することも) ◦ 検出したい差 δ:内容による ◦ 共通の標準偏差 σ(いくつか計算⽅法がある) 【割合の⽐較の場合】 ◦ 推定される各群の割合 ◦ 症例数の⽐ m 2017/02/25 27 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  28. 28. 数式は教科書にもあるが… 実際の計算はかなり⾯倒 ◦ ソフトウェアに任せるのが吉 ◦ 統計解析ソフトのほかに,専⽤のものもある ◦ 特殊なサンプルサイズ設計以外は⼿計算やプログラ ムを書いての計算はおすすめしない ◦ 分からなければ専⾨家に訊くとよい 計算結果の読み⽅に注意 ◦ 2群でその数字か,1群あたりの数字か ◦ 2群で154.3⼈という計算結果が得られた場合,端数 処理はどうする? 2017/02/25 28 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  29. 29. たとえば差 δ 臨床的に意味を⾒出せる差として扱うこともある 薬の効果を確かめたい • ⾎圧1mmHgの低下に意味がある? • たぶん20mmHgくらいないと意味がない • NRSが1下がることに意味は?(リ○カ®とか) 開発した教材の効果を確かめたい • 何点上昇すればいい?(10点,15点,20点…) • 関連する研究などを参考に研究者が設定 • 情報の受け⼿が納得できる数字であること 2017/02/25 29 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  30. 30. たとえば群の割合 どんな値をとるか予想する 対照群の数字も(予想であっても)必要になる 先⾏研究などを参考にして検討 ◦ 既に参考になる効果量がある場合などは利⽤ ソフトウェアによって⼊⼒させる項⽬が異なる ◦ 計算しているものは同じ(ただし微妙に異なることも) Windows版ならVanderbilt⼤学のPSが便利 ◦ Methodsのところにコピペできる⽂章を作ってくれる! http://biostat.mc.vanderbilt.edu/wiki/Main/PowerSa mpleSize 2017/02/25 30 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  31. 31. G*Powerを使ってみる 2017/02/25 31 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  32. 32. Test Familyを選択 1. Exact Fisherʼs Exact test・McNemar test・相関係数など 2. F tests ANOVA・MANOVA・回帰分析など 3. t tests t test・Wilcoxon testなど 4. χ^2 tests 5. Z tests 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 32
  33. 33. Type of power analysis 1. A priori:事前分析に⽤いる 2. Post hoc:事後分析に⽤いる 主に2つを使うが,別のものを⽤いてもよい (⼊⼒するパラメータが異なるだけ) 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 33
  34. 34. 例題1 •同⼀⼈物に対する模試の点数変化 •対応のある両側t検定 • α=0.05 • 検出⼒1-β=0.8 • Effect size d=0.5 • Cohenʼs dの「中程度」 • スライド17の表参照 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 34
  35. 35. こたえ1 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 35
  36. 36. 例題2 •e-Learning群と対⾯授業群の試験成績⽐較 • e-Learning群:74点 • 対⾯授業群:+8点 • 標準偏差(両群のデータをpool):25 •対応のない両側t検定 • α=0.05 • 検出⼒1-β=0.7 • ⼈数⽐ 1:1 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 36
  37. 37. こたえ2 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 37
  38. 38. 例題3 •クラス別の試験成績⽐較 • 効果量は中程度と⾒積もる •⼀元配置分散分析 • α=0.05 • 検出⼒1-β=0.7 • 3群⽐較(多重⽐較ではない) 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 38
  39. 39. こたえ3 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 39
  40. 40. Rを使ってみる 2017/02/25 40 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  41. 41. Rの基本的な操作 •CUIっぽいからといって⼼配する必要はない •加減乗除はそのまま⼊⼒すると計算できる •代⼊は “<-” 記号を使う • x <- 5 •複数のデータを⼊⼒する場合 c( )を使う • x <- c(1,2,3,4,5) •⾏列の場合 • x <- matrix(c(1,2,3,4), ncol=2, byrow=T) • ncolは⾏の数,byrow=Tは横に埋めていく 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 41
  42. 42. ほら,できた 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 42
  43. 43. これだけできると… •この表のデータを⼊⼒すると… •x <- matrix(c(10,15,20,20), ncol=2, byrow=T) • chisq.test(x);カイ⼆乗検定 • fisher.test(x);Fisherの直接確率検定 • (カイ⼆乗検定は直接確率検定の近似) 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 43 採用 不採用 計 男性 10 15 25 女性 20 20 40 計 30 35 65
  44. 44. ちょっと応⽤: CSVファイルの読み込み •作業ディレクトリの変更(確認)が必要 • Windowsは「ファイル」,Macは「その他」 •あとは取り込むだけ • x <- read.table(abc.csv, sep=”,”, header=TRUE) • 別にxでなくてもよい • テキストファイル(.txt)でもよい • sep=“¥t”と書くとタブ(空⽩)を認識 • 最初の⾏に変数名がないならheader=FALSE •やり⽅はネットに転がっているので覚えなくてOK 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 44
  45. 45. さあ,サンプルサイズ計算 •まずはRの標準機能から 1. power.t.test( );t検定 2. power.anova.test( );ANOVA 3. power.prop.test( );割合の検定 ⼊⼒すると下に⼩さく⼊⼒例が出るので安⼼ 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 45
  46. 46. power.t.test( ) •対応のないt検定 •例:power.t.test(n=NULL, delta=10, sd=20, sig.level=0.05, power=0.9) • n:サンプルサイズ • delta:2群の差 • sd:(Poolされた)標準偏差 • sig.level:有意⽔準α • power:検出⼒1-β •このうち求めたい箇所を「=NULL」とする 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 46
  47. 47. power.prop.test( ) •2群の割合の検定 •例:power.prop.test(n=NULL, p1=0.1, p2=0.3, sig.level=0.05, power=0.9) • n:サンプルサイズ • p1:グループ1の割合 • p2:グループ2の割合 • sig.level:有意⽔準α • power:検出⼒1-β •このうち求めたい箇所を「=NULL」とする 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 47
  48. 48. 例題4 •とある難関試験の対策講座 •⾒積もり • 受講したグループの合格割合: 30% • 受講しなかったグループの合格割合:10% •2群の割合の両側検定 • α=0.05 • 検出⼒1-β=0.8 • 受講したグループ:受講しないグループ=1:1 •2群合計で必要なサンプルサイズは? 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 48
  49. 49. こたえ4 •割合なので power.prop.test( )を使う •⼤⽂字・⼩⽂字の違いに注意 • 両側検定ではalternative以降は指定しなくてもOK 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 49 62×2=124
  50. 50. 例題5 •e-Learning群と対⾯授業群の試験成績⽐較 • e-Learning群:74点 • 対⾯授業群:+8点 • 標準偏差(両群のデータをpool):25 •対応のない両側t検定 • α=0.05 • 検出⼒1-β=0.7 • ⼈数⽐ 1:1 •例題2と同じ問題をRで求めてみる 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 50
  51. 51. こたえ5 •t検定なのでprop.t.testを使う 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 51 122×2=244
  52. 52. ライブラリを使ってみる •短いコマンドでひとまとめの処理ができる • 新たにプログラムを組まなくてもよい • ただし⽟⽯混交 • 妥当性の確認がとれていないものも • かわりにSASなどの商⽤ソフトより採⽤は早い •予めlibrary( )で読み込んでおく •マニュアルがあるので確認する • 指定すべきパラメータなどが全て書いてある 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 52
  53. 53. TrialSizeを使ってみる •Rを起動したら library(TrialSize) と⼊⼒ • これで使⽤可能になる • インストールしていないライブラリ使えない •関数はマニュアルを参照 • 標準の関数よりも圧倒的に種類が多い • 他にもpwrというライブラリもよく使われる •例:OneSampleProportion.Equivalence • あとでやってみる 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 53
  54. 54. TrialSizeのマニュアルより •OneSampleProportion.Equivalence 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 54
  55. 55. Outline 1. Introduction 2. 要約統計量と効果量 ◦ 分散・標準偏差ってなんでしたっけ? ◦ 効果量と有意⽔準と検出⼒と 3. とりあえずソフトに慣れてみる ◦ G*PowerとRと… 4. ソフトがあっても難しいわけです ◦ 感度解析をやってみよう 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 55
  56. 56. 決めうちはハイリスク パラメータの予測は予測でしかない ◦ 正確に予測するのは困難(無理!) ◦ 数字が動いたらどのくらい影響を受けるか (if〜thenの考え⽅) 予測を外した場合の影響の評価をする →感度解析(分析) ◦ 影響が⼤きい場合は慎重に検討 ◦ 現実的な数(妥協できる数)との⽐較検討 ◦ 無理なら試験中⽌,デザインの⾒直しなども 2017/02/25 56 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  57. 57. 感度解析(分析)とは 決め打ちをせずに決められたらいい(?) 条件が変化したときに最適解がどの程度変化するのか を計算して確認すること ◦ 標準偏差や割合の差,検出⼒が変化した場合に必要 なサンプルサイズがどの程度変化するか ◦ 統計解析が必要な様々な領域で利⽤される 完全な予測は優秀な統計家でも無理 ◦ でも被害は最⼩限に抑えたい ◦ ⽯橋を叩いて(時には壊れても)渡る 図や表を作成して検討することが多い 2017/02/25 57 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  58. 58. 台⾵の進路予測とか 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 58
  59. 59. 感度解析の例 複数のパターンで計算して,実現可能な数や検出⼒と 折り合いをつけて最終的なサンプルサイズを決める 2017/02/25 59 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 割合 検出⼒ 60% 70% 80% 20% 250 314 398 25% 126 158 200 30% 78 98 124 35% 54 68 86 40% 40 50 64 45% 32 38 48 例:2群の割合の⽐較,⽚⽅は10%固定で,1:1
  60. 60. パラメータはなんでもいい α,1-β,サンプルサイズ,効果量のうち3つを決めれ ば残りが決まる サンプルサイズの上限が初めからほぼ決まっている 場合も少なくないが,この場合でも感度解析は有効 ◦ 脱落が⽣じた時に検出⼒にどの程度影響するか ◦ 効果量が想定していたほどでなかった場合または 変化した場合に検出⼒にどう影響するか 2017/02/25 60 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  61. 61. ひとつひとつ計算していく •パラメータをひとつだけ段階的に変化させる • 複数のパラメータは同時に動かさない • クロス集計表もしくはグラフを描く •例題2を使って実践してみる • 「感度解析の例」のようなスライドを作る • 検出⼒(1-β)を0.6,0.7,0.8に変化 • 標準偏差(SD)を15,20,25,30,35に変化 • クロス集計表を作ってみる 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 61
  62. 62. 例題6(例題2改) •e-Learning群と対⾯授業群の試験成績⽐較 • e-Learning群:74点 • 対⾯授業群の増加点数:+2,+4,+6,+8,+10 • 標準偏差(両群のデータをpool):25 •対応のない両側t検定 • α=0.05 • 検出⼒(1-β)を0.6,0.7,0.8に変化 • 感度解析のためのクロス集計表を作成 •複数のパラメータを同時に動かさない 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 62
  63. 63. こたえ6 • Rによる計算のケース • power.t.test(n=NULL, delta=*, sd=25, sig.level=0.05, power=**) 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 63 増加点数* 検出⼒** 60% 70% 80% +2 3062 3860 4908 +4 768 968 1230 +6 344 432 548 +8 194 244 310 +10 126 158 200
  64. 64. G*Powerだと… •PowerPlotですぐに図が描ける 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 64
  65. 65. 例題7(例題4改) •サンプルサイズの上限が与えられている場合 • 減ったら検出⼒はどう変わるか •とある難関試験の対策授業 • 受講グループの合格割合: 20%, 30%, 40%と変化 • 受講しなかったグループの合格割合:10% •2群の割合の両側検定 • α=0.05,検出⼒1-β=0.8 • 受講したグループ:受講しないグループ=1:1 • 2群で最⼤80名(75, 70, 65, 60と変化) 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 65
  66. 66. 例題7(例題4改) •今度はG*Powerを使ってみる 2017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 66
  67. 67. それで… •ところで,標準偏差ってなんでしたっけ • 説明してみよう! 672017/02/25 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH さ、教えてっ!
  68. 68. まとめ サンプルサイズは「はっきり」決まるものではない 計算してからどうするかが重要 ◦ 数字が動いたらどのくらい影響を受けるか → 感度解析(分析)を必ず実施して評価 統計ソフトの利⽤ ◦ Rはコマンドに慣れてしまえばいろいろ便利 ◦ コマンドは憶えておく必要は(あまり)ない ◦ 直感的に操作できるソフトウェアも併⽤するとよい 2017/02/25 68 © 2017 TAKAORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH
  69. 69. お疲れさまでした 2016/04/20 © 2016 TAKANORI HIROE; DEPARTMENT OF BIOSTATISTICS, KYOTO UNIVERSITY SCHOOL OF PUBLIC HEALTH 69 研究がんばれっ! 今⽇の質問や解析のお悩み相談に応じます。 名刺が必要な⽅は声をおかけください。 hiroe.takanori.65w[at]kyoto-u.jp Facebook: takanorihiroe までどうぞ。

×