介入効果のメタ分析
専修大学人間科学部心理学科
国里愛彦
日本心理学会第79回 シンポジウム「現場に役立つ心理学(5):
研究・実践の効果を測定するための研究デザインとデータ分析」
メタ分析とは
過去の研究を系統的・批判的に検討して,
量的・統計的に統合する方法。
非系統的レビュウによるメタ分析は,エビ
デンスとして価値がなく有害!
→実験・調査の片手間にできるものでない!!!
メタ分析の手順
①問題の定式化
②文献検索
③研究の選択・データベース化
④個々の研究のバイアス評価
⑤結果の統合
⑥バイアスの検討
⑦メタ分析の質の評価と解釈
メタ分析の手順
①問題の定式化
②文献検索
③研究の選択・データベース化
④個々の研究のバイアス評価
⑤結果の統合
⑥バイアスの検討
⑦メタ分析の質の評価と解釈
問題の定式化
• PICOを用いて問題を定式化する
Patient:対象患者(どういう患者か?)
Intervention:介入方法(どういう介入か?)
Comparison:対照群の設定(誰orどの介入と比較?)
Outcome:効果指標(何を指標とするか?)
※アウトカムは,患者にとって重要な結果(最大7個)。
※プライマリーアウトカムは最大3個(少なくとも1個の効果,1個の副作用)。
セカンダリーアウトカムは,効果の説明に有効な追加的なアウトカムである。
• PICOを元に適格基準を作成する
メタ分析の手順
①問題の定式化
②文献検索
③研究の選択・データベース化
④個々の研究のバイアス評価
⑤結果の統合
⑥バイアスの検討
⑦メタ分析の質の評価と解釈
文献検索の方法
① 電子データベース検索
• 使用データベース:CENTRAL, MEDLINE, EMBASEなど包括的な
DB+問題に沿ったDBを複数使う(心理系ならPsycINFO)。
• データベースに合わせた検索式を作成:基本は①患者+介入
(必要に応じてアウトカム)&②研究デザイン(基本はRCT)
• 論理演算子(AND, OR, NOT)やSearch filterも活用し、検索過
程が再現できるように記録を残す
②検索用語付与・引用サービス検索(Web of Scienceなど)
③ハンドサーチ(手作業で論文を探す)
④灰色文献の調査(公的機関や製薬会社の未公表データ)
⑤臨床試験登録システムを用いて,未公表データや実
施中のデータにも注意する
メタ分析の手順
①問題の定式化
②文献検索
③研究の選択・データベース化
④個々の研究のバイアス評価
⑤結果の統合
⑥バイアスの検討
⑦メタ分析の質の評価と解釈
研究の評価・選択とデータベース化
• 論文の評価・選択過程
①文献管理ソフトで管理し,重複論文を削除
②タイトル・アブストから関連しない論文を削除
③論文の全文を入手し、同じ研究から出た複数の報告を結合
④適格基準に合うかどうか全文で検討
⑤必要に応じて,適格基準に合致するか確認するため著者連絡
※評価と選択について、複数評定者での一致率(Kappa)を算出
• メタ分析で必要な情報をデータベース化
→Excelでも良いが、コクランではRevManを推奨
研究の選択過程の報告方法
• PRISMA声明のフロー
ダイアグラムを使うこ
とで、研究の選択過程
での文献数や除外理
由などをまとめる。
Moher et al. (2009). Preferred reporting
items for systematic reviews and meta-
analyses: the PRISMA statement. PLoS
Medicine, 6(7), e1000097.
データベース検索か
ら得られた文献数
他のソースから得ら
れた追加的な文献数
重複文献削除後の文献数
除外した
文献数
除外した全文
文献数と理由
質的統合に含めた文献数
量的統合(メタアナリシス)
に含めた文献数
スクリーニングした文献数
適格性を評価した全文文献
数
特
定
ス
ク
リ
ー
ニ
ン
グ
適
格
性
研
究
に
含
め
た
も
の
メタ分析の手順
①問題の定式化
②文献検索
③研究の選択・データベース化
④個々の研究のバイアス評価
⑤結果の統合
⑥バイアスの検討
⑦メタ分析の質の評価と解釈
研究の質の評価
バイアスをアセスメントする6つの基準
領域 判断(YES, NO, Unclear)
①割り付けの順番の作成 割り付けの順番は適切に作成されている
か?
②割り付けの隠蔽 割り付けの隠蔽は適切にできているか?
③参加者,職員,効果評
価者の盲検
研究実施中に,割り付けられた介入が分
からないようできていたか?
④不完全なアウトカム
データ
不完全なアウトカムデータがちゃんと記
述されているか?
⑤選択的なアウトカムの
報告
選択的なアウトカムの報告が示唆される
ようなことはないか?
⑥その他のバイアス その他のバイアスのリスクはないか?
YES(基準を満たしている)、NO(基準を満たしていない)、
Unclear(YESかNOか判断するだけの情報がない)を判断
①割り付けの順番の作成は適切か?
②割り付けの隠蔽はできているか?
• 割付けを曜日,誕生日,カルテ
番号で行うような乱数生成
→無作為化が崩れるので、乱数表,
乱数生成ソフトなどの適切な乱数
生成を使う。
• 研究への組み入れ担当者が,次
に組み入れる患者がどちらの群
に割り振られるのか知っている
(もしくは患者にバレている)
→割付表を意識した組み入れとな
り、選択バイアスが生じるので、適
切な隠蔽を行う(中央登録割付、封
をした封筒の利用など)
組み入れ担当者
実は、新しい治療の効
果を調べる研究が・・・
今日は月曜なので、プラセ
ボ群か・・・この人は元気そ
うだし大丈夫かな
13
③参加者,職員,効果評価者の盲検はで
きているか?
• 患者、治療者、アウトカムの
報告者、評価者、データ解析
担当者が,患者がどの群に
割付けられたか分かった状
態(盲検化していない)。
→盲検化してないと、どの治療
をうけたかの情報によって評価
が変わる情報バイアスが生じ
る可能性がある。
*心理療法だと患者と治療者
の盲検化が不可能なので、少
なくともアウトカムの報告者、
評価者の盲検化。
この人は、すごく効く
と噂の新しい治療を
受けた人か。確かに、
よく効いている気が
するな・・・
評価者 14
④不完全なアウトカムデータは適切に記載
されているか?
• 治療や追跡調査からの脱落者
が報告されていない。もしくは、
報告されているが、脱落に対し
てIntention to treat (ITT)解析な
どを行っていない。
→効いている患者のみが脱落しな
い可能性もあり、バイアスが生じる
参加者(200名)
治療群
(100名)
プラセボ群
(100名)
治療群
(60名)
プラセボ群
(90名)
ランダム化
治療群の脱落多
いけど、気にせ
ず統計解析にか
けちゃお〜
*ITT解析とは、割付けられた
治療から逸脱or脱落に関わ
らず、当初割付けた群に基
づいて解析を実施すること。
治療 プラセボ
15
⑤選択的なアウトカム報告が疑われない
か?
• 研究計画書に記載されて
いるにもかかわらず,論文
で報告されるアウトカムが
選択的である。
→良い結果だけを報告してお
り、効果の確信度を低める
0
1
2
3
4
5
6
7
8
9
治療群 プラセボ群
効果に差のあったア
ウトカム5だけを報
告すればいいね。余
裕、余裕。
16
バイアスのリスクアセスメントのまとめ
• 各研究のバイアスリスクをアセスメントして、以下のよ
うな図にまとめる。
• バイアスリスク評価後の対処
①質の低い一次研究(適格基準外)は除外する
②感度分析をする(質の低い研究を含む・含まないを比較
してエビデンスの頑健性を確認)
③一次研究の質に応じて重み付けをする
→質が低なりがちな領域で①は難しい。②が推奨。
メタ分析の手順
①問題の定式化
②文献検索
③研究の選択・データベース化
④個々の研究のバイアス評価
⑤結果の統合
⑥バイアスの検討
⑦メタ分析の質の評価と解釈
メタ分析で使用する効果量
<2値データ>
①リスク差=介入群の比率-統制群の比率
②NNT(Number needed to treat)=1/|リスク差|
③リスク比=介入群の比率/統制群の比率
④オッズ比=[介入群の比率/(1-介入群の比率)]/[統制群の比率/(1-統
制群の比率)]
※メタ分析では,リスク比とオッズ比(相対リスク)を用いるが,結果の解釈ではリ
スク差やNNT(絶対リスク)に変換する
<連続データ>
①平均値差=介入群の平均値-統制群の平均値
②標準化平均値差=(介入群の平均値-統制群の平均値)/プー
ルされた標準偏差
※Cochraneでは、Hedges’ gが使用される(unbiasedが推奨)
フォレストプロット(forest plot)
Watanabe et al., Acta Psychiatr Scand, 2007
■は,個々の研究の効果。重み付けが多いほど,大きく表示。横
棒は95%信頼区間(真ん中の縦線null valueをまたぐと統計的には
有意でない)。◆は,メタ分析によって統合された効果量。
効果量の統合:メタアナリシス
• メタアナリシス:個々の研究から得られた介入効果
を重み付けして平均する分析
• メタ分析では、固定効果モデル(General variance-
base法)やランダム効果モデル(DerSimonian-Laird
法)などがあるが、基本的には重み付け平均であ
り、介入効果の前提が異なるだけ。
M =
WiYi
i=1
k
å
Wi
i=1
k
å
重み付け平均=
(効果×重み付け)の合計
重み付けの合計
ランダム効果モデルと固定効果モデル
• 固定効果モデル:1つの真の介入
効果を仮定しており,偶然誤差の
影響によって個々の研究結果が
ばらつくとするモデル
→異質性が高いデータには不適切
• ランダム効果モデル:研究ごとに
真の介入効果を仮定しており,偶
然誤差と研究間の効果の差によっ
て,個々の研究結果がばらつくと
するモデル
→異質性が高いデータにも適用でき
るが、検出力は固定効果モデルより
落ちる。
異質性 (Heterogeneity)
• 異質性:個々の研究の効果の大きさが異なること
• 臨床的・方法論的異質性:①臨床的異質性(患者集
団の違い:年齢,性別,人種,重症度など)、 ②
方法論的異質性(研究デザインの違い:治療,治療
期間,エンドポイント,治療者の経験など)
• 統計学的異質性:Cochrane’s QやI2などの指標によ
り統計学的に明らかとなる異質性(I2が推奨)
I2 解釈
0~40% 異質性は問題でないかも
30~60% 中程度の異質性があるかも
50~90% 実際に異質性があるかも
75~100% 無視できない異質性の大きさ
異質性によって、サブグ
ループ分析やメタ回帰分析
の実施、もしくは「メタ分析を
実施しない」を決める。
メタ分析の手順
①問題の定式化
②文献検索
③研究の選択・データベース化
④個々の研究のバイアス評価
⑤結果の統合
⑥バイアスの検討
⑦メタ分析の質の評価と解釈
①視覚的評価
Funnel plotの非対称性
縦軸:研究精度(nなど)
横軸:効果量
出版バイアスの評価
出版バイスなし 出版バイアスあり
0
100
200
300
400
500
600
0 1 2
0
100
200
300
400
500
600
0 0.5 1 1.5
効果あり←
サ
ン
プ
ル
サ
イ
ズ
②統計学的検定
Rank correlation test (Begg, Biometrics, 50, 1088-1101,1994)
Linear regression test (Egger, BMJ, 315, 629-634, 1997)
※Funnel plotの左右対称性を検定する(有意だと対称ではない)
→出版バイアスがある場合は、Trim-fill法などで調整
効果あり←
ポジティブな結果はネガティブな結果よりも発表されやすい
→治療効果の過大評価
メタ分析の手順
①問題の定式化
②文献検索
③研究の選択・データベース化
④個々の研究のバイアス評価
⑤結果の統合
⑥バイアスの検討
⑦メタ分析の質の評価と解釈
メタ分析の質の評価
• メタ分析によるエビデンスの質や推奨度の評価には,
GRADEシステムが有用
※評価はアウトカムごとに行う。GRADE(Grades of Recommendation,
Assessment, Development and Evaluation:http://www.gradeworkinggroup.org/)
質 研究デザイン ダウングレード アップグレード
高:推定された
効果が真の効果
に近い強い確信
RCT(RCTのメタ
分析)
1.デザインや実施における限界
2.結果の間接性(比較が間接的・限
定的な結果)
3.説明できない異質性や結果の不一
致
4.結果の不正確さ(広いCI)
5.出版バイアスの確率が高い
深刻な問題(1ランクダウン)
非常に深刻な問題(2ランクダウン)
1.大きな効果
2.交絡因子のた
め,効果が過小
評価されている
3.用量-反応勾配
状況によって,1
〜2ランクアップ
中:中程度の確
信
ダウングレー
ドされたRCT
低い:確信は限
定的
観察研究
非常に低:確信
がほとんどない
ケースレポー
トなど
メタ分析の結論
• メタ分析の結論は,①患者・臨床家への示唆
と②今後の研究への示唆に分けられ,以下の
4つの要因を考慮して行う。
Eddy, JAMA, 263, 441-443, 1990
価値と選好
(患者の価値や治療選好は
どうか?)
資源の利用
(その治療は利用可能?)
利益と害のバランス
(害やコストはどのくらいで,効
果はどのくらい?)
エビデンスの質
(そのエビデンスは信頼で
きる?)
Take Home Message
① 臨床的疑問を明確化して、包括的な文献検索をする。
② 文献検索と選択/評価過程は再現可能にする。
③ 6つのポイントから介入研究の質を評価し、全体として
のエビデンスの質を評価する。
④ 適切な効果量とモデルを決めて、異質性を考慮して、
データ統合する。
⑤ メタ分析から得られたエビデンスの質を評価して、推奨
度を提示する。
※以下のSlide shareも参照ください
「メタ・アナリシスの入門」 ( http://goo.gl/gUv4d5)
「診断精度のメタ分析」 ( http://goo.gl/tF2XXy )
「介入研究の質のアセスメント」( http://goo.gl/2t0yjT )

介入効果のメタ分析

Editor's Notes

  • #21 真ん中の縦線はnull value。縦線より右ほど効果がある。95%信頼区間が縦線をまたぐと統計的には有意ではない。
  • #26 ふぁんねるぷろっと
  • #29 ここで40分になるように調整する。