Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
臨床医からみた医学統計
日本医科大学武蔵小杉病院
腫瘍内科
勝俣範之
2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
nk...
本日のお話
• 正しく医学情報を吟味するには?
• 医学論文を3分で読む方法
• ちょっと上級者編
Division of Medical Oncology, Nippon Medical School Musashikosugi Hospit...
最新のエビデンスについていくには?
Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
がん領域のトップジャーナル
雑誌名 インパクトファクター
NEW ENGL J MED 54.420
NATURE 42.351
LANCET 39.207
CELL 33.116
SCIENCE 31.477
JAMA 30.387
LANC...
• エビデンスレベルの高い情報源
• ASCO(米国臨床腫瘍学会)
• Impact factorの高い(引用数の高い)医学
雑誌
• 自分で批判的吟味ができるようにする
こと
• エビデンスレベルを判断すること
最新のエビデンスについていくに...
臨床研究の質: Levels of Evidence
I 複数のランダム化比較試験のメタアナリシス
検出力の高いランダム化比較試験 (第三相試験)
II 検出力の低いランダム化比較試験(第三相試験)
III シングルアーム研究(第二相試験)、ケ...
数百人規模の患者数のランダム比較試験の結果
超音波乳がん治療の150名の報告
○○病院のAC療法の68名の経験
○○がんセンターでこれまで行ったACとCMF療法の比
較。
マウス実験で著明な効果を示した新規分子標的薬
国立がん研究センターの治療...
ランダム化比較試験
(Randomized Controlled Trial: RCT)とは?
• 新しい治療などを科学的に検証するための最も優れた
研究方法
• バイアスを最も少なくできる研究方法
• 対照群(コントロール群)と、介入群 (治...
フ
ォ
ロ
ー
ア
ッ
プ
調
査
データ解析
第Ⅲ相臨床試験:ランダム化比較試験(RCT)
新治療群
標準治療(対照群・プラセボ)
(標準治療がない場合は無治療)
A
B
ラ
ン
ダ
ム
に
ふ
り
わ
け
る
患者さん 数百~数千名
NEJ...
乳がん術後薬物療法のランダム化比較試験 (RCT)
乳房切除
した患者さ
ん
無治療
CMF療法
(179人)
(207人)
イタリア・ミラノ試験 1973年より開始
NEJM 1976, updated: NEJM 1995
ラ
ン
ダ
ム
...
ランダム化比較試験 (RCT)の結果による
乳がん術後化学療法の進歩
無治療 CMF療法
C: エンドキサン
M: メソトレキセート
F: 5-FU
CMF療法 AC療法 A: アドリアマイシン
C: エンドキサン
AC療法
AC療法
PTX ...
• 臨床試験の最終で最難関の研究
• 数百~数千例が必要
• 研究費(数億円)
• インフォームド・コンセントが得られにくい
• 先進国中、日本は最低の研究数
• J Epidemiol, 2002,11,46-47
第Ⅲ相臨床試験:ランダム化...
ランダム化比較試験(トップ10ヶ国) 1995年-1999年
0
100
200
300
400
500
600
700
410
316 310
244 237 226 196 192
106
1846
~~
J Epidemiol, 2002...
データの信頼性を決めるもの
•偶然性
• 統計的エラー
• αエラー、βエラー
•バイアスの存在
• バイアスとは? 真実をゆがめてみせるもの、みせか
け
批判的吟味の目的は偶然、バイアスを見破り、ど
れくらい真実に近いのか見定めること
Div...
ある日の新聞記事広告から
• 末期がん患者が水溶性ア
ガリクスを飲んだらがんが
治った!
これは真実?、偶然?、それともバイアス?
Division of Medical Oncology, Nippon Medical School Musa...
偶然性、バイアスの可能性は?
• たまたま効いたのではないか? (偶然性)
• 本当に末期がんだったの? (サンプリングバイアス)
• 効いた人だけを発表したのでは? (発表バイアス)
• 本当に効いたという証拠があるの? (測定バイアス)
•...
バイアスの可能性
• 世の中はバイアス(偽物)の固まりである!!
• 三大バイアス
• 選択バイアス(selection bias)
• 測定バイアス(measurement bias)
• 交絡バイアス(confounding bias)
•...
色々なバイアス
• 発表バイアス、出版バイアス
• よい結果のみ発表したい、よい結果のみ出版したいというバイアス
• 解析バイアス
• 有意差が出るまで何回も検定しようとするバイアス
• 主治医の欲目バイアス
• 自分の治療法がうまくいってほし...
• スポンサーが明確になっている臨床試験で、製薬企業スポ
ンサーの臨床試験は、それ以外の臨床試験に比べて4倍
(95%CI 2.98-5.51)positive dataになりやすかった
BMJ 2003;326:1167
→Major jou...
京都府立医大ディオバンのRCTでデータねつ造の疑い
朝日新聞2013.2.28
朝日新聞2013.4.26
Division of Medical Oncology, Nippon Medical School Musashikosugi Ho...
• 全貌は明らかではありませんが…..
• 医師主導研究として行われた
• モニタリング・監査が行われていない
• データセンターが存在しない
• 統計解析が一人のノバルティス社員にて行われた
ディオバン事件の問題点
データねつ造
論文取り下げ...
1. 承認された薬剤
2. 多数の競合品の存在
3. 医師への、不釣合いな多額な見返り:奨学寄付金
4. 製薬企業の営業部門からのスポンサーシップ
5. 試験デザインがPoor (RCTでない、盲検でない、プラセボがない)
6. データ管理がず...
1. 承認された薬剤:YES
2. 多数の競合品の存在:YES(ARB)
3. 多額な奨学寄付金:YES
4. 製薬企業の営業部門からのスポンサーシップ:YES
5. 試験デザインがPoor :YES(PROBE法)
6. データ管理がずさん:...
医学論文を3分で読む方法
Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
• タイトル・アブストラクト(要約)を読む
• randomly, randomizedがあるか?
• なければ読む必要なし!!
• エンドポイント(プライマリー・セカンダリー)は何か?
• overall survival(全生存期間)が一番...
アウトカム (エンドポイント) の重要性
高血圧患者で
降圧薬を処方したら
処方しなかった場合と比べて
血圧が下がった
肺がん患者で
新しい分子標的薬治療は
従来治療と比べて
腫瘍縮小率が増加した
これが本当に見
たいアウトカムで
しょうか?
...
エンドポイントとは?
• 臨床試験ではあらかじめ、検証したいクリニカルアウトカム(臨床
結果)をエンドポイント(Endpoint)として設定をする。
• プライマリーエンドポイント(主要評価項目):通常は一つ
• Overall Surviva...
真のエンドポイントと代用エンドポイント
疾患 代用エンドポイント 真のエンドポイント
高血圧 血圧低下 心・脳血管疾患発生、死亡
肺癌 腫瘍のサイズ縮小 生存期間、QOL
真のエンドポイント (6Ds) :Death(生死), Disease(...
真のエンドポイントと代用エンドポイント
代用(サロゲート)エンド
ポイント
真のエンドポイント
がん ORR, PFS, DFS 総死亡(OS)
動脈硬化性疾患 血圧、脂質、血糖、微量
アルブミン尿
心筋梗塞、脳卒中発症、
心血管死亡、ハイリス...
がん医学論文を3分で読む方法
Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
• まずはタイトル・アブストラクトを見る。
• randomly, randomizedがある...
Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
• まずはタイトル・アブストラクトを見る。
• randomly, randomizedがある...
ちょっと上級者編
Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
上級者編
• JAMAのチェックリストを使えるようにする
• サブグループ解析を正しく解釈する
• 臨床試験における αエラー、βエラーを理解する
• 臨床的有用性と統計学的有意差
Division of Medical Oncology, N...
治療(介入)研究の文献を読む際のチェックリスト
I デザインは妥当か?
1. 試験デザインは何か?エビデンスレベルは?
2. 患者背景は妥当か?適格規準は妥当か?ばらつきはないか?
3. intention to treat解析か?除外例をどう...
intention-to-treat (ITT)解析の重要性
術後がん患者200人
ランダム化割付
無治療
100人
化学療法
100人
100人 80人 or
100人?
途中中止
20人
途中脱落
0人
最終解析
無治療(100人)
化学療...
• Per-protocol 解析のバイアス
• 2群の患者特性の類似性が失われる(attrition bias, 漸減バイアス)
• セレクションバイアス(都合の悪い患者を後付けに排除してしまう)
• 部分修正した(Modified) ITT...
• サブグループ解析での結果はすべて探索的であり、
信頼性が低い
• サブグループ解析で差がありそうなときは別の試験
で検証すべきである
サブグループ解析は正しく解釈されているか?
米国SWOGに学ぶがん臨床試験の実践 , 医学書院2004
D...
A Phase III, Open-label, Randomized,
Multicenter Study Of Eribulin Mesylate Versus Capecitabine In Patients With Locally
A...
試験デザイン
 多国籍,無作為化,オープンラベル第III相試験 (301試験)
• 層別化因子:地域,HER2発現状況
カぺシタビン群
1,250 mg/m2,1日2回経口投与,1サイ
クル21日で,day1~14投与
エリブリンメシル酸塩群...
無増悪生存期間 (PFS)
HR 0.977 (95%CI:0.857,1.114)
p=0.736
期間(月)
HR 1.079 (95%CI:0.932,1.250)
p=0.305
主治医による判定
1.0
0.8
0.6
0.4
0.2...
生存率
期間(月)
0
0.0
0.2
0.4
0.6
0.8
1.0
56524844403632282420161284
HR*0.879(95%CI:0.770,1.003)
p†=0.056
OS中央値(月)
─ エリブリン群(554例...
生存率
期間(月)
0
0.0
0.2
0.4
0.6
0.8
1.0
56524844403632282420161284
1年OS
エリブリン群 64.4%
カペシタビン群 58.0%
p値 0.035
2年OS
エリブリン群 32.8%
...
全体 0.879 (0.770, 1.003) 15.9 14.5
HER2
陽性 0.965 (0.688, 1.355) 14.3 17.1
陰性 0.838 (0.715, 0.983) 15.9 13.5
ER
陽性 0.897 (0....
統計学的エラー (α、β)とは??
• 偶然性のエラーのこと
• 臨床試験では、どの程度の偶然性のエラーを許容するか?によって、
目標症例数が決められる
• αエラー : あわてもののエラー
• 本当は、有意差がないのに、有意差あり、と言ってし...
JGOG 3016, NOVEL, Japanese Gynecologic Oncology Group
• Ovarian Epithelial,
Primary Peritoneal, or
Fallopian Tube cancer
•...
JGOG3016: Progression-Free Survival
Treatment n Event Median PFS P value HR 95%CI
dd-TC 312 160 28.0 mos.
0.0015 0.714 0.5...
P=0.07
0
.2
.4
.6
.8
1
0 10 20 30 40 50 60
0
.2
.4
.6
.8
1
0 10 20 30 40 50 60 70
P=0.41
0
.2
.4
.6
.8
1
0 10 20 30 40 50 ...
検定の多重性 multiple comparisons
 何回も比較を行うとどこかで差が出る可能性は高くなること
 多くの検定、多くのエンドポイント、多くのサブグループ解析
比較の回数
1
2
3
4
5
10
20
誤って「有意差」が出る...
有意水準(P値)の決め方
 n回比較を行うなら、有意水準をnで割り算する。
5回の比較検定予定の場合
P value = 0.05/5 = 0.01 と設定する。
Cook R. Multiple comparisons.
In: Encyc...
サブグループ解析を解釈する際のガイドライン
 サブグループ解析は事前に計画されたものであった
か? (層別因子は正当化されない)
 十分な症例数があるか? (偽陰性率が高い)
 統計学的多重性を考慮しているか? (偽陽性)
 他の研究で...
NOVEL studyの結果は本当なの??
「18例登録したけど
weekly TCはあまり効
かないね…….」。
「結構再発した印象
があるけど…….」。
18例登録した○○がんセンター医師 27例登録した○○大学医師
施設別のPFSを書いてみると….
18例登録した○○がんセンター 27例登録した○○大学
症例数が足りなくて、差が検出できていない
↓
βエラーの可能性 (ぼんやりもののエラー)
0
.2
.4
.6
.8
1
0 200 400 600 80...
臨床的有用性と統計学的有意差
Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
RR: 0.87 (95%CI
0.78-0.91)
P<0.00001
絶対リスク減少に注目しよう!
56
ランセット 2012; 379: 432–44
No CTX
39.6%
Anthracycline
34.6%
死亡率
RR: Ri...
ハザード比に惑わされないようにする
~TAS102のエビデンスから~
2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
TA...
• 吐き気 48%
• 嘔吐 28%
• 食欲低下 39%
• 疲労 35%
• 下痢 32%
• 発熱性好中球減少 4%(うち死亡例1名)
• 白血球減少 77%
• 好中球減少 67%
• 血小板減少 42%
TAS102の副作用
2015...
もう一度、もし、自分ががんだったら、
自分の家族だったら、TAS102を勧めますか?
2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hos...
進行膵臓がんに対するエルロチニブの比較試験
の例
2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
エルロチニブは、プラセボ...
• トップジャーナルだからと安易に信用しない
• 自分で正しく情報の批判的吟味をできるようにする
• 患者にベネフィットがあるかどうか常に考える
まとめ
Division of Medical Oncology, Nippon Medical ...
ご静聴ありがとうございました。
医局員募集中です!!
勝俣nkatsuma@nms.ac.jp
がん患者さんの笑顔と
希望のために
臨床医からみた医学統計
Upcoming SlideShare
Loading in …5
×

臨床医からみた医学統計

11,516 views

Published on

NPO東京化学療法研究会夏期セミナーでお話したスライドです。

Published in: Health & Medicine
  • Be the first to comment

臨床医からみた医学統計

  1. 1. 臨床医からみた医学統計 日本医科大学武蔵小杉病院 腫瘍内科 勝俣範之 2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital nkatsuma@nms.ac.jp
  2. 2. 本日のお話 • 正しく医学情報を吟味するには? • 医学論文を3分で読む方法 • ちょっと上級者編 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  3. 3. 最新のエビデンスについていくには? Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  4. 4. がん領域のトップジャーナル 雑誌名 インパクトファクター NEW ENGL J MED 54.420 NATURE 42.351 LANCET 39.207 CELL 33.116 SCIENCE 31.477 JAMA 30.387 LANCET ONCOL 24.725 J CLIN ONCOL 17.960 J NATL CANCER I 15.161 CANCER RES 9.284 CLIN CANCER RES 8.193 ANN ONCOL 6.578 BRIT J CANCER 4.817 臨床系医学雑誌 基礎系医学雑誌 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital 2013 JCR
  5. 5. • エビデンスレベルの高い情報源 • ASCO(米国臨床腫瘍学会) • Impact factorの高い(引用数の高い)医学 雑誌 • 自分で批判的吟味ができるようにする こと • エビデンスレベルを判断すること 最新のエビデンスについていくには? Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  6. 6. 臨床研究の質: Levels of Evidence I 複数のランダム化比較試験のメタアナリシス 検出力の高いランダム化比較試験 (第三相試験) II 検出力の低いランダム化比較試験(第三相試験) III シングルアーム研究(第二相試験)、ケースコント ロール研究 IV ケースシリーズ V ケースレポート、臨床経験 高い 低い 信頼性 コスト 時間 患者数 ASCO(米国臨床腫瘍学会) プラクティスガイドライン (Can Med Assoc J 121:1193, 1979) Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  7. 7. 数百人規模の患者数のランダム比較試験の結果 超音波乳がん治療の150名の報告 ○○病院のAC療法の68名の経験 ○○がんセンターでこれまで行ったACとCMF療法の比 較。 マウス実験で著明な効果を示した新規分子標的薬 国立がん研究センターの治療方針 がんの民間療法 勝俣の講演 MRのおすすめ、上司のすすめ レベル1 レベル 3-4 レベル4 レベル5 これらのエビデンスのレベルは? レベル5 レベル5 レベル4 レベル5 レベル5 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  8. 8. ランダム化比較試験 (Randomized Controlled Trial: RCT)とは? • 新しい治療などを科学的に検証するための最も優れた 研究方法 • バイアスを最も少なくできる研究方法 • 対照群(コントロール群)と、介入群 (治療・検査など)とに ランダムに割り付けて、結果を比較する • 世界で最初のRCTは、結核のストレプトマイシンの RCT(1948年)
  9. 9. フ ォ ロ ー ア ッ プ 調 査 データ解析 第Ⅲ相臨床試験:ランダム化比較試験(RCT) 新治療群 標準治療(対照群・プラセボ) (標準治療がない場合は無治療) A B ラ ン ダ ム に ふ り わ け る 患者さん 数百~数千名 NEJM 2001
  10. 10. 乳がん術後薬物療法のランダム化比較試験 (RCT) 乳房切除 した患者さ ん 無治療 CMF療法 (179人) (207人) イタリア・ミラノ試験 1973年より開始 NEJM 1976, updated: NEJM 1995 ラ ン ダ ム 化 無治療 CMF 9%の生存率改善
  11. 11. ランダム化比較試験 (RCT)の結果による 乳がん術後化学療法の進歩 無治療 CMF療法 C: エンドキサン M: メソトレキセート F: 5-FU CMF療法 AC療法 A: アドリアマイシン C: エンドキサン AC療法 AC療法 PTX x 4 AC療法 PTX x 4 AC療法 Weekly PTX x 12 AC療法 Weekly PTX x 12 1970s 1980s 1990s 2000s PTX: パクリタキセル
  12. 12. • 臨床試験の最終で最難関の研究 • 数百~数千例が必要 • 研究費(数億円) • インフォームド・コンセントが得られにくい • 先進国中、日本は最低の研究数 • J Epidemiol, 2002,11,46-47 第Ⅲ相臨床試験:ランダム化比較試験
  13. 13. ランダム化比較試験(トップ10ヶ国) 1995年-1999年 0 100 200 300 400 500 600 700 410 316 310 244 237 226 196 192 106 1846 ~~ J Epidemiol, 2002,11,46-47
  14. 14. データの信頼性を決めるもの •偶然性 • 統計的エラー • αエラー、βエラー •バイアスの存在 • バイアスとは? 真実をゆがめてみせるもの、みせか け 批判的吟味の目的は偶然、バイアスを見破り、ど れくらい真実に近いのか見定めること Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  15. 15. ある日の新聞記事広告から • 末期がん患者が水溶性ア ガリクスを飲んだらがんが 治った! これは真実?、偶然?、それともバイアス? Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  16. 16. 偶然性、バイアスの可能性は? • たまたま効いたのではないか? (偶然性) • 本当に末期がんだったの? (サンプリングバイアス) • 効いた人だけを発表したのでは? (発表バイアス) • 本当に効いたという証拠があるの? (測定バイアス) • 他の治療と併用していたのでは? (交絡バイアス) などなど Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  17. 17. バイアスの可能性 • 世の中はバイアス(偽物)の固まりである!! • 三大バイアス • 選択バイアス(selection bias) • 測定バイアス(measurement bias) • 交絡バイアス(confounding bias) • その他のバイアス • Sampling bias, lead time bias, length bias, incidence bias, referral bias, detection bias, information bias, observer bias, recall bias, reporting bias, response bias, review bias, publication bias Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  18. 18. 色々なバイアス • 発表バイアス、出版バイアス • よい結果のみ発表したい、よい結果のみ出版したいというバイアス • 解析バイアス • 有意差が出るまで何回も検定しようとするバイアス • 主治医の欲目バイアス • 自分の治療法がうまくいってほしいと願うあまりつい効果ありと判定してしまうバイアス • 経験バイアス(思い出しバイアス) • 良かった経験、良くなかった経験のみ覚えているバイアス • 癒着バイアス • ある製薬会社のMRからの情報を信じてしまうバイアス • データ捏造 • STAP細胞事件、ディオバン事件 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  19. 19. • スポンサーが明確になっている臨床試験で、製薬企業スポ ンサーの臨床試験は、それ以外の臨床試験に比べて4倍 (95%CI 2.98-5.51)positive dataになりやすかった BMJ 2003;326:1167 →Major journalでは、funding sourceとその役割について記 載が必須となった。 →COI (conflict of interest, 利益相反)を提出することが必須 になった 製薬企業スポンサーの臨床試験(治験)は、良い 結果が出やすい 2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  20. 20. 京都府立医大ディオバンのRCTでデータねつ造の疑い 朝日新聞2013.2.28 朝日新聞2013.4.26 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  21. 21. • 全貌は明らかではありませんが….. • 医師主導研究として行われた • モニタリング・監査が行われていない • データセンターが存在しない • 統計解析が一人のノバルティス社員にて行われた ディオバン事件の問題点 データねつ造 論文取り下げ Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  22. 22. 1. 承認された薬剤 2. 多数の競合品の存在 3. 医師への、不釣合いな多額な見返り:奨学寄付金 4. 製薬企業の営業部門からのスポンサーシップ 5. 試験デザインがPoor (RCTでない、盲検でない、プラセボがない) 6. データ管理がずさん Seeding Trial(販売促進試験)の見抜き方 FDA; N. Engl. J. Med. 1994:331 (20): 1350–53.
  23. 23. 1. 承認された薬剤:YES 2. 多数の競合品の存在:YES(ARB) 3. 多額な奨学寄付金:YES 4. 製薬企業の営業部門からのスポンサーシップ:YES 5. 試験デザインがPoor :YES(PROBE法) 6. データ管理がずさん:YES(GCPでない、データセンターがない、製 薬企業社員による解析) Jikei Herart Studyは販促試験か? FDA; N. Engl. J. Med. 1994:331 (20): 1350–53.
  24. 24. 医学論文を3分で読む方法 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  25. 25. • タイトル・アブストラクト(要約)を読む • randomly, randomizedがあるか? • なければ読む必要なし!! • エンドポイント(プライマリー・セカンダリー)は何か? • overall survival(全生存期間)が一番良い!! • Discussionは読まない。Methodから読む! 医学論文を3分で読む方法 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  26. 26. アウトカム (エンドポイント) の重要性 高血圧患者で 降圧薬を処方したら 処方しなかった場合と比べて 血圧が下がった 肺がん患者で 新しい分子標的薬治療は 従来治療と比べて 腫瘍縮小率が増加した これが本当に見 たいアウトカムで しょうか? Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  27. 27. エンドポイントとは? • 臨床試験ではあらかじめ、検証したいクリニカルアウトカム(臨床 結果)をエンドポイント(Endpoint)として設定をする。 • プライマリーエンドポイント(主要評価項目):通常は一つ • Overall Survival (OS) 全生存期間(第三相試験) • Progression-free Survival(PFS) 無増悪生存期間(第三相試験) • Relapse-free Survival (RFS) 無再発生存期間(第三相試験) • Response Rate (RR) 腫瘍縮小率(第二相試験) • Adverse Events (AE) 毒性(第一相試験) • セカンダリーエンドポイント(副次評価項目):複数OK • 上記に加えて、 • QOL • コストなど Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  28. 28. 真のエンドポイントと代用エンドポイント 疾患 代用エンドポイント 真のエンドポイント 高血圧 血圧低下 心・脳血管疾患発生、死亡 肺癌 腫瘍のサイズ縮小 生存期間、QOL 真のエンドポイント (6Ds) :Death(生死), Disease(罹病), Discomfort(自覚症状), Disability(身体機能の障害), Dissatisfaction(不満足), Destitution(費用) 代用エンドポイント: 臨床試験などで、治療の効果を短期的に見 ておきたい場合などに、真のエンドポイントの代用的評価指標とし て使われる。あくまで代用であり、真のエンドポイントに必ずしも結 びつかないことに注意! Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  29. 29. 真のエンドポイントと代用エンドポイント 代用(サロゲート)エンド ポイント 真のエンドポイント がん ORR, PFS, DFS 総死亡(OS) 動脈硬化性疾患 血圧、脂質、血糖、微量 アルブミン尿 心筋梗塞、脳卒中発症、 心血管死亡、ハイリスクで は総死亡 腎疾患 蛋白尿 透析導入、移植、死亡 心不全 BNP、心不全による入院 死亡
  30. 30. がん医学論文を3分で読む方法 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  31. 31. Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital • まずはタイトル・アブストラクトを見る。 • randomly, randomizedがあるか? →なければ読む必要なし • 何のがん患者を対象としたか? • 何と何を比較して? • Survival でどちらが優ったのか? →overall survivalが一番良い!!
  32. 32. Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital • まずはタイトル・アブストラクトを見る。 • randomly, randomizedがあるか? →書いてないので 読む必要なし。 Phase II studyというのはエンドポイ ント(アウトカム)がsurvivalでなく、 response(腫瘍縮小効果)なので読 む必要なし!
  33. 33. ちょっと上級者編 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  34. 34. 上級者編 • JAMAのチェックリストを使えるようにする • サブグループ解析を正しく解釈する • 臨床試験における αエラー、βエラーを理解する • 臨床的有用性と統計学的有意差 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  35. 35. 治療(介入)研究の文献を読む際のチェックリスト I デザインは妥当か? 1. 試験デザインは何か?エビデンスレベルは? 2. 患者背景は妥当か?適格規準は妥当か?ばらつきはないか? 3. intention to treat解析か?除外例をどう扱っているか? 4. サンプルサイズは妥当か?サンプルサイズの計算方法が述べられているか? 5. 新治療の方法、対照群の治療方法は妥当か? II 結果はどの程度か?バイアスはないか? 1. プライマリーエンドポイントは真のエンドポイントか?結果の解釈は妥当か?α、βエラーはないか? 2. サブグループ解析の解釈は妥当か? 3. 統計学的有用性だけでなく、臨床的有用性はどうか? 4. 副作用を過小評価していないか? 5. COI(スポンサーの関与)はどの程度か? III 結果は一般化できるか? 1. 試験結果は、現在の標準治療を変えたか? 2. 結果を自分の患者の診療に適用できるか?できるとしたらどのような患者か? Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital JAMA 270:2598-601, 1993 日本語訳:表6-1治療に関する論文のユーザーズガイド、69ページ:2010年医学文献ユーザーズガイド第二版凸版メディア株式会社
  36. 36. intention-to-treat (ITT)解析の重要性 術後がん患者200人 ランダム化割付 無治療 100人 化学療法 100人 100人 80人 or 100人? 途中中止 20人 途中脱落 0人 最終解析 無治療(100人) 化学療法完遂 症例(80人) Per-protocol 解析 P<0.001 無治療(100人) 化学療法 (100人) Intent-to-treat 解析 P=0.56
  37. 37. • Per-protocol 解析のバイアス • 2群の患者特性の類似性が失われる(attrition bias, 漸減バイアス) • セレクションバイアス(都合の悪い患者を後付けに排除してしまう) • 部分修正した(Modified) ITT解析は、一種のPer-protocol解析で あることに注意 • Per-protocol 解析はどんなときに使われるか • 薬剤の安全性の評価 • 新薬のPhase II 試験 • 非劣性試験 Per-protocol 解析の欠点と利点 2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  38. 38. • サブグループ解析での結果はすべて探索的であり、 信頼性が低い • サブグループ解析で差がありそうなときは別の試験 で検証すべきである サブグループ解析は正しく解釈されているか? 米国SWOGに学ぶがん臨床試験の実践 , 医学書院2004 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  39. 39. A Phase III, Open-label, Randomized, Multicenter Study Of Eribulin Mesylate Versus Capecitabine In Patients With Locally Advanced Or Metastatic Breast Cancer Previously Treated With Anthracyclines And Taxanes Peter A. Kaufman,1 Ahmad Awada,2 Christopher Twelves,3 Louise Yelle,4 Edith A. Perez,5 Jantien Wanders,6 Martin S. Olivo,7 Yi He,7 Corina E. Dutcus,7 Javier Cortes8 1Norris Cotton Cancer Center, Dartmouth-Hitchcock Medical Center, Lebanon, NH, USA; 2Medical Oncology Clinic, Jules Bordet Institute, Brussels, Belgium; 3Leeds Institute of Molecular Medicine and St James’s Institute of Oncology, Leeds, UK; 4Department of Medicine, University of Montreal, Montreal, Canada; 5Mayo Medical Clinic, Jacksonville, FL, USA; 6Eisai Ltd., Hatfield, UK; 7Eisai Inc., Woodcliff Lake, NJ, USA; 8Vall D’Hebron University Hospital, Barcelona, Spain アンスラサイクリンとタキサンの前治療歴を有する 局所進行・転移乳癌患者に対する エリブリンメシル酸塩とカペシタビンを比較した 第III相オープンラベルランダム化多施設共同試験 San Antonio Breast Cancer Symposium-- Dec 4-8, 2012; San Antonio, TX
  40. 40. 試験デザイン  多国籍,無作為化,オープンラベル第III相試験 (301試験) • 層別化因子:地域,HER2発現状況 カぺシタビン群 1,250 mg/m2,1日2回経口投与,1サイ クル21日で,day1~14投与 エリブリンメシル酸塩群 1.4 mg/m2, 2~5分静注, 1サイクル21日で,day1,8投与 無作為化 1:1 主要評価項目 • OSおよびPFS 副次評価項目 • QOL • 奏効率 • 奏効期間 • 1,2,3年生存率 • 腫瘍関連症状の評価 • 安全性 • 薬物動態 (エリブリン群のみ) 対象 (1,102例) • 局所進行あるいは 転移乳癌 • 前治療化学療法は 3レジメン以内 (進行・再発の場合, 2レジメン以内) • 術前・術後補助療法,または局 所進行あるいは転移再発乳癌 に対してアンスラサイクリンとタ キサンによる治療歴あり  術前・術後化学療法から12ヵ月以内の再発患者または,進行再発後の化学療法から 6ヵ月以内の再発患者を登録した。  投与期間中の骨シンチによる骨病変の評価を必須とした。
  41. 41. 無増悪生存期間 (PFS) HR 0.977 (95%CI:0.857,1.114) p=0.736 期間(月) HR 1.079 (95%CI:0.932,1.250) p=0.305 主治医による判定 1.0 0.8 0.6 0.4 0.2 0.0 生存率 0 4 8 12 16 20 24 28 32 36 40 44 期間(月) 独立審査機関による判定 0 4 8 12 16 20 24 28 32 1.0 0.8 0.6 0.4 0.2 0.0 生存率 36 40 44 ITT集団を対象 *実施地域やHER2での層別化を含むHR Coxモデル †臨床データベースに基づく層別化log rankテストからのp値 期間中央値 (月) ─ エリブリン群 (554例) 4.1 ─ カぺシタビン群 (548例) 4.2 期間中央値 (月) ─ エリブリン群 (554例) 4.2 ─ カぺシタビン群 (548例) 4.1
  42. 42. 生存率 期間(月) 0 0.0 0.2 0.4 0.6 0.8 1.0 56524844403632282420161284 HR*0.879(95%CI:0.770,1.003) p†=0.056 OS中央値(月) ─ エリブリン群(554例) 15.9 ─ カぺシタビン群(548例) 14.5 ITT集団を対象 *実施地域やHER2での層別化を含むHR Coxモデル †臨床データベースに基づく層別化log-rankテストからのp値 全生存期間(OS)
  43. 43. 生存率 期間(月) 0 0.0 0.2 0.4 0.6 0.8 1.0 56524844403632282420161284 1年OS エリブリン群 64.4% カペシタビン群 58.0% p値 0.035 2年OS エリブリン群 32.8% カペシタビン群 29.8% p値 0.324 3年OS エリブリン群 17.8% カペシタビン群 14.5% p値 0.175 ITT集団を対象 *実施地域やHER2での層別化を含むHR Coxモデル †臨床データベースに基づく層別化log-rankテストからのp値 生存率(1年,2年,3年) 1年生存率が有意に良好?
  44. 44. 全体 0.879 (0.770, 1.003) 15.9 14.5 HER2 陽性 0.965 (0.688, 1.355) 14.3 17.1 陰性 0.838 (0.715, 0.983) 15.9 13.5 ER 陽性 0.897 (0.737, 1.093) 18.2 16.8 陰性 0.779 (0.635, 0.955) 14.4 10.5 トリプルネガティブ 有 0.702 (0.545, 0.906) 14.4 9.4 無 0.927 (0.795, 1.081) 17.5 16.6 サブグループ HR (95% CI) エリブリン群 カぺシタビン群 期間中央値(月) ITT集団を対象 受容体発現別にみた全生存率 0.2 0.5 1.0 2 5 エリブリンが良好 カぺシタビンが良好 (755例) (449例) (284例) トリプルネガティブにエリブ リンが有効??
  45. 45. 統計学的エラー (α、β)とは?? • 偶然性のエラーのこと • 臨床試験では、どの程度の偶然性のエラーを許容するか?によって、 目標症例数が決められる • αエラー : あわてもののエラー • 本当は、有意差がないのに、有意差あり、と言ってしまうエラー、 罪が重い(例:検定の多重性) • 通常は、0.05 • βエラー : ぼんやりもののエラー • 本当は、有意差があるのに、有意差なしと言ってしまうエラー、罪 は軽い(例:症例数不足による有意差なし) • 通常は、0.2 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  46. 46. JGOG 3016, NOVEL, Japanese Gynecologic Oncology Group • Ovarian Epithelial, Primary Peritoneal, or Fallopian Tube cancer • FIGO Stage II-IV • Stratfied: residual disease, stage, and histology Paclitaxel 180mg/m2, day 1 Carboplatin AUC 6.0, day 1 every 21 days for 6-9 cycles Paclitaxel 80mg/m2, days 1,8,15 Carboplatin AUC 6.0, day 1 every 21 days for 6-9 cycles R A N D O M I Z E • Primary endpoint: PFS • Secondary endpoint: OS • Accrual: 637 pts (2003 Apr.– 2005 Dec.) JGOG 3016 (NOVEL study) Katsumata N. et al. Lancet 2009; 374: 1331–38 Dose-dense weekly TC (dd-TC) Conventional TC (c-TC)
  47. 47. JGOG3016: Progression-Free Survival Treatment n Event Median PFS P value HR 95%CI dd-TC 312 160 28.0 mos. 0.0015 0.714 0.581-0.879 c-TC 319 200 17.2 mos. Lancet 2009; 374: 1331–38 JGOG 3016, NOVEL, Japanese Gynecologic Oncology Group dd-TC c-TC median follow-up period: 29 months
  48. 48. P=0.07 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 70 P=0.41 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 70 P=0.73 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 70 P=0.92 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 P=0.48 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 P=0.32 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 70 P=0.14 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 70 P=0.29 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 70 P=0.67 登録番号下1ケタ0-9に分けた生存解析 P=0.02 0 .2 .4 .6 .8 1 0 10 20 30 40 50 60 70 下1ケタ 7番の患者さんには Dose-dense TCが効く?? ↓ αエラーの可能性 (あわてもののエラー) 検定の多重性 JGOG3016のデータより Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  49. 49. 検定の多重性 multiple comparisons  何回も比較を行うとどこかで差が出る可能性は高くなること  多くの検定、多くのエンドポイント、多くのサブグループ解析 比較の回数 1 2 3 4 5 10 20 誤って「有意差」が出る(αエラー)確率(%) 5.0 9.7 14.3 18.5 22.6 40.0 64.1 Simon R. Design and Analysis of Clinical Trials In DeVita et al eds. Cancer Principles and Practice of Oncology 8th edition, 2008:586
  50. 50. 有意水準(P値)の決め方  n回比較を行うなら、有意水準をnで割り算する。 5回の比較検定予定の場合 P value = 0.05/5 = 0.01 と設定する。 Cook R. Multiple comparisons. In: Encyclopedia of Biostatistics. New York, NY: Willey; 1999:2736
  51. 51. サブグループ解析を解釈する際のガイドライン  サブグループ解析は事前に計画されたものであった か? (層別因子は正当化されない)  十分な症例数があるか? (偽陰性率が高い)  統計学的多重性を考慮しているか? (偽陽性)  他の研究でも同様な結果が得られているか? (再現性)  生物学的、動物実験などでも予測されるか? JAMA User’s Guides to the Medical Literature, 2002
  52. 52. NOVEL studyの結果は本当なの?? 「18例登録したけど weekly TCはあまり効 かないね…….」。 「結構再発した印象 があるけど…….」。 18例登録した○○がんセンター医師 27例登録した○○大学医師
  53. 53. 施設別のPFSを書いてみると…. 18例登録した○○がんセンター 27例登録した○○大学 症例数が足りなくて、差が検出できていない ↓ βエラーの可能性 (ぼんやりもののエラー) 0 .2 .4 .6 .8 1 0 200 400 600 800 1000 1200 1400 1600 1800 時間 0 .2 .4 .6 .8 1 0 200 400 600 800 1000 1200 1400 1600 時間 Dose-dense TC Conventional TC P=0.38P=0.89 13 9 14 12 27 21 観察数 発生数 A B 合計 10 5 8 5 18 10 観察数 発生数 A B 合計 64例登録した国立がんセンター 32 26 32 22 64 48 観察数 発生数 A B 合計 0 .2 .4 .6 .8 1 0 250 500 750 1000 1250 1500 1750 2000 P=0.100 時間 Dose-dense TC Conventional TC Dose-dense TC Conventional TC
  54. 54. 臨床的有用性と統計学的有意差 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  55. 55. RR: 0.87 (95%CI 0.78-0.91) P<0.00001 絶対リスク減少に注目しよう! 56 ランセット 2012; 379: 432–44 No CTX 39.6% Anthracycline 34.6% 死亡率 RR: Risk Ratio (HRに近似する) = 34.6/39.6 = 0.87 RRR:Relative Risk Reduction = 1-0.87 = 13% ARR:Absolute Risk Reduction = 39.6 – 34.6 = 5.0% RR: 0.87 (95%CI 0.78-0.91) P<0.00001 乳がん術後化学療法の効果 13%の死亡リスク減少! 絶対死亡リスク減少は5%!
  56. 56. ハザード比に惑わされないようにする ~TAS102のエビデンスから~ 2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital TAS102群 生存期間中央値7.1ヶ月 プラセボ群 生存期間中央値5.3ヶ月 1.8ヶ月 34%の死亡リスク減少! N Engl J Med 2015;372:1909-19. HR (Hazard ratio);0.68 (95%CI, 0.58-0.81) P<0.001
  57. 57. • 吐き気 48% • 嘔吐 28% • 食欲低下 39% • 疲労 35% • 下痢 32% • 発熱性好中球減少 4%(うち死亡例1名) • 白血球減少 77% • 好中球減少 67% • 血小板減少 42% TAS102の副作用 2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital N Engl J Med 2015;372:1909-19.
  58. 58. もう一度、もし、自分ががんだったら、 自分の家族だったら、TAS102を勧めますか? 2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  59. 59. 進行膵臓がんに対するエルロチニブの比較試験 の例 2015/7/10 Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital エルロチニブは、プラセボと比して 10日間の延命効果を示した。 強い副作用として、下痢(6%)、皮疹 (6%)、だるさ(15%)、感染(17%)が あった。 有意差P=0.038があったからと言って、 すべての膵臓がんに強く推奨できますか? エルロチニブ群285名 生存期間中央値6.2ヶ月 プラセボ群285名 生存期間中央値5.9ヶ月 J Clin Oncol. 2007;25(15):1960-6 HR=0.82 95% CI, 0.69-0.99 P = 0.038
  60. 60. • トップジャーナルだからと安易に信用しない • 自分で正しく情報の批判的吟味をできるようにする • 患者にベネフィットがあるかどうか常に考える まとめ Division of Medical Oncology, Nippon Medical School Musashikosugi Hospital
  61. 61. ご静聴ありがとうございました。 医局員募集中です!! 勝俣nkatsuma@nms.ac.jp がん患者さんの笑顔と 希望のために

×