Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Cox比例ハザードモデル
とその周辺
TokyoR #46
2015/2/21
@kikurag1001
自己紹介
名前:@kikurage1001
お仕事:統計ソフトを作ってます@東京
兼
大学院生として医療統計を勉強してます@福岡
今は遺伝子解析をぼちぼち。。。
よく使うもの:R、SAS
楽しみ:映画データをいじくって眺める
内容
• Cox比例ハザードモデルとは?
• 実際に分析してみる
• ノモグラムを描いてみる
Cox比例ハザードモデル
• イベントが起こったか、起こらなかった
かについて、時間も含めて行う多変量解
析のこと
• 医療疫学分野、製品の寿命や故障の解析
などに使われる
特徴1
ℎ 𝑡 𝑥 = ℎ0(𝑡)exp(𝛽1 𝑥1 + 𝛽2 𝑥2 + ・・・ + 𝛽 𝑘 𝑥 𝑘)
• 柔軟性の高いモデル
• ハザード比:exp(偏回帰係数)
群間でのハザード(単位時間あたりの死亡確率)の比
1より大きいとリスクを上げ、...
特徴2
• 累積ハザード関数から生存関数を求めることができる
• 生存予測ができる
𝐻 𝑡 =
0
𝑡
ℎ 𝑥 𝑑𝑥 = −log[𝑆(𝑡)]
累積ハザード関数
こんなニュースが・・・
最近、ミニシアターがどんどん閉館しているらしい
ミニシアターの閉館にどんな因子が関係しているのか?
※5スクリーン未満の映画館
実際に分析してみる
映画館のデータ(自作)を使って分析してみる
1910~2015年に営業している(た)5スクリーン未満の映画館
計128件のデータをCox比例ハザードモデルを用いて解析!
変数 説明
営業年数 営業年数(平均約36年)
営業中...
コード
結果
コード
結果
結果からわかること
• スクリーンは多いほうが良さそう
• 副都心地域はやばそう(新宿、渋谷等)
• シネコンの影響は・・・あったほうが?
グラフにしてみよう!!
ノモグラムを描いてみる
• 臨床の世界で使われる便利なグラフ
• 死んだり、病気になったりする可能性を
ざっくりと計算することができる
• Rで描ける!{rms}
コード
結果
市部
市部
市部
実際の使い方
もしも
• 総座席数400席 で
• スクリーン数2つ の映画館が
• シネコンのない
• 中野区に建設されたとしたら
どのくらいの確率で
50年後も営業しているかなあ??
市部
市部
市部
市部
3点 35点 38点 67点
市部
3 + 35 + 38 + 67 = 143点
市部
143点
市部
143点
市部
143点
0.65!
65%くらいの確率で、
営業してるんじゃ
ないかねぇ、たぶん
まとめ
説明 {survival} {rms}
Cox解析 coxph cph
残差の分析 residuals.coxph residuals.cph
比例ハザード性の確認 cox.zph ―
生存確率の算出 survfit survest.c...
Upcoming SlideShare
Loading in …5
×

Tokyo.R #46 Cox比例ハザードモデルとその周辺

6,956 views

Published on

Tokyo.R #46 の資料です。

  • Be the first to comment

Tokyo.R #46 Cox比例ハザードモデルとその周辺

  1. 1. Cox比例ハザードモデル とその周辺 TokyoR #46 2015/2/21 @kikurag1001
  2. 2. 自己紹介 名前:@kikurage1001 お仕事:統計ソフトを作ってます@東京 兼 大学院生として医療統計を勉強してます@福岡 今は遺伝子解析をぼちぼち。。。 よく使うもの:R、SAS 楽しみ:映画データをいじくって眺める
  3. 3. 内容 • Cox比例ハザードモデルとは? • 実際に分析してみる • ノモグラムを描いてみる
  4. 4. Cox比例ハザードモデル • イベントが起こったか、起こらなかった かについて、時間も含めて行う多変量解 析のこと • 医療疫学分野、製品の寿命や故障の解析 などに使われる
  5. 5. 特徴1 ℎ 𝑡 𝑥 = ℎ0(𝑡)exp(𝛽1 𝑥1 + 𝛽2 𝑥2 + ・・・ + 𝛽 𝑘 𝑥 𝑘) • 柔軟性の高いモデル • ハザード比:exp(偏回帰係数) 群間でのハザード(単位時間あたりの死亡確率)の比 1より大きいとリスクを上げ、1より小さいとリスクを下げる • 比例ハザード性(ハザード比が常に一定)の仮定が必要 ベースラインハザード (推定しない) 偏回帰係数と共変量の線形結合の指数関数
  6. 6. 特徴2 • 累積ハザード関数から生存関数を求めることができる • 生存予測ができる 𝐻 𝑡 = 0 𝑡 ℎ 𝑥 𝑑𝑥 = −log[𝑆(𝑡)] 累積ハザード関数
  7. 7. こんなニュースが・・・ 最近、ミニシアターがどんどん閉館しているらしい ミニシアターの閉館にどんな因子が関係しているのか? ※5スクリーン未満の映画館
  8. 8. 実際に分析してみる 映画館のデータ(自作)を使って分析してみる 1910~2015年に営業している(た)5スクリーン未満の映画館 計128件のデータをCox比例ハザードモデルを用いて解析! 変数 説明 営業年数 営業年数(平均約36年) 営業中or閉館 営業中=0、閉館=1 総座席数 館内全体の座席数の合計 スクリーン数 館内のスクリーン数の合計 区のカテゴリー 映画館がある区のカテゴリー シネコン有無 営業期間内にその映画館がある区 内にシネコンがあったか 都心 千代田区、中央区、 港区 副都心 新宿区、文京区、 渋谷区、豊島区 城東 台東区、墨田区、江東 区、荒川区、足立区、 葛飾区、江戸川区 城南 品川区、目黒区、 大田区 城西 世田谷区、中野区、 杉並区、練馬区 城北 北区、板橋区 その他市部 ※シネコン:5スクリーン以上ある映画館
  9. 9. コード 結果
  10. 10. コード 結果
  11. 11. 結果からわかること • スクリーンは多いほうが良さそう • 副都心地域はやばそう(新宿、渋谷等) • シネコンの影響は・・・あったほうが? グラフにしてみよう!!
  12. 12. ノモグラムを描いてみる • 臨床の世界で使われる便利なグラフ • 死んだり、病気になったりする可能性を ざっくりと計算することができる • Rで描ける!{rms}
  13. 13. コード
  14. 14. 結果 市部
  15. 15. 市部
  16. 16. 市部
  17. 17. 実際の使い方 もしも • 総座席数400席 で • スクリーン数2つ の映画館が • シネコンのない • 中野区に建設されたとしたら どのくらいの確率で 50年後も営業しているかなあ??
  18. 18. 市部
  19. 19. 市部
  20. 20. 市部
  21. 21. 市部 3点 35点 38点 67点
  22. 22. 市部 3 + 35 + 38 + 67 = 143点
  23. 23. 市部 143点
  24. 24. 市部 143点
  25. 25. 市部 143点 0.65!
  26. 26. 65%くらいの確率で、 営業してるんじゃ ないかねぇ、たぶん
  27. 27. まとめ 説明 {survival} {rms} Cox解析 coxph cph 残差の分析 residuals.coxph residuals.cph 比例ハザード性の確認 cox.zph ― 生存確率の算出 survfit survest.cph Coxモデルの予測 predict.coxph predict ノモグラムを描く ― nomogram • Rを使えば、Cox比例ハザードモデルに関 することが色々できます ※ここで用いたデータ及び、解析方法、解釈については個人の見解に基づくものである ことをご了承くださいm(-_-)m

×