SlideShare a Scribd company logo
Cox比例ハザードモデル
とその周辺
TokyoR #46
2015/2/21
@kikurag1001
自己紹介
名前:@kikurage1001
お仕事:統計ソフトを作ってます@東京
兼
大学院生として医療統計を勉強してます@福岡
今は遺伝子解析をぼちぼち。。。
よく使うもの:R、SAS
楽しみ:映画データをいじくって眺める
内容
• Cox比例ハザードモデルとは?
• 実際に分析してみる
• ノモグラムを描いてみる
Cox比例ハザードモデル
• イベントが起こったか、起こらなかった
かについて、時間も含めて行う多変量解
析のこと
• 医療疫学分野、製品の寿命や故障の解析
などに使われる
特徴1
ℎ 𝑡 𝑥 = ℎ0(𝑡)exp(𝛽1 𝑥1 + 𝛽2 𝑥2 + ・・・ + 𝛽 𝑘 𝑥 𝑘)
• 柔軟性の高いモデル
• ハザード比:exp(偏回帰係数)
群間でのハザード(単位時間あたりの死亡確率)の比
1より大きいとリスクを上げ、1より小さいとリスクを下げる
• 比例ハザード性(ハザード比が常に一定)の仮定が必要
ベースラインハザード
(推定しない)
偏回帰係数と共変量の線形結合の指数関数
特徴2
• 累積ハザード関数から生存関数を求めることができる
• 生存予測ができる
𝐻 𝑡 =
0
𝑡
ℎ 𝑥 𝑑𝑥 = −log[𝑆(𝑡)]
累積ハザード関数
こんなニュースが・・・
最近、ミニシアターがどんどん閉館しているらしい
ミニシアターの閉館にどんな因子が関係しているのか?
※5スクリーン未満の映画館
実際に分析してみる
映画館のデータ(自作)を使って分析してみる
1910~2015年に営業している(た)5スクリーン未満の映画館
計128件のデータをCox比例ハザードモデルを用いて解析!
変数 説明
営業年数 営業年数(平均約36年)
営業中or閉館 営業中=0、閉館=1
総座席数 館内全体の座席数の合計
スクリーン数 館内のスクリーン数の合計
区のカテゴリー 映画館がある区のカテゴリー
シネコン有無 営業期間内にその映画館がある区
内にシネコンがあったか
都心
千代田区、中央区、
港区
副都心
新宿区、文京区、
渋谷区、豊島区
城東
台東区、墨田区、江東
区、荒川区、足立区、
葛飾区、江戸川区
城南
品川区、目黒区、
大田区
城西
世田谷区、中野区、
杉並区、練馬区
城北 北区、板橋区
その他市部
※シネコン:5スクリーン以上ある映画館
コード
結果
コード
結果
結果からわかること
• スクリーンは多いほうが良さそう
• 副都心地域はやばそう(新宿、渋谷等)
• シネコンの影響は・・・あったほうが?
グラフにしてみよう!!
ノモグラムを描いてみる
• 臨床の世界で使われる便利なグラフ
• 死んだり、病気になったりする可能性を
ざっくりと計算することができる
• Rで描ける!{rms}
コード
結果
市部
市部
市部
実際の使い方
もしも
• 総座席数400席 で
• スクリーン数2つ の映画館が
• シネコンのない
• 中野区に建設されたとしたら
どのくらいの確率で
50年後も営業しているかなあ??
市部
市部
市部
市部
3点 35点 38点 67点
市部
3 + 35 + 38 + 67 = 143点
市部
143点
市部
143点
市部
143点
0.65!
65%くらいの確率で、
営業してるんじゃ
ないかねぇ、たぶん
まとめ
説明 {survival} {rms}
Cox解析 coxph cph
残差の分析 residuals.coxph residuals.cph
比例ハザード性の確認 cox.zph ―
生存確率の算出 survfit survest.cph
Coxモデルの予測 predict.coxph predict
ノモグラムを描く ― nomogram
• Rを使えば、Cox比例ハザードモデルに関
することが色々できます
※ここで用いたデータ及び、解析方法、解釈については個人の見解に基づくものである
ことをご了承くださいm(-_-)m

More Related Content

What's hot

5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnetNagi Teramo
 
構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性
Shiga University, RIKEN
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
takehikoihayashi
 
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
Hiroshi Shimizu
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
Shiga University, RIKEN
 
EMアルゴリズム
EMアルゴリズムEMアルゴリズム
生存時間分析の書き方
生存時間分析の書き方生存時間分析の書き方
生存時間分析の書き方
Yasuyuki Okumura
 
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR  #11「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR  #11
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
Koichi Hamada
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門
Koichiro Gibo
 
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用 Koichiro Gibo
 
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
yutannihilation
 
これからの仮説検証・モデル評価
これからの仮説検証・モデル評価これからの仮説検証・モデル評価
これからの仮説検証・モデル評価
daiki hojo
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
Hidetoshi Matsui
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
 
マルコフ転換モデル:導入編
マルコフ転換モデル:導入編マルコフ転換モデル:導入編
マルコフ転換モデル:導入編
Masa Kato
 
ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方
Sayuri Shimizu
 
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
nocchi_airport
 
ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-Koichiro Gibo
 
20180118 一般化線形モデル(glm)
20180118 一般化線形モデル(glm)20180118 一般化線形モデル(glm)
20180118 一般化線形モデル(glm)
Masakazu Shinoda
 

What's hot (20)

5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet
 
構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
 
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
 
EMアルゴリズム
EMアルゴリズムEMアルゴリズム
EMアルゴリズム
 
生存時間分析の書き方
生存時間分析の書き方生存時間分析の書き方
生存時間分析の書き方
 
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR  #11「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR  #11
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
 
分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門分割時系列解析(ITS)の入門
分割時系列解析(ITS)の入門
 
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用
 
ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)ggplot2再入門(2015年バージョン)
ggplot2再入門(2015年バージョン)
 
これからの仮説検証・モデル評価
これからの仮説検証・モデル評価これからの仮説検証・モデル評価
これからの仮説検証・モデル評価
 
関数データ解析の概要とその方法
関数データ解析の概要とその方法関数データ解析の概要とその方法
関数データ解析の概要とその方法
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
マルコフ転換モデル:導入編
マルコフ転換モデル:導入編マルコフ転換モデル:導入編
マルコフ転換モデル:導入編
 
ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方ロジスティック回帰分析の書き方
ロジスティック回帰分析の書き方
 
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
 
ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-
 
20180118 一般化線形モデル(glm)
20180118 一般化線形モデル(glm)20180118 一般化線形モデル(glm)
20180118 一般化線形モデル(glm)
 

Similar to Tokyo.R #46 Cox比例ハザードモデルとその周辺

反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
SAKAUE, Tatsuya
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Issei Kurahashi
 
順序データでもベイズモデリング
順序データでもベイズモデリング順序データでもベイズモデリング
順序データでもベイズモデリング
. .
 
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
Atsunori Kanemura
 
How to use in R model-agnostic data explanation with DALEX & iml
How to use in R model-agnostic data explanation with DALEX & imlHow to use in R model-agnostic data explanation with DALEX & iml
How to use in R model-agnostic data explanation with DALEX & iml
Satoshi Kato
 
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築Tatsuya Tojima
 
因果探索: 観察データから 因果仮説を探索する
因果探索: 観察データから因果仮説を探索する因果探索: 観察データから因果仮説を探索する
因果探索: 観察データから 因果仮説を探索する
Shiga University, RIKEN
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38horihorio
 

Similar to Tokyo.R #46 Cox比例ハザードモデルとその周辺 (8)

反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか反応時間データをどう分析し図示するか
反応時間データをどう分析し図示するか
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
 
順序データでもベイズモデリング
順序データでもベイズモデリング順序データでもベイズモデリング
順序データでもベイズモデリング
 
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
データに隠れた構造を推定して予測に活かす 〜行列分解とそのテストスコアデータへの応用〜
 
How to use in R model-agnostic data explanation with DALEX & iml
How to use in R model-agnostic data explanation with DALEX & imlHow to use in R model-agnostic data explanation with DALEX & iml
How to use in R model-agnostic data explanation with DALEX & iml
 
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
 
因果探索: 観察データから 因果仮説を探索する
因果探索: 観察データから因果仮説を探索する因果探索: 観察データから因果仮説を探索する
因果探索: 観察データから 因果仮説を探索する
 
状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38状態空間モデルの考え方・使い方 - TokyoR #38
状態空間モデルの考え方・使い方 - TokyoR #38
 

Tokyo.R #46 Cox比例ハザードモデルとその周辺

Editor's Notes

  1. http://www.eiren.org/toukei/data.html
  2. http://www.eiren.org/toukei/data.html