SlideShare a Scribd company logo
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
「機械学習の自動化が AIの民主化を加速する」
スケジュール
18:30-19:00 受付
19:00-19:15 準備(環境、データ)
19:15-19:20 お知らせ
19:20-19:30 生存分析と打切り
19:30-20:00 生存分析の手法
20:00-20:30 汎用的機械学習で生存予測
20:30-20:50 演習(犯罪予測)
20:50-21:00 まとめ、質問、アンケート
機械学習による
生存予測
1
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
生存分析と
打切り
2
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
生存分析 for improved quality of life
3
● ヘルスケア(生存分析)
○ 患者がいつ死亡するか
○ 患者がいつ入院するか
○ 患者がいつ病気にかかるか
● 製造(Failure Time 分析)
○ 機械がいつ故障するか
○ 材料がいつ耐えられなくなるか
○ 商品がいつ使えなくなるか
● その他(Time to Event 分析)
○ 顧客がいつ離脱するか
○ 犯罪者がいつ再逮捕されるか
○ 会社がいつ倒産するか
○ いつ結婚するか、離婚するか
薬の研究開発 リスク管理ケア変更 リソース管理
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
生存分析ではある事象が起こるまでの時間を分析する
4
医師によるECOG
パフォーマンス点数
0=good 3=poor
医師によるKarnofsky
パフォーマンス点数
0=poor 100=good
患者によるKarnofsky
パフォーマンス点数
0=poor 100=good
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
打切りがあるので、連続値回帰で予測できない
5
観察開始 観察終了
肺がんで死亡
交通事故で死亡
脱落
生存
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
解決法打切りなし→生存時間を直接予測
6
打切りあり→生存時間を直接予測できない
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
生存分析の手法
7
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
Kaplan-Meier法で生存曲線の比較
ある時点での生存確率 = その時点での生存者数をその時点で
の対象者数で割る
P_i = (S - D - C) / (S - C)
S = その時点まで生存した人数
D = その時点で死亡した人数
C = その時点で打切りになった人数
この時点より前の打切りはこの時点より前の死亡と同様に対象
者に含まれない
この時点でまだ打切りでないものは対象者に含まれる
P_iの掛け算をして生存曲線を生成
8
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
Kaplan-Meier法で生存曲線を作ってみましょう
9
1. Time
各時間の準備
2. At Risk
各時間で対象者数の計算
3. Failed
各時間で死亡者数の計算
4. Fail Rate
Failed / At Risk
5. Survival Rate
1 - Fail Rate
6. Survival Curve
Survival Rateの掛け算
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
Cox PH 回帰
Kaplan-Meier法では複数の要因が生存に及ぼす影響を見ることができない
このような場合に活用できる手法にCOX比例ハザードモデルというものがある
λ(t|x1, · · · , xn) = λ0(t) exp(β1x1 + · · · + βnxn)
ハザードλはベースラインハザードのλ0と特徴量に依存
10
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
最新のアルゴリズムでやるには...
11
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
汎用的機械学習
で生存予測
12
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
© DataRobot, Inc. All rights reserved.
データの前処理
13
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
Person-Periodデータの作成
データを期間に分割し、各期間生存するかを学習し、将来の各期間について予測
注意点:時間の情報が何らかの形で特徴量セットに含まれているということ
ID 時間 死 打ち切り 薬1 薬2
Ann 2年 1 0 120 180
Ben 2年 0 1 130 110
Cindy 1年 1 0 80
ID 時間 死 薬
Ann 1年 0 120
Ann 2年 1 180
Ben 1年 0 130
Ben 2年 0 110
Cindy 1年 1 80
14
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
Person-PeriodデータでKaplan-Meier生存曲線を作ってみよう
15
1. Time: 一人を期間ごとに
2. Status: もともと1であれば、最後の期間が1
3. Insert PivotTable
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
From Person-Level データ...
16
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
To Person-Periodデータ
17
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
Person-PeriodデータでKaplan-Meier生存曲線
18
Rと同じ曲線
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
© DataRobot, Inc. All rights reserved.
モデリング
19
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
DataRobotで死亡予測
20
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
Person-PeriodデータをDataRobotにドラッグ&ドロップ
21
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
高度なオプションでグループパーティション
注意点:同じ患者のデータの一部が学習に使われて残りが検定に使われることを防ぐこと
22
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
データタブで生存月数と過去の死亡率の関係
23
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
特徴量のインパクト、モデルX-Rayでモデルを元に解釈
24
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
各期間で予測、生存確率を掛け算して生存曲線
25
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
演習:犯罪がいつ起こる
か予測してみよう
26
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
DataRobotで犯罪予測(演習20分)
1. Person-PeriodデータをDataRobotにドラッグ&ドロップ、ターゲットをセット
2. 高度なオプションでグループパーティション
3. データタブで生存月数と過去の死亡率の関係
4. 特徴量のインパクト、モデルX-Rayでモデルを元に解釈
5. 各期間で予測、生存確率を掛け算して生存曲線(時間があれば)
27
各テーブルでRossi
データを使用して釈
放されてからいつ逮
捕されるかを予測し
てみましょう。
いくつかのテーブル
に発表していただき
ます。
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
まとめ
28
Confidential. Copyright © DataRobot, Inc. - All Rights Reserved
Person-periodのデータを準備することで...
● 最新のアルゴリズムを使用して精度をあげることができるかもしれない
○ ケア変更、リソース管理、リスク管理に貢献できる
● DataRobotで分析をして、特徴量のインパクトやモデルX-Rayなどを見ることによっ
て、Kaplan-Meier曲線やCox回帰とは違ったインサイトを得ることができる
○ 要因分析や予測値の理由を見ることができる
29
薬の研究開発 リスク管理ケア変更 リソース管理
Questions?
DataRobot Japan Team
@ DataRobot
30

More Related Content

What's hot

変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)Takao Yamanaka
 
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた. .
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習Masaki Saito
 
PRML輪読#1
PRML輪読#1PRML輪読#1
PRML輪読#1
matsuolab
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
Hiroshi Shimizu
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
Fumihiko Takahashi
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
kazutantan
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
Shota Imai
 
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
Hakky St
 
密度比推定による時系列データの異常検知
密度比推定による時系列データの異常検知密度比推定による時系列データの異常検知
密度比推定による時系列データの異常検知
- Core Concept Technologies
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門Shuyo Nakatani
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類Shintaro Fukushima
 
探索と活用の戦略 ベイズ最適化と多腕バンディット
探索と活用の戦略 ベイズ最適化と多腕バンディット探索と活用の戦略 ベイズ最適化と多腕バンディット
探索と活用の戦略 ベイズ最適化と多腕バンディット
H Okazaki
 
学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」
西岡 賢一郎
 
[DL輪読会]1次近似系MAMLとその理論的背景
[DL輪読会]1次近似系MAMLとその理論的背景[DL輪読会]1次近似系MAMLとその理論的背景
[DL輪読会]1次近似系MAMLとその理論的背景
Deep Learning JP
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
Kota Matsui
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
 
機械学習 入門
機械学習 入門機械学習 入門
機械学習 入門
Hayato Maki
 
工学系大学4年生のための論文の読み方
工学系大学4年生のための論文の読み方工学系大学4年生のための論文の読み方
工学系大学4年生のための論文の読み方
ychtanaka
 

What's hot (20)

変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
 
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
 
条件付き確率場の推論と学習
条件付き確率場の推論と学習条件付き確率場の推論と学習
条件付き確率場の推論と学習
 
PRML輪読#1
PRML輪読#1PRML輪読#1
PRML輪読#1
 
心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する心理学におけるベイズ統計の流行を整理する
心理学におけるベイズ統計の流行を整理する
 
時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
 
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
 
密度比推定による時系列データの異常検知
密度比推定による時系列データの異常検知密度比推定による時系列データの異常検知
密度比推定による時系列データの異常検知
 
Active Learning 入門
Active Learning 入門Active Learning 入門
Active Learning 入門
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
探索と活用の戦略 ベイズ最適化と多腕バンディット
探索と活用の戦略 ベイズ最適化と多腕バンディット探索と活用の戦略 ベイズ最適化と多腕バンディット
探索と活用の戦略 ベイズ最適化と多腕バンディット
 
学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」学習時に使ってはいないデータの混入「リーケージを避ける」
学習時に使ってはいないデータの混入「リーケージを避ける」
 
[DL輪読会]1次近似系MAMLとその理論的背景
[DL輪読会]1次近似系MAMLとその理論的背景[DL輪読会]1次近似系MAMLとその理論的背景
[DL輪読会]1次近似系MAMLとその理論的背景
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)機械学習による統計的実験計画(ベイズ最適化を中心に)
機械学習による統計的実験計画(ベイズ最適化を中心に)
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
機械学習 入門
機械学習 入門機械学習 入門
機械学習 入門
 
工学系大学4年生のための論文の読み方
工学系大学4年生のための論文の読み方工学系大学4年生のための論文の読み方
工学系大学4年生のための論文の読み方
 

Similar to 機械学習による生存予測

20140708 オンラインゲームソリューション
20140708 オンラインゲームソリューション20140708 オンラインゲームソリューション
20140708 オンラインゲームソリューションTakahiro Inoue
 
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
The Japan DataScientist Society
 
セキュリティとコンプライアンスプログラムについて
セキュリティとコンプライアンスプログラムについてセキュリティとコンプライアンスプログラムについて
セキュリティとコンプライアンスプログラムについて
Toshiboumi Ohta
 
ビジネスに役立つデータ分析
ビジネスに役立つデータ分析ビジネスに役立つデータ分析
ビジネスに役立つデータ分析
Issei Kurahashi
 
『ビッグデータ時代を勝ち抜くデータマネジメント』 セミナー資料
『ビッグデータ時代を勝ち抜くデータマネジメント』 セミナー資料『ビッグデータ時代を勝ち抜くデータマネジメント』 セミナー資料
『ビッグデータ時代を勝ち抜くデータマネジメント』 セミナー資料Akihiko Uchino
 
【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略
Developers Summit
 

Similar to 機械学習による生存予測 (6)

20140708 オンラインゲームソリューション
20140708 オンラインゲームソリューション20140708 オンラインゲームソリューション
20140708 オンラインゲームソリューション
 
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
データサイエンティスト協会 木曜勉強会 #02 講演2:『ビッグデータの0次分析手法と適用例のご紹介 ~俯瞰から始まる企業内ビッグデータの活用~』
 
セキュリティとコンプライアンスプログラムについて
セキュリティとコンプライアンスプログラムについてセキュリティとコンプライアンスプログラムについて
セキュリティとコンプライアンスプログラムについて
 
ビジネスに役立つデータ分析
ビジネスに役立つデータ分析ビジネスに役立つデータ分析
ビジネスに役立つデータ分析
 
『ビッグデータ時代を勝ち抜くデータマネジメント』 セミナー資料
『ビッグデータ時代を勝ち抜くデータマネジメント』 セミナー資料『ビッグデータ時代を勝ち抜くデータマネジメント』 セミナー資料
『ビッグデータ時代を勝ち抜くデータマネジメント』 セミナー資料
 
【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略【B-2】AI時代におけるエンジニアの生存戦略
【B-2】AI時代におけるエンジニアの生存戦略
 

機械学習による生存予測

  • 1. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 「機械学習の自動化が AIの民主化を加速する」 スケジュール 18:30-19:00 受付 19:00-19:15 準備(環境、データ) 19:15-19:20 お知らせ 19:20-19:30 生存分析と打切り 19:30-20:00 生存分析の手法 20:00-20:30 汎用的機械学習で生存予測 20:30-20:50 演習(犯罪予測) 20:50-21:00 まとめ、質問、アンケート 機械学習による 生存予測 1
  • 2. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 生存分析と 打切り 2
  • 3. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 生存分析 for improved quality of life 3 ● ヘルスケア(生存分析) ○ 患者がいつ死亡するか ○ 患者がいつ入院するか ○ 患者がいつ病気にかかるか ● 製造(Failure Time 分析) ○ 機械がいつ故障するか ○ 材料がいつ耐えられなくなるか ○ 商品がいつ使えなくなるか ● その他(Time to Event 分析) ○ 顧客がいつ離脱するか ○ 犯罪者がいつ再逮捕されるか ○ 会社がいつ倒産するか ○ いつ結婚するか、離婚するか 薬の研究開発 リスク管理ケア変更 リソース管理
  • 4. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 生存分析ではある事象が起こるまでの時間を分析する 4 医師によるECOG パフォーマンス点数 0=good 3=poor 医師によるKarnofsky パフォーマンス点数 0=poor 100=good 患者によるKarnofsky パフォーマンス点数 0=poor 100=good
  • 5. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 打切りがあるので、連続値回帰で予測できない 5 観察開始 観察終了 肺がんで死亡 交通事故で死亡 脱落 生存
  • 6. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 解決法打切りなし→生存時間を直接予測 6 打切りあり→生存時間を直接予測できない
  • 7. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 生存分析の手法 7
  • 8. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved Kaplan-Meier法で生存曲線の比較 ある時点での生存確率 = その時点での生存者数をその時点で の対象者数で割る P_i = (S - D - C) / (S - C) S = その時点まで生存した人数 D = その時点で死亡した人数 C = その時点で打切りになった人数 この時点より前の打切りはこの時点より前の死亡と同様に対象 者に含まれない この時点でまだ打切りでないものは対象者に含まれる P_iの掛け算をして生存曲線を生成 8
  • 9. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved Kaplan-Meier法で生存曲線を作ってみましょう 9 1. Time 各時間の準備 2. At Risk 各時間で対象者数の計算 3. Failed 各時間で死亡者数の計算 4. Fail Rate Failed / At Risk 5. Survival Rate 1 - Fail Rate 6. Survival Curve Survival Rateの掛け算
  • 10. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved Cox PH 回帰 Kaplan-Meier法では複数の要因が生存に及ぼす影響を見ることができない このような場合に活用できる手法にCOX比例ハザードモデルというものがある λ(t|x1, · · · , xn) = λ0(t) exp(β1x1 + · · · + βnxn) ハザードλはベースラインハザードのλ0と特徴量に依存 10
  • 11. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 最新のアルゴリズムでやるには... 11
  • 12. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 汎用的機械学習 で生存予測 12
  • 13. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved © DataRobot, Inc. All rights reserved. データの前処理 13
  • 14. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved Person-Periodデータの作成 データを期間に分割し、各期間生存するかを学習し、将来の各期間について予測 注意点:時間の情報が何らかの形で特徴量セットに含まれているということ ID 時間 死 打ち切り 薬1 薬2 Ann 2年 1 0 120 180 Ben 2年 0 1 130 110 Cindy 1年 1 0 80 ID 時間 死 薬 Ann 1年 0 120 Ann 2年 1 180 Ben 1年 0 130 Ben 2年 0 110 Cindy 1年 1 80 14
  • 15. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved Person-PeriodデータでKaplan-Meier生存曲線を作ってみよう 15 1. Time: 一人を期間ごとに 2. Status: もともと1であれば、最後の期間が1 3. Insert PivotTable
  • 16. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved From Person-Level データ... 16
  • 17. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved To Person-Periodデータ 17
  • 18. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved Person-PeriodデータでKaplan-Meier生存曲線 18 Rと同じ曲線
  • 19. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved © DataRobot, Inc. All rights reserved. モデリング 19
  • 20. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved DataRobotで死亡予測 20
  • 21. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved Person-PeriodデータをDataRobotにドラッグ&ドロップ 21
  • 22. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 高度なオプションでグループパーティション 注意点:同じ患者のデータの一部が学習に使われて残りが検定に使われることを防ぐこと 22
  • 23. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved データタブで生存月数と過去の死亡率の関係 23
  • 24. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 特徴量のインパクト、モデルX-Rayでモデルを元に解釈 24
  • 25. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 各期間で予測、生存確率を掛け算して生存曲線 25
  • 26. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved 演習:犯罪がいつ起こる か予測してみよう 26
  • 27. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved DataRobotで犯罪予測(演習20分) 1. Person-PeriodデータをDataRobotにドラッグ&ドロップ、ターゲットをセット 2. 高度なオプションでグループパーティション 3. データタブで生存月数と過去の死亡率の関係 4. 特徴量のインパクト、モデルX-Rayでモデルを元に解釈 5. 各期間で予測、生存確率を掛け算して生存曲線(時間があれば) 27 各テーブルでRossi データを使用して釈 放されてからいつ逮 捕されるかを予測し てみましょう。 いくつかのテーブル に発表していただき ます。
  • 28. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved まとめ 28
  • 29. Confidential. Copyright © DataRobot, Inc. - All Rights Reserved Person-periodのデータを準備することで... ● 最新のアルゴリズムを使用して精度をあげることができるかもしれない ○ ケア変更、リソース管理、リスク管理に貢献できる ● DataRobotで分析をして、特徴量のインパクトやモデルX-Rayなどを見ることによっ て、Kaplan-Meier曲線やCox回帰とは違ったインサイトを得ることができる ○ 要因分析や予測値の理由を見ることができる 29 薬の研究開発 リスク管理ケア変更 リソース管理