予測指標の作り方
@第13回秋季生涯教育セミナー
日本プライマリ・ケア連合学会
研究支援委員会
スタッフ 8名(50音順、敬称略)
片岡裕貴(兵庫県立尼崎総合医療センター)
坂西雄太(佐賀大学医学部地域医療支援学講座)
佐々木彰(福島県立医大臨床研究イノベーションセンター)
杉岡隆(佐賀大学医学部地域医療支援学)
高田俊彦(福島県立医科大学白河総合診療アカデミー)
竹島太郎(自治医科大学地域医療学センター地域医療学部門)
橋本忠幸(橋本市民病院)
山本舜悟(神戸大学感染症科)
2
WSトータルの目標
診断の予測指標研究を実施できる!
3
そのための行動目標
・EQUATOR networkについて説明できる
・TRIPOD statementについて説明できる
・予測指標とは何か説明できる
・診断精度研究の枠組みを説明できる
・診断の予測指標研究をTRIPODの枠組みに
分けて説明することができる
・EZRを用いて
ロジスティック回帰分析を実施できる
β値と95%信頼区間を見て変数選択ができる
callibration, discrimination, internal validation, external
validationが実施できる
4
今日の行動目標
・EQUATOR networkについて説明できる
・TRIPOD statementについて説明できる
・予測指標とは何か説明できる
・診断精度研究の枠組みを説明できる
・診断の予測指標研究をTRIPODの枠組みに
分けて説明することができる
・EZRを用いて
ロジスティック回帰分析を実施できる
β値と95%信頼区間を見て変数選択ができる
callibration, discrimination, internal validation, external
validationが実施できる
5
臨
床
研
究
デ
ザ
イ
ン
道
場
訓
一
、
研
究
の
新
規
性
よ
り
も
診
療
現
場
で
真
に
意
味
の
あ
る
ク
エ
ス
チ
ョ
ン
を
考
案
す
べ
し
一
、
統
計
解
析
の
テ
ク
ニ
ッ
ク
よ
り
も
、
ま
ず
は
研
究
デ
ザ
イ
ン
の
真
髄
を
学
ぶ
べ
し
一
、
症
例
報
告
・
取
り
組
み
報
告
か
ら
一
歩
前
に
踏
み
出
す
こ
と
に
努
め
る
べ
し
一
、
多
職
種
に
よ
る
チ
ー
ム
で
臨
床
研
究
を
学
ぶ
こ
と
に
努
め
る
べ
し
一
、
何
よ
り
も
本
日
の
セ
ミ
ナ
ー
に
お
い
て
同
じ
志
を
も
つ
仲
間
と
共
に
楽
し
む
こ
と
に
努
め
る
べ
し
復習
EQUATOR networkについての以下の文章で正し
いものを全て選べ
• 赤道に位置する国の集まった国際会議のことであ
る
• 臨床研究の透明性があり正確な報告を推進してい
るネットワークである
• 臨床研究の報告のためのガイドラインを作成して
いる
• CONSORT声明は、観察研究の報告のためのガイ
ドラインである
• STARD声明は、診断精度研究の報告のためのガ
イドラインである
7
復習
EQUATOR networkについての以下の文章で正し
いものを全て選べ
X 赤道に位置する国の集まった国際会議のことであ
る
○ 臨床研究の透明性があり正確な報告を推進してい
るネットワークである
○ 臨床研究の報告のためのガイドラインを作成して
いる
X CONSORT声明は、観察研究の報告のためのガイ
ドラインである →ランダム化比較試験
○ STARD声明は、診断精度研究の報告のためのガ
イドラインである
8
TRIPOD statementについての以下の文章で正し
いものを全て選べ
• 写真を撮影するための三脚の国際規格である
• 予測指標研究のバイアスを評価するためのガイド
ラインである →PROBAST
• 予測指標の報告のためのガイドラインである
• チェックリスト、説明と詳細の二部構成になって
いる
• H・G・ウェルズの小説に出てくる火星人の名称
である
9
TRIPOD statementについての以下の文
章で正しいものを全て選べ
X 写真を撮影するための三脚の国際規格である
X 予測指標研究のバイアスを評価するためのガイド
ラインである →PROBAST
O 予測指標の報告のためのガイドラインである
チェックリスト、説明と詳細の二部構成になってい
る
X H・G・ウェルズの小説に出てくる火星人の名称
である
10
予測指標についての以下の文章で正しいもの
を全て選べ
• いくつかの臨床指標を組み合わせて、アウトカ
ムを予測するモデルのことである
• 診断の予測指標と予後の予測指標の2種類があ
る
• CHADS2は診断の予測指標である
• Wellsスコアは診断の予測指標である
11
予測指標についての以下の文章で正しいも
のを全て選べ
○ いくつかの臨床指標を組み合わせて、アウト
カムを予測するモデルのことである
○ 診断の予測指標と予後の予測指標の2種類があ
る
X CHADS2は診断の予測指標である→予後
○ Wellsスコアは診断の予測指標である
12
診断精度研究についての以下の文章で正しいものを全て選べ
• 最もシンプルな診断精度研究は、ある対象全員(P)に対
して、疾患を定義する検査(T)と新たに調べたい検査
(I)を行い、その結果を感度や特異度といった指標(O)
でまとめたものである。
• 感度は疾患を持たない対象者のうちで、検査が陰性になる
割合である
• 検査のカットオフ値を変化させても、感度と特異度は変化
しない
• ROC下面積が大きければ、無条件に良い検査である
13
診断精度研究についての以下の文章で正しいものを全て選べ
○ 最もシンプルな診断精度研究は、ある対象全員(P)に対して、
疾患を定義する検査(T)と新たに調べたい検査(I)を行い、その
結果を感度や特異度といった指標(O)でまとめたものである。
X 感度は疾患を持たない対象者のうちで、検査が陰性になる割合で
ある: PID (positive in disease)と
NIH(negative in health)
X 検査のカットオフ値を変化させても、感度と特異度は変化しない
X ROC下面積が大きければ、無条件に良い検査である
→どういう状況で使いたいのか、状況に依存
感度、特異度のどっちが重要?
14
今日の前半のお題
Identifying Patients with Bacteremia in Community-Hospital
Emergency Rooms: A Retrospective Cohort Study
Taro Takeshima , Yosuke Yamamoto, Yoshinori Noguchi,
Nobuyuki Maki, Koichiro Gibo, Yukio Tsugihashi, Asako Doi,
Shingo Fukuma, Shin Yamazaki, Eiji Kajii, Shunichi Fukuhara
Published: March 29, 2016
http://journals.plos.org/plosone/article?id=10.1371/journal
.pone.0148078
15
レクチャー:
予測指標研究の構造
16
構造?
17
構造化とは?
項目ごとに分けて記載すること
整理されて抜けがなくなる
素早く理解できる
18
https://www.nlm.nih.gov/bsd/policy/structured_abstracts.html
福原,2013
臨床疑問の構造化!
PI(E)CO
19
福原,2013
診断精度の研究
20
診断精度の研究
PICOT (何でしたっけ?)
21
検査の臨床疑問の構造化は今回はこれを使います
PI(C)OT(ぴこてぃー)
P: 対象患者 (population: どんな検査をすでに受
けて、どのようなプレゼンテーションか)
I: みたい検査 (index test: 目的は代替?/add
on?/triage?)
C: みたい検査と比較する検査 (comparator)
O: 診断精度の指標 (outcome)
T: みたい病気を定義するもの (target condition)
22
予測指標の報告のための構造
23
予測指標研究の理解/実施のための構造
T: Type of study
R: Research objectives
I: Index rule
P: Participants
O: Outcome
D: Diagnostic/prognostic performance
measures
24
TRIPOD声明日本語翻訳プロジェクトチーム2016(投稿中)
予測指標研究の理解/実施のための構造
TRIPOD PICOT
T: Type of study
R: Research objectives
I: Index rule I
P: Participants P
O: Outcome T
D: Diagnostic/prognostic
performance measures
O
25
Type of
study
-Single gate?
Two gate?
-What kind of
data sources?
Research
objectives
-Rationale?
-Diagnostic/
prognostic?
-Derivation/
Validation?
Index rule
-What kind of
rules?
Participants
-Who included?
-Who excluded?
Outcome
-What kind of
outcomes
were
predicted?
-How
outcomes
were
measured?
Diagnostic/
prognostic
performa-
nce
measures
-Which
performance
measures?
-How much
the
measures?
Item 4a* Item 1, 2,
3a, 3b
Item 15a, b Item 5a, 5b,
5c, 13a,
13b, 13c
Item 6a, 6b,
14a, 14b
Item 10d,
16
グループワーク
27
T: Type of study
入り口は一つ?/2つ?
どんなデータソース?
28
解説: 診断予測研究の“single-gate” or “two-gate”
29
対象となる疾患の含まれる集団
新規検査法
ゴールド・スタンダード
を同時に実施
疾患あり
疾患なし
(健常者を含
む)
新規検査法 新規検査法
コホート型 ケースコントロール型
T: Type of study
入り口は一つ?/2つ?
どんなデータソース?
(書いてありそうな場所は)
30
9:25
共有
入り口は一つ?/2つ?
どんなデータソース?
31
解説:入り口
Setting
The setting was 4 community hospitals
in Japan
The data were obtained from patients
aged 16 years and older
who had undergone blood-culture
testing while in the ER between 1 April
2011 and 31 March 2012.
32
解説:Resultから
33
R: Research objectives
Checklist: (item 1, 2, 3a, 3b)
何が新しい?
診断?予後?
開発?検証?
34
9:33
解説:どのタイミングで、情報を測定しているか?
35
Box A
ある症状を
有する患者
予測因子
アウトカム
同時に測定
(診断)
ある症状を
有する患者
予測因子
アウトカ
ム
経時的に測定
(予後)
別の曝露=バイアス!
解説:開発/検証
37
開発
開発 検証
開発 検証
検証
データセット
Figure 1開発:development, 検証: validation
R: Research objectives
Checklist: (item 1, 2, 3a, 3b)
何が新しい?
診断?予後?
開発?検証?
38
9:40
共有
何が新しい?
診断?予後?
開発?検証?
39
解説
何が新しい?
which will overcome some of the
limitations of prior studies.
40
解説
診断?予後?
new prediction rule to identify
bacteremia
41
解説
開発?検証?
we report on the development
and testing
42
解説
開発?検証?
Derivation data came from the
Japanese Red Cross Nagoya Daini
Hospital, Okinawa General
Hospital, and Shizuoka General Hospital
Validation data came from Tenri
Hospital
43
I: Index rule
Item: 15a, b
何を予測するどんな指標?
44
9:45
共有
何を予測するどんな指標?
45
解説:Resultから
46
解説
何を予測するどんな指標?
• 菌血症を予測
• the ID-BactER score
47
P: Participants
Item: item 5a, 5b, 5c, 13a, 13b, 13c
誰が組み入れ?
誰が除外?
48
9:53
共有
誰が組み入れ?
誰が除外?
49
解説 組み入れられた患者の特徴
50
解説
どんな対象者で開発・検証されているか?
=どんな対象者に(どの程度)当てはめるこ
とができるか?
本当に他の病院/セッティングの患者でも
当てはまる?
51
解説
Discussionにも
community hospitals only in Japan, which
could reduce the external
validity. Further testing with data from
other countries is certainly needed.
52
開発 検証 検証
New !今回の研究
O: Outcome
Item: 6a, 6b, 14a, 14b
(対象者の)どんなアウトカムを予想?
どうやって測定?
53
10:00
共有
54
解説
どうやって測定?
True bacteremia was defined as
growth of known pathogenic
bacteria in 1 blood culture or as
growth of common skin pathogens in
2 blood cultures.
55
解説
・アウトカム評価時のマスク化?
True bacteremia was distinguished from
contamination by the judgment of 2
physicians working independently, each of
whom had more than 10 years of clinical
experience. They referred to the results of
at least 2 blood cultures and to the
patient’s clinical course.
…やりようがない
56
D: Diagnostic/prognostic performance measures
Item: 16
どんな評価指標で性能を評価?
性能はどの程度?
57
10:15
共有
58
解説:discriminationとcalibrationの違い
Calibration(較正):モデルの予測結果と実
測のアウトカムとの一致度
59
解説:discriminationとcalibrationの違い
Discrimination(識別能):アウトカムにな
るイベントのありなしを予測モデルが区別
する性能
60
更に勉強してみたい
IDI,NRIとDecision-analysis
http://www.slideshare.net/shungo1
977/dca-31156004
61
予測指標研究の理解/実施のための構造
T: Type of study
R: Research objectives
I: Index rule
P: Participants
O: Outcome
D: Diagnostic/prognostic performance
measures
62
TRIPOD声明日本語翻訳プロジェクトチーム2016(投稿中)
ID-BactER score
T: 開発、検証
R: これまでより広い対象で
I: ERでよく使われる項目を用いた菌血症予
測ルール
P: 日本の4つの大規模市中病院のERで血培
O: 血培、カルテデータを用いた菌血症診断、
二人の医師によって実施
D: callibrationとAUCを用いた
discrimination、感度を重視したカットオフ
を決めた
63
今日の行動目標
・EQUATOR networkについて説明できる
・TRIPOD statementについて説明できる
・予測指標とは何か説明できる
・診断精度研究の枠組みを説明できる
・診断の予測指標研究をTRIPODの枠組みに
分けて説明することができる
・EZRを用いて
ロジスティック回帰分析を実施できる
β値と95%信頼区間を見て変数選択ができる
callibration, discrimination, internal validation, external
validationが実施できる
64
臨床研究実施の全体像
65
研究目的
=
リサーチ
クエッション
研究
計画書
倫理委員会
データ収集発表 解析
66
臨床研究実施の全体像:7つのステップの位置
67
基本
設計図
研究目的
=
リサーチ
クエッション
研究
計画書
倫理委員会
データ収集発表 解析
臨床研究実施の全体像:今日読んだ論文
68
基本
設計図
研究目的
=
リサーチ
クエッション
研究
計画書
倫理委員会
データ収集発表 解析
臨床研究実施の全体像:TRIPOD声明が規定
69
基本
設計図
研究目的
=
リサーチ
クエッション
研究
計画書
倫理委員会
データ収集発表 解析
臨床研究実施の全体像:これからやること
70
基本
設計図
研究目的
=
リサーチ
クエッション
研究
計画書
倫理委員会
データ収集発表 解析
今日の行動目標
・EQUATOR networkについて説明できる
・TRIPOD statementについて説明できる
・予測指標とは何か説明できる
・診断精度研究の枠組みを説明できる
・診断の予測指標研究をTRIPODの枠組みに
分けて説明することができる
・EZRを用いて
ロジスティック回帰分析を実施できる
β値と95%信頼区間を見て変数選択ができる
callibration, discrimination, internal validation, external
validationが実施できる
71
今日の行動目標
・EQUATOR networkについて説明できる
・TRIPOD statementについて説明できる
・予測指標とは何か説明できる
・診断精度研究の枠組みを説明できる
・診断の予測指標研究をTRIPODの枠組みに
分けて説明することができる
・EZRを用いて
ロジスティック回帰分析を実施できる
β値と95%信頼区間を見て変数選択ができる
callibration, discrimination, internal validation, external
validationが実施できる
72
注意
Macだと一部、上手くいかない事例が報告
されています。
ご容赦ください。
73
まずは用語の復習と整理
• 開発
• Derivation
• Development
基本的に同じ意味です
開発用データセットから予測モデルを
作ること
74
・検証
・validation
作成済みの予測モデルが、
別のデータセットにどの程度当てはまるか
測定すること
• 内的検証(internal validation)
→開発データセットを少し改変して使う
• 外的検証(external validation)
→別データセットを使う
75
ID-BactER score
T: 開発、(外的)検証
R: これまでより広い対象で
I: ERでよく使われる項目を用いた菌血症予測
ルール
P: 日本の4つの大規模市中病院
O: 血培、カルテデータを用いた菌血症診断、
二人の医師によって実施
D: calibration:図とH-L検定
discrimination: AUC、内的/外的検証
感度を重視したカットオフを決めた
76
開発:予測候補因子の選択
予測候補因子の選択
専門家の意見、既存の文献からの知見で選択
限られたサンプルサイズでは多くの因子を扱うことはできない
→ OverfittingとOptimism
Overfitting
モデルの当てはまりに対して過度の期待(Optimism)
モデルの当てはまりを過大評価
例:開発に用いたデータセットでは性能が良くても、別のデータ
セットでは性能が悪い
→”使えない”予測モデル
77
今回のグループワークでは
既に文献下調べが済んで
候補の予測因子が決まった段階
(研究計画書)
は終わって、既にデータが集まった
ところからWSがスタートしていると考えて
ください
78
つづいて
ソフトとデータを読み込んでみましょう
79
EZRで検索
80
https://drive.google.com/drive/u/0
/folders/0ByQi-
d2EoT4VVFU3MTZla2FkaEk
から、2つのファイルをダウンロード
81
shuki_haifu.rda を読み込む
83
新たな変数を作りましょう
84
年齢を2値変数化します
85
age
age65
65
本当は
各種変数にどんなカットオフを
設定するか/しないか
を既存資料とエキスパートオピニオンを
元に決める必要がありますが
本日は省略
データセットでは、各予測変数に対して
1つのカットオフを設定、2値変数化
86
続いてTable 1 患者背景テーブル
87
※時間の都合で変数は減らしています
88
Hosipital
(0が開発セット、1が
検証セット)
Age65, ambulance,
bac_dr, bil_f, bt380,
age
こんな感じ!
89
意味
90
年齢が65歳未満 人数(%)
0が開発セット、1が検証セット
両病院群の割合が同じ
を帰無仮説としたp値
(結果の報告は不要)
帰無仮説!?
帰無仮説:2群の割合は同じ
その前提で実験を繰り返したときに、目の前
にある事象が起こる確率→p値
仮に目の前で極めてまれな事象が起こってい
ると考えた場合、前提とした仮説は間違って
いる!
→差がある(興味のある人は事後補足資料に)
91
予測候補因子から予測因子への絞り込み
Univariate pre-selection
各予測候補因子とアウトカムの単変量解析結果を行い、
多変量解析のモデルに投入する予測候補因子を絞り込
む
単変量解析で一定基準(p<0.2など)を満たすものを
残す
その後、多変量解析する
※他にもいろいろやり方はあります
今回は、Takeshima 2016のやり方を踏襲
詳細はTRIPOD E&E参照
92
どの検定を選ぶのか?© 山崎新先生
アウトカム変数 2値 連続 生存時間
分布の記述 頻度集計
分割表
ヒストグラム
平均、SD
Kaplan-Meier法
単変量解析 カイ二乗検定
(または
フィッシャー検定)
リスク比の推定
T検定
F検定
平均値の差
Log-rank検定
率比の推定
93
お経ですね
それでは、Table 2の単変量解析
94
※変数は少なめにしてます!
95
Age65, bt380, bun20, chill,
ldh400, wbc15
bac_dr
(0が菌血症なし、1があり)
カイ2乗検定
今回はNo
hospital < 1
開発セットに限定!
こんな結果になりました?
bac_dr=0 bac_dr=1 カイ2乗検定のP値
age65=0 230 31 1.43e-05
age65=1 562 184
bt380=0 391 73 1.69e-05
bt380=1 374 139
bun20=0 446 88 5.67e-05
bun20=1 345 127
chill=0 620 137 9.31e-07
chill=1 157 78
ldh400=0 698 183 0.105
ldh400=1 82 31
wbc15=0 633 161 0.072
wbc15=1 147 52
96
※ e-10は、10の-10乗の意味
bac_dr=0 bac_dr=1 カイ2乗検定のP値
age65=0 230 31 1.43e-05
age65=1 562 184
bt380=0 391 73 1.69e-05
bt380=1 374 139
bun20=0 446 88 5.67e-05
bun20=1 345 127
chill=0 620 137 9.31e-07
chill=1 157 78
ldh400=0 698 183 0.105
ldh400=1 82 31
wbc15=0 633 161 0.072
wbc15=1 147 52
今回の変数選択のやり方は
97
※ e-10は、10の-10乗の意味
Only predictors with a p value of less
than 0.05 were kept in the final model.
Derivationの最後:多変量解析
98
99
bac_dr
(0が菌血症なし、
1があり)
Age65, bt380,
bun20, chill
hospital < 1
開発セットに限定!
オッズ比 95%信頼区間下限 95%信頼区間上限 P値
(Intercept) 0.0567 0.0351 0.0915 6.74e-32
age65 2.2800 1.4800 3.5100 1.89e-04
bt380 1.9100 1.3600 2.6800 1.67e-04
bun20 1.9800 1.4200 2.7700 5.87e-05
chill 2.3200 1.6200 3.3100 3.79e-06
100
※ここ以降はコピペできます。Wordをご確認ください
101
fit <- glm(formula =
bac_dr ~ age65 +
bt380 + bun20 + chill,
family = "binomial",
data=Dataset,
subset=hospital < 1)
summary(fit)
選択して実行
これがベータ係数(傾き)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.8699 0.2442 -11.754 < 2e-16 ***
age65 0.8234 0.2205 3.734 0.000189 ***
bt380 0.6484 0.1722 3.765 0.000167 ***
bun20 0.6847 0.1704 4.018 5.87e-05 ***
chill 0.8401 0.1817 4.623 3.79e-06 ***
102
Pが血培陽性の起こる確率とすると
Log(p/(1-p)) = -2.86+0.82*(65歳以上)+0.64*(体温が38℃以上)
+0.68*(BUNが20以上)+0.84*(悪寒あり)
あり:1、なし0
点数化
Coefficients:
age65 bt380 bun20 chill
0.8234 0.6484 0.6847 0.8401
103
便宜上、全部1点ずつに!
Ageとchillを4点
bt380とbunを3点とする
やり方も考えられます
結果がどの程度の当てはまりを持つかは
この後のステップで検証します
scoreという変数を
age65、bt380、bun20、chill
の足し算で作成
104
105
106
Age65+bt380+bun20
+chill
score
できあがり!
bac_dr=0 bac_dr=1
score=0 52 1
score=1 213 24
score=2 316 91
score=3 143 66
score=4 26 30
107
※先ほど使った2群の比較機能を使えば作れます
今日の行動目標
・EQUATOR networkについて説明できる
・TRIPOD statementについて説明できる
・予測指標とは何か説明できる
・診断精度研究の枠組みを説明できる
・診断の予測指標研究をTRIPODの枠組みに
分けて説明することができる
・EZRを用いて
ロジスティック回帰分析を実施できる
β値と95%信頼区間を見て変数選択ができる
callibration, discrimination, internal validation, external
validationが実施できる
108
続いて
Calibrationとdiscrimination
109
復習:discriminationとcalibrationの違い
Calibration(較正):モデルの予測結果と実
測のアウトカムとの一致度
110
解説:discriminationとcalibrationの違い
Discrimination(識別能):アウトカムにな
るイベントのありなしを予測モデルが区別
する性能
111
まずはcalibrationから
・先ほどのように
図で示す
検定で示す
2つのやり方があります
112
Hosmer-Lemeshow検定とは?
要:rms
ResourceSelection, pROC, Polspline
パッケージの追加インストール
※先にpolsplineをインストールすること
パッケージの詳細な説明は
https://cran.r-
project.org/web/packages/rms/index.
html
CRAN+パッケージ名でググると出てきます
113
※ネットがつながっている状態で
114
R console です!
115
OKをクリック
Polsplineをインストール
116
OKをクリック
続けて
rms
ResourceSelection
pROC
をインストールしてください
117
続いてロードしましょう
118
library (rms)
library (ResourceSelection)
library (pROC)
※以降はプログラムのコピペで
各班で進めてください
119
R コマンダー
コピペ
選択して反転
クリック
あとは、Wordのファイル通りに
適宜コピペして進めてください
120
こんな感じのグラフ書けました?
121
11:45まで
calibration discrimination
まとめ
こんな人にお勧め
予測モデル研究
• 職人芸的な確率の見積もりを数値化し
てみたい
• いきなり前向き研究はハードルが高い
→既存のデータベースを使ってできる
• 斬新なリサーチクエスチョンが思いつかない
→既存のルールの検証研究(external
validation)も意味がある
122
まとめ
123
山本 第6回臨床医のための「臨床研究てらこ屋」
Further reading
124
125
以下はおまけスライド
P値とは
126
まずはこちらを見てみましょう。
『All You Need Is Kill』IMAX予告編
https://www.youtube.com/watch?v
=nBs7vxHCvzg
(仮説)検定: 以下の様な研究結果が出ました
体重減少
あり
体重減少
なし
合計
エステに
通った
40 50 90
エステに
通わなかった
20 70 90
合計 60 120 180
127
体重減少のあったリスク差は?リスク比は?
(仮説)検定: 以下の様な研究結果が出ました
体重減少
あり
体重減少
なし
合計
エステに
通った
40 50 90
エステに
通わなかった
20 70 90
合計 60 120 180
128
リスク差 40/90 – 20/90 ≒ 0.44- 0.22 = 0.22
リスク比 40/90 / (20/90) = 2
まずは仮説を考える
・エステに通った場合と
通わなかった場合を比較すると
体重に変化はない
129
エステに通った場合と
通わなかった場合を比較すると
体重に変化はない
という仮説の元に「実験」を繰り返してみる
その場合、体重減少の起こる確率は1/3
130
体重減少
あり
体重減少
なし
合計
エステAに
通った
40 50 90
エステAに
通わなかった
20 70 90
合計
60 120 180
実験を繰り返してみたとき
1/3で体重減少が起こる前提で
180回実験を繰り返す
今回と同じ事象が起こる確率は?
131
実験を繰り返してみたとき
1/3で体重減少が起こる前提で
180回実験を繰り返す
今回と同じ事象が起こる確率は?
132
40人よりも多い人が体重減少する確率
=0.015444
これって偶然?
133
Welcome to the “P” world
134
0.05
きっと必然だろうと考えると、前提にした
仮説は間違っている!
エステに通った場合と
通わなかった場合を比較すると
体重に変化はない
135
→差がある
逆に
検定の前提にした仮説が間違っていると言
えなかった場合
エステに通った場合と
通わなかった場合を比較すると
体重に変化はない
136
≠差はない
=差があるとは言えない(二重否定)
絵にしてみると
137
エステに
通った
エステに
通わなかった
変化なし
50人
やせた
40人
変化なし
70人
ランダムサンプリング
やせ
た
20人
ここの差ではなく
こっちの差を見ている
仮に人数が10倍だったら
138
体重減少
あり
体重減少
なし
合計
エステAに
通った
400 500 900
エステAに
通わなかった
200 700 900
合計
600 1200 1800
400人よりも多い人が体重減少する確率
< 0.000001
p値を小さくするもの
・リスク差の大きさ
・人数
→なので、統計学的に”有意”であることは、
臨床的に”優位”であることを必ずしも
意味しない
139
もう一度、別の表現で
検定で見ているのは
偶然の変動でどの程度の差があるか
つまり、偶然誤差の評価
系統的誤差(バイアス)の影響を取り除く
ことはできません
→バイアスを減らす研究デザインが重要!
140
質問?
srws.hcru@gmail.com
141

20161106予測指標の作り方当日1031 配布版

Editor's Notes

  • #11 https://upload.wikimedia.org/wikipedia/commons/5/5a/War-of-the-worlds-tripod.jpg
  • #18 https://ja.wikipedia.org/wiki/%E9%AA%B8%E9%AA%A8
  • #20 https://upload.wikimedia.org/wikipedia/commons/3/34/%E9%A3%9B%E3%81%B3%E5%87%BA%E3%81%97%E3%83%9A%E3%82%B3%E3%81%A1%E3%82%83%E3%82%93.JPG
  • #28 https://pixabay.com/ja/%E9%A3%9F%E7%B3%A7-%E3%82%B5%E3%83%B3%E3%83%89%E3%82%A4%E3%83%83%E3%83%81-%E9%A3%9F%E4%BA%8B-%E6%98%BC%E9%A3%9F-%E5%A4%95%E6%96%B9-%E6%96%99%E7%90%86-%E9%A3%9F%E3%81%B9%E7%89%A9%E3%81%AE%E5%86%99%E7%9C%9F-1351286/ https://thenounproject.com/search/?q=lecture&i=1499 https://pixabay.com/static/uploads/photo/2015/09/09/19/03/sandwich-932646_960_720.jpg
  • #41 Attempts to devise a quick procedure to identify patients with bacteremia have had only limited success. [12] Some are useful only in elderly patients [13] or only in those with urinarytract infections [14] or with pneumonia. [15] Others require complex calculations, [16] or use rare or difficult-to-obtain measurements. [17, 18] While some studies reported rules for predicting hospital-acquired bacteremia, [3, 13, 16, 19–21] at least three procedures have been developed to identify community acquired bacteremia among ER patients. [17, 18, 22] They were developed using data from one university hospital each, so their utility in ERs of various community hospitals is unclear. In addition, they use bands or procalcitonin values, which are Identifying Patients with Bacteremia in Community-Hospital Emergency Rooms PLOS ONE | DOI:10.1371/journal.pone.0148078 March 29, 2016 2 / 17 usually not available in ERs of community hospitals, [17, 18] and their development did not include validation studies. [18, 22]
  • #61 青いのがAUCROC ただし、ベースラインモデルに加えた場合!!! 下は各criteriaを比較した場合のp値 上はcronbach α
  • #66 https://pixabay.com/ja/%E4%BC%9A%E8%AD%B0-%E4%BA%BA-%E3%83%86%E3%83%BC%E3%83%96%E3%83%AB-%E7%A7%91%E5%AD%A6%E8%80%85-%E3%83%87%E3%82%A3%E3%83%99%E3%83%BC%E3%83%88-%E3%83%87%E3%82%A3%E3%82%B9%E3%82%AB%E3%83%83%E3%82%B7%E3%83%A7%E3%83%B3-152506/ https://pixabay.com/ja/%E6%80%9D%E8%80%83-%E5%9B%B3-%E4%BA%BA-%E9%9D%92-%E3%82%B9%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E5%9B%B3-%E8%80%83%E6%85%AE%E3%81%97%E3%81%BE%E3%81%99-%E3%82%B3%E3%83%B3%E3%82%BB%E3%83%97%E3%83%88-%E6%96%87%E5%AD%97-25548/
  • #68 https://pixabay.com/ja/%E4%BC%9A%E8%AD%B0-%E4%BA%BA-%E3%83%86%E3%83%BC%E3%83%96%E3%83%AB-%E7%A7%91%E5%AD%A6%E8%80%85-%E3%83%87%E3%82%A3%E3%83%99%E3%83%BC%E3%83%88-%E3%83%87%E3%82%A3%E3%82%B9%E3%82%AB%E3%83%83%E3%82%B7%E3%83%A7%E3%83%B3-152506/ https://pixabay.com/ja/%E6%80%9D%E8%80%83-%E5%9B%B3-%E4%BA%BA-%E9%9D%92-%E3%82%B9%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E5%9B%B3-%E8%80%83%E6%85%AE%E3%81%97%E3%81%BE%E3%81%99-%E3%82%B3%E3%83%B3%E3%82%BB%E3%83%97%E3%83%88-%E6%96%87%E5%AD%97-25548/
  • #69 https://pixabay.com/ja/%E4%BC%9A%E8%AD%B0-%E4%BA%BA-%E3%83%86%E3%83%BC%E3%83%96%E3%83%AB-%E7%A7%91%E5%AD%A6%E8%80%85-%E3%83%87%E3%82%A3%E3%83%99%E3%83%BC%E3%83%88-%E3%83%87%E3%82%A3%E3%82%B9%E3%82%AB%E3%83%83%E3%82%B7%E3%83%A7%E3%83%B3-152506/ https://pixabay.com/ja/%E6%80%9D%E8%80%83-%E5%9B%B3-%E4%BA%BA-%E9%9D%92-%E3%82%B9%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E5%9B%B3-%E8%80%83%E6%85%AE%E3%81%97%E3%81%BE%E3%81%99-%E3%82%B3%E3%83%B3%E3%82%BB%E3%83%97%E3%83%88-%E6%96%87%E5%AD%97-25548/
  • #70 https://pixabay.com/ja/%E4%BC%9A%E8%AD%B0-%E4%BA%BA-%E3%83%86%E3%83%BC%E3%83%96%E3%83%AB-%E7%A7%91%E5%AD%A6%E8%80%85-%E3%83%87%E3%82%A3%E3%83%99%E3%83%BC%E3%83%88-%E3%83%87%E3%82%A3%E3%82%B9%E3%82%AB%E3%83%83%E3%82%B7%E3%83%A7%E3%83%B3-152506/ https://pixabay.com/ja/%E6%80%9D%E8%80%83-%E5%9B%B3-%E4%BA%BA-%E9%9D%92-%E3%82%B9%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E5%9B%B3-%E8%80%83%E6%85%AE%E3%81%97%E3%81%BE%E3%81%99-%E3%82%B3%E3%83%B3%E3%82%BB%E3%83%97%E3%83%88-%E6%96%87%E5%AD%97-25548/
  • #71 https://pixabay.com/ja/%E4%BC%9A%E8%AD%B0-%E4%BA%BA-%E3%83%86%E3%83%BC%E3%83%96%E3%83%AB-%E7%A7%91%E5%AD%A6%E8%80%85-%E3%83%87%E3%82%A3%E3%83%99%E3%83%BC%E3%83%88-%E3%83%87%E3%82%A3%E3%82%B9%E3%82%AB%E3%83%83%E3%82%B7%E3%83%A7%E3%83%B3-152506/ https://pixabay.com/ja/%E6%80%9D%E8%80%83-%E5%9B%B3-%E4%BA%BA-%E9%9D%92-%E3%82%B9%E3%83%86%E3%82%A3%E3%83%83%E3%82%AF%E5%9B%B3-%E8%80%83%E6%85%AE%E3%81%97%E3%81%BE%E3%81%99-%E3%82%B3%E3%83%B3%E3%82%BB%E3%83%97%E3%83%88-%E6%96%87%E5%AD%97-25548/
  • #94 これだけです! 「お経」として覚えてしまいましょう。
  • #102 confint(fit)
  • #112 青いのがAUCROC ただし、ベースラインモデルに加えた場合!!! 下は各criteriaを比較した場合のp値 上はcronbach α
  • #126 リスク差 40/90 – 20/90 ≒ 0.44- 0.22 = 0.22 リスク比 40/90 / (20/90) = 2
  • #127 ALL YOU NEED IS KILL, 2014
  • #128 リスク差 40/90 – 20/90 ≒ 0.44- 0.22 = 0.22 リスク比 40/90 / (20/90) = 2
  • #131 60/180
  • #132 実際のリスク差 0.34 0回 https://en.wikipedia.org/wiki/P-value
  • #133 実際のリスク差 0.34 0回 https://en.wikipedia.org/wiki/P-value
  • #134 https://pixabay.com/ja/%E3%82%AD%E3%83%A5%E3%83%BC%E3%83%96-%E3%82%AB%E3%83%A9%E3%83%95%E3%83%AB-%E9%80%8F%E6%98%8E-%E3%83%9F%E3%83%A9%E3%83%BC-%E9%81%8B-%E3%82%AF%E3%83%A9%E3%83%83%E3%83%97%E3%82%B9-%E7%9E%AC%E9%96%93%E3%81%AE%E9%80%9F%E3%81%95-769344/
  • #135 https://pixabay.com/ja/%E3%82%B9%E3%82%B1%E3%83%BC%E3%83%AB-%E7%A2%BA%E7%8E%87-%E7%B5%B1%E8%A8%88-0-1-%E7%AF%84%E5%9B%B2-%E6%A0%A1%E6%AD%A3-%E8%A1%8C-%E9%96%93%E9%9A%94-%E6%B8%AC%E5%AE%9A-24167/