SlideShare a Scribd company logo
1 of 26
データベース時代の
研究デザイン
~ Quasi-experimental design ~
沖縄県立中部病院 臨床研究推進委員会
2017/8/22(TUE) 17:00-18:00
@第一会議室
Koichiro Gibo, MD, MMSc
はじめに
• 研究ってめんどくさいですよね?
• 超めんどくさがりにもできるだけ楽にできて、なおかつ学術的
にも評価の高いデザインをご紹介します。
• キーワードは..
1. データベースやレジストリを使う
2. Counterfactual(反事実)
3. Quasi-experimental design(準実験デザイン)
研究者の必須要件とは?
• 統計?
• ではなく、リサーチクエスチョンとデザインが
組めること
臨床疫学研究とは
臨床研究はデザインが9割
データ集めるのしんどい
• 古典的な前向き疫学的デザインでは、計画を立てて、デー
タを集める必要がある。これが..
•実にしんどい!
• カルテみたりデータベース(電子カルテ、学会のレジストリ、
DPCデータetc.)使えばいいじゃん!
チャートレビューの落とし穴
チャートレビューによる研究
は国際的に通用しない
Looking Through the Retrospectoscope: Reducing Bias in Emergency Medicine Chart Review Studies Kaji, Amy H. et al. Annals
of Emergency Medicine , Volume 64 , Issue 3 , 292 - 298
データベース研究(レジストリ)
• 目的のしっかりした、研究前提で、かつデータマネージがしっ
かりできているレジストリだと良い研究が結構簡単にできる。
– 例:JEANスタディ、救急蘇生統計、学会主導データ
• 国際的な学術論文を書きたい!というのなら、これらのレジス
トリベースの研究が手っ取り早い。
• 欠点:
– データ処理が大変でプログラミングスキルがないと詰む可能性が高
い。
– 高度な統計手法を必要とすることが多い
データベース研究(電子カルテ、DPCデータetc)
• もともと研究目的ではないもの
• レジストリと較べて
• 利点:
– 入手しやすい
– nが多く、観察期間も長いことが多い
• 欠点:
– 欲しい変数がないことが多い
– データマネージができていないと、GIGO(garbage in, garbage
out)
– 従来の研究デザインでは強いバイアスを生じうる
データベース研究のためのデザイン
• 中断時系列解析(ITS: interrupted time-series)
• 自己対照ケースシリーズ(SCCS: self-controlled
case series)
• この2つを紹介
重要な脱線:因果とは?
• 医学研究の目的は畢竟、原因と結果の関係(因果)を探ること。
• Question:
• コーラを飲む(原因・介入) → ゲップが出る(結果):本当?
思考実験: 因果推論の根本問題
https://www.slideshare.net/R
SS6/choosing-appropriate-
statistical-test-rss6-2104
思考実験: 因果推論の根本問題
https://www.slideshare.net/R
SS6/choosing-appropriate-
statistical-test-rss6-2104
Counterfactual (反事実)
• 因果推論を行う上で重要な概念
• デザインや統計学的手法で反事実
を推測することで、因果推論が可能
• 統計学:傾向スコア、周辺構造モデ
ル、do演算子
• デザイン:RCT、前向きコホート、
Quasi-experimental design
• RCT>>その他
中断時系列デザイン(ITS)
• Quasi-experimental design (準実験デザイン)の一つ
• もともと社会経済科学で使用されてきた。
• 図で理解するほうが早い。
中断時系列デザイン(ITS)
James Lopez Bernal, Steven Cummins, Antonio Gasparrini; Interrupted time series regression for the evaluation of public health interventions:
a tutorial, International Journal of Epidemiology, Volume 46, Issue 1, 1 February 2017, Pages 348–355
Counterfactual
インパクトモデルはアプリオリに決定する
James Lopez Bernal, Steven Cummins, Antonio Gasparrini; Interrupted time series regression for the evaluation of public health interventions:
a tutorial, International Journal of Epidemiology, Volume 46, Issue 1, 1 February 2017, Pages 348–355
時系列モデルは4要素からなる
1.レベル(切片)
2.トレンド
3.季節性/周期性
4.(自己回帰性)
季節性を除去してトレンド部分を
抽出する
James Lopez Bernal, Steven Cummins, Antonio Gasparrini; Interrupted time series regression for the evaluation of public health interventions:
a tutorial, International Journal of Epidemiology, Volume 46, Issue 1, 1 February 2017, Pages 348–355
中断時系列デザイン:ITS
• 例:
• 大阪府における救急隊用のスマートフォンアプリ(ORION)
によるたらいまわしの減少効果について
ITS まとめ
• 何らかの制度やシステムが変化した前後の時系列を比較
して、その変化による因果効果を調べることができる。
• 例:OCHでは11年前に血液培養採取時の消毒方法が当
時の研修医の研究によって劇的に変化した。この採取法に
よりコンタミ率がどうなったかについて、その前後の比較的
長期間のデータが得られれば、十分ITSによる因果推論が
可能。
• データベース主体の研究では非常に有用
自己対照ケースシリーズ(SCCS)
• 似たようなものに"Before and After design"というのもある。
• もともとワクチン接種と副反応の関係をみるために使われた
自己対照のコンセプト
全観察期間
肥満手術
B
・
・
コントロール期間
: 2年
介入期間
: 2年
Aさん
心不全による
ED受診or入院肥満手術を受けたケー
ス群(ケースシリーズ)
Before After
自己対照ケースシリーズ(SCCS)
• 利点:
– ケース群だけで良い。そのためコントロール群を設定することによる
バイアスを避けることができる。
– 時間非依存性変数(例:性別)をすべて調整できる。そのため複雑な
統計モデルを立てる必要がなくなる
• 欠点:
– 縦断的なデータベースが必要
– データの前処理が結構複雑
– コントロール期間内のイベントによって介入が引き起こされる(因果
の逆転)ことがないことが条件
)(ケース肥満患者数
入院 受診orED
条件付きポアソン回帰
• 因果関係を述べるにはいくつかの仮定が必要だが、非常に
有用な方法
• ケース群だけを選べば良く、そのケース群の縦断的なデータ
があれば使えるかも。
• アウトカムのイベントはできるだけ早く起きるタイプのほうが
良い。
• 例:ある手術とまだ文献的に知られていない副作用との因果
関係を見たいときなど
SCCS:まとめ
Enjoy your research !

More Related Content

What's hot

GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論Koichiro Gibo
 
データベース研究の報告
データベース研究の報告データベース研究の報告
データベース研究の報告Yasuyuki Okumura
 
「生存時間分析」の報告事例
「生存時間分析」の報告事例「生存時間分析」の報告事例
「生存時間分析」の報告事例yokomitsuken5
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択kazutantan
 
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価SR WS
 
オンライン心理学実験の基本的な流れ
オンライン心理学実験の基本的な流れオンライン心理学実験の基本的な流れ
オンライン心理学実験の基本的な流れMasanori Kobayashi
 
内容的妥当性,構造的妥当性と仮説検定の評価
内容的妥当性,構造的妥当性と仮説検定の評価内容的妥当性,構造的妥当性と仮説検定の評価
内容的妥当性,構造的妥当性と仮説検定の評価Yoshitake Takebayashi
 
「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例Sayuri Shimizu
 
曝露がアンカーとなるデザイン
曝露がアンカーとなるデザイン曝露がアンカーとなるデザイン
曝露がアンカーとなるデザインYasuyuki Okumura
 
Rで潜在ランク分析
Rで潜在ランク分析Rで潜在ランク分析
Rで潜在ランク分析Hiroshi Shimizu
 
Rでコンジョイント分析
Rでコンジョイント分析Rでコンジョイント分析
Rでコンジョイント分析osamu morimoto
 
20170305 srws robins i最終版
20170305 srws robins i最終版20170305 srws robins i最終版
20170305 srws robins i最終版SR WS
 
傾向スコアマッチと多重補完法の解説 その2
傾向スコアマッチと多重補完法の解説 その2傾向スコアマッチと多重補完法の解説 その2
傾向スコアマッチと多重補完法の解説 その2Atsushi Shiraishi
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会takehikoihayashi
 
愛大学生用、メタアナリシスについて
愛大学生用、メタアナリシスについて愛大学生用、メタアナリシスについて
愛大学生用、メタアナリシスについてTakashi Fujiwara
 
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】Hiroyuki Muto
 

What's hot (20)

GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論
 
データベース研究の報告
データベース研究の報告データベース研究の報告
データベース研究の報告
 
「生存時間分析」の報告事例
「生存時間分析」の報告事例「生存時間分析」の報告事例
「生存時間分析」の報告事例
 
ベイズファクターとモデル選択
ベイズファクターとモデル選択ベイズファクターとモデル選択
ベイズファクターとモデル選択
 
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
 
オンライン心理学実験の基本的な流れ
オンライン心理学実験の基本的な流れオンライン心理学実験の基本的な流れ
オンライン心理学実験の基本的な流れ
 
内容的妥当性,構造的妥当性と仮説検定の評価
内容的妥当性,構造的妥当性と仮説検定の評価内容的妥当性,構造的妥当性と仮説検定の評価
内容的妥当性,構造的妥当性と仮説検定の評価
 
潜在クラス分析
潜在クラス分析潜在クラス分析
潜在クラス分析
 
「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例「傾向スコア分析」 報告事例
「傾向スコア分析」 報告事例
 
曝露がアンカーとなるデザイン
曝露がアンカーとなるデザイン曝露がアンカーとなるデザイン
曝露がアンカーとなるデザイン
 
Rで潜在ランク分析
Rで潜在ランク分析Rで潜在ランク分析
Rで潜在ランク分析
 
Rでコンジョイント分析
Rでコンジョイント分析Rでコンジョイント分析
Rでコンジョイント分析
 
20170305 srws robins i最終版
20170305 srws robins i最終版20170305 srws robins i最終版
20170305 srws robins i最終版
 
傾向スコアマッチと多重補完法の解説 その2
傾向スコアマッチと多重補完法の解説 その2傾向スコアマッチと多重補完法の解説 その2
傾向スコアマッチと多重補完法の解説 その2
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
 
観察研究の必須事項
観察研究の必須事項観察研究の必須事項
観察研究の必須事項
 
観察研究の質の評価
観察研究の質の評価観察研究の質の評価
観察研究の質の評価
 
愛大学生用、メタアナリシスについて
愛大学生用、メタアナリシスについて愛大学生用、メタアナリシスについて
愛大学生用、メタアナリシスについて
 
Rで学ぶロバスト推定
Rで学ぶロバスト推定Rで学ぶロバスト推定
Rで学ぶロバスト推定
 
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
StanとRで折れ線回帰──空間的視点取得課題の反応時間データを説明する階層ベイズモデルを例に──【※Docswellにも同じものを上げています】
 

Similar to データベース時代の疫学研究デザイン

20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザインkulibrarians
 
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025Yusuke Yamamoto
 
探求の道 Lead Clearly
探求の道 Lead Clearly探求の道 Lead Clearly
探求の道 Lead ClearlyYutaka KATAYAMA
 
CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)Ikki Ohmukai
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方Yasushi Hara
 
170907第3回hcru ws
170907第3回hcru ws170907第3回hcru ws
170907第3回hcru wsSR WS
 
ICST2015勉強会 ICST2017に向けて
ICST2015勉強会 ICST2017に向けてICST2015勉強会 ICST2017に向けて
ICST2015勉強会 ICST2017に向けてHironori Washizaki
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法Takayuki Itoh
 
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパスMatsushita Laboratory
 
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介scirexcenter
 
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続きSayuri Shimizu
 
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?Masatsura IGAMI
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Eric Sartre
 
コンセプト資料 Open research-140207
コンセプト資料 Open research-140207コンセプト資料 Open research-140207
コンセプト資料 Open research-140207murakamitubasa
 
デザイン学会2106
デザイン学会2106デザイン学会2106
デザイン学会2106shujiisotani
 
研究のデザイン入門2017
研究のデザイン入門2017研究のデザイン入門2017
研究のデザイン入門2017Hironori Washizaki
 
エンジニアリングテックとは何なのか.pdf
エンジニアリングテックとは何なのか.pdfエンジニアリングテックとは何なのか.pdf
エンジニアリングテックとは何なのか.pdfYoshiki Tanaka
 

Similar to データベース時代の疫学研究デザイン (20)

20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
20131025 ku librarians勉強会#169:図書館データを研究推進にもっと利活用するための情報デザイン
 
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025
図書館データを研究推進にMOTTO利活用するための情報デザイン@京都大学図書館勉強会20131025
 
探求の道 Lead Clearly
探求の道 Lead Clearly探求の道 Lead Clearly
探求の道 Lead Clearly
 
rcast_20140411
rcast_20140411rcast_20140411
rcast_20140411
 
CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)CiNii Researchと大学図書館(2018.6.18)
CiNii Researchと大学図書館(2018.6.18)
 
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回サイエンスリンケージデータベースの使い方
SciREX「ナショナルイノベーションシステムに係る定量データとその分析手法」WSシリーズ第4回 サイエンスリンケージデータベースの使い方
 
170907第3回hcru ws
170907第3回hcru ws170907第3回hcru ws
170907第3回hcru ws
 
ICST2015勉強会 ICST2017に向けて
ICST2015勉強会 ICST2017に向けてICST2015勉強会 ICST2017に向けて
ICST2015勉強会 ICST2017に向けて
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法
 
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
松下研究室紹介_関西大学高槻キャンパスオープンキャンパス
 
研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とは研究データ流通を支える情報基盤とは
研究データ流通を支える情報基盤とは
 
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
戦略的創造研究推進事業の戦略目標策定におけるサイエンスマップ等のデータ活用例の紹介
 
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
大規模医療データベースを活用した治療効果研究の計画と報告:DB研究の手続き
 
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
科学研究プロジェクトの動機は研究活動をどのように特徴づけるのか?
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
 
コンセプト資料 Open research-140207
コンセプト資料 Open research-140207コンセプト資料 Open research-140207
コンセプト資料 Open research-140207
 
デザイン学会2106
デザイン学会2106デザイン学会2106
デザイン学会2106
 
研究のデザイン入門2017
研究のデザイン入門2017研究のデザイン入門2017
研究のデザイン入門2017
 
研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割
 
エンジニアリングテックとは何なのか.pdf
エンジニアリングテックとは何なのか.pdfエンジニアリングテックとは何なのか.pdf
エンジニアリングテックとは何なのか.pdf
 

データベース時代の疫学研究デザイン