7. 二色式マイクロアレイの原理
mRNA
scan
Cells
in a tissue A
Cells
in a tissue B
cDNA
RT and dye
DNA microarray
hybridization
Target Control
赤色:Target>>Control
黄色:Target ~ Control
緑色:Target<<Control
23. 大腸癌 vs. 正常な大腸組織
(Zhan et al., Nature 2001)
62症例 (正常 22 vs. 癌 40)
教師付遺伝子選択で上位3遺伝子を選択
その後にClassification Tree法を適用
性能を5-foldで評価
3遺伝子の選択を前提とした
間違ったクロスバリデーション
24. 乳癌の予後悪 vs. 良
van de Veer et al. Nature 2002
78 症例 (34 予後悪 vs. 44 予後良)
70遺伝子に基づく予後予測器を構成
本文 method には不完全交差検証の方法
付録に、完全な交差検証の方法が記載
比較:予後悪の予測誤差を10%に揃えたとき
完全交差検証での予後良の正解率 27%
不完全交差検証での予後良の正解率 44%
van de Veer et al. NEJM 2002
Nature 論文で構成した予後予測器のテスト
295 症例 (180予後悪 vs. 115 予後良)
Kaplan-Meyerの生存曲線で比較
(正解率の数字は出さずに二群間生存曲線相違の
「統計的有意性」を主張)
25. 乳癌の予後悪 vs. 良
Van’t Veer et al. Nature 2002
Method of supervised classification
We developed a method for classifying breast
tumours into prognostic or diagnostic categories
based on gene expression profiles. This method
includes the following three steps: (1) selection
of discriminating candidate genes by their
correlation with the category; (2) determination
of the optimal set of reporter genes using a
leave-one-out cross validation procedure; (3)
prognostic or diagnostic prediction based on the
gene expression of the optimal set of reporter
genes
31. 情報漏洩について気をつけるべきこと
van de Veer et al. Nature 2002に学ぶべき点
情報漏洩を恐れ過ぎない論法を使っては?
議論を煩雑にする完璧防御は自重するべし
van de Veer の論法:
(1)「情報漏洩を恐れない手法」で分かりやすい結論を示
し、
(2)正しい手法で「情報漏洩の影響の大きさ」を見積もり、
(3)結論(1)の信頼性を議論して、注意喚起する
批判
重要な議論が supplement に回っているのはま
ずい(Simon, R. 2003 British J. of Cancer)
32. 予後予測のための semi-supervised 法
教師付遺伝子選択
生存期間データとの相関で遺伝子順位付け
上位 N 遺伝子を採択
教師無しクラス分類
K-平均法 K=2 → 予後良/予後悪
クロスバリデーションで N を決定
Bair, E. and Tibshirani, R. (2004). Semi-supervised methods to predict patient survival
from gene expression data. PLoS Biology, 2, 511--522.
Cox 比例ハ
ザードモデル
「少数の上位遺伝子を選び出した後は、
遺伝子発現量データに語らせる」
「クラス分類境界を最適化しない」