SlideShare a Scribd company logo
 血中miRNAを用いた疾病バイオマーカー探索
中央大学理工学部物理学科           田口善弘
大阪市立大学大学院医学研究科肝胆膵内科学 
村上善基・河田則文
大垣市民病院消化器科        熊田卓・豊田秀徳
1 統計手法「主成分分析による教師なし学習による変数選択」法
の説明
2 血中エクソーム内microRNAを用いた肝炎判別診断マー
カー探索の試み
1 統計手法「主成分分析による教師なし学習による変数選択」法
の説明
目的:サンプルのラベル情報(患者vs健常者、腫瘍vs正常
組織、など)無しに変数選択する手法が欲しい。
動機:サンプルバイアスをなるべく減らしたい
(例:患者が男性リッチ、健常者が女性リッチ、など意図
しないラベル情報によるバイアスを廃除したい)
人工データによるデモンストレーション
10サンプル∈クラス1 10サンプル∈クラス2
10変数
90変数
2クラスのサン
プルだが、100
変数のうち10
変 数 だ け が 差
があり他の90
変 数 に は 差 が
ない
j番目のサンプルのi番目の変数をxij
xij∈N (μ=1,σ=
1
2
), j∈class1,1≤i≤10
xij∈N (μ=0,σ=
1
2
), j∈class2,1≤i≤10
xij∈N (μ ,σ=
1
2
),10<i,μ=0,1
2群に差がある変数
2群に差が無い変数
N(μ、σ):平均μ、標準偏差σの正規分布
100変数を単純に主成分分析で2次元に射影
(サンプルのラベリング情報は不使用不使用)
第一主成分得点
第
二
主
成
分
得
点
△:2群に差がある10変数
○:2群に差がない90変数
「2群に差がある変数は
『外れ値』として選別可能」
第
一
主
成
分
Class 1
Class 2
第一主成分は2群を分ける成
分に「自動的に自動的に」なっている
サンプル
数値実験
2群の判別:
手法:20サンプルを主成分分析してその第N主成分得点まで
をつかって線形判別。交差検定はLeave One OUT Cross
Validation. 100回繰り返して平均。
Accuracy
0.9
0.5
使用主成分得点数
5 10 15
変数選択なし
変数選択:第一主成分得点の絶対値が大きいM変数を用いて20
サンプルを主成分分析した時の主成分得点を用いて線形判別
M=1
M=6
M=11
変数選択なし
Accuracy
0.9
0.5
使用主成分得点数
5 10 15
変数選択なしとの差
変数選択なし
5%
M=11
「主成分分析による教師なし学習による変数選択主成分分析による教師なし学習による変数選択」
は精度を落とさずに変数選択できる可能性がある。
使用主成分得点数
5 10 15
2 血中エクソーム内microRNAを用いた肝炎判別診断マーカー
探索の試み (Y. Murakami et al, PLoS ONE (2012))
血中エクソソームのmicroRNA(miRNA)を用いて3種類の肝炎
(B型、C型、NASH)と正常群を判別したい。
血中miRNAは疾患特異性が弱いので複数個のmiRNAの組み合
わせが必要⇒変数選択
4群の判別なので単純にt検定などでできない(one vs others
やons vs oneの組み合わせというやり方は勿論ありうる)。
エクソソーム内のmiRNAの抽出:エクソクィック使用
計測:Agilentのマイクロアレイ(NGSじゃないです。すみません)。
gProcessedSignalを平均ゼロ、分散1にしただけの単純な正規化
だけ。 
学習セット
B型肝炎 4、 NASH 12, 正常 24、 C型肝炎 64
変数選択⇒主成分分析を用いた判別分析による交差検定
       B型 NASH 正常 C型
B型       22    1   1 0
NASH 2 88 6 0
  正常      0 3 1414 0
C型       0 0 3 6464
予
測
現実
Accuracy
0.85
12 miRNA使用 使用主成分数15
特許取得可能性があるためmiRNAは非公開
B型 NASH 正常 C型
B型     1313 0 0 4
NASH 0 77 0 1
  正常      1 0 6969 1
C型       2 1 3 2525
テストセット
B型肝炎 16、 NASH 8, 正常 72、 C型肝炎 31
学習セットでの変数選択を用いて主成分分析を用い
た判別分析による交差検定
現実
予
測
Accuracy
0.90
12 miRNA使用 使用主成分数15
C型肝炎の線維化の程度(0〜3ステージ)の判別も可能
今秋発売に向けて製品開発中
この他、14種類の疾患を12種類の血清中血清中miRNAmiRNAで判別可
能なことも解っている。
Y-h. Taguchi and Y. Murakami, PLoS ONE (2013)
hsa-miR-425 hsa-miR-15b hsa-miR-185 hsa-miR-92a
hsa-miR-140-3p hsa-miR-320a hsa-miR-486-5p hsa-miR-16
hsa-miR-191 hsa-miR-106b hsa-miR-19b hsa-miR-30d
上記論文では、変数選択のサンプル依存性が極めて
弱い手法(*)であることも確認されている
(*)変数選択を10 fold 交差検定で確認。多く
の場合、ほぼ100%で同じmiRNAが選ばれる。

More Related Content

Similar to 血中miRNAを用いた疾病バイオマーカー探索

観察研究の質の評価
観察研究の質の評価観察研究の質の評価
観察研究の質の評価
Yoshitake Takebayashi
 
がんセミナー「医療系のための統計の基礎」
がんセミナー「医療系のための統計の基礎」がんセミナー「医療系のための統計の基礎」
がんセミナー「医療系のための統計の基礎」
Kazuo Ishii
 
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
Yasuyuki Okumura
 
PANOPLY: Omics-Guided Drug Prioritization Method Tailored to an Individual Pa...
PANOPLY: Omics-Guided Drug Prioritization Method Tailored to an Individual Pa...PANOPLY: Omics-Guided Drug Prioritization Method Tailored to an Individual Pa...
PANOPLY: Omics-Guided Drug Prioritization Method Tailored to an Individual Pa...
Kyohei Sano
 
大規模医療データベースを活用した治療効果研究の計画と報告
大規模医療データベースを活用した治療効果研究の計画と報告大規模医療データベースを活用した治療効果研究の計画と報告
大規模医療データベースを活用した治療効果研究の計画と報告
Yasuyuki Okumura
 
El.slide arita
El.slide aritaEl.slide arita
El.slide arita
RCCSRENKEI
 

Similar to 血中miRNAを用いた疾病バイオマーカー探索 (7)

観察研究の質の評価
観察研究の質の評価観察研究の質の評価
観察研究の質の評価
 
がんセミナー「医療系のための統計の基礎」
がんセミナー「医療系のための統計の基礎」がんセミナー「医療系のための統計の基礎」
がんセミナー「医療系のための統計の基礎」
 
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
JMDC Claimsデータベースとレセプト情報・特定健診等情報データベースを活用した臨床疫学研究の事例と留意点
 
PANOPLY: Omics-Guided Drug Prioritization Method Tailored to an Individual Pa...
PANOPLY: Omics-Guided Drug Prioritization Method Tailored to an Individual Pa...PANOPLY: Omics-Guided Drug Prioritization Method Tailored to an Individual Pa...
PANOPLY: Omics-Guided Drug Prioritization Method Tailored to an Individual Pa...
 
大規模医療データベースを活用した治療効果研究の計画と報告
大規模医療データベースを活用した治療効果研究の計画と報告大規模医療データベースを活用した治療効果研究の計画と報告
大規模医療データベースを活用した治療効果研究の計画と報告
 
がんについて3
がんについて3がんについて3
がんについて3
 
El.slide arita
El.slide aritaEl.slide arita
El.slide arita
 

More from Y-h Taguchi

Tensor decomposition based and principal component analysis based unsupervise...
Tensor decomposition based and principal component analysis based unsupervise...Tensor decomposition based and principal component analysis based unsupervise...
Tensor decomposition based and principal component analysis based unsupervise...
Y-h Taguchi
 
主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明
主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明
主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明
Y-h Taguchi
 
Tensor decomposition­based unsupervised feature extraction identified the un...
Tensor decomposition­based unsupervised  feature extraction identified the un...Tensor decomposition­based unsupervised  feature extraction identified the un...
Tensor decomposition­based unsupervised feature extraction identified the un...
Y-h Taguchi
 
Tensor decomposition ­based unsupervised feature extraction applied to matrix...
Tensor decomposition ­based unsupervised feature extraction applied to matrix...Tensor decomposition ­based unsupervised feature extraction applied to matrix...
Tensor decomposition ­based unsupervised feature extraction applied to matrix...
Y-h Taguchi
 
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
Y-h Taguchi
 
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Y-h Taguchi
 
Rectified factor networks for biclustering of omics data
Rectified factor networks for biclustering of omics dataRectified factor networks for biclustering of omics data
Rectified factor networks for biclustering of omics data
Y-h Taguchi
 
テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択
Y-h Taguchi
 
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
Y-h Taguchi
 
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
Y-h Taguchi
 
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
Y-h Taguchi
 
Principal component analysis based unsupervised feature extraction applied to...
Principal component analysis based unsupervised feature extraction applied to...Principal component analysis based unsupervised feature extraction applied to...
Principal component analysis based unsupervised feature extraction applied to...
Y-h Taguchi
 
microRNA-mRNA interaction identification in Wilms tumor using principal compo...
microRNA-mRNA interaction identification in Wilms tumor using principal compo...microRNA-mRNA interaction identification in Wilms tumor using principal compo...
microRNA-mRNA interaction identification in Wilms tumor using principal compo...
Y-h Taguchi
 
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Y-h Taguchi
 
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
Y-h Taguchi
 
PCAを用いた2群の有意差検定
PCAを用いた2群の有意差検定PCAを用いた2群の有意差検定
PCAを用いた2群の有意差検定
Y-h Taguchi
 
SFRP1 is a possible candidate for epigenetic therapy in non­small cell lung ...
SFRP1 is a possible candidate for epigenetic  therapy in non­small cell lung ...SFRP1 is a possible candidate for epigenetic  therapy in non­small cell lung ...
SFRP1 is a possible candidate for epigenetic therapy in non­small cell lung ...
Y-h Taguchi
 
A cross-species bi-clustering approach to identifying conserved co-regulated ...
A cross-species bi-clustering approach to identifying conserved co-regulated ...A cross-species bi-clustering approach to identifying conserved co-regulated ...
A cross-species bi-clustering approach to identifying conserved co-regulated ...
Y-h Taguchi
 
Identification of aberrant gene expression associated with aberrant promoter ...
Identification of aberrant gene expression associated with aberrant promoter ...Identification of aberrant gene expression associated with aberrant promoter ...
Identification of aberrant gene expression associated with aberrant promoter ...
Y-h Taguchi
 
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
Heuristic Principal Component Analysis  Based unsupervised Feature Extraction...Heuristic Principal Component Analysis  Based unsupervised Feature Extraction...
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
Y-h Taguchi
 

More from Y-h Taguchi (20)

Tensor decomposition based and principal component analysis based unsupervise...
Tensor decomposition based and principal component analysis based unsupervise...Tensor decomposition based and principal component analysis based unsupervise...
Tensor decomposition based and principal component analysis based unsupervise...
 
主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明
主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明
主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明
 
Tensor decomposition­based unsupervised feature extraction identified the un...
Tensor decomposition­based unsupervised  feature extraction identified the un...Tensor decomposition­based unsupervised  feature extraction identified the un...
Tensor decomposition­based unsupervised feature extraction identified the un...
 
Tensor decomposition ­based unsupervised feature extraction applied to matrix...
Tensor decomposition ­based unsupervised feature extraction applied to matrix...Tensor decomposition ­based unsupervised feature extraction applied to matrix...
Tensor decomposition ­based unsupervised feature extraction applied to matrix...
 
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
 
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
 
Rectified factor networks for biclustering of omics data
Rectified factor networks for biclustering of omics dataRectified factor networks for biclustering of omics data
Rectified factor networks for biclustering of omics data
 
テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択
 
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
 
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
 
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
 
Principal component analysis based unsupervised feature extraction applied to...
Principal component analysis based unsupervised feature extraction applied to...Principal component analysis based unsupervised feature extraction applied to...
Principal component analysis based unsupervised feature extraction applied to...
 
microRNA-mRNA interaction identification in Wilms tumor using principal compo...
microRNA-mRNA interaction identification in Wilms tumor using principal compo...microRNA-mRNA interaction identification in Wilms tumor using principal compo...
microRNA-mRNA interaction identification in Wilms tumor using principal compo...
 
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
 
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
 
PCAを用いた2群の有意差検定
PCAを用いた2群の有意差検定PCAを用いた2群の有意差検定
PCAを用いた2群の有意差検定
 
SFRP1 is a possible candidate for epigenetic therapy in non­small cell lung ...
SFRP1 is a possible candidate for epigenetic  therapy in non­small cell lung ...SFRP1 is a possible candidate for epigenetic  therapy in non­small cell lung ...
SFRP1 is a possible candidate for epigenetic therapy in non­small cell lung ...
 
A cross-species bi-clustering approach to identifying conserved co-regulated ...
A cross-species bi-clustering approach to identifying conserved co-regulated ...A cross-species bi-clustering approach to identifying conserved co-regulated ...
A cross-species bi-clustering approach to identifying conserved co-regulated ...
 
Identification of aberrant gene expression associated with aberrant promoter ...
Identification of aberrant gene expression associated with aberrant promoter ...Identification of aberrant gene expression associated with aberrant promoter ...
Identification of aberrant gene expression associated with aberrant promoter ...
 
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
Heuristic Principal Component Analysis  Based unsupervised Feature Extraction...Heuristic Principal Component Analysis  Based unsupervised Feature Extraction...
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
 

血中miRNAを用いた疾病バイオマーカー探索