SlideShare a Scribd company logo
miRNA­mRNA相互作用同定を用いた
腎芽腫関連遺伝子の推定
田口善弘
中央大学・物理学科
本研究はBIBE2016で発表したものです。
http://biorxiv.org/content/early/2016/08/30/059295
http://bibe2016.asia.edu.tw/
DOI 10.1109/BIBE.2016.14
研究の動機:
がんの原因遺伝子、バイオマーカーなどを患者と健常者
の間で発現差が大きい遺伝子から選ぼうという試みはよ
くなされている。
しかし、擬陽性(False Positive, FP)の多さが大きな問題
になっている。
近年はマルチオミックスデータで絞りこみを行おうという
動きが増えてきている。
本研究ではmRNAとmiRNAの発現量から統合解析を行
うことでガン関連遺伝子・バイオマーカーのFPを減らすこ
とを試みる
特に腎芽腫は遺伝子の突然変異と関係付けられていな
いのでエペジェネティックすを考慮する価値がある
microRNA (miRNA)とは?
DNA
mRNA
protein
miRNA
miRNA­mRNA 相互作用の予測には困難が伴う
*ペアの数、多すぎ
 mRNA 〜 104, miRNA 〜 103 → pairs 〜 107
*情報科学的な予測はあるが配列ベース
どうすればいい?
発現差(differential expression, DE)を用いてあら
かじめmRNA/miRNAをスクリーニングしておく。
 例:疾患関連 miRNA­mRNA ペア
 → mRNA/miRNA 有意なDEだけを考慮
mRNA miRNA
健
常
者
患
者
マ
ッ
チ
ン
グ
負相関
健
常
者
患
者
問題点
 ”有意な”有意なDE” DE”   に任意性ありすぎ。
スクリーニングの基準: P­値とFoldChange:FC
P­値:
mRNA/miRNAの数はNで固定だが
サンプル数Mは変化する
 M:大 → P:小
FC:
典型的なしきい値: 2  or ½, バイアスはないか?
先行研究の実施例
significant DEsignificant DE
cancers
Previous studies
None
No mention
現実には....
 P­value and FC を調整→ よい結果
これでいいのかの議論はなし
生物学的に生物学的にOKOKならならOKOKなの?なの?
(No discussion about P­value and FC)
→”有意な DE のあるmRNA/miRNAはどれか?”
→本当の答えはあるはずだが....
→ データ駆動型のアプローチなら恣意性を回避可能
主成分分析(PCA)を用いた教師なし学習による変数選択とは?
 N 変数(遺伝子)
カテゴリ多クラス
分類
普通のPCAではサンプルを埋め込むが今回は変数(遺伝
子)の方を低次元( Q 次元)に埋め込む.
PCA
PC1
サンプル主成分負荷量
M サンプル
N × M 行列 X (実数値)
PC2
PC1
主成分得点
+
+ +
+ +
++
+
+
+
++ +
+
+
群間で発現に差異なし
人工データによるデモ
10 サンプル
10 サンプル
90 変数(遺伝子) 10 変数(遺伝子)
N(0)
N()
[N()+N(0)]/2
+:Top 10 外れ値

外れ値を選べば教師なし学
習的に二群に差があるもの
をみつてられる
精度精度(100 (100 試行平均試行平均))
 89.5% (
 52.6% (
PC1
PC2
正規分布 μ:平均 ½ :標準偏差
主成分分析主成分分析(PCA)(PCA)を用いた教師なし学習による変数選択を使えばを用いた教師なし学習による変数選択を使えば
mRNA/miRNA, N固定
M:可変,  M → ∞で収束するものは?
⇓
主成分得点(遺伝子)の方は M → ∞ で収束する?
M(≪N)
サンプル
遺
伝
子
発
現
行
列
主成分負荷量
( M   → ∞で収束)
健
常
者
患
者
PC1M
N
PC1
PC2
ガウス分布
仮定
cf.確率
主成分分析
主成分得点 外れ値*
||
選択
有意性検定:
T test:P<0.05
*:多重ガウス分布+χ2 分布
BH 法補正したP value<0.01
N(mRNA/miRNA)
第46回バイオ情報学研究会(2016年7月沖縄)
では、この枠組みで多数のがん種に対して統一的
にP<0.01という基準「だけ」でmiRNAとmRNAを
スクリーニングすることで生物学的に意味がある
miRNA-mRNAペアの検出に成功したことを報告
済み。今回はそれを腎芽腫に使う。
mRNA miRNA 
mRNAsmiRNAs
外れ値
miRTarBase
変数
(遺伝子)
埋め込み
miRNA
­mRNA 
ペア
逆相関ペア
 vs 
発現行列
健
常
者
患
者
実験ベースの既知の
相互作用データベース
結果結果::
サンプルサンプル: (Ludwig et al, IJMS, 2016): (Ludwig et al, IJMS, 2016)
mRNA miRNA
患者   健常者     
(P)atients (N)ormal P N
28 4 62 4
選択選択
mRNA 1114 miRNA 55
                                  線形判別 線形判別 (PCA+LDA+LOOCV)(PCA+LDA+LOOCV)
mRNA miRNA
P N P N
P 2727 0 6161 0
N 1 44 1 44
R=-0.126 (P=0.008)
R=-0.267 (P<10­16)
3,4
2
複数個の複数個のmiRNAmiRNAの標的になっている遺伝子の生存曲線の標的になっている遺伝子の生存曲線
解析(解析(OncoLnc.org, BoldOncoLnc.org, Bold::Kidney cancersKidney cancers))
3,4
2
Kaplan plot for CBX2 in KIRP
Logrank p-value=0.000471
Kaplan plot for IGF2 in KIRP
Logrank p-value=0.011
Kaplan plot for CCND1 in KIRC
Logrank p-value=0.000285
Kaplan plot for RPL12 in KIRC
Logrank p-value=0.000577
結論結論::
mRNA と ,miRNA の 発 現 量 の 統 合 解 析 と
mRNA­miRNA 相互作用の組み合わせで 生生
物学的に妥当性の高い物学的に妥当性の高い mRNAsをmRNAsの
発現差だけ発現差だけから選択するよりもずっとうまく選ぶ
ことができた。
今後、バイオマーカー、疾患関連遺伝子の同定
に広く活用されることが期待される。

More Related Content

More from Y-h Taguchi

遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
Y-h Taguchi
 
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Y-h Taguchi
 
Rectified factor networks for biclustering of omics data
Rectified factor networks for biclustering of omics dataRectified factor networks for biclustering of omics data
Rectified factor networks for biclustering of omics data
Y-h Taguchi
 
テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択
Y-h Taguchi
 
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
Y-h Taguchi
 
Principal component analysis based unsupervised feature extraction applied to...
Principal component analysis based unsupervised feature extraction applied to...Principal component analysis based unsupervised feature extraction applied to...
Principal component analysis based unsupervised feature extraction applied to...
Y-h Taguchi
 
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Y-h Taguchi
 
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
Y-h Taguchi
 
PCAを用いた2群の有意差検定
PCAを用いた2群の有意差検定PCAを用いた2群の有意差検定
PCAを用いた2群の有意差検定
Y-h Taguchi
 
SFRP1 is a possible candidate for epigenetic therapy in non­small cell lung ...
SFRP1 is a possible candidate for epigenetic  therapy in non­small cell lung ...SFRP1 is a possible candidate for epigenetic  therapy in non­small cell lung ...
SFRP1 is a possible candidate for epigenetic therapy in non­small cell lung ...
Y-h Taguchi
 
A cross-species bi-clustering approach to identifying conserved co-regulated ...
A cross-species bi-clustering approach to identifying conserved co-regulated ...A cross-species bi-clustering approach to identifying conserved co-regulated ...
A cross-species bi-clustering approach to identifying conserved co-regulated ...
Y-h Taguchi
 
Identification of aberrant gene expression associated with aberrant promoter ...
Identification of aberrant gene expression associated with aberrant promoter ...Identification of aberrant gene expression associated with aberrant promoter ...
Identification of aberrant gene expression associated with aberrant promoter ...
Y-h Taguchi
 
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
Heuristic Principal Component Analysis  Based unsupervised Feature Extraction...Heuristic Principal Component Analysis  Based unsupervised Feature Extraction...
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
Y-h Taguchi
 
Integrating different data types by regularized unsupervised multiple kernel...
Integrating different data types by regularized  unsupervised multiple kernel...Integrating different data types by regularized  unsupervised multiple kernel...
Integrating different data types by regularized unsupervised multiple kernel...
Y-h Taguchi
 
FAMSとchooseLDを用いたインシリコ創薬パイプライン
FAMSとchooseLDを用いたインシリコ創薬パイプラインFAMSとchooseLDを用いたインシリコ創薬パイプライン
FAMSとchooseLDを用いたインシリコ創薬パイプライン
Y-h Taguchi
 
Principal component analysis-based unsupervised feature extraction applied to...
Principal component analysis-based unsupervised feature extraction applied to...Principal component analysis-based unsupervised feature extraction applied to...
Principal component analysis-based unsupervised feature extraction applied to...
Y-h Taguchi
 
In silico spleen tyrosine kinase inhibitor screening by chooseLD
In silico spleen tyrosine kinase inhibitor screening by chooseLDIn silico spleen tyrosine kinase inhibitor screening by chooseLD
In silico spleen tyrosine kinase inhibitor screening by chooseLD
Y-h Taguchi
 
How to screen out liars
How to screen out liarsHow to screen out liars
How to screen out liars
Y-h Taguchi
 
Comparison of Hepatocellular Carcinoma miRNA Expression Profiling as Evaluate...
Comparison of Hepatocellular Carcinoma miRNA Expression Profiling as Evaluate...Comparison of Hepatocellular Carcinoma miRNA Expression Profiling as Evaluate...
Comparison of Hepatocellular Carcinoma miRNA Expression Profiling as Evaluate...Y-h Taguchi
 
模擬授業(高校生向け)
模擬授業(高校生向け)模擬授業(高校生向け)
模擬授業(高校生向け)Y-h Taguchi
 

More from Y-h Taguchi (20)

遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
 
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
 
Rectified factor networks for biclustering of omics data
Rectified factor networks for biclustering of omics dataRectified factor networks for biclustering of omics data
Rectified factor networks for biclustering of omics data
 
テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択テンソル分解を用いた教師なし学習による変数選択
テンソル分解を用いた教師なし学習による変数選択
 
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
 
Principal component analysis based unsupervised feature extraction applied to...
Principal component analysis based unsupervised feature extraction applied to...Principal component analysis based unsupervised feature extraction applied to...
Principal component analysis based unsupervised feature extraction applied to...
 
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
 
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
 
PCAを用いた2群の有意差検定
PCAを用いた2群の有意差検定PCAを用いた2群の有意差検定
PCAを用いた2群の有意差検定
 
SFRP1 is a possible candidate for epigenetic therapy in non­small cell lung ...
SFRP1 is a possible candidate for epigenetic  therapy in non­small cell lung ...SFRP1 is a possible candidate for epigenetic  therapy in non­small cell lung ...
SFRP1 is a possible candidate for epigenetic therapy in non­small cell lung ...
 
A cross-species bi-clustering approach to identifying conserved co-regulated ...
A cross-species bi-clustering approach to identifying conserved co-regulated ...A cross-species bi-clustering approach to identifying conserved co-regulated ...
A cross-species bi-clustering approach to identifying conserved co-regulated ...
 
Identification of aberrant gene expression associated with aberrant promoter ...
Identification of aberrant gene expression associated with aberrant promoter ...Identification of aberrant gene expression associated with aberrant promoter ...
Identification of aberrant gene expression associated with aberrant promoter ...
 
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
Heuristic Principal Component Analysis  Based unsupervised Feature Extraction...Heuristic Principal Component Analysis  Based unsupervised Feature Extraction...
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
 
Integrating different data types by regularized unsupervised multiple kernel...
Integrating different data types by regularized  unsupervised multiple kernel...Integrating different data types by regularized  unsupervised multiple kernel...
Integrating different data types by regularized unsupervised multiple kernel...
 
FAMSとchooseLDを用いたインシリコ創薬パイプライン
FAMSとchooseLDを用いたインシリコ創薬パイプラインFAMSとchooseLDを用いたインシリコ創薬パイプライン
FAMSとchooseLDを用いたインシリコ創薬パイプライン
 
Principal component analysis-based unsupervised feature extraction applied to...
Principal component analysis-based unsupervised feature extraction applied to...Principal component analysis-based unsupervised feature extraction applied to...
Principal component analysis-based unsupervised feature extraction applied to...
 
In silico spleen tyrosine kinase inhibitor screening by chooseLD
In silico spleen tyrosine kinase inhibitor screening by chooseLDIn silico spleen tyrosine kinase inhibitor screening by chooseLD
In silico spleen tyrosine kinase inhibitor screening by chooseLD
 
How to screen out liars
How to screen out liarsHow to screen out liars
How to screen out liars
 
Comparison of Hepatocellular Carcinoma miRNA Expression Profiling as Evaluate...
Comparison of Hepatocellular Carcinoma miRNA Expression Profiling as Evaluate...Comparison of Hepatocellular Carcinoma miRNA Expression Profiling as Evaluate...
Comparison of Hepatocellular Carcinoma miRNA Expression Profiling as Evaluate...
 
模擬授業(高校生向け)
模擬授業(高校生向け)模擬授業(高校生向け)
模擬授業(高校生向け)
 

miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定