Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Y-h Taguchi
1,167 views
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
Presentation at SIGBIO47 28th Oct 2016
Science
◦
Related topics:
Feature Extraction Methods
•
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 21
2
/ 21
3
/ 21
4
/ 21
5
/ 21
6
/ 21
7
/ 21
8
/ 21
9
/ 21
10
/ 21
11
/ 21
12
/ 21
13
/ 21
14
/ 21
15
/ 21
16
/ 21
17
/ 21
18
/ 21
19
/ 21
20
/ 21
21
/ 21
More Related Content
PDF
How AlphaGo Works
by
Shane (Seungwhan) Moon
PDF
FAMSとchooseLDを用いたインシリコ創薬パイプライン
by
Y-h Taguchi
PDF
SFRP1 is a possible candidate for epigenetic therapy in nonsmall cell lung ...
by
Y-h Taguchi
PDF
バイオインフォマティクスによる遺伝子発現解析
by
sesejun
PDF
Rdkitの紹介
by
Takayuki Serizawa
PDF
IIBMP2016 深層生成モデルによる表現学習
by
Preferred Networks
PDF
Tensor decomposition based and principal component analysis based unsupervise...
by
Y-h Taguchi
PDF
主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明
by
Y-h Taguchi
How AlphaGo Works
by
Shane (Seungwhan) Moon
FAMSとchooseLDを用いたインシリコ創薬パイプライン
by
Y-h Taguchi
SFRP1 is a possible candidate for epigenetic therapy in nonsmall cell lung ...
by
Y-h Taguchi
バイオインフォマティクスによる遺伝子発現解析
by
sesejun
Rdkitの紹介
by
Takayuki Serizawa
IIBMP2016 深層生成モデルによる表現学習
by
Preferred Networks
Tensor decomposition based and principal component analysis based unsupervise...
by
Y-h Taguchi
主成分分析を用いた教師なし学習による筋萎縮性側索硬化症とがんの遺伝的関連性の解明
by
Y-h Taguchi
More from Y-h Taguchi
PDF
Tensor decompositionbased unsupervised feature extraction identified the un...
by
Y-h Taguchi
PDF
Tensor decomposition based unsupervised feature extraction applied to matrix...
by
Y-h Taguchi
PDF
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
by
Y-h Taguchi
PDF
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
by
Y-h Taguchi
PDF
Rectified factor networks for biclustering of omics data
by
Y-h Taguchi
PDF
テンソル分解を用いた教師なし学習による変数選択
by
Y-h Taguchi
PDF
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
by
Y-h Taguchi
PDF
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
by
Y-h Taguchi
PDF
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
by
Y-h Taguchi
PDF
Principal component analysis based unsupervised feature extraction applied to...
by
Y-h Taguchi
PDF
microRNA-mRNA interaction identification in Wilms tumor using principal compo...
by
Y-h Taguchi
PDF
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
by
Y-h Taguchi
PDF
PCAを用いた2群の有意差検定
by
Y-h Taguchi
PDF
A cross-species bi-clustering approach to identifying conserved co-regulated ...
by
Y-h Taguchi
PDF
主成分分析を用いた教師なし学習による変数選択法を用いたがんにおけるmRNA-miRNA相互作用のより信頼性のある同定
by
Y-h Taguchi
PDF
Identification of aberrant gene expression associated with aberrant promoter ...
by
Y-h Taguchi
PDF
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
by
Y-h Taguchi
PDF
Integrating different data types by regularized unsupervised multiple kernel...
by
Y-h Taguchi
PDF
Principal component analysis-based unsupervised feature extraction applied to...
by
Y-h Taguchi
PDF
In silico spleen tyrosine kinase inhibitor screening by chooseLD
by
Y-h Taguchi
Tensor decompositionbased unsupervised feature extraction identified the un...
by
Y-h Taguchi
Tensor decomposition based unsupervised feature extraction applied to matrix...
by
Y-h Taguchi
遺伝子発現プロファイルからの 薬剤標的タンパクの統計的推定法の開発
by
Y-h Taguchi
Identification of Candidate Drugs for Heart Failure using Tensor Decompositio...
by
Y-h Taguchi
Rectified factor networks for biclustering of omics data
by
Y-h Taguchi
テンソル分解を用いた教師なし学習による変数選択
by
Y-h Taguchi
主成分分析を用いた教師なし学習による変数選択を用いたヒストン脱アセチル化酵素阻害剤の機能探索
by
Y-h Taguchi
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
by
Y-h Taguchi
miRNA-mRNA相互作用同定を用いた 腎芽腫関連遺伝子の推定
by
Y-h Taguchi
Principal component analysis based unsupervised feature extraction applied to...
by
Y-h Taguchi
microRNA-mRNA interaction identification in Wilms tumor using principal compo...
by
Y-h Taguchi
Comprehensive analysis of transcriptome andmetabolome analysis in Intrahepati...
by
Y-h Taguchi
PCAを用いた2群の有意差検定
by
Y-h Taguchi
A cross-species bi-clustering approach to identifying conserved co-regulated ...
by
Y-h Taguchi
主成分分析を用いた教師なし学習による変数選択法を用いたがんにおけるmRNA-miRNA相互作用のより信頼性のある同定
by
Y-h Taguchi
Identification of aberrant gene expression associated with aberrant promoter ...
by
Y-h Taguchi
Heuristic Principal Component Analysis Based unsupervised Feature Extraction...
by
Y-h Taguchi
Integrating different data types by regularized unsupervised multiple kernel...
by
Y-h Taguchi
Principal component analysis-based unsupervised feature extraction applied to...
by
Y-h Taguchi
In silico spleen tyrosine kinase inhibitor screening by chooseLD
by
Y-h Taguchi
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析
1.
主成分分析を用いた教師なし学習による出芽酵母 の時間周期遺伝子発現プロファイルの解析 田口善弘 中央大学 物理学科 本研究は Yh. Taguchi, “Principal component analysis based unsupervised feature extraction applied to budding yeast temporally periodic gene expression”, BioData mining, 2016, 9:22 として原著論文として刊行済みです
2.
主成分分析を用いた教師なし学習による変数選択
3.
外れ値(遺伝子)の同定方法(P値の計算方法) 主成分得点(遺伝子)に多重ガウス分布を仮定(帰無仮説: 確率主成分分析でも使われている仮定なので妥当と予想) →χ二乗分布を仮定して遺伝子にP値を付与 →Benjamini–HochbergでP値を多重比較補正 →補正されたP値<0.01または0.05を外れ値とする。
4.
人工データによるデモンストレーション 青:元の正弦・余弦波 赤:後述 黒:正弦・余弦波+周期ノイズ(ε(t)=ε(t+T(=25))) 100時刻(4周期)×10、000遺伝子 100遺伝子:2つの黒色ベクトルのランダム線形和 9,900遺伝子:全くのノイズ タスク:無情報で100遺伝子を区別できるか?
5.
ϵj S ,ϵj C ∈[−A, A],δi∈[0,2π],ϵij ∈[−1,1] 正弦・余弦波 周期ノイズ付加 直交化 100個の周期ノイズ付加 正弦波と9900個の ノイズベクトル作成 全遺伝子の発現量規格化
6.
100遺伝子 9,900遺伝子 主成分得点(遺伝子) 主成分負荷量(時刻) (前々ページの赤線)
7.
正弦回帰と主成分分析による変数選択の性能比較 A:周期ノイズが正弦・余弦波の何倍の振幅か?
8.
人工データでは無情報でも 非正弦波周期ベクトルを 100%の精度で分離可能だった。 現実は?
9.
現実のデータ:出芽酵母の細胞分裂周期遺伝子の同定現実のデータ:出芽酵母の細胞分裂周期遺伝子の同定 酵母は勝手な位相で分裂するので同期が必要 同期戦略①:餌の制限(メタボリックサイクル) 最初の4つの主成分負 荷量(時刻)の散布図 数字は重心のまわりの 回転数。 PC2とPC3に注目。 これらのPCを用いた 遺伝子選択は 生物学的に妥当か?
10.
主成分得点(遺伝子) 主成分負荷量(時刻) 黒赤緑が選択遺伝子(P<0.01) リボゾーム ミトコンドリア →原報に一致 細胞分裂 きれいな周期関数 だが正弦波とは似 ても似つかない
11.
REACTOME (PC1〜PC4を使って遺伝子を選択) 主成分分析を用いた教師なし学習による変数選択は正弦波・矩形 波・三角波のどれにくらべても生物学的に妥当な遺伝子を選ぶ。 そもそもPC2とPC3が全く違う形状なので単一の周期関数の位相 を動かすだけでフィッティングできるわけがない。
12.
ここまでの結論: 遺伝子発現プロファイルは周期関数だが正弦関 数ではない。正弦回帰を使うとアーティファクトを もたらす危険がある(しかし、あんな変な関数型 はアプリオリには想定しようがない!)。 関数形どころか、周期長さえ仮定しなくてもリミッ トサイクルはしっかり同定可能。 詳細な生物学的な考察で原報で同定した遺伝 子の3グループが「半自動的に」同定可能。 →全て「主成分分析を用いた教師なし学習によ る変数選択の優位性を示す」
13.
同期戦略②:温度感受性変異体(細胞周期阻止) Cyclebase:8つの独立した研究論文の統合データベース 8つのうちの1つの 主成分負荷量 (時刻)の散布図。 PC2とPC3にリミッ トサイクルが観測さ れる →PC2 と PC3
を 使って外れ値 (遺伝子)を検出。
14.
別の1つ。ひどい場合は「本当にリミット サイクルなの?」と思うくらい乱れている。 しかし、人工データだって これくらい乱れていたの で、乱れているかどうかと リミットサイクルかどうか とは本当はあまり関係な いかも....。 PC2とPC4にリミット サイクルが観測される →PC2とPC4を使っ て外れ値(遺伝子)を 検出。
15.
結果:8つ中7つのプロファイルでP<0.05で100〜 200個の遺伝子が選択され、うち37個は7つ中 6つ以上のプロファイルで共通に選ばれた →高い整合性
16.
REACTOME 37遺伝子 PCA Cyclebase
17.
ここまでの結論: 8つ中7つの実験でリミットサイクルを見つけ、細 胞分裂周期遺伝子を特定できた。 整合性は非常によく、全く独立な実験であること を考えると信頼できる 実際、REACTOMEで評価すると細胞分裂関連 遺伝子がたくさん見つかった 同じ数をcyclebaseから選んでもそこまでいい遺 伝子は含まれていなかった。
18.
考察 2次元平面内にリミットサイクルがある場合、2軸 の関数は全く別のものでいいので位相がずれてい るだけの周期関数で回帰するのがそもそも間違っ ている。 実験ごとに周期関数の形が異なるのでリミットサ イクルがある、という条件を超えて関数形を仮定す ると複数の実験に渡って整合性のある結果をだす ことは原理的に不可能。 2次元平面で外れ値、というだけだと射影が大き ければそれでOK。回帰計算は相関なので無関係 な成分はペナルティになる。射影はそうではない。
19.
メタボリックサイクルの場合(選択遺伝子ベン図) PC2とPC3の射影なら PC1からPC4までの射 影 と 排
他 的 で は な い が、PC2とPC3への回 帰にしてしまうと、PC1 やPC4の寄与が無いも のを選んでしまうので 排他的になってしまう。 しかし、PC1やPC4は 倍周期というだけで決 してノイズではない。 →回帰にしてしまうと ア ー テ ィ フ ァ ク ト が は いってしまう。
20.
REACTOME: PC1からPC4 メタボリズム関係がちゃんと選ばれている。
21.
結論: 細胞分裂周期遺伝子は正弦回帰でみつかるだろ う、という予想は一見、もっともらしいが、生物学的 にはなんの根拠もなく、実際に現実のデータは正 弦波からかけ離れている。 まったく間違いということではないのでなかなか間 違いに気づくことはできないが、モデル化をしない 教師なし学習ならばこのような間違いに簡単に気 づける。 安易にモデル化やってベイズ統計計算して周辺尤 度が、とかやってはいけない。「何らかの周期関数」 を仮定した時点でアウト。
Download