Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
metaSeq: RNA-seqデータにおける
メタアナリシス解析パッケージ
antiplastics@Kashiwa.R#9
自己紹介
名前: 露崎弘毅 (つゆざき こうき)
所属: 東京理科大学大学院 薬学研究科 D2
専門: バイオインフォマティクス、システムバイオロジー
抗生物質

緑膿菌

バイオフィルム形成

?
薬物耐性
BioCHackathon
Bioconductorのパッケージを開発するハッカソン
Itoshi
Nikaido

Gota
Morota

RIKEN

UW-medison

@dritoshi

@chikudaisei
Koki
Ts...
遺伝子アノテーション
アノテーション = 注釈をつける
こいつらは一体何者?

RNA-seq
ChIP-seq
DNA Microarray
SNP array
CAGE
SAGE

HNRNPR
ZNF436
TFEA3
ASAP3
E2F...
MeSH
Medical Subject Headings
PubMedの注釈情報
MeSHによる遺伝子アノテーション
GeneとMeSHを対応づける

HNRNPR
ZNF436
TFEA3
ASAP3
E2F2
...

Gene

gendoo
gene2pubmed

23445621
23521515
5351531...
これまで開発に携わったパッケージ

MeSH.db: MeSHデータ全般
org.MeSH.XXX.db:
119生物種のGeneID-MeSHIDの対応関係
meshr: MeSHエンリッチメント解析
metaSeq: RNA-seqメタアナ...
今後の予定
metaSeqはBioconductor2.13 (2013/10/15)に公開
MeSH関連はBioconductor 2.14 (2014/4/XX) にて公開予定
JSBi2013 (2013/10/29-31)でmetaSe...
RNA-seq (1/2)
Gene XのmRNA
AAAAAAAAAA

PCR増幅
断片化

次世代シーケンサー
(NGS)
ショートリード

シーケンシング

GCTGTACAC
GCTACGAA
GTCAAACTC
CAGCTGCAC ...
RNA-seq (2/2)
対象群 (無処置)

処置群 (薬物投与)

C_1

C_2

C_3

T_1

T_2

1/2-BSRNA4

2

1

2

1

3

4

A1BG

0

2

1

0

0

1

A1BG-A...
“meta”-analysisとは?
meta-analysis = analysis of analysis
出所が異なる(e.g., 異なる機関)から出たRNA-seqデータを統合して解析する
StudyA

StudyB

StudyC
...
p値の統合
Fisher’s method

p1
p2
p3
p4

meta-p
統合

Χ^2検定
p値の統合
Stouffer’s method(重み付け有り)

p2
p3

Z1
Z2
Z3

w1 × Z1
w2 × Z2
w3 × Z3

p4

Z4

w4 × Z4

p1

変換

meta-p

Z
統合

Z検定

重み付...
乳癌データにおける
エンリッチメント解析の結果
4つの乳癌研究のメタアナリシス

データによっては有意に

統合によりどのデータでも

ならないものもある

安定して有意にできている
パッケージ化
NOISeq

metaSeq
まとめ
メタアナリシスとは複数の研究データの統合解析
metaSeqでRNA-seqのメタアナリシスができる
Bioconductor page : http:/
/www.bioconductor.org/packages/
devel/bi...
Upcoming SlideShare
Loading in …5
×

metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

2,305 views

Published on

  • Be the first to comment

metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ

  1. 1. metaSeq: RNA-seqデータにおける メタアナリシス解析パッケージ antiplastics@Kashiwa.R#9
  2. 2. 自己紹介 名前: 露崎弘毅 (つゆざき こうき) 所属: 東京理科大学大学院 薬学研究科 D2 専門: バイオインフォマティクス、システムバイオロジー 抗生物質 緑膿菌 バイオフィルム形成 ? 薬物耐性
  3. 3. BioCHackathon Bioconductorのパッケージを開発するハッカソン Itoshi Nikaido Gota Morota RIKEN UW-medison @dritoshi @chikudaisei Koki Tsuyuzaki TUS @antiplastics Takeru Nakazato DBCLS @chalkless
  4. 4. 遺伝子アノテーション アノテーション = 注釈をつける こいつらは一体何者? RNA-seq ChIP-seq DNA Microarray SNP array CAGE SAGE HNRNPR ZNF436 TFEA3 ASAP3 E2F2 ID3 GALE HMGCL FUCA1 CNR2 ... ゲノムワイドな実験 のリスト サイトを有するか どこのパスウェイか 自分が興味ある遺伝子 (オミックス) どんな転写因子結合 どんな機能に関わっ ているか
  5. 5. MeSH Medical Subject Headings PubMedの注釈情報
  6. 6. MeSHによる遺伝子アノテーション GeneとMeSHを対応づける HNRNPR ZNF436 TFEA3 ASAP3 E2F2 ... Gene gendoo gene2pubmed 23445621 23521515 53515315 51231357 61646667 ... PubMed Licensed PubMed Cancer Stem Cell Internet Soft ware USA ... MeSH
  7. 7. これまで開発に携わったパッケージ MeSH.db: MeSHデータ全般 org.MeSH.XXX.db: 119生物種のGeneID-MeSHIDの対応関係 meshr: MeSHエンリッチメント解析 metaSeq: RNA-seqメタアナリシス MeSH関連
  8. 8. 今後の予定 metaSeqはBioconductor2.13 (2013/10/15)に公開 MeSH関連はBioconductor 2.14 (2014/4/XX) にて公開予定 JSBi2013 (2013/10/29-31)でmetaSeqはポスター発表で、 MeSHR関連については、BioHackコンペディション https:/ /github.com/dbcls/jsbi2013/wiki/BioHack にて話す予定
  9. 9. RNA-seq (1/2) Gene XのmRNA AAAAAAAAAA PCR増幅 断片化 次世代シーケンサー (NGS) ショートリード シーケンシング GCTGTACAC GCTACGAA GTCAAACTC CAGCTGCAC ACACTGCAC TGCATGCTA CCCACACTT CTCAGAAC マッピング TGCATGCTA GCTACGAA ... ATGCATGCTACGAAGCT ... Gene Xには2つのリード 定量化 がマップされた! 参照ゲノム e.g., hg19 (UCSC), GRCh37 (Ensembl) © 2011 DBCLS Licensed under CC 表示 2.1 日本
  10. 10. RNA-seq (2/2) 対象群 (無処置) 処置群 (薬物投与) C_1 C_2 C_3 T_1 T_2 1/2-BSRNA4 2 1 2 1 3 4 A1BG 0 2 1 0 0 1 A1BG-AS1 23 12 42 1 2 p-value T_3 4 DESeq edgeR cuffdiff ... 0.67 0.35 q-value BH Q-value LFDR 0.04 統計解析 0.53 0.32 0.020 FDR制御 ZZZ3 12 12 32 124 104 96 0.02 0.012 tAKR 21 32 41 10 12 58 0.11 0.25 e.g., 30000行 (遺伝子数) × 6列 (サンプル数) 発現変動遺伝子 (DEGs) (q < 0.1) © 2011 DBCLS Licensed under CC 表示 2.1 日本
  11. 11. “meta”-analysisとは? meta-analysis = analysis of analysis 出所が異なる(e.g., 異なる機関)から出たRNA-seqデータを統合して解析する StudyA StudyB StudyC C_1 C_2 C_3 T_1 T_2 T_3 3 2 1 2 2 4 1 1/2BSRNA4 A1BG 0 5 4 1 1 2 4 A1BG-AS1 19 10 31 3 124 104 96 ZZZ3 32 21 31 10 12 58 tAKR 21 46 24 C_1 C_2 C_3 T_1 T_2 T_3 1/2BSRNA4 A1BG 2 1 2 1 3 4 0 2 1 0 0 A1BG-AS1 23 12 42 1 ZZZ3 12 12 32 tAKR 21 32 41 + C_1 C_2 C_3 T_1 T_2 T_3 3 4 6 2 5 3 2 1/2BSRNA4 A1BG 4 2 2 3 2 2 4 4 A1BG-AS1 21 21 36 5 5 4 86 35 64 ZZZ3 21 21 25 152 135 112 14 56 21 tAKR 20 30 41 21 21 53 + DEGs どのデータからも検出される再現性が高いDEGsを取得する事ができる
  12. 12. p値の統合 Fisher’s method p1 p2 p3 p4 meta-p 統合 Χ^2検定
  13. 13. p値の統合 Stouffer’s method(重み付け有り) p2 p3 Z1 Z2 Z3 w1 × Z1 w2 × Z2 w3 × Z3 p4 Z4 w4 × Z4 p1 変換 meta-p Z 統合 Z検定 重み付け サンプルサイズ による重み付け
  14. 14. 乳癌データにおける エンリッチメント解析の結果 4つの乳癌研究のメタアナリシス データによっては有意に 統合によりどのデータでも ならないものもある 安定して有意にできている
  15. 15. パッケージ化 NOISeq metaSeq
  16. 16. まとめ メタアナリシスとは複数の研究データの統合解析 metaSeqでRNA-seqのメタアナリシスができる Bioconductor page : http:/ /www.bioconductor.org/packages/ devel/bioc/html/metaSeq.html GitHup page : https:/ /github.com/kokitsuyuzaki/metaSeq

×