SlideShare a Scribd company logo
1 of 53
Download to read offline
情報・システム研究機構 ライフサイエンス統合データベースセンター
仲里 猛留
Research Organization of Information and Systems (ROIS)Database Center for Life Science (DBCLS),
NAKAZATO, Takeru
2015/1/27
@chalkless
第1回 データ解析よろず相談会:AJACS advanced (AJACSa)
NGSデータベース検索
遺伝研W412
撮影
可
自己紹介
3
仲里 猛留名前
なかざと たけるふりがな
所属 情報・システム研究機構
ライフサイエンス統合
 データベースセンター
Twitter chalkless
詳しくは所属のページをごらんください...
質問などどうぞ
http://dbcls.rois.ac.jp/~nakazato/
4
Wet浸透圧調節・イオン輸送
イオントランスポーターの
クローニング
東工大院・生命理工
阪大院・情報科学
文献情報を利用した
 マイクロアレイデータの
 生物学的知見の付与
99.4
02.4
05.10
08.9
15.1
07.4
NEC バイオIT事業推進センター
文献検索(もどき)ツールの開発
遺伝子(群)への文献情報を用いた	

アノテーションづけ
07.9
Dry
ライフサイエンス	

統合データベースセンター
遺伝子、疾患のアノテーション
キーワードづけ、用語整備
NGSデータの整理
休眠時代
(部署解体 → 異動)
毎日、PowerPointで営業資料作成
Dry
Dry
こんな実験生物を使っていました...
鰻
血圧調節
分子生物学っぽく	

言ってみる
イオン濃度調節
mouse の系
高Na食 or 高K食
変化が見にくい
ウナギ
淡水と海水を行き来
(サケ、マスと同じ)
SW
FW
blood
urine
Anguilla japonica
淡水/海水で遺伝子発現が	

どうかわるか。	

(イオントランスポーター中心)
wet時代・ ウナギの海水適応機構
組織局在
膵臓と後腸に強い発現
wet時代・ ウナギの海水適応機構
8
経時変化
淡水 → 海水 で発現増大
wet時代・ ウナギの海水適応機構
9
H2O H2O
Na+
Cl-
Ca2+
Mg2+
HCO3
-
HCO3
-
Osm
H2O
eSult?
腸内
血液
腸細胞
wet時代・ ウナギの海水適応機構
海水適応に伴う浸透圧適応モデル
ライフサイエンス統合データベースセンター特任助教。博士(情報
科学)。東京工業大学の学部 ・ 修士課程にて魚類の遺伝子研究を行
い、2002 年修了。同年、NEC バイオ IT 事業推進センターに入社し、
遺伝子発現データの解析用ソフトの開発を行う。2007 年同部門の
解体に伴い、現職に転職。2008 年大阪大学情報科学研究科にて博
士号取得。最近は、公共データベース中の NGS データを検索する
ウェブサービスを作成。研究活動も行う。
自分の研究用に検索エンジンを作ったら、
世界中のユーザーから反響があった。
大勢の役に立ててうれしかった
仲 里
猛 留
Nakazato Takeru
25www.nature.com/naturedigest ©2014 Nature Japan K.K., trading as Nature Publishing Group. All rights reserved.
ワタクシも取材してもらいました
(Natureダイジェスト '15年1月号)
本題
だんだん
アンケート
NGS機器を使っている
NGSのデータ解析をしている
NGSをやってみたい
本題
次世代シーケンサー(NGS)
電気泳動式 キャピラリ式 NGS
Next Generation Sequencing
→ High-Throughput Sequencing
ABI社
北海道システム社
750 (base/lane) 48/4 lanes
= 9kbase
500 (base/lane) 96 lane
= 48kbase
36 (base/seq) 300M seq/run
= 10.8Gbase
次世代とか新型とか
ちっとも新しくない
「新しい昆虫採集案内」
昭和46年出版
昭和52年改訂
PubMed
BLAST
データベース 検索システム
GenBank
EMBL
DDBJ
BLAST
MEDLINE
塩基配列
文献
登録
Entrez Gene
登録
整理
NGSデータ
SRA
データベース 検索システム
GenBank
EMBL
DDBJ
BLAST
MEDLINE
塩基配列
文献
登録
登録
登録
SRA Search
SRA:
Sequence Read Archive
ちなみに、昔は Short Read Archive
データを使ってもらう
データを集める
Total:
52,387
3,660
Total:
3.3 petabase
http://www.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?
JGA (Japanese Genotype-Phenotype Archive)
Controlled-access データのアーカイブ
DRAへのデータ登録
http://trace.ddbj.nig.ac.jp/dra/submission.html
FASTQ データ
@DRR001107.1 GEZQ5FO01EEA7F length=77	
GCAACATTCAACACATATGTGTTGAATGTTGCACGACGGNGTG...	
+DRR001107.1 GEZQ5FO01EEA7F length=77	
C@BBBECCECDBBBAAAAA<441111<?@>?=?????44!000...	
4行1組 1行目: @ + タイトル
2行目:塩基配列
3行目: + (+ タイトル)
4行目:シーケンスクオリティ
+
メタデータ = 実験情報
プロジェクト名、生物種、シーケンサー、...
×
数千万
数十億
mappingde novo assemble
Quality check
データベース検索
Download
自分で
発現量解析 SNP検出ゲノム
http://trace.ddbj.nig.ac.jp/DRASearch/
SRAを検索してみましょう
SRAのデータ構造(簡略版)
http://trace.ddbj.nig.ac.jp/dra/submission.html に現バージョン(後出)あり
ワインが飲みたい
どれにする?
どうしようかなぁ...
Soleil Hikumo Rouge名前
タイプ
ワイナリー
ブドウ品種
製造年
生産地
赤で重くないやつ
→ 中身のクオリティによる足切り
赤
旭洋酒
山梨
ピノノワール+ベイリーA
2012年
→ メタデータによる選択
目的が多種多様
SRAの検索は意外とツラい
ゲノム、発現解析、エピゲ、メタゲ、...
対象生物種も多種多様
データベースの構造
ヒト、マウス、メタゲノム、微生物、...
study:プロジェクト情報
experiment:個々の実験情報
DBCLS SRA
http://sra.dbcls.jp/
35
生物種による検索
上のレベルや下のレベルでも検索可能
論文からの検索
疾患から検索
Total:
52,387
3,660
http://sra.dbcls.jp/trends.html
http://sra.dbcls.jp/trends.html
HiSeq
2000
GA II
454
GS GLX
Titanium
NCBI SRA やめます事件 (2011/2/22)
http://www.nlm.nih.gov/pubs/techbull/jf11/jf11_ncbi_reprint_sra.html
発現はGEOへ
BioProject
SRA GEO
Project Summary
Run data
Umbrella Project
Study
Sample
Platform
Sample
Run data
Primary Project
Exp
Run
BioSample
Sample
SRAのデータ構造(最新版)
http://trace.ddbj.nig.ac.jp/dra/submission.html を改
http://aoe.dbcls.jp/
AOE(あおい):遺伝子発現データの目次サイト
※ マイクロアレイ+NGS
PMID: 24167589
NGS(発現)データの
(生物学的)解釈
[参考]
mappingde novo assemble
Quality check
データベース検索
Download
自分で
発現量解析 SNP検出ゲノム
Statistics
?
wt/disease
Drug(+/-)
microarray
Interpretation from
biological viewpoint
...
k-means
raw data (sequence)
normalization
clustering
PCA
gene list (cluster)
What is biological features?
What is relationships to
initial conditions?
mapping
Next generation Sequencing
raw data (intensity)
No
biology!
Gene Ontology
DNA binding
androgen receptor binding
enzyme binding
transcription coactivator activity
tubulin binding
ubiquitin protein ligase binding
...
Molecular Function Biological Process
DNA damage response, signal transduction by p53 class media
resulting in transcription of p21 class mediator
G2 DNA damage checkpoint
androgen receptor signaling pathway
apoptotic process
cellular response to indole-3-methanol
chromosome segregation
double-strand break repair via homologous recombination
positive regulation of DNA repair
positive regulation of protein ubiquitination
postreplication repair
regulation of cell proliferation
BRCA1-A complex
BRCA1-BARD1 complex
gamma-tubulin ring complex
Cellular Component
Example) BRCA1 (Gene ID: 672)
Controlled vocabulary for representing biological features
GO assign and enrichment analysis
http://david.abcc.ncifcrf.gov/
TogoTV (Tutorial movie)
http://togotv.dbcls.jp/
Gene Ontology, ...
DNA binding
androgen receptor binding
enzyme binding
transcription coactivator activity
tubulin binding
ubiquitin protein ligase binding
...
Molecular Function Biological Process
DNA damage response, signal transduction by p53 class mediato
resulting in transcription of p21 class mediator
G2 DNA damage checkpoint
androgen receptor signaling pathway
apoptotic process
cellular response to indole-3-methanol
chromosome segregation
double-strand break repair via homologous recombination
positive regulation of DNA repair
positive regulation of protein ubiquitination
postreplication repair
regulation of cell proliferation
regulation of transcription from RNA polymerase II promoter
regulation of transcription from RNA polymerase III promoter
BRCA1-A complex
BRCA1-BARD1 complex
gamma-tubulin ring complex
nucleus
protein complex
Cellular Component
Example) BRCA1 (Gene ID: 672)
No information on
diseases and anatomy
MeSH terms
50
Medical Subject Headings
> 23,000 terms
Controlled vocabulary
15 categories
Disease,
Drugs,
Anatomy, ...
Gene MeSH
Article
MeSH keywords related to BRCA1
51
Example) BRCA1 (Gene ID: 672)
Breast Neoplasms
Ovarian Neoplasms
BRCA1 Protein
Tumor Suppressor Proteins
Rad51 Recombinase
Breast
Chromosomes, Human, Pair 17
0
0
0
5.91 × 10-136
1.66 × 10-54
1.52 × 10-43
9.03 × 10-23
Disease
Chemicals and Drugs
Anatomy
MeSH Terms Category p-value
Differences and similarities
between type 1/2 diabetes
52
MeSH keywords
type1
diabetes
type2
diabetes
10e-10
10e-09
10e-08
10e-07
10e-06
10e-05
10e-04
10e-03
10e-02
0.05
0.10
0.20
0.30
0.40
0.50
0.75
1
p-value
Category
Diseases
Chemicals
and drugs
Anatomy
Diabetes Mellitus
Diabetes Mellitus, Type 1
Diabetes Mellitus, Type 2
Autoimmune Diseases
Insulin Resistance
Obesity
Insulin
Adiponectin
Pancreas
Spleen
Adipocytes
Implementation
53
http://gendoo.dbcls.jp/
Reference:
Gendoo: Functional profiling of gene and disease features using MeSH vocabulary.
Nucleic Acids Res, 37 (Suppl. 2), 2009. PMID: 19498079

More Related Content

What's hot

[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤Eli Kaminuma
 
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観DNA Data Bank of Japan center
 
Bh13.13 sagace 1
Bh13.13 sagace 1Bh13.13 sagace 1
Bh13.13 sagace 1Maori Ito
 
第三回統合牧場収穫祭イントロダクション
第三回統合牧場収穫祭イントロダクション 第三回統合牧場収穫祭イントロダクション
第三回統合牧場収穫祭イントロダクション Tazro Ohta
 
20191113国環研琵琶湖分室セミナー
20191113国環研琵琶湖分室セミナー20191113国環研琵琶湖分室セミナー
20191113国環研琵琶湖分室セミナーarosawa
 
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」Hidemasa Bono
 

What's hot (7)

[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
[2016-06-06] CrowdR&D:クラウド協働評価のための参加型R&Dプロジェクト情報統合基盤
 
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
[All-in-one2016] JST/NBDC が提供するサービス及びプロジェクト概観
 
Bh13.13 sagace 1
Bh13.13 sagace 1Bh13.13 sagace 1
Bh13.13 sagace 1
 
第三回統合牧場収穫祭イントロダクション
第三回統合牧場収穫祭イントロダクション 第三回統合牧場収穫祭イントロダクション
第三回統合牧場収穫祭イントロダクション
 
kita m
kita mkita m
kita m
 
20191113国環研琵琶湖分室セミナー
20191113国環研琵琶湖分室セミナー20191113国環研琵琶湖分室セミナー
20191113国環研琵琶湖分室セミナー
 
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
第57回日本人類遺伝学会大会 教育講演「バイオインフォマティクス:データベース統合化によるアプローチ」
 

Similar to AJACS advanced: NGSデータベース検索

パーソナルゲノム時代のリテラシー教育(Omix 2013)
パーソナルゲノム時代のリテラシー教育(Omix 2013)パーソナルゲノム時代のリテラシー教育(Omix 2013)
パーソナルゲノム時代のリテラシー教育(Omix 2013)Kazuharu Arakawa
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベースDNA Data Bank of Japan center
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクスMas Kot
 
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージmetaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ弘毅 露崎
 
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-SeqItoshi Nikaido
 
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...奈良先端大 情報科学研究科
 
第63回情報科学談話会(大林 武 准教授)
第63回情報科学談話会(大林 武 准教授) 第63回情報科学談話会(大林 武 准教授)
第63回情報科学談話会(大林 武 准教授) gsis gsis
 
[DDBJing29]DDBJ, NIG SuperComputer, 大量配列情報解析(第29回 DDBJing 講習会 in 三島)
[DDBJing29]DDBJ, NIG SuperComputer, 大量配列情報解析(第29回 DDBJing 講習会 in 三島)[DDBJing29]DDBJ, NIG SuperComputer, 大量配列情報解析(第29回 DDBJing 講習会 in 三島)
[DDBJing29]DDBJ, NIG SuperComputer, 大量配列情報解析(第29回 DDBJing 講習会 in 三島)DNA Data Bank of Japan center
 
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報DNA Data Bank of Japan center
 
データベース活用による 知のめぐりのよい細胞生物学
データベース活用による 知のめぐりのよい細胞生物学データベース活用による 知のめぐりのよい細胞生物学
データベース活用による 知のめぐりのよい細胞生物学Hidemasa Bono
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformaticsMas Kot
 
El text.life science6.ikeguchi1911211.
El text.life science6.ikeguchi1911211.El text.life science6.ikeguchi1911211.
El text.life science6.ikeguchi1911211.RCCSRENKEI
 
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~Hidemasa Bono
 
コスモバイオニュース No.125 (2017年1月)
コスモバイオニュース No.125 (2017年1月)コスモバイオニュース No.125 (2017年1月)
コスモバイオニュース No.125 (2017年1月)COSMO BIO
 
[All-in-one2015] 文献情報関連サービス活用法
[All-in-one2015] 文献情報関連サービス活用法[All-in-one2015] 文献情報関連サービス活用法
[All-in-one2015] 文献情報関連サービス活用法DNA Data Bank of Japan center
 
コスモバイオニュース No.174(2021年6月)
コスモバイオニュース No.174(2021年6月)コスモバイオニュース No.174(2021年6月)
コスモバイオニュース No.174(2021年6月)COSMO BIO
 

Similar to AJACS advanced: NGSデータベース検索 (20)

Ajacs33 文献の検索とその整理方法
Ajacs33 文献の検索とその整理方法Ajacs33 文献の検索とその整理方法
Ajacs33 文献の検索とその整理方法
 
パーソナルゲノム時代のリテラシー教育(Omix 2013)
パーソナルゲノム時代のリテラシー教育(Omix 2013)パーソナルゲノム時代のリテラシー教育(Omix 2013)
パーソナルゲノム時代のリテラシー教育(Omix 2013)
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
 
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージmetaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
 
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
 
[DDBJing31] DDBJ と NIG SuperComputer の使い方
[DDBJing31] DDBJ と NIG SuperComputer の使い方[DDBJing31] DDBJ と NIG SuperComputer の使い方
[DDBJing31] DDBJ と NIG SuperComputer の使い方
 
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
 
第63回情報科学談話会(大林 武 准教授)
第63回情報科学談話会(大林 武 准教授) 第63回情報科学談話会(大林 武 准教授)
第63回情報科学談話会(大林 武 准教授)
 
[DDBJing29]DDBJ, NIG SuperComputer, 大量配列情報解析(第29回 DDBJing 講習会 in 三島)
[DDBJing29]DDBJ, NIG SuperComputer, 大量配列情報解析(第29回 DDBJing 講習会 in 三島)[DDBJing29]DDBJ, NIG SuperComputer, 大量配列情報解析(第29回 DDBJing 講習会 in 三島)
[DDBJing29]DDBJ, NIG SuperComputer, 大量配列情報解析(第29回 DDBJing 講習会 in 三島)
 
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
 
Swc2013 yamamoto
Swc2013 yamamotoSwc2013 yamamoto
Swc2013 yamamoto
 
データベース活用による 知のめぐりのよい細胞生物学
データベース活用による 知のめぐりのよい細胞生物学データベース活用による 知のめぐりのよい細胞生物学
データベース活用による 知のめぐりのよい細胞生物学
 
第52回生命科学夏の学校
第52回生命科学夏の学校第52回生命科学夏の学校
第52回生命科学夏の学校
 
Metabolic network and cheminformatics
Metabolic network and cheminformaticsMetabolic network and cheminformatics
Metabolic network and cheminformatics
 
El text.life science6.ikeguchi1911211.
El text.life science6.ikeguchi1911211.El text.life science6.ikeguchi1911211.
El text.life science6.ikeguchi1911211.
 
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
データベースから始まる分子生物学~トランスクリプトーム解析研究の新しいスタイル~
 
コスモバイオニュース No.125 (2017年1月)
コスモバイオニュース No.125 (2017年1月)コスモバイオニュース No.125 (2017年1月)
コスモバイオニュース No.125 (2017年1月)
 
[All-in-one2015] 文献情報関連サービス活用法
[All-in-one2015] 文献情報関連サービス活用法[All-in-one2015] 文献情報関連サービス活用法
[All-in-one2015] 文献情報関連サービス活用法
 
コスモバイオニュース No.174(2021年6月)
コスモバイオニュース No.174(2021年6月)コスモバイオニュース No.174(2021年6月)
コスモバイオニュース No.174(2021年6月)
 

AJACS advanced: NGSデータベース検索