SlideShare a Scribd company logo
1 of 57
Download to read offline
いまさら聞けない
NGS超!入門
株式会社ジナリス
竹田 綾
ブース#40: 株式会社ジナリス
目的
• NGSについて「少し会話ができるレベル」になる
• 知りたい情報を効率よく入手するためのヒント
OUTLINE
• NGS:なにができるの?
• 「次世代」シーケンサー
– 活躍中のシーケンサー
– 第n世代シーケンサーたち
• 基本の「き」 用語集
– ライブラリー作製
– シーケンシング
– データ解析
• 情報源のまとめ
NGSで何ができるの?
(どんなふうに使われているのか)
http://cell-innovation.nig.ac.jp/public/contents/sra_stat.html
42%
NCBI Short Read Archive
DDBJ = DRA
アプリケーション
• 新規ゲノム解析
• リシーケンス(変異)
• RNA-seq(発現)
• 新規トランスクリプトーム
• miRNA
• ChIP-seq
• メチル化
• 16S rRNAメタゲノム
• メタゲノム(ショットガン)
などなど
NGS = 実験ツール
“一方、シークエンサーはマイクロアレイと違い、DNA 多型から、転写、
DNAタンパク質相互作用、エピゲノムまで、あらゆる現象を捉える「多目的
顕微鏡」になっている。先日、“何々-Seq”がどのぐらいあるかを、数人で思
い出してみたところ、60手法ぐらいはすらすらと出てきた。”
(大会長挨拶より)
「次世代」シーケンサーたち
http://flxlexblog.wordpress.com/2012/12/03/developments-in-next-generation-sequencing-a-visualisation/
Dec 3rd, 2012
41%
8%
1%0%0%0%
50%
シーケンサー別統計
Illumina
Roche454
SOLiD
IonTorrent
PacBio
Helicos
Others
Next“次世代”シーケンサー
• Qiagen GeneReader
– Intelligent Bio-System “Max-Seq Genome Sequencer”
– 20-400M reads/flowcell, 20 flowcell (independent)
– Early access starts 2013
• GnuBIO
– Beta version start shipping in April
– Sequence by Hybridization
– Read length ~1000bp, 1.2Gb/run, $50,000
• Oxford Nanopore GridION & MinION
基本の「き」 用語集
(ほぼ)共通のながれ
ライブラリー
作製
シーケンシ
ング
データ解析
①
ライブラリー作製
• DNA断片化→シーケンシングアダプター付与
• フラグメントサイズ:断片化したDNAの長さ
• RNA:PolyA濃縮/ rRNA除去後、cDNA作製
• Target capture
• Amplicon
など
ライブラリー
フラグメント/シングルエンド ペアエンド
アダプター DNAフラグメント
シーケンスリード
メイトペアライブラリー
http://wako-chem.co.jp/siyaku/jutaku/dna_sequence/img/figure_03_01.jpg
マルチプレックス
http://www.illuminakk.co.jp/technology/multiplexing_sequencing_assay.ilmn
(ほぼ)共通のながれ
ライブラリー
作製
シーケンシ
ング
データ解析
②
“生データ”
• 生データ: ベースコールと最低限のフィルタ
リング後、シーケンサーから出力されるリード
配列とそのクオリティー情報
(Fastq, SFF, etc)
• 出力データ量 = リード数 x リード長
• リード長
• クオリティー Phred Score
Phred Score
http://en.wikipedia.org/wiki/Phred_quality_score
http://en.wikipedia.org/wiki/Phred_quality_score
トリミング・フィルタリング
生データのQual. Valueの分布
1 51 bp
トリミング後のデータの
Qual. Valueの分布
1 51 bp
(株)ジナリス
(ほぼ)共通のながれ
ライブラリー
作製
シーケンシ
ング
データ解析
③
アセンブリー vs マッピング
コンセンサス配列
参照配列/リファレンス
リード
アダプター DNAフラグメント
シーケンスリード
http://www.slideshare.net/kbradnam/assemblathon-2-talk
ペアリード
アダプター DNAフラグメント
メイトペアリード
コンティグ
コンティグ
スキャフォールド/スーパーコンティグ
コンティグ1 コンティグ2
スキャフォールド/スーパーコンティグ
コンティグ1 コンティグ2
NNNNNNNNNNNN
スキャフォールド
ギャップ
アセンブリー結果の評価
• アセンブリーサイズ:総コンティグ/スキャフォールド長
• コンティグ・スキャフォールド数
• N50
• ギャップ数・ギャップ長
N50
12個のスキャフォールド/コンティグ、総塩基長200Mb
http://www.slideshare.net/kbradnam/assemblathon-2-talk
N50
12個のスキャフォールド/コンティグ、総塩基長200Mb
http://www.slideshare.net/kbradnam/assemblathon-2-talk
マッピングの評価
参照配列/リファレンス
A
A
A
A
A
Depth=リードの厚み
%Coverage = 参照配列の全長に対して、リードがマップされている領域の割合
SNP・一塩基置換
A
A
A
A
A
G
A
A
A
A
A
G
A
A
G
G
InDel
Deletion
Insertion
リピート配列
ATTGGCTATGGTTACAGAACGCGCGCGCGCGCGCGCGCGCGCGCGCGCATTGCACTT
GTTACA
GTTACA
GCACTT
GCACTT
CGCGCG
CGCGCG
??
高次解析
• 遺伝子アノテーション
• SNP解析
• 発現量解析
• コピー数
• 菌叢推定
などなど
情報収集源
First Option
https://www.google.com/?tbm=pts
Google 特許
メーカーサイト
http://www.illuminakk.co.jp/events/webinar_japan.ilmn
http://454.com/publications/index.asp
http://cell-innovation.nig.ac.jp/wiki/tiki-index.php
http://togotv.dbcls.jp/index.rb?category=NGS
http://seqanswers.com/
http://qa.lifesciencedb.jp/
http://www.genome.gov/27552682
業界ニュース
個人ブログ
http://pacbiobrothers.blogspot.jp/
http://shortreadbrothers.blogspot.jp/
匠たちに聞く
• Twitter
#ngsfield
http://genaport.genaris.com/GOC_topics.php
http://genaport.genaris.com/GOC_topics.php
GOクラブ会員募集中!
次世代シーケンシング関連の最新ニュースを定期的にお届けします。
会員登録、メールマガジン購読をご希望の方はこちら。
http://genaport.genaris.com/GOC_top.htm
ご清聴ありがとうございました
宿題: せっかくですので、本会期中に「匠」印の人
を見つけて、一つ質問してみましょう!

More Related Content

What's hot

大規模負荷試験時にやったこと
大規模負荷試験時にやったこと大規模負荷試験時にやったこと
大規模負荷試験時にやったことまべ☆てっく運営
 
遺伝研スパコンを使った解析の並列化.pptx
遺伝研スパコンを使った解析の並列化.pptx遺伝研スパコンを使った解析の並列化.pptx
遺伝研スパコンを使った解析の並列化.pptxOsamu Ogasawara
 
ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析Hiromi Kajiya-Kanegae
 
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門Amelieff
 
計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-sleepy_yoshi
 
いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例Fixstars Corporation
 
Singularityで分散深層学習
Singularityで分散深層学習Singularityで分散深層学習
Singularityで分散深層学習Hitoshi Sato
 
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化NVIDIA Japan
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類Shintaro Fukushima
 
Juliaで学ぶ Hamiltonian Monte Carlo (NUTS 入り)
Juliaで学ぶ Hamiltonian Monte Carlo (NUTS 入り)Juliaで学ぶ Hamiltonian Monte Carlo (NUTS 入り)
Juliaで学ぶ Hamiltonian Monte Carlo (NUTS 入り)Kenta Sato
 
Interact 2019:Microsoft SDN v2 よもやま話
Interact 2019:Microsoft SDN v2 よもやま話Interact 2019:Microsoft SDN v2 よもやま話
Interact 2019:Microsoft SDN v2 よもやま話wind06106
 
高速なソートアルゴリズムを書こう!!
高速なソートアルゴリズムを書こう!!高速なソートアルゴリズムを書こう!!
高速なソートアルゴリズムを書こう!!masakazu matsubara
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析Kunihiro Hisatsune
 
C++による数値解析の並列化手法
C++による数値解析の並列化手法C++による数値解析の並列化手法
C++による数値解析の並列化手法dc1394
 
【CNDT2022】SIerで実践!クラウドネイティブを普及させる取り組み
【CNDT2022】SIerで実践!クラウドネイティブを普及させる取り組み【CNDT2022】SIerで実践!クラウドネイティブを普及させる取り組み
【CNDT2022】SIerで実践!クラウドネイティブを普及させる取り組みYuta Shimada
 
明日からはじめられる Docker + さくらvpsを使った開発環境構築
明日からはじめられる Docker + さくらvpsを使った開発環境構築明日からはじめられる Docker + さくらvpsを使った開発環境構築
明日からはじめられる Docker + さくらvpsを使った開発環境構築MILI-LLC
 
PostgreSQLクエリ実行の基礎知識 ~Explainを読み解こう~
PostgreSQLクエリ実行の基礎知識 ~Explainを読み解こう~PostgreSQLクエリ実行の基礎知識 ~Explainを読み解こう~
PostgreSQLクエリ実行の基礎知識 ~Explainを読み解こう~Miki Shimogai
 

What's hot (20)

大規模負荷試験時にやったこと
大規模負荷試験時にやったこと大規模負荷試験時にやったこと
大規模負荷試験時にやったこと
 
遺伝研スパコンを使った解析の並列化.pptx
遺伝研スパコンを使った解析の並列化.pptx遺伝研スパコンを使った解析の並列化.pptx
遺伝研スパコンを使った解析の並列化.pptx
 
Distributed computing with spark
Distributed computing with sparkDistributed computing with spark
Distributed computing with spark
 
ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析
 
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門
 
計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-計算論的学習理論入門 -PAC学習とかVC次元とか-
計算論的学習理論入門 -PAC学習とかVC次元とか-
 
いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例いまさら聞けないarmを使ったNEONの基礎と活用事例
いまさら聞けないarmを使ったNEONの基礎と活用事例
 
Singularityで分散深層学習
Singularityで分散深層学習Singularityで分散深層学習
Singularityで分散深層学習
 
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化
NVIDIA cuQuantum SDK による量子回路シミュレーターの高速化
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
Rの高速化
Rの高速化Rの高速化
Rの高速化
 
Juliaで学ぶ Hamiltonian Monte Carlo (NUTS 入り)
Juliaで学ぶ Hamiltonian Monte Carlo (NUTS 入り)Juliaで学ぶ Hamiltonian Monte Carlo (NUTS 入り)
Juliaで学ぶ Hamiltonian Monte Carlo (NUTS 入り)
 
Prml11 4
Prml11 4Prml11 4
Prml11 4
 
Interact 2019:Microsoft SDN v2 よもやま話
Interact 2019:Microsoft SDN v2 よもやま話Interact 2019:Microsoft SDN v2 よもやま話
Interact 2019:Microsoft SDN v2 よもやま話
 
高速なソートアルゴリズムを書こう!!
高速なソートアルゴリズムを書こう!!高速なソートアルゴリズムを書こう!!
高速なソートアルゴリズムを書こう!!
 
ベイズ統計によるデータ解析
ベイズ統計によるデータ解析ベイズ統計によるデータ解析
ベイズ統計によるデータ解析
 
C++による数値解析の並列化手法
C++による数値解析の並列化手法C++による数値解析の並列化手法
C++による数値解析の並列化手法
 
【CNDT2022】SIerで実践!クラウドネイティブを普及させる取り組み
【CNDT2022】SIerで実践!クラウドネイティブを普及させる取り組み【CNDT2022】SIerで実践!クラウドネイティブを普及させる取り組み
【CNDT2022】SIerで実践!クラウドネイティブを普及させる取り組み
 
明日からはじめられる Docker + さくらvpsを使った開発環境構築
明日からはじめられる Docker + さくらvpsを使った開発環境構築明日からはじめられる Docker + さくらvpsを使った開発環境構築
明日からはじめられる Docker + さくらvpsを使った開発環境構築
 
PostgreSQLクエリ実行の基礎知識 ~Explainを読み解こう~
PostgreSQLクエリ実行の基礎知識 ~Explainを読み解こう~PostgreSQLクエリ実行の基礎知識 ~Explainを読み解こう~
PostgreSQLクエリ実行の基礎知識 ~Explainを読み解こう~
 

NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」