SlideShare a Scribd company logo
1 of 105
Download to read offline
The 
wild 
mushroom 
chase 
2013 
The 
last 
presentation
Presenter 
発表者 
水産総合研究センター 
中央水産研究所 
田辺 晶史 
Akifumi S. Tanabe 
National Research Institute of Fisheries Science, 
Fisheries Research Agency
メタバーコーディング 
が拓く新種探索の新時代 
Metabarcoding marks a new era 
for exploring new taxa
未知の生物を 
探す 
Exploring new taxa
どうやって? 
How?
目で見る 
observe by eyes
遅い 
Too slow
そんなときに 
メタバーコーディング 
Metabarcoding is 
able to solve this problem
メタバーコーディングって何? 
What is “metabarcoding”?
メタバーコーディングって何? 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
What is “metabarcoding”? 
soils 
sea water 
fresh water 
undigested materials 
feces 
dead bodies 
living bodies 
etc.
メタバーコーディングって何? 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
What is “metabarcoding”? 
メタゲノム 
metagenomes 
soils 
sea water 
fresh water 
undigested materials 
feces 
dead bodies 
living bodies 
etc.
メタバーコーディングって何? 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
What is “metabarcoding”? 
メタゲノム塩基配列 
metagenomes nucleotide 
soils 
sea water 
fresh water 
undigested materials 
feces 
dead bodies 
living bodies 
etc. 
sequences
メタバーコーディングって何? 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
What is “metabarcoding”? 
メタゲノム塩基配列生物種名 
metagenomes nucleotide 
soils 
sea water 
fresh water 
undigested materials 
feces 
dead bodies 
living bodies 
etc. 
sequences 
biological 
taxa
メタバーコーディングのポジティブスパイラル 
A positive spiral of metabarcoding 
メタバーコーディング 
未知生物発見 
従来法による記載分類 
improve 
metabarcoding 
メタバーコーディング 
能力向上 
metabarcoding 
DNA データベース充実 
discover 
a new taxon 
describe the new taxon 
by existing method 
expand the DNA database
メタバーコーディングって何? 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
What is “metabarcoding”? 
メタゲノム塩基配列生物種名 
metagenomes nucleotide 
sequences 
an old 
method 
PCRで特定の遺伝子座を増幅 
サンガー法で塩基配列解読 
biological 
taxa 
amplify a barcode locus 
sequence by Sanger method
メタバーコーディングって何? 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
What is “metabarcoding”? 
メタゲノム塩基配列生物種名 
metagenomes nucleotide 
sequences 
a new 
method 
PCRで特定の遺伝子座を増幅 
同時にサンプル識別用タグ配列付加 
多サンプルを混合してNGSで解読 
biological 
taxa 
amplify a barcode locus 
add multiplex identifier sequence 
mix and sequence by NGS
メタバーコーディングって何? 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
What is “metabarcoding”? 
メタゲノム塩基配列生物種名 
metagenomes nucleotide 
sequences 
biological 
an old 
method 
近縁既知配列と多重整列 
分子系統樹推定 
taxa 
multiple alignment with known relatives 
molecular phylogenetic inference
メタバーコーディングって何? 
What is “metabarcoding”? 
metagenomes nucleotide 
sequences 
biological 
taxa 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
メタゲノム塩基配列生物種名 
a new 
method 
タグ配列に基いて由来サンプルを特定 
     … demultiplexing 
   ……… quality-trimming 
 …………… quality-filtering 
   ……… denoising 
   ……… chimera removal 
    …… clustering 
     … barcoding 
配列から低品質な部位を除去 
低品質な配列を除去 
ノイズの多そうな配列を除去 
キメラと思われる配列を除去 
類似度n%以上の配列をまとめる 
類似する既知配列からホスト生物を推定
メタバーコーディングって何? 
metagenomes nucleotide 
sequences 
biological 
taxa 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
メタゲノム塩基配列生物種名 
タグ配列に基いて由来サンプルを特定 
     … demultiplexing 
   ……… quality-trimming 
 …………… quality-filtering 
   ……… denoising 
   ……… chimera removal 
    …… clustering 
     … barcoding 
配列から低品質な部位を除去 
低品質な配列を除去 
ノイズの多そうな配列を除去 
キメラと思われる配列を除去 
類似度n%以上の配列をまとめる 
類似する既知配列からホスト生物を推定 
Claident 
http://www.claident.org/ 
What is “metabarcoding”? 
a new 
method
メタバーコーディングって何? 
metagenomes nucleotide 
sequences 
biological 
taxa 
土壌 
海水 
淡水 
未消化物 
糞 
遺骸 
生物体 
など 
メタゲノム塩基配列生物種名 
タグ配列に基いて由来サンプルを特定 
     … demultiplexing 
   ……… quality-trimming 
 …………… quality-filtering 
   ……… denoising 
   ……… chimera removal 
    …… clustering 
     … barcoding 
配列から低品質な部位を除去 
低品質な配列を除去 
ノイズの多そうな配列を除去 
キメラと思われる配列を除去 
類似度n%以上の配列をまとめる 
類似する既知配列からホスト生物を推定 
Claident 
http://www.claident.org/ 
What is “metabarcoding”? 
a new 
method
植物菌根のメタバーコーディング例 
An example of metabarcoding 
of mycorrhizae 
(Toju et al. 2013)
interlude 
start
生物の分類は階層的に体系化されている 
Biological taxonomy is hierarchically systematized
生物の分類は階層的に体系化されている 
Biological taxonomy is hierarchically systematized 
界 kingdom
生物の分類は階層的に体系化されている 
Biological taxonomy is hierarchically systematized 
界 kingdom 
門 phylum
生物の分類は階層的に体系化されている 
Biological taxonomy is hierarchically systematized 
界 kingdom 
門 phylum 
綱 class
生物の分類は階層的に体系化されている 
Biological taxonomy is hierarchically systematized 
界 kingdom 
門 phylum 
綱 class 
目 order
生物の分類は階層的に体系化されている 
Biological taxonomy is hierarchically systematized 
界 kingdom 
門 phylum 
綱 class 
目 order 
科 family
生物の分類は階層的に体系化されている 
Biological taxonomy is hierarchically systematized 
界 kingdom 
門 phylum 
綱 class 
目 order 
科 family 
属 genus
生物の分類は階層的に体系化されている 
Biological taxonomy is hierarchically systematized 
界 kingdom 
門 phylum 
綱 class 
目 order 
科 family 
属 genus 
種 species
生物の所属分類群を特定=同定すると、様々なことがわかる 
Taxonomic identification gives us 
a lot of information
生物の所属分類群を特定=同定すると、様々なことがわかる 
● 生態 
Taxonomic identification gives us 
a lot of information 
Ecology
生物の所属分類群を特定=同定すると、様々なことがわかる 
● 生態 
Taxonomic identification gives us 
a lot of information 
Ecology 
● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc. 
life history, body size, habitat, distribution, etc.
生物の所属分類群を特定=同定すると、様々なことがわかる 
● 生態 
● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc. 
● 近縁の分類群 
Taxonomic identification gives us 
a lot of information 
Ecology 
life history, body size, habitat, distribution, etc. 
Closely related taxa
生物の所属分類群を特定=同定すると、様々なことがわかる 
● 生態 
Taxonomic identification gives us 
a lot of information 
Ecology 
● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc. 
● 近縁の分類群 
life history, body size, habitat, distribution, etc. 
Closely related taxa 
● ヒトであればチンパンジー,ライオンであればネコ, etc. 
chimps for humans, lions for cats, etc.
より下位の階層まで同じ分類群は、より似ている 
Organisms which belong same lower taxa 
are more similar
より下位の階層まで同じ分類群は、より似ている 
Organisms which belong same lower taxa 
are more similar 
● 既知生物に似ているほど下位の階層まで同定可能 
An organism which is more similar to known organisms 
is identifiable to lower taxa
より下位の階層まで同じ分類群は、より似ている 
Organisms which belong same lower taxa 
are more similar 
● 既知生物に似ているほど下位の階層まで同定可能 
An organism which is more similar to known organisms 
is identifiable to lower taxa 
● より下位の階層(種とか)まで同定できるとより詳細にわかる 
Lower taxonomic information provides 
more detailed ecological information
interlude 
end
DNA 
→分類情報 
Translating DNA into 
taxonomic information
どうやって? 
How?
新規準 
A new criterion for molecular identification
新規準 
A new criterion for molecular identification 
問い合わせ配列と最近隣配列間の変異量 
distance between query and nearest-neighbor
新規準 
A new criterion for molecular identification 
問い合わせ配列と最近隣配列間の変異量 
distance between query and nearest-neighbor 
< 
同定結果分類群内の最大変異量 
maximum distance within resulting taxon
イメージ図 
既知配列B 
A schematic illustration 
sequence space 
既知配列A 
配列空間 
問い合わせ配列 
known sequence A 
known sequence B 
query sequence
イメージ図 
既知配列B 
A schematic illustration 
既知配列A 
属genus Ω 
種species α 
問い合わせ配列 
属genus Ω 
種species β 
配列空間 
sequence space 
known sequence A 
known sequence B 
query sequence
A schematic illustration 
配列空間 
属Ω の変異の範囲 
known sequence B 
イメージ図 
既知配列B 
sequence space 
既知配列A 
問い合わせ配列 
known sequence A 
query sequence 
variable range of genus Ω
A schematic illustration 
known sequence A 
属Ω の変異の範囲 
known sequence B 
query sequence 
イメージ図 
既知配列B 
既知配列A 
問い合わせ配列 
属genus Ω 
種species ? 
配列空間 
sequence space 
variable range of genus Ω
NN-centric auto-k-NN method 
配列空間sequence space 
問い合わせ配列 
query sequence
NN-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
Retrieve nearest-neighbor (A), and calculate distance from query (DQA) 
配列空間sequence space 
問い合わせ配列 
A 
DQA 
query sequence
NN-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 
Retrieve borderline (B), 
which is nearest to A in the sequences farther from A than Q 
DQA 
A 
配列空間 
問い合わせ配列 
B 
sequence space 
query sequence
NN-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 
3.DAN≤DABを満たす全ての配列(N) を得る 
Retrieve all sequences (Ns) filling DAN≤DAB 
DAB 
A 
B 
N 
N 
N 
配列空間sequence space 
問い合わせ配列 
query sequence
NN-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 
3.DAN≤DABを満たす全ての配列(N) を得る 
4.A, B, N の全配列で共通する分類群を採用 
Accept a taxon common to A, B, and Ns 
DAB 
A 
B 
N 
N 
N 
配列空間sequence space 
問い合わせ配列 
query sequence
NN-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
distance between query and nearest-neighbor 
2.DAB>DQAを満たす配列のうち問最いも合わA せ配に列近とい最近配隣列配列(B) 間のを変得異る 
量 
3.DAN≤DABを満たす全ての配列(N) を得る 
4.A, B, N の全配列で共通する分類群を採用 
< ≤ = 
sequence space 
DAB 
A 
B 
N 
N 
N 
配列空間 
maximum distance within resulting taxon 
問い合わせ配列 
DQA 
DAB 
同定結果分類群内の最大変異量 
query sequence
Query-centric auto-k-NN method 
配列空間sequence space 
問い合わせ配列 
query sequence
Query-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
Retrieve nearest-neighbor (A), and calculate distance from query (DQA) 
配列空間sequence space 
問い合わせ配列 
A 
DQA 
query sequence
Query-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 
Retrieve borderline (B), 
which is nearest to A in the sequences farther from A than Q 
DQA 
A 
配列空間 
問い合わせ配列 
B 
sequence space 
query sequence
Query-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 
3.DQN≤DQBを満たすすべての配列(N) を得る 
Retrieve all sequences (Ns) filling DQN≤DQB 
A 
DQB 
N 
N 
問い合わせ配列 
N 
配列空間 
B 
sequence space 
query sequence
Query-centric auto-k-NN method 
1.最近隣配列(A) を探し出して変異量(DQA) を算出 
2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 
3.DQN≤DQBを満たすすべての配列(N) を得る 
4.A, B, N の全配列で共通する分類群を採用 
Accept a taxon common to A, B, and Ns 
A 
DQB 
N 
N 
問い合わせ配列 
N 
配列空間 
B 
sequence space 
query sequence
Query-centric auto-k-NN method 
1.最近隣配列distance (A) between を探しquery 出しand てnearest-変異neighbor 
量(DQA) を算出 
問い合わせ配列と最近隣配列間の変異量 
2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 
3.DQN≤DQBを満たすすべての配列(N) を得る 
4.A, B, N の全配列で共通する分類群を採用 
sequence space 
< ≤ = 
maximum distance within resulting taxon 
A 
DQB 
N 
N 
問い合わせ配列 
N 
配列空間 
B 
DQA 
DQB 
同定結果分類群内の最大変異量 
query sequence
従来法との比較1 
Comparing with existing methods 1 
DNA database 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT…
従来法との比較1 
Comparing with existing methods 1 
DNA database 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 無作為に 
pick 
1 本抜く 
a sequence 
human ACATAGC…
従来法との比較1 
Comparing with existing methods 1 
DNA database 
無作為に 
1 本抜く 
DNA database lacking 1 sequence 
human ACATAGC… 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
pick 
a sequence
従来法との比較1 
Comparing with existing methods 1 
DNA database 
DNA database lacking 1 sequence 
human ACATAGC… 
human のDNA を 
右のデータベースを使って 
プログラムで同定して 
正解かどうかを調べる 
無作為に 
1 本抜く 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
pick 
a sequence 
identify human DNA by programs 
with DNA database lacking human DNA
従来法との比較1 
Comparing with existing methods 1 
DNA database 
DNA database lacking 1 sequence 
human ACATAGC… 
human のDNA を 
右のデータベースを使って 
プログラムで同定して 
正解かどうかを調べる 
無作為に 
1 本抜く 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
pick 
a sequence 
identify human DNA by programs 
with DNA database lacking human DNA 
抜き取ったDNA は 
プログラムからは 
未知のものになる 
Picked DNA seems to be 
“unknown sequence” 
from programs
Results of leave-one-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
Results of leave-one-out cross-validation 
1NN はよく落ちるが 
誤同定多数 
Too many misidentifications 
were produced by 1NN method 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
Results of leave-one-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified 
97%NN, 99%NN, 
Barcoder, ConstrainedNJ 
は、門レベルすら落とせない 
ことが頻繁にある 
97%NN, 99%NN, Barcoder, ConstrainedNJ were 
not able to identify the sequences even at phylum-level
Results of leave-one-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified NNC, QC は門~科までは 
よく落とせている 
NNC and QC frequently produced correct identification 
at phylum-, class-, order-, and family-level.
Results of leave-one-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified 
5NN はNNC, QC 
とよく似た結果 
5NN produced similar results to NNC and QC
従来法との比較2 
Comparing with existing methods 2 
DNA database 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 無作為に 
pick 
1 本抜く 
a sequence 
human ACATAGC…
従来法との比較2 
Comparing with existing methods 2 
DNA database 
無作為に 
1 本抜く 
DNA database lacking all seqs of a order 
human ACATAGC… 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
cow TACGTCT… 
cat GCTGTGT… 
pick 
a sequence
従来法との比較2 
Comparing with existing methods 2 
DNA database 
DNA database lacking all seqs of a order 
human ACATAGC… 
human のDNA を 
右のデータベースを使って 
プログラムで同定して 
正解かどうかを調べる 
無作為に 
1 本抜く 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
cow TACGTCT… 
cat GCTGTGT… 
pick 
a sequence 
identify human DNA by programs 
with DNA database lacking all DNA of a order
従来法との比較2 
Comparing with existing methods 2 
DNA database 
DNA database lacking all seqs of a order 
human ACATAGC… 
human のDNA を 
右のデータベースを使って 
プログラムで同定して 
正解かどうかを調べる 
無作為に 
1 本抜く 
human ACATAGC… 
chimp ACATTCT… 
cow TACGTCT… 
cat GCTGTGT… 
cow TACGTCT… 
cat GCTGTGT… 
pick 
a sequence 
identify human DNA by programs 
with DNA database lacking all DNA of a order 
抜き取ったDNA の 
「目」は 
プログラムからは 
未知のものになる 
Picked DNA seems to be 
“unknown order” 
from programs
Results of leave-one-order-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
Results of leave-one-order-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-l phylum, class ではevel unidentified 
5NN, NNC, QC 
はよく似た結果
Results of leave-one-order-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified 
order の誤同定は 
5NN > NNC > QC
Results of leave-one-order-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified 
family でも 
5NN > NNC > QC
Results of leave-one-family-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
Results of leave-one-genus-out cross-validation 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
まとめ 
Conclusion 
● QCauto method... 
● 多重整列が不要 
● 既知系統樹が不要 
● どの遺伝子座でも適用可能 
● どの分類群にも適用可能 
● 前処理に時間がかからない 
● 同定処理に時間がかからない 
● 理論的背景がある 
is multiple alignment free 
is phylogenetic tree free 
is locus independent 
is taxon independent 
is fast in preprocess 
is fast in identification process 
has theoretical background 
● 「既知の綱の未知の目」といった答えを正しく出す 
can find unknown order of existing class
QCauto 法はポジティブスパイラルを加速する 
QCauto method accelerates positive spiral 
メタバーコーディング 
未知生物発見 
従来法による記載分類 
improve 
metabarcoding 
メタバーコーディング 
能力向上 
metabarcoding 
DNA データベース充実 
discover 
a new taxon 
describe the new taxon 
by existing method 
expand the DNA database
QCauto 法はポジティブスパイラルを加速する 
QCauto method accelerates positive spiral 
メタバーコーディング 
未知生物発見 
従来法による記載分類 
improve 
metabarcoding 
メタバーコーディング 
能力向上 
metabarcoding 
DNA データベース充実 
discover 
a new taxon 
describe the new taxon 
by existing method 
expand the DNA database 
Bottleneck
誤同定の要因 
● 見かけ上の誤同定 
● 問い合わせ配列の同定情報が間違っている 
● 既知配列の同定情報が間違っている 
● 分類体系が系統関係を反映していない 
● 本当の誤同定 
● バーコード領域がincomplete lineage sorting や浸透交雑・水平 
伝播によって種の系統関係を反映していない 
● 変異量の指標(BLAST raw score) が不適 
● 規準が不適
全分類群全遺伝子座でのLOOCV 結果 
属レベルが最も 
誤同定が多い 
correctly identified incorrectly identified cannot identified but incorrectly identified at higher-level cannot identified
属レベルで誤同定が多いのは何故か? 
● 種を記載するとき、無理にでも属は指定する必要がある 
● 系統関係と整合的でない分類群が属で設立されやすいのでは? 
● 正しくない属に入れられてしまう種も多いのでは?
誤同定の要因 
● 見かけ上の誤同定 
● 問い合わせ配列の同定情報が間違っている 
● 既知配列の同定情報が間違っている 
● 分類体系が系統関係を反映していない 
● 本当の誤同定 
● バーコード領域がincomplete lineage sorting や浸透交雑・水平 
伝播によって種の系統関係を反映していない 
● 変異量の指標(BLAST raw score) が不適 
● 規準が不適 
「属レベルが最も誤同定が多い」 
のは、これが多いことを示している?
複数の同定結果を優先順位を付けて統合する 
● 複数の既知配列データベースでの同定結果 
● 種以下まで情報がある既知配列のみのデータベースでの同定結果 
● 科以下まで情報がある既知配列のみのデータベースでの同定結果 
● 厳しい制約下の同定結果と制約を緩めた同定結果 
● 類似配列の厳密一致分類群を採用した同定結果 
● 類似配列の90% 多数決合意分類群を採用した同定結果 
● 複数の遺伝子座での同定結果 
● 遺伝子座A の配列での同定結果 
● 遺伝子座B の配列での同定結果
複数の同定結果を優先順位を付けて統合する 
優先度綱目科属種 
高哺乳綱霊長目ヒト科 
低哺乳綱霊長目ヒト科ヒト属ヒト 
綱目科属種 
統合結果哺乳綱霊長目ヒト科ヒト属ヒト
複数の同定結果を優先順位を付けて統合する 
優先度綱目科属種 
高哺乳綱霊長目ヒト科ゴリラ属ゴリラ 
低哺乳綱霊長目ヒト科ヒト属ヒト 
綱目科属種 
統合結果哺乳綱霊長目ヒト科ゴリラ属ゴリラ
複数の同定結果を優先順位を付けて統合する 
優先度綱目科属種 
同哺乳綱霊長目ヒト科ゴリラ属ゴリラ 
同哺乳綱霊長目ヒト科ヒト属ヒト 
綱目科属種 
統合結果哺乳綱霊長目ヒト科
複数の同定結果を優先順位を付けて統合する 
優先度綱目科属種 
同哺乳綱霊長目ヒト科ゴリラ属ゴリラ 
同哺乳綱霊長目ヒト科ヒト属 
綱目科属種 
統合結果哺乳綱霊長目ヒト科ゴリラ属ゴリラ
動物COX1 でのno-LOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
動物COX1 でのLOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
細菌16S でのno-LOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
細菌16S でのLOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
真菌ITS でのno-LOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
真菌ITS でのLOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
植物matK でのno-LOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
植物matK でのLOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
植物rbcL でのno-LOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
植物rbcL でのLOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
植物trnH-psbA でのno-LOOCV 結果
植物trnH-psbA でのLOOCV 結果 
correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified

More Related Content

What's hot

フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料Amelieff
 
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料Amelieff
 
次世代シーケンサが求める機械学習
次世代シーケンサが求める機械学習次世代シーケンサが求める機械学習
次世代シーケンサが求める機械学習sesejun
 
空気中に存在する生物派生物の捕捉による特定生物の存在確認
空気中に存在する生物派生物の捕捉による特定生物の存在確認空気中に存在する生物派生物の捕捉による特定生物の存在確認
空気中に存在する生物派生物の捕捉による特定生物の存在確認HiroshiYasue
 
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)pinmarch_t Tada
 
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析Amelieff
 
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料Genaris Omics, Inc.
 
DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正弘毅 露崎
 
コスモバイオニュース No.176(2021年8月)
コスモバイオニュース No.176(2021年8月)コスモバイオニュース No.176(2021年8月)
コスモバイオニュース No.176(2021年8月)COSMO BIO
 
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門Amelieff
 
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」Genaris Omics, Inc.
 
Exome解析入門
Exome解析入門Exome解析入門
Exome解析入門Amelieff
 
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造Tetsuro Toyoda
 
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージmetaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ弘毅 露崎
 
遺伝子のアノテーション付加
遺伝子のアノテーション付加遺伝子のアノテーション付加
遺伝子のアノテーション付加弘毅 露崎
 
環境試料からの核酸精製キット ミニカタログ(ZYR : ZYMO RESEARCH/#5764) | フナコシ株式会社
環境試料からの核酸精製キット ミニカタログ(ZYR : ZYMO RESEARCH/#5764) | フナコシ株式会社環境試料からの核酸精製キット ミニカタログ(ZYR : ZYMO RESEARCH/#5764) | フナコシ株式会社
環境試料からの核酸精製キット ミニカタログ(ZYR : ZYMO RESEARCH/#5764) | フナコシ株式会社fu7koshi
 
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料Amelieff
 

What's hot (18)

フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
 
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
 
次世代シーケンサが求める機械学習
次世代シーケンサが求める機械学習次世代シーケンサが求める機械学習
次世代シーケンサが求める機械学習
 
空気中に存在する生物派生物の捕捉による特定生物の存在確認
空気中に存在する生物派生物の捕捉による特定生物の存在確認空気中に存在する生物派生物の捕捉による特定生物の存在確認
空気中に存在する生物派生物の捕捉による特定生物の存在確認
 
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
 
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
 
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
 
DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正DNAマイクロアレイの解析と多重検定補正
DNAマイクロアレイの解析と多重検定補正
 
コスモバイオニュース No.176(2021年8月)
コスモバイオニュース No.176(2021年8月)コスモバイオニュース No.176(2021年8月)
コスモバイオニュース No.176(2021年8月)
 
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門
 
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
 
Exome解析入門
Exome解析入門Exome解析入門
Exome解析入門
 
花咲かめら
花咲かめら花咲かめら
花咲かめら
 
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
 
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージmetaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
 
遺伝子のアノテーション付加
遺伝子のアノテーション付加遺伝子のアノテーション付加
遺伝子のアノテーション付加
 
環境試料からの核酸精製キット ミニカタログ(ZYR : ZYMO RESEARCH/#5764) | フナコシ株式会社
環境試料からの核酸精製キット ミニカタログ(ZYR : ZYMO RESEARCH/#5764) | フナコシ株式会社環境試料からの核酸精製キット ミニカタログ(ZYR : ZYMO RESEARCH/#5764) | フナコシ株式会社
環境試料からの核酸精製キット ミニカタログ(ZYR : ZYMO RESEARCH/#5764) | フナコシ株式会社
 
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
 

Viewers also liked

Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggisKearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggismarlinasitipriyati
 
El sistema solar
El sistema solarEl sistema solar
El sistema solarelenabgs
 
небезпечні предмети та дії в разі їх виявлення
небезпечні предмети та дії в разі їх виявленнянебезпечні предмети та дії в разі їх виявлення
небезпечні предмети та дії в разі їх виявленняPoltava municipal lyceum #1
 
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis marlinasitipriyati
 
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggisKearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggismarlinasitipriyati
 
Moving infographics provided by Moving van
Moving infographics provided by Moving vanMoving infographics provided by Moving van
Moving infographics provided by Moving vanAndrei Petrov
 
SMARTWaste Brochure 2015
SMARTWaste Brochure 2015SMARTWaste Brochure 2015
SMARTWaste Brochure 2015Stuart Blofeld
 
Campaign management- Account management- troubleshooting- Client handling-Pro...
Campaign management- Account management- troubleshooting- Client handling-Pro...Campaign management- Account management- troubleshooting- Client handling-Pro...
Campaign management- Account management- troubleshooting- Client handling-Pro...Priyabrata Chakraborty
 
employer-brand-playbook-us-en
employer-brand-playbook-us-enemployer-brand-playbook-us-en
employer-brand-playbook-us-enGourab Banerjee
 
Building Science 2 Project 2
Building Science 2 Project 2Building Science 2 Project 2
Building Science 2 Project 2YeeQun
 
Serdar sınıf yönetimi
Serdar sınıf yönetimiSerdar sınıf yönetimi
Serdar sınıf yönetimipashasoner
 

Viewers also liked (20)

Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggisKearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
 
El sistema solar
El sistema solarEl sistema solar
El sistema solar
 
небезпечні предмети та дії в разі їх виявлення
небезпечні предмети та дії в разі їх виявленнянебезпечні предмети та дії в разі їх виявлення
небезпечні предмети та дії в разі їх виявлення
 
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
 
причини виникнення пожеж
причини виникнення пожежпричини виникнення пожеж
причини виникнення пожеж
 
посвята в старшокласники
посвята в старшокласникипосвята в старшокласники
посвята в старшокласники
 
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggisKearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
Kearifan Lokal tentang Pencemaran limbah di Sungai kampungan pondok manggis
 
Moving infographics provided by Moving van
Moving infographics provided by Moving vanMoving infographics provided by Moving van
Moving infographics provided by Moving van
 
Bai trinh dien_gioi_thieu_bai_day
Bai trinh dien_gioi_thieu_bai_dayBai trinh dien_gioi_thieu_bai_day
Bai trinh dien_gioi_thieu_bai_day
 
SMARTWaste Brochure 2015
SMARTWaste Brochure 2015SMARTWaste Brochure 2015
SMARTWaste Brochure 2015
 
Campaign management- Account management- troubleshooting- Client handling-Pro...
Campaign management- Account management- troubleshooting- Client handling-Pro...Campaign management- Account management- troubleshooting- Client handling-Pro...
Campaign management- Account management- troubleshooting- Client handling-Pro...
 
ознаки отруєння газом
ознаки отруєння газомознаки отруєння газом
ознаки отруєння газом
 
laporan akhir objek 1 print
laporan akhir objek 1 printlaporan akhir objek 1 print
laporan akhir objek 1 print
 
Untitled Presentation
Untitled PresentationUntitled Presentation
Untitled Presentation
 
bài trình diễn con lật đật
bài trình diễn con lật đậtbài trình diễn con lật đật
bài trình diễn con lật đật
 
Muskoka Night Sky
Muskoka Night SkyMuskoka Night Sky
Muskoka Night Sky
 
employer-brand-playbook-us-en
employer-brand-playbook-us-enemployer-brand-playbook-us-en
employer-brand-playbook-us-en
 
Building Science 2 Project 2
Building Science 2 Project 2Building Science 2 Project 2
Building Science 2 Project 2
 
Serdar sınıf yönetimi
Serdar sınıf yönetimiSerdar sınıf yönetimi
Serdar sınıf yönetimi
 
Tail recursion
Tail recursionTail recursion
Tail recursion
 

More from astanabe

20170824進化学夏の学校
20170824進化学夏の学校20170824進化学夏の学校
20170824進化学夏の学校astanabe
 
20160324自由集会趣旨説明
20160324自由集会趣旨説明20160324自由集会趣旨説明
20160324自由集会趣旨説明astanabe
 
系統樹・系統仮説の可視化と系統仮説間の統計的比較 実習編
系統樹・系統仮説の可視化と系統仮説間の統計的比較 実習編系統樹・系統仮説の可視化と系統仮説間の統計的比較 実習編
系統樹・系統仮説の可視化と系統仮説間の統計的比較 実習編astanabe
 
系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編
系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編
系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編astanabe
 
最尤系統樹推定と系統樹の信頼性評価 実習編
最尤系統樹推定と系統樹の信頼性評価 実習編最尤系統樹推定と系統樹の信頼性評価 実習編
最尤系統樹推定と系統樹の信頼性評価 実習編astanabe
 
最尤系統樹推定と系統樹の信頼性評価 講義編
最尤系統樹推定と系統樹の信頼性評価 講義編最尤系統樹推定と系統樹の信頼性評価 講義編
最尤系統樹推定と系統樹の信頼性評価 講義編astanabe
 
分子進化の統計モデリングとモデル選択 実習編
分子進化の統計モデリングとモデル選択 実習編分子進化の統計モデリングとモデル選択 実習編
分子進化の統計モデリングとモデル選択 実習編astanabe
 
分子進化の統計モデリングとモデル選択 講義編
分子進化の統計モデリングとモデル選択 講義編分子進化の統計モデリングとモデル選択 講義編
分子進化の統計モデリングとモデル選択 講義編astanabe
 
分子系統樹推定に適した配列データセットの作成 実習編
分子系統樹推定に適した配列データセットの作成 実習編分子系統樹推定に適した配列データセットの作成 実習編
分子系統樹推定に適した配列データセットの作成 実習編astanabe
 
分子系統樹推定に適した配列データセットの作成 講義編
分子系統樹推定に適した配列データセットの作成 講義編分子系統樹推定に適した配列データセットの作成 講義編
分子系統樹推定に適した配列データセットの作成 講義編astanabe
 
20141211柏セミナー
20141211柏セミナー20141211柏セミナー
20141211柏セミナーastanabe
 
20141207種生物シンポ総括
20141207種生物シンポ総括20141207種生物シンポ総括
20141207種生物シンポ総括astanabe
 
20141207種生物シンポ趣旨
20141207種生物シンポ趣旨20141207種生物シンポ趣旨
20141207種生物シンポ趣旨astanabe
 

More from astanabe (13)

20170824進化学夏の学校
20170824進化学夏の学校20170824進化学夏の学校
20170824進化学夏の学校
 
20160324自由集会趣旨説明
20160324自由集会趣旨説明20160324自由集会趣旨説明
20160324自由集会趣旨説明
 
系統樹・系統仮説の可視化と系統仮説間の統計的比較 実習編
系統樹・系統仮説の可視化と系統仮説間の統計的比較 実習編系統樹・系統仮説の可視化と系統仮説間の統計的比較 実習編
系統樹・系統仮説の可視化と系統仮説間の統計的比較 実習編
 
系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編
系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編
系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編
 
最尤系統樹推定と系統樹の信頼性評価 実習編
最尤系統樹推定と系統樹の信頼性評価 実習編最尤系統樹推定と系統樹の信頼性評価 実習編
最尤系統樹推定と系統樹の信頼性評価 実習編
 
最尤系統樹推定と系統樹の信頼性評価 講義編
最尤系統樹推定と系統樹の信頼性評価 講義編最尤系統樹推定と系統樹の信頼性評価 講義編
最尤系統樹推定と系統樹の信頼性評価 講義編
 
分子進化の統計モデリングとモデル選択 実習編
分子進化の統計モデリングとモデル選択 実習編分子進化の統計モデリングとモデル選択 実習編
分子進化の統計モデリングとモデル選択 実習編
 
分子進化の統計モデリングとモデル選択 講義編
分子進化の統計モデリングとモデル選択 講義編分子進化の統計モデリングとモデル選択 講義編
分子進化の統計モデリングとモデル選択 講義編
 
分子系統樹推定に適した配列データセットの作成 実習編
分子系統樹推定に適した配列データセットの作成 実習編分子系統樹推定に適した配列データセットの作成 実習編
分子系統樹推定に適した配列データセットの作成 実習編
 
分子系統樹推定に適した配列データセットの作成 講義編
分子系統樹推定に適した配列データセットの作成 講義編分子系統樹推定に適した配列データセットの作成 講義編
分子系統樹推定に適した配列データセットの作成 講義編
 
20141211柏セミナー
20141211柏セミナー20141211柏セミナー
20141211柏セミナー
 
20141207種生物シンポ総括
20141207種生物シンポ総括20141207種生物シンポ総括
20141207種生物シンポ総括
 
20141207種生物シンポ趣旨
20141207種生物シンポ趣旨20141207種生物シンポ趣旨
20141207種生物シンポ趣旨
 

メタバーコーディングが拓く新種探索の新時代

  • 1. The wild mushroom chase 2013 The last presentation
  • 2. Presenter 発表者 水産総合研究センター 中央水産研究所 田辺 晶史 Akifumi S. Tanabe National Research Institute of Fisheries Science, Fisheries Research Agency
  • 10. メタバーコーディングって何? 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など What is “metabarcoding”? soils sea water fresh water undigested materials feces dead bodies living bodies etc.
  • 11. メタバーコーディングって何? 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など What is “metabarcoding”? メタゲノム metagenomes soils sea water fresh water undigested materials feces dead bodies living bodies etc.
  • 12. メタバーコーディングって何? 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など What is “metabarcoding”? メタゲノム塩基配列 metagenomes nucleotide soils sea water fresh water undigested materials feces dead bodies living bodies etc. sequences
  • 13. メタバーコーディングって何? 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など What is “metabarcoding”? メタゲノム塩基配列生物種名 metagenomes nucleotide soils sea water fresh water undigested materials feces dead bodies living bodies etc. sequences biological taxa
  • 14. メタバーコーディングのポジティブスパイラル A positive spiral of metabarcoding メタバーコーディング 未知生物発見 従来法による記載分類 improve metabarcoding メタバーコーディング 能力向上 metabarcoding DNA データベース充実 discover a new taxon describe the new taxon by existing method expand the DNA database
  • 15. メタバーコーディングって何? 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など What is “metabarcoding”? メタゲノム塩基配列生物種名 metagenomes nucleotide sequences an old method PCRで特定の遺伝子座を増幅 サンガー法で塩基配列解読 biological taxa amplify a barcode locus sequence by Sanger method
  • 16. メタバーコーディングって何? 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など What is “metabarcoding”? メタゲノム塩基配列生物種名 metagenomes nucleotide sequences a new method PCRで特定の遺伝子座を増幅 同時にサンプル識別用タグ配列付加 多サンプルを混合してNGSで解読 biological taxa amplify a barcode locus add multiplex identifier sequence mix and sequence by NGS
  • 17. メタバーコーディングって何? 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など What is “metabarcoding”? メタゲノム塩基配列生物種名 metagenomes nucleotide sequences biological an old method 近縁既知配列と多重整列 分子系統樹推定 taxa multiple alignment with known relatives molecular phylogenetic inference
  • 18. メタバーコーディングって何? What is “metabarcoding”? metagenomes nucleotide sequences biological taxa 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など メタゲノム塩基配列生物種名 a new method タグ配列に基いて由来サンプルを特定      … demultiplexing    ……… quality-trimming  …………… quality-filtering    ……… denoising    ……… chimera removal     …… clustering      … barcoding 配列から低品質な部位を除去 低品質な配列を除去 ノイズの多そうな配列を除去 キメラと思われる配列を除去 類似度n%以上の配列をまとめる 類似する既知配列からホスト生物を推定
  • 19. メタバーコーディングって何? metagenomes nucleotide sequences biological taxa 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など メタゲノム塩基配列生物種名 タグ配列に基いて由来サンプルを特定      … demultiplexing    ……… quality-trimming  …………… quality-filtering    ……… denoising    ……… chimera removal     …… clustering      … barcoding 配列から低品質な部位を除去 低品質な配列を除去 ノイズの多そうな配列を除去 キメラと思われる配列を除去 類似度n%以上の配列をまとめる 類似する既知配列からホスト生物を推定 Claident http://www.claident.org/ What is “metabarcoding”? a new method
  • 20. メタバーコーディングって何? metagenomes nucleotide sequences biological taxa 土壌 海水 淡水 未消化物 糞 遺骸 生物体 など メタゲノム塩基配列生物種名 タグ配列に基いて由来サンプルを特定      … demultiplexing    ……… quality-trimming  …………… quality-filtering    ……… denoising    ……… chimera removal     …… clustering      … barcoding 配列から低品質な部位を除去 低品質な配列を除去 ノイズの多そうな配列を除去 キメラと思われる配列を除去 類似度n%以上の配列をまとめる 類似する既知配列からホスト生物を推定 Claident http://www.claident.org/ What is “metabarcoding”? a new method
  • 21. 植物菌根のメタバーコーディング例 An example of metabarcoding of mycorrhizae (Toju et al. 2013)
  • 25. 生物の分類は階層的に体系化されている Biological taxonomy is hierarchically systematized 界 kingdom 門 phylum
  • 26. 生物の分類は階層的に体系化されている Biological taxonomy is hierarchically systematized 界 kingdom 門 phylum 綱 class
  • 27. 生物の分類は階層的に体系化されている Biological taxonomy is hierarchically systematized 界 kingdom 門 phylum 綱 class 目 order
  • 28. 生物の分類は階層的に体系化されている Biological taxonomy is hierarchically systematized 界 kingdom 門 phylum 綱 class 目 order 科 family
  • 29. 生物の分類は階層的に体系化されている Biological taxonomy is hierarchically systematized 界 kingdom 門 phylum 綱 class 目 order 科 family 属 genus
  • 30. 生物の分類は階層的に体系化されている Biological taxonomy is hierarchically systematized 界 kingdom 門 phylum 綱 class 目 order 科 family 属 genus 種 species
  • 32. 生物の所属分類群を特定=同定すると、様々なことがわかる ● 生態 Taxonomic identification gives us a lot of information Ecology
  • 33. 生物の所属分類群を特定=同定すると、様々なことがわかる ● 生態 Taxonomic identification gives us a lot of information Ecology ● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc. life history, body size, habitat, distribution, etc.
  • 34. 生物の所属分類群を特定=同定すると、様々なことがわかる ● 生態 ● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc. ● 近縁の分類群 Taxonomic identification gives us a lot of information Ecology life history, body size, habitat, distribution, etc. Closely related taxa
  • 35. 生物の所属分類群を特定=同定すると、様々なことがわかる ● 生態 Taxonomic identification gives us a lot of information Ecology ● 寿命,最大・平均・最小サイズ,生息環境,分布域, etc. ● 近縁の分類群 life history, body size, habitat, distribution, etc. Closely related taxa ● ヒトであればチンパンジー,ライオンであればネコ, etc. chimps for humans, lions for cats, etc.
  • 37. より下位の階層まで同じ分類群は、より似ている Organisms which belong same lower taxa are more similar ● 既知生物に似ているほど下位の階層まで同定可能 An organism which is more similar to known organisms is identifiable to lower taxa
  • 38. より下位の階層まで同じ分類群は、より似ている Organisms which belong same lower taxa are more similar ● 既知生物に似ているほど下位の階層まで同定可能 An organism which is more similar to known organisms is identifiable to lower taxa ● より下位の階層(種とか)まで同定できるとより詳細にわかる Lower taxonomic information provides more detailed ecological information
  • 40. DNA →分類情報 Translating DNA into taxonomic information
  • 42. 新規準 A new criterion for molecular identification
  • 43. 新規準 A new criterion for molecular identification 問い合わせ配列と最近隣配列間の変異量 distance between query and nearest-neighbor
  • 44. 新規準 A new criterion for molecular identification 問い合わせ配列と最近隣配列間の変異量 distance between query and nearest-neighbor < 同定結果分類群内の最大変異量 maximum distance within resulting taxon
  • 45. イメージ図 既知配列B A schematic illustration sequence space 既知配列A 配列空間 問い合わせ配列 known sequence A known sequence B query sequence
  • 46. イメージ図 既知配列B A schematic illustration 既知配列A 属genus Ω 種species α 問い合わせ配列 属genus Ω 種species β 配列空間 sequence space known sequence A known sequence B query sequence
  • 47. A schematic illustration 配列空間 属Ω の変異の範囲 known sequence B イメージ図 既知配列B sequence space 既知配列A 問い合わせ配列 known sequence A query sequence variable range of genus Ω
  • 48. A schematic illustration known sequence A 属Ω の変異の範囲 known sequence B query sequence イメージ図 既知配列B 既知配列A 問い合わせ配列 属genus Ω 種species ? 配列空間 sequence space variable range of genus Ω
  • 49. NN-centric auto-k-NN method 配列空間sequence space 問い合わせ配列 query sequence
  • 50. NN-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 Retrieve nearest-neighbor (A), and calculate distance from query (DQA) 配列空間sequence space 問い合わせ配列 A DQA query sequence
  • 51. NN-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る Retrieve borderline (B), which is nearest to A in the sequences farther from A than Q DQA A 配列空間 問い合わせ配列 B sequence space query sequence
  • 52. NN-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 3.DAN≤DABを満たす全ての配列(N) を得る Retrieve all sequences (Ns) filling DAN≤DAB DAB A B N N N 配列空間sequence space 問い合わせ配列 query sequence
  • 53. NN-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 3.DAN≤DABを満たす全ての配列(N) を得る 4.A, B, N の全配列で共通する分類群を採用 Accept a taxon common to A, B, and Ns DAB A B N N N 配列空間sequence space 問い合わせ配列 query sequence
  • 54. NN-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 distance between query and nearest-neighbor 2.DAB>DQAを満たす配列のうち問最いも合わA せ配に列近とい最近配隣列配列(B) 間のを変得異る 量 3.DAN≤DABを満たす全ての配列(N) を得る 4.A, B, N の全配列で共通する分類群を採用 < ≤ = sequence space DAB A B N N N 配列空間 maximum distance within resulting taxon 問い合わせ配列 DQA DAB 同定結果分類群内の最大変異量 query sequence
  • 55. Query-centric auto-k-NN method 配列空間sequence space 問い合わせ配列 query sequence
  • 56. Query-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 Retrieve nearest-neighbor (A), and calculate distance from query (DQA) 配列空間sequence space 問い合わせ配列 A DQA query sequence
  • 57. Query-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る Retrieve borderline (B), which is nearest to A in the sequences farther from A than Q DQA A 配列空間 問い合わせ配列 B sequence space query sequence
  • 58. Query-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 3.DQN≤DQBを満たすすべての配列(N) を得る Retrieve all sequences (Ns) filling DQN≤DQB A DQB N N 問い合わせ配列 N 配列空間 B sequence space query sequence
  • 59. Query-centric auto-k-NN method 1.最近隣配列(A) を探し出して変異量(DQA) を算出 2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 3.DQN≤DQBを満たすすべての配列(N) を得る 4.A, B, N の全配列で共通する分類群を採用 Accept a taxon common to A, B, and Ns A DQB N N 問い合わせ配列 N 配列空間 B sequence space query sequence
  • 60. Query-centric auto-k-NN method 1.最近隣配列distance (A) between を探しquery 出しand てnearest-変異neighbor 量(DQA) を算出 問い合わせ配列と最近隣配列間の変異量 2.DAB>DQAを満たす配列のうち最もA に近い配列(B) を得る 3.DQN≤DQBを満たすすべての配列(N) を得る 4.A, B, N の全配列で共通する分類群を採用 sequence space < ≤ = maximum distance within resulting taxon A DQB N N 問い合わせ配列 N 配列空間 B DQA DQB 同定結果分類群内の最大変異量 query sequence
  • 61. 従来法との比較1 Comparing with existing methods 1 DNA database human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT…
  • 62. 従来法との比較1 Comparing with existing methods 1 DNA database human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… 無作為に pick 1 本抜く a sequence human ACATAGC…
  • 63. 従来法との比較1 Comparing with existing methods 1 DNA database 無作為に 1 本抜く DNA database lacking 1 sequence human ACATAGC… human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… pick a sequence
  • 64. 従来法との比較1 Comparing with existing methods 1 DNA database DNA database lacking 1 sequence human ACATAGC… human のDNA を 右のデータベースを使って プログラムで同定して 正解かどうかを調べる 無作為に 1 本抜く human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… pick a sequence identify human DNA by programs with DNA database lacking human DNA
  • 65. 従来法との比較1 Comparing with existing methods 1 DNA database DNA database lacking 1 sequence human ACATAGC… human のDNA を 右のデータベースを使って プログラムで同定して 正解かどうかを調べる 無作為に 1 本抜く human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… pick a sequence identify human DNA by programs with DNA database lacking human DNA 抜き取ったDNA は プログラムからは 未知のものになる Picked DNA seems to be “unknown sequence” from programs
  • 66. Results of leave-one-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 67. Results of leave-one-out cross-validation 1NN はよく落ちるが 誤同定多数 Too many misidentifications were produced by 1NN method correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 68. Results of leave-one-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified 97%NN, 99%NN, Barcoder, ConstrainedNJ は、門レベルすら落とせない ことが頻繁にある 97%NN, 99%NN, Barcoder, ConstrainedNJ were not able to identify the sequences even at phylum-level
  • 69. Results of leave-one-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified NNC, QC は門~科までは よく落とせている NNC and QC frequently produced correct identification at phylum-, class-, order-, and family-level.
  • 70. Results of leave-one-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified 5NN はNNC, QC とよく似た結果 5NN produced similar results to NNC and QC
  • 71. 従来法との比較2 Comparing with existing methods 2 DNA database human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… 無作為に pick 1 本抜く a sequence human ACATAGC…
  • 72. 従来法との比較2 Comparing with existing methods 2 DNA database 無作為に 1 本抜く DNA database lacking all seqs of a order human ACATAGC… human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… cow TACGTCT… cat GCTGTGT… pick a sequence
  • 73. 従来法との比較2 Comparing with existing methods 2 DNA database DNA database lacking all seqs of a order human ACATAGC… human のDNA を 右のデータベースを使って プログラムで同定して 正解かどうかを調べる 無作為に 1 本抜く human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… cow TACGTCT… cat GCTGTGT… pick a sequence identify human DNA by programs with DNA database lacking all DNA of a order
  • 74. 従来法との比較2 Comparing with existing methods 2 DNA database DNA database lacking all seqs of a order human ACATAGC… human のDNA を 右のデータベースを使って プログラムで同定して 正解かどうかを調べる 無作為に 1 本抜く human ACATAGC… chimp ACATTCT… cow TACGTCT… cat GCTGTGT… cow TACGTCT… cat GCTGTGT… pick a sequence identify human DNA by programs with DNA database lacking all DNA of a order 抜き取ったDNA の 「目」は プログラムからは 未知のものになる Picked DNA seems to be “unknown order” from programs
  • 75. Results of leave-one-order-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 76. Results of leave-one-order-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-l phylum, class ではevel unidentified 5NN, NNC, QC はよく似た結果
  • 77. Results of leave-one-order-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified order の誤同定は 5NN > NNC > QC
  • 78. Results of leave-one-order-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified family でも 5NN > NNC > QC
  • 79. Results of leave-one-family-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 80. Results of leave-one-genus-out cross-validation correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 81. まとめ Conclusion ● QCauto method... ● 多重整列が不要 ● 既知系統樹が不要 ● どの遺伝子座でも適用可能 ● どの分類群にも適用可能 ● 前処理に時間がかからない ● 同定処理に時間がかからない ● 理論的背景がある is multiple alignment free is phylogenetic tree free is locus independent is taxon independent is fast in preprocess is fast in identification process has theoretical background ● 「既知の綱の未知の目」といった答えを正しく出す can find unknown order of existing class
  • 82. QCauto 法はポジティブスパイラルを加速する QCauto method accelerates positive spiral メタバーコーディング 未知生物発見 従来法による記載分類 improve metabarcoding メタバーコーディング 能力向上 metabarcoding DNA データベース充実 discover a new taxon describe the new taxon by existing method expand the DNA database
  • 83. QCauto 法はポジティブスパイラルを加速する QCauto method accelerates positive spiral メタバーコーディング 未知生物発見 従来法による記載分類 improve metabarcoding メタバーコーディング 能力向上 metabarcoding DNA データベース充実 discover a new taxon describe the new taxon by existing method expand the DNA database Bottleneck
  • 84.
  • 85. 誤同定の要因 ● 見かけ上の誤同定 ● 問い合わせ配列の同定情報が間違っている ● 既知配列の同定情報が間違っている ● 分類体系が系統関係を反映していない ● 本当の誤同定 ● バーコード領域がincomplete lineage sorting や浸透交雑・水平 伝播によって種の系統関係を反映していない ● 変異量の指標(BLAST raw score) が不適 ● 規準が不適
  • 86. 全分類群全遺伝子座でのLOOCV 結果 属レベルが最も 誤同定が多い correctly identified incorrectly identified cannot identified but incorrectly identified at higher-level cannot identified
  • 87. 属レベルで誤同定が多いのは何故か? ● 種を記載するとき、無理にでも属は指定する必要がある ● 系統関係と整合的でない分類群が属で設立されやすいのでは? ● 正しくない属に入れられてしまう種も多いのでは?
  • 88. 誤同定の要因 ● 見かけ上の誤同定 ● 問い合わせ配列の同定情報が間違っている ● 既知配列の同定情報が間違っている ● 分類体系が系統関係を反映していない ● 本当の誤同定 ● バーコード領域がincomplete lineage sorting や浸透交雑・水平 伝播によって種の系統関係を反映していない ● 変異量の指標(BLAST raw score) が不適 ● 規準が不適 「属レベルが最も誤同定が多い」 のは、これが多いことを示している?
  • 89. 複数の同定結果を優先順位を付けて統合する ● 複数の既知配列データベースでの同定結果 ● 種以下まで情報がある既知配列のみのデータベースでの同定結果 ● 科以下まで情報がある既知配列のみのデータベースでの同定結果 ● 厳しい制約下の同定結果と制約を緩めた同定結果 ● 類似配列の厳密一致分類群を採用した同定結果 ● 類似配列の90% 多数決合意分類群を採用した同定結果 ● 複数の遺伝子座での同定結果 ● 遺伝子座A の配列での同定結果 ● 遺伝子座B の配列での同定結果
  • 90. 複数の同定結果を優先順位を付けて統合する 優先度綱目科属種 高哺乳綱霊長目ヒト科 低哺乳綱霊長目ヒト科ヒト属ヒト 綱目科属種 統合結果哺乳綱霊長目ヒト科ヒト属ヒト
  • 91. 複数の同定結果を優先順位を付けて統合する 優先度綱目科属種 高哺乳綱霊長目ヒト科ゴリラ属ゴリラ 低哺乳綱霊長目ヒト科ヒト属ヒト 綱目科属種 統合結果哺乳綱霊長目ヒト科ゴリラ属ゴリラ
  • 92. 複数の同定結果を優先順位を付けて統合する 優先度綱目科属種 同哺乳綱霊長目ヒト科ゴリラ属ゴリラ 同哺乳綱霊長目ヒト科ヒト属ヒト 綱目科属種 統合結果哺乳綱霊長目ヒト科
  • 93. 複数の同定結果を優先順位を付けて統合する 優先度綱目科属種 同哺乳綱霊長目ヒト科ゴリラ属ゴリラ 同哺乳綱霊長目ヒト科ヒト属 綱目科属種 統合結果哺乳綱霊長目ヒト科ゴリラ属ゴリラ
  • 94. 動物COX1 でのno-LOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 95. 動物COX1 でのLOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 96. 細菌16S でのno-LOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 97. 細菌16S でのLOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 98. 真菌ITS でのno-LOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 99. 真菌ITS でのLOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 100. 植物matK でのno-LOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 101. 植物matK でのLOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 102. 植物rbcL でのno-LOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 103. 植物rbcL でのLOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified
  • 105. 植物trnH-psbA でのLOOCV 結果 correctly identified incorrectly identified unidentified but incorrectly identified at higher-level unidentified