Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Total evidence
phylogenies
The missing data issue
Thomas Guillerme
?
@TGuillerme
Trinity College Dublin
Acknowledgements
Natalie Cooper (Natural History Museum - UK)
Gavin Thomas (Univ. Sheffield - UK)
Emmanuel Douzery (Univ. ...
Time
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 1 1 1
0 1 1 0
0 1 1 0
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
What is the effect of
missing data on tree
topology?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
? ? ? ?
0 ...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
150 CPU years later…
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
6 PhD months later…
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
A B C D
A B C D
A BCD
A BCD
No missing data
Missing data
25%
50%
75%
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Treesimilarity
Data
1
0
100% 25%
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Treesimilarity
1
0
Trees are identical
Trees are no more different
than expected by chance
Data100% 25%
Guillerme & Cooper...
Results
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Treesimilarity
1
0
Missing data in
the fossil record
Data100% 25%
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
Treesimilarity
1
0
Missing data in
the fossil record
Missing data
for living taxa
Data100% 25%
Guillerme & Cooper, accepte...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
? ? ? ? ? ? ?
A T T G A A C
A T C G A A C
A T C G G A C
A T C G G A A
0 0 1 0
0 ...
We need
morphological data
from living taxa!
Guillerme & Cooper, accepted, Mol. Phyl. Evol.
How much data
are out there?
Guillerme & Cooper, 2015, bioRxiv
Guillerme & Cooper, 2015, bioRxiv
Available data
?
Guillerme & Cooper, 2015, bioRxiv
Available data
?
Guillerme & Cooper, 2015, bioRxiv
Available data
Guillerme & Cooper, 2015, bioRxiv
Available data
Guillerme & Cooper, 2015, bioRxiv
Available data
16%
56/351
Treesimilarity
1
0
Missing data in
the fossil record
Missing data
for living taxa
Data100% 25%
Treesimilarity
1
0
Missing data in
the fossil record
Missing data
for living taxa
Data100% 25%
Treesimilarity
1
0
Missing data in
the fossil record
Missing data
for living taxa
Data100% 25%
@TGuillerme
Guillerme & Coo...
Treesimilarity
1
0
Missing data in
the fossil record
Missing data
for living taxa
Data100% 25%
@TGuillerme
Thank you
Guill...
Total evidence phylogenies: the missing data issue
Total evidence phylogenies: the missing data issue
Total evidence phylogenies: the missing data issue
Total evidence phylogenies: the missing data issue
Total evidence phylogenies: the missing data issue
Upcoming SlideShare
Loading in …5
×

Total evidence phylogenies: the missing data issue

351 views

Published on

Presentations at the Systematics Association Biennial (Oxford 2015/08/26).
Including results of Guillerme & Cooper, accpted, Mol. Phyl. Evol. and Guillerme & Cooper, 2015, http://dx.doi.org/10.1101/022970.

Published in: Science
  • Be the first to comment

Total evidence phylogenies: the missing data issue

  1. 1. Total evidence phylogenies The missing data issue Thomas Guillerme ? @TGuillerme Trinity College Dublin
  2. 2. Acknowledgements Natalie Cooper (Natural History Museum - UK) Gavin Thomas (Univ. Sheffield - UK) Emmanuel Douzery (Univ. Montpellier II - FR) Frédéric Delsuc (Univ. Montpellier II - FR) Trevor Hodkinson (Trinity College Dublin - IE) @TGuillerme
  3. 3. Time
  4. 4. A T T G A A C A T C G A A C A T C G G A C A T C G G A A
  5. 5. 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 A T T G A A C A T C G A A C A T C G G A C A T C G G A A
  6. 6. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1
  7. 7. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 ? ? ? ? ? ? ? ?
  8. 8. What is the effect of missing data on tree topology?
  9. 9. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData No missing data Missing data 25% 50% 75% ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 ? ? ? ? 0 1 1 0 ? ? ? ? 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? ? ? ? ? ? ? ? ? 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  10. 10. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  11. 11. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 ? 0 ? 0 0 1 ? 0 ? ? 1 ? 0 ? 1 1 Fossil taxa Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  12. 12. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? 0 1 1 1 ? ? ? ? ? ? ? ? 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 Living taxa Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  13. 13. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData No missing data Missing data 25% 50% 75% ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 ? ? ? ? 0 1 1 0 ? ? ? ? 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? ? ? ? ? ? ? ? ? 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData A B C D Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  14. 14. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData No missing data Missing data 25% 50% 75% ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 ? ? ? ? 0 1 1 0 ? ? ? ? 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? ? ? ? ? ? ? ? ? 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData A B C D Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  15. 15. 150 CPU years later… Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  16. 16. 6 PhD months later… Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  17. 17. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData No missing data Missing data 25% 50% 75% ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 ? ? ? ? 0 1 1 0 ? ? ? ? 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A ? ? ? ? ? ? ? ? ? ? ? ? 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 SimulatedData A B C D A B C D A BCD A BCD Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  18. 18. A B C D A B C D A BCD A BCD No missing data Missing data 25% 50% 75% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  19. 19. Treesimilarity Data 1 0 100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  20. 20. Treesimilarity 1 0 Trees are identical Trees are no more different than expected by chance Data100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  21. 21. Results Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  22. 22. Treesimilarity 1 0 Missing data in the fossil record Data100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  23. 23. Treesimilarity 1 0 Missing data in the fossil record Missing data for living taxa Data100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  24. 24. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1 Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  25. 25. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 ? 1 0 0 0 1 1 0 1 1 1 Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  26. 26. ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? A T T G A A C A T C G A A C A T C G G A C A T C G G A A 0 0 1 0 0 1 1 1 ? ? ? ? 0 1 1 0 1 0 0 0 0 ? 1 0 0 0 1 1 0 1 1 1 Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  27. 27. We need morphological data from living taxa! Guillerme & Cooper, accepted, Mol. Phyl. Evol.
  28. 28. How much data are out there?
  29. 29. Guillerme & Cooper, 2015, bioRxiv
  30. 30. Guillerme & Cooper, 2015, bioRxiv Available data ?
  31. 31. Guillerme & Cooper, 2015, bioRxiv Available data ?
  32. 32. Guillerme & Cooper, 2015, bioRxiv Available data
  33. 33. Guillerme & Cooper, 2015, bioRxiv Available data
  34. 34. Guillerme & Cooper, 2015, bioRxiv Available data 16% 56/351
  35. 35. Treesimilarity 1 0 Missing data in the fossil record Missing data for living taxa Data100% 25%
  36. 36. Treesimilarity 1 0 Missing data in the fossil record Missing data for living taxa Data100% 25%
  37. 37. Treesimilarity 1 0 Missing data in the fossil record Missing data for living taxa Data100% 25% @TGuillerme Guillerme & Cooper, 2015 biorxiv.org Guillerme & Cooper, accepted Mol. Phyl. Evol.
  38. 38. Treesimilarity 1 0 Missing data in the fossil record Missing data for living taxa Data100% 25% @TGuillerme Thank you Guillerme & Cooper, 2015 biorxiv.org Guillerme & Cooper, accepted Mol. Phyl. Evol.

×