Vvedenie v bioinformatiku_5_2

251 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
251
On SlideShare
0
From Embeds
0
Number of Embeds
11
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Vvedenie v bioinformatiku_5_2

  1. 1. Молекулярный филогенез
  2. 2. ancestor descendant 1 descendant 2 Предположение: жизнь - монофилетична Любые два организма имеют общего предка в прошлом
  3. 3. extinct extant 1 extant 2 Дистанцию (в генетическом смысле) между двумя огранизмами расчитываема. И эта дистанция может быть переведена во временную шкалу
  4. 4. (5 M лет) Общий предок
  5. 5. (120 M лет)Общий предок
  6. 6. (1,500 M лет) Общий предок
  7. 7. (1,500 M лет) (120 M лет) (5 M лет)
  8. 8. Древо Жизни (The Tree of Life Homepage (University of Arizona)) http://tolweb.org/tree/phylogeny.html 2002
  9. 9. Задачи филогенеза • Реконструкция достоверных генеалогических ветвей биологических сущностей • Оценка времени расхождения организмов • Хронометраж последовательности событий вдоль вектора эволюции
  10. 10. Источники информации и базы данных в Интернете
  11. 11. Типы баз данных • Всеобъемлющие базы данных • Организмоспецифические • Молекулярноспецифические • Дополнительные базы данных
  12. 12. Проблемы • Биологические базы данных росли последние 20 лет: 1. Избыточность: множественные записи. 2. Неверные последовательности и записи. • Открытость (данные добавляются пользователями): 1. Изменения вносятся владельцами записей. 2. Старые последовательности. 3. Неверные последовательности. 4. Неполные аннотации.
  13. 13. Полные базы данных Большие базы данных ДНК, РНК и белков. Примеры: GenBank, EMBL, swissprot. Имеется обмен информацией между базами
  14. 14. NCBI (National center for biotechnology information) NCBI PubMed Books OMIM Nucleotides Proteins GenomesTaxonomy Structure Domains Exp’ profiles
  15. 15. NCBI - GenBank • GenBank: открытая база данных нуклеотидных и аминокислотных последовательностей • Источники информации: 1. Прямая подача от исследователей. 2. Литература. 3. Центры исследований последовательностей (Sanger, TIgr) 4. Обмен с другими базами (swiss-prot, PDB).
  16. 16. NCBI - GenBank • GenBank поделён на подбазы: 1. Organism specific (Human, Bacteria, etc). 2. Molecule specific (DNA, RNA, protein). 3. Sequence specific (Genome, mRNA, ESTs etc).
  17. 17. EMBL Параллельная GenBank база данных.
  18. 18. Swiss prot База данных белков: 1. Очень хорошо аннотированная. 2. Отсутствует избыточность. 3. Имеются перекрёстные ссылки. 4. ID для нескольких связанных файлов белков
  19. 19. Организмоориентированные базы
  20. 20. Молекулоспецифические базы • Базы даных, ориентированные на группы молекул GtRDB: The Genomic tRNA Database
  21. 21. PDB – Protein Data Bank • Главная база данных 3D структур белков • Включает порядка 23,000 белковых структур. • Белки организованы в группы, семейства и т.д. • Имеет порядка 5600 точных структур.
  22. 22. SCOP - Structural Classification Of Proteins • Организована в соответствии со структурными семействами белков. • Иерархическая система.
  23. 23. Текстовый поиск Общие принципы: 1. Все главные базы предоставляют удобные средства для тектового поиска. 2. Поиск по ключевым словам или полям. 3. Одновременный поиск в нескольких базах. 4. Дополнительные условия (дата, длина и т.д.).
  24. 24. NCBI - Entrez • Entrez - поисковая машина для баз NCBI. • Поиск начинается с выбора адекватной области для поикса (Nucleotide, белки). • Можно использовать определители полей, логические операторы, условия и т.д.
  25. 25. NCBI - Entrez Ограничения:
  26. 26. Эффективность поиска Эффективность: время и адекватные результаты!
  27. 27. SRS (Sequence Retrieval System). • Исталлирована на множестве серверов. • Имеет связи со многими базами данных. • Предоставляет множество инструментов и служб для анализа. • Позволяет сохранить результаты работы и анализа и продолжить работу локально.
  28. 28. SRS Рабочая среда Выбор базы данных Заполнение формы запроса Страница результатов
  29. 29. Проект ENCODE http://genome.ucsc.edu/

×