SlideShare a Scribd company logo
1 of 31
Молекулярный филогенез
ancestor
descendant 1 descendant 2
Предположение: жизнь -
монофилетична
Любые два организма имеют общего предка в
прошлом
extinct
extant 1 extant 2
Дистанцию (в генетическом смысле) между двумя
огранизмами расчитываема.
И эта дистанция может быть переведена во
временную шкалу
(5 M лет)
Общий предок
(120 M лет)Общий предок
(1,500 M лет)
Общий предок
(1,500 M лет)
(120 M лет)
(5 M лет)
Древо Жизни (The Tree of Life Homepage (University of
Arizona))
http://tolweb.org/tree/phylogeny.html
2002
Задачи филогенеза
• Реконструкция достоверных генеалогических
ветвей биологических сущностей
• Оценка времени расхождения организмов
• Хронометраж последовательности событий вдоль
вектора эволюции
Источники информации и базы
данных в Интернете
Типы баз данных
• Всеобъемлющие базы данных
• Организмоспецифические
• Молекулярноспецифические
• Дополнительные базы данных
Проблемы
• Биологические базы данных росли последние 20 лет:
1. Избыточность: множественные записи.
2. Неверные последовательности и записи.
• Открытость (данные добавляются пользователями):
1. Изменения вносятся владельцами записей.
2. Старые последовательности.
3. Неверные последовательности.
4. Неполные аннотации.
Полные базы данных
Большие базы данных ДНК, РНК и белков.
Примеры: GenBank, EMBL, swissprot.
Имеется обмен информацией между базами
NCBI (National center for biotechnology information)
NCBI
PubMed
Books
OMIM
Nucleotides
Proteins
GenomesTaxonomy
Structure
Domains
Exp’ profiles
NCBI - GenBank
• GenBank: открытая база данных нуклеотидных и
аминокислотных последовательностей
• Источники информации:
1. Прямая подача от исследователей.
2. Литература.
3. Центры исследований последовательностей (Sanger, TIgr)
4. Обмен с другими базами (swiss-prot, PDB).
NCBI - GenBank
• GenBank поделён на подбазы:
1. Organism specific (Human, Bacteria, etc).
2. Molecule specific (DNA, RNA, protein).
3. Sequence specific (Genome, mRNA, ESTs etc).
EMBL
Параллельная GenBank база данных.
Swiss prot
База данных белков:
1. Очень хорошо аннотированная.
2. Отсутствует избыточность.
3. Имеются перекрёстные ссылки.
4. ID для нескольких связанных файлов белков
Организмоориентированные базы
Молекулоспецифические базы
• Базы даных, ориентированные на группы молекул
GtRDB: The Genomic tRNA Database
PDB – Protein Data Bank
• Главная база данных 3D
структур белков
• Включает порядка 23,000
белковых структур.
• Белки организованы в группы,
семейства и т.д.
• Имеет порядка 5600 точных
структур.
SCOP - Structural Classification
Of Proteins
• Организована в соответствии со
структурными семействами белков.
• Иерархическая система.
Текстовый поиск
Общие принципы:
1. Все главные базы предоставляют удобные
средства для тектового поиска.
2. Поиск по ключевым словам или полям.
3. Одновременный поиск в нескольких базах.
4. Дополнительные условия (дата, длина и т.д.).
NCBI - Entrez
• Entrez - поисковая машина для баз NCBI.
• Поиск начинается с выбора адекватной области для
поикса (Nucleotide, белки).
• Можно использовать определители полей, логические
операторы, условия и т.д.
NCBI - Entrez
Ограничения:
Эффективность поиска
Эффективность: время и адекватные результаты!
SRS (Sequence Retrieval System).
• Исталлирована на множестве серверов.
• Имеет связи со многими базами данных.
• Предоставляет множество инструментов и служб для анализа.
• Позволяет сохранить результаты работы и анализа и
продолжить работу локально.
SRS
Рабочая среда
Выбор базы
данных
Заполнение
формы
запроса
Страница
результатов
Проект ENCODE
http://genome.ucsc.edu/

More Related Content

Similar to Vvedenie v bioinformatiku_5_2

Биоинформатикаинтернет.pptx
Биоинформатикаинтернет.pptxБиоинформатикаинтернет.pptx
Биоинформатикаинтернет.pptxssuser0527111
 
Biotech autumn2012-02-comparative genomics
Biotech autumn2012-02-comparative genomicsBiotech autumn2012-02-comparative genomics
Biotech autumn2012-02-comparative genomicsBioinformaticsInstitute
 
Biotech autumn2012-02-comparative genomics-1
Biotech autumn2012-02-comparative genomics-1Biotech autumn2012-02-comparative genomics-1
Biotech autumn2012-02-comparative genomics-1BioinformaticsInstitute
 
Генетическая инженерия сегодня
Генетическая инженерия сегодняГенетическая инженерия сегодня
Генетическая инженерия сегодняIlya Klabukov
 
Живой звездолет
Живой звездолетЖивой звездолет
Живой звездолетIlya Klabukov
 
Глобальные эволюционные уровни и их структура
Глобальные эволюционные уровни и их структураГлобальные эволюционные уровни и их структура
Глобальные эволюционные уровни и их структураAlexander Boldachev
 
Опыт применения данных секвенирования на платформе Illumina в генетике растений
Опыт применения данных секвенирования на платформе Illumina в генетике растенийОпыт применения данных секвенирования на платформе Illumina в генетике растений
Опыт применения данных секвенирования на платформе Illumina в генетике растенийIlya Klabukov
 
Прокариоты
ПрокариотыПрокариоты
ПрокариотыLotosPlay
 
клетка единица жизни
клетка   единица жизниклетка   единица жизни
клетка единица жизниIvan2133
 

Similar to Vvedenie v bioinformatiku_5_2 (20)

Биоинформатикаинтернет.pptx
Биоинформатикаинтернет.pptxБиоинформатикаинтернет.pptx
Биоинформатикаинтернет.pptx
 
Vvedenie v bioinformatiku_5_3
Vvedenie v bioinformatiku_5_3Vvedenie v bioinformatiku_5_3
Vvedenie v bioinformatiku_5_3
 
Biotech autumn2012-02-comparative genomics
Biotech autumn2012-02-comparative genomicsBiotech autumn2012-02-comparative genomics
Biotech autumn2012-02-comparative genomics
 
Biotech autumn2012-02-comparative genomics-1
Biotech autumn2012-02-comparative genomics-1Biotech autumn2012-02-comparative genomics-1
Biotech autumn2012-02-comparative genomics-1
 
Генетическая инженерия сегодня
Генетическая инженерия сегодняГенетическая инженерия сегодня
Генетическая инженерия сегодня
 
Живой звездолет
Живой звездолетЖивой звездолет
Живой звездолет
 
11 колчанов
11 колчанов11 колчанов
11 колчанов
 
Глобальные эволюционные уровни и их структура
Глобальные эволюционные уровни и их структураГлобальные эволюционные уровни и их структура
Глобальные эволюционные уровни и их структура
 
Опыт применения данных секвенирования на платформе Illumina в генетике растений
Опыт применения данных секвенирования на платформе Illumina в генетике растенийОпыт применения данных секвенирования на платформе Illumina в генетике растений
Опыт применения данных секвенирования на платформе Illumina в генетике растений
 
Прокариоты
ПрокариотыПрокариоты
Прокариоты
 
9 b suh
9 b suh9 b suh
9 b suh
 
9 b suh
9 b suh9 b suh
9 b suh
 
Vvedenie v bioinformatiku_4
Vvedenie v bioinformatiku_4Vvedenie v bioinformatiku_4
Vvedenie v bioinformatiku_4
 
Biotechnology 2012-05 1
Biotechnology 2012-05 1Biotechnology 2012-05 1
Biotechnology 2012-05 1
 
678
678678
678
 
678
678678
678
 
Плюрипотентность 101
Плюрипотентность 101Плюрипотентность 101
Плюрипотентность 101
 
биология как наука
биология как наукабиология как наука
биология как наука
 
клетка единица жизни
клетка   единица жизниклетка   единица жизни
клетка единица жизни
 
Biodb 2011-03
Biodb 2011-03Biodb 2011-03
Biodb 2011-03
 

More from BioinformaticsInstitute

Comparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsComparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsBioinformaticsInstitute
 
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес... Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...BioinformaticsInstitute
 
Вперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкВперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкBioinformaticsInstitute
 
"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр ПредеусBioinformaticsInstitute
 
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...BioinformaticsInstitute
 
Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)BioinformaticsInstitute
 
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...BioinformaticsInstitute
 
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)BioinformaticsInstitute
 

More from BioinformaticsInstitute (20)

Graph genome
Graph genome Graph genome
Graph genome
 
Nanopores sequencing
Nanopores sequencingNanopores sequencing
Nanopores sequencing
 
A superglue for string comparison
A superglue for string comparisonA superglue for string comparison
A superglue for string comparison
 
Comparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphsComparative Genomics and de Bruijn graphs
Comparative Genomics and de Bruijn graphs
 
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес... Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
Биоинформатический анализ данных полноэкзомного секвенирования: анализ качес...
 
Вперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днкВперед в прошлое. Методы генетической диагностики древней днк
Вперед в прошлое. Методы генетической диагностики древней днк
 
Knime & bioinformatics
Knime & bioinformaticsKnime & bioinformatics
Knime & bioinformatics
 
"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус"Зачем биологам суперкомпьютеры", Александр Предеус
"Зачем биологам суперкомпьютеры", Александр Предеус
 
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
Иммунотерапия раковых опухолей: взгляд со стороны системной биологии. Максим ...
 
Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)Рак 101 (Мария Шутова, ИоГЕН РАН)
Рак 101 (Мария Шутова, ИоГЕН РАН)
 
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
Секвенирование как инструмент исследования сложных фенотипов человека: от ген...
 
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
Инвестиции в биоинформатику и биотех (Андрей Афанасьев)
 
Biodb 2011-everything
Biodb 2011-everythingBiodb 2011-everything
Biodb 2011-everything
 
Biodb 2011-05
Biodb 2011-05Biodb 2011-05
Biodb 2011-05
 
Biodb 2011-04
Biodb 2011-04Biodb 2011-04
Biodb 2011-04
 
Biodb 2011-01
Biodb 2011-01Biodb 2011-01
Biodb 2011-01
 
Biodb 2011-02
Biodb 2011-02Biodb 2011-02
Biodb 2011-02
 
Ngs 3 1
Ngs 3 1Ngs 3 1
Ngs 3 1
 
Ngs 1 0_0
Ngs 1 0_0Ngs 1 0_0
Ngs 1 0_0
 
Ngs 2 0_0
Ngs 2 0_0Ngs 2 0_0
Ngs 2 0_0
 

Vvedenie v bioinformatiku_5_2