SlideShare a Scribd company logo
1 of 18
Организация анализа NGS
(Next-Generation sequencing)
данных в UGENE
Голосова Ольга
ООО НЦИТ «Унипро»
План
• Задача анализа данных секвенирования
• О проекте UGENE
• Сотрудничество с институтом NIAID
• Итоги
Секвенирование
Секвенирование ДНК — определение последовательности ДНК,
представление ее в цифровом виде.
Секвенирование
Высокоэффективное секвенирование (High-throughput или Next
Generation Sequencing) — группа различных методов, позволяющих
осуществлять секвенирование ДНК очень большого размера за одну
операцию.
Секвенирование
Зачем определять ДНК
• Персонализированная медицина
– Определение предрасположенности к болезням
– Более качественное проектирование лекарств (в
зависимости от генотипа и т.п.)
• Биоархеология, антропология, миграция
• Криминология
• Идентификация
• И многое другое
NGS данные
UGENE
UGENE — свободное кроссплатформенное биоинформационное
программное обеспечение [Okonechnikov K.; Golosova O.; Fursov M.; the
UGENE team. Unipro UGENE: a unified bioinformatics toolkit ;Bioinformatics
2012 28: 1166-1167].
Некоторые возможности:
• Редактор последовательностей
• Редактор множественных выравниваний
• Обозреватель сборок (Assembly Browser)
• Множество алгоритмов для анализа данных
• Автоматизация анализа (Workflow Designer)
Сотрудничество с NIAID
NIAID (National Institute of Allergy and Infectious Diseases) -
один из 27 институтов National Institutes of Health (NIH), USA
http://www.niaid.nih.gov/
Проблемы анализа NGS данных
• Разрозненность инструментов
• Несовместимость форматов
• Трудоемкость конфигурации
• Недоступность инcтрументов для разных ОС
• Запуск только из командной строки
• Много ручной рутинной работы
Цели сотрудничества
• NGS Pipelines:
– Variants Calling Pipeline
– Tuxedo Pipeline (RNA-Seq)
– Cistrome Pipeline (ChIP-Seq)
• Удобство работы:
– Pipeline wizards
– Dashboard
• Оценка времени выполнения, запуск на Amazon сервере
• А также:
– BioMart Integration
– DAS Integration
– Mobyle Integration
Variants Calling Pipeline
Поиск вариаций с помощью SAMtools:
Tuxedo Pipeline
Анализ RNA-Seq данных с помощью инструментов:
• TopHat (использует Bowtie, Bowtie2)
• Cufflinks
• Cuffmerge
• Cuffdiff
Cistrome Pipeline
Анализ ChIP-Seq данных с помощью инструментов:
• MACS
• CEAS
• peak2gene
• seqpos
• go_analysis
• conservation plot
Wizards
Dashboard
• Workflow Resources:
– workflow name;
– workflow start time;
– time left (finish time can be shown as a tooltip);
– percentage of the workflow running progress;
– amount of used memory;
– percentage of CPU usage;
• Output Files:
– clickable file name;
– the name of the workflow element that has produced the file;
– is it a temporary or final file;
– file status: is written, ready, deleted (for temporary files);
• Common Statistics
– number of messages that has been retrieved by an element, etc.;
Промежуточные итоги
• NGS Pipelines:
– Variants Calling Pipeline
– Tuxedo Pipeline (Linux, Mac OS)
– Cistrome Pipeline
• Удобство работы:
– Pipeline wizards
– Dashboard
• Оценка времени выполнения, запуск на Amazon сервере
• А также:
– BioMart Integration
– DAS Integration
– Mobyle Integration
• Довольный заказчик 
Спасибо за внимание

More Related Content

Similar to голосова 17 niaid

Анализ уязвимостей ИБ распределенного ПО (2012)
Анализ уязвимостей ИБ распределенного ПО (2012)Анализ уязвимостей ИБ распределенного ПО (2012)
Анализ уязвимостей ИБ распределенного ПО (2012)Alexey Kachalin
 
Сканирование уязвимостей со вкусом Яндекса. Тарас Иващенко, Яндекс
Сканирование уязвимостей со вкусом Яндекса. Тарас Иващенко, ЯндексСканирование уязвимостей со вкусом Яндекса. Тарас Иващенко, Яндекс
Сканирование уязвимостей со вкусом Яндекса. Тарас Иващенко, Яндексyaevents
 
Программные средства синтетической биологии для автоматизированного проектиро...
Программные средства синтетической биологии для автоматизированного проектиро...Программные средства синтетической биологии для автоматизированного проектиро...
Программные средства синтетической биологии для автоматизированного проектиро...Ilya Klabukov
 
компьютерный анализ данных геномного секвенирования по технологии Ch ip seq
компьютерный анализ данных геномного секвенирования по технологии Ch ip seqкомпьютерный анализ данных геномного секвенирования по технологии Ch ip seq
компьютерный анализ данных геномного секвенирования по технологии Ch ip seqEk_Kul
 
Развитие центра коллективного пользования высокопроизводительными вычислитель...
Развитие центра коллективного пользования высокопроизводительными вычислитель...Развитие центра коллективного пользования высокопроизводительными вычислитель...
Развитие центра коллективного пользования высокопроизводительными вычислитель...Perm State University
 
Операционные системы 2015, лекция № 4
Операционные системы 2015, лекция № 4Операционные системы 2015, лекция № 4
Операционные системы 2015, лекция № 4Aleksey Bragin
 
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данныхАфанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данныхbigdatabm
 
Семинар ДНК 16/05/2014 iBinom
Семинар ДНК 16/05/2014 iBinomСеминар ДНК 16/05/2014 iBinom
Семинар ДНК 16/05/2014 iBinomRuslan Titov
 
TMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeTMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeIosif Itkin
 
Перспективные исследования и технологии
Перспективные исследования и технологииПерспективные исследования и технологии
Перспективные исследования и технологииAncud Ltd.
 
диссертационная презентация
диссертационная презентациядиссертационная презентация
диссертационная презентацияSon Ingvar
 
Сканер-ВС. Сертифицированный инструмент для этичного хакера
Сканер-ВС. Сертифицированный инструмент для этичного хакераСканер-ВС. Сертифицированный инструмент для этичного хакера
Сканер-ВС. Сертифицированный инструмент для этичного хакераcnpo
 
Развитие систем анализа защищенности. Взгляд в будущее!
Развитие систем анализа защищенности. Взгляд в будущее!Развитие систем анализа защищенности. Взгляд в будущее!
Развитие систем анализа защищенности. Взгляд в будущее!Dmitry Evteev
 
Нейронные сети. Pureso
Нейронные сети. PuresoНейронные сети. Pureso
Нейронные сети. PuresoAlexey Dmitriev
 
Решения для мониторинга ИТ-инфраструктуры. Как правильно сделать выбор? Часть 1
Решения для мониторинга ИТ-инфраструктуры.  Как правильно сделать выбор? Часть 1Решения для мониторинга ИТ-инфраструктуры.  Как правильно сделать выбор? Часть 1
Решения для мониторинга ИТ-инфраструктуры. Как правильно сделать выбор? Часть 1СвязьКомплект
 
DevOps в Agile среде. Как, почему и когда инструменты помогают.
DevOps в Agile среде. Как, почему и когда инструменты помогают.DevOps в Agile среде. Как, почему и когда инструменты помогают.
DevOps в Agile среде. Как, почему и когда инструменты помогают.Alexander Titov
 
Python tools for web development (Python meetup Almaty #ALAPY)
Python tools for web development (Python meetup Almaty #ALAPY)Python tools for web development (Python meetup Almaty #ALAPY)
Python tools for web development (Python meetup Almaty #ALAPY)aviatakz
 
Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора Yandex
 

Similar to голосова 17 niaid (20)

Анализ уязвимостей ИБ распределенного ПО (2012)
Анализ уязвимостей ИБ распределенного ПО (2012)Анализ уязвимостей ИБ распределенного ПО (2012)
Анализ уязвимостей ИБ распределенного ПО (2012)
 
Сканирование уязвимостей со вкусом Яндекса. Тарас Иващенко, Яндекс
Сканирование уязвимостей со вкусом Яндекса. Тарас Иващенко, ЯндексСканирование уязвимостей со вкусом Яндекса. Тарас Иващенко, Яндекс
Сканирование уязвимостей со вкусом Яндекса. Тарас Иващенко, Яндекс
 
Программные средства синтетической биологии для автоматизированного проектиро...
Программные средства синтетической биологии для автоматизированного проектиро...Программные средства синтетической биологии для автоматизированного проектиро...
Программные средства синтетической биологии для автоматизированного проектиро...
 
A.g.demenev(perm su) 2014
A.g.demenev(perm su) 2014A.g.demenev(perm su) 2014
A.g.demenev(perm su) 2014
 
компьютерный анализ данных геномного секвенирования по технологии Ch ip seq
компьютерный анализ данных геномного секвенирования по технологии Ch ip seqкомпьютерный анализ данных геномного секвенирования по технологии Ch ip seq
компьютерный анализ данных геномного секвенирования по технологии Ch ip seq
 
Развитие центра коллективного пользования высокопроизводительными вычислитель...
Развитие центра коллективного пользования высокопроизводительными вычислитель...Развитие центра коллективного пользования высокопроизводительными вычислитель...
Развитие центра коллективного пользования высокопроизводительными вычислитель...
 
Операционные системы 2015, лекция № 4
Операционные системы 2015, лекция № 4Операционные системы 2015, лекция № 4
Операционные системы 2015, лекция № 4
 
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данныхАфанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
Афанасьев А. iBinom - Облачный сервис для медицинского анализа геномных данных
 
Семинар ДНК 16/05/2014 iBinom
Семинар ДНК 16/05/2014 iBinomСеминар ДНК 16/05/2014 iBinom
Семинар ДНК 16/05/2014 iBinom
 
TMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeTMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: Genode
 
Перспективные исследования и технологии
Перспективные исследования и технологииПерспективные исследования и технологии
Перспективные исследования и технологии
 
диссертационная презентация
диссертационная презентациядиссертационная презентация
диссертационная презентация
 
Сканер-ВС. Сертифицированный инструмент для этичного хакера
Сканер-ВС. Сертифицированный инструмент для этичного хакераСканер-ВС. Сертифицированный инструмент для этичного хакера
Сканер-ВС. Сертифицированный инструмент для этичного хакера
 
Развитие систем анализа защищенности. Взгляд в будущее!
Развитие систем анализа защищенности. Взгляд в будущее!Развитие систем анализа защищенности. Взгляд в будущее!
Развитие систем анализа защищенности. Взгляд в будущее!
 
Нейронные сети. Pureso
Нейронные сети. PuresoНейронные сети. Pureso
Нейронные сети. Pureso
 
Решения для мониторинга ИТ-инфраструктуры. Как правильно сделать выбор? Часть 1
Решения для мониторинга ИТ-инфраструктуры.  Как правильно сделать выбор? Часть 1Решения для мониторинга ИТ-инфраструктуры.  Как правильно сделать выбор? Часть 1
Решения для мониторинга ИТ-инфраструктуры. Как правильно сделать выбор? Часть 1
 
DevOps в Agile среде. Как, почему и когда инструменты помогают.
DevOps в Agile среде. Как, почему и когда инструменты помогают.DevOps в Agile среде. Как, почему и когда инструменты помогают.
DevOps в Agile среде. Как, почему и когда инструменты помогают.
 
Python tools for web development (Python meetup Almaty #ALAPY)
Python tools for web development (Python meetup Almaty #ALAPY)Python tools for web development (Python meetup Almaty #ALAPY)
Python tools for web development (Python meetup Almaty #ALAPY)
 
Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора
 
3 тема
3 тема3 тема
3 тема
 

More from Marina_creautor

Sertifikaty prezentaciya
Sertifikaty prezentaciyaSertifikaty prezentaciya
Sertifikaty prezentaciyaMarina_creautor
 
урнышев форум
урнышев форумурнышев форум
урнышев форумMarina_creautor
 
тюрюшкин сиис2013 оптиплат (2)
тюрюшкин сиис2013 оптиплат (2)тюрюшкин сиис2013 оптиплат (2)
тюрюшкин сиис2013 оптиплат (2)Marina_creautor
 
сидоров безопасный район 02
сидоров безопасный район 02сидоров безопасный район 02
сидоров безопасный район 02Marina_creautor
 
котов лаборатория свободных решений
котов лаборатория свободных решенийкотов лаборатория свободных решений
котов лаборатория свободных решенийMarina_creautor
 
кашин аис цон
кашин аис цонкашин аис цон
кашин аис цонMarina_creautor
 
королев пргноз
королев пргнозкоролев пргноз
королев пргнозMarina_creautor
 
карасев электронные услуги красноярска
карасев электронные услуги красноярскакарасев электронные услуги красноярска
карасев электронные услуги красноярскаMarina_creautor
 
горобцов услуги (1)
горобцов услуги (1)горобцов услуги (1)
горобцов услуги (1)Marina_creautor
 
гоков мобильные приложения
гоков мобильные приложениягоков мобильные приложения
гоков мобильные приложенияMarina_creautor
 
горобцов услуги
горобцов услугигоробцов услуги
горобцов услугиMarina_creautor
 
ананьев мой новосибирск
ананьев мой новосибирскананьев мой новосибирск
ананьев мой новосибирскMarina_creautor
 
3 арьянова-cdek siis2013
3 арьянова-cdek siis20133 арьянова-cdek siis2013
3 арьянова-cdek siis2013Marina_creautor
 
15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов
15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов
15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктовMarina_creautor
 
13 штокало ит в генетике
13  штокало ит в генетике13  штокало ит в генетике
13 штокало ит в генетикеMarina_creautor
 

More from Marina_creautor (20)

Sertifikaty prezentaciya
Sertifikaty prezentaciyaSertifikaty prezentaciya
Sertifikaty prezentaciya
 
урнышев форум
урнышев форумурнышев форум
урнышев форум
 
тюрюшкин сиис2013 оптиплат (2)
тюрюшкин сиис2013 оптиплат (2)тюрюшкин сиис2013 оптиплат (2)
тюрюшкин сиис2013 оптиплат (2)
 
сидоров безопасный район 02
сидоров безопасный район 02сидоров безопасный район 02
сидоров безопасный район 02
 
котов лаборатория свободных решений
котов лаборатория свободных решенийкотов лаборатория свободных решений
котов лаборатория свободных решений
 
поздняков Ibm
поздняков Ibmпоздняков Ibm
поздняков Ibm
 
кашин аис цон
кашин аис цонкашин аис цон
кашин аис цон
 
королев пргноз
королев пргнозкоролев пргноз
королев пргноз
 
нек спо
нек спонек спо
нек спо
 
карасев электронные услуги красноярска
карасев электронные услуги красноярскакарасев электронные услуги красноярска
карасев электронные услуги красноярска
 
горобцов услуги (1)
горобцов услуги (1)горобцов услуги (1)
горобцов услуги (1)
 
гоков мобильные приложения
гоков мобильные приложениягоков мобильные приложения
гоков мобильные приложения
 
зеленцов рои
зеленцов роизеленцов рои
зеленцов рои
 
горобцов услуги
горобцов услугигоробцов услуги
горобцов услуги
 
ананьев мой новосибирск
ананьев мой новосибирскананьев мой новосибирск
ананьев мой новосибирск
 
гайдук барс
гайдук барсгайдук барс
гайдук барс
 
3 арьянова-cdek siis2013
3 арьянова-cdek siis20133 арьянова-cdek siis2013
3 арьянова-cdek siis2013
 
15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов
15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов
15 сиис 2013.павловскийен.баланс разработки и продвижения наукоёмких продуктов
 
09 rodionov
09 rodionov09 rodionov
09 rodionov
 
13 штокало ит в генетике
13  штокало ит в генетике13  штокало ит в генетике
13 штокало ит в генетике
 

голосова 17 niaid

  • 1. Организация анализа NGS (Next-Generation sequencing) данных в UGENE Голосова Ольга ООО НЦИТ «Унипро»
  • 2. План • Задача анализа данных секвенирования • О проекте UGENE • Сотрудничество с институтом NIAID • Итоги
  • 3. Секвенирование Секвенирование ДНК — определение последовательности ДНК, представление ее в цифровом виде.
  • 4. Секвенирование Высокоэффективное секвенирование (High-throughput или Next Generation Sequencing) — группа различных методов, позволяющих осуществлять секвенирование ДНК очень большого размера за одну операцию.
  • 6. Зачем определять ДНК • Персонализированная медицина – Определение предрасположенности к болезням – Более качественное проектирование лекарств (в зависимости от генотипа и т.п.) • Биоархеология, антропология, миграция • Криминология • Идентификация • И многое другое
  • 8. UGENE UGENE — свободное кроссплатформенное биоинформационное программное обеспечение [Okonechnikov K.; Golosova O.; Fursov M.; the UGENE team. Unipro UGENE: a unified bioinformatics toolkit ;Bioinformatics 2012 28: 1166-1167]. Некоторые возможности: • Редактор последовательностей • Редактор множественных выравниваний • Обозреватель сборок (Assembly Browser) • Множество алгоритмов для анализа данных • Автоматизация анализа (Workflow Designer)
  • 9. Сотрудничество с NIAID NIAID (National Institute of Allergy and Infectious Diseases) - один из 27 институтов National Institutes of Health (NIH), USA http://www.niaid.nih.gov/
  • 10. Проблемы анализа NGS данных • Разрозненность инструментов • Несовместимость форматов • Трудоемкость конфигурации • Недоступность инcтрументов для разных ОС • Запуск только из командной строки • Много ручной рутинной работы
  • 11. Цели сотрудничества • NGS Pipelines: – Variants Calling Pipeline – Tuxedo Pipeline (RNA-Seq) – Cistrome Pipeline (ChIP-Seq) • Удобство работы: – Pipeline wizards – Dashboard • Оценка времени выполнения, запуск на Amazon сервере • А также: – BioMart Integration – DAS Integration – Mobyle Integration
  • 12. Variants Calling Pipeline Поиск вариаций с помощью SAMtools:
  • 13. Tuxedo Pipeline Анализ RNA-Seq данных с помощью инструментов: • TopHat (использует Bowtie, Bowtie2) • Cufflinks • Cuffmerge • Cuffdiff
  • 14. Cistrome Pipeline Анализ ChIP-Seq данных с помощью инструментов: • MACS • CEAS • peak2gene • seqpos • go_analysis • conservation plot
  • 16. Dashboard • Workflow Resources: – workflow name; – workflow start time; – time left (finish time can be shown as a tooltip); – percentage of the workflow running progress; – amount of used memory; – percentage of CPU usage; • Output Files: – clickable file name; – the name of the workflow element that has produced the file; – is it a temporary or final file; – file status: is written, ready, deleted (for temporary files); • Common Statistics – number of messages that has been retrieved by an element, etc.;
  • 17. Промежуточные итоги • NGS Pipelines: – Variants Calling Pipeline – Tuxedo Pipeline (Linux, Mac OS) – Cistrome Pipeline • Удобство работы: – Pipeline wizards – Dashboard • Оценка времени выполнения, запуск на Amazon сервере • А также: – BioMart Integration – DAS Integration – Mobyle Integration • Довольный заказчик 