Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Pt4 nanopore
1. Часть 4. Биоинформатика длинных прочтений
● Определение последовательности из сигнала (basecalling) и
первичный контроль качества
● Выравнивание длинных прочтений
● Гибридная и прямая сборка длинных прочтений
● Полировка геномных сборок
● Анализ данных метагеномного секвенирования
● Биоинформатика длинных прочтений и РНК-сек
● Заключение
3. Сигнал → последовательность
● первая стадия - сегментация сигнала (определение границ нуклеотидов)
● вторая стадия - собственно определение нуклеотида
4. Albacore
● официальный бейсколлер от Oxford Nanopore
● постоянно впитывает удачные находки открытых разработок
● работает под основными операционными системами
● требует немалых мощностей (более дня на 4 CPU для 5-10 Гб данных)
5. EPI2ME
● облачный сервис, доступен покупателям сервисного обслуживания
● помогает пользователям без доступа к биоинформатической экспертизе
14. Сборка из длинных прочтений
● miniasm2 - очень быстро (минуты), неплохая точность
● canu - золотой стандарт, очень медленно (сотни ЦПУ-часов)
● много других опций (HGAP3 - PacBio, FALCON, etc)
15. Гибридная сборка
● использует длинные и
короткие прочтения
● MaSuRCA (Алексей
Зимин) для эукариот
● Flye (Михаил
Колмогоров)
● Unicycler (Ryan Wick) -
для бактерий
16. Бактериальная референсная сборка
● Unicycler производит тихую революцию в сборке бактерий
● минимальное количество ошибок (misassembles)
● отлично “закрывает” плазмиды
19. Полировка 1: Racon
● улучшение консенсусной
последовательности
● необходимо после грубых
сборок (miniasm2)
● опция полировки при
помощи Illumina
20. Полировка 2: Nanopolish
● Только для нанопоры, использует fast5
● используя модель метилирования, сильно улучшает бактериальные сборки
● также определяет варианты и модификации нуклеотидов
21. Полировка 3: Pilon
● Pilon использует данные
Illumina для коррекции
небольших ошибок
● можно использовать много
раз подряд
● используется при
гибридной сборке
Unicycler
23. Классификация: Kraken, Centrifuge
● те же программы, которые полезны для работы с Illumina:
○ Kraken - быстрый таксономический классификатор на к-мерах
○ Centrifuge - менее быстрый и менее ресурсоемкий классификатор (FM-index)
● предоставляет классификацию прочтений вплоть до вида
26. Tombo: модификации РНК и ДНК
● разрабатывается
самими Oxford
Nanopore
● хорошо
предсказывает
модификации
4mC, 5mC, и 6mA
27. LoReAn: улучшенная
аннотация генома
● использует длинные
прочтения транскриптома
для улучшения аннотации
геномов
● дает результат,
превосходящий все
известные методы