1Д М И Т Р И Й Н О В И Ц К И Й
BIG DATA И БИОИНФОРМАТИКА
ЧТО ТАКОЕ БИОИНФОРМАТИКА
• математические методы компьютерного
анализа генома, транскриптома, протеома
(омикс- биоинформатика).
• разработка алгоритмов и программ для
предсказания пространственной структуры
биополимеров– РНК и белок - структурная
биоинформатика ~ ФОЛДНИНГ
• ]моделирование белковых
каскадов,предсказание функции белка,
регуляторных контуров и т.
2
SHOTGUN & NEXT GEN. SEQUENCING
3
Strand Sequence
Original
AGCATGCTGCAGTCATGCTTAGG
CTA
First shotgun sequence
AGCATGCTGCAGTCATGCT-------
-------------------TAGGCTA
Second shotgun sequence
AGCATG--------------------
------CTGCAGTCATGCTTAGGCTA
Reconstruction
AGCATGCTGCAGTCATGCTTAGG
CTA
ФОРМАТ FASTA : ПРИМЕР БЕЛКОВОЙ
ПОСЛЕДОВАТЕЛЬНОСТИ
4
ВЫРАВНИВАНИЕ
ПОСЛЕДОВАТЕЛЬНОСТЕЙ
5
• Обнаружение внутривидового
и межвидового полиморфизма.
• Таксономия
• Молекулярные часы
БЕЛКОВЫЕ КАСКАДЫ
6
ОДИН ИЗ КАСКАДОВ РЕАКЦИЙ В
КОНСОЛИДАЦИИ ПАМЯТИ С УЧАСТИЕМ
CREB/EBP
7
ПРЕДСКАЗАНИЕ СТРУКТУРЫ БЕЛКА
(ФОЛДИНГ)
• .Моделирование5 (молекулярная физика)
• Решение сложной задачи оптимизации
• Можно использовать машинное обучение
• Глубокие нейронные сети
• Высокий параллелизм, можно использовать GPU
8
9
МНОГОФУНКЦИОНАЛЬНЫЙ ФАКТОР
CREB1
10
Популярный белок CREB1
участвует в десятках
процессах в клетке.
Является
транскрипционным
фактором, выглядит как
«ножницы»
связывающиеся с ДНК.
Играет важную роль в
процессах обучения и
памяти.
ТРАНСКРИПЦИОННЫЙ ФАКТОР ZIF268-
ВАЖНЫЙ БЕЛОК В СИНАПТИЧЕСКОЙ
ПЛАСТИЧНОСТИ
• Показан комплекс zif268 , ДНК и цинка
11
ЯЗЫКИ, ПЛАТФОРМЫ, БИБЛИОТЕКИ
•BioPerl
•BioPython
•R/Bioconductor
•Matlab
•Julia (BioSeq ?)
•Scala/Spark (ADAM)
12
13
14
15
ИЛЬЯ ИЛЬИЧ
МЕЧНИКОВ
16
СПАСИБО ЗА ВНИМАНИЕ!
17
ДАНИО РЕРИО (DANIO RERIO),
ИЛИ ZEBRAFISH (ДИКИЙ)
18
ЧЕМ ХОРОША РЫБКА ДАНИО
• Позвоночное животное
• Достаточно сложный мозг, может обучаться
• Внешнее оплодотворение- легче проводить
генетическую модификацию (трансфекцию)
• Стандартный модельный организм. Геном
секвенирован
• Мальки прозрачны. Есть линии (породы),
прозрачные во взрослом возрасте
19
ЭКСПЕРИМЕНТ С ПОДСВЕТКОЙ
КАЛЬЦИЕВЫХ КАНАЛОВ В МАЛЬКЕ
ДАНИО
20
КАСПЕР- ЛИНЕЙНЫЕ
ПОЛУПРОЗРАЧНЫЕ ДАНИО
21

AI&BigData Lab. Дмитрий Новицкий "Big Data и биоинформатика".