AI&BigData Lab. Дмитрий Новицкий "Big Data и биоинформатика".

1Д М И Т Р И Й Н О В И Ц К И Й
BIG DATA И БИОИНФОРМАТИКА

ЧТО ТАКОЕ БИОИНФОРМАТИКА
• математические методы компьютерного
анализа генома, транскриптома, протеома
(омикс- биоинформатика).
• разработка алгоритмов и программ для
предсказания пространственной структуры
биополимеров– РНК и белок - структурная
биоинформатика ~ ФОЛДНИНГ
• ]моделирование белковых
каскадов,предсказание функции белка,
регуляторных контуров и т.
2

SHOTGUN & NEXT GEN. SEQUENCING
3
Strand Sequence
Original
AGCATGCTGCAGTCATGCTTAGG
CTA
First shotgun sequence
AGCATGCTGCAGTCATGCT-------
-------------------TAGGCTA
Second shotgun sequence
AGCATG--------------------
------CTGCAGTCATGCTTAGGCTA
Reconstruction
AGCATGCTGCAGTCATGCTTAGG
CTA

ФОРМАТ FASTA : ПРИМЕР БЕЛКОВОЙ
ПОСЛЕДОВАТЕЛЬНОСТИ
4

ВЫРАВНИВАНИЕ
ПОСЛЕДОВАТЕЛЬНОСТЕЙ
5
• Обнаружение внутривидового
и межвидового полиморфизма.
• Таксономия
• Молекулярные часы

БЕЛКОВЫЕ КАСКАДЫ
6

ОДИН ИЗ КАСКАДОВ РЕАКЦИЙ В
КОНСОЛИДАЦИИ ПАМЯТИ С УЧАСТИЕМ
CREB/EBP
7

ПРЕДСКАЗАНИЕ СТРУКТУРЫ БЕЛКА
(ФОЛДИНГ)
• .Моделирование5 (молекулярная физика)
• Решение сложной задачи оптимизации
• Можно использовать машинное обучение
• Глубокие нейронные сети
• Высокий параллелизм, можно использовать GPU
8

МНОГОФУНКЦИОНАЛЬНЫЙ ФАКТОР
CREB1
10
Популярный белок CREB1
участвует в десятках
процессах в клетке.
Является
транскрипционным
фактором, выглядит как
«ножницы»
связывающиеся с ДНК.
Играет важную роль в
процессах обучения и
памяти.

ТРАНСКРИПЦИОННЫЙ ФАКТОР ZIF268-
ВАЖНЫЙ БЕЛОК В СИНАПТИЧЕСКОЙ
ПЛАСТИЧНОСТИ
• Показан комплекс zif268 , ДНК и цинка
11

ЯЗЫКИ, ПЛАТФОРМЫ, БИБЛИОТЕКИ
•BioPerl
•BioPython
•R/Bioconductor
•Matlab
•Julia (BioSeq ?)
•Scala/Spark (ADAM)
12

ИЛЬЯ ИЛЬИЧ
МЕЧНИКОВ
16

СПАСИБО ЗА ВНИМАНИЕ!
17

ДАНИО РЕРИО (DANIO RERIO),
ИЛИ ZEBRAFISH (ДИКИЙ)
18

ЧЕМ ХОРОША РЫБКА ДАНИО
• Позвоночное животное
• Достаточно сложный мозг, может обучаться
• Внешнее оплодотворение- легче проводить
генетическую модификацию (трансфекцию)
• Стандартный модельный организм. Геном
секвенирован
• Мальки прозрачны. Есть линии (породы),
прозрачные во взрослом возрасте
19

ЭКСПЕРИМЕНТ С ПОДСВЕТКОЙ
КАЛЬЦИЕВЫХ КАНАЛОВ В МАЛЬКЕ
ДАНИО
20

КАСПЕР- ЛИНЕЙНЫЕ
ПОЛУПРОЗРАЧНЫЕ ДАНИО
21

AI&BigData Lab. Дмитрий Новицкий "Big Data и биоинформатика".

More Related Content

Viewers also liked

Similar to AI&BigData Lab. Дмитрий Новицкий "Big Data и биоинформатика".

More from GeeksLab Odessa

AI&BigData Lab. Дмитрий Новицкий "Big Data и биоинформатика".