“Анализ и визуализация генных сетей” 
Александр Фокин 
Институт Биологии Развития им. Н.К.Кольцова РАН, 
РНИМУ им. Н.И. Пирогова
Генная сеть — группа координировано экспрессирующихся генов, их белковых 
продуктов и микроРНК, контролирующих выполнение определенных функций 
организма, а также механизмы взаимосвязей между собой . 
Работа генной сети регулирует биохимические, физиологические и другие 
процессы внутри клетки. 
Кроме этого, генные сети тесно переплетены между собой и активно влияют на 
работу друг друга.
Использованнные инструменты и базы данных: 
● NCBI gene 
● PubMed Central 
● Gene Onthology 
● DrugBank 
● dbSNP 
● SNPPER 
● BioGPS 
● StringDB 
● BioGrid 
● WikiPathways 
● Panter 
● GeneMania 
● PharmGkb 
● Bio4J 
● Reactome 
● Biokarta 
● GEO 
● ArrayExpress 
● Manualy Curted Data 
● HPRD 
● MirBase 
● MirTarBase 
● OMIM 
● Mesh 
● FDA 
● NCI 
● NCCN 
● что вспомнил!
Нужно уметь задавать правильные вопросы: 
• Что и зачем мы хотим получить из огромного количества 
информации? 
• Как это сделать?
Что пошло не так внутри клетки конкретного организма? 
• биомаркеры 
прогностические 
диагностические 
Кто виноват? 
• гены-мишени/мутации 
• сигнальные каскады 
Как исправить? 
• лекарственные препараты 
• гайд-лайны
Вначале была 
база данных
Надо бы это все визуализировать
Генная сеть TP53 на GraphViz
Очень много информации на одном экране. 
Проблема: получается сложно и непонятно 
Что делать?
Создали графическую и цветовую нотацию:
Опять инфохаос
Связали Ген-РНК-Белок-микроРНК в единые сущности
А что будет, если использовать открытые базы? данных?
Информация об узле Информация о ребре
Информация о генной сети
Все равно все очень сложно и непонятно.
Фильтры 
Планируем добавить фильтры: 
● Тканевая специфичность 
● Cut-off по уровням экспрессии 
● По сигнальным каскадам
Колоректальный рак
Gene Ontology?
MirOB Ontology!
Cisplatin resistance gene network
Антагонизм MIR34A и MIR21
Кратчайший путь: PAX6 => OPTN
Потенциальные пути: PAX6 => OPTN
Случайно уронили SNPPer
Лекартсва, действующие на мишени
http://omictools.com/rna-seq-c1212-p1.html 
RNA-seq analysis
Gene expression microarray analysis 
http://omictools.com/gene-expression-array-c1210-p1.html
MirOB -- инструмент анализа генных сетей 
http://mirob.interactome.ru
Что дальше 
● Динамическая визуализация генных сетей 
● Градации по экспрессионным уровням на генной сети 
● Анализ “сырых” данных в облаке (Arrays & RNA-seq) 
● GWAS анализ 
● Имплементация основных мировых гайд-лайнов 
лечения онкозаболеваний 
● Распределенные вычисления 
Полноценный workflow от загрузки любых данных, 
до понятного отчета.
Александр Фокин 
bifurc8@gmail.com 
http://mirob.interactome.ru 
+7 910 452 44 84

Семинар по генным сетям. Mirob.

Editor's Notes

  • #5 Для построения генной сети нужно собирать и обрабатывать данные из разных источников. Часто эти данные бывают «сырые», например с чипов или полученные с секвенаторов. Но, для почти всех задач уже есть решения или информация частично собрана. Нужно лишь знать где она лежит, что из себя представляет и как правильно ее сопоставить с другими источниками. Большинство алгоритмов связанных со статистикой и анализом графов были разработаны еще в середине прошлого века. Почти все новые алгоритмы – это модификаци старых или составление более сложных из нескольких простых. Т.е. Продолжается игра в конструктор – мы не «изобретаем велосипед», а собираем из того, что уже есть. Зачем создавать то, что уже создано? Лучше использовать готовые вещи и модифицировать их под конкретные задачи.
  • #9 Чтобы посмотреть, как выглядит то, что у нас получилось мы повесили GraphViz: Надо сказать, когда появился первый визуальный фидбек, наши аннотаторы сразу заработали веселее: больше мотивов работать, когда ты сразу можешь увидеть, как каждый твой новый линк строит сложную систему геной сети.
  • #10 Но затем, как-то незаметно и быстро контент увеличивался, а генные сети усложнялись еще быстрее. Начали появлятся монстры по популярным генам.
  • #12 Подключили лидера в области визуализаци графов в биообластях -- Cytoscape, точнее его web версию Cytoscape Web. Что важно: появилась возможность двигать узлы.
  • #14 Связали узлы в единые сущности. Но в базе данных оставили триединую структуру -- еще пригодится. Но тут непонятно: сигнал вроде есть, а какой он? и что за механизм?
  • #15 Пример построение сети по данным из внешних баз данных: HPRD и BioGrid Видно, что много дублей и это в основном, межбелковые взаимодействия. К тому же предсказательные.
  • #19 Эту часть мы еще будем дорабатывать.
  • #21 Все равно много-много информации на одном экране. По этому нужно исползовать любые возможности отсечь ненужную информацию! (несмотря на то, что у нас только валидированные взаимодействия, которые с очень высокой вероятностью гарантируют прохождение сигнала) А нам еще нужно добавить болезни, мутации, метаболиты, фьюжн-гены и возможно что-то еще.
  • #31 Использовать биоинформатические разработки надо очень осторожно. В канаде есть неплохая бесплатная база данных по снипам SNPper, в которой коротко и ясно собрана необходимая информация по снипам из dbSNP и UCSC браузера. именно на этой базе мы решили протесировать одну из наших разработок: