2. Общее
>track name=ER_E2 description=ER_E2
chr1 557112 558114
chr1 559459 560286
chr1 998864 999397
chr1 999399 999604
chr1 1004343 1005146
chr1 1070346 1071080
chr1 1305474 1306502
chr1 1358287 1358744
chr1 1776987 1777750
chr1 1820476 1821168
chr1 1922754 1923628
chr1 2131962 2132747
chr1 2325805 2326447
chr1 2368996 2369977
chr1 3119829 3120541
chr1 3244610 3245121
Данные генов мыши взяты из базы данных
http://genome.ucsc.edu RefSeq Genes версия
mm10. Данные о доменах – полученные
данные Серова (Fib_domains, Sp_domains).
Программа написана на языке java, jdk 1.7.
Классы: Main, DataLoader, Comparator,
Interval, Chromosome,
StatisticResultComparison и др.
3. Что сделано на данный момент
# domain
# domainGenes
# makeTable
# listBorder
# listLongGenes
# listNameGenes
4. # domain;
# domainGenes
# listBorder
# listLongGenes
# domain Сравнивает два bed файла. Выдает общую статистику
#domainGenes сравнивает файл доменов с файлами генов.
#listBorder выдает список генов находящихся у границы доменов или
пересекающие ее. Будет проведен анализ по генным онтологиям
#listLongGenes выдает список «длинных» генов.
6. #listNameGenes
По списку имен генов, выдает координаты и
расположение в домене. Будет проведен
анализ пар генов, лежащих рядом.
7. Дальнейшие действия
Анализ категорий генных онтологий, генов расположенных
на границах доменов(в узлах), с помощью ресурсов DAVID и
PANTHER, (http://david.abcc.ncifcrf.gov, http://pantherdb.org),
исследование уровней экспрессии генов находящихся на
границах и внутри хромосомных доменов.
Статистический анализ совместного расположения генов из
генных сетей метаболических путей. (проверка гипотезы
хромосомных контактов генов имеющих одну функцию)
Запланировано выступление на МНСК-2014, SBB-2014.