Презентация для защиты проекта на хакатоне Genehack 2015 на физтехе. Мы собрали весь protein data bank, отобрали из файлов те, которые представляют белковые комплексы. Затем для каждого такого белкового комплекса построили матрицу средних расстояний между аминокислотами (20 штук) в разных цепях. После этого по матрицам построили тепловые карты, и прокластеризовали матрицы с помощью трех методов. Self-Organising Map считался с помощью CUDA 7.0. После разбиения на кластеры, мы проаннотировали все кластеры ключевыми словами из PDB-файлов.
На выходе разработана функциональная система аннотации кластеров.
5. Вывод
April 12, 20155
Получена эффективная модель
представления информации о
расстоянии между аминокислотами в
цепях
Реализовано три различных варианта
кластеризации белковых комплексов
Разработана система функциональной
аннотации кластеров