• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
20121006 algorithmsinbioinformatics vyahhi_lecture02
 

20121006 algorithmsinbioinformatics vyahhi_lecture02

on

  • 427 views

 

Statistics

Views

Total Views
427
Views on SlideShare
310
Embed Views
117

Actions

Likes
0
Downloads
0
Comments
0

3 Embeds 117

http://compsciclub.ru 105
http://www.compsciclub.ru 9
http://logic.pdmi.ras.ru 3

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    20121006 algorithmsinbioinformatics vyahhi_lecture02 20121006 algorithmsinbioinformatics vyahhi_lecture02 Presentation Transcript

    • Сравнение Последовательностей Николай Вяххи vyahhi@bioinf.spbau.ru Computer Science клуб Екатеринбург, 2012суббота, 6 октября 12 г.
    • Центральная Догмасуббота, 6 октября 12 г.
    • Омикисуббота, 6 октября 12 г.
    • Домашнее задание http://rosalind.info • DNA • RNA • REVC • PROT • HAMM http://rosalind.info/classes/enroll/ 171da3d314a0b07e00883287cd2b6ddeeeba225b/суббота, 6 октября 12 г.
    • Подстроки Строка == Последовательность НО Подстрока != Подпоследовательностьсуббота, 6 октября 12 г.
    • Расстояние Хэмминга Число замен, необходимых для преобразования первой строки во вторую. CCAGAGAC CCAAGGCTсуббота, 6 октября 12 г.
    • Редакционное расстояние Число замен, вставок и удалений, необходимых для преобразования первой строки во вторую. CCAGAGAC- CCA-AGGCT (выравнивание)суббота, 6 октября 12 г.
    • Динамика C C A G A G A C C C A A G G C Tсуббота, 6 октября 12 г.
    • Динамика C C A G A G A C C C A A G G C T ?суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 C C A A G G C T ?суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 C 2 A 3 A 4 G 5 G 6 C 7 T 8 ?суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 ? C 2 A 3 A 4 G 5 G 6 C 7 T 8 ?суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 C 2 ? A 3 A 4 G 5 G 6 C 7 T 8 ?суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 C 2 1 A 3 ? A 4 G 5 G 6 C 7 T 8 ?суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 C 2 1 A 3 ? A 4 G 5 G 6 C 7 T 8 ? d[i-1][j] + 1 d[i][j] = MIN d[i][j-1] + 1 d[i-1][j-1] + (s1[i] != s2[j])суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 1 2 3 4 5 6 7 C 2 1 0 1 2 3 4 5 6 A 3 2 1 0 1 2 3 4 5 A 4 3 2 1 1 1 2 3 4 G 5 4 3 2 1 2 1 2 3 G 6 5 4 3 2 2 2 2 3 C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3 d[i-1][j] + 1 d[i][j] = MIN d[i][j-1] + 1 d[i-1][j-1] + (s1[i] != s2[j])суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 1 2 3 4 5 6 7 C 2 1 0 1 2 3 4 5 6 A 3 2 1 0 1 2 3 4 5 A 4 3 2 1 1 1 2 3 4 G 5 4 3 2 1 2 1 2 3 G 6 5 4 3 2 2 2 2 3 C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3 d[i-1][j] + 1 d[i][j] = MIN d[i][j-1] + 1 d[i-1][j-1] + (s1[i] != s2[j])суббота, 6 октября 12 г.
    • Динамика C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 1 2 3 4 5 6 7 C 2 1 0 1 2 3 4 5 6 A 3 2 1 0 1 2 3 4 5 A 4 3 2 1 1 1 2 3 4 G 5 4 3 2 1 2 1 2 3 G 6 5 4 3 2 2 2 2 3 C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3 CCAGAGAC- CCA-AGGCTсуббота, 6 октября 12 г.
    • Динамика A B R A C A D A B R Aсуббота, 6 октября 12 г.
    • Динамика A B R A C A D A B R A -ABRACA DABR--Aсуббота, 6 октября 12 г.
    • Редакционное расстояние Память: O( ? ) Время: O( ? )суббота, 6 октября 12 г.
    • Редакционное расстояние Память: O(N2) Время: O(N2)суббота, 6 октября 12 г.
    • Редакционное расстояние Если нам нужно только расстояние, но не выравнивание, можно ли использовать меньше памяти? C C A G A G A C 0 1 2 3 4 5 6 7 8 C 1 0 1 2 3 4 5 6 7 C 2 1 0 1 2 3 4 5 6 A 3 2 1 0 1 2 3 4 5 A 4 3 2 1 1 1 2 3 4 G 5 4 3 2 1 2 1 2 3 G 6 5 4 3 2 2 2 2 3 C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3суббота, 6 октября 12 г.
    • Редакционное расстояние Если нам нужно только расстояние, но не выравнивание, можно ли использовать меньше памяти? C C A G A G A C 0 1 2 3 4 5 6 7 8 C C 1 2 0 1 1 0 2 1 3 2 4 3 5 4 6 5 7 6 Да. A 3 2 1 0 1 2 3 4 5 Храним A G 4 5 3 4 2 3 1 2 1 1 1 2 2 1 3 2 4 3 только 2 G 6 5 4 3 2 2 2 2 3 колонки. C 7 6 5 4 3 3 3 3 2 T 8 7 6 5 4 4 4 4 3суббота, 6 октября 12 г.
    • Оценка Минимизируем расстояние → максимизируем оценку (score)суббота, 6 октября 12 г.
    • Оценка Минимизируем расстояние → максимизируем оценку (score) T C A G T C A G T 1 0 0 0 T 3 -2 -1 -2 C 0 1 0 0 C -2 3 -2 -1 A 0 0 1 0 A -1 -2 3 -2 G 0 0 0 1 G -2 -1 -2 3суббота, 6 октября 12 г.
    • Оценка Минимизируем расстояние → максимизируем оценку (score) T C A G T C A G T 1 0 0 0 T 3 -2 -1 -2 C 0 1 0 0 C -2 3 -2 -1 A 0 0 1 0 A -1 -2 3 -2 G 0 0 0 1 G -2 -1 -2 3 GAP = 0 GAP = -3суббота, 6 октября 12 г.
    • Оценка Минимизируем расстояние → максимизируем оценку (score) d[i-1][j] + GAP d[i][j] = MAX d[i][j-1] + GAP d[i-1][j-1] + SCORE[s1[i]][s2[j]]суббота, 6 октября 12 г.
    • BLOSUM, PAMсуббота, 6 октября 12 г.
    • Локальное выравниваниесуббота, 6 октября 12 г.
    • Локальное выравниваниесуббота, 6 октября 12 г.
    • Локальное выравниваниесуббота, 6 октября 12 г.
    • Локальное выравниваниесуббота, 6 октября 12 г.
    • Локальное выравниваниесуббота, 6 октября 12 г.
    • Локальное выравниваниесуббота, 6 октября 12 г.
    • Локальное выравниваниесуббота, 6 октября 12 г.
    • Локальное выравнивание O(N6)суббота, 6 октября 12 г.
    • Локальное выравнивание O(N6) O(N4)суббота, 6 октября 12 г.
    • Локальное выравнивание O(N6) O(N4) Как быстрее?суббота, 6 октября 12 г.
    • Локальное выравнивание O(N6) O(N4) Как быстрее?суббота, 6 октября 12 г.
    • Локальное выравнивание 0 ← изменилось тут d[i-1][j] + GAP d[i][j] = MAX d[i][j-1] + GAP d[i-1][j-1] + SCORE[s1[i]][s2[j]]суббота, 6 октября 12 г.
    • Локальное выравнивание O(N6) O(N4) Как быстрее? O(N2) 0 ← изменилось тут d[i-1][j] + GAP d[i][j] = MAX d[i][j-1] + GAP d[i-1][j-1] + SCORE[s1[i]][s2[j]]суббота, 6 октября 12 г.
    • Локальное выравнивание A B R A C A B C D R - A 3 -2 -2 -2 -1 -3 A B -2 3 -2 -2 -2 -3 D C -2 -2 4 -1 -2 -3 A D -2 -2 -1 4 -2 -3 B R -1 -2 -2 -2 3 -3 R - -3 -3 -3 -3 -3 -3 A 0 ← изменилось тут d[i-1][j] + GAP d[i][j] = MAX d[i][j-1] + GAP d[i-1][j-1] + SCORE[s1[i]][s2[j]]суббота, 6 октября 12 г.
    • Множественное выравнивание Число замен, вставок и удалений, необходимых для преобразования K строк к одной.суббота, 6 октября 12 г.
    • Множественное выравниваниесуббота, 6 октября 12 г.
    • Множественное выравниваниесуббота, 6 октября 12 г.
    • Профильсуббота, 6 октября 12 г.
    • Множественное выравнивание Число замен, вставок и удалений, необходимых для преобразования K строк к одной. O(NK)суббота, 6 октября 12 г.
    • Множественное выравнивание Число замен, вставок и удалений, необходимых для преобразования K строк к одной. O(2KNK)суббота, 6 октября 12 г.
    • ClustalW O(K2N2)суббота, 6 октября 12 г.
    • Аффинная модель Удаление X букв подряд вероятнее, чем удаление X букв по отдельности.суббота, 6 октября 12 г.
    • Аффинная модель Удаление X букв подряд вероятнее, чем удаление X букв по отдельности.суббота, 6 октября 12 г.
    • Аффинная модель Удаление X букв подряд вероятнее, чем удаление X букв по отдельности. GAP(X) = GAP_OPENING + X * GAP_EXTENSIONсуббота, 6 октября 12 г.
    • Аффинная модельсуббота, 6 октября 12 г.
    • Аффинная модель O(N3)суббота, 6 октября 12 г.
    • Аффинная модель O(N3) Быстрее?суббота, 6 октября 12 г.
    • Аффинная модельсуббота, 6 октября 12 г.
    • Аффинная модель O(N2)суббота, 6 октября 12 г.
    • Геномные перестройки Крупные мутации: реверсии транслокации слияния расщеплениясуббота, 6 октября 12 г.
    • Геномные перестройкисуббота, 6 октября 12 г.
    • Геномные перестройкисуббота, 6 октября 12 г.
    • Что мы узнали • Редакционное расстояние • Глобальное и локальное выравнивание • Аффинная модель вставки • Всё за O(N ) 2 • Множественное выравнивание • Геномные перестройкисуббота, 6 октября 12 г.
    • Домашнее задание http://rosalind.info • EDIT • EDTA • GLOB • LOCA • MULT http://rosalind.info/classes/enroll/ 171da3d314a0b07e00883287cd2b6ddeeeba225b/суббота, 6 октября 12 г.