2011 12 09_data_mining_lecture_12_part2

533 views
470 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
533
On SlideShare
0
From Embeds
0
Number of Embeds
201
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

2011 12 09_data_mining_lecture_12_part2

  1. 1. Genome rearrangements Aganezov Sergey jr. 2011 CS CenterMonday, December 12, 11
  2. 2. Genome rearrangements • Эволюция • Раковые заболевания • Предсказание будущих эволюционных измененийMonday, December 12, 11
  3. 3. Genome rearrangements • Раковые заболеванияMonday, December 12, 11
  4. 4. Genome rearrangements • “Philadelphia” chromosome хромосома 9 хромосома 22Monday, December 12, 11
  5. 5. Genome rearrangements • “Philadelphia” chromosome хромосома 9 хромосома 22Monday, December 12, 11
  6. 6. Genome rearrangements • Раковые заболеванияMonday, December 12, 11
  7. 7. неизвестный предокMonday, December 12, 11
  8. 8. неизвестный предокMonday, December 12, 11
  9. 9. неизвестный предок 80 000 000 лет мышьMonday, December 12, 11
  10. 10. 80 000 000 лет ранее... неизвестный предокMonday, December 12, 11
  11. 11. неизвестный предок 80 000 000 лет ЧеловекMonday, December 12, 11
  12. 12. Мышь 80 000 000 лет Человек 1 2 3 4 5 6 7 8 9 10 11Monday, December 12, 11
  13. 13. Мышь 80 000 000 лет Человек 1 2 3 4 5 6 7 8 9 10 11Monday, December 12, 11
  14. 14. Мышь 1 80 000 000 лет Человек 1 2 3 4 5 6 7 8 9 10 11Monday, December 12, 11
  15. 15. Мышь 1 -7 80 000 000 лет Человек 1 2 3 4 5 6 7 8 9 10 11Monday, December 12, 11
  16. 16. Мышь 1 -7 6 -10 9 -8 2 -11 -3 5 4 80 000 000 лет Человек 1 2 3 4 5 6 7 8 9 10 11Monday, December 12, 11
  17. 17. Циклический геном A = (1,2,3,4) 2 1 3 4Monday, December 12, 11
  18. 18. Циклический геном A = (1,2,3,4) 2t 2h 1h 3t 1t h 3 4h 4tMonday, December 12, 11
  19. 19. Циклический геном A = (1,-2,3,4) 2h 2t 1h 3t 1t h 3 4h 4tMonday, December 12, 11
  20. 20. 2-break операцииMonday, December 12, 11
  21. 21. Reversal A= (1,2,3,4) 2 1 3 4Monday, December 12, 11
  22. 22. Reversal A= (1,-3,-2,4) 2 1 3 4Monday, December 12, 11
  23. 23. Fissions A= (1,2,3,4) 2 1 3 4Monday, December 12, 11
  24. 24. Fissions A= (1,2,3,4) A= (1,4) (2,3) 2 1 3 4Monday, December 12, 11
  25. 25. Fusion A= (1,4) (2,3) 2 1 3 4Monday, December 12, 11
  26. 26. Fusion A= (1,4) (2,3) A=(1,2,3,4) 2 1 3 4Monday, December 12, 11
  27. 27. Breakpoint graph 2 3 1 3 1 4 4 2Monday, December 12, 11
  28. 28. Breakpoint graph A= (1,2,3,4) B = (1,3,-4,2) 2 3 1 3 1 4 4 2Monday, December 12, 11
  29. 29. Breakpoint graph A= (1,2,3,4) B = (1,3,-4,2) 2 3 1 3 1 4 4 2Monday, December 12, 11
  30. 30. Breakpoint graph A= (1,2,3,4) B = (1,3,-4,2) 2 3 1 3 1 4 4 2Monday, December 12, 11
  31. 31. Breakpoint graph A= (1,2,3,4) B = (1,3,-4,2) 2 3 1 3 1 4 4 2Monday, December 12, 11
  32. 32. Breakpoint graph A= (1,2,3,4) B = (1,3,-4,2) 2 3 1 3 1 4 4 2Monday, December 12, 11
  33. 33. Breakpoint graph A= (1,2,3,4) B = (1,3,-4,2) 2 3 1 3 1 4 4 2Monday, December 12, 11
  34. 34. Breakpoint graph 2 1 3 4 A BMonday, December 12, 11
  35. 35. Breakpoint graph A BMonday, December 12, 11
  36. 36. Breakpoint graph A BMonday, December 12, 11
  37. 37. Breakpoint graph идентичных геномов A BMonday, December 12, 11
  38. 38. Breakpoint расстояние что есть что хочетсяMonday, December 12, 11
  39. 39. 3 1 4 2Monday, December 12, 11
  40. 40. 3 1 4 2Monday, December 12, 11
  41. 41. 3 3 1 4 1 4 2 2Monday, December 12, 11
  42. 42. 3 3 1 4 1 4 2 2Monday, December 12, 11
  43. 43. 3 3 1 4 1 4 2 2Monday, December 12, 11
  44. 44. d2 (P, Q) = |P | c(P, Q) |P | количество блоков в геноме c(P, Q) количество циклов в breakpoint graphMonday, December 12, 11
  45. 45. Идентичные геномы и их breakpoint graphMonday, December 12, 11
  46. 46. d2 (P, Q) = |P | c(P, Q) |P | количество блоков в геноме c(P, Q) количество циклов в breakpoint graph Proof:Monday, December 12, 11
  47. 47. d2 (P, Q) = |P | c(P, Q) |P | количество блоков в геноме c(P, Q) количество циклов в breakpoint graph Proof: При каждой 2-break исчезает минимум один цикл и может появится максимум 2 новыхMonday, December 12, 11
  48. 48. d2 (P, Q) = |P | c(P, Q) |P | количество блоков в геноме c(P, Q) количество циклов в breakpoint graph Proof: При каждой 2-break исчезает минимум один цикл и может появится максимум 2 новых =) cycles  1Monday, December 12, 11
  49. 49. d2 (P, Q) = |P | c(P, Q) |P | количество блоков в геноме c(P, Q) количество циклов в breakpoint graph Proof: При каждой 2-break исчезает минимум один цикл и может появится максимум 2 новых =) cycles  1 c(P, Q) сколько есть циклов |P | сколько хочется цикловMonday, December 12, 11
  50. 50. d2 (P, Q) = |P | c(P, Q) |P | количество блоков в геноме c(P, Q) количество циклов в breakpoint graph Proof: При каждой 2-break исчезает минимум один цикл и может появится максимум 2 новых =) cycles  1 c(P, Q) сколько есть циклов |P | сколько хочется циклов т. к. на при каждой операции число циклов может возрастать не более чем на 1, то наименьшее число операций равно разности исходного количества циклов и необходимого.Monday, December 12, 11
  51. 51. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P,P)Monday, December 12, 11
  52. 52. Breakpoint graph что есть что хочетсяMonday, December 12, 11
  53. 53. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P, P ) Proof:Monday, December 12, 11
  54. 54. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P, P ) Proof: Если есть нетривиальный нечетный цикл, то он может быть разделен максимум на 3 нечетных цикла с помощью 3-breakMonday, December 12, 11
  55. 55. Monday, December 12, 11
  56. 56. Monday, December 12, 11
  57. 57. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P, P ) Proof:Monday, December 12, 11
  58. 58. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P, P ) Proof: Если есть нетривиальный нечетный цикл, то он может быть разделен максимум на 3 нечетных цикла с помощью 3-breakMonday, December 12, 11
  59. 59. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P, P ) Proof: Если есть нетривиальный нечетный цикл, то он может быть разделен максимум на 3 нечетных цикла с помощью 3-break cyclesodd <= 2Monday, December 12, 11
  60. 60. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P, P ) Proof: Если есть нетривиальный нечетный цикл, то он может быть разделен максимум на 3 нечетных цикла с помощью 3-break cyclesodd <= 2 Если есть нетривиальный четный цикл, то он может быть разделен максимум на 2 нечетных и один четный циклы с помощью 3-breakMonday, December 12, 11
  61. 61. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P, P ) Proof: Если есть нетривиальный нечетный цикл, то он может быть разделен максимум на 3 нечетных цикла с помощью 3-break cyclesodd <= 2 Если есть нетривиальный четный цикл, то он может быть разделен максимум на 2 нечетных и один четный циклы с помощью 3-break odd cycles <= 2Monday, December 12, 11
  62. 62. |P | codd (P, Q) d3 (P, Q) = 2 codd (P, Q) количество циклов, содержащих нечетное число ребер одного цвета |P | количество тривиальных циклов в breakpoint graph (P, P ) Proof: Если есть нетривиальный нечетный цикл, то он может быть разделен максимум на 3 нечетных цикла с помощью 3-break cyclesodd <= 2 Если есть нетривиальный четный цикл, то он может быть разделен максимум на 2 нечетных и один четный циклы с помощью 3-break odd cycles <= 2 Таким образом за каждый шаг число нечетных циклов может быть увеличено максимум на 2.Monday, December 12, 11
  63. 63. Другие расстояния & ⌅ ⇧ 1 2 |P | c4 (P, Q) c4 (P, Q)/2 d4 (P, Q) = 3 ⇠ ⇡ |P | s5 (P, Q) d5 (P, Q) = 4 где ⌫ 1 2 3 max{0, c3 (P, Q) 5 c2 (P, Q)} 5 s5 (P, Q) = c5 (P, Q) + min c5 (P, Q), c5 (P, Q) + 3Monday, December 12, 11
  64. 64. Другие расстояния ⇠ ⇡ |P | sk (P, Q) dk (P, Q) = k 1 для k = 10 s10 (P, Q) содержит более 1000 слагаемыхMonday, December 12, 11
  65. 65. СложностьM. Alekseyev, P. Pevzner“Multi-break rearrangements and chromosomal evolution”Theoretical Computer Science 395(2-3) (2008), pp. 193-202.Monday, December 12, 11
  66. 66. Сложность O(nk 2 ) + O(n)M. Alekseyev, P. Pevzner“Multi-break rearrangements and chromosomal evolution”Theoretical Computer Science 395(2-3) (2008), pp. 193-202.Monday, December 12, 11
  67. 67. Сложность O(nk 2 ) + O(n) O(nbk/2c 2 ) + O(n)M. Alekseyev, P. Pevzner“Multi-break rearrangements and chromosomal evolution”Theoretical Computer Science 395(2-3) (2008), pp. 193-202.Monday, December 12, 11
  68. 68. Сложность O(nk 2 ) + O(n) O(nbk/2c 2 ) + O(n) ⇤ O(n)M. Alekseyev, P. Pevzner“Multi-break rearrangements and chromosomal evolution”Theoretical Computer Science 395(2-3) (2008), pp. 193-202.Monday, December 12, 11
  69. 69. Сложность O(nk 2 ) + O(n) O(nbk/2c 2 ) + O(n) ⇤ O(n) ⇤ препроцесс работает за время экспоненциальное от kM. Alekseyev, P. Pevzner“Multi-break rearrangements and chromosomal evolution”Theoretical Computer Science 395(2-3) (2008), pp. 193-202.Monday, December 12, 11
  70. 70. Breakpoint re-use d3 (Human, M ouse) = 139 Если нет переиспользования, тогда будет всего 139*3 = 417разрывов. 417 соединяющих связей будут разорваны. Причем каждый раз эти связи будут различны (в свете предположения) Всего связей для разрывов 281, следовательно какие-то из них точно переиспользуются.Monday, December 12, 11
  71. 71. Breakpoint re-use d3 (Human, M ouse) = 139 Если нет переиспользования, тогда будет всего 139*3 = 417разрывов. 417 соединяющих связей будут разорваны. Причем каждый раз эти связи будут различны (в свете предположения) Всего связей для разрывов 281, следовательно какие-то из них точно переиспользуются.Monday, December 12, 11
  72. 72. Breakpoint re-use d3 (Human, M ouse) = 139 Если нет переиспользования, тогда будет всего 139*3 = 417разрывов. 417 соединяющих связей будут разорваны. Причем каждый раз эти связи будут различны (в свете предположения) Всего связей для разрывов 281, следовательно какие-то из них точно переиспользуются. Но!!! 2-break частный случай 3-breakMonday, December 12, 11
  73. 73. Breakpoint re-use Рассмотрим такую серию k-break, что геном P переводится в геном Q с минимальным количеством разрывовMonday, December 12, 11
  74. 74. Breakpoint re-use Рассмотрим такую серию k-break, что геном P переводится в геном Q с минимальным количеством разрывов Теорема: любая серия k-break переводящая P в Q делает по меньшей мере dk (P, Q) + d2 (P, Q) разрывов Max A. Alekseyev and Pavel A. Pevzner “Are there rearrangements hotspots in the Human genome?”. PLoS Computational Biology 3(11) (2007): e209Monday, December 12, 11
  75. 75. Breakpoint re-use Рассмотрим такую серию k-break, что геном P переводится в геном Q с минимальным количеством разрывов Теорема: любая серия k-break переводящая P в Q делает по меньшей мере dk (P, Q) + d2 (P, Q) разрывов Max A. Alekseyev and Pavel A. Pevzner “Are there rearrangements hotspots in the Human genome?”. PLoS Computational Biology 3(11) (2007): e209 Следствие: существует такая серия 3-break, которая переводит геном P в геном Q за d3 (P, Q) + d2 (P, Q)Monday, December 12, 11
  76. 76. Breakpoint re-useMonday, December 12, 11
  77. 77. Breakpoint re-use d2 (Human, M ouse) = 246Monday, December 12, 11
  78. 78. Breakpoint re-use d2 (Human, M ouse) = 246 d3 (Human, M ouse) = 139Monday, December 12, 11
  79. 79. Breakpoint re-use d2 (Human, M ouse) = 246 d3 (Human, M ouse) = 139 минимальное количество разрывов, необходимо для перевода генома Человека в геном МышиMonday, December 12, 11
  80. 80. Breakpoint re-use d2 (Human, M ouse) = 246 d3 (Human, M ouse) = 139 минимальное количество разрывов, необходимо для перевода генома Человека в геном Мыши d2 (Human, M ouse) + d3 (Human, M ouse) = 246 + 139 = 385Monday, December 12, 11
  81. 81. Breakpoint re-use d2 (Human, M ouse) = 246 d3 (Human, M ouse) = 139 минимальное количество разрывов, необходимо для перевода генома Человека в геном Мыши d2 (Human, M ouse) + d3 (Human, M ouse) = 246 + 139 = 385 385 >> 281Monday, December 12, 11
  82. 82. Спасибо за внимание!Monday, December 12, 11

×