유전통계학의 오늘과 내일(고려대학교 특강)

4,908 views
4,612 views

Published on

2009년 11월 19일 고려대학교 특강 자료

Published in: Education
0 Comments
7 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,908
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
148
Comments
0
Likes
7
Embeds 0
No embeds

No notes for slide

유전통계학의 오늘과 내일(고려대학교 특강)

  1. 1. 유전통계학의 오늘과 내일<br />양 우성<br />StaGen Co., Ltd<br />유전통계분석사업부<br />
  2. 2. “Genetics is the science of heredity and variation in living organisms.”<br />Wikipedia (http://en.wikipedia.org/wiki/Genetics)<br />
  3. 3. 염색체와 유전체 정보<br />
  4. 4. 4<br />DOE Human Genome Project (http://genomics.energy.gov)<br />
  5. 5.
  6. 6. Text<br />National Human Genome Research Institute<br />
  7. 7. telomere<br />centromere<br />telomere<br />
  8. 8. James Watson and Francis Crick (1953)<br />
  9. 9. Central Dogma<br />http://en.wikipedia.org/wiki/Central_dogma_of_molecular_biology<br />
  10. 10. Genome = Gene + Ome<br />Genome = Whole DNA<br />
  11. 11. Human Genome Project<br />1990년 휴먼게놈프로젝트 시작<br />2000년 DNA 염기서열 중 97% 해독 <br />2003년 99.99% 정확도의 인간유전체지도 완성 <br />Database : GenBank<br /> (http://www.ncbi.nlm.nih.gov/Genbank/)<br />
  12. 12.
  13. 13. 세포분열과 유전정보의 계승<br />
  14. 14. 체세포 분열Mitosis<br />http://www.biology.iupui.edu/biocourses/N100/2k4ch8mitosisnotes.html<br />
  15. 15. 생식세포 분열Meiosis- 1st stage<br />
  16. 16. 생식세포 분열Meiosis- 2ndstage<br />http://www.biology.iupui.edu/biocourses/n100/2k4ch9meiosisnotes.html<br />
  17. 17. (유전자좌)<br />(우성대립형질)<br />(열성대립형질)<br />(유전자형)<br />
  18. 18. 교차와 재조합Crossover & Recombination<br />http://biology200.gsu.edu/houghton/2107%20%2709/lecture15.html<br />
  19. 19. 재조합비율Recombination fraction<br />상동염색체<br />생식체(gamete)<br />생식체(gamete)<br />or<br />or<br />재조합 O<br />재조합 X<br />1-θ<br />재조합비율:θ<br />
  20. 20. 재조합비율과거리Recombination fraction & Distance<br />2 loci사이의거리가가까우면재조합비율은 0에가까워짐<br />2 loci사이의거리가멀면재조합비율은 0.5에가까워짐<br />
  21. 21. 재조합비율과거리Recombination fraction & Distance<br />L2<br />L3<br />L1<br />
  22. 22. 유전적거리(Genetic distance)<br />정의: 2개의유전자좌사이의교차횟수의기대치<br />단위 : M (morgan)<br />1M은“1회의생식세포분열에서 1회의교차가일어나는거리”<br />사람의전염색체에대한유전적거리<br />남성: 약 28M, 여성: 약 43M<br />물리적거리(Physical distance)<br />정의: 염기배열의수<br />단위: bp (base pair)<br />사람의전유전체에대한물리적거리 : 3x109 bp<br />
  23. 23. 재조합비율(θ)과유전적거리(x)의관계<br />Haldane’s map function<br />
  24. 24. 유전통계학의역사<br />
  25. 25. 다윈의 진화론(Darwin,1859)<br />멘델의 법칙(Mendel, 1865)<br />생물계측학파<br />(다양성, 연속형자료)<br />멘델학파<br />(유전, 이산형자료)<br />Galton, Pearson,Weldon<br />Bateson, Johannsen<br />Modern synthesis<br />Fisher, Wright<br />
  26. 26. 자식의 키<br />평균신장<br />Francis Galton (1822 ~1911)<br />부모의 평균키<br />E(자식의 키) = a × 부모의 평균키+ b<br />
  27. 27. Karl Pearson (1857 ~1936) <br /><ul><li>피어슨의 상관계수
  28. 28. 피어슨의 Chi-square 검정
  29. 29. 적률 & 적률생성함수
  30. 30. 분포함수 & 확률밀도함수
  31. 31. Biometrika, Ann Hum Gene의 창간인</li></li></ul><li>Gregor Johann Mendel (1822 ~1884) <br />Laws of inheritance,1866<br />1900년 de Vries, Correns, Tschermak멘델법칙의 재발견<br />
  32. 32. Battle Round 1<br />다양성은 연속형<br />생물계측학은 실험결과와 불일치<br />Bateson<br />Genetics(1905)<br />K. Pearson<br />Johannsen<br />Gene (1909)<br />Weldon<br />생물계측학파<br />멘델학파<br />
  33. 33. Battle Round 2<br />멘델의 법칙은 참이다 !<br />증명없는 법칙은 없다 !<br />R.A. Fisher<br />K. Pearson<br />Modern synthesis<br />다윈의 진화론<br />멘델의 유전계승법칙<br />돌연변이(mutation)<br />개체간의 다양성(variation): 생물계측학<br />
  34. 34. R.A Fisher (1890~1962)<br /><ul><li> 가설검정 이론 도입
  35. 35. 랜덤화의 중요성 강조
  36. 36. 피셔의 exact 검정
  37. 37. 실험계획법
  38. 38. 우도(likelihood)의 개념, </li></ul>최우법에 의한 추정 검정의 이론을 완성 <br />-> Linkage analysis<br />
  39. 39. Additive polygene model<br />이산과 연속의 문제를 통합<br />The correlation between relatives on the supposition of Mendelian inheritance.Trans. Roy. Soc, Edinb, 1918<br />
  40. 40. Battle Round 3<br />E. Pearson<br />R.A. Fisher <br />Neyman-Pearson’s lemma<br />Alternative hypothesis<br />The most powerful test<br />Confidence interval<br />Only null hypothesis<br />Fiducial interval<br />J. Neyman<br />
  41. 41. 잘못된 유전학<br />우생학(eugenics)<br />유전적으로 뒤떨어진 개인을 배제<br />- Galton , K. Pearson, R.A Fisher<br />- Adolf Hitler (1931)<br />“유전적 결함이 있는 자손 억제를 위한 법”<br />Lysenko주의<br />스탈린 시대<br />유전적으로는 모두 평등하며, 노력에 의해 형질은 변화<br />
  42. 42. 유전계승법칙<br />
  43. 43. Variation<br />
  44. 44. 유전체의0.1%가개인의 차이를 결정<br />
  45. 45. 다형성의 종류Polymorphism<br /><ul><li>SNP(Single-nucleotide polymorphism)
  46. 46. STRP (short tandem repeat polymorphism, Microsatellite)
  47. 47. VNTR(variable number of tandem repeat)
  48. 48. Insertion / Deletion</li></li></ul><li>SNP<br />
  49. 49. STRP와 VNTR<br />….ATTCCGATATATAT….<br />….ATTCCGATATATATATATAT….<br />STRP<br />STRP : 2~5 염기의 반복<br />VNTR : 6~ 염기의 반복<br />
  50. 50. 삽입과 삭제Insertion/Deletion<br />deletion<br />….ATTCCGGTACTACT….<br />….ATTCCGGGTACTACT….<br />insertion<br />
  51. 51. (유전자좌)<br />(우성대립형질)<br />(열성대립형질)<br />(유전자형)<br />
  52. 52. 게놈 관련 연구의 대상물<br />유전형질(trait)<br />유전자형으로 인해 발생하는 결과의 공간<br />질적형질(qualitative trait)<br />양적형질(quantitative trait)<br />발병<br />비발병<br />2.1<br />6.4<br />9.7<br />병의 발병유무<br />검사치<br />표현형(phenotype)<br />
  53. 53. A<br />a<br />B<br />b<br />A or a<br />A<br />a<br />B<br />b<br />B or b<br />멘델의 법칙<br />분리의 법칙<br />우열의 법칙<br />독립의 법칙<br />질적표현형(qualitative phenotype)<br />유전자형A/a<br />A or a<br />연쇄의 법칙<br />유전 계승의 법칙 = 멘델의 법칙<br />+ 연쇄의 법칙<br />
  54. 54. 우열의 법칙Mendel's law of dominance (1st law)<br />질적표현형(qualitative phenotype)<br />양적표현형(quantitative phenotype)<br />AA or Aa<br />aa<br />AA<br />P(D=+|AA)=q+AA<br />P(D=+|Aa)=q+Aa<br />Aa<br />XAA~N(μ1,σ12)<br />P(D=+|aa)=q+aa<br />aa<br />XAa~N(μ1,σ12)<br />Xaa~N(μ2,σ22)<br />
  55. 55. 유전계승양식mode of inheritance<br />유전자형(genotype)<br />열성(recessive)<br />우성(dominant)<br />대립형질 A에 대해 열성<br />대립형질 A에 대해 우성<br />유전자형<br />AAAa<br />aa<br />aa<br />Aa<br />AA<br />Aaaa<br />AA<br />
  56. 56. 침투율penetrance<br />완전침투<br />불완전침투<br />AA<br />Aa<br />aa<br />AA<br />Aa<br />aa<br />10%<br />10%<br />50%<br />90%<br />100%<br />100%<br />100%<br />50%<br />90%<br />발병<br />비발병<br />발병<br />비발병<br />
  57. 57. 유전자형A/a<br />P(A)=P(a)=1/2<br />A or a<br />분리의 법칙Mendel‘s law of segregation (2nd law)<br />
  58. 58. A<br />a<br />B<br />b<br />A or a<br />B or b<br />독립의 법칙Mendel's law of independent assortment (3rd law)<br />유전자형A/a B/b<br />AB, Ab, aB, ab<br />
  59. 59. 연쇄(독립 법칙의 예외)linkage<br />재조합 비율recombination fraction<br />연사와 재조합<br />유전자좌 1<br />유전자좌 2<br />
  60. 60. 돌연변이Mutation<br />젬라인 돌연변이(Germline mutation)<br /><ul><li> 정의 :다음 세대에 전달되는 변화를 일으키는 돌연변이
  61. 61. 발생장소 : 생식체(정자,난자), 수정란, 생식기생성이전의 배아세포
  62. 62. 선천성 질환의 원인, 진화와 관련</li></ul>체세포 돌연변이(Somatic mutation)<br /><ul><li> 정의: 젬라인 세포 이외의 세포에서 일어나는 유전자의 변화
  63. 63. 다음 세대에 전달되지 않음
  64. 64. 발암과정과 밀접한 관계</li></li></ul><li>다운 증후군Down’s syndrome<br />Trisomy 21<br />
  65. 65. 산모연령<br />American Family Physician: Aug 15, 2000<br />
  66. 66. 집단과 유전적 다형성<br />
  67. 67. 분석대상 집단<br />가계정보를 가진 집단<br />가계정보가 없는 집단<br />통원환자<br />PMS<br />
  68. 68. 가계정보가 있는 집단<br />가계의 상세한 정보를 알 수 있다면연쇄분석(linkage analysis)에 의해 정확한 분석이 가능<br />
  69. 69. Marker locus<br />연쇄분석(linkage analysis)<br />Marker locus<br />질환관련 유전자좌<br />거리(재조합비율)을 추정<br />
  70. 70. 가계정보<br />모수적 연쇄분석Parametric linkage analysis<br />관측 유전자좌의 유전자형과 표현형<br />가정<br />질환관련 유전자좌는 2개의 대립형질 A, N을 가지고, 대립형질A에 대해 완전 우성, 완전침투율을 가짐<br />
  71. 71.
  72. 72. 귀무가설<br />대립가설<br />재조합 비율(θ)=0.5<br />재조합 비율(θ)< 0.5<br />
  73. 73. 귀무가설의 우도<br />
  74. 74. 대립가설의 우도<br />개체 1의 diplotype형:A-X/T-N의 경우<br />
  75. 75. 개체 1의 diplotype형:A-N/T-X의 경우<br />
  76. 76. LOD(log of odds) Score<br />대립가설의 최대우도<br />귀무가설의 우도<br />
  77. 77. Map distance (cM)<br />LOD score<br />UMOD<br />#118<br />#238<br />D16S3041<br />D16S3046<br />D16S3045<br />D16S3036<br />#123<br />D16S499<br />D16S501<br />D16S773<br />D16S772<br />D16S401<br />D16S537<br />D16S410<br />D16S412<br />D16S420<br />D16S417<br />D16S3056<br />D16S3113<br />D16S3133<br />ac002299a3<br />ac002302a4<br />ac002299a4<br />連鎖解析によるFamilial Juvenile Hyperuricemic Nephropathy (FJHN)疾患関連座位の探索 (鎌谷直之 数学セミナー 517, 40, 2004)<br />
  78. 78. 66<br />
  79. 79.
  80. 80.
  81. 81. 가계정보가 없는 집단<br />Case-control study<br />Cohort study<br />Intervention study<br />수집<br />임의화<br />개입<br />연구 방향<br />처리 A<br />처리 B<br />시간경과<br />시간경과<br />연구 방향<br />시간경과<br />수집<br />Case group<br />Control group<br />
  82. 82. AA<br />TT+TA<br />발병<br />비발병<br />연관성의 강도(코호트 연구)<br />+<br />+<br />AA<br />TT+TA<br />유전자형TT+TA군의 침투율<br />유전자형AA군의 침투율<br />상대위험률(relative risk)<br />
  83. 83. 연관성의 강도(Case-Control 연구)<br />Case group<br />AA<br />TT+TA<br />Odds<br />발병<br />오즈비(Odds ratio)<br />비발병<br />Odds<br />침투율은 알 수 없음<br />Control group<br />
  84. 84. 상대위험률<br />오즈비<br />
  85. 85. 연관성 검정Test of association<br />Pearson’s chi-square test<br />or<br />Fisher’s exact test<br />
  86. 86. Hardy-Weinberg 평형법칙Law of Hardy-Weinberg Equilibrium<br />세대별 대립형질의 빈도(p)는일정<br />=<br />세대t<br />random mating<br />=<br />세대t+1<br />
  87. 87. Hardy-Weinberg 평형법칙Law of Hardy-Weinberg Equilibrium<br />then<br />if<br />
  88. 88. HWE법칙이 성립하지 않는 이유<br />Random Mating 가정의 불성립<br />근친혼<br />선택결혼 (assortative mating)<br />집단의 구조화<br />데이터의 이상(Typing miss)<br />
  89. 89. 유전계승양식의 가정<br />(1)우성<br />(2)열성<br />(3)유전자형<br />(4) Risk allele의 수<br />(5)allele의 수<br />
  90. 90. 경향성 검정Cochran-Armigate test for trend<br />Balding (2006), Nat. Rev. Genet<br />
  91. 91. 양적형질의 경향성 검정<br />회귀분석<br />양적표현형에 정규분포를 가정<br />AA=0, Aa=1, aa=2으로할 때, 회귀계수가 0인지 아닌지를 검정<br />비모수 검정<br />순위상관<br />Kendall’s tau<br />Spearman의 순위상관계수<br />선형순위상관계수 등<br />대립형질a의 갯수<br />Balding (2006), Nat. Rev. Genet<br />
  92. 92. Haplotype과 연쇄불균형<br />
  93. 93. C<br />T<br />A<br />haplotypeand diplotype<br />G<br />T<br />G<br />Diplotype configuration<br />아버지 유래의 haplotype: C-T-A<br />어머니 유래의 haplotype: G-T-G<br />관측 유전자형<br />C/G-T/T-A/G<br />C<br />G<br />T<br />T<br />A<br />G<br />
  94. 94. SNP에서Haplotype으로<br />
  95. 95. 2n개의 haplotype<br />n 명<br />
  96. 96. 연쇄불균형linkage disequilibrium<br />연쇄 균형 상태<br />연쇄 불균형 상태<br />제2 유전자좌<br />제2 유전자좌<br />제1 유전자좌<br />제1 유전자좌<br />
  97. 97. 연쇄불균형계수DCoefficient of linkage disequilibrium<br />연쇄불균형계수 D’<br />
  98. 98. 절대 연쇄 불균형・완전 연쇄 불균형absolute LD & complete LD <br />절대 연쇄 불균형<br />완전 연쇄 불균형<br />연쇄 균형<br />
  99. 99. 연쇄 불균형 계수r2<br />Haplotype빈도의 상관계수<br />각각의 대립형질을 등간격으로 좌표축에 나타내어 빈도의 상관계수를 계산<br />2nd locus<br />freq<br />제2 유전자좌<br />b<br />제 1유전자좌<br />B<br />A<br />a<br />1st locus<br />
  100. 100. Linkage Disequilibrium map (LD map)<br />
  101. 101. Absolute LD<br />Complete LD<br />Linkage equilibrium<br />연쇄 불균형 계수 D’과r2<br />D’=1<br />D’=1<br />D’=0<br />r2=1<br />r2=0.28<br />r2=0<br />
  102. 102. LD와 세대경과와의 관계<br />D’<br />θ=0.001<br />θ=0.01<br />θ=0.05<br />generation<br />
  103. 103. Genome wide association study<br />
  104. 104. 게놈와이드 연관분석(Genome-Wide Association Study, GWAS)<br />형질과 관련있는 유전자를 광범위하게 탐색<br />1,000만 SNP의 리스트 작성<br />30~100만 SNP chip<br />(Invader, Illumina, Affymetrix)<br />
  105. 105. “빈도가 높은 질환이 유전과 관계있다고 한다면 가계가 <br />다르다 하더라도 질환의 원인이 되는 돌연변이는 공통”<br />Common Disease Common Variant 가설<br />
  106. 106. 직접연관과 간접연관Direct association & Indirect association<br />Kruglyak (2008), Nat. Rev. Genet<br />
  107. 107. ManhattanPlot<br />
  108. 108. 집단의 구조화Population structure<br />Balding (2006), Nat. Rev. Genet<br />
  109. 109. EIGENSTRAT주성분분석을 이용한 집단의 구조화 탐색<br />1. 유전자형 데이터<br />3.각SNP별로 표준화<br />Binom(2,MAF)<br />2.대립형질의 갯수<br />유전계승법칙의 도입<br />각 개체는 한세대 위로 부터 minor allele가 MAF의 확률로 전달됨<br />
  110. 110. EIGENSTRAT의 예<br />HapMap데이터의 일본인과 중국인<br />
  111. 111. 다중검정 문제The multiple testing problem<br />Balding (2006), Nat. Rev. Genet<br />
  112. 112. 게놈연구를 위한 연구디자인<br />
  113. 113. “… 789 publications reporting on 802 different polymorphismsin 277 genes .”<br />…<br />“We systematically meta-analyzed 127 polymorphisms across69 different putative Alzheimer disease risk genes.” <br />나머지는 ??<br />
  114. 114. Replication<br />(반복검증)<br />
  115. 115. 반복검증을 위한 3대 요소<br />연구의 디자인<br />데이터의 품질관리<br />유전통계분석<br />Cohort studysample sizeRR=3alpha =0.05power=0.8<br />
  116. 116. 연구디자인 (검정력과 샘플사이즈)<br />Power<br />Sample size (#case=#control)<br />100<br />
  117. 117. 100<br />100<br />GWAS<br />Control<br />Case<br />Power<br />?<br />?<br />후보유전자 연관분석<br />유의수준:1.38×10-08<br />Control<br />Case<br />유의수준:0.01<br />2nd stage 의 샘플사이즈<br />2 단계 연관분석2 Stage association study<br />연구전체의 유의수준:1×10-7<br />
  118. 118. 다형 데이터의 품질관리<br /> 개체의 Call Rate ( > 0.99 )<br /> SNP의 Call Rate ( > 0.99 )<br /> HWE 적합성 검정 ( p > 1e-5 )<br /> Minor Allele Frequency ( > 0.01 )<br /> 집단의 구조화 탐색<br />
  119. 119. 그밖의 분석기법<br />
  120. 120. 가계정보를 이용한 연관분석<br />Transmission Disequilibrium Test (TDT)<br />Ott et al. (1992) Hum Hered, 42, 337-346.<br />Spielman et al. (1993) Am J Hum Genet, 52, 506-516.<br />A/T<br />A/T<br />A/A<br />
  121. 121. 로지스틱 회귀분석logistic regression<br />ROC curve<br />
  122. 122. 서양인<br />동양인<br />메타분석meta analysis<br />CDKAL1 rs7754840<br />
  123. 123. 대응분석Correspondence analysis<br />
  124. 124. 생존분석Survival analysis<br />
  125. 125. 복잡한 형질의 유전complex trait<br />발현<br />발현<br />발현<br />3p4<br />3q25<br />12q28<br />Additive polygene model<br />
  126. 126. 유전체 연구의 응용<br />
  127. 127. 개별화 의료Personalized medicine<br />
  128. 128. 유전 카운셀링Genetic counseling<br />?<br />
  129. 129. Statistical Genetics Analysis Division<br />

×