Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

유전통계학의 오늘과 내일(고려대학교 특강)

6,129 views

Published on

2009년 11월 19일 고려대학교 특강 자료

Published in: Education
  • Be the first to comment

유전통계학의 오늘과 내일(고려대학교 특강)

  1. 1. 유전통계학의 오늘과 내일<br />양 우성<br />StaGen Co., Ltd<br />유전통계분석사업부<br />
  2. 2. “Genetics is the science of heredity and variation in living organisms.”<br />Wikipedia (http://en.wikipedia.org/wiki/Genetics)<br />
  3. 3. 염색체와 유전체 정보<br />
  4. 4. 4<br />DOE Human Genome Project (http://genomics.energy.gov)<br />
  5. 5.
  6. 6. Text<br />National Human Genome Research Institute<br />
  7. 7. telomere<br />centromere<br />telomere<br />
  8. 8. James Watson and Francis Crick (1953)<br />
  9. 9. Central Dogma<br />http://en.wikipedia.org/wiki/Central_dogma_of_molecular_biology<br />
  10. 10. Genome = Gene + Ome<br />Genome = Whole DNA<br />
  11. 11. Human Genome Project<br />1990년 휴먼게놈프로젝트 시작<br />2000년 DNA 염기서열 중 97% 해독 <br />2003년 99.99% 정확도의 인간유전체지도 완성 <br />Database : GenBank<br /> (http://www.ncbi.nlm.nih.gov/Genbank/)<br />
  12. 12.
  13. 13. 세포분열과 유전정보의 계승<br />
  14. 14. 체세포 분열Mitosis<br />http://www.biology.iupui.edu/biocourses/N100/2k4ch8mitosisnotes.html<br />
  15. 15. 생식세포 분열Meiosis- 1st stage<br />
  16. 16. 생식세포 분열Meiosis- 2ndstage<br />http://www.biology.iupui.edu/biocourses/n100/2k4ch9meiosisnotes.html<br />
  17. 17. (유전자좌)<br />(우성대립형질)<br />(열성대립형질)<br />(유전자형)<br />
  18. 18. 교차와 재조합Crossover & Recombination<br />http://biology200.gsu.edu/houghton/2107%20%2709/lecture15.html<br />
  19. 19. 재조합비율Recombination fraction<br />상동염색체<br />생식체(gamete)<br />생식체(gamete)<br />or<br />or<br />재조합 O<br />재조합 X<br />1-θ<br />재조합비율:θ<br />
  20. 20. 재조합비율과거리Recombination fraction & Distance<br />2 loci사이의거리가가까우면재조합비율은 0에가까워짐<br />2 loci사이의거리가멀면재조합비율은 0.5에가까워짐<br />
  21. 21. 재조합비율과거리Recombination fraction & Distance<br />L2<br />L3<br />L1<br />
  22. 22. 유전적거리(Genetic distance)<br />정의: 2개의유전자좌사이의교차횟수의기대치<br />단위 : M (morgan)<br />1M은“1회의생식세포분열에서 1회의교차가일어나는거리”<br />사람의전염색체에대한유전적거리<br />남성: 약 28M, 여성: 약 43M<br />물리적거리(Physical distance)<br />정의: 염기배열의수<br />단위: bp (base pair)<br />사람의전유전체에대한물리적거리 : 3x109 bp<br />
  23. 23. 재조합비율(θ)과유전적거리(x)의관계<br />Haldane’s map function<br />
  24. 24. 유전통계학의역사<br />
  25. 25. 다윈의 진화론(Darwin,1859)<br />멘델의 법칙(Mendel, 1865)<br />생물계측학파<br />(다양성, 연속형자료)<br />멘델학파<br />(유전, 이산형자료)<br />Galton, Pearson,Weldon<br />Bateson, Johannsen<br />Modern synthesis<br />Fisher, Wright<br />
  26. 26. 자식의 키<br />평균신장<br />Francis Galton (1822 ~1911)<br />부모의 평균키<br />E(자식의 키) = a × 부모의 평균키+ b<br />
  27. 27. Karl Pearson (1857 ~1936) <br /><ul><li>피어슨의 상관계수
  28. 28. 피어슨의 Chi-square 검정
  29. 29. 적률 & 적률생성함수
  30. 30. 분포함수 & 확률밀도함수
  31. 31. Biometrika, Ann Hum Gene의 창간인</li></li></ul><li>Gregor Johann Mendel (1822 ~1884) <br />Laws of inheritance,1866<br />1900년 de Vries, Correns, Tschermak멘델법칙의 재발견<br />
  32. 32. Battle Round 1<br />다양성은 연속형<br />생물계측학은 실험결과와 불일치<br />Bateson<br />Genetics(1905)<br />K. Pearson<br />Johannsen<br />Gene (1909)<br />Weldon<br />생물계측학파<br />멘델학파<br />
  33. 33. Battle Round 2<br />멘델의 법칙은 참이다 !<br />증명없는 법칙은 없다 !<br />R.A. Fisher<br />K. Pearson<br />Modern synthesis<br />다윈의 진화론<br />멘델의 유전계승법칙<br />돌연변이(mutation)<br />개체간의 다양성(variation): 생물계측학<br />
  34. 34. R.A Fisher (1890~1962)<br /><ul><li> 가설검정 이론 도입
  35. 35. 랜덤화의 중요성 강조
  36. 36. 피셔의 exact 검정
  37. 37. 실험계획법
  38. 38. 우도(likelihood)의 개념, </li></ul>최우법에 의한 추정 검정의 이론을 완성 <br />-> Linkage analysis<br />
  39. 39. Additive polygene model<br />이산과 연속의 문제를 통합<br />The correlation between relatives on the supposition of Mendelian inheritance.Trans. Roy. Soc, Edinb, 1918<br />
  40. 40. Battle Round 3<br />E. Pearson<br />R.A. Fisher <br />Neyman-Pearson’s lemma<br />Alternative hypothesis<br />The most powerful test<br />Confidence interval<br />Only null hypothesis<br />Fiducial interval<br />J. Neyman<br />
  41. 41. 잘못된 유전학<br />우생학(eugenics)<br />유전적으로 뒤떨어진 개인을 배제<br />- Galton , K. Pearson, R.A Fisher<br />- Adolf Hitler (1931)<br />“유전적 결함이 있는 자손 억제를 위한 법”<br />Lysenko주의<br />스탈린 시대<br />유전적으로는 모두 평등하며, 노력에 의해 형질은 변화<br />
  42. 42. 유전계승법칙<br />
  43. 43. Variation<br />
  44. 44. 유전체의0.1%가개인의 차이를 결정<br />
  45. 45. 다형성의 종류Polymorphism<br /><ul><li>SNP(Single-nucleotide polymorphism)
  46. 46. STRP (short tandem repeat polymorphism, Microsatellite)
  47. 47. VNTR(variable number of tandem repeat)
  48. 48. Insertion / Deletion</li></li></ul><li>SNP<br />
  49. 49. STRP와 VNTR<br />….ATTCCGATATATAT….<br />….ATTCCGATATATATATATAT….<br />STRP<br />STRP : 2~5 염기의 반복<br />VNTR : 6~ 염기의 반복<br />
  50. 50. 삽입과 삭제Insertion/Deletion<br />deletion<br />….ATTCCGGTACTACT….<br />….ATTCCGGGTACTACT….<br />insertion<br />
  51. 51. (유전자좌)<br />(우성대립형질)<br />(열성대립형질)<br />(유전자형)<br />
  52. 52. 게놈 관련 연구의 대상물<br />유전형질(trait)<br />유전자형으로 인해 발생하는 결과의 공간<br />질적형질(qualitative trait)<br />양적형질(quantitative trait)<br />발병<br />비발병<br />2.1<br />6.4<br />9.7<br />병의 발병유무<br />검사치<br />표현형(phenotype)<br />
  53. 53. A<br />a<br />B<br />b<br />A or a<br />A<br />a<br />B<br />b<br />B or b<br />멘델의 법칙<br />분리의 법칙<br />우열의 법칙<br />독립의 법칙<br />질적표현형(qualitative phenotype)<br />유전자형A/a<br />A or a<br />연쇄의 법칙<br />유전 계승의 법칙 = 멘델의 법칙<br />+ 연쇄의 법칙<br />
  54. 54. 우열의 법칙Mendel's law of dominance (1st law)<br />질적표현형(qualitative phenotype)<br />양적표현형(quantitative phenotype)<br />AA or Aa<br />aa<br />AA<br />P(D=+|AA)=q+AA<br />P(D=+|Aa)=q+Aa<br />Aa<br />XAA~N(μ1,σ12)<br />P(D=+|aa)=q+aa<br />aa<br />XAa~N(μ1,σ12)<br />Xaa~N(μ2,σ22)<br />
  55. 55. 유전계승양식mode of inheritance<br />유전자형(genotype)<br />열성(recessive)<br />우성(dominant)<br />대립형질 A에 대해 열성<br />대립형질 A에 대해 우성<br />유전자형<br />AAAa<br />aa<br />aa<br />Aa<br />AA<br />Aaaa<br />AA<br />
  56. 56. 침투율penetrance<br />완전침투<br />불완전침투<br />AA<br />Aa<br />aa<br />AA<br />Aa<br />aa<br />10%<br />10%<br />50%<br />90%<br />100%<br />100%<br />100%<br />50%<br />90%<br />발병<br />비발병<br />발병<br />비발병<br />
  57. 57. 유전자형A/a<br />P(A)=P(a)=1/2<br />A or a<br />분리의 법칙Mendel‘s law of segregation (2nd law)<br />
  58. 58. A<br />a<br />B<br />b<br />A or a<br />B or b<br />독립의 법칙Mendel's law of independent assortment (3rd law)<br />유전자형A/a B/b<br />AB, Ab, aB, ab<br />
  59. 59. 연쇄(독립 법칙의 예외)linkage<br />재조합 비율recombination fraction<br />연사와 재조합<br />유전자좌 1<br />유전자좌 2<br />
  60. 60. 돌연변이Mutation<br />젬라인 돌연변이(Germline mutation)<br /><ul><li> 정의 :다음 세대에 전달되는 변화를 일으키는 돌연변이
  61. 61. 발생장소 : 생식체(정자,난자), 수정란, 생식기생성이전의 배아세포
  62. 62. 선천성 질환의 원인, 진화와 관련</li></ul>체세포 돌연변이(Somatic mutation)<br /><ul><li> 정의: 젬라인 세포 이외의 세포에서 일어나는 유전자의 변화
  63. 63. 다음 세대에 전달되지 않음
  64. 64. 발암과정과 밀접한 관계</li></li></ul><li>다운 증후군Down’s syndrome<br />Trisomy 21<br />
  65. 65. 산모연령<br />American Family Physician: Aug 15, 2000<br />
  66. 66. 집단과 유전적 다형성<br />
  67. 67. 분석대상 집단<br />가계정보를 가진 집단<br />가계정보가 없는 집단<br />통원환자<br />PMS<br />
  68. 68. 가계정보가 있는 집단<br />가계의 상세한 정보를 알 수 있다면연쇄분석(linkage analysis)에 의해 정확한 분석이 가능<br />
  69. 69. Marker locus<br />연쇄분석(linkage analysis)<br />Marker locus<br />질환관련 유전자좌<br />거리(재조합비율)을 추정<br />
  70. 70. 가계정보<br />모수적 연쇄분석Parametric linkage analysis<br />관측 유전자좌의 유전자형과 표현형<br />가정<br />질환관련 유전자좌는 2개의 대립형질 A, N을 가지고, 대립형질A에 대해 완전 우성, 완전침투율을 가짐<br />
  71. 71.
  72. 72. 귀무가설<br />대립가설<br />재조합 비율(θ)=0.5<br />재조합 비율(θ)< 0.5<br />
  73. 73. 귀무가설의 우도<br />
  74. 74. 대립가설의 우도<br />개체 1의 diplotype형:A-X/T-N의 경우<br />
  75. 75. 개체 1의 diplotype형:A-N/T-X의 경우<br />
  76. 76. LOD(log of odds) Score<br />대립가설의 최대우도<br />귀무가설의 우도<br />
  77. 77. Map distance (cM)<br />LOD score<br />UMOD<br />#118<br />#238<br />D16S3041<br />D16S3046<br />D16S3045<br />D16S3036<br />#123<br />D16S499<br />D16S501<br />D16S773<br />D16S772<br />D16S401<br />D16S537<br />D16S410<br />D16S412<br />D16S420<br />D16S417<br />D16S3056<br />D16S3113<br />D16S3133<br />ac002299a3<br />ac002302a4<br />ac002299a4<br />連鎖解析によるFamilial Juvenile Hyperuricemic Nephropathy (FJHN)疾患関連座位の探索 (鎌谷直之 数学セミナー 517, 40, 2004)<br />
  78. 78. 66<br />
  79. 79.
  80. 80.
  81. 81. 가계정보가 없는 집단<br />Case-control study<br />Cohort study<br />Intervention study<br />수집<br />임의화<br />개입<br />연구 방향<br />처리 A<br />처리 B<br />시간경과<br />시간경과<br />연구 방향<br />시간경과<br />수집<br />Case group<br />Control group<br />
  82. 82. AA<br />TT+TA<br />발병<br />비발병<br />연관성의 강도(코호트 연구)<br />+<br />+<br />AA<br />TT+TA<br />유전자형TT+TA군의 침투율<br />유전자형AA군의 침투율<br />상대위험률(relative risk)<br />
  83. 83. 연관성의 강도(Case-Control 연구)<br />Case group<br />AA<br />TT+TA<br />Odds<br />발병<br />오즈비(Odds ratio)<br />비발병<br />Odds<br />침투율은 알 수 없음<br />Control group<br />
  84. 84. 상대위험률<br />오즈비<br />
  85. 85. 연관성 검정Test of association<br />Pearson’s chi-square test<br />or<br />Fisher’s exact test<br />
  86. 86. Hardy-Weinberg 평형법칙Law of Hardy-Weinberg Equilibrium<br />세대별 대립형질의 빈도(p)는일정<br />=<br />세대t<br />random mating<br />=<br />세대t+1<br />
  87. 87. Hardy-Weinberg 평형법칙Law of Hardy-Weinberg Equilibrium<br />then<br />if<br />
  88. 88. HWE법칙이 성립하지 않는 이유<br />Random Mating 가정의 불성립<br />근친혼<br />선택결혼 (assortative mating)<br />집단의 구조화<br />데이터의 이상(Typing miss)<br />
  89. 89. 유전계승양식의 가정<br />(1)우성<br />(2)열성<br />(3)유전자형<br />(4) Risk allele의 수<br />(5)allele의 수<br />
  90. 90. 경향성 검정Cochran-Armigate test for trend<br />Balding (2006), Nat. Rev. Genet<br />
  91. 91. 양적형질의 경향성 검정<br />회귀분석<br />양적표현형에 정규분포를 가정<br />AA=0, Aa=1, aa=2으로할 때, 회귀계수가 0인지 아닌지를 검정<br />비모수 검정<br />순위상관<br />Kendall’s tau<br />Spearman의 순위상관계수<br />선형순위상관계수 등<br />대립형질a의 갯수<br />Balding (2006), Nat. Rev. Genet<br />
  92. 92. Haplotype과 연쇄불균형<br />
  93. 93. C<br />T<br />A<br />haplotypeand diplotype<br />G<br />T<br />G<br />Diplotype configuration<br />아버지 유래의 haplotype: C-T-A<br />어머니 유래의 haplotype: G-T-G<br />관측 유전자형<br />C/G-T/T-A/G<br />C<br />G<br />T<br />T<br />A<br />G<br />
  94. 94. SNP에서Haplotype으로<br />
  95. 95. 2n개의 haplotype<br />n 명<br />
  96. 96. 연쇄불균형linkage disequilibrium<br />연쇄 균형 상태<br />연쇄 불균형 상태<br />제2 유전자좌<br />제2 유전자좌<br />제1 유전자좌<br />제1 유전자좌<br />
  97. 97. 연쇄불균형계수DCoefficient of linkage disequilibrium<br />연쇄불균형계수 D’<br />
  98. 98. 절대 연쇄 불균형・완전 연쇄 불균형absolute LD & complete LD <br />절대 연쇄 불균형<br />완전 연쇄 불균형<br />연쇄 균형<br />
  99. 99. 연쇄 불균형 계수r2<br />Haplotype빈도의 상관계수<br />각각의 대립형질을 등간격으로 좌표축에 나타내어 빈도의 상관계수를 계산<br />2nd locus<br />freq<br />제2 유전자좌<br />b<br />제 1유전자좌<br />B<br />A<br />a<br />1st locus<br />
  100. 100. Linkage Disequilibrium map (LD map)<br />
  101. 101. Absolute LD<br />Complete LD<br />Linkage equilibrium<br />연쇄 불균형 계수 D’과r2<br />D’=1<br />D’=1<br />D’=0<br />r2=1<br />r2=0.28<br />r2=0<br />
  102. 102. LD와 세대경과와의 관계<br />D’<br />θ=0.001<br />θ=0.01<br />θ=0.05<br />generation<br />
  103. 103. Genome wide association study<br />
  104. 104. 게놈와이드 연관분석(Genome-Wide Association Study, GWAS)<br />형질과 관련있는 유전자를 광범위하게 탐색<br />1,000만 SNP의 리스트 작성<br />30~100만 SNP chip<br />(Invader, Illumina, Affymetrix)<br />
  105. 105. “빈도가 높은 질환이 유전과 관계있다고 한다면 가계가 <br />다르다 하더라도 질환의 원인이 되는 돌연변이는 공통”<br />Common Disease Common Variant 가설<br />
  106. 106. 직접연관과 간접연관Direct association & Indirect association<br />Kruglyak (2008), Nat. Rev. Genet<br />
  107. 107. ManhattanPlot<br />
  108. 108. 집단의 구조화Population structure<br />Balding (2006), Nat. Rev. Genet<br />
  109. 109. EIGENSTRAT주성분분석을 이용한 집단의 구조화 탐색<br />1. 유전자형 데이터<br />3.각SNP별로 표준화<br />Binom(2,MAF)<br />2.대립형질의 갯수<br />유전계승법칙의 도입<br />각 개체는 한세대 위로 부터 minor allele가 MAF의 확률로 전달됨<br />
  110. 110. EIGENSTRAT의 예<br />HapMap데이터의 일본인과 중국인<br />
  111. 111. 다중검정 문제The multiple testing problem<br />Balding (2006), Nat. Rev. Genet<br />
  112. 112. 게놈연구를 위한 연구디자인<br />
  113. 113. “… 789 publications reporting on 802 different polymorphismsin 277 genes .”<br />…<br />“We systematically meta-analyzed 127 polymorphisms across69 different putative Alzheimer disease risk genes.” <br />나머지는 ??<br />
  114. 114. Replication<br />(반복검증)<br />
  115. 115. 반복검증을 위한 3대 요소<br />연구의 디자인<br />데이터의 품질관리<br />유전통계분석<br />Cohort studysample sizeRR=3alpha =0.05power=0.8<br />
  116. 116. 연구디자인 (검정력과 샘플사이즈)<br />Power<br />Sample size (#case=#control)<br />100<br />
  117. 117. 100<br />100<br />GWAS<br />Control<br />Case<br />Power<br />?<br />?<br />후보유전자 연관분석<br />유의수준:1.38×10-08<br />Control<br />Case<br />유의수준:0.01<br />2nd stage 의 샘플사이즈<br />2 단계 연관분석2 Stage association study<br />연구전체의 유의수준:1×10-7<br />
  118. 118. 다형 데이터의 품질관리<br /> 개체의 Call Rate ( > 0.99 )<br /> SNP의 Call Rate ( > 0.99 )<br /> HWE 적합성 검정 ( p > 1e-5 )<br /> Minor Allele Frequency ( > 0.01 )<br /> 집단의 구조화 탐색<br />
  119. 119. 그밖의 분석기법<br />
  120. 120. 가계정보를 이용한 연관분석<br />Transmission Disequilibrium Test (TDT)<br />Ott et al. (1992) Hum Hered, 42, 337-346.<br />Spielman et al. (1993) Am J Hum Genet, 52, 506-516.<br />A/T<br />A/T<br />A/A<br />
  121. 121. 로지스틱 회귀분석logistic regression<br />ROC curve<br />
  122. 122. 서양인<br />동양인<br />메타분석meta analysis<br />CDKAL1 rs7754840<br />
  123. 123. 대응분석Correspondence analysis<br />
  124. 124. 생존분석Survival analysis<br />
  125. 125. 복잡한 형질의 유전complex trait<br />발현<br />발현<br />발현<br />3p4<br />3q25<br />12q28<br />Additive polygene model<br />
  126. 126. 유전체 연구의 응용<br />
  127. 127. 개별화 의료Personalized medicine<br />
  128. 128. 유전 카운셀링Genetic counseling<br />?<br />
  129. 129. Statistical Genetics Analysis Division<br />

×