유전통계학의 오늘과 내일양 우성StaGen Co., Ltd유전통계분석사업부
“Genetics is the science of heredity and variation in living organisms.”Wikipedia (http://en.wikipedia.org/wiki/Genetics)
염색체와 유전체 정보
4DOE Human Genome Project (http://genomics.energy.gov)
TextNational Human Genome Research Institute
telomerecentromeretelomere
James Watson and Francis Crick (1953)
Central Dogmahttp://en.wikipedia.org/wiki/Central_dogma_of_molecular_biology
Genome       = Gene + OmeGenome      = Whole DNA
Human Genome Project1990년 휴먼게놈프로젝트 시작2000년 DNA 염기서열 중 97% 해독 2003년 99.99% 정확도의 인간유전체지도 완성 Database : GenBank   (http://www.ncbi.nlm.nih.gov/Genbank/)
세포분열과 유전정보의 계승
체세포 분열Mitosishttp://www.biology.iupui.edu/biocourses/N100/2k4ch8mitosisnotes.html
생식세포 분열Meiosis- 1st stage
생식세포 분열Meiosis- 2ndstagehttp://www.biology.iupui.edu/biocourses/n100/2k4ch9meiosisnotes.html
(유전자좌)(우성대립형질)(열성대립형질)(유전자형)
교차와  재조합Crossover & Recombinationhttp://biology200.gsu.edu/houghton/2107%20%2709/lecture15.html
재조합비율Recombination fraction상동염색체생식체(gamete)생식체(gamete)oror재조합 O재조합 X1-θ재조합비율:θ
재조합비율과거리Recombination fraction & Distance2 loci사이의거리가가까우면재조합비율은 0에가까워짐2 loci사이의거리가멀면재조합비율은 0.5에가까워짐
재조합비율과거리Recombination fraction & DistanceL2L3L1
유전적거리(Genetic distance)정의: 2개의유전자좌사이의교차횟수의기대치단위 : M (morgan)1M은“1회의생식세포분열에서 1회의교차가일어나는거리”사람의전염색체에대한유전적거리남성: 약 28M, 여성: 약 43M물리적거리(Physical distance)정의: 염기배열의수단위: bp (base pair)사람의전유전체에대한물리적거리 : 3x109 bp
재조합비율(θ)과유전적거리(x)의관계Haldane’s map function
유전통계학의역사
다윈의 진화론(Darwin,1859)멘델의 법칙(Mendel, 1865)생물계측학파(다양성, 연속형자료)멘델학파(유전, 이산형자료)Galton, Pearson,WeldonBateson, JohannsenModern synthesisFisher, Wright
자식의 키평균신장Francis Galton (1822 ~1911)부모의 평균키E(자식의 키) = a × 부모의 평균키+ b
Karl Pearson (1857 ~1936) 피어슨의 상관계수
피어슨의 Chi-square 검정
적률 & 적률생성함수
분포함수 & 확률밀도함수
Biometrika, Ann Hum Gene의 창간인Gregor Johann Mendel (1822 ~1884) Laws of inheritance,18661900년 de Vries, Correns, Tschermak멘델법칙의 재발견
Battle Round 1다양성은 연속형생물계측학은 실험결과와 불일치BatesonGenetics(1905)K. PearsonJohannsenGene (1909)Weldon생물계측학파멘델학파
Battle Round 2멘델의 법칙은 참이다 !증명없는 법칙은 없다 !R.A. FisherK. PearsonModern synthesis다윈의 진화론멘델의 유전계승법칙돌연변이(mutation)개체간의 다양성(variation): 생물계측학
R.A Fisher (1890~1962) 가설검정 이론 도입
 랜덤화의 중요성 강조
 피셔의 exact 검정
 실험계획법
 우도(likelihood)의 개념, 최우법에 의한 추정 검정의 이론을 완성 -> Linkage analysis
Additive polygene model이산과 연속의 문제를 통합The correlation between relatives on the supposition of Mendelian inheritance.Trans. Roy. Soc, Edinb, 1918
Battle Round 3E. PearsonR.A. Fisher Neyman-Pearson’s lemmaAlternative hypothesisThe most powerful testConfidence intervalOnly null hypothesisFiducial intervalJ. Neyman
잘못된 유전학우생학(eugenics)유전적으로 뒤떨어진 개인을 배제- Galton , K. Pearson, R.A Fisher- Adolf Hitler (1931)“유전적 결함이 있는 자손 억제를 위한 법”Lysenko주의스탈린 시대유전적으로는 모두 평등하며, 노력에 의해 형질은 변화
유전계승법칙
Variation
유전체의0.1%가개인의 차이를 결정
다형성의 종류PolymorphismSNP(Single-nucleotide polymorphism)
 STRP (short tandem repeat polymorphism, Microsatellite)
 VNTR(variable number of tandem repeat)
 Insertion / DeletionSNP
STRP와 VNTR….ATTCCGATATATAT….….ATTCCGATATATATATATAT….STRPSTRP 	: 2~5 염기의 반복VNTR	: 6~ 염기의 반복
삽입과 삭제Insertion/Deletiondeletion….ATTCCGGTACTACT….….ATTCCGGGTACTACT….insertion
(유전자좌)(우성대립형질)(열성대립형질)(유전자형)
게놈 관련 연구의 대상물유전형질(trait)유전자형으로 인해 발생하는 결과의 공간질적형질(qualitative trait)양적형질(quantitative trait)발병비발병2.16.49.7병의 발병유무검사치표현형(phenotype)
AaBbA or aAaBbB or b멘델의 법칙분리의 법칙우열의 법칙독립의 법칙질적표현형(qualitative phenotype)유전자형A/aA or a연쇄의 법칙유전 계승의 법칙 = 멘델의 법칙+ 연쇄의 법칙
우열의 법칙Mendel's law of dominance (1st law)질적표현형(qualitative phenotype)양적표현형(quantitative phenotype)AA or AaaaAAP(D=+|AA)=q+AAP(D=+|Aa)=q+AaAaXAA~N(μ1,σ12)P(D=+|aa)=q+aaaaXAa~N(μ1,σ12)Xaa~N(μ2,σ22)
유전계승양식mode of inheritance유전자형(genotype)열성(recessive)우성(dominant)대립형질 A에 대해 열성대립형질 A에 대해 우성유전자형AAAaaaaaAaAAAaaaAA
침투율penetrance완전침투불완전침투AAAaaaAAAaaa10%10%50%90%100%100%100%50%90%발병비발병발병비발병
유전자형A/aP(A)=P(a)=1/2A or a분리의 법칙Mendel‘s law of segregation (2nd law)
AaBbA or aB or b독립의 법칙Mendel's law of independent assortment (3rd law)유전자형A/a  B/bAB, Ab, aB, ab
연쇄(독립 법칙의 예외)linkage재조합 비율recombination fraction연사와 재조합유전자좌 1유전자좌 2
돌연변이Mutation젬라인 돌연변이(Germline mutation) 정의 :다음 세대에 전달되는 변화를 일으키는 돌연변이
 발생장소 : 생식체(정자,난자), 수정란, 생식기생성이전의 배아세포
선천성 질환의 원인, 진화와 관련체세포 돌연변이(Somatic mutation) 정의: 젬라인 세포 이외의 세포에서 일어나는 유전자의 변화
다음 세대에 전달되지 않음
발암과정과 밀접한 관계다운 증후군Down’s syndromeTrisomy 21
산모연령American Family Physician: Aug 15, 2000
집단과 유전적 다형성
분석대상 집단가계정보를 가진 집단가계정보가 없는 집단통원환자PMS
가계정보가 있는 집단가계의 상세한 정보를 알 수 있다면연쇄분석(linkage analysis)에 의해 정확한 분석이 가능
Marker locus연쇄분석(linkage analysis)Marker locus질환관련 유전자좌거리(재조합비율)을 추정
가계정보모수적 연쇄분석Parametric linkage analysis관측 유전자좌의 유전자형과 표현형가정질환관련 유전자좌는 2개의 대립형질 A, N을 가지고, 대립형질A에 대해 완전 우성, 완전침투율을 가짐
귀무가설대립가설재조합 비율(θ)=0.5재조합 비율(θ)< 0.5
귀무가설의 우도
대립가설의 우도개체 1의 diplotype형:A-X/T-N의 경우
개체 1의 diplotype형:A-N/T-X의 경우
LOD(log of odds) Score대립가설의 최대우도귀무가설의 우도
Map distance (cM)LOD scoreUMOD#118#238D16S3041D16S3046D16S3045D16S3036#123D16S499D16S501D16S773D16S772D16S401D16S537D16S410D16S412D16S420D16S417D16S3056D16S3113D16S3133ac002299a3ac002302a4ac002299a4連鎖解析によるFamilial Juvenile Hyperuricemic Nephropathy (FJHN)疾患関連座位の探索 (鎌谷直之 数学セミナー 517, 40, 2004)
66
가계정보가 없는 집단Case-control studyCohort studyIntervention study수집임의화개입연구 방향처리 A처리 B시간경과시간경과연구 방향시간경과수집Case groupControl group
AATT+TA발병비발병연관성의 강도(코호트 연구)++AATT+TA유전자형TT+TA군의 침투율유전자형AA군의 침투율상대위험률(relative risk)
연관성의 강도(Case-Control 연구)Case groupAATT+TAOdds발병오즈비(Odds ratio)비발병Odds침투율은 알 수 없음Control group
상대위험률오즈비
연관성 검정Test of associationPearson’s chi-square testorFisher’s exact test
Hardy-Weinberg 평형법칙Law of Hardy-Weinberg Equilibrium세대별 대립형질의 빈도(p)는일정=세대trandom mating=세대t+1
Hardy-Weinberg 평형법칙Law of Hardy-Weinberg Equilibriumthenif
HWE법칙이 성립하지 않는 이유Random Mating 가정의 불성립근친혼선택결혼 (assortative mating)집단의 구조화데이터의 이상(Typing miss)
유전계승양식의 가정(1)우성(2)열성(3)유전자형(4) Risk allele의 수(5)allele의 수
경향성 검정Cochran-Armigate test for trendBalding (2006), Nat. Rev. Genet
양적형질의 경향성 검정회귀분석양적표현형에 정규분포를 가정AA=0, Aa=1, aa=2으로할 때, 회귀계수가 0인지 아닌지를 검정비모수 검정순위상관Kendall’s tauSpearman의 순위상관계수선형순위상관계수 등대립형질a의 갯수Balding (2006), Nat. Rev. Genet
Haplotype과 연쇄불균형
CTAhaplotypeand diplotypeGTGDiplotype configuration아버지 유래의 haplotype: C-T-A어머니 유래의 haplotype: G-T-G관측 유전자형C/G-T/T-A/GCGTTAG
SNP에서Haplotype으로
2n개의 haplotypen 명
연쇄불균형linkage disequilibrium연쇄 균형 상태연쇄 불균형 상태제2 유전자좌제2 유전자좌제1 유전자좌제1 유전자좌
연쇄불균형계수DCoefficient of linkage disequilibrium연쇄불균형계수 D’
절대 연쇄 불균형・완전 연쇄 불균형absolute LD & complete LD 절대 연쇄 불균형완전 연쇄 불균형연쇄 균형
연쇄 불균형 계수r2Haplotype빈도의 상관계수각각의 대립형질을 등간격으로 좌표축에 나타내어 빈도의 상관계수를 계산2nd locusfreq제2 유전자좌b제 1유전자좌BAa1st locus
Linkage Disequilibrium map (LD map)
Absolute LDComplete LDLinkage equilibrium연쇄 불균형 계수 D’과r2D’=1D’=1D’=0r2=1r2=0.28r2=0
LD와 세대경과와의 관계D’θ=0.001θ=0.01θ=0.05generation
Genome wide association study
게놈와이드 연관분석(Genome-Wide Association Study, GWAS)형질과 관련있는 유전자를 광범위하게 탐색1,000만 SNP의 리스트 작성30~100만 SNP chip(Invader, Illumina, Affymetrix)
“빈도가 높은 질환이 유전과 관계있다고 한다면 가계가 다르다 하더라도 질환의 원인이 되는 돌연변이는 공통”Common Disease Common Variant 가설
직접연관과 간접연관Direct association & Indirect associationKruglyak (2008), Nat. Rev. Genet
ManhattanPlot
집단의 구조화Population structureBalding (2006), Nat. Rev. Genet
EIGENSTRAT주성분분석을 이용한 집단의 구조화 탐색1. 유전자형 데이터3.각SNP별로 표준화Binom(2,MAF)2.대립형질의 갯수유전계승법칙의 도입각 개체는 한세대 위로 부터 minor allele가 MAF의 확률로 전달됨
EIGENSTRAT의 예HapMap데이터의 일본인과 중국인
다중검정 문제The multiple testing problemBalding (2006), Nat. Rev. Genet
게놈연구를 위한 연구디자인
“… 789 publications reporting on 802 different polymorphismsin 277 genes .”…“We systematically meta-analyzed 127 polymorphisms across69 different putative Alzheimer disease risk genes.” 나머지는 ??
Replication(반복검증)
반복검증을 위한 3대 요소연구의 디자인데이터의 품질관리유전통계분석Cohort studysample sizeRR=3alpha =0.05power=0.8
연구디자인 (검정력과 샘플사이즈)PowerSample size (#case=#control)100
100100GWASControlCasePower??후보유전자 연관분석유의수준:1.38×10-08ControlCase유의수준:0.012nd  stage 의 샘플사이즈2 단계 연관분석2 Stage association study연구전체의 유의수준:1×10-7

유전통계학의 오늘과 내일(고려대학교 특강)