HGP And Computer

1,933 views

Published on

Human Genome Project and Computer

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,933
On SlideShare
0
From Embeds
0
Number of Embeds
11
Actions
Shares
0
Downloads
49
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

HGP And Computer

  1. 1. 휴먼게놈프로젝트와 컴퓨터 Human genome project and Computer science 김형용 , Insilicogen, Inc.
  2. 2. 순서 <ul><li>생물학 백그라운드 </li></ul><ul><li>Genome의 구조 </li></ul><ul><li>서열결정작업 </li></ul><ul><li>HGP 이후의 이야기들 </li></ul><ul><li>컴퓨터과학의 기여 </li></ul>
  3. 3. Genome <ul><li>게놈 ? 지놈 ? </li></ul><ul><li>유전자 (gene), 유전체 (genome) </li></ul>
  4. 4. Great 3 books <ul><li>우주 – 생명 - 인간 </li></ul>
  5. 5. Central Dogma of Molecular Biology
  6. 7. Protein structure <ul><li>20 Amino acids </li></ul><ul><li>Sequence specifies conformation </li></ul><ul><li>RNase </li></ul>
  7. 8. Life <ul><li>DNA’s common method of producing more DNA </li></ul><ul><li>Review the life </li></ul>
  8. 9. Evolution <ul><li>Self replicator </li></ul>
  9. 10. Chromosome 1 cM ~= 1 Mbps
  10. 11. Gene structure
  11. 13. Junk DNA <ul><li>전체 Genome 의 5% 만이 단백질이 되는 영역 . 그렇다면 나머지는 ? </li></ul><ul><li>Repetitive sequence </li></ul><ul><ul><li>LINE (>300bps) </li></ul></ul><ul><ul><li>SINE (300bps), Alu (30000~50000 개 ) </li></ul></ul><ul><ul><li>Microsatelite </li></ul></ul>
  12. 14. Human genome <ul><li>3~4x10 14 cells (~=2 45 ) </li></ul><ul><li>> 200 cell type </li></ul><ul><li>3x10 9 bps (3Gbps = 3Gbyte) </li></ul><ul><li>20000~25000 Gene s </li></ul><ul><li>98% unknown functional DNA </li></ul><ul><li>0.1% difference with you </li></ul><ul><li>Information theory : 30Mbyte </li></ul>
  13. 15. Human genome project <ul><li>DOE, NHGRI 에서 시작 . 2003 년 공식 완료 . 13 년 . 7 개국 참여 </li></ul><ul><li>95% 나 되는 Junk DNA 를 꼭 그 많은 돈을 들여서 해야만 했는가 ? </li></ul><ul><li>목적 </li></ul><ul><ul><li>Human DNA 에서 모든 Gene 의 동정 </li></ul></ul><ul><ul><li>30 억 염기서열의 결정 </li></ul></ul><ul><ul><li>Database 에 결과의 저장 </li></ul></ul><ul><ul><li>이를 분석할 수 있는 도구의 향상 </li></ul></ul><ul><ul><li>관련 윤리적 문제의 연구 </li></ul></ul>
  14. 16. History <ul><li>PCR </li></ul><ul><li>RFLP </li></ul><ul><li>Genetic marker </li></ul><ul><li>BAC </li></ul><ul><li>Shotgun sequencing </li></ul><ul><li>Whole genome shotgun </li></ul>
  15. 17. Gel Electrophoresis <ul><li>젤 ( 그물막 ) 에 전하를 띤 물질을 통과시킴으로 , 분리하는 방법 . 작을수록 멀리 ~ </li></ul><ul><li>DNA, Protein </li></ul>
  16. 18. PCR <ul><li>Polymerase Chain Reaction </li></ul>
  17. 19. Genetic marker <ul><li>Polymorphic allele locus </li></ul>
  18. 21. Genetic map
  19. 22. Cloning <ul><li>무지 작은 저 분자를 하나씩 직접 읽을 수 없다 . </li></ul><ul><li>따라서 , “ 동일” 한 것들 여러 개를 갖고 실험 </li></ul>
  20. 23. Gene cloning <ul><li>Gene cloning 과정 </li></ul><ul><ul><li>Genome 상에서 원하는 영역을 정한다 . </li></ul></ul><ul><ul><li>원하는 영역을 뽑아낼 수 있는 PrimerDesign 을 한다 . </li></ul></ul><ul><ul><li>PCR 로 해당영역의 major band 를 확인하고 , 추출한다 . </li></ul></ul><ul><ul><li>CloningVector 에 삽입한다 . </li></ul></ul><ul><ul><li>Selection 의 과정을 통해 , 해당 유전자가 삽입된 벡터가 들어있는 클론을 선발한다 . </li></ul></ul><ul><li>Cloning vector </li></ul><ul><ul><li>Plasmid : </li></ul></ul><ul><ul><li>Cosmid : 30 kb </li></ul></ul><ul><ul><li>BAC : 350 kb </li></ul></ul><ul><ul><li>YAC : 2 Mb 이상 </li></ul></ul><ul><ul><li>PAC : 300 kb </li></ul></ul>
  21. 24. DNA sequencing
  22. 25. DNA sequencing
  23. 26. <ul><li>Frederic Sanger </li></ul><ul><li>DNA, Protein </li></ul><ul><li>유효길이 </li></ul><ul><li>700-800bp </li></ul>DNA sequencing
  24. 27. Shotgun sequencing 게놈을 읽기 위해 유전학자들은 먼저 게놈을 수천조각으로 부순 뒤 , 아무렇게나 잘라졌을 이 조각들을 가지고 시작할 수 밖에 없다 . 재조립하기 위해 파괴하는 것 , 그것이 분자생물학자들의 저주받을 운명이고 직업적 강박관념이다 . -- 다니엘코엥 , 휴먼게놈을 찾아서
  25. 28. Genome sequencing <ul><li>Clone by clone method </li></ul><ul><ul><li>Genetic marker 에 따라 BAC 선발 후 shotgun </li></ul></ul><ul><li>Whole genome shotgun </li></ul><ul><ul><li>무작정 shotgun </li></ul></ul><ul><ul><li>Repeat 로 인한 조립에의 어려움 . </li></ul></ul><ul><ul><li>컴퓨터만 믿는다 . </li></ul></ul>
  26. 29. Current status (since 2003) <ul><li>Human Chromosome 4 Completed, April 2005. </li></ul><ul><li>Human Chromosome 2 Completed, April 2005. </li></ul><ul><li>Human Chromosome X Completed, March 2005. </li></ul><ul><li>Human Chromosome 16 Completed, December 2004. </li></ul><ul><li>Human Gene Count Estimates Changed to 20,000 to 25,000, October 2004. </li></ul><ul><li>Human Chromosome 5 Completed, September 2004. </li></ul><ul><li>Human Chromosome 9 Completed, May 2004. </li></ul><ul><li>Human Chromosome 10 Completed, May 2004. </li></ul><ul><li>Human Chromosome 19 Completed, March 2004. </li></ul><ul><li>Human Chromosome 13 Completed, March 2004. </li></ul><ul><li>Human Chromosome 6 Completed, October 2003. </li></ul><ul><li>Human Chromosome 7 Completed, July 2003. </li></ul><ul><li>Human Chromosome Y Completed, June 2003. </li></ul><ul><li>Human Genome Project Completion: 1990-2003 (April 2003) </li></ul>
  27. 30. Genome browser <ul><li>UCSC Genome browser </li></ul><ul><li>NCBI Genome browser </li></ul><ul><li>Ensembl </li></ul><ul><li>VistaBrowser </li></ul>
  28. 31. Genetic disease – before HGP
  29. 32. Genetic disease – after HGP
  30. 33. Comparative genomics <ul><li>Synteny (Gene order), Gene duplication, Gene fusion </li></ul>
  31. 35. Comparative genomics
  32. 36. SNP <ul><li>Single Nucleotide Polymorphism </li></ul><ul><li>종간 다양성  종내 다양성 </li></ul><ul><li>염기변화  유전자내  아미노산변화  구조변화 </li></ul>
  33. 37. Haplotype
  34. 39. HapMap <ul><li>일본 , 영국 , 중국 , 캐나다 , 미국 , 나이지리아 </li></ul><ul><li>Project 의 목표는 MinorAllele 의 빈도가 최소 5% 이상이고 평균 간격이 5 kilobase 인 60 만개 SNPs 을 genotype 하는 것 </li></ul>
  35. 40. Transcriptome, Proteome <ul><li>EST </li></ul><ul><li>DNA chip </li></ul><ul><li>Proteomics </li></ul>
  36. 41. EST <ul><li>Expression Sequence Tag </li></ul>
  37. 45. Transformational grammar <ul><li>Regular grammar : computer program </li></ul><ul><li>Context free grammar : DNA </li></ul><ul><ul><li>Palindrome, “다시 합창합시다” </li></ul></ul><ul><li>Context sensitive grammar </li></ul><ul><li>Unrestricted Grammar : 자연어 </li></ul>
  38. 46. Sequence alignment
  39. 47. Smith-Waterman algorithm
  40. 48. BLAST <ul><li>Unknown sequence </li></ul>Known sequence Database
  41. 49. Object oriented programming <ul><li>Computer programming paradigm </li></ul><ul><li>생명현상의 모델링 </li></ul>
  42. 50. 마치며… <ul><li>Rosetta stone </li></ul><ul><li>Programming </li></ul>

×