Genetické databáze MUDr. Marek Turnovec Ústav biologie a lékařské genetiky UK 2. LF a FN Motol Středa 2. března 2011 IPVZ,...
Definice pojmu „databáze“ <ul><li>uspořádaná množina informací na paměťovém médiu
systém pro správu dat </li><ul><li>ukládání
získávání
vyhledávání
(odstraňování)
… </li></ul></ul>
„Analogové“ databáze obrázky: sxc.hu <ul><li>Různé seznamy – např. soupis adres, telefonní seznam
Katalogy
Kartotéka („lístkovnice“) - 18. století, Carl Linné
Děrné štítky, děrné pásky </li></ul>
Elektronické/digitální databáze <ul><li>Elektromechanické stroje zpracovávaly děrné štítky již na konci 19. století </li><...
1965 – síťové databáze pro sálové počítače
1970 – E. F. Codd – relační databáze
1975 – SQL
90. léta – objektové databáze </li></ul></ul>Univac 1108, rok 1964 (Zdroj Wikipedia) SŘBD?
Databázové modely <ul><li>„plochý“ - flat
hierarchický
síťový
relační
objektový </li></ul>SŘBD = systém řízení báze dat DBMS = database management system
Flat file vzorek jméno mutace1 mutace2 1 Jan N. F508del nenalezena 2 Petr V. F508del F508del 3 Eva M. nenalezena nenalezen...
Příklady relačních databázových systémů <ul><li>DB2 (IBM)
Informix
Oracle
Sybase SQL Server
MySQL / MariaDB
PostgreSQL
Microsoft SQL Server
JET Engine (Microsoft Office Access) </li></ul>
SQL -  S tructured  Q uery  L anguage SELECT * FROM  vysledky  WHERE  vzorek =1; SELECT * FROM  vysledky  WHERE   mutace1 ...
Nejrozšířenější databáze na světě... MS Excel <ul><li>nějaký pěkný obrázek Excelu? </li></ul>
Architektura klient-server <ul><li>Databáze běží centrálně na serveru </li><ul><li>snazší zálohování
menší nároky na klientské počítače </li></ul><li>Přístup možný z více míst současně </li></ul>
Online a webové databáze <ul><li>architektura klient-server
možnost přístupu odkudkoliv
obvykle stačí obyčejný prohlížeč
API pro přístup z jiných systémů </li></ul>
Genomové databáze <ul><li>databáze tzv. referenčních sekvencí
databáze z celého světa jsou zasílány do jedné ze 3 databází: </li><ul><li>ENA
GeneBank
DDBJ </li></ul><li>dohoda na společném/kompatibilním formátu
obsah databází se každý den synchronizuje </li></ul>
International Nucleotide Sequence Database Collaboration <ul><li>ENA/EMBL/EBI </li><ul><li>European Nucleotide Archive
European Molecular Biology Laboratory
European Bioinformatics Institute </li></ul><li>GeneBank / NCBI / NIH </li><ul><li>National Center for Biotechnology Infor...
National Institute of Health </li></ul><li>DDNJ </li><ul><li>DNA Databank of Japan </li></ul></ul>
International Nucleotide Sequence Database Collaboration
„Genome browsers“ <ul><li>slouží k prohlížení dat z genomových databází
„stand-alone“ aplikace
„web-based“ </li><ul><li>Ensembl (Sanger Institute a EBI) www.ensembl.org
NCBI Map Viewer www.ncbi.nlm.nih.gov/projects/mapview
UCSC Genome Browser genome.ucsc.edu </li></ul></ul>
Argo www.broadinstitute.org/annotation/argo/
 
 
 
Upcoming SlideShare
Loading in …5
×

Genetické databáze

916 views

Published on

Přednáška, kterou jsem přednesl v rámci kurzu IPVZ Pokroky v molekulární genetice 2. března 2011.

Published in: Health & Medicine
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
916
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Genetické databáze

  1. 1. Genetické databáze MUDr. Marek Turnovec Ústav biologie a lékařské genetiky UK 2. LF a FN Motol Středa 2. března 2011 IPVZ, Praha
  2. 2. Definice pojmu „databáze“ <ul><li>uspořádaná množina informací na paměťovém médiu
  3. 3. systém pro správu dat </li><ul><li>ukládání
  4. 4. získávání
  5. 5. vyhledávání
  6. 6. (odstraňování)
  7. 7. … </li></ul></ul>
  8. 8. „Analogové“ databáze obrázky: sxc.hu <ul><li>Různé seznamy – např. soupis adres, telefonní seznam
  9. 9. Katalogy
  10. 10. Kartotéka („lístkovnice“) - 18. století, Carl Linné
  11. 11. Děrné štítky, děrné pásky </li></ul>
  12. 12. Elektronické/digitální databáze <ul><li>Elektromechanické stroje zpracovávaly děrné štítky již na konci 19. století </li><ul><li>1890 – sčítání lidu v USA </li></ul><li>Další rozvoj od poloviny 20. století společně s vývojem počítačů </li><ul><li>1960 – COBOL
  13. 13. 1965 – síťové databáze pro sálové počítače
  14. 14. 1970 – E. F. Codd – relační databáze
  15. 15. 1975 – SQL
  16. 16. 90. léta – objektové databáze </li></ul></ul>Univac 1108, rok 1964 (Zdroj Wikipedia) SŘBD?
  17. 17. Databázové modely <ul><li>„plochý“ - flat
  18. 18. hierarchický
  19. 19. síťový
  20. 20. relační
  21. 21. objektový </li></ul>SŘBD = systém řízení báze dat DBMS = database management system
  22. 22. Flat file vzorek jméno mutace1 mutace2 1 Jan N. F508del nenalezena 2 Petr V. F508del F508del 3 Eva M. nenalezena nenalezena 4 Josef P. CFTR del2,3 nenalezena Relační model vzorek jméno mutace1 mutace2 1 Jan N. 2 1 2 Petr V. 2 2 3 Eva M. 1 1 4 Josef P. 3 1 mutace_id mutace_nazev 1 nenalezena 2 F508del 3 CFTR del2,3
  23. 23. Příklady relačních databázových systémů <ul><li>DB2 (IBM)
  24. 24. Informix
  25. 25. Oracle
  26. 26. Sybase SQL Server
  27. 27. MySQL / MariaDB
  28. 28. PostgreSQL
  29. 29. Microsoft SQL Server
  30. 30. JET Engine (Microsoft Office Access) </li></ul>
  31. 31. SQL - S tructured Q uery L anguage SELECT * FROM vysledky WHERE vzorek =1; SELECT * FROM vysledky WHERE mutace1 =&quot;nenalezena&quot; AND mutace2 =&quot;nenalezena&quot;; SELECT vzorek FROM vysledky WHERE mutace1 =&quot;F508del&quot; OR mutace2 =&quot;F508del&quot;; INSERT INTO vysledky ( vzorek , jmeno , mutace1 , mutace2 ) VALUES (&quot;5&quot;, &quot;Tereza M.&quot;, &quot;nenalezena&quot;, &quot;nenalezena&quot;) vzorek jméno mutace1 mutace2 1 Jan N. F508del nenalezena 2 Petr V. F508del F508del 3 Eva M. nenalezena nenalezena 4 Josef P. CFTR del2,3 nenalezena tabulka &quot; vysledky &quot;
  32. 32. Nejrozšířenější databáze na světě... MS Excel <ul><li>nějaký pěkný obrázek Excelu? </li></ul>
  33. 33. Architektura klient-server <ul><li>Databáze běží centrálně na serveru </li><ul><li>snazší zálohování
  34. 34. menší nároky na klientské počítače </li></ul><li>Přístup možný z více míst současně </li></ul>
  35. 35. Online a webové databáze <ul><li>architektura klient-server
  36. 36. možnost přístupu odkudkoliv
  37. 37. obvykle stačí obyčejný prohlížeč
  38. 38. API pro přístup z jiných systémů </li></ul>
  39. 39. Genomové databáze <ul><li>databáze tzv. referenčních sekvencí
  40. 40. databáze z celého světa jsou zasílány do jedné ze 3 databází: </li><ul><li>ENA
  41. 41. GeneBank
  42. 42. DDBJ </li></ul><li>dohoda na společném/kompatibilním formátu
  43. 43. obsah databází se každý den synchronizuje </li></ul>
  44. 44. International Nucleotide Sequence Database Collaboration <ul><li>ENA/EMBL/EBI </li><ul><li>European Nucleotide Archive
  45. 45. European Molecular Biology Laboratory
  46. 46. European Bioinformatics Institute </li></ul><li>GeneBank / NCBI / NIH </li><ul><li>National Center for Biotechnology Information
  47. 47. National Institute of Health </li></ul><li>DDNJ </li><ul><li>DNA Databank of Japan </li></ul></ul>
  48. 48. International Nucleotide Sequence Database Collaboration
  49. 49. „Genome browsers“ <ul><li>slouží k prohlížení dat z genomových databází
  50. 50. „stand-alone“ aplikace
  51. 51. „web-based“ </li><ul><li>Ensembl (Sanger Institute a EBI) www.ensembl.org
  52. 52. NCBI Map Viewer www.ncbi.nlm.nih.gov/projects/mapview
  53. 53. UCSC Genome Browser genome.ucsc.edu </li></ul></ul>
  54. 54. Argo www.broadinstitute.org/annotation/argo/
  55. 60. UniProt <ul><li>Universal Protein resource
  56. 61. Konsorcium: </li><ul><li>EBI
  57. 62. Swiss Institute of Bioinformatics
  58. 63. Protein Information Resource </li></ul><li>www.uniprot.org </li></ul>
  59. 66. Specifické databáze <ul><li>Cystic Fibrosis Mutation Database genet.sickkids.on.ca </li></ul>
  60. 68. Z českých luhů a hájů
  61. 69. Mendelian Inheritance in Men (MIM) <ul><li>katalog všech známých genetických onemocnění
  62. 70. odkazy na geny (jsou-li známé)
  63. 71. Victor A. McKusick
  64. 72. 1. vydání – 1966
  65. 73. 12. vydání – 1998
  66. 74. fenotypy i geny
  67. 75. až na pár výjimek neobsahuje chromosomální aberace </li></ul>Victor A. McKusick Foto: Wikipedia
  68. 76. O MIM kódy 1. číslice Rozsah Dědičnost 1 100000–199999 AD (před 1994) 2 200000–299999 AR (před 1994) 3 300000–399999 X-vázaná 4 400000–499999 Y-vázaná 5 500000–599999 mitochontriální 6 600000– AD (po 1994) Symbol Význam * gen o známé sekvenci # fenotyp + gen + fenotyp % fenotyp, lokus, ale ne sekvence žádný symbol mendelovská dedičnost nejistá ^ odstraněný či přesunutý záznam
  69. 77. Online Mendelian Inheritance in Men <ul><li>online verze spravovaná NCBI
  70. 78. časté aktualizace
  71. 79. oproti tištěné verzi více odkazů (do jiných databází, literatura...)
  72. 80. těsné propojení na další služby NCBI (PubMed, MapViewer...)
  73. 81. www.ncbi.nlm.nih.gov/omim </li></ul>
  74. 83. PubMed <ul><li>online přístup do databáze MEDLINE ( Med ical Li terature Analysis and Retrieval System On line )
  75. 84. články od roku 1950
  76. 85. asi 5000 časopisů (i některé české)
  77. 86. pro lepší výsledky hledání nutné jisté znalosti: </li><ul><li>MeSH slovník, limitování a kombinování dotazů, etc. </li></ul><li>www.ncbi.nlm.nih.gov/pubmed </li></ul>
  78. 88. Entrez <ul><li>portál pro vyhledávání v mnoha biomedicínských databázích
  79. 89. sekvence (DNA, RNA), geny, varianty
  80. 90. proteiny a jejich struktura
  81. 91. OMIM, OMIA
  82. 92. články v odborných časopisech
  83. 93. monografie </li></ul>www.ncbi.nlm.nih.gov/Entrez
  84. 96. POSSUM Web <ul><li>dysmorfologická databáze
  85. 97. >3000 syndromů
  86. 98. metabolické, chromosomální, skeletální i vícečetné vady
  87. 99. aktualizace každý měsíc
  88. 100. fotografie, rtg
  89. 101. přístup přes web, nutný hardwarový klíč
  90. 102. roční předplatné $300
  91. 103. www.possum.net.au </li></ul>
  92. 107. London Medical Databases <ul><li>The Winter-Baraitser Dysmorphology Database (WBDD) </li><ul><li>více než 4450 syndromů – dysmorfologie, vícečetné vrozené vady, monogenní choroby, mikrodeleční syndromy, mentální retardace
  93. 108. fotografie, možnost vyhledávání dle příznaků </li></ul><li>The Baraitser-Winter Neurogenetics Database (BWND) </li><ul><li>přes 4000 neurogenetických syndromů
  94. 109. kromě fotografií i CT, MRI, EEG </li></ul><li>The London Ophthalmic Genetics Database (GENEEYE) </li><ul><li>2750 oftalmologických stavů s genetickým pozadím </li></ul><li>£600 za 1 databázi, další updaty £200 ročně </li></ul>
  95. 110. Seznam syndromů
  96. 111. Popis syndromu
  97. 112. Příznaky
  98. 113. Vyhledávání podle příznaků
  99. 114. Literatura
  100. 115. Obrazová dokumentace asi 20000 obrázků: fotografie, RTG, CT, MRI, EEG, mikrofotografie...
  101. 116. Orphanet <ul><li>mezinárodní portál pro vzácná onemocnění ( rare diseases ) a „léčivé přípravky pro léčbu vzácných onemocnění“ ( orphan drugs )
  102. 117. vzácné onemocnění – prevalence < 1:2000
  103. 118. původně vznikl ve Francii, dnes projekt na Evropské úrovni
  104. 119. chtějí se připojit další země – Kanada, Japonsko...
  105. 120. spolupráce na nové revizi MKN </li></ul>www.orpha.net
  106. 121. Co Orphanet nabízí? <ul><li>5832 vzácných onemocnění (k únoru 2011)
  107. 122. klasifikace
  108. 123. 2878 encyklopedicky zpracovaných
  109. 124. léčiva pro vzácná onemocnění – ve všech fázích vývoje/výroby
  110. 125. adresáře: </li><ul><li>expertní klinická pracoviště
  111. 126. diagnostické a genetické laboratoře
  112. 127. pacientské organizace </li></ul></ul>
  113. 131. www.orphanet.cz
  114. 132. Databáze laboratoří v ČR na ÚHKT <ul><li>databáze cytogenetických laboratoří </li><ul><li>kontaktní údaje, prováděná vyšetření </li></ul><li>databáze DNA laboratoří </li><ul><li>kontaktní údaje
  115. 133. vyšetřované geny, včetně OMIM kódu
  116. 134. informace o akreditaci/certifikaci, kontrole kvality
  117. 135. www.uhkt.cz/nrl/db </li></ul></ul>
  118. 138. Děkuji za pozornost. [email_address] [email_address]

×