Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
760
On Slideshare
0
From Embeds
0
Number of Embeds
7

Actions

Shares
Downloads
6
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Cátedra de genéticaUniversidad Nacional Autónoma de Colombia Sede Bogotá (r)evolución de información en biología: el caso de la genómica Layla MichánDepartamento de Biología Evolutiva, Facultad de Ciencias, UNAM
  • 2. PROBLEMAS 1. (R)evolución digital en las ciencias biológicas 2. Características de la E-biología 3. Dinámica, estructura y relaciones de la biología reciente 4. Publicación científica 5. Recursos web y ciberinfraestructura para biología 6. Colecciones de datos 7. Meta-análisis de literatura: bibliometría, análisis de redes, minería de textos, semántica TIPOS1.Biológica ENFOQUES 1.Biología2.Bibliográfica 2.Ciencias de la información y3.Institucional INFORMACIÓN documentación 3.Tecnologías de la ÁREAS BIOLÓGICA Información y comunicación 1.Biodiversidad 4.Ciencias de la computación 2.Biomedicina APLICACIONES 1.Obtención de nuevo conocimiento (Biología) 2.Análisis de la ciencia actual (Bibliometría, Historia, Sociología) 3.Ciencias de la Información y la documentación biológica 4.Planeación, evaluación, gestión y política científica
  • 3. Historia de la ciencias Etapas• Antigüedad (III ac V d.c.)• Edad Media.(V-XIV)• Renacimiento (XV-XVI)• Etapa Moderna Temprana (XVII-XVIII)• Etapa Moderna (1800-1950)• Etapa Reciente o Contemporánea(1950-2010)
  • 4. Historia Biología (Problemas)Historia Natural (in vivo) – Siglo III A.C-XIX Biología Siglo XX (in vitro) Molecularización Siglo XXI (in silico) Computarización
  • 5. Los problemas de la Herencia Siglo XIX• La biología es una rama del conocimiento derivada de la síntesis de diversas tradiciones científicas, sin duda la más importante es la Historia Natural pero durante el siglo XIX hubo otras quizás menos abundantes en cuanto a producción, pero igualmente relevantes en cuanto a las innovaciones conceptuales para la biología actual, entre estas están:• La herencia que estudiaba como se transmiten los caracteres de los padres a los hijos con base en: – La de los criadores y mejoradores enfocados al estudio del mejoramiento (especialmente de plantas), es decir en la herencia de los caracteres importantes para el hombre (agronomía actual). – La de los hibridólogos encargados de estudiar la herencia de caracteres y la naturaleza de la especie (esencialista y nominalista) iniciada con Linneo.• Había dos formas de estudiar la herencia de caracteres: – Los arboles genealógicos o pedigrís. – Cruzas entre individuos con distintos caracteres
  • 6. Gregor Mendel (1822-1884)• En 1900 se redescubrió el trabajo de Gregor Mendel, quien en 1865 había anunciado el resultado de sus estudios con chícharos ante la Sociedad Bruniana.• Los principales postulados de sus experimentos fueron: – Ciertos caracteres que pueden distinguirse fácilmente muestran predominancia de unos sobre otros en la progenie de la cruza de padres con caracteres opuestos o diferenciados. – Dos caracteres son transmitidos como elementos diferentes, uno del padre y otro de la madre, en donde uno es dominante y el otro recesivo . Los caracteres que se transmiten y aparecen en la primera generación son los dominantes y los que permanecen ocultos o de forma latente en el proceso son los recesivos.• Mendel usó la expresión recesivo porque estos caracteres desaparecen en la primera generación, pero reaparecen en las subsecuentes.• Reconoció que esos pares actúan independientemente de otros pares de caracteres.• De estos dos principios derivó algunas reglas aritméticas que rigen la herencia
  • 7. Para progenies de híbridos con un par de caracteres diferenciantes) R y r, suproporción de la progenie será de tres dominantes contra un recesivo.Cuando difieren en dos pares de caracteres la proporción será de 9:3:3:1.
  • 8. Redescubrimiento de las leyes de MendelEn 1900 de manera independiente publicaron los resultados de sus trabajos haciendo referencia al trabajo “precursor” de Mendel:• El botánico holandés Hugo de Vries (1848-1935)• El botánico alemán Carl Correns (1864-1933)• El austríaco Eric Tschermak von Seysenegg (1871-1962)Este hecho marcó el inicio del estudio de la genética se extendieron y aplicaron los conocimientos mendelianos.• Sólo Correns comprendió completamente el trabajo de Mendel y sus consecuencias. Tanto De Vries como Tschermak no entendían conceptos como dominancia y confundían en una las dos leyes de Mendel en una sola. Es entonces muy claro que el trabajo de Mendel no fue entendido ni en sus aspectos técnicos ni tampoco en su importancia. De hecho, el entendimiento de su relevancia vino antes de ser entendido técnicamente.
  • 9. Tomas H. Morgan (1866-1945)Teoría cromosómica de la herenciaMapas cromosómicosHerencia ligada al sexoNobel 1933
  • 10. El término biología molecular fue acuñado por el Director de laDivisión de Ciencias Naturales de la fundación Rokefeller, WarrenWeaver, en 1938. Warren Weaver Warren Weaver Hall (1894-1978) Washington
  • 11. Hechos históricos http://www.nature.com/nature/journal/v422/n6934/pdf/tim eline_01626.pdf
  • 12. James Watson y Francis Crick Premio Nobel 1962
  • 13. 1990: TICS Y BIOLOGÍA
  • 14. La sociedad del conocimiento• Se refiere al incremento espectacular y a la aceleración sin precedente del ritmo de creación, acumulación, distribución y aprovechamiento de la información y el conocimiento.-El conocimiento se crea, se acumula, se difunde y se aprovecha, pues orienta las decisiones y permite la intervención en el mundo, de acuerdo con ciertos fines y valores (Morales, 2001).• El modelo de la Sociedad del Conocimiento está en construcción al igual que la sociedad misma (Olivé, 2005).
  • 15. (Re)evolución de la información (1990)• Diseño de las computadoras.• Aparición del Internet• Masificación de la web.• Formato digital: bajo costo, poco espacio.• Explosión de la información.• Gran cantidad de colecciones de datos .• Dinámica: cambia, está en modificación constante, tanto el contenido como los formatos.• Masiva• Aplicaciones de mata-análisis
  • 16. (Re)evolución de la información (científica)• La adopción del formato electrónico.• Producción acelerada de una gran variedad de programas, aplicaciones, herramientas, utilidades recursos y servicios electrónicos para la práctica científica, muchos de ellos disponibles a través de la Internet.• Uso de la Web como medio de comunicación.• El número de los investigadores y de sus publicaciones se duplica aproximadamente cada veinte años.• Viven actualmente entre un 80% y un 90% de los científicos que han existido.• Se publican cada año mas de dos millones de artículos.• Se conceden un millón de patentes.• Modificación en la forma de producir, evaluar y consultar la información. – Revistas electrónicas – Procedimiento electrónico – Evaluación libre – E-prints: Preprints y posprints – Inmediatez• Se han producido nuevas disciplinas científicas
  • 17. La transformación de la biología• Molecularización• Colaboración• Multidisciplinariedad• Proyectos internacionales• Grids• Nuevos modelos• Nuevas disciplinas – Bioinformática – Informática Médica – Neuroinformática – Biología de Sistemas• Colecciones de datos – Biológicas – Bibliográficas
  • 18. Investigación biológica Descripción Comparación Observación Experimentación ClasificaciónIn vivoIn vitro (1900) Investigación CientíficaIn Silico (1990) (Biología)
  • 19. 3000 Escherichia (94873) Drosophila (48989) 2500 Saccharomyces (27549) Arabidopsis (18094) Caenorhabditis (5353) 2000Documents 1500 1000 500 0 1900 1905 1910 1915 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 Year
  • 20. 250 Zea (7636) Neurospora (6640) Dictyostelium (6191) 200 Chlamydomonas (5646) Schizosaccharomyces (3183) Danio (973) 150Documentos 100 50 0 1900 1905 1910 1915 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 Year
  • 21. 706 Behavioral Scien 782 Biotech & Microbio 1200 Biophysics 1231 Physiology 1258 Toxicology 1465 Entomology 1811 (2) 1258 Ecology 2340 (3) Evolutionary Bio Figure 21 2365 Zoology Subject Area 2482 (2) Biology 2519 (1) Neurosciences 4310 (20) Multidisciplinary 6328 (3) Develop Bio 8137 (15) Cell Bio 10907 (18) Biochem & Mol Bio17900 (6) Genetics & Heredity 0% 5% 30% 25% 20% 15%40% 35% 10% Documents
  • 22. 600 Genetics & Heredity Biochemistry & Molecular Biology 500 Cell Biology Developmental Biology 400 NeuroscienceDocuments 300 200 100 0 1905 1910 1915 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 Year Figure 22
  • 23. 2005 2000 1995 1990 1985 1980 1975 1970 1965 1960 Figure 23 Year 1955 1950 1945 Evolutionary Biology 1940 1935 Toxicology 1930 Zoology Ecology 1925 1920 1915 1910 1905100 80 70 50 40 30 20 0 90 60 10 Documents
  • 24. Colección desecuencias de E-cienciagenes Ciberinfraestructura
  • 25. Genbank• Es una colección anotada de todas las secuencias de nucleótidos a disposición del público y su traducción de proteínas.• Centro Nacional de Información Biotecnológica (NCBI)• European Molecular Biology Laboratory (EMBL) de datos de Bibliotecas del Instituto Europeo de Bioinformática (EBI)• DNA Data Bank de Japón (DDBJ).• Reciben las secuencias producidas en laboratorios de todo el mundo de más de 100.000 organismos distintos.• Crece a un ritmo exponencial, duplicando cada 10 meses. Suelte 134, producido en febrero de 2003, contenía más de 29300 millones de bases nucleotídicas en más de 23,0 millones de secuencias.• Se construye mediante el envío directo de los distintos laboratorios y de los centros de secuenciación a gran escala.
  • 26. http://www.ncbi.nlm.nih.gov/genbank/genbankstats.html
  • 27. Olson M, Hood L, Cantor C,Botstein D. A commonlanguage for physicalmapping of the humangenome. Science. 1989; 245(4925): 1434–1435. [PubMed]
  • 28. 800.000 Documentos en PubMed (NIH)700.000600.000500.000400.000300.000200.000100.000 0 1870 1885 1900 1915 1930 1945 1960 1975 1985 1990 2000 2005 1865 1875 1880 1890 1895 1905 1910 1920 1925 1935 1940 1950 1955 1965 1970 1980 1995 Cerca de 20 millones octubre, 2010)
  • 29. e-science/ cyberinfraestructure• cyberinfraestructure (USA) • e-science (europe)• United States National Science • United Kingdoms Office of Foundation (NSF) blue-ribbon Science and Technology in committee in 2003 1999• Describes the new research • Will refer to the large scale environments that support advanced data acquisition, data science that will storage, data management, data increasingly be carried out integration, data mining, data through distributed global visualization and other computing collaborations enabled by and information processing the Internet services over the Internet
  • 30. Ciberinfraestructura•Entorno tecnológico-social que permite crear, difundir ypreservar los datos, información y conocimientos mediantela adquisición, almacenamiento, gestión, integración,informática, minería, visualización y otros servicios a travésde Internet (NSF 2003, 2007).•Incluye un conjunto interoperable de diversos elementos: –1) Infraestructura, los sistemas computacionales (hardware, software y redes), servicios, instrumentos y herramientas. –2) Colecciones de datos. –3) Grupos virtuales de investigación (colaboratorios y observatorios).
  • 31. e-investigación• Actividades de investigación que utilizan una gama de capacidades avanzadas de las TIC y abarca nuevas metodologías de investigación que salen de un mayor acceso a: * Las comunicaciones de banda ancha de redes, instrumentos de investigación y las instalaciones, redes de sensores y repositorios de datos; * Software y servicios de infraestructura que permitan garantizar la conectividad e interoperabilidad; * Aplicación herramientas que abarcan la disciplina de instrumentos específicos y herramientas de interacción. avanzar y aumentar, en lugar de reemplazar las tradicionales metodologías de investigación,• permitirá a los investigadores para llevar a cabo su labor de investigación más creativa, eficiente y colaboración a larga distancia y difundir sus resultados de la investigación con un mayor efecto.• Colaboración Nuevos campos de investigación emergentes, utilizando nuevas técnicas de minería de datos y el análisis, avanzados algoritmos computacionales y de redes de intercambio de recursos.
  • 32. e-Science• Originally referred to experiments that connected together a few powerful computers located at different sites and, later, a very large number of modest PCs across the world in order to undertake enormous calculations or process huge amounts of data. The coordination of geographically dispersed computing and data resources has become known as the Grid. This is shorthand for the emerging standards and technology – hardware and software – being developed to enable and simplify the sharing of resources. The analogy is an electric power grid, which comprises numerous varied resources connected together to contribute power into a shared pool that users can easily access when they need it.• What is exciting about the Grid is that the combination of extensive connectivity, massive computer power and vast quantities of digitized data – all three of which are still rapidly expanding – making possible new applications that are orders of magnitude more potent than even a few years ago.• The term e-research is sometimes used instead of e-science, with the advantage that gives more emphasis to the end result of better, richer, faster or new research results, rather than the technologies used to get them.National Centre for e-Social Science. 2008. Frequently Asked Questions. Diponible en: http://www.ncess.ac.uk/about_eSS/faq/?q=General_1#General_1
  • 33. E-ciencia (e-science)• Resulta del uso y aplicación de la Ciberinfraestructura en la práctica cientifica,• Se caracteriza por la inter y multidisciplinariedad.• Colaboración, la participación de un gran número de investigadores (en algunos casos cientos) localizados en diversas regiones y con diferentes especialidades que se forman grupos trabajo (Hey y Trefethen, 2005; Barbera et al.,2009).
  • 34. E-cienciaUno de los primeros proyectos de e-ciencia fue el de el genoma humano, se publicó en el 2001 en dos artículos con un día de diferencia en las revistas Nature y Science.Nature:Initial sequencing and analysis of the human genome 79 Autores 48 Instituciones181 referencias Todos los autores provenientes de departamentos de Ciencias Genómicas (o genética) exceptuando los siguientes: Department of Cellular and Structural Biology Department of Molecular Genetics Department of Molecular BiologyScience: The Sequence of the Human Genome 276 Autores 14 Instituciones 452 referencias Todos los autores provenientes de departamentos de Ciencias Genómicas (o genética) exceptuando los siguientes: Department of Biology e Informática Médica
  • 35. 1865 Gregor Mendel descubre las leyes de la Genética http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf1953 James Watson y Francis Crick describen la estructura de la doble-hélice del ADN http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf1966 Marshall Nirenberg, Har Gobind Khorana y Robert Holley determinan el código http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf genético1972 Stanley Cohen and Herbert Boyer desarrollan la tecnología del ADN recombinante http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf1977 Frederick Sanger, Allan Maxam y Walter Gilbert desarrollan métodos de http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf secuenciación del ADN1982 La base de datos „GenBank‟ es establecida http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf1985 Es inventada la Reacción en Cadena de la Polimerasa (PCR) http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf1990 El Proyecto Genoma Humano (HGP) inicia en Estados Unidos http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf1997 El genoma de Escherichia coli es secuenciado http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf2003 La secuencia del genoma humano es finalizada http://www.nature.com/nature/journal/v42 2/n6934/pdf /timeline_01626.pdf
  • 36. La Genómica• Es el estudio sistemático de la documentación completa de las secuencias del ADN de los organismos (MeSH, 2010), dicho estudio ha ayudado a comprender polimorfismos dentro de las especies, la interacción de las proteínas y la evolución (Brent, 2000).• Incluye todos los métodos que recopilan y analizan datos completos acerca de los genes, incluida las secuencias, la abundancia de los ácidos nucleicos y las propiedades de las proteínas que codifican (Murray, 2000).• Nuestra capacidad para estudiar la función génica está aumentando en la especificidad gracias a esta nueva disciplina (Collins, et ál., 2003) que se compromete a acelerar el descubrimiento científico en todos los ámbitos de la ciencia biológica (Burley, 2000).
  • 37. Número de Publicaciones 3500 Pathology and immunopathology 3000 research en 1988; The genomics of human homeobox-containing 2500 loci‟, escrito por CA Ferguson-Smith y FH Ruddle del Departamento dePublicaciones 2000 Biología, en la Universidad de Yale, 1500 New Haven, Connecticut. 1000 500 0 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Año
  • 38. Número de Publicaciones 600 500 400Publicaciones 300 200 100 0 Institución
  • 39. Nature. 2001 Feb 15;409(6822):860-921. Initial sequencing and analysis of the human genome.Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W, Funke R, Gage D, Harris K, Heaford A, Howland J, Kann L, Lehoczky J, LeVine R, McEwan P, McKernan K, Meldrim J, Mesirov JP, Miranda C, Morris W, Naylor J, Raymond C, Rosetti M, Santos R, Sheridan A, Sougnez C, Stange-Thomann N,Stojanovic N, Subramanian A, Wyman D, Rogers J, Sulston J, Ainscough R, Beck S, Bentley D, Burton J, Clee C, Carter N, Coulson A, Deadman R, Deloukas P, Dunham A,Dunham I, Durbin R, French L, Grafham D, Gregory S, Hubbard T, Humphray S, Hunt A, Jones M, Lloyd C, McMurray A, Matthews L, Mercer S, Milne S, Mullikin JC, Mungall A,Plumb R, Ross M, Shownkeen R, Sims S, Waterston RH, Wilson RK, Hillier LW, McPherson JD, Marra MA, Mardis ER, Fulton LA, Chinwalla AT, Pepin KH, Gish WR, Chissoe SL, Wendl MC, Delehaunty KD, Miner TL, Delehaunty A, Kramer JB, Cook LL, Fulton RS, Johnson DL, Minx PJ, Clifton SW, Hawkins T, Branscomb E, Predki P, Richardson P,Wenning S, Slezak T, Doggett N, Cheng JF, Olsen A, Lucas S, Elkin C, Uberbacher E, Frazier M, Gibbs RA, Muzny DM, Scherer SE, Bouck JB, Sodergren EJ, Worley KC, Rives CM, Gorrell JH, Metzker ML, Naylor SL, Kucherlapati RS, Nelson DL, Weinstock GM, Sakaki Y, Fujiyama A, Hattori M, Yada T, Toyoda A, Itoh T, Kawagoe C, Watanabe H, Totoki Y,Taylor T, Weissenbach J, Heilig R, Saurin W, Artiguenave F, Brottier P, Bruls T, Pelletier E, Robert C, Wincker P, Smith DR, Doucette-Stamm L, Rubenfield M, Weinstock K, Lee HM, Dubois J, Rosenthal A, Platzer M, Nyakatura G, Taudien S, Rump A, Yang H, Yu J, Wang J, Huang G, Gu J, Hood L, Rowen L, Madan A, Qin S, Davis RW, Federspiel NA,Abola AP, Proctor MJ, Myers RM, Schmutz J, Dickson M, Grimwood J, Cox DR, Olson MV, Kaul R, Raymond C, Shimizu N, Kawasaki K, Minoshima S, Evans GA, Athanasiou M,Schultz R, Roe BA, Chen F, Pan H, Ramser J, Lehrach H, Reinhardt R, McCombie WR, de la Bastide M, Dedhia N, Blöcker H, Hornischer K, Nordsiek G, Agarwala R, Aravind L,Bailey JA, Bateman A, Batzoglou S, Birney E, Bork P, Brown DG, Burge CB, Cerutti L, Chen HC, Church D, Clamp M, Copley RR, Doerks T, Eddy SR, Eichler EE, Furey TS,Galagan J, Gilbert JG, Harmon C, Hayashizaki Y, Haussler D, Hermjakob H, Hokamp K, Jang W, Johnson LS, Jones TA, Kasif S, Kaspryzk A, Kennedy S, Kent WJ, Kitts P,Koonin EV, Korf I, Kulp D, Lancet D, Lowe TM, McLysaght A, Mikkelsen T, Moran JV, Mulder N, Pollara VJ, Ponting CP, Schuler G, Schultz J, Slater G, Smit AF, Stupka E,Szustakowski J, Thierry-Mieg D, Thierry-Mieg J, Wagner L, Wallis J, Wheeler R, Williams A, Wolf YI, Wolfe KH, Yang SP, Yeh RF, Collins F, Guyer MS, Peterson J, Felsenfeld A,Wetterstrand KA, Patrinos A, Morgan MJ, de Jong P, Catanese JJ, Osoegawa K, Shizuya H, Choi S, Chen YJ; International Human Genome Sequencing Consortium.Whitehead Institute for Biomedical Research, Center for Genome Research, Cambridge, Massachusetts 02142, USA. lander@genome.wi.mit.edu
  • 40. • The human genome holds an extraordinary trove of information about human development, physiology, medicine and evolution. Here we report the results of an international collaboration to produce and make freely available a draft sequence of the human genome. We also present an initial analysis of the data, describing some of the insights that can be gleaned from the sequence.• Here we report the results of a collaboration involving 20 groups from the United States, the United Kingdom, Japan, France, Germany and China to produce a draft sequence of the human genome.• Of course, navigating information spanning nearly ten orders of magnitude requires computational tools to extract the full value.
  • 41. FIGURA 1. Línea de tiempo de los análisis genómicos a gran escala. Nature 409, 860-921(15 February 2001)doi:10.1038/35057062http://www.nature.com/nature/journal/v409/n6822/fig_tab/409860a0_F1.html
  • 42. FIGURE 3. The automated production line for sample preparation at the WhiteheadInstitute, Center for Genome Research.Nature 409, 860-921(15 February 2001)doi:10.1038/35057062http://www.nature.com/nature/journal/v409/n6822/images/409860ac.2.jpg
  • 43. • Science 16 February 2001: Vol. 291. no. 5507, pp. 1304 - 1351 DOI: 10.1126/science.1058040• REVIEW• The Sequence of the Human Genome• J. Craig Venter,1* Mark D. Adams,1 Eugene W. Myers,1 Peter W. Li,1 Richard J. Mural,1 Granger G. Sutton,1 Hamilton O. Smith,1 Mark Yandell,1 Cheryl A. Evans,1Robert A. Holt,1 Jeannine D. Gocayne,1 Peter Amanatides,1 Richard M. Ballew,1 Daniel H. Huson,1 Jennifer Russo Wortman,1 Qing Zhang,1Chinnappa D. Kodira,1 Xiangqun H. Zheng,1 Lin Chen,1 Marian Skupski,1 Gangadharan Subramanian,1 Paul D. Thomas,1 Jinghui Zhang,1George L. Gabor Miklos,2 Catherine Nelson,3 Samuel Broder,1 Andrew G. Clark,4 Joe Nadeau,5 Victor A. McKusick,6 Norton Zinder,7 Arnold J. Levine,7Richard J. Roberts,8 Mel Simon,9 Carolyn Slayman,10 Michael Hunkapiller,11 Randall Bolanos,1 Arthur Delcher,1 Ian Dew,1 Daniel Fasulo,1 Michael Flanigan,1Liliana Florea,1 Aaron Halpern,1 Sridhar Hannenhalli,1 Saul Kravitz,1 Samuel Levy,1 Clark Mobarry,1 Knut Reinert,1 Karin Remington,1 Jane Abu-Threideh,1Ellen Beasley,1 Kendra Biddick,1 Vivien Bonazzi,1 Rhonda Brandon,1 Michele Cargill,1 Ishwar Chandramouliswaran,1 Rosane Charlab,1 Kabir Chaturvedi,1Zuoming Deng,1 Valentina Di Francesco,1 Patrick Dunn,1 Karen Eilbeck,1 Carlos Evangelista,1 Andrei E. Gabrielian,1 Weiniu Gan,1 Wangmao Ge,1Fangcheng Gong,1 Zhiping Gu,1 Ping Guan,1 Thomas J. Heiman,1 Maureen E. Higgins,1 Rui-Ru Ji,1 Zhaoxi Ke,1 Karen A. Ketchum,1 Zhongwu Lai,1 Yiding Lei,1Zhenya Li,1 Jiayin Li,1 Yong Liang,1 Xiaoying Lin,1 Fu Lu,1 Gennady V. Merkulov,1 Natalia Milshina,1 Helen M. Moore,1 Ashwinikumar K Naik,1Vaibhav A. Narayan,1 Beena Neelam,1 Deborah Nusskern,1 Douglas B. Rusch,1 Steven Salzberg,12 Wei Shao,1 Bixiong Shue,1 Jingtao Sun,1 Zhen Yuan Wang,1Aihui Wang,1 Xin Wang,1 Jian Wang,1 Ming-Hui Wei,1 Ron Wides,13 Chunlin Xiao,1 Chunhua Yan,1 Alison Yao,1 Jane Ye,1 Ming Zhan,1 Weiqing Zhang,1Hongyu Zhang,1 Qi Zhao,1 Liansheng Zheng,1 Fei Zhong,1 Wenyan Zhong,1 Shiaoping C. Zhu,1 Shaying Zhao,12 Dennis Gilbert,1 Suzanna Baumhueter,1Gene Spier,1 Christine Carter,1 Anibal Cravchik,1 Trevor Woodage,1 Feroze Ali,1 Huijin An,1 Aderonke Awe,1 Danita Baldwin,1 Holly Baden,1 Mary Barnstead,1Ian Barrow,1 Karen Beeson,1 Dana Busam,1 Amy Carver,1 Angela Center,1 Ming Lai Cheng,1 Liz Curry,1 Steve Danaher,1 Lionel Davenport,1 Raymond Desilets,1Susanne Dietz,1 Kristina Dodson,1 Lisa Doup,1 Steven Ferriera,1 Neha Garg,1 Andres Gluecksmann,1 Brit Hart,1 Jason Haynes,1 Charles Haynes,1 Cheryl Heiner,1Suzanne Hladun,1 Damon Hostin,1 Jarrett Houck,1 Timothy Howland,1 Chinyere Ibegwam,1 Jeffery Johnson,1 Francis Kalush,1 Lesley Kline,1 Shashi Koduru,1Amy Love,1 Felecia Mann,1 David May,1 Steven McCawley,1 Tina McIntosh,1 Ivy McMullen,1 Mee Moy,1 Linda Moy,1 Brian Murphy,1 Keith Nelson,1Cynthia Pfannkoch,1 Eric Pratts,1 Vinita Puri,1 Hina Qureshi,1 Matthew Reardon,1 Robert Rodriguez,1 Yu-Hui Rogers,1 Deanna Romblad,1 Bob Ruhfel,1Richard Scott,1 Cynthia Sitter,1 Michelle Smallwood,1 Erin Stewart,1 Renee Strong,1 Ellen Suh,1 Reginald Thomas,1 Ni Ni Tint,1 Sukyee Tse,1 Claire Vech,1Gary Wang,1 Jeremy Wetter,1 Sherita Williams,1 Monica Williams,1 Sandra Windsor,1 Emily Winn-Deen,1 Keriellen Wolfe,1 Jayshree Zaveri,1 Karena Zaveri,1Josep F. Abril,14 Roderic Guigó,14 Michael J. Campbell,1 Kimmen V. Sjolander,1 Brian Karlak,1 Anish Kejariwal,1 Huaiyu Mi,1 Betty Lazareva,1 Thomas Hatton,1Apurva Narechania,1 Karen Diemer,1 Anushya Muruganujan,1 Nan Guo,1 Shinji Sato,1 Vineet Bafna,1 Sorin Istrail,1 Ross Lippert,1 Russell Schwartz,1Brian Walenz,1 Shibu Yooseph,1 David Allen,1 Anand Basu,1 James Baxendale,1 Louis Blick,1 Marcelo Caminha,1 John Carnes-Stine,1 Parris Caulk,1Yen-Hui Chiang,1 My Coyne,1 Carl Dahlke,1 Anne Deslattes Mays,1 Maria Dombroski,1 Michael Donnelly,1 Dale Ely,1 Shiva Esparham,1 Carl Fosler,1 Harold Gire,1Stephen Glanowski,1 Kenneth Glasser,1 Anna Glodek,1 Mark Gorokhov,1 Ken Graham,1 Barry Gropman,1 Michael Harris,1 Jeremy Heil,1 Scott Henderson,1Jeffrey Hoover,1 Donald Jennings,1 Catherine Jordan,1 James Jordan,1 John Kasha,1 Leonid Kagan,1 Cheryl Kraft,1 Alexander Levitsky,1 Mark Lewis,1Xiangjun Liu,1 John Lopez,1 Daniel Ma,1 William Majoros,1 Joe McDaniel,1 Sean Murphy,1 Matthew Newman,1 Trung Nguyen,1 Ngoc Nguyen,1 Marc Nodell,1Sue Pan,1 Jim Peck,1 Marshall Peterson,1 William Rowe,1 Robert Sanders,1 John Scott,1 Michael Simpson,1 Thomas Smith,1 Arlan Sprague,1Timothy Stockwell,1 Russell Turner,1 Eli Venter,1 Mei Wang,1 Meiyuan Wen,1 David Wu,1 Mitchell Wu,1 Ashley Xia,1 Ali Zandieh,1 Xiaohong Zhu1
  • 44. • A 2.91-billion base pair (bp) consensus sequence of the euchromatic portion of the human genome was generated by the whole-genome shotgun sequencing method. The 14.8-billion bp DNA sequence was generated over 9 months from 27,271,853 high-quality sequence reads (5.11-fold coverage of the genome) from both ends of plasmid clones made from the DNA of five individuals. Two assembly strategies--a whole-genome assembly and a regional chromosome assembly--were used, each combining sequence data from Celera and the publicly funded genome effort. The public data were shredded into 550-bp segments to create a 2.9-fold coverage of those genome regions that had been sequenced, without including biases inherent in the cloning and assembly procedure used by the publicly funded group. This brought the effective coverage in the assemblies toeightfold, reducing the number and size of gaps in the final assembly over what would be obtained with 5.11-fold coverage. The two assembly strategies yielded very similar results that largely agree with independent mapping data. The assemblies effectively cover the euchromatic regions of the human chromosomes. More than 90% of the genome is in scaffold assemblies of 100,000 bp or more, and 25% of the genome is in scaffolds of 10 million bp or larger. Analysis of the genome sequence revealed 26,588 protein-encoding transcripts for which there was strong corroborating evidence and an additional ~12,000 computationally derived genes with mouse matches or other weak supporting evidence. Although gene-dense clusters are obvious, almost half the genes are dispersed in low G+C sequence separated by large tracts of apparently noncoding sequence. Only 1.1% of the genome is spanned by exons, whereas 24% is in introns, with 75% of the genome being intergenic DNA. Duplications of segmental blocks, ranging in size up to chromosomal lengths, are abundant throughout the genome and reveal a complex evolutionary history. Comparative genomic analysis indicates vertebrate expansions of genes associated with neuronal function, with tissue-specific developmental regulation, and with the hemostasis and immune systems. DNA sequence comparisons between the consensus sequence and publicly funded genome data provided locations of 2.1 million single-nucleotide polymorphisms (SNPs). A random pair of human haploid genomes differed at a rate of 1 bp per 1250 on average, but there was marked heterogeneity in the level of polymorphism across the genome. Less than 1% of all SNPs resulted in variation in proteins, but the task of determining which SNPs have functional consequences remains an open challenge.
  • 45. Fig. 2. Flow diagram for sequencing pipeline. Samples are received, selected, and processed in compliance with standard operating procedures, with a focus on quality within and across departments. Each process has defined inputs and outputs with the capability to exchange samples and data with both internal and external entities according to defined quality guidelines. Manufacturing pipeline processes, products, quality control measures, and responsible parties are indicated and are described further in the text.J. C. Venter et al., Science 291, 1304 -1351 (2001)
  • 46. http://genome.ucsc.edu/cgi-bin/hgTracks?org=human
  • 47. Registro de PubMedhttp://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html
  • 48. OMICS• Los estudios “omics” están involucrados en el análisis de cantidades grandes de parámetros, generalmente proteínas (proteomics), lípidos (lipidomics) y metabolitos (metabolomics). El término “omics” deriva del sufijo griego “ome” que significa muchos o masa. Las mediciones se hacen a base de marcadores químicos que son indicativos de algún evento biológico (biomarkers). Los valores asociados con los parámetros medidos son investigados con el fin de encontrar una correlación con enfermedades. Cuando los objetos de investigación son proteinas, genes y metabolitos, las aproximaciones correspondientes son proteomics, genomics y metabolommics.• En años recientes, con el desarrollado de métodos para medir y analizar un número muy grande de analitos de una sola muestra, se ha popularizado las investigaciones que intentan medir miles de parámetros en vez de sólo unos cuantos. Esta aproximación es la que dio pie a los experimentos modernos de “omics.”• La meta final de las aproximaciones “omics” es comprender comprehensiva e integralmente los procesos biológicos, mediante la identificación y correlación de varios “jugadores” (e.g. genes, RNA, proteínas, metabolitos) en vez de estudiar cada uno de ellos de manera individual.• Lamentablemente, un estudio sobre la probabilidad de reproducir investigaciones en "genomics" (asociar grupos de genes con enfermedades complejas), en el cual se compararon 370 estudios, reveló una alta frecuencia de investigaciones subsecuentes que no confirmaban los descubrimientos iniciales. Debido al enorme número de mediciones y el número limitado de muestras de investigación, surgen problemas relacionados a la estadística, el sesgo, la metodología y el uso inadecuado del método.•• Layjr, J., Liyanage, R., Borgmann, S., & Wilkins, C. (2006). Problems with the “omics”. TrAC Trends in Analytical Chemistry, 25(11), 1046-1056. doi: 10.1016/j.trac.2006.10.007.
  • 49. OMIC’S ARTICULOGenomics Genomics: buzzword or reality? http://view.ncbi.nlm.nih.gov/pubmed/10343163Metabolomics Metabolomic http://www.benthamdirect.org/pages/content.php?CDM/2008/00000009/00000001/0011F.SGMProteomics Proteomics http://dx.doi.org/10.1097/01.mnh.0000079691.89474.eeTranscriptomics Transcriptomics http://view.ncbi.nlm.nih.gov/pubmed/18336229Vaccinomics Vaccinomics http://www.gtmb.org/VOL12B/PDF/16._Gomase_&_Tagore,_141-146.pdfOncogenomics Oncogenomics http://www.ncbi.nlm.nih.gov/pubmed/18336222Pharmacogenomics Pharmacogenomics http://www.ncbi.nlm.nih.gov/pubmed/18336223Epigenomics Epigenomics. http://www.ncbi.nlm.nih.gov/pubmed/18336226Toxicogenomics Toxicogenomics. http://www.ncbi.nlm.nih.gov/pubmed/18336230Kinomics Kinomics http://www.ncbi.nlm.nih.gov/pubmed/18336231Physiomics Physiomics http://www.ncbi.nlm.nih.gov/pubmed/18336232Cytomics Cytomics http://www.ncbi.nlm.nih.gov/pubmed/18336233Postgenomics Tracking the shift to postgenomics http://dx.doi.org/10.1159/000092656Glycomics Probing glycomics http://dx.doi.org/10.1016/j.cbpa.2006.11.040Lipidomics Lipidomics is emerging. http://view.ncbi.nlm.nih.gov/pubmed/14643793Cellunomic Cellunomics: the interaction analysis of cells http://view.ncbi.nlm.nih.gov/pubmed/19887340Phylogenomics Phylogenomics: evolution and genomics intersection http://view.ncbi.nlm.nih.gov/pubmed/19778869
  • 50. http://biiiogeek.blogspot.com/http://laylamichanunam.blogspot.com/
  • 51. • Este proyecto se lleva a cabo gracias al financiamiento de: DGAPA, UNAM Proyecto PAPIME PE 201509
  • 52. Agradecimientos• Laura Montoya• Lourdes Valencia• Fernando Galicia• Roberto Calderón• Lyssania Macías
  • 53. No se nos ha escapado a nuestra atención que cuánto más exploramos el genoma humano,más nos queda por explorar. "No cesaremos de explorar. Pues al final de toda exploraciónllegaremos donde empezamos, y conoceremos cuál es nuestro lugar por primera vez“ Thomas Stearns, Eliot, 2001