Successfully reported this slideshow.
Your SlideShare is downloading. ×

CONSORCIO ONTOLOGÍA DE GENES: herramientas para anotación funcional

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Loading in …3
×

Check these out next

1 of 75 Ad

CONSORCIO ONTOLOGÍA DE GENES: herramientas para anotación funcional

Download to read offline

Esta presentación contiene información impartida durante el curso de Ontología de Genes en BIOS. Los temas de la charla incluyen una descripción de la estructura de la ontología, cómo se construyen los términos y porqué es necesario usar ontologías. También discutimos los análisis estadísticos de enriquecimiento y representación de términos. Los ejercicios son parte del entrenamiento del grupo de GOA en EMBL-EBI.
La presentación fue dada en Español.

Esta presentación contiene información impartida durante el curso de Ontología de Genes en BIOS. Los temas de la charla incluyen una descripción de la estructura de la ontología, cómo se construyen los términos y porqué es necesario usar ontologías. También discutimos los análisis estadísticos de enriquecimiento y representación de términos. Los ejercicios son parte del entrenamiento del grupo de GOA en EMBL-EBI.
La presentación fue dada en Español.

Advertisement
Advertisement

More Related Content

Viewers also liked (20)

Similar to CONSORCIO ONTOLOGÍA DE GENES: herramientas para anotación funcional (20)

Advertisement

More from Monica Munoz-Torres (19)

Recently uploaded (20)

Advertisement

CONSORCIO ONTOLOGÍA DE GENES: herramientas para anotación funcional

  1. 1. CONSORCIO ONTOLOGÍA DE GENES: 
 herramientas para anotación funcional Mónica Muñoz-Torres | @monimunozto
 
 For the Gene Ontology Consortium. Also at BBOP: Christopher Mungall, Seth Carbon, Heiko Dietze, Jeremy Nguyen, Nicole Washington, Nathan Dunn, and Suzanna E. Lewis (PI). 
 Berkeley Bioinformatics Open-Source Projects
 Environmental Genomics & Systems Biology Division 
 Lawrence Berkeley National Laboratory
 
 BIOS. Manizales, Colombia, 22-Sep-2015
  2. 2. EQUIPOS DE DESARROLLADORES APOLLO DEVELOPERS 2 h " p : / / G e n e O n t o l o g y . o r g   Nathan Dunn Suzi Lewis Principal Investigator BBOP   Moni Munoz-TorresChris Mungall Nicole WashingtonHeiko Dietze Seth Carbon Jeremy Nguyen ... and a few hundred of our closest friends at the GOC. UniProt-GOA team at EMBL-EBI Rachael Huntley Now at UCL Tony Swafford Maria Martin Claire O’Donovan Team Leader Paul Thomas (PI) Huaiyu Mi PANTHER DB University of Southern California
  3. 3. CONTENIDO
 •  Hoy   descubriremos   cómo   u/lizar   la   ontología   de   genes   de   una   forma   más   eficiente,   y   descubriremos   algunas   herramientas   para   su  acceso.   GENE  ONTOLOGY  CONSORTIUM   herramientas  para  anotación  funcional.   3OUTLINE
  4. 4. Ayer…  
  5. 5. 5 El mapa del genoma Introduction Diseño & muestreo Análisis comparativos Colección consenso de genes Anotación manual Anotación automatizada Secuenciación Ensamblaje Síntesis & publicación QC QC QC QC QCQC QC
  6. 6. ANOTACION DE GENOMAS
 requiere precisión y profundidad Anotaciones con Precisión 6 La  colección  de  genes  de  cada  organismo  informa  una  variedad  de  análisis:   •  Número  de  genes,  %  GC,  composición  de  TEs,  áreas  repe//vas   •  Asignar  función   •  Evolución  molecular,  conservación  de  secuencias   •  Familias  de  genes   •  Caminos  metabólicos   •  ¿Qué  hace  único  a  cada  organismo?     ¿Qué  hace  “abeja”  a  una  abeja?   Marbach et al. 2011. Nature Methods | Shutterstock.com | Alexander Wild
  7. 7. 7 BIOCURACION
 ajustes estructurales y funcionales Iden/ficar  los  elementos  del  genoma   que  mejor  representan  la  biología   subyacente  y  eliminar  los  elementos   que  reflejan  errores  sistémicos  de  los   análisis  automa/zados.   Asignar  funciones  a  través  de  análisis   compara/vos  entre  elementos   genómicos  similares  de  organismos   cercanamente  relacionados  usando   literatura,  bases  de  datos,  y  datos   experimentales.   BIOCURACION hTp://GeneOntology.org   1   2  
  8. 8. ANOTACION
 un ejercicio en colaboración COLABORANDO 8 Los  inves5gadores  usualmente  buscamos  las   opiniones  y  percepciones  de  colegas  con   experiencia  en  áreas  específicas  del   conocimiento.     Por  ejemplo,  dominios  conservados     o  familias  de  genes.  
  9. 9. Precisión:     mejorando  la  anotación  estructural.  
  10. 10. Apollo
 una herramienta para editar anotaciones 10 v  En  la  web,  integrado  con  JBrowse.   v  ¡Permite  la  colaboración  en  /empo  real!   v  Automá/camente  genera  datos  en     formatos  comunes  para  análisis.   v  Anotación  de  genes,  pseudogenes,  tRNAs,     snRNAs,  snoRNAs,  ncRNAs,  miRNAs,  TEs,  y  fragmentos  repe//vos.   v  Funciones  intui/vas  y  menús  desplegables  crean  y  editan  estructuras   de  transcritos  y  exones,  insertan  comentarios  (CV,  texto  libre),  y   términos  de  GO,  etc.   INTRODUCING APOLLO hTp://GenomeArchitect.org/  
  11. 11. Profundidad:     anotación  funcional.  
  12. 12. LA ONTOLOGIA DE GENES
 anotación funcional The Gene Ontology 12 •   GO  es  una  forma  de  capturar  el   conocimiento  biológico  para   productos  de  genes  individuales  de   forma  computable,  usando   ontologías.     •   Es  un  grupo  de  conceptos,  y  las   relaciones  entre  ellos,  arreglados   como  una  jerarquía  (no  linear).     •   GOC  genera  recursos  que  puedan   ser  usados  para  asignar  funciones  a   los  genes  de  interés,  usando  GO.   Conceptos  menos  específicos   Conceptos  más  específicos  
  13. 13. LAS ONTOLOGIAS
 todos para uno… DEMO 13 3.  Componente  Celular   Donde  se  localiza  el  producto  de  gen   •   mitocondria     •   matriz  mitocondrial   •   membrana  interna          mitocondrial   1.  Función  Molecular   Una  ac/vidad,  tarea,     o  trabajo  elementales   •   Ac/vidad  de  proteína   quinasa   • Ac/vidad  de  receptor  de   insulina   2.  Proceso  Biológico   Una  serie  de  eventos   comúnmente  reconocidos   •   División  celular   Mitochondrion. PaisekaScience Photo Library Insulin Receptor Petrus et al, 2009, ChemMedChem| End of Telophase. Lothar Schermelleh
  14. 14. ANATOMIA  DE  UN  TERMINO  DE  GO   DEMO   14   ID  único   Nombre  del  término   Ontología   Sinónimo   Definición   Información  relacionada   con  el  término.  
  15. 15. ONTOLOGIA  DE  GENES   estructura   DEMO   15   •   Grafo  acíclico  dirigido   -­‐  Un  término  puede  tener  más  de  un  “parental”   •   Los  términos  están  unidos  por  relaciones   is_a        es_un   part_of      parte_de   regulates  (&  +/-­‐)  regula  (&+/-­‐)   occurs_in    ocurre_en   has_part      5ene_parte   Estas  relaciones  permiten  análisis  complejos  de  conjuntos  de  datos  de  gran  envergadura   -­‐  Un  término  puede  tener  más  de  un  “hijo”  
  16. 16. GO ANNOTATIONS 16 ¿DÓNDE ESTAN LAS ANOTACIONES? hTp://www.ebi.ac.uk/GOA/downloads.html   1.  Si/o  de  internet  del  Consorcio  de  GO   Los  archivos  de  anotación  guardan   información  acerca  de  cada   asociación  entre  un  producto     de  gen  y  un  término.     Archivo  de   anotación  por   cada  especie.   hTp://GeneOntology.org/    
  17. 17. GO ANNOTATIONS 17 hTp://www.ebi.ac.uk/GOA/downloads.html   2.  Si/o  de  internet  de  UniProt-­‐GOA   Los  archivos  de  anotación  guardan   información  acerca  de  cada   asociación  entre  un  producto     de  gen  y  un  término.     Archivo  de   anotación  por   cada  especie.   hTp://www.ebi.ac.uk/GOA     ¿DÓNDE ESTAN LAS ANOTACIONES?
  18. 18. GO ANNOTATIONS 18 hTp://www.ebi.ac.uk/GOA/downloads.html   3.  UniProtKB   Anotaciones  con   términos  de  GO  para   cada  producto  de  gen.   hTp://www.uniprot.org/uniprot/     ¿DÓNDE ESTAN LAS ANOTACIONES?
  19. 19. GO ANNOTATIONS 19 hTp://www.ebi.ac.uk/GOA/downloads.html   4.  Ensembl   hTp://www.ensembl.org/     ¿DÓNDE ESTAN LAS ANOTACIONES?
  20. 20. GO ANNOTATIONS 20 hTp://www.ebi.ac.uk/GOA/downloads.html   5.  NCBI  Gene   hTp://www.ncbi.nlm.nih.gov/gene/     ¿DÓNDE ESTAN LAS ANOTACIONES?
  21. 21. GO BROWSERS 21 NAVEGADORES PARA GO hTp://www.ebi.ac.uk/GOA/downloads.html   hTp://amigo.geneontology.org/     Grebe:  interface  de  asistencia   para  AmiGO2  con  opción  para   “llenar  el  espacio  en  blanco”.   GOOSE:  interrogar  la   base  de  datos  de  GO   usando  SQL.   Servicio  de  análisis  de   representación  de   términos.   Generado  por  PANTHER   Búsqueda  simple:  con   auto-­‐completar.  
  22. 22. GO BROWSERS 22 NAVEGANDO GO hTp://www.ebi.ac.uk/GOA/downloads.html   Búsqueda  simple:     busca  términos  GO  o  proteínas;   con  auto-­‐completar.   InvesUga  GO  Slims:     Visualización  enfocada  de   ciertas  porciones  de  GO.   hTp://www.ebi.ac.uk/QuickGO/     Encuentra  conjuntos  de   anotaciones  GO:     Con  filtros  para  generar   subconjuntos  de   anotaciones.  
  23. 23. Ejercicios 23 EJERCICIO hTp://www.ebi.ac.uk/GOA/downloads.html   hTp://www.ebi.ac.uk/QuickGO/     Ejercicio  1.   Buscando  un  término  GO.   Ejercicio  1  en  página  15.  
  24. 24. ¿Porqué  necesitamos  GO?  
  25. 25. RAZONES PARA QUE EXISTA GO Razones 25 •  Inconsistencia  en  el  lenguaje:  Inglés    
  26. 26. INCONSISTENCIA EN EL LENGUAJE: INGLÉS Razones 26 •  El  mismo  nombre  para  conceptos  diferentes   Cell   o   ???   www.robertpaterson.com www.biology.usf.edu
  27. 27. INCONSISTENCIA EN EL LENGUAJE: INGLÉS Razones 27 •  Nombres  diferentes  para  el  mismo  concepto   Eggplant   Lo  mismo  es  cierto  cuando  se  trata  de  conceptos  biológicos:   •  Esto  dificulta  las  comparaciones,  par/cularmente  cuando  se   comparan  especies  o  bases  de  datos.   Aubergine   Brinjal   Melongene   www.care2.com
  28. 28. RAZONES PARA QUE EXISTA GO Razones 28 •  Inconsistencia  en  el  lenguaje:  Inglés   •  Creciente  can/dad  de  datos  biológicos  disponibles  
  29. 29. CRECIENTE CANTIDAD DE DATOS BIOLÓGICOS DISPONIBLES Razones 29 Una  búsqueda  con  “DNA  repair”  genera  más  de  80,000  resultados.   hTp://www.ncbi.nlm.nih.gov/pubmed/    
  30. 30. RAZONES PARA QUE EXISTA GO Razones 30 •  Inconsistencia  en  el  lenguaje:  Inglés   •  Creciente  can/dad  de  datos  biológicos  disponibles   •  Creciente  can/dad  de  datos  biológicos  aún  por   venir  
  31. 31. CRECIENTE CANTIDAD DE DATOS BIOLÓGICOS AÚN POR VENIR Razones 31 Expansión  de  la  información  en  pares  de  bases.   http://www.ncbi.nlm.nih.gov/
  32. 32. RAZONES PARA QUE EXISTA GO Razones 32 •  Inconsistencia  en  el  lenguaje:  Inglés   •  Creciente  can/dad  de  datos  biológicos  disponibles   •  Creciente  can/dad  de  datos  biológicos  que  aún   están  por  venir   •  Conjuntos  de  datos  enormes  necesitan  ser   interpretados  rápidamente    
  33. 33. OBJETIVOS DEL PROYECTO GO Razones 33 •  Compilar  las  ontologías   -­‐  Actualmente  hay  más  de  41,000  términos   -­‐  Aumentando  y  mejorando  constantemente   •  Anotar  productos  de  genes  usando  términos  de  ontología   -­‐  Unos  30  grupos  contribuyen  anotaciones   •  Proveer  un  recurso  público  de  datos  y  herramientas   -­‐  Lanzamientos  regulares  de  archivos  con  anotaciones   -­‐  Herramientas  para  navegar  e  interrogar  las  anotaciones  y   también  para  editar  las  anotaciones.  
  34. 34. Reactome PAMGO  
  35. 35. Anotación  con  GO  
  36. 36. UNA ANOTACION GO ES... Anotación 36 ...  una  declaración  que  dice  que  el  producto  de  un  gen:     1.  /ene  una  función  molecular  par/cular     o,  está  involucrado  en  un  proceso  biológico   o,  está  localizado  en  cierto  componente  celular     2.  lo  que  ha  sido  determinado  por  un  método  par/cular     3.  y  ha  sido  descrito  en  una  referencia  en  especial  
  37. 37. INCORPORANDO ANOTACIONES Anotación 37 Las  anotaciones  GO  se  pueden  incorporar  usando  dos  métodos:   1.  Anotación  Electrónica   •  Una  forma  rápida  de  producir  un  gran  número  de   anotaciones   •  Las  anotaciones  usan  términos  GO  menos  específicos   •  La  única  fuente  de  anotación  para  muchos  de  los   organismos  no  modelo  (non-­‐MODs).   2.  Anotación  Manual   •  Este  proceso  toma  /empo  y  produce  un  menor   número  de  anotaciones   •  Las  anotaciones  /enden  a  usar  términos  GO   muy  específicos  
  38. 38. 1. ANOTACION ELECTRONICA Anotación 38 1.1  Mapeo  de  conceptos  externos  a  términos  GO   GO:0005634:  Nucleus   GO:0004707:  MAP  kinase  ac/vity   GO:0009734:  Auxin-­‐ac/vated  signaling  pathway  
  39. 39. 1. ANOTACION ELECTRONICA Anotación 39 1.2  Transferencia  automá/ca  de  anotaciones  electrónicas  a  ortólogos   e.g.  Humano   Macaco   Ratón   Chimpancé   Vaca   Cuy   Ratón   Rata   Pollo   ...  y  otros  más   Ensembl  compara   hTp://www.geneontology.org/cgi-­‐bin/references.cgi     Arabidopsis   Rice   Alamo   Maíz   Braquiaria   Uva   ...  y  otros  más   Ensembl  compara   Las  anotaciones  son  de  alta  calidad  e  incluyen  una  explicación  del  método  u/lizado  (ver  GO_REF)  
  40. 40. 2. ANOTACION MANUAL (en UniProt-GOA) Anotación 40 Anotaciones  específicas  y  de  alta  calidad  son  hechas  usando:       •  Aryculos  completos,  revisados  por  expertos   •  Un  rango  de  códigos  de  evidencia  (“evidence  codes”)  para   categorizar  los  /pos  de  evidencia  que  se  encuentran  en  un   aryculo.     E.g.  IDA,  IMP,  IPI  
  41. 41. NUMERO TOTAL DE ANOTACIONES UniProt-GOA Anotación 41 Anotaciones  electrónicas   Anotaciones  manuales*   213,536,891   2,865,245   31,499,149   432,005   Número  de  diferentes   productos  de  gen   *Incluye  anotaciones  manuales  integradas  de   grupos  externos  MOD  y  grupos  especializados.  
  42. 42. GO BROWSERS 42 NAVEGANDO GO hTp://www.ebi.ac.uk/GOA/downloads.html   Búsqueda  simple:     busca  términos  GO  o  proteínas;   con  auto-­‐completar.   InvesUga  GO  Slims:     Visualización  enfocada  de   ciertas  porciones  de  GO.   hTp://www.ebi.ac.uk/QuickGO/     Encuentra  conjuntos  de   anotaciones  GO:     Con  filtros  para  generar   subconjuntos  de   anotaciones.  
  43. 43. Ejercicios 43 EJERCICIO hTp://www.ebi.ac.uk/GOA/downloads.html   hTp://www.ebi.ac.uk/QuickGO/     Ejercicio  2.     Encuentra  anotaciones  para  una  proteína.  Ejercicio  2,   página  15.     Encuentra  anotaciones  para  una  lista  de  proteínas.   Ejercicios  1  y  2  pg.  20.  
  44. 44. Análisis.  
  45. 45. ¿PARA QUE SIRVE GO? ¿Para qué sirve la Ontología de Genes? 45 •  Acceder  a  información  funcional  de  productos  de  genes   •  Analizar  datos  genómicos  o  proteómicos  de  alto  rendimiento   •  Validación  de  técnicas  experimentales   •  Obtener  una  visión  general  de  las  funciones  de  un  proteoma   •  Obtener  información  funcional  para  nuevos  productos  de  genes   •  Etc…   Dutkowski et al 2013, Nature Biotechnology.
  46. 46. Enriquecimiento  &   representación.  
  47. 47. Interpretando experimentos “ómicos” de alto rendimiento Pruebas de representación y enriquecimiento 47 Escenarios:   •  Cuando  /enes  un  experimento  con  datos  de  todo  el  genoma,  e.g.:   •  Estudio  de  asociación  de  enfermedad  con  >100M  si/os  de   variantes  genómicas  diferentes   •  Experimento  de  RNA-­‐seq  que  cuan/fica  los  cambios  en  decenas   de  miles  de  genes  o  de  isoformos.   •  Etc.  
  48. 48. “ENRIQUECIMIENTO” Pruebas de representación y enriquecimiento 48 •  Es  el  método  más  común  para  interpretar  un  gran  número  de  medidas   individuales,  en  términos  de  la  biología  subyacente.   •  Determina  cuáles  términos  de  GO  están  más  comúnmente  asociados  con   una  lista  específica  de  genes  /  proteínas,  cuando  se  compara  con  una  lista   control  o  con  el  resto  del  genoma.     •  Conocido  en  inglés  como  “enrichment  analysis”  o  “pathway  analysis”.  
  49. 49. “ENRIQUECIMIENTO” Pruebas de representación y enriquecimiento 49 •  U/liza  información  conocida  acerca  de  la  función  de  un  gen  para  ver  si   hay  alguna  tendencia  estadís/ca  en  los  /pos  de  FUNCIONES  de  los   genes  muestran  cambios  en  el  experimento.     •  Hipótesis  de  trabajo:     •  Los  genes  el  en  mismo  subsistema  biológico  (“módulo”  o  “camino”)   /enden  a  estar  regulados  de  forma  coordinada,  o  a  tener  efectos   biológicos  similares  cuando  son  perturbados.  
  50. 50. VARIACIONES COMUNES DE ANALISIS DE ENRIQUECIMIENTO Pruebas de representación y enriquecimiento 50 Para  tener  en  cuenta:   •  Diferentes  pruebas  estadís/cas  requieren  diferentes  conjuntos  de  datos.     •  Hay  diferentes  “conjuntos  de  datos  de  anotación”  (“annota/on  sets”).   •  Si  se  observan  diferencias  en  los  resultados,  no  escoja  la  respuesta   que  más  le  gustaría  que  fuera  cierta,  sino  examine  los  resultados  para   entenderlos  bien.  
  51. 51. CONJUNTOS DE DATOS DE ANOTACION Pruebas de representación y enriquecimiento 51 •  Los  conjuntos  apropiados  dependen  de  la  pregunta  biológica   •  El  obje/vo  de  la  mayoría  de  análisis  de  datos  “ómicos”  es  iden/ficar   cambios  correlacionados  entre  grupos  de  genes  que  posiblemente   funcionan  juntos:  procesos  biológicos  de  GO  (incluyendo  caminos  /   pathways).   •  Los  análisis  de  enriquecimiento  iden/fican  diferentes  aspectos  de  la   ontología  de  genes.   •  Función  molecular,  componente  celular,  proceso  biológicos   •  Hay  diferentes  versiones  del  mismo  conjunto  de  datos:   •  Siempre  haz  uso  de  los  conjuntos  de  datos  más  recientes:  los  más   completos,  los  más  acertados.   •  Con  GO,  puedes  restringirte  a  un  subconjunto  de  /pos  de  evidencia  
  52. 52. DOS TIPOS PRINCIPALES DE PRUEBAS Pruebas de representación y enriquecimiento 52 •  “Suprarepresentación  /    Infrarepresentación”   •  ¿Considerando  mi  lista  de  genes,  hay  alguna(s)  clase(s)  funcional(es)  que   se  encuentre(n)  representada(s)  más  /  menos  frecuentemente  de  lo   esperado?     •  “Enriquecimiento”    (e.g.  Gene  Set  Enrichment  Analysis  (GSEA))   •  No  hay  una  lista.  En  cambio,  para  cada  gen  en  el  experimento  se  mide  y  se   computa  un  valor.   •  ¿Tienen  los  genes  de  una  clase  funcional  en  par5cular  una  distribución  de   valores  que  es  diferente  de  la  esperada?  
  53. 53. PRUEBA DE REPRESENTACION Pruebas de representación y enriquecimiento 53 •  Entrada   •  Una  lista  de  genes  de  interés.   •  Opcional,  pero  recomendado:  una  lista  de  referencia  de  genes  de  la  cuál   se  sacaron  los  genes  de  la  primera  lista.     ¿Se  ven  algunas  de  las  clases  funcionales  supra  (o  infra)  representadas  en   la  lista  comparada  con  lo  esperado  por  azar?     •  Salida       •  Enriquecimiento  /  disminución:  ¿Cuántos  más  (menos)  genes  de  cada   clase  hay  en  la  lista,  comparado  con  lo  esperado?   •  P-­‐value:  probabilidad  que  el  enriquecimiento  /  disminución  observado(a)   sea  significa/vamente  diferente  de  la  hipótesis  nula  de   NO  ENRIQUECIMIENTO  /  DISMINUCIÓN.  
  54. 54. PRUEBA DE REPRESENTACION Pruebas de representación y enriquecimiento 54 Lista  de  genes  como   referencia   Tu  lista  de  genes  de   interés   Es  necesario  definir:   •  Lista(s)  de  genes  de  interés   •  Lista  de  genes  como  referencia   EJEMPLO  1  
  55. 55. PRUEBA DE REPRESENTACION Pruebas de representación y enriquecimiento 55 Tu  lista  de  genes   como  referencia   Lista  de  genes   de  interés   Genes  anotados  con  un  término  GO   Genes  no  anotados  con  un  término  GO   ¿Está  la  clase  de  anotación  supra  o  infra   representada,  comparada  con  la  referencia?     EJEMPLO  1  
  56. 56. PRUEBA DE REPRESENTACION Pruebas de representación y enriquecimiento 56 Por  cada  término  de  anotación:     ¿Hay  más  (supra)  o  menos  (infra)  genes  representados  en  la  lista  de   interés,  comparados  con  lo  esperado  por  azar?   EJEMPLO  2  
  57. 57. PRUEBA DE SUPRA / INFRA REPRESENTACIÓN Pruebas de representación y enriquecimiento 57 Tabal  de  conUngencia   P-­‐value   Conteo  de  genes  con   término  GO  en  el   conjunto  de  datos   Conteo  de  genes  sin   término  GO  en  el   conjunto  de  datos   Conteo  en  el  conjunto     (e.g.  genes  expresados   diferencialmente)     Conteo  en  conjunto  de   referencia  (e.g.  todos  los   genes  en  el  arreglo)     Test  exacto  de  Fisher   o  prueba  chi-­‐cuadrado   o  Bionomial   o  hipergeométrico   51   125   173   416   8588   9004   467   8713   9177   8  x  10-­‐52   EJEMPLO  2  
  58. 58. ANÁLISIS DE REPRESENTACIÓN DE TÉRMINOS Pruebas de representación y enriquecimiento 58 Para  MODs   Especie   Ontología   Corrección   Fuente  de  datos,   visualización.   Powered  by   h"p://www.pantherdb.org/   hTp://GeneOntology.org/     hTp://amigo.geneontology.org/     hTp://geneontology.org/page/go-­‐enrichment-­‐analysis    
  59. 59. ANÁLISIS DE REPRESENTACIÓN DE TÉRMINOS Pruebas de representación y enriquecimiento 59 hTp://www.ebi.ac.uk/interpro/search/sequence-­‐search     •  InterProScan   -­‐  Predice  términos  de  GO  basado  en   dominios  detectados  usando  nuestro   archivo  de  mapeo  InterPro-­‐2-­‐GO,  una   secuencia  a  la  vez.   hTp://geneontology.org/page/download-­‐mappings     -­‐  Descarga  e  instala  la  úl/ma  versión   de  InterProScan   Si  no  trabajas  con  MODs  
  60. 60. PRUEBA DE ENRIQUECIMIENTO Pruebas de representación y enriquecimiento 60 •  Entrada   •  Una  lista  de  genes  (tantos  como  sea  posible  para  obtener  buen  soporte   estadís/co!)  y  un  valor  cuan/ta/vo  para  cada  gen  (e.g.  medida  de   aumento  de  cambio,  “fold  change”).     •  Salida       •  La  probabilidad  que  la  distribución  de  los  valores  para  los  genes  en  cada   clase  de  GO  es  significa/vamente  diferente  de  la  distribución  de  valores   para  todos  los  genes.  
  61. 61. PRUEBA DE ENRIQUECIMIENTO Pruebas de representación y enriquecimiento 61 Tick  para  remover  el  uso   de  parámetros  por  defecto   h"p://www.pantherdb.org/  
  62. 62. PRUEBA DE ENRIQUECIMIENTO Pruebas de representación y enriquecimiento 62 Estadís/camente   compara  la   distribución  de  los   valores  para  todos   los  genes  en  cada   clase  de  anotación,   con  la  distribución   de  valores  para   todos  los  genes  en  el   experimento.   Enriquecimiento  en  un  conjunto  de  genes  -­‐     Gene  set  enrichment  (GSEA)  
  63. 63. RESUMEN FUNCIONAL
 GO slims Term Representation, so-called “Enrichment” 63 Para  conjuntos  de  datos  de  larga  envergadura:   •  Muchas  herramientas  de  análisis  de  GO  u/lizan  GO  slims  para  ofrecer  un   resumen  general  de  los  datos.   •   GO  slims  son  versiones  recortadas  de  GO  y  con/enen  un  subconjunto  de   los  términos  de  la  ontología  completa.     •   Usualmente  los  GO  slims  con/enen  términos  GO  menos  especializados  
  64. 64. ADELGAZANDO A GO CON LA REGLA DE “TRUE PATH” Term Representation, so-called “Enrichment” 64 Muchos  productos  de  genes  están  asociados  con   un  gran  número  de  nodos  finales  (leaf  nodes)  de   GO,  que  son  descrip/vos  en  detalle.  
  65. 65. ADELGAZANDO A GO CON LA REGLA DE “TRUE PATH” Term Representation, so-called “Enrichment” 65 ...  sin  embargo,  las  anotaciones  pueden  ser   mapeadas  a  conjuntos  más  pequeños  de  términos   de  GO:      
  66. 66. RESUMEN FUNCIONAL
 GO slims Term Representation, so-called “Enrichment” 66 •  Hay  GO  slims  personalizados  disponibles  para  especies  y  grupos  de  cierto   enfoque  en  hTp://geneontology.org/page/go-­‐slim-­‐and-­‐subset-­‐guide     •  Puedes  generar  tu  propio  GO  slim  usando  las  siguientes  herramientas:   •  hTp://www.ebi.ac.uk/QuickGO       •  hTp://go.princeton.edu/  
  67. 67. GO BROWSERS 67 NAVEGANDO GO hTp://www.ebi.ac.uk/GOA/downloads.html   Búsqueda  simple:     busca  términos  GO  o  proteínas;   con  auto-­‐completar.   InvesUga  GO  Slims:     Visualización  enfocada  de   ciertas  porciones  de  GO.   hTp://www.ebi.ac.uk/QuickGO/     Encuentra  conjuntos  de   anotaciones  GO:     Con  filtros  para  generar   subconjuntos  de   anotaciones.  
  68. 68. Ejercicios 68 EJERCICIO hTp://www.ebi.ac.uk/GOA/downloads.html   hTp://www.ebi.ac.uk/QuickGO/     Ejercicio  3.     Uso  de  GO  slims  en  QuickGO.  Ejercicio  1,  página  27.  
  69. 69. PRECAUCIONES AL USAR GO Term Representation, so-called “Enrichment” 69 •  La  Ontología  de  Genes  cambia  constantemente  y  nuevas  anotaciones  son   creadas  con/nuamente:     •  ¡Siempre  usa  las  versiones  más  actualizadas  de  ambas!   •  Cuando  publiques  tus  análisis,  cita  al  GOC:   hTp://geneontology.org/page/go-­‐cita/on-­‐policy     •  Es  recomendable  remover  anotaciones  “NOT”  antes  de  conducir  análisis.   •  ~7K  /  141M  son  “NOT”   •  Pueden  causar  confusión  en  el  análisis  
  70. 70. PRECAUCIONES AL USAR GO Term Representation, so-called “Enrichment” 70 •  “Unannotated”  no  significa  “unknown”   •  Cuando  no  hay  evidencia  en  la  literatura  acerca  de  un  proceso,  función  o   localización,  el  producto  de  gen  se  anota  al  nodo  raíz  apropiado  en  la   ontología  con  un  código  de  evidencia  “ND”  (no  biological  data),  dis/nguiendo   así  entre  “unannotated”  y  “unknown”.   •  Pon  atención  a  la  infrarepresentación  de  términos  GO   •  Una  infrarepresentación  muy  notoria  para  un  camino  metabólico  puede   representar  que  es  necesario  tener  una  función  normal  de  este  camino  para  la   condición  específica  bajo  estudio.    
  71. 71. Otras  herramientas     para  el  uso  de  GO.  
  72. 72. PAINT
 Phylogenetic Annotation INference Tool PAINT 72 Datos   experimentales   Anotaciones   propagadas   (azul  oscuro)   PAINT   Propagación  de  anotaciones   basado  en  árboles   filogené/cos  construidos  con   familias  de  genes.  Trabaja   sobre  los  principios   evolu/vos  de  ancestro   común  y  divergencia.  
  73. 73. Noctua
 edición de modelos moleculares Noctua | LEGO 73 •  Edición  gráfica,  colaboraUva  para  colecciones   de  anotaciones  GO:  modelos  ‘LEGO’.   •  Los  usuarios  pueden  mover  y  adicionar   elementos.   •  Cada  nódulo  (caja)  es  una  función  o  proceso.   •  Todos  los  modelos  se  guardan  en  OWL  en   GitHub  (repo)  y  son  sincronizados  por  un   servidor  llamado  Minerva.   •  Se  puede  decir  mucho  más  en  un  modelo   LEGO  con  menos  esfuerzo  y  /empo  inver/do.  
  74. 74. CONTENIDO
 •  ESTRUCTURA  DE  GO   descripción  y  búsqueda     •  ANOTACION   ¿Cómo  se  anota  con  GO?     •  ANALISIS   Usos  de  GO   •  OTRAS  HERRAMIENTAS   PAINT  &  Noctua     CONSORCIO  ONTOLOGÍA  DE  GENES:     herramientas  para  anotación  funcional   74OUTLINE
  75. 75. •  Berkeley  BioinformaUcs  Open-­‐source  Projects  (BBOP),   Berkeley  Lab:  Apollo  and  Gene  Ontology  teams.  Suzanna   E.  Lewis  (PI).   •  The  members  of  the  Gene  Ontology  Consor/um.   •  Rachael  Huntley  &  Paul  Thomas  for  teaching  materials.   •  GO  is  supported  by  NIH  (NHGRI)  grant   5U41HG002273-­‐14  and  by  the  Director,  Office  of   Science,  Office  of  Basic  Energy  Sciences,  of  the  U.S.   Department  of  Energy  under  Contract  No.  DE-­‐ AC02-­‐05CH11231   •          •  For  your  a"enUon,  thank  you!   Thank you. 75 Suzanna  Lewis  (PI)   Chris  Mungall   Seth  Carbon   Heiko  Dietze   Jeremy  Nguyen   Nicole  Washington   Nathan  Dunn   Mis  colegas  en  BBOP   GO:  hTp://GeneOntology.org   ¡Gracias!  

×