PLATAFORMA
                                            ANDALUZA DE
                                            BIOINFORMÁT...
Vamos a situarnos...

Centro de Supercomputación y
    Bioinformática (UMA)                   Plataforma de Genómica,
    ...
Objetivos


• Poner a disposición del entorno Ciencia-Tecnología-
  Empresa andaluz la infraestructura, tecnología, y pers...
Funcionamiento
                                                Supercomputador
                                           ...
Acceso: www.scbi.uma.es
Acceso: www.scbi.uma.es




                     Identificación
Lo que se puede ver
Recursos bioinformáticos
Lo que se puede usar
GCG Accelrys
                          Bioconductor (R)
EMBOSS
                          ArrayHub
Seq...
Herramientas públicas (propias)
¿Quiénes lo usan?
             !




1 usuario

3 usuarios

   3 usuarios
                                           1 usu...
Frecuencia de uso
Resumen anual




                                    10 usuarios (25%)
                  Último mes
Se usa desde la zona privada
Las máquinas virtuales
Descarga de la máquina virtual
Uso de la máquina virtual
PLATAFORMA
                           ANDALUZA DE
                           BIOINFORMÁTICA




Las herramientas propias
SeqTrim




www.scbi.uma.es/seqtrim   Falgueras et al, 2007
SeqTrim is modular... and something more
                                                                                 ...
SeqTrim




          Falgueras et al, 2007
Browsing window




                  Falgueras et al, 2007
Browsing window




                  Falgueras et al, 2007
Browsing window




                  Falgueras et al, 2007
Browsing window




                  Falgueras et al, 2007
Browsing window




                  Falgueras et al, 2007
Browsing window




                  Falgueras et al, 2007
Browsing window




                  Falgueras et al, 2007
Browsing window




                  Falgueras et al, 2007
Utilizaciones de SeqTrim
                                         Porcentaje de nucleótidos recortados Porcentaje de lectu...
Full-Lengther




www.scbi.uma.es/full-lengther   Lara et al, 2007
Análisis de los resultados




                        N. Fernández-Pozo, 2008
AlignMiner




www.scbi.uma.es/alignminer
Trabajar con AlignMiner
Visualización de los resultados
InGeBiol: modelo general en Ruby
Nuestro uso de CAP3web




                                                           PIN                                 ...
Interfaz simplificada para MIRA2
El «gran proyecto»
PLATAFORMA
                                                                                             ANDALUZA DE
      ...
Investigación
• Úselo usted mismo
• Colaboración científica
 • Analizar resultados e interpretarlos
 • Diseño de bases de d...
Base de datos en Ruby
Base de datos en Ruby
Análisis de micromatrices 2C
                            •Datos normalizados
                            •Genes con expres...
Visualización de los datos 2C
    Datos orginales   Datos normalizados
Los genes candidatos
Calidad datos
                Genes con expresión diferencial
Interpretación funcional
                                                                                                 ...
Experimentos en serie
Análisis ANOVA




    Enriquecimiento biológico (análisis asociativo)
Un ejemplo de resultado
                       Cytosol
  Mitochondria




                                      !quot;#$qu...
Mejor normalización (Affymetrix)
              El mejor       El 2.º mejor
              Datos brutos
Variability




    ...
Mejor normalización (Affymetrix)
              El mejor       El 2.º mejor
              Datos brutos
Variability




    ...
Mejor normalización (Affymetrix)
              El mejor       El 2.º mejor
              Datos brutos




                ...
Mejor normalización (Affymetrix)
                El mejor       El 2.º mejor
                Datos brutos
correlation
Spea...
Mejor normalización (Affymetrix)
                El mejor       El 2.º mejor
                Datos brutos
correlation
Spea...
Ensamblaje de un BAC de pino

                                                        Pirosecuenciación
               Fra...
Estrategias de ensamblaje
                          Secuencias
    Otros
ensambladores
  probados
                   Newbl...
¿Qué contiene 176P12?



Fd-GOGAT




           Retroelement pol    Ty1-Copia element
            polyprotein-like
El gen Fd-GOGAT
Recursos humanos actuales
• 2 Ldo. en informática
 • Darío Guerrero Fernández
 • Antonio J. Lara Aparicio
• 2 Dr. en Biolo...
PLATAFORMA
SCBI   ANDALUZA DE
       BIOINFORMÁTICA
Upcoming SlideShare
Loading in …5
×

Presentación de la Plataforma Bioinformática de Andalucía.

1,341 views

Published on

Gonzalo Claros

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,341
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
10
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Presentación de la Plataforma Bioinformática de Andalucía.

  1. 1. PLATAFORMA ANDALUZA DE BIOINFORMÁTICA La Plataforma Andaluza de Bioinformática: cómo utilizar la bioinformática sin morir en el intento M. Gonzalo Claros Departamento de Biología Molecular y Bioquímica
  2. 2. Vamos a situarnos... Centro de Supercomputación y Bioinformática (UMA) Plataforma de Genómica, Proteómica y Biocomputación Plataforma Andaluza Genómica y Proteómica de Bioinformática (SCAI, UCO) Mare Nostrum HP SuperDome Investigación Soporte a los Red Española Plataforma usuarios (formación) de Super- Computacional Acceso a recursos computación de la UMA bioinformáticos
  3. 3. Objetivos • Poner a disposición del entorno Ciencia-Tecnología- Empresa andaluz la infraestructura, tecnología, y personal altamente cualificado para el acceso eficiente a las nuevas tecnologías denominadas «ómicas» • Potenciar a los grupos de investigación y unidades I+D+I al poner a su disposición las herramientas necesarias para incrementar su competitividad y proyección internacional, así como fomentar la transferencia de tecnología. BOE 172 del 20-7-2005, 25926-33
  4. 4. Funcionamiento Supercomputador SuperDome HP • Acceso a los programas sin necesidad de instalarlos. • Programas comerciales (garantizado por 5 años). • Espacio para almacenar datos, con backup. • Acceso a bases de datos comerciales. • Computación de altas prestaciones
  5. 5. Acceso: www.scbi.uma.es
  6. 6. Acceso: www.scbi.uma.es Identificación
  7. 7. Lo que se puede ver
  8. 8. Recursos bioinformáticos
  9. 9. Lo que se puede usar GCG Accelrys Bioconductor (R) EMBOSS ArrayHub SeqTrim ArrayUnlock Full-Lengther LitheMiner AlignMiner SpotFire Decisionsite Seq2ContigWF SYBYL Cap3 AMPAC MIRA2 Amber HyperChem Discovery Studio GE DeCyder Ingenuity Pathway (IPA) SpotFire Decisionsite Protein Loounge MatLab: • Simulink • Bioinformatics ToolBox • Simbiology
  10. 10. Herramientas públicas (propias)
  11. 11. ¿Quiénes lo usan? ! 1 usuario 3 usuarios 3 usuarios 1 usuario 19 usuarios 2 usuarios 19 usuarios
  12. 12. Frecuencia de uso Resumen anual 10 usuarios (25%) Último mes
  13. 13. Se usa desde la zona privada
  14. 14. Las máquinas virtuales
  15. 15. Descarga de la máquina virtual
  16. 16. Uso de la máquina virtual
  17. 17. PLATAFORMA ANDALUZA DE BIOINFORMÁTICA Las herramientas propias
  18. 18. SeqTrim www.scbi.uma.es/seqtrim Falgueras et al, 2007
  19. 19. SeqTrim is modular... and something more Several input formats Sequences (fasta) Seqs + Quals (fasta) chromatograms (abi, scf...) ZIP Phred Removing cloning vector Removing low quality seqs Trimming Vector Trimming Ns Trimming Low Qual Four modular functions Removing specialized features Removing contaminant seqs Trimming Adaptors Trimming Contaminants Trimming polyA | T Removing Additional artifacts Terminal tranferase Ending As, Ts, Ns, Xs Two sequential, optional functions Repeat Masker Maskering Repeats Dust Output formats for pipelining Sequences Info Qualities Falgueras et al, 2007
  20. 20. SeqTrim Falgueras et al, 2007
  21. 21. Browsing window Falgueras et al, 2007
  22. 22. Browsing window Falgueras et al, 2007
  23. 23. Browsing window Falgueras et al, 2007
  24. 24. Browsing window Falgueras et al, 2007
  25. 25. Browsing window Falgueras et al, 2007
  26. 26. Browsing window Falgueras et al, 2007
  27. 27. Browsing window Falgueras et al, 2007
  28. 28. Browsing window Falgueras et al, 2007
  29. 29. Utilizaciones de SeqTrim Porcentaje de nucleótidos recortados Porcentaje de lecturas afectadas 100 nt Reads 100 75 75 % Nucleótidos % Lecturas 50 50 99,65 • EST 85,63 70,68 25 25 • GEMINI 25,48 18,62 • PIN 5,34 0 0 Vector Adaptadores Baja calidad Indeterminaciones Contaminantes Vector Adaptadores Baja calidad Indeterminaciones Contaminantes • SSH • Compresión/lateral • Juvenil/madura • Secuenciación de ADNg • BAC de Pinus pinaster
  30. 30. Full-Lengther www.scbi.uma.es/full-lengther Lara et al, 2007
  31. 31. Análisis de los resultados N. Fernández-Pozo, 2008
  32. 32. AlignMiner www.scbi.uma.es/alignminer
  33. 33. Trabajar con AlignMiner
  34. 34. Visualización de los resultados
  35. 35. InGeBiol: modelo general en Ruby
  36. 36. Nuestro uso de CAP3web PIN GEMINI Iniciales Limpias Únicas Iniciales Limpias Únicas Porcentaje de Lecturas o Nucleótidos 120 120 Porcentaje de Lecturas o Nucleótidos 100 100 100 100 100 100 73,93 80 80 67,18 60 60 50,99 48,93 36,37 37,36 36,03 40 40 23,15 20 20 0 0 Lecturas Nucleótidos Lecturas Nucleótidos N. Fernández-Pozo, 2008
  37. 37. Interfaz simplificada para MIRA2
  38. 38. El «gran proyecto»
  39. 39. PLATAFORMA ANDALUZA DE BIOINFORMÁTICA Colaboración en investigación Spike 4 Spike 6 AS GEM-093-A05 Spike 4 GEM-085-C12 GEM-093-C02 GEM-078-C04 ASPG Spike 2 Spike 6 Spike 2 Genes candidatos GEM-026-H10 GEM-094-G04 PIN-5-F01 GEM-088-A07 GEM-105-C03 GEM-077-C08 PIN-9-A08 GEM-097-H03 GEM-002-F10 GEM-003-B08 gDNA pinaster GEM-100-H11 GEM-051-B04 CK16 1 B05 GEM-058-D04 CK16 2 F10 GEM-103-E10 GEM-020-C11 GEM-032-C07 GEM-108-C01 GEM-009-H07 NC/-N-C_a NC/-N-C_z -N-C/NC_a -N-C/NC_z Condiciones experimentales
  40. 40. Investigación • Úselo usted mismo • Colaboración científica • Analizar resultados e interpretarlos • Diseño de bases de datos, portales y algoritmos a medida • Desarrollo de flujos de trabajo estándares para la investigación • Socio bionformático para proyectos ómicos. • Ejemplos: • Proyecto piloto nacional para la secuenciación de Pinus pinaster (UMA. IP: Francisco M. Cánovas) • European Animal Disease Genomics Network of Excellence for animal health and food safety (UCO. IP: Juan José Garrido)
  41. 41. Base de datos en Ruby
  42. 42. Base de datos en Ruby
  43. 43. Análisis de micromatrices 2C •Datos normalizados •Genes con expresión Datos diferencial (GenePix, •Visualización de los QScan) resultados Script propio •Calidad de los datos
  44. 44. Visualización de los datos 2C Datos orginales Datos normalizados
  45. 45. Los genes candidatos Calidad datos Genes con expresión diferencial
  46. 46. Interpretación funcional Spike 4 Spike 4 Spike 6 Spike 6 AS AS myo-inositol oxygenase GEM-093-A05 GEM-093-A05 Spike 4 Spike 4 general substrate transporter GEM-085-C12 GEM-085-C12 stem-specific proteinexpressed GEM-093-C02 GEM-093-C02 seed imbibition protein GEM-078-C04 GEM-078-C04 ASPG ASPG Spike 2 Spike 2 Spike 6 Spike 6 Spike 2 Spike 2 Genes candidatos Genes candidatos ---NA--- GEM-026-H10 GEM-026-H10 aldose 1-epimerase GEM-094-G04 GEM-094-G04 PIN-5-F01 PIN-5-F01 stem-specific proteinexpressed GEM-088-A07 GEM-088-A07 ---NA--- GEM-105-C03 GEM-105-C03 stem-specific proteinexpressed GEM-077-C08 GEM-077-C08 catalase PIN-9-A08 PIN-9-A08 transaldolase GEM-097-H03 GEM-097-H03 glyoxalase bleomycin resistance protein dioxygenase GEM-002-F10 GEM-002-F10 ---NA--- GEM-003-B08 GEM-003-B08 gDNA pinaster gDNA pinaster ---NA--- GEM-100-H11 GEM-100-H11 ---NA--- GEM-051-B04 GEM-051-B04 CK16 1 B05 CK16 1 B05 ---NA--- GEM-058-D04 GEM-058-D04 CK16 2 F10 CK16 2 F10 acid phosphatase GEM-103-E10 GEM-103-E10 metallothionein-like protein GEM-020-C11 GEM-020-C11 ---NA--- GEM-032-C07 GEM-032-C07 GEM-108-C01 GEM-108-C01 ---NA--- GEM-009-H07 GEM-009-H07 NC/-N-C_a NC/-N-C_z NC/-N-C_a -N-C/NC_a NC/-N-C_z -N-C/NC_a -N-C/NC_z -N-C/NC_z NC/-N-C_z -N-C/NC_a -N-C/NC_z Condiciones experimentales iciones experimentales
  47. 47. Experimentos en serie Análisis ANOVA Enriquecimiento biológico (análisis asociativo)
  48. 48. Un ejemplo de resultado Cytosol Mitochondria !quot;#$quot;$% !quot;quot;#$ Plastid D.P. Villalobos 2008
  49. 49. Mejor normalización (Affymetrix) El mejor El 2.º mejor Datos brutos Variability Sólo la normalización no basta Normalizar disminuye variabilidad VSN se basa en disminuir variabilidad Pérez-Florido et al 2009
  50. 50. Mejor normalización (Affymetrix) El mejor El 2.º mejor Datos brutos Variability Sólo la normalización no basta Normalizar disminuye variabilidad VSN se basa en disminuir variabilidad Pérez-Florido et al 2009
  51. 51. Mejor normalización (Affymetrix) El mejor El 2.º mejor Datos brutos Los datos brutos tienen poca correlación Los otros métodos son parecidos RMA y GCRMA se basan en mejorar la correlación de los datos Variability Sólo la normalización no basta Normalizar disminuye variabilidad VSN se basa en disminuir variabilidad Pérez-Florido et al 2009
  52. 52. Mejor normalización (Affymetrix) El mejor El 2.º mejor Datos brutos correlation Spearman RMA es el que mejor se comporta VSN es una buena alternativa Los datos brutos tienen poca correlación Los otros métodos son parecidos RMA y GCRMA se basan en mejorar la correlación de los datos Variability Sólo la normalización no basta Normalizar disminuye variabilidad VSN se basa en disminuir variabilidad Pérez-Florido et al 2009
  53. 53. Mejor normalización (Affymetrix) El mejor El 2.º mejor Datos brutos correlation Spearman RMA es el que mejor se comporta VSN es una buena alternativa Los datos brutos tienen poca correlación Los otros métodos son parecidos RMA y GCRMA se basan en mejorar la correlación de los datos Variability Sólo la normalización no basta Normalizar disminuye variabilidad VSN se basa en disminuir variabilidad Pérez-Florido et al 2009
  54. 54. Ensamblaje de un BAC de pino Pirosecuenciación Fragmentación (media: 200 pb) Ensamblaje ADN pino Vector pIndigoBAC536 Genómico E. coli Allcontig Filtrado Largecontig ( > 500 pb)
  55. 55. Estrategias de ensamblaje Secuencias Otros ensambladores probados Newbler® SeqTrim SeqTrim PCAP Contig Cap3 MIRA2 Newbler® Contig Large EULER-SR contigs AmosValidate Celera SeqTrim Reliable contigs Assembler Estrategia FLX Estrategias
  56. 56. ¿Qué contiene 176P12? Fd-GOGAT Retroelement pol Ty1-Copia element polyprotein-like
  57. 57. El gen Fd-GOGAT
  58. 58. Recursos humanos actuales • 2 Ldo. en informática • Darío Guerrero Fernández • Antonio J. Lara Aparicio • 2 Dr. en Biología • Rocío Bautista Moreno • M. Gonzalo Claros Díaz (supervisión) • Otros colaboradores • Guillermo Pérez Trabado (supervisión) • Juan Falgueras (profesor) • Rafael Larrosa (gestor del sistema) • Noé Fernández Pozo (doctorando)
  59. 59. PLATAFORMA SCBI ANDALUZA DE BIOINFORMÁTICA

×