Rendre les standards de description de biopuces accessibles: réalisation d'un module de conversion inter-standard Pierre M...
Sommaire <ul><li>L’Institut  Européen  de Bioinformatique </li></ul><ul><ul><li>l’équipe  informatique Microarray </li></u...
S ervices   Banques de données R echerche  en bioinformatique et en biologie moleculaire Industrie Promouvoir des  standar...
 
S ervices   Banques de données R echerche  en bioinformatique et en biologie moleculaire Industrie Promouvoir des  standar...
l’équipe  Microarray   MicroArray Informatics Team <ul><li>les résultats d’expériences de biopuces  </li></ul><ul><li>Une ...
ArrayExpress
l’équipe  Microarray   MicroArray Informatics Team <ul><li>les expériences de biopuces  </li></ul><ul><li>-> petite équipe...
la standardisation ? <ul><li>Hétérogénéité des applications et des techniques </li></ul><ul><li>Des éléments non pris en  ...
Le projet <ul><li>Un constat : de plus en plus de données à traiter et un manque d’outils </li></ul><ul><li>Outil de conve...
Outil de conversion
Les descriptions d’agencement <ul><li>Informations initiales avant une expérience </li></ul><ul><ul><li>méta données   (co...
MAGE-ML (MAGE-OM)
MAGE-ML (suite)
Array Design File adh adr adc Header contacts Informations  techniques
Array Design File adr adc Feature  /Reporter Features Reporters
Array Design File Composite Caractéristiques Liens avec les reporters
Contribution <ul><li>Application </li></ul><ul><ul><li>indépendante (pas de DB) </li></ul></ul><ul><ul><li>Multi plateform...
Validation  (une étape obligatoire) <ul><li>Analyse syntaxique et lexicale des données </li></ul><ul><ul><li>Définition de...
Implémentation - choix techniques <ul><li>Utilisation de MAGE-stk (perl ou Java) </li></ul><ul><li>Simplicité d’installati...
Problèmes rencontrés <ul><li>Mémoire </li></ul><ul><ul><li>Beaucoup de données </li></ul></ul><ul><ul><li>Et leur redondan...
Une adresse :  http://www.ebi.ac.uk/adf http://www.ebi.ac.uk/adf/
Bilan <ul><li>Bilan pour l’équipe </li></ul><ul><ul><li>Premier outil de vérification complète des données de description ...
 
Upcoming SlideShare
Loading in...5
×

Presentation Dess Ebi

817

Published on

Published in: Travel, Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
817
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Stage bioinformatique
  • I nternational network of 5 research institutes dedicated to research and service in molecular biology es 2 subdivisions majeures de l&apos;EBI entre Recherche et Service (fournir de DB biologique). les autres roles de l&apos;EBI consistent a assurer une mission de formation (cours EMBO reguliers, 3 sessions annuelles pour les microarrays uniquement) ainsi que la presence d&apos;une section plus particulierement dediee au support et lien avec les industriels. (grands groupes mais aussi PME)
  • les 2 subdivisions majeures de l&apos;EBI entre Recherche et Service (fournir de DB biologique). les autres roles de l&apos;EBI consistent a assurer une mission de formation (cours EMBO reguliers, 3 sessions annuelles pour les microarrays uniquement) ainsi que la presence d&apos;une section plus particulierement dediee au support et lien avec les industriels. (grands groupes mais aussi PME)
  • Une biopuce est un petit outil d&apos;analyse et de diagnostic d&apos;environ 1 cm2. Elle se présente sous la forme d&apos;un support en verre ou en silicium sur lequel sont fixés des protéines ou des milliers de fragments d&apos; ADN ou d&apos; ARN . Une biopuce permet d&apos;identifier en un temps record un grand nombre de gènes (puces à ADN ou à ARN) et de protéines (puces à protéines) ou d&apos;en étudier le fonctionnement. Dans le domaine médical, les puces à ADN et à ARN contribuent au diagnostic de maladies infectieuses ou génétiques , à la recherche de résistances aux antibiotiques des souches microbiennes, à l&apos;analyse de mutations géné
  • Une biopuce est un petit outil d&apos;analyse et de diagnostic d&apos;environ 1 cm2. Elle se présente sous la forme d&apos;un support en verre ou en silicium sur lequel sont fixés des protéines ou des milliers de fragments d&apos; ADN ou d&apos; ARN . Une biopuce permet d&apos;identifier en un temps record un grand nombre de gènes (puces à ADN ou à ARN) et de protéines (puces à protéines) ou d&apos;en étudier le fonctionnement. Dans le domaine médical, les puces à ADN et à ARN contribuent au diagnostic de maladies infectieuses ou génétiques , à la recherche de résistances aux antibiotiques des souches microbiennes, à l&apos;analyse de mutations géné MGED -Microarray Gene Expression Data-, elle travaille à la standardisation des données, de leurs échanges et de leurs stockages. Ce consortium est une organisation international de biologistes, de développer et d’analystes, afin de faciliter l’échange de données de biopuces obtenues par les expérience de génomique fonctionnelle et de protéomique.
  • besoin de standard homogene, permettant des comparaison entre biopuces Application -&gt; differents element DNA RNA protien Heterogeneite harmonization of terminologies
  • Metadonnes description du protocole utilisé , commentaire (Les termes employés correspondent aux recommandations MIAME et sont des objets du modèle MAGE). Reporter: dont la principale est la séquence déposée, associée à l’échantillon biologique.
  • 16 packages au total 6 pour design
  • Redondance des informations Plus claire et plus lisible Facilement créable (tableur)
  • Facile a lire et a comprenddre créer -&gt;redondance d’information
  • Facile a lire et a comprenddre créer -&gt;redondance d’information
  • Vocabulaire contrôlé
  • Gestion de projet : être autonome , proposer et prendre des décisions
  • Presentation Dess Ebi

    1. 1. Rendre les standards de description de biopuces accessibles: réalisation d'un module de conversion inter-standard Pierre Marguerite – DESS Bioinformatique Lille EBI – Microarray Informatics Team 4 mai– 31 octobre 2004
    2. 2. Sommaire <ul><li>L’Institut Européen de Bioinformatique </li></ul><ul><ul><li>l’équipe informatique Microarray </li></ul></ul><ul><li>La standardisation des données de biopuces? </li></ul><ul><li>Le projet </li></ul><ul><ul><li>Les standards de description d’agencement </li></ul></ul><ul><ul><li>Contribution </li></ul></ul><ul><li>Bilan </li></ul>
    3. 3. S ervices Banques de données R echerche en bioinformatique et en biologie moleculaire Industrie Promouvoir des standards Formation Heidelberg Hinxton UK Monterotondo Hamburg Grenoble Service Research Training Industry E uropean M olecular B iology L aboratory EBI
    4. 5. S ervices Banques de données R echerche en bioinformatique et en biologie moleculaire Industrie Promouvoir des standards Formation Heidelberg Hinxton UK Monterotondo Hamburg Grenoble Service Research Training Industry E uropean M olecular B iology L aboratory EBI
    5. 6. l’équipe Microarray MicroArray Informatics Team <ul><li>les résultats d’expériences de biopuces </li></ul><ul><li>Une petite équipe : 26 développeurs, annotateurs, doctorants </li></ul><ul><li>Un projet ArrayExpress </li></ul><ul><ul><li>Banque de données publique de données de biopuces </li></ul></ul><ul><ul><li>Déclinaison en toxicogénomique et nutrigénomique </li></ul></ul><ul><li>MGED </li></ul><ul><ul><li>Standardisation des données de biopuces </li></ul></ul>
    6. 7. ArrayExpress
    7. 8. l’équipe Microarray MicroArray Informatics Team <ul><li>les expériences de biopuces </li></ul><ul><li>-> petite équipe : 26 développeurs, annotateurs </li></ul><ul><li>Un projet ArrayExpress </li></ul><ul><ul><li>Banque de données publique de données de biopuces </li></ul></ul><ul><ul><li>Déclinaison en toxicogénomique et nutrigénomique </li></ul></ul><ul><li>Le consortium MGED </li></ul><ul><ul><li>Standardisation des données de biopuces </li></ul></ul>
    8. 9. la standardisation ? <ul><li>Hétérogénéité des applications et des techniques </li></ul><ul><li>Des éléments non pris en compte </li></ul><ul><ul><li>=> expériences non comparables </li></ul></ul><ul><li>Nombreux formats de données </li></ul><ul><ul><li>Même données -> beaucoup de manipulation </li></ul></ul><ul><li>Différents termes -> pour la même signification </li></ul><ul><li>Le même terme -> des concepts différents </li></ul>MAGE Ontologie MGED Recommandations MIAME
    9. 10. Le projet <ul><li>Un constat : de plus en plus de données à traiter et un manque d’outils </li></ul><ul><li>Outil de conversion des fichiers de description d’agencement </li></ul>
    10. 11. Outil de conversion
    11. 12. Les descriptions d’agencement <ul><li>Informations initiales avant une expérience </li></ul><ul><ul><li>méta données (contacts, un numéro de version, …) </li></ul></ul><ul><ul><li>Feature: position sur une lame de biopuces, définie par ses coordonnées </li></ul></ul><ul><ul><li>Reporter: élément déposé sur une feature, qui a certaines caractéristiques, </li></ul></ul><ul><ul><li>Composites: séquences composites entre les « reporter » vers une entité biologique. </li></ul></ul><ul><li>2 formats: </li></ul><ul><ul><li>MAGE-ML :XML </li></ul></ul><ul><ul><li>ADF (Array Design File) : fichiers tabulaires </li></ul></ul>
    12. 13. MAGE-ML (MAGE-OM)
    13. 14. MAGE-ML (suite)
    14. 15. Array Design File adh adr adc Header contacts Informations techniques
    15. 16. Array Design File adr adc Feature /Reporter Features Reporters
    16. 17. Array Design File Composite Caractéristiques Liens avec les reporters
    17. 18. Contribution <ul><li>Application </li></ul><ul><ul><li>indépendante (pas de DB) </li></ul></ul><ul><ul><li>Multi plateforme </li></ul></ul><ul><li>En 2 étapes: </li></ul><ul><ul><li>Validation </li></ul></ul><ul><ul><li>conversion </li></ul></ul>
    18. 19. Validation (une étape obligatoire) <ul><li>Analyse syntaxique et lexicale des données </li></ul><ul><ul><li>Définition de règles de validation </li></ul></ul><ul><ul><li>Utilisation de fichiers XML pour décrire les structures des fichiers de données (ADF) </li></ul></ul><ul><ul><li>Vérification des termes de la ontologie MGED </li></ul></ul><ul><ul><li>Vérification des banques de données approuvées </li></ul></ul><ul><ul><li>Rapport d’erreurs pour correction (standardisation des données) </li></ul></ul>
    19. 20. Implémentation - choix techniques <ul><li>Utilisation de MAGE-stk (perl ou Java) </li></ul><ul><li>Simplicité d’installation </li></ul><ul><li>Multi plateforme </li></ul>- Multiples formats de sortie
    20. 21. Problèmes rencontrés <ul><li>Mémoire </li></ul><ul><ul><li>Beaucoup de données </li></ul></ul><ul><ul><li>Et leur redondance </li></ul></ul><ul><li>Flexibilité </li></ul><ul><ul><li>Acceptation et correction d’éléments incorrects </li></ul></ul><ul><ul><li>Nouvelles versions des formats de descriptions </li></ul></ul><ul><ul><li>Support minimum pour futurs applications des biopuces </li></ul></ul>
    21. 22. Une adresse : http://www.ebi.ac.uk/adf http://www.ebi.ac.uk/adf/
    22. 23. Bilan <ul><li>Bilan pour l’équipe </li></ul><ul><ul><li>Premier outil de vérification complète des données de description </li></ul></ul><ul><ul><li>Soulager le travail des annotateurs en déplaçant la validation des données de description à la source (biologistes ou fabricants) </li></ul></ul><ul><li>Un bilan personnel positif, mais douloureux </li></ul><ul><ul><li>6 mois en Angleterre </li></ul></ul><ul><ul><li>Gestion de projet </li></ul></ul><ul><ul><li>Nombreux contacts </li></ul></ul>
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×