Your SlideShare is downloading. ×
JRAB & GenoCensus
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

JRAB & GenoCensus

2,281
views

Published on

Here is described two tools: JRAB is used to store and handle genotypes. Genocensus performs analysis on CGH data

Here is described two tools: JRAB is used to store and handle genotypes. Genocensus performs analysis on CGH data

Published in: Technology

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
2,281
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1.
    • Les techniques de génotypage à haut débit et du CGH (Comparative Genomic Hybridization) génèrent une importante quantité d'information. Elles nécessitent la mise en place d'outils pour assurer la conservation, la traçabilité et l'analyse des données. Les logiciels classiques d'analyse d’association et de déséquilibre de liaison ont besoin que ces données se présentent sous la forme d'un fichier standard “Linkage” à double-entrée représentant des allèles d'une collection d' individus en fonction de marqueurs génétiques. De plus l'analyse d’experiences CGH sur nos puces BACs nécessite l'accès à un outil simple, ouvert et complet . Dans le cadre de notre plateforme génétique, nous présentons ici deux outils: l'un; baptisé JRAB, permet la capture des données brutes, l'intégration des données familiales et cliniques et le croisement avec des annotations génomiques pour générer des fichiers Linkage afin qu'ils soient directement analysés par les outils statistiques. L'autre outil, baptisé Genocensus est un logiciel d'analyse et d'interprétation de données issues des puces CGH IntegraChip TM .
    Integragen S.A, 5 rue Henri Desbruères Evry France JRAB & Genocensus Deux outils de manipulation de données CGH et d'épidémiologie génétique. Pierre Lindenbaum, Ekrame Ayari-Jacoby, Frederic Tores, Peter Brooks, Abdel Benajjou et Philippe Gesnouin.
  • 2. Notre base de données destinée à stocker des génotype est implémentée sous mysql, l'interface permettant de tracer les données et les programmes en ligne de commandes servant à  les exporter sont écrits en java. Pour chacun des génotypes stocké dans la base de données, nous pouvons retrouver la famille de l’individus et la position du marqueur. Ce système est capable de gérer la position des marqueurs génétiques en fonction de différentes versions (« build ») de l'assemblage du génome humain: la position de ce marqueur est en effet susceptible de varier selon les versions, nous pouvons donc suivre les modifications des positions de nos marqueurs sur les différents mise a jour de l’assemblage. Chaque génotype est stocké avec la valeur des deux allèles, le lien vers l'échantillon d'ADN de l'individu, un lien vers le marqueur génétique utilisé, un lien vers l'expérience et la date de l'insertion dans la base. Ce système nous permet également de génotyper un même point expérimental à différentes dates.
  • 3. Genocensus TM
    • Nous avons développé GenoCensus TM essentiellement pour faciliter l'analyse de nos lames CGH. Il existe peu de logiciel complet (traitement de données, représentation graphique et identification des régions altérées) d'analyse de données CGH. L’ originalité de ce logiciel, est qu'avec un seul outil simple, en quelques clics, il est possible de visualiser les régions chromosomiques altérées sans se soucier de toutes les manipulations de données à faire au préalable. Notre objectif est de le rendre encore plus complet en y incorporant à terme l'analyse d'image.
  • 4. Pedigrés
    • La structure de notre base de données permet de stocker les pedigrés, les phénotypes, les références des échantillons d'ADN dans des plaques P96 et P384.
    incompat 'parent' avec le marqueur TAQMAN ID 823 : RS6683015-G172 et l'individus gecko-id=48117
    • Pour chaque génotype il est ainsi possible de générer un rapport sur les incompatibilités mendeliennes rencontrée.
    ;Female; 0 0 DFS_2006:48: 159 gecko-id: 47128 ;Male; 0 0 DFS_2006:48: 158 gecko-id: 47127 <--- ;Male; 159 158 DFS_2006:48: 157 gecko-id: 48117 VIC DFS_2006:48:159 gecko-id: 47128 S3006LM0.sds:M15 data-id: 318747 <--- FAM DFS_2006:48:158 gecko-id: 47127 S3006LM0.sds:K15 data-id: 318699 <--- VIC DFS_2006:48:157 gecko-id: 48117 S3006LM0.sds:I15 data-id: 318651
  • 5. Lectures et Analyses
    • Notre sytème intègre la création des « feuilles de route » pour séquenceurs à partir des plans de plaques d'ADN . Les résultats sont ensuite intégrés dans la base de données, mais peuvent également être directement analysés en interne comme ici pour des résultats d'analyse d'expériences TAQMAN ® .
  • 6. Analyse de Genome-Hip
    • Les régions génomiques d'intérêt sont stockées dans notre base. Ces régions d'intérêt sont celles qui ont été trouvées lors d'expériences de Genome-Hip , une technique permettant d'identifier les régions identiques par descendance (IBD) entre deux individus. L’étape de localisation de ces régions utilise des puces à ADN de BACs. Nous sommes ainsi en mesure de lier nos marqueurs génétiques à  ces région elles mémes reliées à  des clones BAC déposés sur les puces.
  • 7. Génération de Fichiers Linkage
    • Un exemple de fichier linkage: chaque ligne correspond à  un individu. Les 6 premières colonnes correspondent respectivement au nom de l'individu, son identifiant dans le pedigree, l'identifiant du père, de la mère et le sexe. Les colonnes suivantes correspondent aux allèles identifiés pour une série de marqueurs génétiques donnés codés par un entier. Une valeur '0' correspond à  une donnée inconnue.
    La génération des fichiers Linkage est possible en fonction des critéres définis par l'utilisateur (date, région génomique, type de marqueur, etc...). Lors de ce processus, chaque génotype est indexé sous la forme d'un nombre entier, représentant la base ou la taille de l'amplicon, et chaque marqueur est ordonné en fonction de sa position dans le génome pour une version de « build » donné. A l'issue de ces indexations, le fichier Linkage est généré. Si un individu a été génotypé plusieurs fois pour un même marqueur et qu'il existe une incompatibilité entre ces génotypes, le système d'exportation permet d'ignorer tous les génotypes obtenus avec ce marqueur pour tous les membres de la famille de l'individu impliqué et de mettre les résultats à  « 0 ». Les haplotypes produits lors des analyses ultérieures peuvent éventuellement être insérés dans la base.
  • 8. Analyses des Haplotypes.
    • Les données des fichiers Linkage sont ensuite analysées par les outils statistiques standards qui participent à la découverte des déséquilibres de liaison, d'haplotypes impliqués dans une pathologie. Ces résultats peuvent ensuite être intégrés dans la base de données.
  • 9. Perspectives Nous migrons d'un système d'interfaces web (java/tomcat) à un système interactif (java swing) où l'utilisateur pourra encore plus facilement manipuler les données (tableaux croisés, analyses graphiques, pipeline d'analyses) .
  • 10. Conclusion
    • Bien que nos outils soient étroitement liés aux spécificités de notre laboratoire nous pensons que certains de nos programmes présenteront un intérêt auprés des biostatisticiens, des épidémiologistes et des généticiens, car à  notre connaissance il n'existe pas d'outil permettant la génération de fichiers « Linkage » à  partir de d'une base de données de génotypes ou de programmes simples d'analyses de données CGH.