Studi di associazione genetica e                             disegno sperimantale caso-                                   ...
BIOMEDICINA      ENERGIA                      E AMBIENTE                                   DATA FUSION    Collana di Semin...
Indice degli argomenti           • Background           • Studi di associazione           • Perchè questo studio sulla pop...
Variabilità genetica       • Le variazioni genetiche            spiegano la maggior            parte della variabilità    ...
Studi di associazione           • Studio caso-controllo                An epidemiological study design in which cases with...
Studi di associazione           • Studio caso-controllo:                                                        Variante g...
Studi di associazione           • Studio caso-controllo: caso ideale           • Malattie monogeniche, penetranza completa...
Studi di associazione           • Studio caso-controllo: malattie multifattoriali                                         ...
Studi di associazione           • Studio caso-controllo: malattie multifattoriali           • p-value: probabilità che la ...
Studio caso-controllo           • Obiettivo: identificare varianti genetiche con frequenze                diverse in casi e...
• Studio di associazione per tratti quantitativi            • Correlazione tra variabilità genetica e fenotipicaThursday, ...
• Studio di associazione per tratti quantitativi            • Es. altezzaThursday, March 31, 2011
• Studio di associazione per tratti quantitativi            • Es. altezzaThursday, March 31, 2011
Tipi di studi           • Genome-wide                  – Studio il cui scopo è quello di identificare le varianti causali  ...
Marcatori genetici                un marcatore genetico è costituito da una differenza nel                             DNA ...
Single Nucleotide Polymorphism (SNP)                                            • Marcatore biallelico                    ...
Single Nucleotide Polymorphism (SNP)                                            • Si stima che ci siano circa             ...
Progressi nelle tecnologie di genotipizzazione            2001            2002            2003            2004            ...
Due case produttrici di microarrays utilizzati in studi GWAS                                      Affymetrix Genome-Wide   ...
• Che cosa c’è in una probe?                                           www.affymetrix.comThursday, March 31, 2011
• Concetti base               –Ibridazione               –Lettura con scanner                ad alta risoluzione          ...
Quali SNPs?Thursday, March 31, 2011
Progetto HapMap           • Database pubblico dei pattern comuni di variazione             genetica nel genoma umano      ...
Linkage Disequilibrium           • fenomeno per cui due o più alleli non segregano in                maniera indipendente ...
Non è necessario studiare tutti gli SNPs del genoma!                  Associazione diretta             Associazione indire...
Workflow           • Studi di associazione Genome-Wide                  – Definizione casi e controlli                  – Ra...
Selezione casi e controlli             • Perchè la popolazione sarda?             • Perchè le malattie autoimmuni?Thursday...
• Perchè la popolazione sarda?                  – Dimensione del campione adeguata al tipo di studio                      ...
• Perchè la popolazione sarda?Thursday, March 31, 2011
• Perchè le malattie autoimmuni?                  – Alta incidenza di malattie autoimmuni in Sardegna                     ...
• Perchè le malattie autoimmuni?Thursday, March 31, 2011
• Perchè le malattie autoimmuni?Thursday, March 31, 2011
• Perchè le malattie autoimmuni?Thursday, March 31, 2011
Raccolta campioni biologici e dati clinici                                           • Raccolta iniziata circa 20 anni fa ...
Raccolta campioni biologici e dati clinici                                           • Accurata definizione dei            ...
Database dati clinici (beta)              -> Seminario Gianmauro Cuccuru - “Approccio integrato alla gestione             ...
Genotipizzazione                                                                                                 • ∼6700 i...
LIMS (beta)              -> Seminario Gian Franco Frau - “Laboratory Information Management              System - Perchè e...
Workflow           • Studi di associazione Genome-Wide                  – Definizione casi e controlli                  – Ra...
Controlli di qualità sugli individui           • Callrate >90%, 95%, 98%                  – % genotipi chiamati per indivi...
Controlli di qualità sugli SNPs           • Callrate > 95% o > 98%                  – % genotipi chiamati per un dato SNP ...
Controlli di qualità sugli SNPs           • Equilibrio di Hardy-Weinberg. Ipotesi:                  – Popolazione infinita ...
Controlli di qualità sugli SNPs           • Minor Allele Frequency                  – Alleli con frequenza < 1% sono varia...
Controlli di qualità sugli SNPs           • Eliminazione SNPs con eccesso di errori mendeliani           • Eliminazione SN...
Passi successivi                  –Selezione individui non imparentati per test di                   associazione         ...
Analisi della sottostruttura di popolazione           • Stratificazione genetica:                  –fattore di confounding ...
Analisi della sottostruttura di popolazione           • Principal Component Analysis (PCA)                  – Software Eig...
Test di associazione           • Errore per test multipli                           • Accettare un errore del 5% e testare...
Test di associazioneThursday, March 31, 2011
Possibili svantaggi           • I patterns di LD nelle popolazioni HapMap possono                non riflettere i patterns ...
Possibili svantaggi           • Abbiamo visto che il numero di casi e controlli                necessario per trovare un’a...
Possibili svantaggi           • Abbiamo visto che il numero di casi e controlli                necessario per trovare un’a...
Inferenza           • I metodi di inferenza sviluppati da statistici e                informatici consentono di incrementa...
1000 Genomes ProjectThursday, March 31, 2011
1000 Genomes Project           • Scopo              • fornire un catalogo completo di                 • varianti genetiche...
Pannello sequenze sarde           • 508 individui sequenziati                  • 13,313,964 SNPs identificati              ...
Inferenza di marcatori non genotipizzatiThursday, March 31, 2011
Inferenza di marcatori non genotipizzatiThursday, March 31, 2011
Inferenza di marcatori non genotipizzatiThursday, March 31, 2011
Inferenza di marcatori non genotipizzati                   -> Seminario Serena Sanna “L’inferenza statistica e la lettura ...
Annotazione Risultati           • Quali informazioni per ogni SNP?             • Risultati test di associazione           ...
Ispezione visiva plot di calling                                            • casi e controlli                            ...
Ispezione visiva plot di calling                                            • casi e controlli                            ...
Cosa succede dopo l’associazione?           •    Selezione marcatori candidati           •    Estensione e validazione ris...
• Estensione e validazione dei risultati                  – Genotipizzazione dei marcatori selezionati negli stessi       ...
• Analisi condizionale                  – Valutazione della presenza di varianti associate indipendenti                   ...
Primi risultatiThursday, March 31, 2011
Primi risultati                           Sanna S. et al. Variants within immunoregulatory CBLB gene are associated with m...
Primi risultati                           Sanna S. et al. Variants within immunoregulatory CBLB gene are associated with m...
Primi risultati           • top SNP                  • genotipizzato, non presente in HapMap II                  • present...
Primi risultati           • Il top SNP identificato spiega tutta                l’associazione al locus in cui si trova    ...
Ipotesi di interpretazione biologica           • Topi knock-out per l’ortologo di CBLB presentano alta                susc...
Ipotesi di interpretazione biologica           • Il processo infiammatorio nella MS è causato                dall’attività ...
Ipotesi di interpretazione biologica           • CBLB regola negativamente l’attività di TCR (T-cell                recept...
Ipotesi di interpretazione biologica           • CBLB regola negativamente l’attività di TCR (T-cell                recept...
Ipotesi aggiuntive           • Inoltre, altri studi hanno dimostrato che topi knock-                out per il CBLB non sv...
Lavori in corso           • Estensione casistica (∼7000)                  –GWAS Sclerosi Multipla                         ...
Lavori in corso           • Nuove genotipizzazioni                  – Affymetrix 6.0                  – Illumina 1M        ...
Ringraziamenti           Serena Sanna              Sandra Lai           Andrea Angius           Maristella Pitzalis       ...
Ringraziamenti             Francesco Cucca         High Performance Computing and Network group - CRS4             Chris J...
Riferimenti           • Sanna S. et al. A GWAS in Sardinians reveals a novel gene associated with multiple sclerosis - Eur...
Links           • http://www.affymetrix.com           • http://www.illumina.com/           • http://www.appliedbiosystems.c...
Grazie per l’attenzione!                                    Ilenia Zara                                ilenia.zara@crs4.it...
BIOMEDICINA       ENERGIA                       E AMBIENTE                                    DATA FUSION    Collana di Se...
Studi di associazione genetica e disegno sperimantale caso- controllo
Upcoming SlideShare
Loading in...5
×

Studi di associazione genetica e disegno sperimantale caso- controllo

5,112

Published on

Applicazioni allo studio del Diabete di Tipo1 e della Sclerosi Multipla nella popolazione sarda

Ilenia Zara (CRS4)

Published in: Business, Technology
1 Comment
2 Likes
Statistics
Notes
  • <br /><object type="application/x-shockwave-flash" data="http://www.youtube.com/v/-TFZkYKkXvk?fs=1&amp;hl=en_US" width="350" height="288"><param name="movie" value="http://www.youtube.com/v/-TFZkYKkXvk?fs=1&amp;hl=en_US"></param><embed src="http://www.youtube.com/v/-TFZkYKkXvk?fs=1&amp;hl=en_US" width="350" height="288" type="application/x-shockwave-flash"></embed></object>
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
No Downloads
Views
Total Views
5,112
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
89
Comments
1
Likes
2
Embeds 0
No embeds

No notes for slide

Transcript of "Studi di associazione genetica e disegno sperimantale caso- controllo"

  1. 1. Studi di associazione genetica e disegno sperimantale caso- controllo Applicazioni allo studio del Diabete di Tipo1 e della Sclerosi Multipla nella popolazione sarda Ilenia Zara ilenia.zara@crs4.it Aula Magna Dipartimento di Fisica Cittadella Universitaria di Monserrato 30 Marzo 2011Thursday, March 31, 2011
  2. 2. BIOMEDICINA ENERGIA E AMBIENTE DATA FUSION Collana di Seminari per la Valorizzazione dei Risultati della Ricerca al CRS4 30.03.2011 Seminario 16:00 -18:00 P.M. AULA MAGNA DIP. FISICA Cittadella Universitaria - Monserrato I recenti sviluppi delle nuove piattaforme sperimentali consentono di studiare le caratteristiche genetiche di intere popolazioni utilizzando volumi di dati sempre crescenti con costi sempre minori. Questo tipo di studi rende necessaria l’interazione tra persone con una formazione medico/ biologica e persone con competenze nei campi della statistica Studi di associazione genetica e e dell’informatica. disegno sperimentale “caso controllo”: applicazioni a diabete di tipo 1 e sclerosi multipla nella popolazione Sarda Durante il seminario saranno illustrati i concetti genetico- statistici che stanno alla base degli studi GWAS e i risultati di ricerca ottenuti con tale approccio per identi care varianti genetiche predisponenti al diabete di tipo 1, alla sclerosi multipla e alle malattie autoimmuni in generale, nella popolazione Sarda. Relatore: Ileniasviluppi delle nuove piattaforme sperimentali consentono Relatore I recenti Zara Ilenia Zara di studiare le caratteristiche genetiche di intere popolazioni utlizzando CRS4 volumi di dati sempre crescenti con costi sempre minori. Questo tipo di studi rende necessaria l’interazione tra persone con una formazione medico/biologica e persone con competenze nei campi della statistica e dell’informatica.Thursday, March 31, 2011
  3. 3. Indice degli argomenti • Background • Studi di associazione • Perchè questo studio sulla popolazione sarda? • Workflow dello studio • Risultati ottenuti • Lavori in corsoThursday, March 31, 2011
  4. 4. Variabilità genetica • Le variazioni genetiche spiegano la maggior parte della variabilità osservata tra individui della stessa specie • Il crossing-over è un meccanismo di ricombinazione del materiale genetico proveniente dai due genitori.Thursday, March 31, 2011
  5. 5. Studi di associazione • Studio caso-controllo An epidemiological study design in which cases with a defined condition and controls without this condition are sampled from the same population. Risk-factor information is compared between two groups to investigate the potential role of these in the etiology of the condition. Krina T. Zondervan and Lon R. Cardon “The complex interplay among factors that influence allelic association” - Nature Genetics Reviews - 2004Thursday, March 31, 2011
  6. 6. Studi di associazione • Studio caso-controllo: Variante genetica Controlli: individui non affetti Casi: individui affettiThursday, March 31, 2011
  7. 7. Studi di associazione • Studio caso-controllo: caso ideale • Malattie monogeniche, penetranza completa Variante genetica causale Variante genetica protettiva Controlli: individui non affetti Casi: individui affettiThursday, March 31, 2011
  8. 8. Studi di associazione • Studio caso-controllo: malattie multifattoriali Variante genetica causale Variante genetica protettiva Controlli: individui non affetti Casi: individui affettiThursday, March 31, 2011
  9. 9. Studi di associazione • Studio caso-controllo: malattie multifattoriali • p-value: probabilità che la variante considerata NON sia associata alla malattia Variante genetica causale Variante genetica protettiva Controlli: individui non affetti Casi: individui affetti No Associazione 1 > p-value > 0 AssociazioneThursday, March 31, 2011
  10. 10. Studio caso-controllo • Obiettivo: identificare varianti genetiche con frequenze diverse in casi e controlli, che possano rappresentare un fattore di rischio o protettivo verso l’insorgenza di una patologia. • Assunzione: casi e controlli provengono da una popolazione omogenea e possono essere utilizzati per stimare le distribuzioni dei marcatori genetici nella popolazione sottostante.Thursday, March 31, 2011
  11. 11. • Studio di associazione per tratti quantitativi • Correlazione tra variabilità genetica e fenotipicaThursday, March 31, 2011
  12. 12. • Studio di associazione per tratti quantitativi • Es. altezzaThursday, March 31, 2011
  13. 13. • Studio di associazione per tratti quantitativi • Es. altezzaThursday, March 31, 2011
  14. 14. Tipi di studi • Genome-wide – Studio il cui scopo è quello di identificare le varianti causali lungo tutto il genoma • Candidate marker – Studio di un marcatore che si ritiene implicato nel meccanismo di insorgenza di una patologia • Candidate gene – Studio dei marcatori che cadono nella regione di un gene • Fine mapping – Studio ad alta risoluzione di marcatori che cadono in un’intera che può contenere uno o più geniThursday, March 31, 2011
  15. 15. Marcatori genetici un marcatore genetico è costituito da una differenza nel DNA tra due o più individui • Marcatori multiallelici o multiforme – microsatelliti, inserzioni, delezioni – Copy Number Variations, Copy Number Polymorphism – Riarrangiamenti su larga scala (duplicazioni, traslocazioni, inversioni, etc.) • SNPs (Polimorfismi a Singolo Nucleotide)Thursday, March 31, 2011
  16. 16. Single Nucleotide Polymorphism (SNP) • Marcatore biallelico • Variazione di un singolo nucleotide in un altro • Il polimorfismo è considerato stabile se osservato in almeno l’1% della popolazione • ∼2001: prime applicazioni in laboratorioThursday, March 31, 2011
  17. 17. Single Nucleotide Polymorphism (SNP) • Si stima che ci siano circa 30,000,000 SNPs nel genoma umano • Nascono come mutazioni (MAF<1%) • La maggior parte scompare ma alcuni si stabilizzano • caso • selezione naturaleThursday, March 31, 2011
  18. 18. Progressi nelle tecnologie di genotipizzazione 2001 2002 2003 2004 10 3 2005 2006 2007 2008 Next Generation Sequencing 2009 1 10 100 1,000 10,000 100,000 1,000,000Thursday, March 31, 2011
  19. 19. Due case produttrici di microarrays utilizzati in studi GWAS Affymetrix Genome-Wide Human SNP 6.0 www.affymetrix.com Illumina 1M Duo beadchip www.illumina.comThursday, March 31, 2011
  20. 20. • Che cosa c’è in una probe? www.affymetrix.comThursday, March 31, 2011
  21. 21. • Concetti base –Ibridazione –Lettura con scanner ad alta risoluzione –Immagine A. Angius - “High throughput genotyping and next generation sequencing: nuovi strumenti e strategie di analisi della ricerca genetica” - 16 febbraio 2011Thursday, March 31, 2011
  22. 22. Quali SNPs?Thursday, March 31, 2011
  23. 23. Progetto HapMap • Database pubblico dei pattern comuni di variazione genetica nel genoma umano • Scopo: fornire ai ricercatori una mappa aplotipica del genoma umanoThursday, March 31, 2011
  24. 24. Linkage Disequilibrium • fenomeno per cui due o più alleli non segregano in maniera indipendente • Gran parte del genoma cade in segmenti di forte LD detti blocchi di aplotipi, separati da segmenti di basso LD • All’interno di ciascun blocco le varianti presenti sono tra loro fortemente correlate e un piccolo numero di combinazioni di alleli distinti (aplotipi) rappresentano la maggior parte delle variazioni genetiche nella popolazione considerataThursday, March 31, 2011
  25. 25. Non è necessario studiare tutti gli SNPs del genoma! Associazione diretta Associazione indiretta • Gli SNPs vengono testati • Gli SNPs vengono in base alle conoscenze a genotipizzati in base al priori sulla loro funzione Linkage Disequilibrium • L’individuazione della variane causale dipende dalla sua correlazione con la variante genotipizzataThursday, March 31, 2011
  26. 26. Workflow • Studi di associazione Genome-Wide – Definizione casi e controlli – Raccolta campioni biologici e dati clinici – Genotipizzazione – Controlli di qualità su individui e marcatori – Analisi della struttura della popolazione – Test di associazione – Inferenza di marcatori non genotipizzati – Annotazione dei risultati e selezione marcatori candidati e regioni corrispondentiThursday, March 31, 2011
  27. 27. Selezione casi e controlli • Perchè la popolazione sarda? • Perchè le malattie autoimmuni?Thursday, March 31, 2011
  28. 28. • Perchè la popolazione sarda? – Dimensione del campione adeguata al tipo di studio • Dimensione della popolazione abbastanza elevata da consentire di mantenere una certa variabilità tra gli individui – Popolazione Isolata • Assenza sostanziale di sottostruttura di popolazione (basso tasso di immigrazione) • Presenza di varianti comuni nei sardi e rare o assenti in altre popolazioni • Nonostante sia una popolazione europea, si comporta come un outlier rispetto alla gamma di variabilità europeaThursday, March 31, 2011
  29. 29. • Perchè la popolazione sarda?Thursday, March 31, 2011
  30. 30. • Perchè le malattie autoimmuni? – Alta incidenza di malattie autoimmuni in Sardegna • Es.: l’incidenza del Diabete di Tipo 1 è 5 volte maggiore che nel resto d’Italia e pari all’incidenza osservata in Finlandia – Altre ipotesi • Gli stessi fattori genetici che predispongono alle malattie autoimmuni potrebbero in passato aver protetto la popolazione da alcune infezioni batteriche • Protezione nei confronti di alcune forme di tumore (modelli murini) • Longevità (ipotesi)Thursday, March 31, 2011
  31. 31. • Perchè le malattie autoimmuni?Thursday, March 31, 2011
  32. 32. • Perchè le malattie autoimmuni?Thursday, March 31, 2011
  33. 33. • Perchè le malattie autoimmuni?Thursday, March 31, 2011
  34. 34. Raccolta campioni biologici e dati clinici • Raccolta iniziata circa 20 anni fa • Gran numero di persone e istituzioni coinvolte • ∼2500 volontari sani provenienti da vari centri trasfusionali e ospedali dell’isola • ∼2500 pazienti affetti da Sclerosi Multipla • ∼1500 pazienti affetti da Diabete di Tipo 1 • La raccolta dei campioni continua!Thursday, March 31, 2011
  35. 35. Raccolta campioni biologici e dati clinici • Accurata definizione dei fenotipi clinici • Accurata selezione dei controlli rispetto al fenotipo da testare • Età • Sesso • Appartenenza effettiva alla popolazione sarda • Altri fenotipi presenti solo nei casi o solo nei controlliThursday, March 31, 2011
  36. 36. Database dati clinici (beta) -> Seminario Gianmauro Cuccuru - “Approccio integrato alla gestione dati in ambito clinico e genetico” - 25 Maggio 2011Thursday, March 31, 2011
  37. 37. Genotipizzazione • ∼6700 individui • ∼840 individui • Non imparentati • Trios • Famiglie multigenerazionali con più affetti per famiglia Esempio: plot di calling per SNP Affymetrix J. M. Korn, et al.: Integrated genotype calling and association analysis of SNPs, common copy number polymorphisms and rare CNVs. Nat. Genet. Technical Reports, ng237 (October 2008)Thursday, March 31, 2011
  38. 38. LIMS (beta) -> Seminario Gian Franco Frau - “Laboratory Information Management System - Perchè e per cosa?” - 7 Settembre 2011Thursday, March 31, 2011
  39. 39. Workflow • Studi di associazione Genome-Wide – Definizione casi e controlli – Raccolta campioni biologici e dati clinici – Genotipizzazione – Controlli di qualità su individui e marcatori – Analisi della struttura della popolazione – Test di associazione – Inferenza di marcatori non genotipizzati – Annotazione dei risultati e selezione marcatori candidati e regioni corrispondentiThursday, March 31, 2011
  40. 40. Controlli di qualità sugli individui • Callrate >90%, 95%, 98% – % genotipi chiamati per individuo rispetto al totale • Corrispondenza tra sesso annotato e sesso inferito – Sesso inferito in base all’eterozigosità del cromosoma X • Verifica delle relazioni di parentela annotate – Mediante test di verosimiglianza tra genotipi reali e genotipi attesi in base alla relazione di parentela dichiarata – Test effettuato su oltre 5000 varianti di buona qualità altamente polimorficheThursday, March 31, 2011
  41. 41. Controlli di qualità sugli SNPs • Callrate > 95% o > 98% – % genotipi chiamati per un dato SNP sul totale degli individui • Assenza di deviazioni dall’equilibrio di Hardy- Weinberg nei controlli p frequenza allele 1 q frequenza allele 2Thursday, March 31, 2011
  42. 42. Controlli di qualità sugli SNPs • Equilibrio di Hardy-Weinberg. Ipotesi: – Popolazione infinita – Assenza di flussi migratori – Non selezione – Non mutazione • Eliminazione SNPs con HWEp<0.000001 • Un discostamento dall’equilibrio di Hardy-Weinberg nei casi può essere indice di associazioneThursday, March 31, 2011
  43. 43. Controlli di qualità sugli SNPs • Minor Allele Frequency – Alleli con frequenza < 1% sono varianti rare – Possono causare una diminuzione del potere di identificazione delle deviazioni dall’HWE – Possono nascondere errori di genotipizzazione – Possono generare associazioni spurie, perchè possono comparire in individui con fenotipi estremi • Eliminazione marcatori con MAF<1% o MAF<5%Thursday, March 31, 2011
  44. 44. Controlli di qualità sugli SNPs • Eliminazione SNPs con eccesso di errori mendeliani • Eliminazione SNPs con eccesso di maschi eterozigoti sul cromosoma X • Eliminazione SNPs con eccessivo tasso d’errore su dupliche Cut-off definiti in base ai dati disponibiliThursday, March 31, 2011
  45. 45. Passi successivi –Selezione individui non imparentati per test di associazione • Verifica dell’assenza di parenti –Controlli su SNPs testati comunque • Controllo callrate nei soli casi e nei soli controlli • Differenza tra callrate nei casi e callrate nei controlli non eccessiva • Controllo MAF nei soli casi e nei soli controlli • HWEp nei casiThursday, March 31, 2011
  46. 46. Analisi della sottostruttura di popolazione • Stratificazione genetica: –fattore di confounding dovuto alla presenza di differenze di frequenze alleliche tra casi e controlli non correlate al fenotipo di interesse • Può portare all’identificazione di falsi positiviThursday, March 31, 2011
  47. 47. Analisi della sottostruttura di popolazione • Principal Component Analysis (PCA) – Software Eigenstrat (http://genepath.med.harvard.edu/ ~reich/EIGENSTRAT.htm) – Mediante analisi di matrici di covarianza riduce lo spazio dei dati identificando gli assi di maggior variazione delle frequenze alleliche – Consente di identificare outliers – Consente di effettuare un test di associazione corretto per sottostruttura di popolazione – Analisi effettuata su 100,000 SNPs di buona qualità, altamente polimorficiThursday, March 31, 2011
  48. 48. Test di associazione • Errore per test multipli • Accettare un errore del 5% e testare 600,000 SNPs significa accettare la possibilità di trovare 0.05 * 600,000 = 30,000 associazioni false • Correzione di Bonferroni • Assumendo un errore del 5% e testando 600,000 SNPs la soglia di significatività per il mio test è 0.05 / 600,000 = 8.3 * 10-8 • La correzione di Bonferroni assume però indipendenza tra i test e si rivela eccessivamente conservativa in presenza di LDThursday, March 31, 2011
  49. 49. Test di associazioneThursday, March 31, 2011
  50. 50. Possibili svantaggi • I patterns di LD nelle popolazioni HapMap possono non riflettere i patterns di LD nella popolazione oggetto dello studio • Anche se gli SNPs selezionati per la creazione dei chips non sono random ma sono stati scelti per essere rappresentativi (tag SNPs), HapMap non è un database esaustivoThursday, March 31, 2011
  51. 51. Possibili svantaggi • Abbiamo visto che il numero di casi e controlli necessario per trovare un’associazione dipende anche dal LD con la variante causale. In che modo?Thursday, March 31, 2011
  52. 52. Possibili svantaggi • Abbiamo visto che il numero di casi e controlli necessario per trovare un’associazione dipende anche dal LD con la variante causale. In che modo? Soluzioni?Thursday, March 31, 2011
  53. 53. Inferenza • I metodi di inferenza sviluppati da statistici e informatici consentono di incrementare il numero di marcatori testati, a costi molto bassi rispetto a quelli degli esperimenti • Nuovi genotipi possono essere inferiti a partire da diversi pannelli di referenza – HapMap ∼3 milioni di SNPs – 1000 Genomes Project ∼13 milioni di SNPs – Sequenze di individui Sardi ∼13 milioni di SNPsThursday, March 31, 2011
  54. 54. 1000 Genomes ProjectThursday, March 31, 2011
  55. 55. 1000 Genomes Project • Scopo • fornire un catalogo completo di • varianti genetiche umane (freq.>=1%) • varianti con frequenza <1% nelle regioni dei geni • dati di sequenza di alta qualità per l’85% del genoma • 629 individui • varie popolazioni Africa, Asia, Europa e America • Il catalogo include SNPs, CNV, inserzioni e delezioni • Il catalogo è fruibile gratuitamenteThursday, March 31, 2011
  56. 56. Pannello sequenze sarde • 508 individui sequenziati • 13,313,964 SNPs identificati • ∼45% presenti in dbSNP • http://www.ncbi.nlm.nih.gov/projects/SNP/ • ∼55% SNPs non descritti -> Seminario Frederic Reinier - “Sequenziamento e analisi bioinformatica del genoma umano” - 11 Maggio 2011Thursday, March 31, 2011
  57. 57. Inferenza di marcatori non genotipizzatiThursday, March 31, 2011
  58. 58. Inferenza di marcatori non genotipizzatiThursday, March 31, 2011
  59. 59. Inferenza di marcatori non genotipizzatiThursday, March 31, 2011
  60. 60. Inferenza di marcatori non genotipizzati -> Seminario Serena Sanna “L’inferenza statistica e la lettura dei dati”Thursday, March 31, 2011
  61. 61. Annotazione Risultati • Quali informazioni per ogni SNP? • Risultati test di associazione • Risultati controlli di qualità • Gene in cui cade lo SNP o gene più vicino • Posizione e distanza dello SNP rispetto al gene • Tipologia dello SNP • Funzione del gene, quando notaThursday, March 31, 2011
  62. 62. Ispezione visiva plot di calling • casi e controlli • casi • controlliThursday, March 31, 2011
  63. 63. Ispezione visiva plot di calling • casi e controlli • casi • controlli SNP da scartare!Thursday, March 31, 2011
  64. 64. Cosa succede dopo l’associazione? • Selezione marcatori candidati • Estensione e validazione risutati • Analisi aplotipiche nelle regioni selezionate • Interpretazione biologica dei risultati • Studi funzionali • Studi su modelli animaliThursday, March 31, 2011
  65. 65. • Estensione e validazione dei risultati – Genotipizzazione dei marcatori selezionati negli stessi individui e calcolo del tasso di concordanza – Genotipizzazione in un dataset esteso – Genotipizzazione in un dataset di individui indipendente http://www.appliedbiosystems.com/absite/us/en/home.htmlThursday, March 31, 2011
  66. 66. • Analisi condizionale – Valutazione della presenza di varianti associate indipendenti nello stesso aplotipo – Valutazione dell’associazione dei marcatori rispetto all’associazione degli aplotipi di cui fanno parte • Studi funzionali – Studi dell’espressione dei geni in cui cadono gli SNPs associati o dei gene vicini – Studi dei prodotti proteici dei geni in cui cadono gli SNPs associati o dei gene vicini • Studi su modelli animali – Studi funzionali su modelli animali delle patologieThursday, March 31, 2011
  67. 67. Primi risultatiThursday, March 31, 2011
  68. 68. Primi risultati Sanna S. et al. Variants within immunoregulatory CBLB gene are associated with multiple sclerosis Nat Genet 42(6):495-7 (2010)Thursday, March 31, 2011
  69. 69. Primi risultati Sanna S. et al. Variants within immunoregulatory CBLB gene are associated with multiple sclerosis Nat Genet 42(6):495-7 (2010)Thursday, March 31, 2011
  70. 70. Primi risultati • top SNP • genotipizzato, non presente in HapMap II • presente solo nel chip Affymetrix • p-value su dati genotipizzati (882/872) ∼10^-5 • p-value dopo inferenza su HapMap III e 1000 Genomes ∼10^-6 • p-value estensione (1775/2005) ∼10^-6 • p-value joint analysis (2657/2877) ∼10^-10Thursday, March 31, 2011
  71. 71. Primi risultati • Il top SNP identificato spiega tutta l’associazione al locus in cui si trova • Le analisi condizionali non hanno mostrato segnali indipendenti • Anche l’associazione degli aplotipi è meno significativa di quella del marcatore singoloThursday, March 31, 2011
  72. 72. Ipotesi di interpretazione biologica • Topi knock-out per l’ortologo di CBLB presentano alta suscettibilità allo sviluppo dell’encefalomielite autoimmune Chiang, Y.J. et al., Nature 403, 216-20 (2000) • Il gene potrebbe avere un ruolo più generale nelle malattie autoimmuni • è infatti un gene di suscettibilità per diverse malattie autoimmuni, tra cui il T1D, in diversi modelli murini Yokoi N. et al., Nat Genet 31(4), 391-4 (2002) Mordes J.P., et al. ILAR J 45(3), 278-91 (2004)Thursday, March 31, 2011
  73. 73. Ipotesi di interpretazione biologica • Il processo infiammatorio nella MS è causato dall’attività dei linfociti T, che riconoscono la mielina come estranea e la attaccano • Studi su modelli animali mettono in evidenza anche un ruolo dei linfociti B nello sviluppo della malattiaThursday, March 31, 2011
  74. 74. Ipotesi di interpretazione biologica • CBLB regola negativamente l’attività di TCR (T-cell receptors) e BCR (B-cell receptors)Thursday, March 31, 2011
  75. 75. Ipotesi di interpretazione biologica • CBLB regola negativamente l’attività di TCR (T-cell receptors) e BCR (B-cell receptors)Thursday, March 31, 2011
  76. 76. Ipotesi aggiuntive • Inoltre, altri studi hanno dimostrato che topi knock- out per il CBLB non sviluppano alcuni tipi di tumore Loser, S. & Penninger, J.M. Semin. Immunol. 19, 206-214 (2007) • Le variazioni nel gene CBLB sembrano essere critiche nel mantenimento del delicato equilibrio tra l’attivazione e la tolleranza immunologica con effetti opposti nell’autoimmunità e nel cancroThursday, March 31, 2011
  77. 77. Lavori in corso • Estensione casistica (∼7000) –GWAS Sclerosi Multipla • 1922 controlli • 2280 casi –GWAS Diabete di Tipo 1 • 1917 controlli • 1377 casi –GWAS Autoimmunità (MS+T1D) • 1915 controlli • 3595 casiThursday, March 31, 2011
  78. 78. Lavori in corso • Nuove genotipizzazioni – Affymetrix 6.0 – Illumina 1M • Nuove sequenze – Illumina GA e HiSeq • Nuova imputazione – 1000 Genomes – Sequenze Sarde • Studi funzionali per capire meglio il ruolo di CBLB nella predisporre alla MSThursday, March 31, 2011
  79. 79. Ringraziamenti Serena Sanna Sandra Lai Andrea Angius Maristella Pitzalis Antonella Mulas Maurizio Melis Magdalena Zoledziewska Gianmauro Cuccuru Giulio Rosati Carlo Sidore Eleonora Porcu Gonçalo R Abecasis Raffaele Murru Liming Liang Manuela Uda Michael B Whalen Patrizia Zavattari Maria Giovanna Marrosu Fabio Busonero Loredana Moi David Schlessinger Andrea Maschio Elisa Deriu Francesco Cucca Gianna Costa M Francesca Urru Maria Cristina Melis Michele Bajorek Francesca Deidda Maria Anna Satta Fausto Poddie Eleonora Cocco Laura Morelli Paola Ferrigno Gabriele Farina Stefano Sotgiu Yun Li Maura Pugliatti Mariano Dei Sebastiano TraccisThursday, March 31, 2011
  80. 80. Ringraziamenti Francesco Cucca High Performance Computing and Network group - CRS4 Chris Jones Valorization and Transfert of Knowledge group - CRS4 Serena Sanna Eleonora Porcu Outreach Team - CRS4 Carlo Sidore Maria Valentini Istituto di Ricerca Genetica e Biomedica - CNR Rossano Atzeni Progenia Team - Lanusei Riccardo Berutti Frederic Reinier Università di Cagliari Università di Sassari Andrea Angius Roberto Cusano Marco Marcelli Tutti i volontari e i pazienti! Manuela Oppo Rosella Pilu Maria Francesca UrruThursday, March 31, 2011
  81. 81. Riferimenti • Sanna S. et al. A GWAS in Sardinians reveals a novel gene associated with multiple sclerosis - European Society Of Human Genetics (ESHG) 2010 • Sanna S. et al. Variants within immunoregulatory CBLB gene are associated with multiple sclerosis Nat Genet 42(6):495-7 (2010) • Sanna S. Genome-wide association studies: past, present future - Seminar (2009) • Finny Kuruvilla, Broad Institute of Harvard and MIT Massachussetts General Hospital - Genotyping on the Affymetrix platform using Birdseed (2077) • Krina T. Zondervan and Lon R. Cardon The complex interplay among factors that influence allelic association Nat Genet Reviews (2004) • Lampis et al. Human Molecular Genetics. 2000, 9, 2959-2965 • Pugliatti et al. (EBC), Eur J Neurol (2006) • J. M. Korn, et al.: Integrated genotype calling and association analysis of SNPs, common copy number polymorphisms and rare CNVs. Nat. Genet. Technical Reports, ng237 (2008) • Chiang, Y.J. et al., Nature 403, 216-20 (2000) • Yokoi N. et al., Nat Genet 31(4), 391-4 (2002) • Mordes J.P., et al. ILAR J 45(3), 278-91 (2004) • Loser, S. & Penninger, J.M. Semin. Immunol. 19, 206-214 (2007)Thursday, March 31, 2011
  82. 82. Links • http://www.affymetrix.com • http://www.illumina.com/ • http://www.appliedbiosystems.com/absite/us/en/home.html • http://genepath.med.harvard.edu/~reich/EIGENSTRAT.htm • http://hapmap.ncbi.nlm.nih.gov/ • http://www.1000genomes.org/Thursday, March 31, 2011
  83. 83. Grazie per l’attenzione! Ilenia Zara ilenia.zara@crs4.itThursday, March 31, 2011
  84. 84. BIOMEDICINA ENERGIA E AMBIENTE DATA FUSION Collana di Seminari per la Valorizzazione dei Risultati della Ricerca al CRS4 20.04.2011 prossimo appuntamento... SALA AUDITORIUM via Roma, 253 - Cagliari Seminario 11:00 -12:30 A.M. 20 aprile 2011 La “rivoluzione digitale”, in atto da anni in tutti i settori della vita quotidiana, sta investendo in modo sempre più intensivo la Medicine goes digital medicina in generale e la pratica clinica: la tecnologia è ormai diventata un fattore pervasivo ed importante nell’ambito dei processi di cura, contribuendo a migliorare l’assistenza ai pazienti. Durante il seminario, partendo dall’esperienza più che decennale del CRS4 in ricerca e sviluppo per l’impiego di informatica e tecnologia in campo medico, verranno presentate le attività di ricerca del gruppo Healthcare Flows nell’ambito delle applicazioni biomediche, dell’informatica clinica e della sanità elettronica, anche in stretta collaborazione con istituzioni sanitarie di eccellenza. In particolare si parlerà di integrazione di sistemi clinici, sicurezza e tracciabilità nei processi sanitari, gestione semantica e computazionale di dati biomedici eterogenei, medicina distribuita e telemedicina. Relatore: Riccardo Triunfo Relatore Riccardo Triunfo La “rivoluzione digitale”, in atto da anni in tutti i settori della vita quotidiana, sta investendo in modo sempre più intensivo la medicina in generale e la pratica CRS4 clinica: la tecnologia è ormai diventata un fattore pervasivo ed importante nell’ambito dei processi di cura, contribuendo a migliorare l’assistenza ai pazienti. Durante il seminario, partendo dall’esperienza più che decennale del CRS4 inThursday, March 31, 2011
  85. 85. Info e iscrizione: www.crs4.it Risorse online facebook.com/crs4fb twitter.com/crs4research youtube.com/CRS4video slideshare.net/CRS4 contatti: calis@crs4.itThursday, March 31, 2011

×