Capitolo 8
La genomica:
la mappatura e il sequenziamento
dei genomi
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
http://web.unife.it/progetti/genetica/Guido/index.php?lng=it&p=4
Domande 8
• In che modo possiamo isolare un tratto di DNA?
• In che modo possiamo clonarlo, e perché occorre farlo?
• Come si determina la sequenza di un tratto di DNA, o di un
cromosoma, o di un intero genoma?
• Come si identificano e come si descrivono i geni e le altre regioni
importanti del genoma?
• Cosa sappiamo del genoma umano e della sua variabilità?
No money? Become a geneticist!
Date Time taken N authors Cost (US dollars)
2003 (HGP) 13 years 2,800 2.7 billion
2007 (Venter) 4 years 31 100 million
2008 (Watson) 4.5 months 27 1.5 million
Oct. 2008 342,502
Oct. 2009 little 70,333
Oct. 2010 29,092
Oct. 2012 6,618
Oct. 2013 2.5 days (exome) 5,096
Oct. 2017 1 day <1,000
Al 20 aprile 2014, era stato completato il sequenziamento di 18798 genomi e
si lavorava su oltre 21626 altri progetti
Al 19 marzo 2015, era stato completato il sequenziamento di 58151 genomi
(44430 di procarioti, 1031 di Archea, 7777 di Eucarioti)
Al 27 marzo 2017, è stato completato il sequenziamento di 269968 organismi
(245764 di procarioti, 2151 di Archea, 15412 di Eucarioti)
Confronti fra genomi a diverse distanze filogenetiche
permettono di rispondere a diverse domande
Studiare proteine e DNA comporta problemi
tecnici differenti
Si possono separare alleli proteici che
differiscono perché più basici o più acidi,
grazie alla loro diversa capacità di migrare
in campo elettrico
Ma tutto il DNA ha la stessa
carica elettrica
Con l’elettroforesi si possono solo separare frammenti di DNA di diversa
grandezza (i più piccoli sono più mobili)
È possibile trattare il DNA in modo da ottenere da tutte le cellule un frammento
della stessa regione, e riconoscerlo?  Enzimi di restrizione
Figura 8.1
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Gli enzimi di restrizione riconoscono sequenze palindrome e
operano un taglio del DNA
Figura 8.2
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Diversi enzimi di restrizione
riconoscono diverse sequenze
palindrome e operano tagli diversi
(estremità adesive, estremità
piatte)
Sequenze palindrome riconosciute da diversi enzimi di restrizione
Le sonde o probe sono sequenze marcate che riconoscono
sequenze complementari e vi si legano
Digestione con diversi enzimi di restrizione, e isolamento con
sonde, di regioni mitocondriali in due specie di ape Melipona
Figura 8.3
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Un taglio che produce estremità adesive permette di
generare molecole di DNA ricombinante
ligasi
Figura 8.4
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Si possono incorporare tratti di DNA
Eucariote in plasmidi batterici, o
vettori di clonaggio.
I vettori contengono:
1.Una sequenza ori;
2.Un marcatore (qui: ampR
) che consenta
di selezionare le cellule batteriche
contenenti il vettore;
3.Uno o più siti unici di taglio per enzimi
di restrizione, dove verrà incorporato il
DNA Eucariote
Clonaggio del DNA in vettori plasmidici
Due strategie per isolare una specifica sequenza di DNA
Via mRNA e trascrittasi inversa Via enzimi di restrizione
e Southern blotting
Separazione in colonna
Trascrizione inversa
cDNA
Digestione con enzimi
di restrizione
Ibridazione con
una sonda
Lavaggio
DNA
Figura 8.5
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
La β galattosidasi, se integra e funzionante, scinde un analogo del galattosio presente
sul terreno e provoca la colorazione in blu della colonia batterica
Vettore di clonaggio pBluescript II
Dimensioni < 15 kb
Figura 8.6
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Per clonare frammenti di
dimensioni maggiori si usano
vettori BAC (fino a 300 kb)
e YAC (fino a 2 Mb)
Cromosomi artificiali
Banche genomiche
Una banca genomica o
library è un insieme di
cloni che contiene, o si
spera contenga, tutto il
DNA di un cromosoma o
di un genoma
Figura 8.7
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Creazione di banche
genomiche
Polymerase Chain Reaction
(PCR): come ottenere tante
copie dello stesso DNA
Kary Mullis
La PCR produce, attraverso n cicli di denaturazione, annealing
ed estensione, 2n copie della molecola di DNA
Figura 8.9
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Sequenziamento Sanger
Il DNA stampo viene denaturato, il primer si appaia alla
sequenza complementare, presente in una sola delle eliche
DNA stampo + primer + desossinucleotidi trifosfati + didesossinucleotidi trifosfati
Frederick Sanger
Premio Nobel 1958, 1980
Figura 8.10
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Quando sono incorporati nella nuova sequenza, i
didesossinucleotidi impediscono che venga aggiunto un
nuovo desossinucleotide, e interrompono la reazione
Ciascun tipo di didesossinucleotide viene marcato con un fluorocromo
che, se stimolato, emette luce a diversa λ
Figura 8.11 (b)
(c)
Peter J Russell, Genetica © 2010 Pearson Italia S.p.A
Il sequenziatore automatico
riconosce le λ delle fluorescenze
associate ad ogni
didesossinucleotide, e produce un
grafico in cui il colore di ciascun
picco indica la base nella sequenza
Riassumendo
1. Taglio con enzimi di restrizione. Il genoma, o un singolo cromosoma, o parte di un
cromosoma, viene ridotto in piccoli frammenti
2. Clonaggio. I frammenti vengono trasferiti su vettori plasmidici o cromosomi
artificiali, così creando una banca genomica
3. PCR. Vengono prodotte molte copie dei cloni di DNA da sequenziare
4. Sequenziamento (Sanger). La sequenza dei nucleotidi di un’elica, o di tutte e due,
viene determinata sintetizzando l’elica complementare e utilizzando
didesossinucleotidi
5. Assemblaggio. Sequenze di cloni diversi si sovrappongono, e allineandole con
metodi bioinformatici si ottengono sequenze più lunghe
Con il sequenziamento a shotgun, si sequenziano i cloni di una
library di BAC e li si allinea sfruttando le regioni di
sovrapposizione
Craig Venter
Next-Generation Sequencing (NGS)
Next-Generation Sequencing (NGS)
Next-Generation
Sequencing:
allineamento dei
reads
Confronto fra Sanger e Next-Generation sequencing
Allineando e confrontando più genomi si individuano
polimorfismi di singolo nucleotide, o SNPs (Single-Nucleotide
Polymorphisms)
Topic                         Statistic
Total size of the genome: approximately 3,200,000,000 bp*
Percentage of adenine (A) in the genome: 54%
Percentage of cytosine (C) in the genome: 38%
Percentage of bases not yet determined: 9%
Highest gene-dense chromosome: chromosome 19 with 23 genes per 1,000,000 bp*
Least gene-dense chromosomes: chromosome 13 and Y with 5 genes per 1,000,000 bp*
Percentage of DNA spanned by genes: between 25% and 38%
Percentage of exons: 1.1 to 1.4%
Percentage of introns: 24% to 37%
Percentage of intergenic DNA: 74% to 64%
The average size of a gene: 27,000 bp*
The longest gene: dystrophin (a muscle protein) with 2,400,000 bp*
Average length of an intron: 3,300 bp*
Most common length of an intron: 87 bp*
Occurrence rate of SNPs: roughly 1 per 1,500 bp*
Occurrence rate of genes: about 12 per 1,000,000 bp*
Table of Human Genome Statistics
Ma quanto siamo diversi? Quante basi del DNA lo sono?
Due cellule dello stesso individuo 0/1000
Due gemelli identici 0/1000
Due di noi a caso 1/1000
Uno di noi e uno scimpanzè 10-30/1000
Uno di noi e una banana 750/1000
Albero evolutivo del cromosoma X:
Kaessmann et al. (2001).
Le differenze genetiche nella nostra specie sono
le più basse di tutti i primati
Le differenze genetiche fra popolazioni umane sono le
più basse fra tutti i primati
0.38
0.15
0.32
Entro popolazioni
Tra popolazioni
100%
100%100%
88%88%
88%
Same diagnosis and treatment
Little or no response
Side effects or toxicity
Genetic polymorphisms affect drug response
Good response
Why does it matter? Pharmacogenomics
Target genes
DME genes
(Drug-Metabolising Enzymes)
Transporter genes
Classes of genes causing variation
in drug response
Metabolic rate – CYP2D6
Slow Normal Rapid
Amount of metabolite
in urine
N of individuals
Chinese
Swedes
Populations differ as for allele frequencies, but the whole spectrum of
phenotypes is generally present in each of them
Sintesi 8
• Gli enzimi di restrizione permettono di tagliare il DNA ottenendo da
diverse cellule gli stessi frammenti
• Le tecnologie del DNA ricombinante permettono di integrare tratti
di DNA in vettori o cromosomi artificiali, da cui possono essere escissi
e identificati da sonde o probe
• Si ottengono molte copie di un tratto di DNA attraverso la PCR
• Esistono diverse tecniche per ottenere la sequenza di un frammento
di DNA; le principali sono l’estensione del primer con l’uso di
didesossinucleotidi (metodo Sanger) e il Next-Generation sequencing
• Se si fa in modo di ottenere cloni sovrapposti, il loro allineamento
consente di ottenere sequenze via via più lunghe
• Una volta ottenuta una sequenza più o meno completa, si può
scegliere di caratterizzare solo alcuni siti noti per essere polimorfici, o
SNP
Sintesi 8
• Nel genoma umano ci sono milioni di siti polimorfici, ma in media la
differenza fra due individui è dello 0,1%, la più bassa fra i primati
• Gran parte degli alleli umani è presente, a frequenze diverse, in
popolazioni diverse e in continenti diversi
• Membri della stessa popolazione sono mediamente più simili di
membri di popolazioni diverse, ma la varianza intorno a queste medie
è altissima
• Data la struttura della diversità genomica umana, tentativi di
medicina o farmacologia razziale sono irrazionali
C’è una struttura geografica della diversità genomica umana
Modified from Lopez-Herràez et al. 2009

08 genomica

  • 1.
    Capitolo 8 La genomica: lamappatura e il sequenziamento dei genomi Peter J Russell, Genetica © 2010 Pearson Italia S.p.A http://web.unife.it/progetti/genetica/Guido/index.php?lng=it&p=4
  • 2.
    Domande 8 • Inche modo possiamo isolare un tratto di DNA? • In che modo possiamo clonarlo, e perché occorre farlo? • Come si determina la sequenza di un tratto di DNA, o di un cromosoma, o di un intero genoma? • Come si identificano e come si descrivono i geni e le altre regioni importanti del genoma? • Cosa sappiamo del genoma umano e della sua variabilità?
  • 3.
    No money? Becomea geneticist! Date Time taken N authors Cost (US dollars) 2003 (HGP) 13 years 2,800 2.7 billion 2007 (Venter) 4 years 31 100 million 2008 (Watson) 4.5 months 27 1.5 million Oct. 2008 342,502 Oct. 2009 little 70,333 Oct. 2010 29,092 Oct. 2012 6,618 Oct. 2013 2.5 days (exome) 5,096 Oct. 2017 1 day <1,000
  • 4.
    Al 20 aprile2014, era stato completato il sequenziamento di 18798 genomi e si lavorava su oltre 21626 altri progetti
  • 5.
    Al 19 marzo2015, era stato completato il sequenziamento di 58151 genomi (44430 di procarioti, 1031 di Archea, 7777 di Eucarioti)
  • 6.
    Al 27 marzo2017, è stato completato il sequenziamento di 269968 organismi (245764 di procarioti, 2151 di Archea, 15412 di Eucarioti)
  • 7.
    Confronti fra genomia diverse distanze filogenetiche permettono di rispondere a diverse domande
  • 8.
    Studiare proteine eDNA comporta problemi tecnici differenti Si possono separare alleli proteici che differiscono perché più basici o più acidi, grazie alla loro diversa capacità di migrare in campo elettrico Ma tutto il DNA ha la stessa carica elettrica Con l’elettroforesi si possono solo separare frammenti di DNA di diversa grandezza (i più piccoli sono più mobili) È possibile trattare il DNA in modo da ottenere da tutte le cellule un frammento della stessa regione, e riconoscerlo?  Enzimi di restrizione
  • 9.
    Figura 8.1 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A Gli enzimi di restrizione riconoscono sequenze palindrome e operano un taglio del DNA
  • 10.
    Figura 8.2 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A Diversi enzimi di restrizione riconoscono diverse sequenze palindrome e operano tagli diversi (estremità adesive, estremità piatte)
  • 11.
    Sequenze palindrome riconosciuteda diversi enzimi di restrizione
  • 12.
    Le sonde oprobe sono sequenze marcate che riconoscono sequenze complementari e vi si legano
  • 13.
    Digestione con diversienzimi di restrizione, e isolamento con sonde, di regioni mitocondriali in due specie di ape Melipona
  • 14.
    Figura 8.3 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A Un taglio che produce estremità adesive permette di generare molecole di DNA ricombinante ligasi
  • 15.
    Figura 8.4 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A Si possono incorporare tratti di DNA Eucariote in plasmidi batterici, o vettori di clonaggio. I vettori contengono: 1.Una sequenza ori; 2.Un marcatore (qui: ampR ) che consenta di selezionare le cellule batteriche contenenti il vettore; 3.Uno o più siti unici di taglio per enzimi di restrizione, dove verrà incorporato il DNA Eucariote Clonaggio del DNA in vettori plasmidici
  • 16.
    Due strategie perisolare una specifica sequenza di DNA Via mRNA e trascrittasi inversa Via enzimi di restrizione e Southern blotting Separazione in colonna Trascrizione inversa cDNA Digestione con enzimi di restrizione Ibridazione con una sonda Lavaggio DNA
  • 17.
    Figura 8.5 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A La β galattosidasi, se integra e funzionante, scinde un analogo del galattosio presente sul terreno e provoca la colorazione in blu della colonia batterica Vettore di clonaggio pBluescript II Dimensioni < 15 kb
  • 18.
    Figura 8.6 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A Per clonare frammenti di dimensioni maggiori si usano vettori BAC (fino a 300 kb) e YAC (fino a 2 Mb) Cromosomi artificiali
  • 19.
    Banche genomiche Una bancagenomica o library è un insieme di cloni che contiene, o si spera contenga, tutto il DNA di un cromosoma o di un genoma
  • 20.
    Figura 8.7 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A Creazione di banche genomiche
  • 21.
    Polymerase Chain Reaction (PCR):come ottenere tante copie dello stesso DNA Kary Mullis
  • 22.
    La PCR produce,attraverso n cicli di denaturazione, annealing ed estensione, 2n copie della molecola di DNA
  • 23.
    Figura 8.9 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A Sequenziamento Sanger Il DNA stampo viene denaturato, il primer si appaia alla sequenza complementare, presente in una sola delle eliche DNA stampo + primer + desossinucleotidi trifosfati + didesossinucleotidi trifosfati Frederick Sanger Premio Nobel 1958, 1980
  • 24.
    Figura 8.10 Peter JRussell, Genetica © 2010 Pearson Italia S.p.A Quando sono incorporati nella nuova sequenza, i didesossinucleotidi impediscono che venga aggiunto un nuovo desossinucleotide, e interrompono la reazione Ciascun tipo di didesossinucleotide viene marcato con un fluorocromo che, se stimolato, emette luce a diversa λ
  • 26.
    Figura 8.11 (b) (c) PeterJ Russell, Genetica © 2010 Pearson Italia S.p.A Il sequenziatore automatico riconosce le λ delle fluorescenze associate ad ogni didesossinucleotide, e produce un grafico in cui il colore di ciascun picco indica la base nella sequenza
  • 27.
    Riassumendo 1. Taglio conenzimi di restrizione. Il genoma, o un singolo cromosoma, o parte di un cromosoma, viene ridotto in piccoli frammenti 2. Clonaggio. I frammenti vengono trasferiti su vettori plasmidici o cromosomi artificiali, così creando una banca genomica 3. PCR. Vengono prodotte molte copie dei cloni di DNA da sequenziare 4. Sequenziamento (Sanger). La sequenza dei nucleotidi di un’elica, o di tutte e due, viene determinata sintetizzando l’elica complementare e utilizzando didesossinucleotidi 5. Assemblaggio. Sequenze di cloni diversi si sovrappongono, e allineandole con metodi bioinformatici si ottengono sequenze più lunghe
  • 28.
    Con il sequenziamentoa shotgun, si sequenziano i cloni di una library di BAC e li si allinea sfruttando le regioni di sovrapposizione Craig Venter
  • 29.
  • 30.
  • 32.
  • 33.
    Confronto fra Sangere Next-Generation sequencing
  • 34.
    Allineando e confrontandopiù genomi si individuano polimorfismi di singolo nucleotide, o SNPs (Single-Nucleotide Polymorphisms)
  • 35.
    Topic                         Statistic Total sizeof the genome: approximately 3,200,000,000 bp* Percentage of adenine (A) in the genome: 54% Percentage of cytosine (C) in the genome: 38% Percentage of bases not yet determined: 9% Highest gene-dense chromosome: chromosome 19 with 23 genes per 1,000,000 bp* Least gene-dense chromosomes: chromosome 13 and Y with 5 genes per 1,000,000 bp* Percentage of DNA spanned by genes: between 25% and 38% Percentage of exons: 1.1 to 1.4% Percentage of introns: 24% to 37% Percentage of intergenic DNA: 74% to 64% The average size of a gene: 27,000 bp* The longest gene: dystrophin (a muscle protein) with 2,400,000 bp* Average length of an intron: 3,300 bp* Most common length of an intron: 87 bp* Occurrence rate of SNPs: roughly 1 per 1,500 bp* Occurrence rate of genes: about 12 per 1,000,000 bp* Table of Human Genome Statistics
  • 36.
    Ma quanto siamodiversi? Quante basi del DNA lo sono? Due cellule dello stesso individuo 0/1000 Due gemelli identici 0/1000 Due di noi a caso 1/1000 Uno di noi e uno scimpanzè 10-30/1000 Uno di noi e una banana 750/1000
  • 37.
    Albero evolutivo delcromosoma X: Kaessmann et al. (2001). Le differenze genetiche nella nostra specie sono le più basse di tutti i primati
  • 38.
    Le differenze genetichefra popolazioni umane sono le più basse fra tutti i primati 0.38 0.15 0.32 Entro popolazioni Tra popolazioni
  • 40.
  • 43.
    Same diagnosis andtreatment Little or no response Side effects or toxicity Genetic polymorphisms affect drug response Good response Why does it matter? Pharmacogenomics
  • 44.
    Target genes DME genes (Drug-MetabolisingEnzymes) Transporter genes Classes of genes causing variation in drug response
  • 45.
    Metabolic rate –CYP2D6 Slow Normal Rapid Amount of metabolite in urine N of individuals Chinese Swedes Populations differ as for allele frequencies, but the whole spectrum of phenotypes is generally present in each of them
  • 46.
    Sintesi 8 • Glienzimi di restrizione permettono di tagliare il DNA ottenendo da diverse cellule gli stessi frammenti • Le tecnologie del DNA ricombinante permettono di integrare tratti di DNA in vettori o cromosomi artificiali, da cui possono essere escissi e identificati da sonde o probe • Si ottengono molte copie di un tratto di DNA attraverso la PCR • Esistono diverse tecniche per ottenere la sequenza di un frammento di DNA; le principali sono l’estensione del primer con l’uso di didesossinucleotidi (metodo Sanger) e il Next-Generation sequencing • Se si fa in modo di ottenere cloni sovrapposti, il loro allineamento consente di ottenere sequenze via via più lunghe • Una volta ottenuta una sequenza più o meno completa, si può scegliere di caratterizzare solo alcuni siti noti per essere polimorfici, o SNP
  • 47.
    Sintesi 8 • Nelgenoma umano ci sono milioni di siti polimorfici, ma in media la differenza fra due individui è dello 0,1%, la più bassa fra i primati • Gran parte degli alleli umani è presente, a frequenze diverse, in popolazioni diverse e in continenti diversi • Membri della stessa popolazione sono mediamente più simili di membri di popolazioni diverse, ma la varianza intorno a queste medie è altissima • Data la struttura della diversità genomica umana, tentativi di medicina o farmacologia razziale sono irrazionali
  • 48.
    C’è una strutturageografica della diversità genomica umana Modified from Lopez-Herràez et al. 2009