Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Gen pop1var

5,072 views

Published on

  • Be the first to comment

  • Be the first to like this

Gen pop1var

  1. 1. Genetica di popolazioni Guido Barbujani Dip. Scienze della Vita e Biotecnologie, Università di Ferrara g.barbujani@unife.it
  2. 2. Obiettivi del corso: Capire le basi genetiche dell’evoluzione Arrivare a porsi domande scientificamente corrette Arrivare a poter leggere criticamente un articolo ESERCIZI: http://darwin.eeb.uconn.edu/simulations/simulations.html
  3. 3. Dipartimento di Scienze della Vita e Biotecnologie g.barbujani@unife.it Ricevimento: stanza 12, lunedì 14.30 – 16.00
  4. 4. TESTO ADOTTATO J.H. Relethford (2013) Genetica delle popolazioni umane. Ambrosiana, 36 Euro. ESERCIZI: http://www.evolution.unibas.ch/teaching/evol_genetics/index.htm
  5. 5. Conner & Hartl. Elementi di Genetica ecologica, Piccin Frankham, Ballou, Briscoe. Fondamenti di Genetica della conservazione, Zanichelli Hartl & Clark. Principles of poplation genetics. Sinauer
  6. 6. ALCUNE DOMANDE IMPORTANTI • Con che frequenza troviamo unioni consanguinee nelle popolazioni, e quali effetti hanno? • Cosa ci dice la diversità genetica riguardo alla storia delle diverse specie? • Come possiamo utilizzare dati genetici per ricostruire la storia delle migrazioni? • Perché alcune popolazioni presentano frequenze elevate di alleli patologici? • Perché alcune piccole popolazioni sono così diverse da quelle vicine? • Quali sono state le relazioni genealogiche fra forme viventi comparse in momenti diversi dell’evoluzione? • Cosa possiamo fare per preservare la biodiversità?
  7. 7. Cose da ricordare, per cominciare 1. Cos’è un gene, un allele, un aplotipo 2. Com’è fatto il DNA 3. Com’è fatto un gene Eucariote 4. Com’è fatto un gene procariote 5. Com’è la struttura dei geni (siti codificanti, siti di regolazione, introni, esoni) 6. Come funzionano i geni
  8. 8. Cosa vuol dire che due geni sono associati? Se le coppie A,a e B,b sono associate che gameti produce il genotipo AaBb e il genotipo Aa BB? Se AaBb si incrocia con AaBb che tipi di figli può avere? Se AaBb si incrocia con aabb che tipi di figli può avere? Cosa si intende per locus genico? Cosa si intende per allele? Cosa vuol dire che due geni sono indipendenti? Se le coppie A,a e B,b sono indipendenti che gameti produce il genotipo AaBb? E il genotipo Aa BB?
  9. 9. Che cos’è il crossing-over? Se c’è crossing-over tra due geni associati, gli effetti del crossing-over sono evidenziabili nei gameti? In che modo i geni codificano le proteine? Cosa significa dire che i gameti sono aploidi? Qual è la differenza tra meiosi e mitosi? Che differenza c’è tra popolazione e specie? Quanti alleli di un dato locus ci sono in una popolazione? Specie diverse con lo stesso numero di cromosomi si possono incrociare?
  10. 10. Programma del corso 1. Diversità genetica 2. Equilibrio di Hardy-Weinberg 3. Inbreeding 4. Linkage disequilibrium 5. Mutazione 6. Deriva genetica 7. Flusso genico e varianze genetiche 8. Selezione 9. Mantenimento dei polimorfismi e teoria neutrale 10. Introduzione alla teoria coalescente 11. Struttura e storia della popolazione umana + Lettura critica di articoli
  11. 11. Programma del corso 1. Diversità genetica 2. Equilibrio di Hardy-Weinberg 3. Inbreeding 4. Linkage disequilibrium 5. Mutazione 6. Deriva genetica 7. Flusso genico e varianze genetiche 8. Selezione 9. Mantenimento dei polimorfismi e teoria neutrale 10. Introduzione alla teoria coalescente 11. Struttura e storia della popolazione umana + Lettura critica di articoli
  12. 12. Conosciamo 1,6 milioni di specie, stimiamo che ne esistano >10 milioni
  13. 13. Prima di tutto: non c’è genetica senza variabilità Variabilità morfologica
  14. 14. 1. Variabilità morfologica 2. Variabilità serologica 3. Variabilità proteica 4. Variabilità del DNA 4.1. Varianti di singolo nucleotide: Single-Nucleotide Polymorphisms (SNP) 4.2. Varianti di lunghezza: Inserzioni/delezioni (Indel), Variable Number of Tandem Repeats (VNTR), Short Tandem Repeats (STR) 4.3. Varianti strutturali: Copy-Number Variation (CNV)
  15. 15. 1. Variabilità morfologica
  16. 16. 2. Variabilità serologica 3. Variabilità proteica
  17. 17. Variabilità genetica: Proteine, Test serologici J.B.S. Haldane: Frequenza dell’allele AB0*B in Europa
  18. 18. Quanto DNA in una cellula? Nell’uomo: 6 miliardi di paia di basi nei 46 cromosomi 1 base ≈ 0,8 mμ 6 miliardi di basi ≈ 5 m di DNA in 5-20 μ 5-20 μ
  19. 19. Quanto DNA in una cellula? 6 miliardi di paia di basi 1 base ≈ 0,8 mμ 6 miliardi di basi ≈ 5 m di DNA in 5-20 μ Foglio A4, 60 battute per riga. 30 righe = 1800 basi su ogni foglio, due facciate ≈ 2000 basi Se 100 fogli = 1 cm 6 miliardi di paia di basi ≈ 15000 cm = 150 m
  20. 20. Variabilità genetica: Sequenze di DNA
  21. 21. Applicazioni: Confronti fra sequenze in casi forensi
  22. 22. Applicazioni: Genetic variation in Arabidopsis thaliana: SNPs Nordborg et al., 2005 PLoS Biology
  23. 23. Some human genome statistics Total size 3 190 491 286 bp (male, haploid) [was 3 283 984 159 in Dec. 2011] N of protein-coding genes 21 224 [were 20 442] N of RNA genes 15 952 N of pseudogenes 14 427 N of gene exons 679 045 N of gene transcripts 194 015 N of short variants 52 126 039 (+ 13.4 million: Lachance et al. 2012) N of structural variants 6 303 392 From Ensembl Release 68, July 2012 Nucleotide differences with chimp 1.5 % Structural differences with chimp 4% Human genes missing in chimp 60 (expressed mainly in cerebral cortex and testes) From Wu et al. (2011) PLoS Genet
  24. 24. Some human genome statistics Total size 3 241 953 429 bp (male, haploid) [was 3 545 835 014 in June 2015] N of protein-coding genes 19 034 [were 20 296] N of pseudogenes 13 151 [were 14 424] N of non-coding genes 25 173 (7 703 small, 14 889 long + 2 307 unclassified) N of gene transcripts 198 634 N of short variants 148 892 479 [were 52 million] N of structural variants 4 363 564 [were 6 million] N of proteins 79 086 Human Genome Assembly GRCh38.p10, January 2017 Nucleotide differences with chimp 1.5 % Structural differences with chimp 4% Human genes missing in chimp 60 (expressed mainly in cerebral cortex and testes) From Wu et al. (2011) PLoS Genet
  25. 25. Some human genome statistics
  26. 26. I geni trascritti in proteine rappresentano negli Eucarioti fra il 5% e il 10% del genoma Parte del restante 90-95% non è funzionale (junk DNA), ma un’altra parte contiene importanti siti di regolazione
  27. 27. Human-mouse alignment Human-chimp alignment
  28. 28. Tipi di polimorfismo studiati nel DNA 1. Single Nucleotide Polymorphism: SNP 2. Inserzione/delezione 3. Variazione del numero di copie: Indel, STR, VNTR, 4. Variazione strutturale: CNV
  29. 29. Tipi di polimorfismo studiati nel DNA 1. SNP 2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010) 2017: Almeno 148 milioni di SNPs nel genoma umano
  30. 30. Tipi di polimorfismo studiati nel DNA 1. SNP: Restrizione
  31. 31. Tipi di polimorfismo studiati nel DNA 1. SNP: Fasi preparatorie al sequenziamento
  32. 32. Tipi di polimorfismo studiati nel DNA 1. SNP: Sequenziamento Qual è il vantaggio del sequenziamento rispetto alla restrizione?
  33. 33. Tipi di polimorfismo studiati nel DNA 1. SNP: Costruzione di aplotipi
  34. 34. Tipi di polimorfismo studiati nel DNA 1. SNP: Effetti fenotipici Cioè in regioni: introniche codificanti regolatrici intergeniche Con sostituzioni: nonsinonime sinonime
  35. 35. Tipi di polimorfismo studiati nel DNA 1. SNP: Effetti fenotipici
  36. 36. Tipi di polimorfismo studiati nel DNA 2. Inserzione/delezione: Indel
  37. 37. Tipi di polimorfismo studiati nel DNA 2. Inserzione/delezione: Indel Pereira et al. Genet. Mol. Res. 5 (1): 63-71 (2006)
  38. 38. Tipi di polimorfismo studiati nel DNA 2. Inserzione/delezione: Indel, inserzione di un retrovirus
  39. 39. Tipi di polimorfismo studiati nel DNA 3. Variazione del numero di copie: STR
  40. 40. Tipi di polimorfismo studiati nel DNA 3. Variazione del numero di copie: STR
  41. 41. Tipi di polimorfismo studiati nel DNA 3. Variazione del numero di copie: STR
  42. 42. Tipi di polimorfismo studiati nel DNA 3. Variazione del numero di copie: I loci STR del CODIS
  43. 43. Tipi di polimorfismo studiati nel DNA 3. Variazione del numero di copie: STR & VNTR
  44. 44. Tipi di polimorfismo studiati nel DNA 4. Variazione strutturale: CNV
  45. 45. Tipi di polimorfismo studiati nel DNA 4. Variazione strutturale: CNV An ~11kb deletion on chromosome 8 revealed by ultra-high resolution CGH. Blue lines: individuals with two copies. Red line: individual with zero copies.
  46. 46. Tipi di polimorfismo studiati nel DNA 4. Variazione strutturale: CNV La CGH (Comparative Genomic Hybridization) rileva variazioni del numero di copie di geni. Competizione per il legame su cromosomi in metafase di due DNA genomici marcati con fluorocromi diversi. Un DNA è estratto dal paziente in esame mentre l’altro DNA è un pool di DNA genomico di riferimento. Si legherà in proporzione più DNA se maggiore sarà il numero di copie presenti in quel locus rispetto al numero di copie presenti nel DNA genomico di controllo. Viceversa se ne legherà meno se minore sarà il numero di copie presenti in quel locus rispetto al numero di copie presenti nel DNA genomico di controllo.
  47. 47. 4. Variazione strutturale: CNV Marques-Bonet et al. (2009) Trends in Genetics 25:443-454
  48. 48. Average mutation rates for different polymorphisms (per locus per generation) VNTR 10-1 – 10-2 STR 10-2 – 10-4 SNPs 10-6 – 10-8 Indel (retrovirus) 10-10 – 10-11 CNV ?  In the mitochondrial DNA hypervariable region, up to 5 x 10-5 per site per generation
  49. 49. Quand’è che una popolazione può dirsi variabile? A B
  50. 50. Misure di diversità genetica • N di alleli • Eterozigosi osservata: Ho = N genotipi eteroz./N genotipi totali • Eterozigosi attesa: H = 1 –Σ pi 2 (la frazione di individui che ci si aspetta siano eterozigoti a un gene sconosciuto)
  51. 51. Quand’è che una popolazione può dirsi variabile? A B N alleli = 5 N alleli = 2 HO = 0.4 HO = 0.6 H = 0.35 H = 0.5 Quando il genotipo individuale è difficile da prevedere
  52. 52. Quand’è che una popolazione può dirsi variabile? • Quando molti siti del DNA sono variabili diversità nucleotidica: π = N siti polimorfici / N totale siti • Quando ci sono grandi differenze molecolari fra I suoi membri mismatch medio: k = Σ dij / [N (N-1) / 2]
  53. 53. Il mismatch è il numero di sostituzioni fra coppie di individui TCTAGA CCTAGA CCTAGG CTTAGA CTTAAA 1 2 3 1 1 2 3 1 2 2 Σ dij = 18 k = 1.8
  54. 54. Si può calcolare il mismatch sia all’interno delle popolazioni, sia fra di loro k (rosa) = 2.0 k (fra) = 4.3 k (verde) 2.8 La distanza dAB di Nei è il rapporto fra il mismatch fra popolazioni e la media dei mismatch interni dAB = k (fra) / [(k (rosa) + k (verde) / 2] = 4.3 / [(2.0 + 2.8) / 2] = 4.3 / 2.4 = 1.79
  55. 55. Quanto polimorfismo c’è nel DNA della nostra specie? Goldman et al. (1987) PNAS
  56. 56. Livelli di diversità fra uomo e scimpanzè Tempi di dissociazione indicano una differenza pari all’1.76% (Sibley & Ahlquist, 1984)
  57. 57. Livelli di polimorfismo nell’uomo: SNP 35 milioni di SNP fra uomo e scimpanzè. Su un totale di 3 miliardi di basi (genoma aploide)  1.23% (Chimpanzee Genome Sequencing Consortium, 2005) Di questi SNP, 1.06% fissati fra specie 0.17% polimorfici nell’uomo Kaessmann et al. (2001)
  58. 58. Livelli di polimorfismo nell’uomo: Indel Origine della duplicazione Siti di inserzione Marquès-Bonet et al. (2009)
  59. 59. Livelli di polimorfismo nell’uomo: genomi completi Nel 2010 erano 14 i genomi interamente sequenziati (6 miliardi di paia di basi) Oggi 1-20 giorni 1 tecnico < 1000 euro 60 x 1 1
  60. 60. Africa del sud Americani bianchi Yoruba Asiatici Polimorfici almeno lo 0.13% dei siti Nel 2010 erano 14 i genomi interamente sequenziati (6 miliardi di paia di basi)
  61. 61. Nel 2017 i genomi umani interamente sequenziati sono migliaia Population Number of Individual DNA Samples African Caribbean in Barbados [ACB] 79 African Ancestry in SW USA [ASW] 62 British From England and Scotland [GBR] 100 Chinese Dai in Xishuangbanna, China [CDX] 100 Colombian in Medellín, Colombia [CLM] 105 Finnish in Finland [FIN] 100 Han Chinese in Beijing, China [CHB] 120 Han Chinese South [CHS] 150 Iberian Populations in Spain [IBS] 150 Japanese in Tokyo, Japan [JPT] 120 Kinh in Ho Chi Minh City, Vietnam [KHV] 100 Luhya in Webuye, Kenya [LWK] 120 Mexican Ancestry in Los Angeles [MXL] 71 Peruvian in Lima Peru [PEL] 105 Puerto Rican in Puerto Rico [PUR] 105 Toscani in Italia [TSI] 114 Yoruba in Ibadan, Nigeria [YRI] 62
  62. 62. 1000Genomes Project Consortium (2015) Nature 526: 68-74
  63. 63. Livelli di polimorfismo nell’uomo: genomi completi
  64. 64. N of markers Samples FST Reference 599,356 SNPs 209 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba 0.13 Weir et al. 2005 1,034,741 SNPs 71 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba 0.10 Weir et al. 2005 1,007,329 SNPs 269 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba 0.12 International HapMap Consortium 2005 443,434 SNPs 3845 worldwide distributed individuals 0.052 Auton et al. 2009 2,841,354 SNPs 210 individuals from 4 populations: Caucasian, Chinese, Japanese, Yoruba 0.11 Barreiro et al. 2008 243,855 SNPs 554 individuals from 27 worldwide populations 0.123 Xing et al. 2009 100 Alu insertions 710 individuals from 23 worldwide populations 0.095 Watkins et al. 2008 67 CNVs 270 individuals from 4 populations with ancestry in Europe, Africa or Asia 0.11 Redon et al. 2006 Le stime genomiche di FST per la popolazione umana globale sono ∼ 0.12 Le popolazioni umane esprimono ∼ 12% della varianza massima possibile, date le loro frequenze alleliche
  65. 65. 100% 100%100% I membri della nostra comunità sono solo un po’ più simili a noi dei membri di comunità molto lontane 88%88% 88% Cosa vuol dire?
  66. 66. Due persone dello stesso continente possono essere geneticamente più distanti di persone di continenti diversi.
  67. 67. In the 117 megabases (Mb) of sequenced exome-containing intervals, the average rate of nucleotide difference between a pair of the Bushmen was 1.2 per kb, compared to an average of 1.0 per kb between a European and Asian individual. Schuster et al. (2010) In media, ci sono differenze più grandi fra due africani che fra europei e asiatici
  68. 68. Nota bene La variabilità interna di una popolazione è solo uno degli aspetti della variabilità genetica: Variabilità tra individui della stessa popolazione Variabilità tra individui di popolazioni diverse Variabilità tra individui di gruppi di popolazioni diverse eccetera
  69. 69. PS: Cos’è una popolazione? Hendrick: un gruppo di individui che si accoppiano e coesistono nel tempo e nello spazio In pratica, si usano come unità operative di analisi gruppi di individui localizzati nello spazio, che spesso hanno in comune vari tratti culturali, come mezzi di sussistenza, lingua, casta (in India), religione. La scelta dell’unità operativa di analisi dipende spesso (a) dalla domanda scientifica che ci si pone e (b) dalla effettiva disponibilità di dati
  70. 70. Riassunto • La genetica di popolazioni è un ramo della genetica, e quindi si occupa di studiare la variabilità. • Si può descrivere la variabilità o diversità genetica a partire dal fenotipo (morfologia o proteina) o dal genotipo (DNA). • La diversità del DNA è dovuta a polimorfismi di singolo nucleotide (SNP), alla presenza di elementi ripetuti (STR e VNTR) e alla presenza di delezioni, inserzioni o duplicazioni (CNV). • Per quantificare la diversità genetica all’interno di una popolazione si ricorre a statistiche, fra cui: (1) numero di alleli; (2) eterozigosi osservata; (3) eterozigosi attesa; (4) polimorfismo nucleotidico; (5) differenza media a coppie o mismatch. • Il mismatch medio può essere calcolato sia all’interno delle singole popolazione, sia fra popolazioni differenti, il che porta a una semplice statistica, la distanza dAB di Nei, che quantifica la differenza genetica fra popolazioni.

×