SlideShare a Scribd company logo
1 of 92
Download to read offline
Information Technology e DNA

                 dal 1953 ad oggi


Dr.ssa Patricia Rodriguez-Tomé
prtome@crs4.it
original papers
                                                                                                                                    1953                                                            original papers




                                                                                                                   25 Aprile 1953
                                                                                                                  Nature p:737-741
                                                                                             original papers




RE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature   © 2003 Nature Publishing Group                         397


                                                                                           1953 scoperta                                                                                             400                   © 2003 Nature Publishing Group   NATURE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature

                                                                                          della struttura del
                                                                                           DNA
                                                                                             398                                                       NATURE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature
                                                                                                                      © 2003 Nature Publishing Group




    1850                                     1900                            1950                      1960                                                   1975                                                  1990           2000                             2005                                  20102
Facciamo un passo
                   indietro...



                      1953 scoperta
                     della struttura del
                      DNA




1850   1900   1950               1960      1975   1990   2000   2005   20103
Eredità biologica




1850   1900   1950    1960   1975   1990   2000   2005   20104
Come si trasmettono i caratteri ereditari
          da una generazione a un’altra?




1850   1900   1950   1960   1975   1990   2000   2005   20105
Mendel

                                Gregor Mendel (1822 - 1884)
                                Leggi dell'Ereditarietà di Mendel (1865)
                                “L’origine delle specie” di Darwin (1859)


  • Frate agostiniano, laureato in
    matematica e scienze
  • Abate del monastero di Brno (ora
    Rep. Ceca)
  • Appassionato di botanica
         1865
       Leggi di             1953 scoperta
        Mendel             della struttura del
                            DNA




1850         1900   1950               1960         1975   1990   2000   2005   20106
Mendel




                                Il lavoro di Mendel è stato inizialmente ignorato
                               Solo dopo 35 anni è stato riscoperto e apprezzato
         1865
                    1900
       Leggi di
                  riscoperta Leggi
        Mendel
                    di Mendel




1850         1900           1950      1960            1975          1990    2000    2005   20107
Dove si trovano i geni?




            1900
          riscoperta Leggi
            di Mendel




1850   1900         1950     1960   1975   1990   2000   2005   20108
Cromosomi




       Cellula vegetale in telofase



                   1927 I geni
                  sono
                  localizzati sui
                   cromosomi                      Il moscerino della frutta:
                                                  Drosophila melanogaster

1850    1900      1950              1960   1975             1990      2000     2005   20109
Morgan e collaboratori
       Columbia University




                                                             Hermann Joseph Muller (1890
                                     Thomas Hunt Morgan         - 1967) collaboratore di
                                     (1866 - 1945)             Morgan medico e genetista
                                     genetista e biologo -    1946 Premio Nobel Medicina
                                     1933 Premio Nobel
                                     Medicina

   Alfred H. Sturtevant (1891 - 1970)
   studente del laboratorio di Morgan

                 1927 I geni
                sono
                localizzati sui
                 cromosomi




1850     1900     1950            1960            1975           1990    2000   2005   201010
Di cosa sono fatti i geni?




               1927 I geni
              sono
              localizzati sui
               cromosomi




1850   1900     1950            1960   1975   1990   2000   2005   201011
DNA
 La molecola di DNA contiene l’informazione genetica




                                                             Virus sulla superficie di
       Alfred Hershey (1908 - 1997)                              Escherichia coli
       (1969: nobel per la medicina)
        Martha Chase (1927 - 2003)

                                                       Cold Spring Harbor, Washington
                           1952
                        L’informazione
                        genetica è contenuta
                         nel DNA




1850    1900    1950       1960                 1975           1990     2000    2005     201012
Come può la molecola del DNA
              contenere tanta informazione?




                          1952
                       L’informazione
                       genetica è contenuta
                        nel DNA




1850   1900     1950      1960                1975   1990   2000   2005   201013
doppia elica (Cambridge)

       1953: Watson & Crick

                                               James Watson (1928 -) biologo molecolare
                                               e genetico
                                               Francis Crick (1916 - 2004) fisico che
                                               diventò biologo molecolare, biofisico e
                                               neuroscienziato

                                               Scoperta della struttura a doppia elica del
                                               DNA

                                               Watson e Crick interpretarono le informazioni
                                               che già esistevano, prodotte da esperimenti e
                                               studi di altri ricercatori, ma ebbero l’intuizione
                                               giusta prima di tutti gli altri.

  1865                    1953 scoperta
Leggi di                 della struttura del
 Mendel                   DNA




1850       1900   1950               1960       1975             1990      2000     2005      201014
The Eagle




                                       Il pub del “DNA” a Cambridge




1850   1900   1950   1960       1975       1990    2000   2005   201015
original papers   1953
             25 Aprile 1953
             Nature p:737-741
                                                                                                                                                                                             original papers
                                                                                                   original papers                                                                                                           Franklin & Gosslin




                                                                                                                                                                Wilkins
                                                                                                            398                © 2003 Nature Publishing Group   NATURE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature




                                                                                                                    Watson & Crick
                                                                                            1953 scoperta
                                                                                           della struttura del
                                                                                            DNA
URE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature   © 2003 Nature Publishing Group                          397

                                                                                                                                                                                             400                                   © 2003 Nature Publishing Group   NATURE | VOL 421 | 23 JANUARY 2003 | www.nature.com/




    1850                                     1900                            1950                      1960                           1975                                                                         1990          2000                      2005                                201016
Premio Nobel
       1962
       Premio
       Nobel in
       Fisiologia e
       Medicina




                   1953
                                       1962 Premio Nobel per
                struttura del
                                       Watson e Crick
                   DNA




1850     1900            1950   1960                     1975   1990   2000   2005   201017
DNA
                         DeoxyriboNucleic Acid = acido desossiribonucleico




                                         il DNA è un polimero composto da milioni
                                         di piccole unità chiamate NUCLEOTIDI,
        Gruppo                           costituite da tre componenti
        fosfato                          fondamentali


                                                                  Basa
                                                                 azotata
                                               zucchero
                                               pentoso


                          1953 scoperta
                         della struttura del
                          DNA




1850   1900       1950               1960                 1975    1990     2000   2005   201018
ATCG
          Le basi azotate sono quattro: Adenina, Timina, Citosina, Guanina




                                 Adenine
                                                                    Thymine




                                            Cytosine
                       1953 scoperta
                      della struttura del                           Guanine
                       DNA




1850   1900    1950               1960             1975   1990   2000   2005   201019
ATCG




               Adenine

1850   1900   1950       1960    1975   1990   2000   2005   201020
ATCG




               Thymine

1850   1900   1950       1960    1975   1990   2000   2005   201021
ATCG




              Cytosine

1850   1900   1950       1960    1975   1990   2000   2005   201022
ATCG




               Guanine

1850   1900   1950       1960    1975   1990   2000   2005   201023
DNA




                                           http://www.youtube.com/watch?v=qYsW0jIFH5A




                      1953 scoperta
                     della struttura del
                      DNA




1850   1900   1950               1960            1975          1990    2000    2005     201024
Leggere la sequenza dei
            nucleotidi per conoscere le
         informazioni genetiche codificate



                      1953 scoperta
                     della struttura del
                      DNA




1850   1900   1950               1960      1975   1990   2000   2005   201025
sequenziamento
  1955: sequenza di una proteina - l’insulina

                                                Frederick Sanger (1918 - )
                                                è un biochimico britannico

  1958 : premio Nobel per la chimica


 1975: sviluppo del metodo della
 terminazione della catena per il
 sequenziamento del DNA.

 1977: prima sequenza di DNA di un
 genoma completo, del Fago Φ-X174




   1980: premio Nobel per la chimica        1975 Metodo di
                                           Sanger per il
                                            sequenziamento




1850   1900    1950      1960           1975                 1990   2000   2005   201026
metodo di Sanger




                                 1975 Metodo di
                                Sanger per il
                                 sequenziamento




1850   1900   1950    1960   1975                 1990   2000   2005   201027
1975 Metodo di
                               Sanger per il
                                sequenziamento




1850   1900   1950   1960   1975                 1990   2000   2005   201028
http://www.snv.jussieu.fr/vie/dossiers/sequencage/lectureATGC1.swf




                                               1975 Metodo di
                                              Sanger per il
                                               sequenziamento




1850   1900   1950        1960             1975                 1990   2000   2005   201029
sequenza di DNA


       SQ    Sequence 1859 BP; 609   A; 314 C; 355 G; 581 T; 0 other;
             aaacaaacca aatatggatt   ttattgtagc catatttgct ctgtttgtta      ttagctcatt     60
             cacaattact tccacaaatg   cagttgaagc ttctactctt cttgacatag      gtaacctgag    120
             tcggagcagt tttcctcgtg   gcttcatctt tggtgctgga tcttcagcat      accaatttga    180
             aggtgcagta aacgaaggcg   gtagaggacc aagtatttgg gataccttca      cccataaata    240
             tccagaaaaa ataagggatg   gaagcaatgc agacatcacg gttgaccaat      atcaccgcta    300
             caaggaagat gttgggatta   tgaaggatca aaatatggat tcgtatagat      tctcaatctc    360
             ttggccaaga atactcccaa   agggaaagtt gagcggaggc ataaatcacg      aaggaatcaa    420
             atattacaac aaccttatca   acgaactatt ggctaacggt atacaaccat      ttgtaactct    480
             ttttcattgg gatcttcccc   aagtcttaga agatgagtat ggtggtttct      taaactccgg    540
             tgtaataaat gattttcgag   actatacgga tctttgcttc aaggaatttg      gagatagagt    600
             gaggtattgg agtactctaa   atgagccatg ggtgtttagc aattctggat      atgcactagg    660
             aacaaatgca ccaggtcgat   gttcggcctc caacgtggcc aagcctggtg      attctggaac
       //




                                                       1975 Metodo di
                                                      Sanger per il
                                                       sequenziamento




1850        1900     1950      1960                1975                 1990     2000   2005   201030
1975 Metodo di
                               Sanger per il
                                sequenziamento




1850   1900   1950   1960   1975                 1990   2000   2005   201031
software




1850   1900   1950   1960      1975    1990   2000   2005   201032
software




1850   1900   1950   1960      1975    1990   2000   2005   201033
software




1850   1900   1950   1960      1975    1990   2000   2005   201034
ICT

   •Linguaggi
       –BASIC
       –PASCAL


   •Calcolatori
       –Personal computer (PC)
        •MS-DOS, Windows




1850    1900   1950   1960    1975   1990   2000   2005   201035
sequenziamento genomico

  • 1981: DNA mitocondriale umano - 16 569 basi
  • 1984: Epstein-Barr virus 170 000 basi
  • 1986: DNA cloroplasto del tabacco - 155 844 basi
                                             1987: primo
                                             sequenziatore
                                             commerciale di
                                             Applied Biosystems
  1986: prima                                ABI370
  macchina semi
  automatica CalTech          1977 Primo
                            genoma completo
                                                     1987 Primo
                                                    sequenziatore
                            sequenziato del Fago     commerciale




1850   1900   1950   1960                  1975      1990           2000   2005   201036
sequenziatori




1850   1900   1950   1960        1975   1990   2000   2005   201037
sequenziatori




1850   1900   1950   1960        1975   1990   2000   2005   201038
sequenziatori




       500 sequenze di ~700 basi al giorno

       350 000 basi al giorno

       un genoma umano = 3 109 basi

       8572 giorni = 23 anni




1850      1900    1950     1960          1975   1990   2000   2005   201039
il risultato




1850   1900   1950   1960        1975      1990   2000   2005   201040
sequenza di DNA


       SQ    Sequence 1859 BP; 609   A; 314 C; 355 G; 581 T; 0 other;
             aaacaaacca aatatggatt   ttattgtagc catatttgct ctgtttgtta   ttagctcatt     60
             cacaattact tccacaaatg   cagttgaagc ttctactctt cttgacatag   gtaacctgag    120
             tcggagcagt tttcctcgtg   gcttcatctt tggtgctgga tcttcagcat   accaatttga    180
             aggtgcagta aacgaaggcg   gtagaggacc aagtatttgg gataccttca   cccataaata    240
             tccagaaaaa ataagggatg   gaagcaatgc agacatcacg gttgaccaat   atcaccgcta    300
             caaggaagat gttgggatta   tgaaggatca aaatatggat tcgtatagat   tctcaatctc    360
             ttggccaaga atactcccaa   agggaaagtt gagcggaggc ataaatcacg   aaggaatcaa    420
             atattacaac aaccttatca   acgaactatt ggctaacggt atacaaccat   ttgtaactct    480
             ttttcattgg gatcttcccc   aagtcttaga agatgagtat ggtggtttct   taaactccgg    540
             tgtaataaat gattttcgag   actatacgga tctttgcttc aaggaatttg   gagatagagt    600
             gaggtattgg agtactctaa   atgagccatg ggtgtttagc aattctggat   atgcactagg    660
             aacaaatgca ccaggtcgat   gttcggcctc caacgtggcc aagcctggtg   attctggaac
       //




1850        1900     1950      1960                1975           1990        2000   2005   201041
1987 Primo
                                   sequenziatore
                                    commerciale




1850   1900   1950   1960   1975       1990        2000   2005   201042
ICT

 •Linguaggi
       –FORTRAN
       –C


 •Calcolatori
       –server, multi user
         • VMS (MicroVAX2)
         • UNIX (HP, SGI, DEC...)
       –PC/Mac per la grafica

                       1956:          1972:C
                       FORTRAN        1979: C++




1850     1900   1950    1960        1975          1990   2000   2005   201043
software




1850   1900   1950   1960      1975    1990   2000   2005   201044
software




1850   1900   1950   1960      1975    1990   2000   2005   201045
Progetto Genoma Umano


       • 1986: prime idee e si discute
       • 1990: proposte e inizio
       • 1994: prima mappa genetica
       • 1998: prima mappa fisica
       • 2003: Homo sapiens - 3 10⁹ basi




1850    1900   1950   1960   1975     1990   2000   2005   201046
Progetto Genoma Umano
                                Nel nucleo di ogni cellula somatica sono presenti 46
                                cromosomi, se si prende come riferimento il
                                genoma aploide (23 cromosomi) si stima un totale
                                di oltre 3 miliardi di basi.

                                Se disteso, il DNA contenuto in ognuna delle nostre
                                cellule è lungo circa 2 m.




  Considerando che un organismo
  adulto è composto di circa 100 000
  miliardi di cellule, si può dire che
  l’estensione complessiva in lunghezza
  di tutte le molecole di DNA presenti in
  un individuo umano è sufficiente a
  coprire circa 1.000 volte la distanza
  Terra-Sole (circa 150 milioni di km).


1850   1900    1950      1960               1975         1990     2000    2005    201047
Progetto Genoma Umano


          20 centri di sequenziamento in 6 paesi:
            – USA (60.8%), UK (28.9%),
            – Giappone (4.9%), Francia (2.8%),
            – Germania (1.5%), Cina (0.7%).


                 costo totale: 2.7 miliardi di dollari



       prima evidenza: ~ 25 000 geni nel genoma umano


1850     1900   1950   1960         1975        1990     2000   2005   201048
Progetto Genoma Umano
       Généthon




1850     1900   1950   1960   1975   1990   2000   2005   201049
MAPPE




       http://www.youtube.com/watch?v=UhQgSAIMs_s&feature=player_embedded




1850   1900    1950     1960           1975          1990     2000   2005   201050
mappa genetica
  1990-1996




1850   1900   1950   1960   1975   1990   2000   2005   201051
mappa fisica




                                     1990 - 2001




1850   1900   1950   1960   1975   1990   2000   2005   201052
Progetto Genoma Umano




                                       mappa fisica
        mappa genetica



1850   1900   1950       1960   1975   1990     2000   2005   201053
Progetto Genoma Umano




          http://www.hhmi.org/biointeractive/dna/DNAi_human_genome_seq.html




1850   1900    1950      1960            1975           1990    2000    2005   201054
Progetto Genoma Umano



   La prima stampa
   del Genoma Umano
   presentata come
   una raccolta di libri,
   esposta alla
   Wellcome Collection
   a Londra




1850   1900   1950     1960   1975   1990   2000   2005   201055
ICT

       •Linguaggi
        –C, C++
        –JAVA
        –Perl
       •Calcolatori
        –server UNIX (HP, SUN, COMPAQ)
        –PC/ Mac, workstations: per la parte
         grafica
       •Statistica, matematica
                                     1987 Perl   1995 Java




1850    1900   1950   1960    1975      1990       2000      2005   201056
software



                      ANALIZZARE
                     CONFRONTARE
                     VISUALIZZARE




1850   1900   1950   1960      1975    1990   2000   2005   201057
software




1850   1900   1950   1960      1975    1990   2000   2005   201058
software




1850   1900   1950   1960      1975    1990   2000   2005   201059
DATABASE

               Memorizzazione, archiviazione e
                     gestione dei dati

                                         Europa: EMBL-Bank (EBI, UK)
                       USA: GenBank (NIH genetic sequence database)
                            Giappone: DDBJ (DNA Data Bank of Japan)




                                            1982- 1986




1850   1900   1950   1960         1975           1990    2000   2005   201060
DATABASE




1850   1900   1950   1960   1975   1990   2000   2005   201061
ICT




1850   1900   1950   1960   1975   1990   2000   2005   201062
ICT




1850   1900   1950   1960   1975   1990   2000   2005   201063
ICT




1850   1900   1950   1960   1975   1990   2000   2005   201064
ICT




1850   1900   1950   1960   1975   1990   2000   2005   201065
ICT




1850   1900   1950   1960   1975   1990   2000   2005   201066
ICT




1850   1900   1950   1960   1975   1990   2000   2005   201067
INTERNET


       • Rete Università - Ricerca
              –BITNET in US (1981)
              –European Academic Research Network -
               EARN (1984) diventa poi TERENA (1995)


                                      1982-1986: basi di dati




                                 1981 BITNET           1984 EARN   1995 TERENA




1850   1900     1950   1960       1975                      1990     2000        2005   201068
INTERNET
       • 1991: protocolli
         –WAIS (Wide Area Information Server)
         –GOPHER
         –WWW
       • 1993: primo browser (Mosaic)
       • 1993: WWW per la biologia
         –agosto 1993: ExPAsY (Svizzera)
         –settembre 1993: Généthon (Francia)

                                1982- 1986: basi di dati


                                                             1991
                                                                    1993 Mosaic     2004 firefox
                                                             WWW




1850    1900   1950   1960      1975                       1990     2000IE
                                                                    1994          2005        201069
siti web

                                         accounts
                                          – geni
                                          – proteine
                                          – organismi
                                          – patologie




1850   1900   1950   1960      1975    1990   2000   2005   201070
linguaggi


       •Siti WEB
       –CGI, HTML, XML, Perl, PHP, Ruby on Rails, JEE


       •Basi di dati:
       –Ingres, Sybase, Oracle, MySQL, PostgreSQL


                                                 1993 CGI
                                                1995 Ruby
                                                1995 PHP


                                                                  2004
                                                  1997 XML     Ruby on Rails




1850    1900   1950   1960       1975    1990   2000         2005        201071
siti web




1850   1900   1950   1960      1975    1990   2000   2005   201072
Ricerca




                     DOVE SIAMO OGGI?




1850   1900   1950    1960      1975   1990   2000   2005   201073
differenze


                            1-
                              2%
                                              0,1%




                               l
                             ia
                           er
                        at                      10
                       M                          -30
                  re
               Sha                                   %




1850   1900   1950         1960        1975     1990     2000   2005   2010
il genoma a 1000 $
          A $10 MILLION PRIZE
          FOR THE FIRST TEAM TO
          SUCCESSFULLY SEQUENCE
          100 HUMAN GENOMES IN 10 DAYS




       •primo gruppo a fare 100 genoma Umani
       •in un massimo 10 giorni
       •per meno di 10 000 $ per genoma
       •vince $ 10 M



                                                       http://genomics.xprize.org/

1850    1900    1950        1960         1975   1990       2000     2005     201075
sequenziamento

       I sequenziatori di nuova generazione sono in
       grado di leggere miliardi di basi in una
       singola corsa di circa 6 giorni
       (la tecnologia precedente: circa 350 kbasi al giorno)


       Tre produttori:
         •454 by Roche
         •SOLID by Applied Biosystems
         •Genome Analyzer by Illumina

1850     1900   1950    1960    1975      1990   2000   2005   201076
@ CRS4




   2009




1850   1900   1950   1960     1975   1990   2000   2005   201077
@ CRS4



 2010




1850    1900   1950   1960     1975   1990   2000   2005   201078
@ CRS4



 2010




1850    1900   1950   1960     1975   1990   2000   2005   201079
@ CRS4




1850   1900   1950   1960     1975   1990   2000   2005   201080
@ CRS4




1850   1900   1950   1960     1975   1990   2000   2005   201081
@ CRS4




1850   1900   1950   1960     1975   1990   2000   2005   201082
@ CRS4
          1 TB (1 TeraByte) = 1 000 USB keys of 1 GB


                                         analizza
   immagine (foto)      32 TB
                                         automaticamente
   “intensity data”:
                        2 TB             si può conservare
   prima analisi
   base call /
                        250 GB           250 GB
   quality data

   allineamento         6TB              1.2 TB


              per ogni esperimento: 1.45 TB

1850   1900   1950   1960         1975            1990   2000   2005   201083
ICT
       •Linguaggi
        –C, C++
        –JAVA
        –Perl
        –Python
        –R
       •Calcolatori: calcolo parallelo
       •Statistica, matematica,
        algoritmica, data mining
                                     1989
                                             1993:
                                    python
                                             R




1850   1900   1950   1960    1975    1990        2000   2005   201084
@ CRS4




1850   1900   1950   1960     1975   1990   2000   2005   201085
Legge di Moore 1:
Le prestazioni dei processori, e il numero di transistor ad esso relativo, raddoppiano ogni 18 mesi.

1850     1900       1950       1960               1975             1990      2000      2005     201086
@ CRS4


       • studiare il genoma
       • individuare il substrato
        genetico di patologie
        multifattoriali
       • terapie personalizzate



1850    1900   1950   1960     1975   1990   2000   2005   201087
i progetti CNR-CRS4

  • sequenziamento del
   genoma dei sardi
  • ricerca dei tratti genetici
   connessi a patologie con
   alta frequenza nell’Isola
  • studio del loro
   funzionamento
  • studio di nuove terapie

1850   1900   1950     1960   1975   1990   2000   2005   201088
@ CRS4
    INFRASTRUTTURE E STRUMENTI
   • potenza di calcolo
   • spazio per archiviazione dati
   • database
   • software di analisi e visualizzazione

     COMPETENZE SCIENTIFICHE
   • informatica, bioinformatica
   • statistica
   • sviluppo web

1850   1900   1950   1960     1975   1990    2000   2005   201089
LIMS

       •Laboratory Information
        Management System
        –gestione integrata di dati e processi di un
         laboratorio
        –gestisce “oggetti” e “eventi”
              •campioni, strumentazione del laboratorio,
               materiale, utenti

       •seminario di Gianfranco Frau il 7
        settembre 2011


1850   1900      1950   1960        1975        1990   2000   2005   201090
1850   1900   1950   1960   1975   1990   2000   2005   201091
Grazie




1850   1900   1950   1960     1975   1990   2000   2005   201092

More Related Content

More from CRS4 Research Center in Sardinia

GIS partecipativo. Laura Muscas e Valentina Spanu (CRS4), Cagliari, 21 Ottobr...
GIS partecipativo. Laura Muscas e Valentina Spanu (CRS4), Cagliari, 21 Ottobr...GIS partecipativo. Laura Muscas e Valentina Spanu (CRS4), Cagliari, 21 Ottobr...
GIS partecipativo. Laura Muscas e Valentina Spanu (CRS4), Cagliari, 21 Ottobr...CRS4 Research Center in Sardinia
 
Alfonso Damiano (Università di Cagliari) ICT per Smart Grid
Alfonso Damiano (Università di Cagliari) ICT per Smart Grid Alfonso Damiano (Università di Cagliari) ICT per Smart Grid
Alfonso Damiano (Università di Cagliari) ICT per Smart Grid CRS4 Research Center in Sardinia
 
Dinamica Molecolare e Modellistica dell'interazione di lipidi col recettore P...
Dinamica Molecolare e Modellistica dell'interazione di lipidi col recettore P...Dinamica Molecolare e Modellistica dell'interazione di lipidi col recettore P...
Dinamica Molecolare e Modellistica dell'interazione di lipidi col recettore P...CRS4 Research Center in Sardinia
 
Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobil...
Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobil...Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobil...
Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobil...CRS4 Research Center in Sardinia
 
ORDBMS e NoSQL nel trattamento dei dati geografici parte seconda. 30 Sett. 2015
ORDBMS e NoSQL nel trattamento dei dati geografici parte seconda. 30 Sett. 2015ORDBMS e NoSQL nel trattamento dei dati geografici parte seconda. 30 Sett. 2015
ORDBMS e NoSQL nel trattamento dei dati geografici parte seconda. 30 Sett. 2015CRS4 Research Center in Sardinia
 
Sistemi No-Sql e Object-Relational nella gestione dei dati geografici 30 Sett...
Sistemi No-Sql e Object-Relational nella gestione dei dati geografici 30 Sett...Sistemi No-Sql e Object-Relational nella gestione dei dati geografici 30 Sett...
Sistemi No-Sql e Object-Relational nella gestione dei dati geografici 30 Sett...CRS4 Research Center in Sardinia
 
Elementi di sismica a riflessione e Georadar (Gian Piero Deidda, UNICA)
Elementi di sismica a riflessione e Georadar (Gian Piero Deidda, UNICA)Elementi di sismica a riflessione e Georadar (Gian Piero Deidda, UNICA)
Elementi di sismica a riflessione e Georadar (Gian Piero Deidda, UNICA)CRS4 Research Center in Sardinia
 
Near Surface Geoscience Conference 2014, Athens - Real-­time or full­‐precisi...
Near Surface Geoscience Conference 2014, Athens - Real-­time or full­‐precisi...Near Surface Geoscience Conference 2014, Athens - Real-­time or full­‐precisi...
Near Surface Geoscience Conference 2014, Athens - Real-­time or full­‐precisi...CRS4 Research Center in Sardinia
 
Luigi Atzori Metabolomica: Introduzione e review di alcune applicazioni in am...
Luigi Atzori Metabolomica: Introduzione e review di alcune applicazioni in am...Luigi Atzori Metabolomica: Introduzione e review di alcune applicazioni in am...
Luigi Atzori Metabolomica: Introduzione e review di alcune applicazioni in am...CRS4 Research Center in Sardinia
 
Scripting e DataWarehouse sui Big Data. Luca Pireddu (CRS4)
Scripting e DataWarehouse sui Big Data. Luca Pireddu (CRS4)Scripting e DataWarehouse sui Big Data. Luca Pireddu (CRS4)
Scripting e DataWarehouse sui Big Data. Luca Pireddu (CRS4)CRS4 Research Center in Sardinia
 
Modellistica molecolare e applicazioni alla sclerosi multipla
Modellistica molecolare e applicazioni alla sclerosi multiplaModellistica molecolare e applicazioni alla sclerosi multipla
Modellistica molecolare e applicazioni alla sclerosi multiplaCRS4 Research Center in Sardinia
 

More from CRS4 Research Center in Sardinia (20)

GIS partecipativo. Laura Muscas e Valentina Spanu (CRS4), Cagliari, 21 Ottobr...
GIS partecipativo. Laura Muscas e Valentina Spanu (CRS4), Cagliari, 21 Ottobr...GIS partecipativo. Laura Muscas e Valentina Spanu (CRS4), Cagliari, 21 Ottobr...
GIS partecipativo. Laura Muscas e Valentina Spanu (CRS4), Cagliari, 21 Ottobr...
 
Alfonso Damiano (Università di Cagliari) ICT per Smart Grid
Alfonso Damiano (Università di Cagliari) ICT per Smart Grid Alfonso Damiano (Università di Cagliari) ICT per Smart Grid
Alfonso Damiano (Università di Cagliari) ICT per Smart Grid
 
Big Data Infrastructures - Hadoop ecosystem, M. E. Piras
Big Data Infrastructures - Hadoop ecosystem, M. E. PirasBig Data Infrastructures - Hadoop ecosystem, M. E. Piras
Big Data Infrastructures - Hadoop ecosystem, M. E. Piras
 
Big Data Analytics, Giovanni Delussu e Marco Enrico Piras
 Big Data Analytics, Giovanni Delussu e Marco Enrico Piras  Big Data Analytics, Giovanni Delussu e Marco Enrico Piras
Big Data Analytics, Giovanni Delussu e Marco Enrico Piras
 
Dinamica Molecolare e Modellistica dell'interazione di lipidi col recettore P...
Dinamica Molecolare e Modellistica dell'interazione di lipidi col recettore P...Dinamica Molecolare e Modellistica dell'interazione di lipidi col recettore P...
Dinamica Molecolare e Modellistica dell'interazione di lipidi col recettore P...
 
Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobil...
Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobil...Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobil...
Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobil...
 
ORDBMS e NoSQL nel trattamento dei dati geografici parte seconda. 30 Sett. 2015
ORDBMS e NoSQL nel trattamento dei dati geografici parte seconda. 30 Sett. 2015ORDBMS e NoSQL nel trattamento dei dati geografici parte seconda. 30 Sett. 2015
ORDBMS e NoSQL nel trattamento dei dati geografici parte seconda. 30 Sett. 2015
 
Sistemi No-Sql e Object-Relational nella gestione dei dati geografici 30 Sett...
Sistemi No-Sql e Object-Relational nella gestione dei dati geografici 30 Sett...Sistemi No-Sql e Object-Relational nella gestione dei dati geografici 30 Sett...
Sistemi No-Sql e Object-Relational nella gestione dei dati geografici 30 Sett...
 
Elementi di sismica a riflessione e Georadar (Gian Piero Deidda, UNICA)
Elementi di sismica a riflessione e Georadar (Gian Piero Deidda, UNICA)Elementi di sismica a riflessione e Georadar (Gian Piero Deidda, UNICA)
Elementi di sismica a riflessione e Georadar (Gian Piero Deidda, UNICA)
 
Near Surface Geoscience Conference 2014, Athens - Real-­time or full­‐precisi...
Near Surface Geoscience Conference 2014, Athens - Real-­time or full­‐precisi...Near Surface Geoscience Conference 2014, Athens - Real-­time or full­‐precisi...
Near Surface Geoscience Conference 2014, Athens - Real-­time or full­‐precisi...
 
SmartGeo/Eiagrid portal (Guido Satta, CRS4)
SmartGeo/Eiagrid portal (Guido Satta, CRS4)SmartGeo/Eiagrid portal (Guido Satta, CRS4)
SmartGeo/Eiagrid portal (Guido Satta, CRS4)
 
Luigi Atzori Metabolomica: Introduzione e review di alcune applicazioni in am...
Luigi Atzori Metabolomica: Introduzione e review di alcune applicazioni in am...Luigi Atzori Metabolomica: Introduzione e review di alcune applicazioni in am...
Luigi Atzori Metabolomica: Introduzione e review di alcune applicazioni in am...
 
Mobile Graphics (part2)
Mobile Graphics (part2)Mobile Graphics (part2)
Mobile Graphics (part2)
 
Mobile Graphics (part1)
Mobile Graphics (part1)Mobile Graphics (part1)
Mobile Graphics (part1)
 
2015 crs4-seminar-massive-models-full
2015 crs4-seminar-massive-models-full2015 crs4-seminar-massive-models-full
2015 crs4-seminar-massive-models-full
 
A Survey of Compressed GPU-based Direct Volume Rendering
A Survey of Compressed GPU-based Direct Volume RenderingA Survey of Compressed GPU-based Direct Volume Rendering
A Survey of Compressed GPU-based Direct Volume Rendering
 
Scripting e DataWarehouse sui Big Data. Luca Pireddu (CRS4)
Scripting e DataWarehouse sui Big Data. Luca Pireddu (CRS4)Scripting e DataWarehouse sui Big Data. Luca Pireddu (CRS4)
Scripting e DataWarehouse sui Big Data. Luca Pireddu (CRS4)
 
Big Data & Hadoop. Simone Leo (CRS4)
Big Data & Hadoop. Simone Leo (CRS4)Big Data & Hadoop. Simone Leo (CRS4)
Big Data & Hadoop. Simone Leo (CRS4)
 
Modellistica molecolare e applicazioni alla sclerosi multipla
Modellistica molecolare e applicazioni alla sclerosi multiplaModellistica molecolare e applicazioni alla sclerosi multipla
Modellistica molecolare e applicazioni alla sclerosi multipla
 
Amit Kumar (CRS4, Università di Cagliari)
Amit Kumar (CRS4, Università di Cagliari)Amit Kumar (CRS4, Università di Cagliari)
Amit Kumar (CRS4, Università di Cagliari)
 

Information Technology e DNA, dal 1953 a oggi" by Patricia Rodriguez Tomé

  • 1. Information Technology e DNA dal 1953 ad oggi Dr.ssa Patricia Rodriguez-Tomé prtome@crs4.it
  • 2. original papers 1953 original papers 25 Aprile 1953 Nature p:737-741 original papers RE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature © 2003 Nature Publishing Group 397 1953 scoperta 400 © 2003 Nature Publishing Group NATURE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature della struttura del DNA 398 NATURE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature © 2003 Nature Publishing Group 1850 1900 1950 1960 1975 1990 2000 2005 20102
  • 3. Facciamo un passo indietro... 1953 scoperta della struttura del DNA 1850 1900 1950 1960 1975 1990 2000 2005 20103
  • 4. Eredità biologica 1850 1900 1950 1960 1975 1990 2000 2005 20104
  • 5. Come si trasmettono i caratteri ereditari da una generazione a un’altra? 1850 1900 1950 1960 1975 1990 2000 2005 20105
  • 6. Mendel Gregor Mendel (1822 - 1884) Leggi dell'Ereditarietà di Mendel (1865) “L’origine delle specie” di Darwin (1859) • Frate agostiniano, laureato in matematica e scienze • Abate del monastero di Brno (ora Rep. Ceca) • Appassionato di botanica 1865 Leggi di 1953 scoperta Mendel della struttura del DNA 1850 1900 1950 1960 1975 1990 2000 2005 20106
  • 7. Mendel Il lavoro di Mendel è stato inizialmente ignorato Solo dopo 35 anni è stato riscoperto e apprezzato 1865 1900 Leggi di riscoperta Leggi Mendel di Mendel 1850 1900 1950 1960 1975 1990 2000 2005 20107
  • 8. Dove si trovano i geni? 1900 riscoperta Leggi di Mendel 1850 1900 1950 1960 1975 1990 2000 2005 20108
  • 9. Cromosomi Cellula vegetale in telofase 1927 I geni sono localizzati sui cromosomi Il moscerino della frutta: Drosophila melanogaster 1850 1900 1950 1960 1975 1990 2000 2005 20109
  • 10. Morgan e collaboratori Columbia University Hermann Joseph Muller (1890 Thomas Hunt Morgan - 1967) collaboratore di (1866 - 1945) Morgan medico e genetista genetista e biologo - 1946 Premio Nobel Medicina 1933 Premio Nobel Medicina Alfred H. Sturtevant (1891 - 1970) studente del laboratorio di Morgan 1927 I geni sono localizzati sui cromosomi 1850 1900 1950 1960 1975 1990 2000 2005 201010
  • 11. Di cosa sono fatti i geni? 1927 I geni sono localizzati sui cromosomi 1850 1900 1950 1960 1975 1990 2000 2005 201011
  • 12. DNA La molecola di DNA contiene l’informazione genetica Virus sulla superficie di Alfred Hershey (1908 - 1997) Escherichia coli (1969: nobel per la medicina) Martha Chase (1927 - 2003) Cold Spring Harbor, Washington 1952 L’informazione genetica è contenuta nel DNA 1850 1900 1950 1960 1975 1990 2000 2005 201012
  • 13. Come può la molecola del DNA contenere tanta informazione? 1952 L’informazione genetica è contenuta nel DNA 1850 1900 1950 1960 1975 1990 2000 2005 201013
  • 14. doppia elica (Cambridge) 1953: Watson & Crick James Watson (1928 -) biologo molecolare e genetico Francis Crick (1916 - 2004) fisico che diventò biologo molecolare, biofisico e neuroscienziato Scoperta della struttura a doppia elica del DNA Watson e Crick interpretarono le informazioni che già esistevano, prodotte da esperimenti e studi di altri ricercatori, ma ebbero l’intuizione giusta prima di tutti gli altri. 1865 1953 scoperta Leggi di della struttura del Mendel DNA 1850 1900 1950 1960 1975 1990 2000 2005 201014
  • 15. The Eagle Il pub del “DNA” a Cambridge 1850 1900 1950 1960 1975 1990 2000 2005 201015
  • 16. original papers 1953 25 Aprile 1953 Nature p:737-741 original papers original papers Franklin & Gosslin Wilkins 398 © 2003 Nature Publishing Group NATURE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature Watson & Crick 1953 scoperta della struttura del DNA URE | VOL 421 | 23 JANUARY 2003 | www.nature.com/nature © 2003 Nature Publishing Group 397 400 © 2003 Nature Publishing Group NATURE | VOL 421 | 23 JANUARY 2003 | www.nature.com/ 1850 1900 1950 1960 1975 1990 2000 2005 201016
  • 17. Premio Nobel 1962 Premio Nobel in Fisiologia e Medicina 1953 1962 Premio Nobel per struttura del Watson e Crick DNA 1850 1900 1950 1960 1975 1990 2000 2005 201017
  • 18. DNA DeoxyriboNucleic Acid = acido desossiribonucleico il DNA è un polimero composto da milioni di piccole unità chiamate NUCLEOTIDI, Gruppo costituite da tre componenti fosfato fondamentali Basa azotata zucchero pentoso 1953 scoperta della struttura del DNA 1850 1900 1950 1960 1975 1990 2000 2005 201018
  • 19. ATCG Le basi azotate sono quattro: Adenina, Timina, Citosina, Guanina Adenine Thymine Cytosine 1953 scoperta della struttura del Guanine DNA 1850 1900 1950 1960 1975 1990 2000 2005 201019
  • 20. ATCG Adenine 1850 1900 1950 1960 1975 1990 2000 2005 201020
  • 21. ATCG Thymine 1850 1900 1950 1960 1975 1990 2000 2005 201021
  • 22. ATCG Cytosine 1850 1900 1950 1960 1975 1990 2000 2005 201022
  • 23. ATCG Guanine 1850 1900 1950 1960 1975 1990 2000 2005 201023
  • 24. DNA http://www.youtube.com/watch?v=qYsW0jIFH5A 1953 scoperta della struttura del DNA 1850 1900 1950 1960 1975 1990 2000 2005 201024
  • 25. Leggere la sequenza dei nucleotidi per conoscere le informazioni genetiche codificate 1953 scoperta della struttura del DNA 1850 1900 1950 1960 1975 1990 2000 2005 201025
  • 26. sequenziamento 1955: sequenza di una proteina - l’insulina Frederick Sanger (1918 - ) è un biochimico britannico 1958 : premio Nobel per la chimica 1975: sviluppo del metodo della terminazione della catena per il sequenziamento del DNA. 1977: prima sequenza di DNA di un genoma completo, del Fago Φ-X174 1980: premio Nobel per la chimica 1975 Metodo di Sanger per il sequenziamento 1850 1900 1950 1960 1975 1990 2000 2005 201026
  • 27. metodo di Sanger 1975 Metodo di Sanger per il sequenziamento 1850 1900 1950 1960 1975 1990 2000 2005 201027
  • 28. 1975 Metodo di Sanger per il sequenziamento 1850 1900 1950 1960 1975 1990 2000 2005 201028
  • 29. http://www.snv.jussieu.fr/vie/dossiers/sequencage/lectureATGC1.swf 1975 Metodo di Sanger per il sequenziamento 1850 1900 1950 1960 1975 1990 2000 2005 201029
  • 30. sequenza di DNA SQ Sequence 1859 BP; 609 A; 314 C; 355 G; 581 T; 0 other; aaacaaacca aatatggatt ttattgtagc catatttgct ctgtttgtta ttagctcatt 60 cacaattact tccacaaatg cagttgaagc ttctactctt cttgacatag gtaacctgag 120 tcggagcagt tttcctcgtg gcttcatctt tggtgctgga tcttcagcat accaatttga 180 aggtgcagta aacgaaggcg gtagaggacc aagtatttgg gataccttca cccataaata 240 tccagaaaaa ataagggatg gaagcaatgc agacatcacg gttgaccaat atcaccgcta 300 caaggaagat gttgggatta tgaaggatca aaatatggat tcgtatagat tctcaatctc 360 ttggccaaga atactcccaa agggaaagtt gagcggaggc ataaatcacg aaggaatcaa 420 atattacaac aaccttatca acgaactatt ggctaacggt atacaaccat ttgtaactct 480 ttttcattgg gatcttcccc aagtcttaga agatgagtat ggtggtttct taaactccgg 540 tgtaataaat gattttcgag actatacgga tctttgcttc aaggaatttg gagatagagt 600 gaggtattgg agtactctaa atgagccatg ggtgtttagc aattctggat atgcactagg 660 aacaaatgca ccaggtcgat gttcggcctc caacgtggcc aagcctggtg attctggaac // 1975 Metodo di Sanger per il sequenziamento 1850 1900 1950 1960 1975 1990 2000 2005 201030
  • 31. 1975 Metodo di Sanger per il sequenziamento 1850 1900 1950 1960 1975 1990 2000 2005 201031
  • 32. software 1850 1900 1950 1960 1975 1990 2000 2005 201032
  • 33. software 1850 1900 1950 1960 1975 1990 2000 2005 201033
  • 34. software 1850 1900 1950 1960 1975 1990 2000 2005 201034
  • 35. ICT •Linguaggi –BASIC –PASCAL •Calcolatori –Personal computer (PC) •MS-DOS, Windows 1850 1900 1950 1960 1975 1990 2000 2005 201035
  • 36. sequenziamento genomico • 1981: DNA mitocondriale umano - 16 569 basi • 1984: Epstein-Barr virus 170 000 basi • 1986: DNA cloroplasto del tabacco - 155 844 basi 1987: primo sequenziatore commerciale di Applied Biosystems 1986: prima ABI370 macchina semi automatica CalTech 1977 Primo genoma completo 1987 Primo sequenziatore sequenziato del Fago commerciale 1850 1900 1950 1960 1975 1990 2000 2005 201036
  • 37. sequenziatori 1850 1900 1950 1960 1975 1990 2000 2005 201037
  • 38. sequenziatori 1850 1900 1950 1960 1975 1990 2000 2005 201038
  • 39. sequenziatori 500 sequenze di ~700 basi al giorno 350 000 basi al giorno un genoma umano = 3 109 basi 8572 giorni = 23 anni 1850 1900 1950 1960 1975 1990 2000 2005 201039
  • 40. il risultato 1850 1900 1950 1960 1975 1990 2000 2005 201040
  • 41. sequenza di DNA SQ Sequence 1859 BP; 609 A; 314 C; 355 G; 581 T; 0 other; aaacaaacca aatatggatt ttattgtagc catatttgct ctgtttgtta ttagctcatt 60 cacaattact tccacaaatg cagttgaagc ttctactctt cttgacatag gtaacctgag 120 tcggagcagt tttcctcgtg gcttcatctt tggtgctgga tcttcagcat accaatttga 180 aggtgcagta aacgaaggcg gtagaggacc aagtatttgg gataccttca cccataaata 240 tccagaaaaa ataagggatg gaagcaatgc agacatcacg gttgaccaat atcaccgcta 300 caaggaagat gttgggatta tgaaggatca aaatatggat tcgtatagat tctcaatctc 360 ttggccaaga atactcccaa agggaaagtt gagcggaggc ataaatcacg aaggaatcaa 420 atattacaac aaccttatca acgaactatt ggctaacggt atacaaccat ttgtaactct 480 ttttcattgg gatcttcccc aagtcttaga agatgagtat ggtggtttct taaactccgg 540 tgtaataaat gattttcgag actatacgga tctttgcttc aaggaatttg gagatagagt 600 gaggtattgg agtactctaa atgagccatg ggtgtttagc aattctggat atgcactagg 660 aacaaatgca ccaggtcgat gttcggcctc caacgtggcc aagcctggtg attctggaac // 1850 1900 1950 1960 1975 1990 2000 2005 201041
  • 42. 1987 Primo sequenziatore commerciale 1850 1900 1950 1960 1975 1990 2000 2005 201042
  • 43. ICT •Linguaggi –FORTRAN –C •Calcolatori –server, multi user • VMS (MicroVAX2) • UNIX (HP, SGI, DEC...) –PC/Mac per la grafica 1956: 1972:C FORTRAN 1979: C++ 1850 1900 1950 1960 1975 1990 2000 2005 201043
  • 44. software 1850 1900 1950 1960 1975 1990 2000 2005 201044
  • 45. software 1850 1900 1950 1960 1975 1990 2000 2005 201045
  • 46. Progetto Genoma Umano • 1986: prime idee e si discute • 1990: proposte e inizio • 1994: prima mappa genetica • 1998: prima mappa fisica • 2003: Homo sapiens - 3 10⁹ basi 1850 1900 1950 1960 1975 1990 2000 2005 201046
  • 47. Progetto Genoma Umano Nel nucleo di ogni cellula somatica sono presenti 46 cromosomi, se si prende come riferimento il genoma aploide (23 cromosomi) si stima un totale di oltre 3 miliardi di basi. Se disteso, il DNA contenuto in ognuna delle nostre cellule è lungo circa 2 m. Considerando che un organismo adulto è composto di circa 100 000 miliardi di cellule, si può dire che l’estensione complessiva in lunghezza di tutte le molecole di DNA presenti in un individuo umano è sufficiente a coprire circa 1.000 volte la distanza Terra-Sole (circa 150 milioni di km). 1850 1900 1950 1960 1975 1990 2000 2005 201047
  • 48. Progetto Genoma Umano 20 centri di sequenziamento in 6 paesi: – USA (60.8%), UK (28.9%), – Giappone (4.9%), Francia (2.8%), – Germania (1.5%), Cina (0.7%). costo totale: 2.7 miliardi di dollari prima evidenza: ~ 25 000 geni nel genoma umano 1850 1900 1950 1960 1975 1990 2000 2005 201048
  • 49. Progetto Genoma Umano Généthon 1850 1900 1950 1960 1975 1990 2000 2005 201049
  • 50. MAPPE http://www.youtube.com/watch?v=UhQgSAIMs_s&feature=player_embedded 1850 1900 1950 1960 1975 1990 2000 2005 201050
  • 51. mappa genetica 1990-1996 1850 1900 1950 1960 1975 1990 2000 2005 201051
  • 52. mappa fisica 1990 - 2001 1850 1900 1950 1960 1975 1990 2000 2005 201052
  • 53. Progetto Genoma Umano mappa fisica mappa genetica 1850 1900 1950 1960 1975 1990 2000 2005 201053
  • 54. Progetto Genoma Umano http://www.hhmi.org/biointeractive/dna/DNAi_human_genome_seq.html 1850 1900 1950 1960 1975 1990 2000 2005 201054
  • 55. Progetto Genoma Umano La prima stampa del Genoma Umano presentata come una raccolta di libri, esposta alla Wellcome Collection a Londra 1850 1900 1950 1960 1975 1990 2000 2005 201055
  • 56. ICT •Linguaggi –C, C++ –JAVA –Perl •Calcolatori –server UNIX (HP, SUN, COMPAQ) –PC/ Mac, workstations: per la parte grafica •Statistica, matematica 1987 Perl 1995 Java 1850 1900 1950 1960 1975 1990 2000 2005 201056
  • 57. software ANALIZZARE CONFRONTARE VISUALIZZARE 1850 1900 1950 1960 1975 1990 2000 2005 201057
  • 58. software 1850 1900 1950 1960 1975 1990 2000 2005 201058
  • 59. software 1850 1900 1950 1960 1975 1990 2000 2005 201059
  • 60. DATABASE Memorizzazione, archiviazione e gestione dei dati Europa: EMBL-Bank (EBI, UK) USA: GenBank (NIH genetic sequence database) Giappone: DDBJ (DNA Data Bank of Japan) 1982- 1986 1850 1900 1950 1960 1975 1990 2000 2005 201060
  • 61. DATABASE 1850 1900 1950 1960 1975 1990 2000 2005 201061
  • 62. ICT 1850 1900 1950 1960 1975 1990 2000 2005 201062
  • 63. ICT 1850 1900 1950 1960 1975 1990 2000 2005 201063
  • 64. ICT 1850 1900 1950 1960 1975 1990 2000 2005 201064
  • 65. ICT 1850 1900 1950 1960 1975 1990 2000 2005 201065
  • 66. ICT 1850 1900 1950 1960 1975 1990 2000 2005 201066
  • 67. ICT 1850 1900 1950 1960 1975 1990 2000 2005 201067
  • 68. INTERNET • Rete Università - Ricerca –BITNET in US (1981) –European Academic Research Network - EARN (1984) diventa poi TERENA (1995) 1982-1986: basi di dati 1981 BITNET 1984 EARN 1995 TERENA 1850 1900 1950 1960 1975 1990 2000 2005 201068
  • 69. INTERNET • 1991: protocolli –WAIS (Wide Area Information Server) –GOPHER –WWW • 1993: primo browser (Mosaic) • 1993: WWW per la biologia –agosto 1993: ExPAsY (Svizzera) –settembre 1993: Généthon (Francia) 1982- 1986: basi di dati 1991 1993 Mosaic 2004 firefox WWW 1850 1900 1950 1960 1975 1990 2000IE 1994 2005 201069
  • 70. siti web accounts – geni – proteine – organismi – patologie 1850 1900 1950 1960 1975 1990 2000 2005 201070
  • 71. linguaggi •Siti WEB –CGI, HTML, XML, Perl, PHP, Ruby on Rails, JEE •Basi di dati: –Ingres, Sybase, Oracle, MySQL, PostgreSQL 1993 CGI 1995 Ruby 1995 PHP 2004 1997 XML Ruby on Rails 1850 1900 1950 1960 1975 1990 2000 2005 201071
  • 72. siti web 1850 1900 1950 1960 1975 1990 2000 2005 201072
  • 73. Ricerca DOVE SIAMO OGGI? 1850 1900 1950 1960 1975 1990 2000 2005 201073
  • 74. differenze 1- 2% 0,1% l ia er at 10 M -30 re Sha % 1850 1900 1950 1960 1975 1990 2000 2005 2010
  • 75. il genoma a 1000 $ A $10 MILLION PRIZE FOR THE FIRST TEAM TO SUCCESSFULLY SEQUENCE 100 HUMAN GENOMES IN 10 DAYS •primo gruppo a fare 100 genoma Umani •in un massimo 10 giorni •per meno di 10 000 $ per genoma •vince $ 10 M http://genomics.xprize.org/ 1850 1900 1950 1960 1975 1990 2000 2005 201075
  • 76. sequenziamento I sequenziatori di nuova generazione sono in grado di leggere miliardi di basi in una singola corsa di circa 6 giorni (la tecnologia precedente: circa 350 kbasi al giorno) Tre produttori: •454 by Roche •SOLID by Applied Biosystems •Genome Analyzer by Illumina 1850 1900 1950 1960 1975 1990 2000 2005 201076
  • 77. @ CRS4 2009 1850 1900 1950 1960 1975 1990 2000 2005 201077
  • 78. @ CRS4 2010 1850 1900 1950 1960 1975 1990 2000 2005 201078
  • 79. @ CRS4 2010 1850 1900 1950 1960 1975 1990 2000 2005 201079
  • 80. @ CRS4 1850 1900 1950 1960 1975 1990 2000 2005 201080
  • 81. @ CRS4 1850 1900 1950 1960 1975 1990 2000 2005 201081
  • 82. @ CRS4 1850 1900 1950 1960 1975 1990 2000 2005 201082
  • 83. @ CRS4 1 TB (1 TeraByte) = 1 000 USB keys of 1 GB analizza immagine (foto) 32 TB automaticamente “intensity data”: 2 TB si può conservare prima analisi base call / 250 GB 250 GB quality data allineamento 6TB 1.2 TB per ogni esperimento: 1.45 TB 1850 1900 1950 1960 1975 1990 2000 2005 201083
  • 84. ICT •Linguaggi –C, C++ –JAVA –Perl –Python –R •Calcolatori: calcolo parallelo •Statistica, matematica, algoritmica, data mining 1989 1993: python R 1850 1900 1950 1960 1975 1990 2000 2005 201084
  • 85. @ CRS4 1850 1900 1950 1960 1975 1990 2000 2005 201085
  • 86. Legge di Moore 1: Le prestazioni dei processori, e il numero di transistor ad esso relativo, raddoppiano ogni 18 mesi. 1850 1900 1950 1960 1975 1990 2000 2005 201086
  • 87. @ CRS4 • studiare il genoma • individuare il substrato genetico di patologie multifattoriali • terapie personalizzate 1850 1900 1950 1960 1975 1990 2000 2005 201087
  • 88. i progetti CNR-CRS4 • sequenziamento del genoma dei sardi • ricerca dei tratti genetici connessi a patologie con alta frequenza nell’Isola • studio del loro funzionamento • studio di nuove terapie 1850 1900 1950 1960 1975 1990 2000 2005 201088
  • 89. @ CRS4 INFRASTRUTTURE E STRUMENTI • potenza di calcolo • spazio per archiviazione dati • database • software di analisi e visualizzazione COMPETENZE SCIENTIFICHE • informatica, bioinformatica • statistica • sviluppo web 1850 1900 1950 1960 1975 1990 2000 2005 201089
  • 90. LIMS •Laboratory Information Management System –gestione integrata di dati e processi di un laboratorio –gestisce “oggetti” e “eventi” •campioni, strumentazione del laboratorio, materiale, utenti •seminario di Gianfranco Frau il 7 settembre 2011 1850 1900 1950 1960 1975 1990 2000 2005 201090
  • 91. 1850 1900 1950 1960 1975 1990 2000 2005 201091
  • 92. Grazie 1850 1900 1950 1960 1975 1990 2000 2005 201092