SlideShare a Scribd company logo
1 of 20
Download to read offline
DIGITAL LONG TERM PRESERVATION:
                                   Glusterfs in BNCF




     Cristiano Corsani
     Biblioteca Nazionale Centrale di Firenze
     30/31 ottobre 2012
DIGITAL LONG TERM PRESERVATION:
glusterfs in BNCF

 
     Breve presentazione BNCF
 
     Digital long term Preservation:
     Perché glusterfs?
 
     Progetti:
     
         Magazzini Digitali
     
         Low cost cloud
     
         Desktop storage
     
         “Teca Digitale” storage
BNCF: cenni storici


 La Biblioteca Nazionale Centrale Firenze (BNCF) ha origini
nei 30.000 volumi della biblioteca privata di Antonio
Magliabechi lasciata in eredità nel 1714 alla città di Firenze.


 Nel 1861 la Biblioteca Magliabechiana fu unificata con la
Biblioteca Palatina (creata da Ferdinando III di Lorena) e
assunse il nome di Biblioteca Nazionale e, nel 1885, quello
di Biblioteca Nazionale Centrale.


 Dal 1870 la BNCF ha il deposito legale di tutta la
produzione editoriale italiana.
BNCF: numeri

Le raccolte della Biblioteca si sviluppano su oltre 120
chilometri di scaffali con un aumento annuo di quasi 2
chilometri e comprendono:

   4.000 incunaboli
   25.000 manoscritti
   68.000 incisioni
   oltre 6 milioni di libri
   oltre 120.000 testate di periodici.
                                             i nuovi magazzini
BNCF: compiti istituzionali

La BNCF ha come compito la raccolta, la conservazione, la
documentazione e la valorizzazione della memoria storica
italiana attraverso:

   il deposito legale in coordinamento con BNCR e le
    istituzione depositarie regionali
   la produzione della Bibliografia Nazionale Italiana (BNI)
   la cooperazione al Servizio Bibliotecario Nazionale
   l'attività di studio e ricerca nel campo della conservazione
    nel lungo periodo delle risorse digitali
BNCF: digitalizzazione

 Manoscritti:
    Unità bibliografiche: 11.104
    Immagini: 166.728
 Libro antico:
    Unità bibliografiche: 53.466
    Immagini: 433.151
 Libro moderno:
    Unità bibliografiche: 77.330
    Immagini: 2.276.848            le lune di Galileo
Digital long term Preservation

    Formati: quale formato scegliere per garantire la
    conservazione e la fruizione nel tempo?

    Storage: quale tecnologia scegliere per garantire la
    sicurezza dei dati?
       Flessibile: semplice e facile da gestire
       Scalabile: aggiungere spazio al bisogno
       Sicuro: nessuna perdita di dati
       Economico: hardware low cost
Glusterfs

    File system distribuito: aggrega spazi disco in rete

    Scalabile: oltre i Petabytes

    Flessibile: installabile in ogni ambiente

    Prestazioni lineari: nessun degrado

    Namespace unificato: come una cartella locale



    No single-point of failure: completamente decentralizzato

    Affidabile: ridondanza dei dati, anche geografica

    Integrità: garantisce integrità del dato
Magazzini Digitali:
    deposito legale di opere digitali
                                       Torino: BNCF

    Sicurezza: replica 6 su nodi
    geograficamente distanti

    Spazio: 32TB storage                       Bologna: BNCR


    Scalabilità: dimensione dei nodi
    e il numero di nodi                          Roma: Dark Archive


    Numeri: 30 server, 96 x 2TB
    disks, apparati di rete

    Nodi: 3 provider iso 27001

    Hardware: standard, low cost.
Magazzini Digitali:                                      Documento
    schema formato dati




                                                  compress

    Opera: formato digitale
    standard (PDF?)

    Metadati: xml, contiene i dati                           WARC
    descrittivi dell'opera da
    indicizzare



                                      Index




                                                  store

    WARC: archivio compresso di
    200Mb circa – opere+metadati
    (ISO 28500:2009)                                         STORAGE
                                     INDEX    File System
Magazzini Digitali: replica dati sul nodo
    replicated glusterfs – replica 2
                                                               Front end


                                              Index

    Hardware: 4 x 2TB x 8 server




                                                      read

    Volume: glusterfs replica 2
    simmetrica su 4 + 4 server                                WARC

    Totale: 32TB utili




                                                      store

    Accesso: index del front-end
    fornisce il path del file WARC
    contenente il documento.
                                  Sys disks                          Sys disks
Magazzini Digitali: replica dati geografica
    todo: georeplica glusterfs o torrent – replica 3 x 2

                                   BNCR


                  deploy




    Replica: geografica dei




                                    replica
    singoli file WARC

    Torrent?
                                                   DARK ARCHIVE
                  deploy



                                   BNCF
Low Cost Cloud:
cloud dei servizi BNCF


   Open hypervisor
disponibile nel kernel di ogni distro standard
   Open orchestrator
live migration, ha, backup, … interfaccia web intuitiva
   Hardware standard
no raid, no-frills (Gb net minima)
   No centralized storage system
file system distribuito sui dischi di sistema
Low Cost Cloud: storage backend
   Lo storage condiviso non è un opzione per la live migration
    e l'alta affidabilità
   Scelte comuni: NAS/SAN
    dedicati (NetApp, EMC, ...)

   Soluzione storage glusterfs:
       Flessibile: semplice e facile
        da gestire
       Scalabile: aggiungi spazio
        al bisogno
       Economico: usa i dischi di sistema ...
Low Cost Cloud: storage backend
    1TB – replicated glusterfs – replica 3


   … aggrega lo spazio
    disponibile dei dischi di
    sistema                              Hosts

   Sicuro: replica dati
    (previene data-loss)
    Sicuro: no single-point of




                                                        VM data


    failure (HA)
   Data disponibili via LAN       System disks
    con protocolli standard:
    FUSE, NFS, CIFS.                              Glusterfs
                                                  STORAGE
Low Cost Cloud 2: storage backend
1TB – glusterfs replicated + georeplica




      Hosts         VM data                                   Hosts




                                                 VM data
                              geo-replica

System disks                                                  System disks
                Glusterfs                       Glusterfs
                STORAGE                         STORAGE




       Ipotesi di georeplica tra volumi su nodi gemelli per
       garantire I servizi in caso di crash
Desktop migration: home storage
 8TB – glusterfs replicated – replica 2


                                                     Glusterfs
Migrazione desktop a Linux                           STORAGE
                                        Hosts
   Oltre 250 postazioni attive




                                                 homes
   Oltre il 60% migrato
                                  System disks
   2 server
   8TB glusterfs storage
    replica 2 (/home)
   Servizi virtuali:
    KVM, proxmox (LDAP, PXE, …)
Desktop migration 2: home storage
8TB – glusterfs replicated + georeplica



                         Glusterfs                 Glusterfs
                         STORAGE                   STORAGE
        Hosts
                                                                   Hosts
                 homes

                                     geo-replica




                                                           homes
 System disks
                                                                   System disks

                                          Ipotesi georeplica dei dati su
                                           nodo remoto.
                                          In caso di crash i client
                                           accedono al volume remoto
                                          Possibile uso dei fs locali
Teca Digitale: storage immagini
32TB – glusterfs distributed + georeplica


                      Glusterfs                 Glusterfs
                      STORAGE                   STORAGE
       Hosts                                                Hosts


                                  geo-replica

System disks                                                 System disks




               WEB server
Cristiano Corsani

                         Servizi Informatici
                         Biblioteca Nazionale Centrale di Firenze
                         Piazza dei Cavalleggeri, 1
                         50122 Firenze

                         Voce: 055 24919 302 / 339 2287466
                         mail: cristiano.corsani@beniculturali.it
                         web: http://www.bncf.firenze.sbn.it




Link:
http://www.rinascimento-digitale.it
http://www.slideshare.com - keysearch: bncf
http://www.bncf.firenze.sbn.it/pagina.php?id=212
http://http://www.depositolegale.it

More Related Content

What's hot

Hard Disk Media Recorder MEDLEY3 MKV DMPR-850N HDD 4Geek
Hard Disk Media Recorder MEDLEY3 MKV DMPR-850N HDD 4GeekHard Disk Media Recorder MEDLEY3 MKV DMPR-850N HDD 4Geek
Hard Disk Media Recorder MEDLEY3 MKV DMPR-850N HDD 4GeekTGeek
 
Understanding Linux: 20 anni di kernel tra storia e tecnica
Understanding Linux: 20 anni di kernel tra storia e tecnicaUnderstanding Linux: 20 anni di kernel tra storia e tecnica
Understanding Linux: 20 anni di kernel tra storia e tecnicaMarco Ferrigno
 
Installazione Linux
Installazione LinuxInstallazione Linux
Installazione Linuxarock84
 
Virtualizzazione e Network Management Open Source
Virtualizzazione e Network Management Open SourceVirtualizzazione e Network Management Open Source
Virtualizzazione e Network Management Open SourceMarco Vanino
 
Giochiamo ai COW-boy : zfs & btrfs
Giochiamo ai COW-boy : zfs & btrfsGiochiamo ai COW-boy : zfs & btrfs
Giochiamo ai COW-boy : zfs & btrfsalberto fiaschi
 
Da Thompson a Torvalds: passato, presente e futuro del mondo *nix
Da Thompson a Torvalds: passato, presente e futuro del mondo *nixDa Thompson a Torvalds: passato, presente e futuro del mondo *nix
Da Thompson a Torvalds: passato, presente e futuro del mondo *nixFelice Pescatore
 
Introduzione Alla Uml Mconsole
Introduzione Alla Uml MconsoleIntroduzione Alla Uml Mconsole
Introduzione Alla Uml MconsoleMajong DevJfu
 

What's hot (8)

Hard Disk Media Recorder MEDLEY3 MKV DMPR-850N HDD 4Geek
Hard Disk Media Recorder MEDLEY3 MKV DMPR-850N HDD 4GeekHard Disk Media Recorder MEDLEY3 MKV DMPR-850N HDD 4Geek
Hard Disk Media Recorder MEDLEY3 MKV DMPR-850N HDD 4Geek
 
Sistema operativo unix
Sistema operativo unixSistema operativo unix
Sistema operativo unix
 
Understanding Linux: 20 anni di kernel tra storia e tecnica
Understanding Linux: 20 anni di kernel tra storia e tecnicaUnderstanding Linux: 20 anni di kernel tra storia e tecnica
Understanding Linux: 20 anni di kernel tra storia e tecnica
 
Installazione Linux
Installazione LinuxInstallazione Linux
Installazione Linux
 
Virtualizzazione e Network Management Open Source
Virtualizzazione e Network Management Open SourceVirtualizzazione e Network Management Open Source
Virtualizzazione e Network Management Open Source
 
Giochiamo ai COW-boy : zfs & btrfs
Giochiamo ai COW-boy : zfs & btrfsGiochiamo ai COW-boy : zfs & btrfs
Giochiamo ai COW-boy : zfs & btrfs
 
Da Thompson a Torvalds: passato, presente e futuro del mondo *nix
Da Thompson a Torvalds: passato, presente e futuro del mondo *nixDa Thompson a Torvalds: passato, presente e futuro del mondo *nix
Da Thompson a Torvalds: passato, presente e futuro del mondo *nix
 
Introduzione Alla Uml Mconsole
Introduzione Alla Uml MconsoleIntroduzione Alla Uml Mconsole
Introduzione Alla Uml Mconsole
 

Viewers also liked

Red Hat Enterprise Linux: Open, hyperconverged infrastructure
Red Hat Enterprise Linux: Open, hyperconverged infrastructureRed Hat Enterprise Linux: Open, hyperconverged infrastructure
Red Hat Enterprise Linux: Open, hyperconverged infrastructureRed_Hat_Storage
 
092812 david addington article (welsh)
092812   david addington article (welsh)092812   david addington article (welsh)
092812 david addington article (welsh)VogelDenise
 
Interpol bringing the united states to justice (danish)
Interpol   bringing the united states to justice (danish)Interpol   bringing the united states to justice (danish)
Interpol bringing the united states to justice (danish)VogelDenise
 
031808 obama speech (ukrainian)
031808   obama speech (ukrainian)031808   obama speech (ukrainian)
031808 obama speech (ukrainian)VogelDenise
 
092712 julian assange (president obama's audacity) - filipino
092712   julian assange (president obama's audacity) - filipino092712   julian assange (president obama's audacity) - filipino
092712 julian assange (president obama's audacity) - filipinoVogelDenise
 
Barack obama christian or heathen (japanese)
Barack obama   christian or heathen (japanese)Barack obama   christian or heathen (japanese)
Barack obama christian or heathen (japanese)VogelDenise
 
092712 julian assange (president obama's audacity) - italian
092712   julian assange (president obama's audacity) - italian092712   julian assange (president obama's audacity) - italian
092712 julian assange (president obama's audacity) - italianVogelDenise
 
Obama us wars used to train white supremacist (polish)
Obama   us wars used to train white supremacist (polish)Obama   us wars used to train white supremacist (polish)
Obama us wars used to train white supremacist (polish)VogelDenise
 
092712 julian assange (president obama's audacity) - dutch
092712   julian assange (president obama's audacity) - dutch092712   julian assange (president obama's audacity) - dutch
092712 julian assange (president obama's audacity) - dutchVogelDenise
 
122312 OBAMA FAX (english)
122312  OBAMA FAX (english)122312  OBAMA FAX (english)
122312 OBAMA FAX (english)VogelDenise
 
Barack obama christian or heathen (hungarian)
Barack obama   christian or heathen (hungarian)Barack obama   christian or heathen (hungarian)
Barack obama christian or heathen (hungarian)VogelDenise
 
092712 julian assange (president obama's audacity) - czech
092712   julian assange (president obama's audacity) - czech092712   julian assange (president obama's audacity) - czech
092712 julian assange (president obama's audacity) - czechVogelDenise
 
102912 vogel denise slideshare documents (bulgarian)
102912   vogel denise slideshare documents (bulgarian)102912   vogel denise slideshare documents (bulgarian)
102912 vogel denise slideshare documents (bulgarian)VogelDenise
 
102912 vogel denise slideshare documents (polish)
102912   vogel denise slideshare documents (polish)102912   vogel denise slideshare documents (polish)
102912 vogel denise slideshare documents (polish)VogelDenise
 
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Filipino)
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Filipino)052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Filipino)
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Filipino)VogelDenise
 
102912 vogel denise slideshare documents (hindi)
102912   vogel denise slideshare documents (hindi)102912   vogel denise slideshare documents (hindi)
102912 vogel denise slideshare documents (hindi)VogelDenise
 
New microsoft word document
New microsoft word documentNew microsoft word document
New microsoft word documentja2013
 
Barack obama christian or heathen (haitian creole)
Barack obama   christian or heathen (haitian creole)Barack obama   christian or heathen (haitian creole)
Barack obama christian or heathen (haitian creole)VogelDenise
 
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Afrikaans)
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Afrikaans)052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Afrikaans)
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Afrikaans)VogelDenise
 

Viewers also liked (20)

Red Hat Enterprise Linux: Open, hyperconverged infrastructure
Red Hat Enterprise Linux: Open, hyperconverged infrastructureRed Hat Enterprise Linux: Open, hyperconverged infrastructure
Red Hat Enterprise Linux: Open, hyperconverged infrastructure
 
092812 david addington article (welsh)
092812   david addington article (welsh)092812   david addington article (welsh)
092812 david addington article (welsh)
 
Interpol bringing the united states to justice (danish)
Interpol   bringing the united states to justice (danish)Interpol   bringing the united states to justice (danish)
Interpol bringing the united states to justice (danish)
 
031808 obama speech (ukrainian)
031808   obama speech (ukrainian)031808   obama speech (ukrainian)
031808 obama speech (ukrainian)
 
092712 julian assange (president obama's audacity) - filipino
092712   julian assange (president obama's audacity) - filipino092712   julian assange (president obama's audacity) - filipino
092712 julian assange (president obama's audacity) - filipino
 
Barack obama christian or heathen (japanese)
Barack obama   christian or heathen (japanese)Barack obama   christian or heathen (japanese)
Barack obama christian or heathen (japanese)
 
092712 julian assange (president obama's audacity) - italian
092712   julian assange (president obama's audacity) - italian092712   julian assange (president obama's audacity) - italian
092712 julian assange (president obama's audacity) - italian
 
Ekonomi 1-mikro 2013
Ekonomi 1-mikro 2013Ekonomi 1-mikro 2013
Ekonomi 1-mikro 2013
 
Obama us wars used to train white supremacist (polish)
Obama   us wars used to train white supremacist (polish)Obama   us wars used to train white supremacist (polish)
Obama us wars used to train white supremacist (polish)
 
092712 julian assange (president obama's audacity) - dutch
092712   julian assange (president obama's audacity) - dutch092712   julian assange (president obama's audacity) - dutch
092712 julian assange (president obama's audacity) - dutch
 
122312 OBAMA FAX (english)
122312  OBAMA FAX (english)122312  OBAMA FAX (english)
122312 OBAMA FAX (english)
 
Barack obama christian or heathen (hungarian)
Barack obama   christian or heathen (hungarian)Barack obama   christian or heathen (hungarian)
Barack obama christian or heathen (hungarian)
 
092712 julian assange (president obama's audacity) - czech
092712   julian assange (president obama's audacity) - czech092712   julian assange (president obama's audacity) - czech
092712 julian assange (president obama's audacity) - czech
 
102912 vogel denise slideshare documents (bulgarian)
102912   vogel denise slideshare documents (bulgarian)102912   vogel denise slideshare documents (bulgarian)
102912 vogel denise slideshare documents (bulgarian)
 
102912 vogel denise slideshare documents (polish)
102912   vogel denise slideshare documents (polish)102912   vogel denise slideshare documents (polish)
102912 vogel denise slideshare documents (polish)
 
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Filipino)
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Filipino)052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Filipino)
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Filipino)
 
102912 vogel denise slideshare documents (hindi)
102912   vogel denise slideshare documents (hindi)102912   vogel denise slideshare documents (hindi)
102912 vogel denise slideshare documents (hindi)
 
New microsoft word document
New microsoft word documentNew microsoft word document
New microsoft word document
 
Barack obama christian or heathen (haitian creole)
Barack obama   christian or heathen (haitian creole)Barack obama   christian or heathen (haitian creole)
Barack obama christian or heathen (haitian creole)
 
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Afrikaans)
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Afrikaans)052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Afrikaans)
052215 - FAX TO DELNER THOMAS & BENNIE THOMPSON (Afrikaans)
 

Similar to BNCF Digital long term preservation: glusterfs

Atempo hyperstream server
Atempo hyperstream serverAtempo hyperstream server
Atempo hyperstream serverPivari.com
 
LinuxDay 2010: Cluster Ha Con Openfiler
LinuxDay 2010: Cluster Ha Con OpenfilerLinuxDay 2010: Cluster Ha Con Openfiler
LinuxDay 2010: Cluster Ha Con OpenfilerIvan Zini
 
Glusterfs: un filesystem altamente versatile
Glusterfs: un filesystem altamente versatileGlusterfs: un filesystem altamente versatile
Glusterfs: un filesystem altamente versatileBioDec
 
Docker - virtualizzazione leggera
Docker - virtualizzazione leggeraDocker - virtualizzazione leggera
Docker - virtualizzazione leggeraRoberto Polli
 
Presentazione Emc Data Domain Remota
Presentazione Emc Data Domain RemotaPresentazione Emc Data Domain Remota
Presentazione Emc Data Domain Remotamodestini
 
La disponibilita dei dati in azienda strategie di protezione
La disponibilita dei dati in azienda strategie di protezioneLa disponibilita dei dati in azienda strategie di protezione
La disponibilita dei dati in azienda strategie di protezioneVincenzo Virgilio
 
Vincenzo Calabrò - Generazione ed Analisi di una Timeline Forense
Vincenzo Calabrò - Generazione ed Analisi di una Timeline ForenseVincenzo Calabrò - Generazione ed Analisi di una Timeline Forense
Vincenzo Calabrò - Generazione ed Analisi di una Timeline ForenseVincenzo Calabrò
 
SDS,la pietra d’angolo dell SDDC
SDS,la pietra d’angolo dell SDDC SDS,la pietra d’angolo dell SDDC
SDS,la pietra d’angolo dell SDDC VMUG IT
 
Analisi ed implementazione di file system distribuiti in ambiente GNU/Linux
Analisi ed implementazione di file system distribuiti in ambiente GNU/LinuxAnalisi ed implementazione di file system distribuiti in ambiente GNU/Linux
Analisi ed implementazione di file system distribuiti in ambiente GNU/LinuxRaul Cafini
 
Open Storage Tra Storia E Tecnologia Share
Open Storage Tra Storia E Tecnologia ShareOpen Storage Tra Storia E Tecnologia Share
Open Storage Tra Storia E Tecnologia ShareWalter Moriconi
 
Presentazione di "Summary of NebulOS: A Big Data framework for astrophysics"
Presentazione di "Summary of NebulOS: A Big Data framework for astrophysics"Presentazione di "Summary of NebulOS: A Big Data framework for astrophysics"
Presentazione di "Summary of NebulOS: A Big Data framework for astrophysics"MarziaPaschini
 
Meccanismi per la cooperazione e la prelazione dell'I/O nel kernel Linux
Meccanismi per la cooperazione e la prelazione dell'I/O nel kernel LinuxMeccanismi per la cooperazione e la prelazione dell'I/O nel kernel Linux
Meccanismi per la cooperazione e la prelazione dell'I/O nel kernel LinuxArianna Avanzini
 
Nagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open sourceNagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open sourceBabel
 
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBSteve Maraspin
 

Similar to BNCF Digital long term preservation: glusterfs (20)

open source in bncf
open source in bncfopen source in bncf
open source in bncf
 
Open@BNCF
Open@BNCFOpen@BNCF
Open@BNCF
 
Atempo hyperstream server
Atempo hyperstream serverAtempo hyperstream server
Atempo hyperstream server
 
LinuxDay 2010: Cluster Ha Con Openfiler
LinuxDay 2010: Cluster Ha Con OpenfilerLinuxDay 2010: Cluster Ha Con Openfiler
LinuxDay 2010: Cluster Ha Con Openfiler
 
Glusterfs: un filesystem altamente versatile
Glusterfs: un filesystem altamente versatileGlusterfs: un filesystem altamente versatile
Glusterfs: un filesystem altamente versatile
 
Docker - virtualizzazione leggera
Docker - virtualizzazione leggeraDocker - virtualizzazione leggera
Docker - virtualizzazione leggera
 
Corso linux base
Corso linux baseCorso linux base
Corso linux base
 
Presentazione Emc Data Domain Remota
Presentazione Emc Data Domain RemotaPresentazione Emc Data Domain Remota
Presentazione Emc Data Domain Remota
 
Google File System - GFS
Google File System - GFSGoogle File System - GFS
Google File System - GFS
 
The Google File System
The Google File SystemThe Google File System
The Google File System
 
Service Backup Online
Service Backup OnlineService Backup Online
Service Backup Online
 
La disponibilita dei dati in azienda strategie di protezione
La disponibilita dei dati in azienda strategie di protezioneLa disponibilita dei dati in azienda strategie di protezione
La disponibilita dei dati in azienda strategie di protezione
 
Vincenzo Calabrò - Generazione ed Analisi di una Timeline Forense
Vincenzo Calabrò - Generazione ed Analisi di una Timeline ForenseVincenzo Calabrò - Generazione ed Analisi di una Timeline Forense
Vincenzo Calabrò - Generazione ed Analisi di una Timeline Forense
 
SDS,la pietra d’angolo dell SDDC
SDS,la pietra d’angolo dell SDDC SDS,la pietra d’angolo dell SDDC
SDS,la pietra d’angolo dell SDDC
 
Analisi ed implementazione di file system distribuiti in ambiente GNU/Linux
Analisi ed implementazione di file system distribuiti in ambiente GNU/LinuxAnalisi ed implementazione di file system distribuiti in ambiente GNU/Linux
Analisi ed implementazione di file system distribuiti in ambiente GNU/Linux
 
Open Storage Tra Storia E Tecnologia Share
Open Storage Tra Storia E Tecnologia ShareOpen Storage Tra Storia E Tecnologia Share
Open Storage Tra Storia E Tecnologia Share
 
Presentazione di "Summary of NebulOS: A Big Data framework for astrophysics"
Presentazione di "Summary of NebulOS: A Big Data framework for astrophysics"Presentazione di "Summary of NebulOS: A Big Data framework for astrophysics"
Presentazione di "Summary of NebulOS: A Big Data framework for astrophysics"
 
Meccanismi per la cooperazione e la prelazione dell'I/O nel kernel Linux
Meccanismi per la cooperazione e la prelazione dell'I/O nel kernel LinuxMeccanismi per la cooperazione e la prelazione dell'I/O nel kernel Linux
Meccanismi per la cooperazione e la prelazione dell'I/O nel kernel Linux
 
Nagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open sourceNagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open source
 
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
 

Recently uploaded

Programma Biennale Tecnologia 2024 Torino
Programma Biennale Tecnologia 2024 TorinoProgramma Biennale Tecnologia 2024 Torino
Programma Biennale Tecnologia 2024 TorinoQuotidiano Piemontese
 
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...Associazione Digital Days
 
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...Associazione Digital Days
 
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”Associazione Digital Days
 
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...Associazione Digital Days
 
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...Associazione Digital Days
 
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...Associazione Digital Days
 
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...Associazione Digital Days
 
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...Associazione Digital Days
 

Recently uploaded (9)

Programma Biennale Tecnologia 2024 Torino
Programma Biennale Tecnologia 2024 TorinoProgramma Biennale Tecnologia 2024 Torino
Programma Biennale Tecnologia 2024 Torino
 
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
Federico Bottino, Lead Venture Builder – “Riflessioni sull’Innovazione: La Cu...
 
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
Gabriele Mittica, CEO @Corley Cloud – “Come creare un’azienda “nativa in clou...
 
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
Edoardo Di Pietro – “Virtual Influencer vs Umano: Rubiamo il lavoro all’AI”
 
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
Luigi Di Carlo, CEO & Founder @Evometrika srl – “Ruolo della computer vision ...
 
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
Alessandro Nasi, COO @Djungle Studio – “Cosa delegheresti alla copia di te st...
 
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
Alessio Mazzotti, Aaron Brancotti; Writer, Screenwriter, Director, UX, Autore...
 
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
Mael Chiabrera, Software Developer; Viola Bongini, Digital Experience Designe...
 
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
Daniele Lunassi, CEO & Head of Design @Eye Studios – “Creare prodotti e servi...
 

BNCF Digital long term preservation: glusterfs

  • 1. DIGITAL LONG TERM PRESERVATION: Glusterfs in BNCF Cristiano Corsani Biblioteca Nazionale Centrale di Firenze 30/31 ottobre 2012
  • 2. DIGITAL LONG TERM PRESERVATION: glusterfs in BNCF  Breve presentazione BNCF  Digital long term Preservation: Perché glusterfs?  Progetti:  Magazzini Digitali  Low cost cloud  Desktop storage  “Teca Digitale” storage
  • 3. BNCF: cenni storici  La Biblioteca Nazionale Centrale Firenze (BNCF) ha origini nei 30.000 volumi della biblioteca privata di Antonio Magliabechi lasciata in eredità nel 1714 alla città di Firenze.  Nel 1861 la Biblioteca Magliabechiana fu unificata con la Biblioteca Palatina (creata da Ferdinando III di Lorena) e assunse il nome di Biblioteca Nazionale e, nel 1885, quello di Biblioteca Nazionale Centrale.  Dal 1870 la BNCF ha il deposito legale di tutta la produzione editoriale italiana.
  • 4. BNCF: numeri Le raccolte della Biblioteca si sviluppano su oltre 120 chilometri di scaffali con un aumento annuo di quasi 2 chilometri e comprendono:  4.000 incunaboli  25.000 manoscritti  68.000 incisioni  oltre 6 milioni di libri  oltre 120.000 testate di periodici. i nuovi magazzini
  • 5. BNCF: compiti istituzionali La BNCF ha come compito la raccolta, la conservazione, la documentazione e la valorizzazione della memoria storica italiana attraverso:  il deposito legale in coordinamento con BNCR e le istituzione depositarie regionali  la produzione della Bibliografia Nazionale Italiana (BNI)  la cooperazione al Servizio Bibliotecario Nazionale  l'attività di studio e ricerca nel campo della conservazione nel lungo periodo delle risorse digitali
  • 6. BNCF: digitalizzazione Manoscritti:  Unità bibliografiche: 11.104  Immagini: 166.728 Libro antico:  Unità bibliografiche: 53.466  Immagini: 433.151 Libro moderno:  Unità bibliografiche: 77.330  Immagini: 2.276.848 le lune di Galileo
  • 7. Digital long term Preservation  Formati: quale formato scegliere per garantire la conservazione e la fruizione nel tempo?  Storage: quale tecnologia scegliere per garantire la sicurezza dei dati?  Flessibile: semplice e facile da gestire  Scalabile: aggiungere spazio al bisogno  Sicuro: nessuna perdita di dati  Economico: hardware low cost
  • 8. Glusterfs  File system distribuito: aggrega spazi disco in rete  Scalabile: oltre i Petabytes  Flessibile: installabile in ogni ambiente  Prestazioni lineari: nessun degrado  Namespace unificato: come una cartella locale  No single-point of failure: completamente decentralizzato  Affidabile: ridondanza dei dati, anche geografica  Integrità: garantisce integrità del dato
  • 9. Magazzini Digitali: deposito legale di opere digitali Torino: BNCF  Sicurezza: replica 6 su nodi geograficamente distanti  Spazio: 32TB storage Bologna: BNCR  Scalabilità: dimensione dei nodi e il numero di nodi Roma: Dark Archive  Numeri: 30 server, 96 x 2TB disks, apparati di rete  Nodi: 3 provider iso 27001  Hardware: standard, low cost.
  • 10. Magazzini Digitali: Documento schema formato dati compress  Opera: formato digitale standard (PDF?)  Metadati: xml, contiene i dati WARC descrittivi dell'opera da indicizzare Index store  WARC: archivio compresso di 200Mb circa – opere+metadati (ISO 28500:2009) STORAGE INDEX File System
  • 11. Magazzini Digitali: replica dati sul nodo replicated glusterfs – replica 2 Front end Index  Hardware: 4 x 2TB x 8 server read  Volume: glusterfs replica 2 simmetrica su 4 + 4 server WARC  Totale: 32TB utili store  Accesso: index del front-end fornisce il path del file WARC contenente il documento. Sys disks Sys disks
  • 12. Magazzini Digitali: replica dati geografica todo: georeplica glusterfs o torrent – replica 3 x 2 BNCR deploy  Replica: geografica dei replica singoli file WARC  Torrent? DARK ARCHIVE deploy BNCF
  • 13. Low Cost Cloud: cloud dei servizi BNCF  Open hypervisor disponibile nel kernel di ogni distro standard  Open orchestrator live migration, ha, backup, … interfaccia web intuitiva  Hardware standard no raid, no-frills (Gb net minima)  No centralized storage system file system distribuito sui dischi di sistema
  • 14. Low Cost Cloud: storage backend  Lo storage condiviso non è un opzione per la live migration e l'alta affidabilità  Scelte comuni: NAS/SAN dedicati (NetApp, EMC, ...)  Soluzione storage glusterfs:  Flessibile: semplice e facile da gestire  Scalabile: aggiungi spazio al bisogno  Economico: usa i dischi di sistema ...
  • 15. Low Cost Cloud: storage backend 1TB – replicated glusterfs – replica 3  … aggrega lo spazio disponibile dei dischi di sistema Hosts  Sicuro: replica dati (previene data-loss) Sicuro: no single-point of VM data  failure (HA)  Data disponibili via LAN System disks con protocolli standard: FUSE, NFS, CIFS. Glusterfs STORAGE
  • 16. Low Cost Cloud 2: storage backend 1TB – glusterfs replicated + georeplica Hosts VM data Hosts VM data geo-replica System disks System disks Glusterfs Glusterfs STORAGE STORAGE Ipotesi di georeplica tra volumi su nodi gemelli per garantire I servizi in caso di crash
  • 17. Desktop migration: home storage 8TB – glusterfs replicated – replica 2 Glusterfs Migrazione desktop a Linux STORAGE Hosts  Oltre 250 postazioni attive homes  Oltre il 60% migrato System disks  2 server  8TB glusterfs storage replica 2 (/home)  Servizi virtuali: KVM, proxmox (LDAP, PXE, …)
  • 18. Desktop migration 2: home storage 8TB – glusterfs replicated + georeplica Glusterfs Glusterfs STORAGE STORAGE Hosts Hosts homes geo-replica homes System disks System disks  Ipotesi georeplica dei dati su nodo remoto.  In caso di crash i client accedono al volume remoto  Possibile uso dei fs locali
  • 19. Teca Digitale: storage immagini 32TB – glusterfs distributed + georeplica Glusterfs Glusterfs STORAGE STORAGE Hosts Hosts geo-replica System disks System disks WEB server
  • 20. Cristiano Corsani Servizi Informatici Biblioteca Nazionale Centrale di Firenze Piazza dei Cavalleggeri, 1 50122 Firenze Voce: 055 24919 302 / 339 2287466 mail: cristiano.corsani@beniculturali.it web: http://www.bncf.firenze.sbn.it Link: http://www.rinascimento-digitale.it http://www.slideshare.com - keysearch: bncf http://www.bncf.firenze.sbn.it/pagina.php?id=212 http://http://www.depositolegale.it