Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

La Stampa: 150 anni in linea

1,102 views

Published on

Intervento di Francesco Cerchio e Guglielmo Gasparini all'eBookFest 2010 di Fosdinovo.

Published in: News & Politics
  • Be the first to comment

  • Be the first to like this

La Stampa: 150 anni in linea

  1. 1. La Stampa: 150 anni in linea La Biblioteca Digitale dell’Informazione Giornalistica Francesco Cerchio SAM – Società di archiviazione multimediali Guglielmo Gasparini CSI Piemonte – Centro di Competenza Cultura e Turismo
  2. 2. Obiettivo L’obiettivo alla base dell’iniziativa è quello di istituire una Biblioteca Digitale per valorizzare, conservare e mettere a disposizione del pubblico la copia digitale del materiale archivistico del Centro di Documentazione de La Stampa denominata Biblioteca Digitale dell’Informazione Giornalistica. L’iniziativa si innesta nel più ampio progetto di realizzazione della Biblioteca Digitale Piemontese, curato dalla Regione Piemonte , che ha l’obiettivo di creare il repository dei patrimoni digitali prodotti dalle istituzioni culturali piemontesi, nel rispetto delle linea guida dettate dal progetto la Biblioteca Digitale Italiana del Ministero per i Beni e le Attività Culturali.
  3. 3. Enti promotori e finanziatori <ul><li>La Stampa </li></ul><ul><li>Regione Piemonte </li></ul><ul><li>Compagnia di San Paolo </li></ul><ul><li>Fondazione Cassa di Risparmio Torino </li></ul>L’iniziativa nasce da un connubio tra Pubblico e Privato . Da un lato l’Editrice La Stampa, che ha messo a disposizione i suoi archivi storici per la digitalizzazione, le Fondazioni Bancarie, che credendo nel progetto hanno contribuito con proprie risorse finanziarie, dall’altro la Regione Piemonte con l’infrastruttura di pubblicazione e fruizione attraverso il CSI Piemonte. Il progetto coordinato dal Comitato per la Biblioteca dell’informazione giornalistica, espressione degli Enti promotori e finanziatori dell’iniziativa coinvolti, è costituito da un membro di ciascun Ente:
  4. 4. <ul><li>L’ Archivio Storico La Stampa , che costituisce il primo nucleo della BDIG, è una iniziativa senza fini di lucro che si rivolge al pubblico per la gratuita consultazione , fornendo al tempo stesso un utile strumento di lavoro per giornalisti, storici, ricercatori, bibliotecari, ed esperti del settore. </li></ul><ul><li>Un patrimonio di informazioni che comprende un arco temporale che va dal 1867 al 2005 , costituito da: </li></ul><ul><li>oltre 1.761.000 pagine </li></ul><ul><li>circa 12.000.000 di pezzi giornalistici di cui oltre 5.000.000 scaricabili singolarmente </li></ul><ul><li>La Stampa, che nasce in origine con il nome Gazzetta Piemontese , comprende due testate: </li></ul><ul><li>La Stampa – con 47.243 edizioni giornaliere dal 1867 al 2005 </li></ul><ul><li>Stampa Sera – con 18.314 edizioni dal 1931 al 1992. </li></ul><ul><li>Permette di consultare tutte le pagine di tutte le edizioni de La Stampa e di Stampa Sera compresi gli allegati e le edizioni locali, tra i quali: </li></ul><ul><li>TorinoSette, TuttoLibri, TuttoScienze, TuttoSoldi, TuttoCome, TuttoDove, MondoScuola, ScuolaLavoro, Global, GIO, VivereRoma, VivereMilano ed altri ancora. </li></ul>La Biblioteca Digitale dell’Informazione Giornalistica (BDIG)
  5. 5. Archivio Storico La Stampa E’ costituito da un Front- end per la consultazione e da un Back-end di gestione
  6. 6. Front-end: funzionalità principali <ul><li>Consente di effettuare ricerche: libere (like google), per data e avanzate </li></ul><ul><li>Consente di filtrare i risultati ottenuti per testata di interesse </li></ul><ul><li>Tiene traccia degli articoli più letti del giorno, della settimana e del mese </li></ul><ul><li>Permette di effettuare la stampa di una pagina di giornale (A4, A3, A2) </li></ul><ul><li>Permette di acquisire il testo dell’articolo di interesse o di una intera pagina di giornale </li></ul>
  7. 7. <ul><li>Permette di visualizzare gli articoli della prima pagina dell’edizione a cui appartiene l’articolo di interesse </li></ul><ul><li>Permette di leggere l’articolo direttamente sull’immagine della pagina </li></ul><ul><li>Consente di navigare le pagine dell’edizione del giornale a partire dall’articolo di interesse </li></ul>Front-end: funzionalità principali
  8. 8. A differenza di quanto possa sembrare, anche, le ultime due attività richiedono impegno, capacità e competenze e sono fondamentali per il successo dell’iniziativa. Attività del Progetto <ul><li>Il progetto è composto da tre macro fasi-attività: </li></ul><ul><li>realizzazione del software </li></ul><ul><li>digitalizzazione delle pagine e degli articoli </li></ul><ul><li>progettazione e gestione dell’infrastruttura di pubblicazione </li></ul>
  9. 9. Digitalizzazione delle pagine e degli articoli Il giornale è un prodotto editoriale complesso. Le variabili da tenere in considerazione sono molte, dimensioni fisiche, complessità di impaginazione, numero di oggetti presenti nelle pagine (articoli, titoli, colonne, immagini, didascalie, pubblicità, annunci,..) è rilevante e non riconducibile a modelli predefiniti. Inoltre questi parametri nel periodo preso in considerazione sono cambiati numerose volte senza soluzione di continuità, complicandone anche l’analisi. Le procedure per digitalizzare un numero così imponente di pagine in un tempo ragionevole devono essere automatizzate il più possibile, limitando l’intervento manuale ai casi più complessi. Questi due aspetti spesso si scontrano e rendono necessarie soluzioni alternative, che nella migliore delle ipotesi aumentano significativamente i tempi di lavorazione.
  10. 10. Predisposizione e gestione dell’infrastruttura di pubblicazione La progettazione dell’infrastruttura sulla quale viene ospitato il servizio deve prendere in considerazione diversi aspetti fondamentali: <ul><li>Numero di accessi potenziali </li></ul><ul><li>Quantità dei dati </li></ul><ul><li>Volume di crescita dei dati </li></ul><ul><li>Ampiezza della banda in uscita </li></ul><ul><li>Sistema di monitoraggio del servizio </li></ul><ul><li>Simulazioni di utilizzo del servizio con stress test di carico </li></ul><ul><li>80 TB di dati archiviati su nastro (immagini ad alta e bassa risoluzione) </li></ul><ul><li>3 TB di dati disponibili alla consultazione on-line (immagini a bassa risoluzione) </li></ul><ul><li>20.000.000 di file gestiti per la consultazione on-line </li></ul>Per dare l’idea della complessità basti pensare che il progetto ha generato un volume di:
  11. 11. Aziende che hanno lavorato al progetto Francesco Cerchio STI Bassnet Bassilichi Microshop CSI Piemonte
  12. 12. Credits Francesco Cerchio La Stampa Regione Piemonte Compagnia di San Paolo Fondazione Cassa di Risparmio STI Bassnet Bassilichi Microshop

×