La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008
Upcoming SlideShare
Loading in...5
×
 

La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008

on

  • 3,669 views

La digitalizzazione dei fondi antichi. Corso per l'Associazione Italiana Biblioteche, Sezione Friuli, 2008.

La digitalizzazione dei fondi antichi. Corso per l'Associazione Italiana Biblioteche, Sezione Friuli, 2008.

Statistics

Views

Total Views
3,669
Views on SlideShare
3,663
Embed Views
6

Actions

Likes
2
Downloads
66
Comments
0

2 Embeds 6

http://www.slideshare.net 5
http://www.health.medicbd.com 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution-NonCommercial-NoDerivs LicenseCC Attribution-NonCommercial-NoDerivs LicenseCC Attribution-NonCommercial-NoDerivs License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008 La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008 Presentation Transcript

  • LA DIGITALIZZAZIONE DEI FONDI ANTICHI Corso per l’Associazione Italiana biblioteche, Sezione Friuli , 6-7 Novembre 2008 Maurizio Messina [email_address]
  • LA DIGITALIZZAZIONE DEI FONDI ANTICHI
    • Quest'opera è stata rilasciata sotto la licenza Creative Commons Attribuzione-Non commerciale-Non opere derivate 2.5 Italia. Per leggere una copia della licenza visita il sito web http://creativecommons.org/licenses/by-nc-nd/2.5/it/
  • PER UN’ONTOLOGIA DELLE BIBLIOTECHE DIGITALI - 1
    • ONTOLOGIA:
    • Specificazione di un ambito concettuale
    • Individuazione dei concetti coinvolti e delle relazioni fra i concetti
    • Definizione di una terminologia
  • PER UN’ONTOLOGIA DELLE BIBLIOTECHE DIGITALI - 2
    • LE PAROLE DELLE BIBLIOTECHE DIGITALI
    • Pluralità , il centro è il punto di vista dell’utente
    • Convergenza, dei domini digitali di entità diverse
    • Interoperabilità, tecnica, semantica, giuridica, amministrativa, organizzativa
    • Integrabilità, riorganizzazione virtuale dei domini digitali anche da parte dell’utente finale
    • (Claudio Leombroni, 2003)
    • Linguaggio, parlare il linguaggio degli utenti
    • Persistenza, mantenimento, integrità, autenticità dei contenuti
    • Sostenibilità, organizzativa, funzionale, finanziaria
  • ALCUNI TESTI DI RIFERIMENTO
    • Manifesto per le biblioteche digitali. AIB, 2005 h ttp://www.aib.it/ aib / cg /gbdigd05a.htm3
    • The Digital Libraries Manifesto . DELOS, [2006] http://delos-dl.isti.cnr.it/OLP/UI/1.0/Load/manifestation_ext/1227463918OgqR0T0r4W?uri=http%3A//146.48.87.21%3A8003/OLP/Repository/1.0/Disseminate/delos/2006_other_0081/content/pdf%3Fversion%3D1&epl_content_type=application/pdf
    • R. David Lankes, Joanne Silverstein, Scott Nicholson. Le reti partecipative: la biblioteca come conversazione . AIB, 2007 http://www.aib.it/aib/cg/gbdigd07.htm3
    • Riccardo Ridi. Manifesto per la biblioteca ipertestuale. In: «Bibliotime», anno X, numero 3 (novembre 2007) http://www2.spbo.unibo.it/bibliotime/num-x-3/ridi.htm
  • LA BIBLIOTECA DIGITALE
    • “ una zona controllata di Internet. In questo spazio informativo si possono trovare risorse digitali controllate e filtrate da specialisti e risorse digitali acquisite o create dalla biblioteca. Le risorse che vi si trovano hanno come caratteristiche di qualità l’integrità, l’accuratezza e l’aggiornamento. L’accesso è facilitato attraverso indici e classificazioni. Infine sono resi disponibili servizi personalizzati per l’utenza”
    • Alberto Salarelli, Annamaria Tammaro. La biblioteca digitale . Milano : Bibliografica, c2000
  • LA BIBLIOTECA DIGITALE una definizione ancora valida
    • “ le biblioteche digitali sono organizzazioni che forniscono le risorse, compreso il personale specializzato, per selezionare, organizzare, dare l’accesso intellettuale, interpretare, distribuire, preservare l’integrità e assicurare la persistenza nel tempo delle collezioni digitali così che queste possano essere accessibili prontamente ed economicamente per una comunità definita o per un insieme di comunità”
    • Digital Library Fedration , 1995 http://www.diglib.org/
  • LA BIBLIOTECA DIGITALE
    • La biblioteca ibrida: integrare le risorse su supporto tradizionale e le risorse digitali in un contesto di servizio adeguato alle mutevoli esigenze degli utenti
    • Le biblioteche digitali: la produzione di contenuti scientifici e culturali originali
    • Le biblioteche digitali: un soggetto attivo nella catena di valore dell’informazione e delle risorse culturali
    • Le biblioteche digitali: collezioni digitali primarie e secondarie
  • IL PROGETTO DI DIGITALIZZAZIONE aspetti rilevanti
    • Creazione di nuovi documenti
    • Produzione di nuovi contenuti
    • Da un punto di vista tecnico: creazione di oggetti digitali, rappresentati da file digitali, cioè da sequenze di bit
  • FASI DI UN PROGETTO ( da contestualizzare )
    • Ideazione
    • Studio di fattibilità
    • Pianificazione operativa ( definizione di: obiettivi finali e intermedi, tempi, costi, controlli di qualità, criteri di collaudo)
    • Esecuzione delle attività
    • Controllo e valutazione
    • Chiusura e comunicazione dei risultati
  • DEFINIZIONE DEGLI OBIETTIVI E DEL MODELLO GENERALE DEI SERVIZI - 1
    • La digitalizzazione è finalizzata all’accessibilità ed alla fruizione dei contenuti
    • La digitalizzazione non è uno strumento di conservazione degli originali analogici
    • Progetti analoghi o simili (sinergie)?
  • DEFINIZIONE DEGLI OBIETTIVI E DEL MODELLO GENERALE DEI SERVIZI - 2
    • Analisi dei rischi, es.:
    • Situazione dei diritti
    • Finanziamenti / sostenibilità
    • Situazione catalografica
    • Necessità di competenze specialistiche
    • Obiettivi “nascosti” (nei progetti cooperativi)
    • .....
  • DEFINIZIONE DEGLI OBIETTIVI E DEL MODELLO GENERALE DEI SERVIZI - 3
    • Inscindibilità della definizione degli obiettivi e del modello dei servizi
    • Modalità d’uso degli oggetti digitali
    • Diritti e sistemi di protezione
    • Eventuali aspetti commerciali
    • Utenza di riferimento e livello di interazione previsto
    • Relazioni con reti parallele/sovraordinate
    • Permeabilità della base dati ad agenti esterni
    • Continuità del servizio, integrità ed autenticità dei contenuti
    • .....
  • CRITERI DI SELEZIONE DEL MATERIALE - 1
    • Digitalizzare collezioni
    • La digitalizzazione di questa collezione (o di questo fondo, o di questa tipologia di materiale) comporta un miglioramento significativo nel modo in cui gli utenti possono accedervi e servirsene, o consente a nuove fasce di utenza di accedervi e servirsene utilmente, magari per finalità nuove o impreviste?
  • CRITERI DI SELEZIONE DEL MATERIALE - 2
    • Buon bilanciamento fra alto valore della collezione e elevata domanda (reale o potenziale)
    • Digitalizzazione appropriata per il tipo di materiale
    • Manipolazione priva di rischi
    • Diritto d’autore?
    • Materiale già catalogato e presente in OPAC
    • Riunione virtuale di collezioni fisicamente separate
    • Sostenibilità dell’impatto sull’organizzazione
    • Rapporto costi-benefici
    • Accessibilità VS Conservazione
  • CATALOGAZIONE vs DIGITALIZZAZIONE
    • non si dovrebbe (non si deve) procedere alla digitalizzazione di documenti che non siano già stati catalogati, e per i quali non si disponga di record catalografici in un formato bibliografico standard disponibili al pubblico in rete su sistemi di recupero delle informazioni
    • tutte le esigenze di natura descrittiva relative ai documenti e agli oggetti digitali devono essere pienamente soddisfatte al livello delle descrizioni formalizzate dei documenti analogici fonte; non andranno di norma descritti i documenti digitali frutto delle operazioni di scansione
  • DEFINIZIONE DELLE COMPONENTI DEL SISTEMA
    • Software applicativo di catalogazione
    • Archivio dei record catalografici (OPAC)
    • Archivio degli oggetti digitali
    • Archivio dei metadati associati agli oggetti digitali
  • L’ARCHIVIO DEI RECORD CATALOGRAFICI
    • Record catalografici = metadati descrittivi
    • definizione: informazioni su altre informazioni, o “dati che descrivono o caratterizzano altri dati” (McClennen, 2002)
    • i metadati descrittivi sono finalizzati all’identificazione, descrizione e recupero dei documenti digitali ( finding-aids )
  • L’ARCHIVIO DEI RECORD CATALOGRAFICI: I METADATI DESCRITTIVI - 1
    • Dublin Core Metadata Initiative (DCMI)
    • “ La DCMI è un forum aperto impegnato nello sviluppo di standard per metadati interoperabili in linea e tali da sostenere una serie ampia di attività e modelli operativi diversi”. La missione della DCMI è facilitare il reperimento di risorse in Internet attraverso le seguenti attività:
    • - Sviluppo di standard per i metadati per la ricerca inter-dominio
    • - Definizione di schemi per l’interoperabilità fra i set di metadati
    • - Impulso allo sviluppo di specifici set di metadati di tipo
    • disciplinare coerenti con i punti precedenti http://dublincore.org/
  • L’ARCHIVIO DEI RECORD CATALOGRAFICI: I METADATI DESCRITTIVI - 2
    • i 15 elementi del Dublin Core: (Dublin Core Metadata Element set, Version 1.1: Reference Description)
    • Titolo; Creatore; Soggetto; Descrizione; Editore; Autore di contributo subordinato; Data; Tipo di risorsa; Formato; Identificatore; Fonte; Lingua; Relazione; Copertura; Gestione dei diritti
    • http://www.iccu.sbn.it/genera.jsp?id=116
  • L’ARCHIVIO DEI RECORD CATALOGRAFICI: I METADATI DESCRITTIVI - 3
    • i 15 elementi del Dublin Core:
    • - semplicità di utilizzo
    • - interoperabilità semantica (rete di dati con significato
    • comune)
    • - promozione di uno strumento utile per una infrastruttura
    • internazionale
    • - flessibilità (possibilità di integrazione di semantiche
    • diverse appropriate al contesto)
    • - minimo comune denominatore per la descrizione, in una
    • base dati integrata, di documenti digitali provenienti
    • da settori diversi del mondo dei beni culturali
    • (archivi, biblioteche, musei) e dell’informazione
    • (autori, editori)
  • L’ARCHIVIO DEI RECORD CATALOGRAFICI: I METADATI DESCRITTIVI - 4
    • Dublin Core simple e Dublin Core qualified
    • DC non specifica nessuna struttura, nessuna sintassi per esprimere i 15 elementi in funzione dello scambio o del trasferimento dei record; nelle applicazioni di biblioteca digitale i record DC vengono abitualmente espressi in formato XML.
  • L’ARCHIVIO DEI DEGLI OGGETTI DIGITALI
    • Documenti, Oggetti e file digitali
    • Requisiti
    • - accessibilità permanente
    • - integrità
    • - conservazione permanente
    • - interoperabilità
    • L’ Open Archival Information System (OAIS)
    • ISO 14721/2003
    • http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=24683
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’ Open Archival Information System (OAIS) - 1
    • Archivio OAIS: “un'organizzazione di soggetti e sistemi che hanno accettato la responsabilità di conservare l'informazione e di mantenerla disponibile per la comunità di riferimento”.  
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’ Open Archival Information System (OAIS) - 2
    • “ OAIS individua termini e concetti rilevanti per l'archiviazione di documenti digitali, identifica le componenti ed i processi chiave comuni alla maggior parte delle attività di conservazione digitale, e propone un modello logico di riferimento per gli oggetti digitali ed i metadati loro associati , che comprende la creazione e l'uso dei metadati utili a gestire il materiale elettronico, dalla fase di acquisizione a quella della conservazione, fino alla fase di accesso”
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’ Open Archival Information System (OAIS) - 3
    • OAIS “non specifica nessun tipo di implementazione e può essere applicato indifferentemente a oggetti digitali nativi, a prodotti di attività di digitalizzazione (quali files di immagini), e persino a oggetti fisici”
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’ Open Archival Information System (OAIS) - 4
    • Le funzioni
    • - Immissione
    • - Archiviazione
    • - Gestione
    • - Accesso
    • - Amministrazione
    • - Pianificazione della conservazione
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’ Open Archival Information System (OAIS) - 5
    • Il modello di strutturazione dei dati
    • L’Oggetto informativo è composto da:
    • - i Dati (Sequenza di bit)
    • - l’Informazione sulla rappresentazione (tutto
    • quanto serve a rendere quei dati accessibili,
    • comprensibili ed utilizzabili: formato dei dati,
    • SW di accesso, condizioni d’uso e quant’altro)
    • I dati, in unione alla loro Informazione sulla
    • Rappresentazione, veicolano significato
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’ Open Archival Information System (OAIS) - 6
    • Modi di “confezione” dei dati
    • ( Packaging Information )
    • SIP ( Submission Information Package ): Immissione
    • AIP ( Archival Information Package ): Archiviazione
    • DIP ( Dissemination Information Package ): Distribuzione
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’ Open Archival Information System (OAIS) - 7
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: L’ Open Archival Information System (OAIS) - 8
    • Obblighi/Responsabilità dell’Archivio
    • Negoziare ed accettare informazioni appropriate dal Produttore di informazione
    • Ottenere un sufficiente controllo sull’informazione fornita, adeguato al livello necessario a garantire la conservazione a lungo termine
    • Identificare la Comunità di fruizione designata, in grado di comprendere l’informazione fornita
    • Assicurare che l’informazione da conservare sia comprensibile da parte della Comunità designata senza avere bisogno dell’ausilio del Produttore di informazione
    • Implementare e mantenere politiche e procedure documentate che assicurino la conservazione dell’informazione in ogni situazione prevedibile, e che garantiscano che l’informazione disseminata a seguito di una richiesta costituisca una copia identica dell’informazione originale, o che sia tracciabile sull’originale
    • Rendere l’informazione così conservata effettivamente disponibile per la comunità designata. (Angela Di Iorio, 2007)
  • LA DISSEMINAZIONE DEGLI OGGETTI DIGITALI: L’ Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) - 1
    • Protocollo di pubblico dominio ( open source = a codice sorgente aperto) sviluppato nell’ambito della comunità degli Archivi aperti ( open access )
    • Consente l’interoperabilità fra gli archivi aperti che lo adottano (ricerche su una pluralità di archivi, accessibilità del singolo archivio da parte di tutti gli altri) attraverso l’”esposizione” in rete dei metadati associati agli oggetti digitali
    • Ciascun archivio può inviare e/o ricevere richieste di accesso agli oggetti digitali tramite una procedura standard
    • http:// www.openarchives.org /OAI/2.0/ openarchivesprotocol.htm
  • L’ Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) - 2
    • Entità
    • Data Provider : è il gestore di uno o più archivi di documenti digitali che supportano il protocollo OAI-PMH; espone e rende accessibili i metadati relativi a quei documenti.
    • Service Provider : è un qualunque servizio web ( harvester ) che interroga gli archivi di documenti digitali del/dei Data provider usando le modalità di richiesta previste dal protocollo OAI-PMH; cattura i metadati esposti dal Data provider e li usa per costruire servizi a valore aggiunto (es. servizi di indicizzazione e interfacce di ricerca).
    • (Valdo Pasqui, 2001)
  • L’ Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) - 3
    • Funzioni ( verbs )
    • Get record : per ottenere uno specifico record (cioè i metadati relativi ad un documento digitale dell'archivio)
    • List identifiers : per ottenere gli identificatori dei record che possono essere catturati dall'archivio
    • List records : per ottenere un insieme di record
    • Identify : per ottenere informazioni sull'archivio
    • List metadata formats : per ottenere i formati di metadati resi disponibili dall'archivio
    • List sets : per ottenere la struttura dei set (partizioni)
  • L’ Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) - 4
    • OAIster : http://oaister.umdl.umich.edu/o/oaister/
    • OPENDOAR : http://www.opendoar.org/
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: l’ambiente software per la gestione - 1
    • Software proprietario o software a codice sorgente aperto?
    • Analisi di mercato della Biblioteca Nazionale della Repubblica Ceca, 2007 ( digitalpreservationeurope ) http://www.digitalpreservationeurope.eu/publications/dpe-market-analysis.pdf
    • Confronto fra software per la gestione di Digital repository. Firenze : FRD, 2006 http:// documenti.rinascimento-digitale.info / doc-pdf /ConfrontoRepository2006-8.pdf
  • L’ARCHIVIO DEGLI OGGETTI DIGITALI: l’ambiente software per la gestione - 2
    • OPENDOAR : http://www.opendoar.org/
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 1
    • Tassonomia dei metadati (categorie funzionali)
    • descrittivi : per l’identificazione, la descrizione ed il recupero degli oggetti digitali;
    • amministrativi (e gestionali n.d.r., MAG): per le varie operazioni di gestione degli oggetti digitali all’interno dell’archivio;
    • strutturali : per descrivere la struttura interna dei documenti e gestire le relazioni fra le varie parti componenti di oggetti digitali complessi (relazioni parte/tutto, ma non solo)
    • R. Wendler. LDI Update: Metadata in the Library. In: “Library Notes”, n. 1286 (1999), p. 4-5
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 2, il MAG Schema
    • Comitato MAG. Manuale utente : versione 2.0.1. Roma : ICCU, 2006.
    • “ costituisce uno strumento di supporto alle attività di impianto e di gestione di basi dati di oggetti digitali che formano una collezione digitale . Tali oggetti possono essere il prodotto di lavori di digitalizzazione di originali analogici o essere digitali nativi, e possono avere molteplici tipologie: immagini statiche, documenti in formato testo, suono, documenti audiovisivi, e insieme possono generare collezioni digitali multimediali”
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 3, il MAG Schema
    • Il MAG schema come profilo di applicazione
    • MAG e METS
    • METS come contenitore di schemi di metadati “completamente agnostico riguardo agli schemi da utilizzare nelle varie sezioni” (Angela Di Iorio, 2007)
    • Il “Comitato MAG”:
    • diffusione dello Schema, suo mantenimento ed evoluzione, produzione di manuali e linee guida, assistenza agli implementatori, formazione e promozione, rapporti con altri progetti e agenzie
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 4, il MAG Schema
    • “ Il MAG Schema costituisce dunque un profilo di applicazione ( application profile) che ha l'obiettivo di fornire le specifiche formali per la fase di raccolta, di trasferimento e disseminazione dei metadati e dei dati digitali nei rispettivi archivi” ( Comitato MAG. Manuale utente , cit. p.6.)
    • ” Si può definire un profilo di applicazione un “assemblaggio” di elementi di metadati selezionati da uno o più schemi. L’obiettivo di un profilo è combinare gli schemi di metadati esistenti in un “pacchetto” che si adatta alle funzioni richieste da una particolare applicazione pur mantenendo una interoperabilità con lo schema di base originale” (Cristina Magliano. I profili di applicazione, 2005)
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 5, il MAG Schema
    • I MAG consentono di:
    • identificare in maniera univoca gli oggetti digitali
    • certificare l’autenticità e l’integrità dei contenuti
    • fornire informazioni, anche in maniera indiretta, sulle condizioni e i diritti di accesso agli oggetti digitali da parte degli utenti finali
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 6, il MAG Schema
    • è definito per tipologie di oggetti digitali e non per tipologie di oggetti fonte
    • è espresso nella sintassi XML
    • si presenta come uno standard aperto, documentato, liberamente disponibile e del tutto indipendente da specifiche piattaforme HW e SW
    • non obbliga all’uso di una particolare struttura di archivio digitale
    • comprende una quantità limitata di metadati descrittivi, ereditati dagli applicativi di catalogazione ed espressi in formato Dublin Core
    • di norma i MAG vanno associati al documento digitale nel suo complesso, ma comprendono anche informazioni relative all’unità elementare dell’archivio, il singolo oggetto digitale
    • i MAG vanno raccolti/prodotti con procedure automatizzate
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 7, il MAG Schema
    • Il MAG Schema nella versione 2.0.1 è composto dalle seguenti sezioni:
    • GEN : informazioni generali sul progetto e sul tipo di digitalizzazione
    • BIB : metadati descrittivi dell’oggetto fonte
    • STRU : metadati strutturali dell’oggetto digitale
    • IMG : metadati tecnici specifici per le immagini statiche
    • OCR : metadati tecnici specifici relativi a testi riconosciuti otticamente
    • DOC : metadati tecnici specifici per file digitali (es. html o pdf)
    • AUDIO : metadati tecnici specifici per file audio
    • VIDEO : metadati tecnici specifici per file video
    • DIS : metadati specifici per la distribuzione degli oggetti digitali
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 8, il MAG Schema
    • Casi d’uso della Sezione <stru>
    • quando si ritenga opportuno mettere in evidenza le eventuali partizioni interne di un documento digitale (es. capitoli di un libro);
    • nel caso di spogli, laddove le partizioni spogliate (es. articoli di una rivista, canzoni di un CD) siano autonome, cioè tali da avere una propria sezione BIB;
    • per far riferimento ad altri oggetti MAG correlati non appartenenti alla stessa tipologia, per esempio nel caso di un cofanetto contenente 1 CD musicale e un fascicolo di testo.
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 9, il MAG Schema
    • Come produrre i MAG? - 1
    • I metadati descrittivi (sezione <bib>) e strutturali (sezione <stru>) sono di norma ereditati dagli applicativi di catalogazione
    • I metadati amministrativi e gestionali di natura tecnica sono di norma prodotti dal sw di scansione
    • Appositi tools li riassemblano e li associano a ciascun set di immagini relative ad un record catalografico
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 10,il MAG Schema
    • Come produrre i MAG? - 2
    • Alcuni requisiti di un pacchetto sw per la produzione di MAG
    • Creazione una volta per tutte delle informazioni ripetitive (es. per la sezione <bib>)
    • Importazione di record bibliografici da fonti esterne
    • Elaborazione di elementi della descrizione bibliografica per il popolamento delle sezioni <bib> e <stru> e per facilitare il workflow della digitalizzazione
    • Costruzione e presentazione al digitalizzatore del piano di scansione
    • Importazione dall’applicativo di scansione dei metadati tecnici per la sezione <img>
    • Assemblaggio dei metadati in un file xml
    • Estrazione dei metadati necessari a consentire l’ harvesting OAI/PMH da parte dei Service provider
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 11,il MAG Schema
    • Come produrre i MAG? - 3
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 12,il MAG Schema
    • Come produrre i MAG? - 4
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI - 13,il MAG Schema
    • Come produrre i MAG? - 5
  • L’ARCHIVIO DEI METADATI ASSOCIATI AGLI OGGETTI DIGITALI – altri schemi
    • Metadati per la gestione dei diritti
    • METS schema for rights declaration:
    • http://cosimo.stanford.edu/sdr/ metsrights.xsd
    • XrML ( eXtensible Rights Markup Language )
    • http://www.xrml.org/
    • ODRL ( Open Digital Rights Language )
    • http:// odrl.net /
  • LA DEFINIZIONE DEL FLUSSO DI LAVORO
    • Movimentazione del materiale
    • Controllo bibliografico ed eventuale bonifica
    • Digitalizzazione
    • Post-produzione delle immagini
    • Assemblaggio dei metadati
    • Controlli di qualità
    • Ricollocazione fisica del materiale
    • Popolamento dell’archivio digitale, connessione OPAC
    • Pubblicazione/messa in servizio
    • Piano di comunicazione e marketing dei servizi
  • L’ALLESTIMENTO DELL’AMBIENTE DI LAVORO
    • Apparati di scansione
    • Sistema di illuminazione
    • Un laboratorio fotografico
  • PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE - 1
    • La qualità desiderata delle immagini master condiziona:
    • Scelta degli apparati HW e degli applicativi SW
    • Tempi di acquisizione ed elaborazione delle immagini
    • Spazio disco per lo storage
    • Oneri di gestione a carico del personale
    • Costi
  • PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE - 2
    • Immagine digitale raster : insieme di dati numerici che si realizza in una matrice di punti colorati detti pixel
    • Densità (o frequenza) di campionamento spaziale : si esprime in ppi (pixel x inch) , indica quanti pixel “entrano” nel corrispettivo digitale di un pollice (2,54 cm) del documento analogico
    • Risoluzione :”distanza minima D fra due linee ben contrastate … tale che queste ultime possano essere percepibili come distinte”
    • (Franco Lotti, Giorgio Trumpy. La digitalizzazione documentaria. Firenze : Fondazione Rinascimento digitale, 2007, p.14-15)
  • PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE – 3 Pieter Van Der Aa. Galerie agrèable du monde … [1729], Tav. 108
  • PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE – 4 Domenico Scarlatti. Sonate, Libro 5. 1753, c1v
  • PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE – 5
    • Il sistema di rappresentazione dei colori
    • Red ( canale rosso ) Green ( canale verde ) Blue ( canale blu ) ( R G B)
    • Tutti gli altri colori sono una miscela dei tre primari
    • Ai tre canali primari corrispondono tre diverse intensità luminose, che vengono rilevate dal sensore dello scanner per ciascun pixel
    • Un convertitore analogico/digitale converte il segnale elettrico che esprime le intensità luminose in bit
    • Profondità di colore : si esprime in bpp (bit per pixel) , consiste nel numero di bit che il sistema ha a disposizione per rappresentare le diverse intensità luminose di ciascun pixel
    • 8 bit per ciascun canale RGB -> 24 bit totali -> oltre 16 mil. di colori
  • PARAMETRI DI ACQUISIZIONE E MEMORIZZAZIONE – 6
  • FORMATI IMMAGINE E SUPPORTI DI MEMORIZZAZIONE – 1
    • Le immagini master vanno memorizzate in formato non compresso e non devono subire alcun trattamento
    • Il formato TIFF ( Tagged Image File Format ) http://partners.adobe.com/public/developer/tiff/index.html
    • I trattamenti sono possibili solo sulle immagini derivate (tipicamente in formato compresso JPEG, con diverse densità di campionamento spaziale)
    • Compressione: un algoritmo elimina i pixel considerati superflui
    • Il formato JPEG2000: http://www.jpeg.org/jpeg2000/
  • FORMATI IMMAGINE E SUPPORTI DI MEMORIZZAZIONE – 2
    • CD
    • DVD
    • Nastri LTO
    • Dischi rigidi ( hard disk ), NAS ( Network Attached Storage ), SAN (Storage Area Network )
  • I SISTEMI DI PROTEZIONE DEI CONTENUTI DIGITALI - 1
    • Wa termarking o filigrana elettronica, può essere visibile o invisibile
  • I SISTEMI DI PROTEZIONE DEI CONTENUTI DIGITALI - 2
    • Applicazioni della marchiatura:
    • Provare l’autenticità del documento (ma non basta!!)
    • Individuare usi commerciali illeciti
    • Dichiarare la proprietà dell’originale
    • Dichiarare la titolarità di diritti sull’oggetto digitale
  • I SISTEMI DI PROTEZIONE DEI CONTENUTI DIGITALI - 3
    • Il marchio (filigrana) elettronico:
    • E’ un codice identificativo permanentemente “impresso” sul documento tramite un codificatore
    • Può essere “rivelato” o estratto dal documento con una specifica procedura di decodifica
    • Deve resistere a:
    • -- tecniche di elaborazione del segnale
    • -- manipolazioni geometriche
  • I SISTEMI DI PROTEZIONE DEI CONTENUTI DIGITALI - 4
    • Requisiti di un sistema di marchiatura:
    • Definizione del n. di bit “impercettibili” da inserire nell’oggetto
    • Rivelazione affidabile
    • Marchiatura multipla
    • Reversibilità del marchio
    • Non invertibilità del marchio
    • Interoperabilità
  • LA CONSERVAZIONE DIGITALE -1
    • Da dove partire?
    • PADI ( Preserving Access to Digital Information ) http://www.nla.gov.au/padi/
    • DigitalPreservationEurope http://www.digitalpreservationeurope.eu /
    • ERPANET http://www.erpanet.org/
  • LA CONSERVAZIONE DIGITALE - 2
    • L’obsolescenza tecnologica
    • Incompatibilità di versioni differenti di HW e SW
    • Progressiva perdita delle conoscenze necessarie a gestire le vecchie versioni di HW e SW
    • Decadimento fisico dei supporti di archiviazione/memorizzazione
    • Indifferenza o scarsa sensibilità al problema da parte delle aziende, del legislatore, degli amministratori e degli stakeholders in genere
  • LA CONSERVAZIONE DIGITALE - 3 Acrobat 5 Acrobat 7 Da: S. Strathmann, Digital Preservation: an introduction, 2007
  • LA CONVERGENZA DIGITALE
    • un file è composto da una sequenza di bit, cioè da una catena codificata di 0 e di 1, a prescindere dai contenuti che esprime ( convergenza digitale )
    • è indipendente dal supporto, e dunque replicabile
    • è dipendente da altre catene di 0 e di 1 per essere interpretato (dipende dal software )
    • è dipendente da apparecchiature in grado di elaborare quelle catene e renderle utilizzabili ( dipende dall’hardware )
  • UN ESEMPIO: queste slide
      • Costituiscono una risorsa digitale indipendente dal supporto (non cambiano se le memorizzo sul disco rigido, su un CD-rom, o se le trasmetto per e-mail)
      • Ma dipendono dalla disponibilità nel tempo di:
      • Programma Powerpoint, versione …
      • Sistema operativo Windows, versione …
      • Personal computer Intel/AMD, versione …
    • Il problema dell’ obsolescenza tecnologica nasce quando quel software e/o quell’hardware non sono più disponibili.
  • QUANTA INFORMAZIONE?
    • HOW MUCH INFORMATION 2003?
    • http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/index.htm
    • Dati riferiti al 2002
    • 800 Mb prodotti per ciascun abitante della terra
    • 30% di incremento annuo fra 1999 e 2002
    • 92% immagazzinata su dischi rigidi in formato digitale
    • 0,01% disponibile su carta
    • Eterogeneità  Standardizzazione, Interoperabilità, Cooperazione
  • L’INFORMAZIONE DIGITALE
      • il contenuto significante ( testo )
      • le strutture iconiche (e/o testuali) che accompagnano il testo ( paratesto e peritesto )
      • la rete di relazioni con altre Informazioni digitali (attraverso i link ipertestuali )
    Look and feel dell’informazione
  • LA CONSERVAZIONE DIGITALE IN SENSO STRETTO consiste nel:
    • mantenimento nel lungo periodo di una sequenza di bit (conservazione fisica )
    • mantenimento nel lungo periodo dell’accessibilità ai contenuti espressi da quella sequenza di bit (conservazione funzionale ) Trusted Digital Repositories: Attributes and Responsabilities , an RLG-OCLC Report. Mountain View : RLG, 2002 http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf
    • ma: alcune procedure adottabili per la conservazione digitale, in particolare la migrazione, possono alterare la sequenza originaria di bit, creando copie autentiche del documento originale
  • LA CONSERVAZIONE DIGITALE, una definizione:
    • L’insieme delle attività e degli strumenti che assicurano che i documenti informatici siano mantenuti accessibili, utilizzabili (leggibili e intelligibili) e autentici (univocamente identificabili e integri) nel medio e nel lungo periodo, in un ambiente tecnologico presumibilmente diverso da quello originario ( Maria Guercio, 2005)
    • L’espressione “ ‘nel lungo periodo’ non significa fornire una garanzia per cinque o cinquanta anni, ma piuttosto lo sviluppo responsabile di strategie che possano affrontare i cambiamenti costanti prodotti dal mercato dell’informazione”
    • (U. Schwens, H. Liegmann. Citati da S.Strathmann, Digital Preservation: an introduction, 2007)
  • LA CONSERVAZIONE DIGITALE come fenomeno di natura sociale e culturale-1
    • Charter on the Preservation of the Digital Heritage (UNESCO, 2003) http:// infolac.ucol.mx / observatorio /memoria/carta%20ingles.pdf
    • L’ “Eredità culturale digitale” deve essere conservata
    • Selezione del materiale
    • Deposito legale o volontario
    • Quali istituzioni
    • Con quali risorse
  • LA CONSERVAZIONE DIGITALE come fenomeno di natura sociale e culturale-2
    • Firenze Agenda http:// www.iccu.sbn.it / upload / documenti /Firenze-agenda-17-Oct_ITAL.pdf
    • Creare consapevolezza e sviluppare meccanismi di cooperazione
    • Scambiarsi le “ buone pratiche ” e sviluppare punti di vista comuni
    • Politiche e strategie di lungo periodo
  • L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 1
    • un sistema nazionale e distribuito di archivi digitali collettivamente responsabili dell'accessibilità nel lungo periodo agli oggetti digitali, che sono istanze dell'eredità sociale, culturale ed economica di una nazione;
    • il carattere di affidabilità degli archivi, che devono essere in grado di gestire con sicurezza le operazioni di stoccaggio degli oggetti digitali, le procedure tecniche di conservazione e quelle necessarie al mantenimento dell'accessibilità;
    • la definizione di un processo di certificazione degli archivi, che sia prova della loro affidabilità;
    • la definizione di un diritto-dovere degli archivi certificati di esercitare attivamente una funzione di salvataggio dell'informazione digitale a rischio di distruzione o abbandono
    • Preserving Digital Information: Report of the Task Force on Archiving of Digital Information. Commission on Preservation and Access and the Research Libraries Group. 1996 http://www.oclc.org/programs/ourwork/past/digpresstudy/final-report.pdf
  • L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 2
    • Un archivio certificato
    • ha la missione di fornire un accesso permanente a risorse digitali gestite
    • ha la responsabilità della conservazione permanente delle risorse digitali per conto dei soggetti depositanti e a vantaggio di utenti attuali e futuri
    • dispone di strumenti organizzativi atti a mantenere nel tempo sia l’archivio che le risorse digitali di cui è responsabile
    • è in grado di dimostrare la propria sostenibilità finanziaria
    • Trusted Digital Repositories: Attributes and Responsabilities , an RLG-OCLC Report. Mountain View : RLG, 2002 http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf
  • L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 3
    • Un archivio certificato
    • progetta i propri sistemi in conformità con le convenzioni e gli standard comunemente accettati, al fine di assicurare continuativamente la gestione, l'accessibilità e la sicurezza delle risorse depositate
    • definisce metodi di valutazione dei sistemi che soddisfino i requisiti di affidabilità
    • è tale che i soggetti depositanti e gli utenti possano farvi assegnamento, per la conservazione permanente, in maniera aperta ed esplicita
    • adotta politiche e prassi verificabili , i cui risultati siano misurabili
    • Trusted Digital Repositories: Attributes and Responsabilities , an RLG-OCLC Report. Mountain View : RLG, 2002 http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf
  • L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 4
    • Digital stewardship (gestione responsabile)
    • “ conservare l’eredità culturale digitale è qualcosa di più del processo tecnico di mantenimento dei segnali digitali nel tempo. E’ un processo sociale e culturale, che implica la scelta di quali risorse conservare e in che forma; è un processo economico, che implica l’armonizzazione di mezzi limitati con obiettivi ambiziosi; è un processo giuridico, che implica la definizione del complesso dei diritti necessari alla conservazione permanente delle risorse culturali; è una questione di responsabilità ed incentivi, e di articolazione ed organizzazione di nuove procedure gestionali. E soprattutto è un’impegno continuativo, di lungo periodo, spesso condiviso e gestito in cooperazione da una molteplicità di istituzioni ”
    • B.Lavoie, L. Dempsey. Thirteen Ways of Looking at...Digital Preservation. In: D-Lib magazine , l uglio/agosto 2004 http://www.dlib.org/ dlib /july04/ lavoie /07lavoie.html
  • L’INFRASTRUTTURA “PROFONDA” DELLA CONSERVAZIONE DIGITALE - 5
    • responsabilità pubblica dell’intero processo
    • natura intrinsecamente sistemica e distribuita del servizio di conservazione permanente
    • problemi giuridici:
    • - irrigidimento della normativa sul diritto d’autore
    • - normative specifiche sul deposito dei documenti
    • elettronici, o diffusi tramite rete informatica
    • modelli dei costi
  • METADATI SPECIFICI PER LA CONSERVAZIONE – 1
    • Preservation Metadata: Implementation Strategies
    • working group (PREMIS ) http://www.oclc.org/research/projects/pmwg/
    • Provenienza : informazioni storiche sulla catena di custodia e/o proprietà
    • Autenticità : informazioni necessarie a certificare che l’oggetto non è stato alterato senza documentare l’alterazione
    • Attività di conservazione : documentazione delle azioni operate nel tempo sull’oggetto a fini di conservazione
    • Ambiente tecnologico : descrizione di hardware, sistema operativo e applicazioni software, necessarie a rappresentare ed usare l’oggetto
    • Gestione dei diritti : dichiarazione e registrazione storica dei diritti di proprietà intellettuale inerenti all’oggetto
  • METADATI SPECIFICI PER LA CONSERVAZIONE - 2
    • PREMIS
    • ha definito un modello dei dati , questi consistono di:
    • > Entità > Relazioni > Proprietà
    • La “mappa” delle Entità si può rappresentare in questo modo:
  • METADATI SPECIFICI PER LA CONSERVAZIONE - 3
    • PREMIS - Entità
    • Entità intellettuale : un insieme coerente di contenuto che può essere ragionevolmente descritto come un’unità, per esempio, un libro, una mappa, una fotografia o un database
    • Oggetto o Oggetto Digitale: un’unità discreta di informazione nella forma digitale, per esempio le singole pagine di un libro, la singola canzone di un CD
    • Evento : un’azione che implica almeno un oggetto o un agente noto al repository
    • Agente : una persona, un’organizzazione, o un programma software associato agli eventi di conservazione nella vita di un oggetto.
    • Diritti : dichiarazione di uno o più diritti o permessi legati ad un oggetto e/o ad un agente.
  • METADATI SPECIFICI PER LA CONSERVAZIONE - 4
    • PREMIS – Proprietà delle Entità
    • Ciascuna Entità ha delle Proprietà, elencate nel Dizionario PREMIS dei dati e definite “Unità semantiche”
    • Es.: l’Unità semantica Identificatore dell’Oggetto è una Proprietà dell’Entità Oggetto, così come la data di creazione, il checksum etc.
  • METADATI SPECIFICI PER LA CONSERVAZIONE - 5
    • PREMIS – Relazioni fra le Entità
    • Le Relazioni dichiarano le associazioni fra le istanze delle Entità ( sono espresse dalle frecce )
    • Sono possibili solo fra due o più Entità Oggetto o fra Entità di tipo diverso (es. fra un Oggetto e un Agente )
  • METADATI SPECIFICI PER LA CONSERVAZIONE – 4, PREMIS, modello dei dati Entità intellettuale Comprende 1 … n Fanno parte di 1 Oggetti Partecipano a 0 … n Modificano 0 … n Eventi Diritti Riguardano 1 … n Definiscono 1 … n Agenti Abilitano 0 … n Eseguono 0 …n Basato su: Angela Di Iorio, 2007
  • GLI IDENTIFICATORI PERSISTENTI -1
    • gli Identificatori Persistenti : “etichette” che permettono di identificare e localizzare il documento con continuità
    • - assegnare al documento un identificatore univoco , che sia potenzialmente stabile oltre il ciclo di vita del documento e del produttore del documento, e questo è un problema di natura tecnologica
    • - assegnare all’identificatore univoco il documento , assicurando che quel documento sia sempre lo stesso, cioè che il suo contenuto non venga alterato, e questo è compito del produttore del contenuto
    • ( Norman Paskin, 2004 )
  • GLI IDENTIFICATORI PERSISTENTI-2
    • Modello “organizzativo” generale di un sistema di identificatori persistenti
    • Selezione dei documenti digitali a cui attribuire un PI
    • Attribuzione al documento digitale di un PI e creazione di un registro dei PI
    • “ Risoluzione” del PI, cioè associazione al PI della URL del documento
    • Mantenimento del registro che associa PI e URL (anche se la URL cambia si mantiene il legame con il PI)
  • GLI IDENTIFICATORI PERSISTENTI-3 un modello di applicazione di NBN (progetto FRD/BNCF) E.Bellini, C.Cirinnà, M. Lunghi, 2008
  • I FORMATI DEI FILE - 1
    • La conoscenza del formato di un file, cioè delle informazioni necessarie ad interpretarlo, è irrinunciabile per la conservazione digitale
    • L’obsolescenza dei formati è una delle minacce più gravi alla conservazione della memoria digitale
  • I FORMATI DEI FILE - 2
    • Esempi di formati sono i seguenti:
    • Documenti: DOC, HTML
    • Immagini raster: TIFF, PNG, JPEG
    • Audio: WAV, MP3, MIDI
    • Video: MPEG, AVI
  • I FORMATI DEI FILE - 3
    • requisiti di ordine generale per i formati adatti alla conservazione:
    • specifiche sintattiche e semantiche pubbliche
    • uso non condizionato da licenze o brevetti
    • riconoscimento da parte di organismi di standardizzazione
    • ampia diffusione
    • indipendenza da tecniche proprietarie di crittografia o compressione
    • indipendenza dai supporti di memorizzazione
    • specifiche tecniche contenute nel formato stesso ( self-contained )
  • I FORMATI DEI FILE - 4
    • lo standard ISO 19005-1:2005 (PDF-A)
    • http://www.iso.org/iso/catalogue_detail?csnumber=38920
    • applicabile a documenti contenenti testo, immagini raster e dati vettoriali
    • totalmente self-contained , cioè contiene in sé stesso, embedded nel file, tutte le informazioni (cioè i metadati) che servono per renderlo accessibile, interpretabile e leggibile, e non dipende funzionalmente da nessuna entità esterna (cioè non embedded )
  • I FORMATI DEI FILE - 5
    • I Registri dei formati dei file
    • Identificazione Ho un oggetto digitale, qual’è il suo formato?
    • Validazione Ho un oggetto che dichiara di essere di formato F, è vero?
    • Trasformazione ho un oggetto di formato F, ma ho bisogno di un formato G, come posso produrlo?
    • Caratterizzazione ho un oggetto di formato F, quali sono le sue caratteristiche?
    • Valutazione del rischio ho un oggetto di formato F, è a rischio di obsolescenza?
    • Consegna ho un oggetto di formato F , come posso fornirlo?
  • METODI DELLA CONSERVAZIONE DIGITALE - 1
    • Refreshing :
    • trasferimento periodico dei documenti digitali su nuovi supporti; si tratta di una
    • “ pre-strategia necessaria ma non sufficiente, e comunque consolidata”
    • (Giovanni Bergamin)
  • METODI DELLA CONSERVAZIONE DIGITALE - 2
    • Migrazione :
    • trasferimento sistematico dei documenti digitali su nuove piattaforme HW e SW prima che le precedenti diventino obsolete
  • METODI DELLA CONSERVAZIONE DIGITALE - 3
    • Emulazione :
    • Il suo maggiore teorico, Jeff Rothenberg, la definisce (1999): “un approccio che permette l’emulazione di sistemi obsoleti su sistemi futuri e non ancora noti, in modo che un software originale di un documento digitale possa essere usato in futuro malgrado sia ormai obsoleto”. Rothenberg si propone di far funzionare una nuova piattaforma tecnologica “come se” fosse una vecchia piattaforma . A questo scopo egli propone di “incapsulare” il documento digitale in un contenitore fisico o logico insieme alla documentazione dell’hardware, al sistema operativo, al software di gestione ed ai diversi tipi di metadati necessari per renderlo accessibile, interpretabile e fruibile, tutti sotto forma di catene di 0 e di 1. Questo allo scopo di costruire in futuro un SW che emuli la vecchia piattaforma.