Accesso all'informazione  e collaborazione virtuale Giovanni Bergamin 16 gennaio 2012
Che cosa sono i metadati Non tanto  “ dati relativi a (che informano su) altri dati ” Ma (prendendo spunto da Karen Coyle) dati: costruiti con l ’ obiettivo di facilitare una determinata attività azionabili e riusabili Una definizione funzionale:  “ più grande è una biblioteca, più è necessario distinguere tra di loro i libri  …”  (Panizzi 1850)
Alcuni esempi 3 diapositive da Karen Coyle 1 gita - mia - per sentieri toscani
 
 
La nostra madre Terra Latitudine e longitudine metadati
 
 
 
Organizzare l ’ informazione “ Librarians and Google share a similar mission: to organize the world's information and make it universally accessible and useful.  ” http://www.google.com/librariancenter/index.html “ Universal Bibliographic Control (UBC) as a long-term programme for the development of a world-wide system for the control and exchange of bibliographic information ”  [IFLA]
Google è una Biblioteca Digitale? Tesi 4  Manifesto :  “ Le biblioteche digitali sono biblioteche ” Che cosa è una biblioteca? a) un servizio di mediazione: organizzare la conoscenza per renderla accessibile b) un servizio di  “ custodia ” : si assicura che le risorse siano accessibili per il servizio a) che intende offrire c) un mandato da parte della comunità di riferimento  per i servizi a) e b)
Di che cosa parleremo assieme I metadati: permettono il  “ controllo ”  di un progetto (di un servizio) a tutti i livelli sono  “ parte costitutiva ”  di una risorsa digitale
Metadati (definizioni e tipologie) Non esistono solo i metadati descrittivi Definizione funzionale metadati finalizzati al  recupero  della risorsa (metadati  descrittivi );  metadati necessari alla  gestione  della risorsa (metadati  gestionali).
Chi li crea? Automatica (generata dal software: il  relevance ranking  dei motori di ricerca; la marcatura delle foto digitali con le coordinate spazio temporali) Alla fonte (p. es. l ’ autore) Un intermediario (p. es. il bibliotecario) L ’ utente (es  connotea ,ma anche - indirettamente -  nell ’ influenzare il risultato dei motori di ricerca  ecc)
Si parla di metadati Con il diffondersi delle risorse digitali su web …   i tag  “ meta ”  delle pagine web Una contrapposizione ormai superata:  M. Gorman, catalogazione e  “ metadata boys ”   È necessario partire dalla  “ risorsa digitale ”
ISOC-- Resource ISOC  –  RFC 2396 (URL, URI) Tutto che quello che ha una identità può essere visto come  “ risorsa ”  come ad esempio un documento digitale, una immagine o un servizio (es. il bollettino meteorologico di oggi per Los Angeles), oppure una raccolta di altre risorse.  Non tutte le risorse sono ricuperabili in rete (=si possono avere con un  “ clic ” ): ad es. gli esseri umani, i libri in una biblioteca possono essere considerati risorse (ma non si possono avere con un  “ clic ” )
OAIS  –  Content information Content information  come insieme di: Content data object Representation information   Distingue tra (metadati esterni): Descriptive information Packaging information Preservation description information
PREMIS  –  Digital object Digital object  come unità distinta di informazione in forma digitale suddiviso in tre tipologie File  (bit più formato) Bitstream  (parte di un File) Representation  (uno o più File in grado di veicolare una  Intellectual entity )
PREMIS  –  Digital object -2 definisce la  Intellectual entity  come  “ insieme coerente di contenuti  identificato, descritto e trattato come unità ” definisce nel dettaglio i  Preservation metadata : ovvero quelle specifiche informazioni che un  “ archivio ”  ha bisogno di conoscere per supportare il processo di conservazione
ISO 27001 - Asset Tutto quello che ha valore per una organizzazione e per il quale occorre assicurare disponibilità, confidenzialità, integrità
ISO21000/MPEG21  –   digital item / resource  digital item (elemento) = oggetto digitale strutturato e normalizzato a livello di rappresentazione, identificazione e metadati  Resource = qualsiasi bene (asset) che sia identificabile (una immagine, un brano audio, un testo  –  il livello di granularità non è predeterminato)
Dati e Metadati  a.  dati  –  le sequenze di bit b.  metadati interni (formati) c.  metadati esterni (possono essere distinti per tipologie funzionali, es. metadati descrittivi, metadati per i diritti d ’ uso della risorsa, ecc.)
Risorse: Dati e metadati - 2 di solito per risorsa si intende  a. + b. per metadati si fa riferimento a  c. Le risorse possono essere viste/trattate a differenti livelli di granularità di ordine logico e fisico
Le risorse digitali sono  “ oggetti sociali ” a differenza degli  oggetti naturali,    stanno nello spazio e nel tempo solo per il fatto che  soggetti  li  rappresentano .  In particolare l' oggetto sociale: “ è il risultato di atti sociali ”  (sono coinvolti almeno due soggetti); è caratterizzato dal fatto di essere  “ iscritto su carta, su un file di computer, o anche semplicemente nella testa delle persone ”  [M. Ferraris].
Le risorse digitali sono  “ oggetti sociali ”  - 2 Rispetto alla  “ iscrizione ”  su carta  –  tipica della risorsa tradizionale (ad esempio, il libro)  –  quella su file presenta almeno due sostanziali novità: l'indipendenza della risorsa dalla fisicità del supporto (un file come sequenza di bit può essere facilmente riprodotto e viene meno la distinzione tra originale, copia, clone e duplicato); la dipendenza della risorsa dalle tecnologie informatiche con tutti i ben noti rischi (ad esempio l'obsolescenza di una tecnologia pregiudica la fruibilità di un file - magari perfettamente  conservato a livello di bit). L'espressione  metadati interni  o  formato  rende evidente questo particolare tipo di  “ iscrizione ”  che consiste nel mettere i bit in un determinato ordine.
Come bibliotecari siamo consapevoli da tempo che i metadati durano più a lungo delle applicazioni
Siamo anche consapevoli che il MARC non basta più  …
Il problema “ Sebbene i sistemi possano oggi esporre i metadati per la raccolta automatica e standardizzata (harvesting es OAI) le risorse digitali rimangono ancora rinchiuse in contenitori di tipo proprietario ” Dobbiamo rompere questi contenitori ed esporre la semantica delle risorse depositate: la struttura di una risorsa  dovrebbe essere esplorabile da una macchina senza l'intervento dell'essere umano che clicca e segue un link ”  [M Witt - 2010]
La ricetta di TBL: il web semantico Usa URI per identificare dati e metadati Usa  HTTP  URI così che possono essere cliccate(" dereferenced ") sia dalle persone che da  user agents . Quando l ’ URI viene cliccata dalle macchine rispondi con informazioni in formati standard come  RDF/XML . Includi tra le informazioni collegamenti a altre URI nel web .
La ricetta di VDS: OAI - ORE “ Open Archives Initiative Object Reuse and Exchange (OAI-ORE) definisce standard per la descrizione e lo scambio di aggregazioni di risorse presenti in rete ” “ L'obiettivo di questi standard è di esporre la ricchezza di queste aggregazioni alle applicazioni che supportano la creazione, il deposito, lo scambio, la visualizzazione, il riuso e la conservazione ”
OAI - ORE in breve Fornisce convenzioni per aggregare dati primari (o  dati tout court ) e secondari (o  metadati )  in un contenitore  che rispetta una delle seguenti sintassi:  RDF/XML, Atom XML  oppure  RDFa E' un contenitore per aggregazioni omogenee (nel linguaggio PREMIS per archiviare una Representation di una Intellectual entity) I dati e metadati possono essere inseriti all'interno del contenitore XML o semplicemente referenziati (in questo caso dentro il file XML troviamo solo indirizzo di tipo URL) E' una proposta consapevole del  Web semantico  (in generale e dei  Linked data  (in particolare)
 
Scenari - 1
Scenari - 2 http://openlibrary.org/authors/OL22022A/Barbara_Cartland http://openlibrary.org/authors/OL22022A.rdf http://viaf.org/viaf/64003092/#Cartland,_Barbara,_1902-2000 http://viaf.org/viaf/64003092/rdf.xml [dal blog di  Karen Koyle, 2011-04-24]
Un identificatore di tipo URI = 1 risorsa identificata e descritta (da tutti riusabile)? http://richard.cyganiak.de/2007/10/lod/imagemap.html http://www.w3.org/2005/Incubator/lld/wiki/Cluster_BibData Ci vuole un  Indice  (anzi un  Sindice )?
Intanto  …  uso diffuso dei formati di aggregazione WARC MAG METS BAGIT
WARC ISO 28500 Il formato WARC (Web ARChive) mette a disposizione convenzioni per  concatenare in un file - anche di grandi dimensioni - risorse digitali anche eterogene le risorse digitali sono viste come Bitstream (PREMIS), ogni Bistream è composto da una intestazione testuale e da un blocco di dati di lunghezza non predefinita E' usato nei progetti di archiviazione del web Deriva dal formato ARC  ( Internet Archive ) e viene usato per la raccolta (harvesting) dei siti web .
WARC ISO 28500 - 2
WARC pro e contro [p] facilita l'archiviazione di massa in un file system convenzionale (come i contenitori ci aiutano a mettere ordine in un ripostiglio che contiene una rilevante quantità di oggetti di differenti dimensioni) [p] ha dato prova di essere scalabile: archiviazione e accesso a grandi quantità di dati per Internet Archive [p]  si possono trovare in rete tutti gli strumenti per la gestione di questo tipo di file [p] E' uno standard ISO  [c] E' pensato per l'archiviazione dei siti web
MPEG21 DIDL  MPEG-21  (ISO 21000) è uno standard ISO  che  “ definisce un insieme di regole per la fornitura e l'uso (comsumption) delle risorse digitali  ”   DIDL  =  Digital Item Declaration Language  per la rappresentazione di oggetti digitali complessi   ; is the part 2 (out of 10) of MPEG-21
MPEG 21 DIDL - 2 Offre convenzioni per mettere insieme in un file XML dati primari (o dati) e secondari (o metadati)   E' un contenitore per aggregazioni omogenee (nel linguaggio PREMIS per archiviare una Representation di una Intellectual entity) I dati e metadati possono essere inseriti all'interno del contenitore XML o semplicemente referenziati (in questo caso dentro il file XML troviamo solo indirizzo di tipo URL) I dati di tipo binario - se inseriti all'interno del contenitore XML - sono codificati in BASE64 come gli allegati delle nostre mail
 
MPEG21 DIDL pro e contro [p] sintassi XML basata su uno Schema XML  [p] è uno standard per tutte le risorse digitali (non è limitato alle sole biblioteche)  [p] è uno standard ISO  [p] usato dai sw per IR (Eprints, Dspace ecc) [c] non ci sono molti strumenti open source per la gestione dei file DIDL
METS METS =  Metadata Encoding and Transmission Standard   Uno Schema  XML per   “ codificare metadati  descrittivi, amministrativi e strutturali  relativi a risorse digitali di una biblioteca digitale" Mantenuto dalla Library of Congress e sviluppato come una  iniziativa della Digital Library Federation.
METS 2 Offre convenzioni per mettere insieme in un file XML dati primari (o dati) e secondari (o metadati)   E' un contenitore per aggregazioni omogenee (nel linguaggio PREMIS per archiviare una Representation di una Intellectual entity) I metadati possono essere inseriti all'interno del contenitore XML o semplicemente referenziati (in questo caso dentro il file XML troviamo solo un indirizzo di tipo URL) I dati non possono essere inseriti all'interno del contenitore XML ma devono essere  referenziati (dei dati dentro il file XML troviamo sempre e solo un indirizzo di tipo URL)
 
METS pro e contro [p]  sintassi XML basata su uno Schema XML [p] oggi molto usato (anche da GBS … ) [p] Ci sono molti strumenti open source disponibili [c] limitato ai progetti di digitalizzazione
MAG Uno Schema  XML per  codificare metadati  descrittivi e gestionali un progetto tutto italiano Esistono XSLT per la trasformazione da MAG in METS
MAG - 2 Offre convenzioni per mettere insieme in un file XML dati primari (o dati) e secondari (o metadati) E' un contenitore per aggregazioni omogenee (nel linguaggio PREMIS per archiviare una Representation di una Intellectual entity) I metadati possono essere inseriti all'interno del contenitore XML o semplicemente referenziati (in questo caso dentro il file XML troviamo solo un indirizzo di tipo URL) I dati non possono essere inseriti all'interno del contenitore XML ma devono essere  referenziati (dei dati dentro il file XML troviamo sempre e solo un indirizzo di tipo URL)
 
MAG pro e contro [p] Una risposta a problemi reali (nasce più di 10 anni fa quando METS era ancora agli albori):   …  semplice ma applicabile subito [c] usato solo in Italia
Bagit Specifiche per aggregare risorse digitali al fine di facilitare il trasferimento tra archivi Creato dalla Library of Congress  –   con la California Digital Library e la Stanford University Le risorse sono aggregate per formare un  bag  comprendente - oltre alle risorse  - anche una etichetta di tipo testuale  (il   tag ) che ha lo scopo di facilitare il ricevimento, l'archiviazione e il recupero delle risorse E' di solito usato per inviare risorse digitali a un deposito che si fa carico della conservazione
 
Bagit pro e contro [p] Buona diffusione (a partire dalla Library of Congress). [p] facile da capire e da implementare (in pratica uno zip ...) [p] molti strumenti disponibili per l'utente  [c] limitata standardizzazione dei metadati 
Per una discussione - 1 I formati per l'uso delle risorse digitali oggi più diffusi non fanno uso di RDF (e a volte nemmeno di XML) Esiste da tempo una  buona sperimentazione  con  soluzioni che spesso si sovrappongono  Qualche segnale da considerare: L'acquisizione da parte di Google di  Freebase 46 milioni di  DOI disponibili come Linked data  (aprile 2011) la comparsa di OAI-ORE nei sw per i repository istituzionali (Eprints, Dspace ecc)
Per una discussione - 2 l'enorme produzione di open data (anche se non linked) la  discussione su un  tld .data l'emergere di strumenti utili "a prescindere" p. es  Google Refine, Google Fusion Tables, SILK, MINT, D3 

Accesso remoto, interfaccia ed architettura dell'informazione

  • 1.
    Accesso all'informazione  e collaborazionevirtuale Giovanni Bergamin 16 gennaio 2012
  • 2.
    Che cosa sonoi metadati Non tanto “ dati relativi a (che informano su) altri dati ” Ma (prendendo spunto da Karen Coyle) dati: costruiti con l ’ obiettivo di facilitare una determinata attività azionabili e riusabili Una definizione funzionale: “ più grande è una biblioteca, più è necessario distinguere tra di loro i libri …” (Panizzi 1850)
  • 3.
    Alcuni esempi 3diapositive da Karen Coyle 1 gita - mia - per sentieri toscani
  • 4.
  • 5.
  • 6.
    La nostra madreTerra Latitudine e longitudine metadati
  • 7.
  • 8.
  • 9.
  • 10.
    Organizzare l ’informazione “ Librarians and Google share a similar mission: to organize the world's information and make it universally accessible and useful. ” http://www.google.com/librariancenter/index.html “ Universal Bibliographic Control (UBC) as a long-term programme for the development of a world-wide system for the control and exchange of bibliographic information ” [IFLA]
  • 11.
    Google è unaBiblioteca Digitale? Tesi 4 Manifesto : “ Le biblioteche digitali sono biblioteche ” Che cosa è una biblioteca? a) un servizio di mediazione: organizzare la conoscenza per renderla accessibile b) un servizio di “ custodia ” : si assicura che le risorse siano accessibili per il servizio a) che intende offrire c) un mandato da parte della comunità di riferimento  per i servizi a) e b)
  • 12.
    Di che cosaparleremo assieme I metadati: permettono il “ controllo ” di un progetto (di un servizio) a tutti i livelli sono “ parte costitutiva ” di una risorsa digitale
  • 13.
    Metadati (definizioni etipologie) Non esistono solo i metadati descrittivi Definizione funzionale metadati finalizzati al recupero della risorsa (metadati descrittivi ); metadati necessari alla gestione della risorsa (metadati gestionali).
  • 14.
    Chi li crea?Automatica (generata dal software: il relevance ranking dei motori di ricerca; la marcatura delle foto digitali con le coordinate spazio temporali) Alla fonte (p. es. l ’ autore) Un intermediario (p. es. il bibliotecario) L ’ utente (es connotea ,ma anche - indirettamente - nell ’ influenzare il risultato dei motori di ricerca ecc)
  • 15.
    Si parla dimetadati Con il diffondersi delle risorse digitali su web … i tag “ meta ” delle pagine web Una contrapposizione ormai superata: M. Gorman, catalogazione e “ metadata boys ” È necessario partire dalla “ risorsa digitale ”
  • 16.
    ISOC-- Resource ISOC – RFC 2396 (URL, URI) Tutto che quello che ha una identità può essere visto come “ risorsa ” come ad esempio un documento digitale, una immagine o un servizio (es. il bollettino meteorologico di oggi per Los Angeles), oppure una raccolta di altre risorse. Non tutte le risorse sono ricuperabili in rete (=si possono avere con un “ clic ” ): ad es. gli esseri umani, i libri in una biblioteca possono essere considerati risorse (ma non si possono avere con un “ clic ” )
  • 17.
    OAIS – Content information Content information come insieme di: Content data object Representation information Distingue tra (metadati esterni): Descriptive information Packaging information Preservation description information
  • 18.
    PREMIS – Digital object Digital object come unità distinta di informazione in forma digitale suddiviso in tre tipologie File (bit più formato) Bitstream (parte di un File) Representation (uno o più File in grado di veicolare una Intellectual entity )
  • 19.
    PREMIS – Digital object -2 definisce la Intellectual entity come “ insieme coerente di contenuti  identificato, descritto e trattato come unità ” definisce nel dettaglio i Preservation metadata : ovvero quelle specifiche informazioni che un “ archivio ” ha bisogno di conoscere per supportare il processo di conservazione
  • 20.
    ISO 27001 -Asset Tutto quello che ha valore per una organizzazione e per il quale occorre assicurare disponibilità, confidenzialità, integrità
  • 21.
    ISO21000/MPEG21 – digital item / resource digital item (elemento) = oggetto digitale strutturato e normalizzato a livello di rappresentazione, identificazione e metadati Resource = qualsiasi bene (asset) che sia identificabile (una immagine, un brano audio, un testo – il livello di granularità non è predeterminato)
  • 22.
    Dati e Metadati a. dati – le sequenze di bit b. metadati interni (formati) c. metadati esterni (possono essere distinti per tipologie funzionali, es. metadati descrittivi, metadati per i diritti d ’ uso della risorsa, ecc.)
  • 23.
    Risorse: Dati emetadati - 2 di solito per risorsa si intende a. + b. per metadati si fa riferimento a c. Le risorse possono essere viste/trattate a differenti livelli di granularità di ordine logico e fisico
  • 24.
    Le risorse digitalisono “ oggetti sociali ” a differenza degli oggetti naturali,   stanno nello spazio e nel tempo solo per il fatto che soggetti li rappresentano . In particolare l' oggetto sociale: “ è il risultato di atti sociali ” (sono coinvolti almeno due soggetti); è caratterizzato dal fatto di essere “ iscritto su carta, su un file di computer, o anche semplicemente nella testa delle persone ” [M. Ferraris].
  • 25.
    Le risorse digitalisono “ oggetti sociali ” - 2 Rispetto alla “ iscrizione ” su carta – tipica della risorsa tradizionale (ad esempio, il libro) – quella su file presenta almeno due sostanziali novità: l'indipendenza della risorsa dalla fisicità del supporto (un file come sequenza di bit può essere facilmente riprodotto e viene meno la distinzione tra originale, copia, clone e duplicato); la dipendenza della risorsa dalle tecnologie informatiche con tutti i ben noti rischi (ad esempio l'obsolescenza di una tecnologia pregiudica la fruibilità di un file - magari perfettamente  conservato a livello di bit). L'espressione metadati interni o formato rende evidente questo particolare tipo di “ iscrizione ” che consiste nel mettere i bit in un determinato ordine.
  • 26.
    Come bibliotecari siamoconsapevoli da tempo che i metadati durano più a lungo delle applicazioni
  • 27.
    Siamo anche consapevoliche il MARC non basta più …
  • 28.
    Il problema “Sebbene i sistemi possano oggi esporre i metadati per la raccolta automatica e standardizzata (harvesting es OAI) le risorse digitali rimangono ancora rinchiuse in contenitori di tipo proprietario ” Dobbiamo rompere questi contenitori ed esporre la semantica delle risorse depositate: la struttura di una risorsa  dovrebbe essere esplorabile da una macchina senza l'intervento dell'essere umano che clicca e segue un link ” [M Witt - 2010]
  • 29.
    La ricetta diTBL: il web semantico Usa URI per identificare dati e metadati Usa HTTP URI così che possono essere cliccate(" dereferenced ") sia dalle persone che da user agents . Quando l ’ URI viene cliccata dalle macchine rispondi con informazioni in formati standard come RDF/XML . Includi tra le informazioni collegamenti a altre URI nel web .
  • 30.
    La ricetta diVDS: OAI - ORE “ Open Archives Initiative Object Reuse and Exchange (OAI-ORE) definisce standard per la descrizione e lo scambio di aggregazioni di risorse presenti in rete ” “ L'obiettivo di questi standard è di esporre la ricchezza di queste aggregazioni alle applicazioni che supportano la creazione, il deposito, lo scambio, la visualizzazione, il riuso e la conservazione ”
  • 31.
    OAI - OREin breve Fornisce convenzioni per aggregare dati primari (o dati tout court ) e secondari (o metadati )  in un contenitore  che rispetta una delle seguenti sintassi:  RDF/XML, Atom XML oppure RDFa E' un contenitore per aggregazioni omogenee (nel linguaggio PREMIS per archiviare una Representation di una Intellectual entity) I dati e metadati possono essere inseriti all'interno del contenitore XML o semplicemente referenziati (in questo caso dentro il file XML troviamo solo indirizzo di tipo URL) E' una proposta consapevole del Web semantico (in generale e dei Linked data (in particolare)
  • 32.
  • 33.
  • 34.
    Scenari - 2http://openlibrary.org/authors/OL22022A/Barbara_Cartland http://openlibrary.org/authors/OL22022A.rdf http://viaf.org/viaf/64003092/#Cartland,_Barbara,_1902-2000 http://viaf.org/viaf/64003092/rdf.xml [dal blog di Karen Koyle, 2011-04-24]
  • 35.
    Un identificatore ditipo URI = 1 risorsa identificata e descritta (da tutti riusabile)? http://richard.cyganiak.de/2007/10/lod/imagemap.html http://www.w3.org/2005/Incubator/lld/wiki/Cluster_BibData Ci vuole un Indice (anzi un Sindice )?
  • 36.
    Intanto … uso diffuso dei formati di aggregazione WARC MAG METS BAGIT
  • 37.
    WARC ISO 28500Il formato WARC (Web ARChive) mette a disposizione convenzioni per concatenare in un file - anche di grandi dimensioni - risorse digitali anche eterogene le risorse digitali sono viste come Bitstream (PREMIS), ogni Bistream è composto da una intestazione testuale e da un blocco di dati di lunghezza non predefinita E' usato nei progetti di archiviazione del web Deriva dal formato ARC  ( Internet Archive ) e viene usato per la raccolta (harvesting) dei siti web .
  • 38.
  • 39.
    WARC pro econtro [p] facilita l'archiviazione di massa in un file system convenzionale (come i contenitori ci aiutano a mettere ordine in un ripostiglio che contiene una rilevante quantità di oggetti di differenti dimensioni) [p] ha dato prova di essere scalabile: archiviazione e accesso a grandi quantità di dati per Internet Archive [p]  si possono trovare in rete tutti gli strumenti per la gestione di questo tipo di file [p] E' uno standard ISO  [c] E' pensato per l'archiviazione dei siti web
  • 40.
    MPEG21 DIDL MPEG-21 (ISO 21000) è uno standard ISO  che  “ definisce un insieme di regole per la fornitura e l'uso (comsumption) delle risorse digitali  ” DIDL = Digital Item Declaration Language per la rappresentazione di oggetti digitali complessi ; is the part 2 (out of 10) of MPEG-21
  • 41.
    MPEG 21 DIDL- 2 Offre convenzioni per mettere insieme in un file XML dati primari (o dati) e secondari (o metadati)   E' un contenitore per aggregazioni omogenee (nel linguaggio PREMIS per archiviare una Representation di una Intellectual entity) I dati e metadati possono essere inseriti all'interno del contenitore XML o semplicemente referenziati (in questo caso dentro il file XML troviamo solo indirizzo di tipo URL) I dati di tipo binario - se inseriti all'interno del contenitore XML - sono codificati in BASE64 come gli allegati delle nostre mail
  • 42.
  • 43.
    MPEG21 DIDL proe contro [p] sintassi XML basata su uno Schema XML  [p] è uno standard per tutte le risorse digitali (non è limitato alle sole biblioteche) [p] è uno standard ISO  [p] usato dai sw per IR (Eprints, Dspace ecc) [c] non ci sono molti strumenti open source per la gestione dei file DIDL
  • 44.
    METS METS = Metadata Encoding and Transmission Standard Uno Schema  XML per   “ codificare metadati  descrittivi, amministrativi e strutturali  relativi a risorse digitali di una biblioteca digitale" Mantenuto dalla Library of Congress e sviluppato come una  iniziativa della Digital Library Federation.
  • 45.
    METS 2 Offreconvenzioni per mettere insieme in un file XML dati primari (o dati) e secondari (o metadati)   E' un contenitore per aggregazioni omogenee (nel linguaggio PREMIS per archiviare una Representation di una Intellectual entity) I metadati possono essere inseriti all'interno del contenitore XML o semplicemente referenziati (in questo caso dentro il file XML troviamo solo un indirizzo di tipo URL) I dati non possono essere inseriti all'interno del contenitore XML ma devono essere  referenziati (dei dati dentro il file XML troviamo sempre e solo un indirizzo di tipo URL)
  • 46.
  • 47.
    METS pro econtro [p]  sintassi XML basata su uno Schema XML [p] oggi molto usato (anche da GBS … ) [p] Ci sono molti strumenti open source disponibili [c] limitato ai progetti di digitalizzazione
  • 48.
    MAG Uno Schema  XML per codificare metadati  descrittivi e gestionali un progetto tutto italiano Esistono XSLT per la trasformazione da MAG in METS
  • 49.
    MAG - 2Offre convenzioni per mettere insieme in un file XML dati primari (o dati) e secondari (o metadati) E' un contenitore per aggregazioni omogenee (nel linguaggio PREMIS per archiviare una Representation di una Intellectual entity) I metadati possono essere inseriti all'interno del contenitore XML o semplicemente referenziati (in questo caso dentro il file XML troviamo solo un indirizzo di tipo URL) I dati non possono essere inseriti all'interno del contenitore XML ma devono essere  referenziati (dei dati dentro il file XML troviamo sempre e solo un indirizzo di tipo URL)
  • 50.
  • 51.
    MAG pro econtro [p] Una risposta a problemi reali (nasce più di 10 anni fa quando METS era ancora agli albori):   … semplice ma applicabile subito [c] usato solo in Italia
  • 52.
    Bagit Specifiche peraggregare risorse digitali al fine di facilitare il trasferimento tra archivi Creato dalla Library of Congress –   con la California Digital Library e la Stanford University Le risorse sono aggregate per formare un bag comprendente - oltre alle risorse  - anche una etichetta di tipo testuale  (il   tag ) che ha lo scopo di facilitare il ricevimento, l'archiviazione e il recupero delle risorse E' di solito usato per inviare risorse digitali a un deposito che si fa carico della conservazione
  • 53.
  • 54.
    Bagit pro econtro [p] Buona diffusione (a partire dalla Library of Congress). [p] facile da capire e da implementare (in pratica uno zip ...) [p] molti strumenti disponibili per l'utente  [c] limitata standardizzazione dei metadati 
  • 55.
    Per una discussione- 1 I formati per l'uso delle risorse digitali oggi più diffusi non fanno uso di RDF (e a volte nemmeno di XML) Esiste da tempo una buona sperimentazione con soluzioni che spesso si sovrappongono Qualche segnale da considerare: L'acquisizione da parte di Google di Freebase 46 milioni di DOI disponibili come Linked data (aprile 2011) la comparsa di OAI-ORE nei sw per i repository istituzionali (Eprints, Dspace ecc)
  • 56.
    Per una discussione- 2 l'enorme produzione di open data (anche se non linked) la discussione su un  tld .data l'emergere di strumenti utili "a prescindere" p. es Google Refine, Google Fusion Tables, SILK, MINT, D3 

Editor's Notes

  • #7 Longitude and latitude are metadata about the planet. The planet doesn ’ t really have lines about around it that define spaces.
  • #13 Se il tuo strumento è solo un martello, finirà che vedrai chiodi dapertutto
  • #35 2 URI per lo stesso oggetto?