• Like
  • Save
Metadati2008
Upcoming SlideShare
Loading in...5
×
 

Metadati2008

on

  • 2,759 views

Courseware on metadata

Courseware on metadata

Statistics

Views

Total Views
2,759
Views on SlideShare
2,755
Embed Views
4

Actions

Likes
2
Downloads
76
Comments
0

1 Embed 4

http://www.slideshare.net 4

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Metadati2008 Metadati2008 Presentation Transcript

    • Metadati Antonella De Robbio Firenze, Firenze gennaio 2008 ICCU- Progetto Centri E-Learning2 Corso di Specializzazione in Esperti p p per la Documentazione Avanzata e la Promozione del Patrimonio Culturale
    • Cosa sono i metadati A cosa servono i metadati Strutturare metadati Schemi di metadati ed insiemi di S h i t d ti d i i i elementi Dublin Core, TEI, METS, MODS, EAD, LOM. Core TEI METS MODS EAD LOM ‹indecs›, ONIX, CDWA, VRAMPEG, FGDC, DDI Creare metadati Interoperabilità e scambio di metadati Antonella De Robbio – Corso Metadati 2
    • Dati i f D ti o informazioni? i i? derobbio I metadati contestualizzano aHUn1l5 HU 1l5 i dati trasformandoli in informazioni 120657 Una sintassi li rende comprensibili Username Etichette per condividere le informazioni Passwd Data di nascita Antonella De Robbio – Corso Metadati 3
    • M t d ti e metatag Metadati t t Metadato (dal greco meta- quot;oltre, dopoquot; e dal latino datum quot;informazionequot; - informazione plurale: data), letteralmente quot;dato su un (altro) dato , è l'informazione che descrive datoquot; l informazione un insieme di dati. I meta tag sono metadati presenti nel d i i l linguaggio HTML utilizzati per fornire informazioni sulle pagine agli utenti o ai motori di ricerca. Antonella De Robbio – Corso Metadati 4
    • Che cosa significa metadato? Definizione di metadato letteralmente definito come quot;dato sul dato” inteso nel significato di quot;dato strutturato g sulle risorse Tim Berners-Lee lo definisce quot;informazione Berners Lee informazione comprensibile alla macchina su risorse Web o altri oggetti . oggettiquot; l'assioma è questo: il metadato è un dato un metadato può descrivere un metadato Antonella De Robbio – Corso Metadati 5
    • I metadati possono descrivere risorse a qualsiasi livello di aggregazione Possono descrivere una collezione una singola risorsa o collezione, un componente di una risorsa più grande (per esempio, una fotografia all’interno di un articolo). g ) Nello stesso modo in cui i catalogatori prendono decisioni sul fatto di creare un record di catalogo per l’intero insieme di volumi o per ogni singolo volume dell’insieme, i dell’insieme creatori di metadati prendono le stesse decisioni. I metadati possono anche essere utilizzati per la descrizione di risorse a tutti i livelli del modello d’informazione Functional Requirements for Bibliographic Records: opera, espressione manifestazione o articolo opera espressione, articolo. Per esempio, un metadato può descrivere un relazione, una particolare edizione di quella relazione o una copia specifica di quella edizione della Antonella De Robbio – Corso Metadati 6
    • I metadati sono la chiave per assicurare la sopravvivenza delle risorsee la loro accessibilità in futuro I metadati possono essere inseriti in un oggetto digitale o possono essere depositati separatamente. Spesso i metadati sono inseriti in documenti HTML e nelle testate dei files di immagini. Depositare i metadati con l’oggetto che descrivono l oggetto assicura che i metadati non vengano persi, elimina i problemi di collegamento tra dati e metadati a assicura che i metadati e l’oggetto siano aggiornati insieme. l oggetto insieme Altre volte, il deposito separato dei metadati può semplificare la gestione stessa dei metadati a facilitare al ricerca e il recupero dei metadati metadati. In sintesi: i metadati sono di soliti immagazzinati in un sistema di database e collegati agli oggetti che g g gg descrivono. Antonella De Robbio – Corso Metadati 7
    • D fi i i Definizione di risorsa i Dalla RFC 2396: “A resource can be anything that has identity. Familiar examples include an electronic document, an image, a service (e.g., quot;today's weather report for Los Angelesquot;), and a collection of other resources. Not all resources are network quot;retrievablequot;; e.g., human beings, corporations, and bound books in a g, g , p , library can also be considered resources. The resource is the conceptual mapping to an entity or set of entities, not necessarily the entity which corresponds to that mapping at any particular instance in time. Thus, a resource can remain constant even when its content---the entities to which it currently corresponds---changes over time, provided that the conceptual mappin is not changed in the process”. Antonella De Robbio – Corso Metadati 8
    • Metadati: una visione ingenua Metadati = dati che descrivono altri dati i record del catalogo di una biblioteca i record di un database Spesso piu’ facili da trattare dei dati che rappresentano h Il formato dei metadati dipende dal catalogo il formato dei dati dipende da molti p fattori Antonella De Robbio – Corso Metadati 9
    • Con i metadati si descrivono e si etichettano gli oggetti Noi usiamo già i metadati nella vita reale p per trovare informazioni o cose per organizzare informazioni o cose Sono le o e 10 00 del mattino ore 10.00 A Firenze ci sono 13 gradi (Celsius) Oggi è il giorno 16 (del mese di ?) gg g ( ) Condivisione di un linguaggio/schema per condividere i significati (vocabolari controllati per differenti comunità = g ) ontologie) dal libro Cent’anni di solutidine ... Antonella De Robbio – Corso Metadati 10
    • accanto ad una visione ingenua... … vi sono percezioni più scientifiche … visioni del metadato correlate alle tecniche dell’Information Retrieval … interpretazioni meramente tecniche … … nel nostro settore bibliotecomico ... Antonella De Robbio – Corso Metadati 11
    • Metadati M t d ti come etichette descrittive ti h tt d itti Registrano le informazioni sull’oggetto (catalografiche o altro) Autore Titolo Co Copyright i ht Informazioni di autenticazione Protezioni e permessi d accesso d’accesso Prezzo esprimono: Struttura e semantica dei dati Antonella De Robbio – Corso Metadati 12
    • Quando sono nati i metadati? Origini e nascita dei metadati origine e primi usi del termine trovano radici nell'ambiente basi di dati. Metadata Workshop 1995 Stu Weibel OCLC: nascita del Dublin Core nella comunità dei bibliotecari mancanza del termine nei testi sulle biblioteche digitali fino a dopo il 1997 il termine quot;metadataquot; è un marchio registrato dal 1986 di proprietà di The Metadata Company Antonella De Robbio – Corso Metadati 13
    • A cosa servono i metadati t d ti Utilizzo di metadati per le seguenti attività Catalogazione dei dati Elaborazione automatica dei dati da parte di agenti software p g Controllo degli accessi Filtraggio dei flussi informativi Antonella De Robbio – Corso Metadati 14
    • Tipico metadato tradizionale Il MARC Machine eadable Ma hi M chine Readabl Cataloguing d l i da un formato di scambio ad un formato di lavoro cooperativo metadato entro gli OPAC t d t t li USMARC, MARC21, DEMARC, ANNAMARC, , , , , UNIMARC, … Esperienza CORC (MARC21/DublinCore) Antonella De Robbio – Corso Metadati 15
    • Accesso alle risorse elettroniche: il campo 856 p 856 Localizzazione elettronica ed accesso 856$k Password Indicatore 1: Metodo di 8 6$l Login/login 856$l L i /l i accesso 856$m Contact for access assistence # = Non sono fornite 856$n Nome of location of host in informazioni subfield $a 0 = Email 856$o Operating system 1 = FTP 856$p Port 2 = Remote login (Telnet) 856$q Electronic format type 3 = Dial-up 856$ S tt 856$r Settngs 4 = HTTP 856$s File size 7 = Metodo specificato in $y 856$t Terminal emulation 856$a Host name 856$u Uniform resource locator 856$b Access number 856$v Hours access method available 856$c Compression information 856$w Record control number 856$d Path 856$x Nonpublic note 8 6$f Electronic name 856$f El i 856$y Access method 856$ A th d 856$g Uniform resource name 856$z Public note 856$h Processor of request 856$i Instruction 856$j Bits per second Antonella De Robbio – Corso Metadati 16
    • MARC e Ruolo dell’autore Acquafortista Designer della legatura • Libraio Annotatore Designer della • Librettista Antecedente bibliografico sovraccoperta • Litografo Arrangiatore Destinatario • Miniatore Artista Detentore del privilegio • Narratore Autore di sceneggiatura, etc. Direttore • Paroliere Autore incerto Direttore d’orchestra, di • Precedente proprietario Calcografo coro, di gruppo musicale, • Produttore ecc. Calligrafo • Recensore Disegnatore dei caratteri Cartografo • Responsabile del Donatore montaggio Censore Editore • Rubricatore Commentatore Fabbricante della carta • Sceneggiatore Compositore C it Falsario • Scrittore del materiale Compositore di musica Finanziatore / sponsor allegato Copista Firmatario • Segretario Coreografo Fotografo g • Sottoscrittore C Correttore tt Grafico • Stampatore Correttore di opera manoscritta Illustratore • Stampatore di tavole Datore del privilegio Incisore • Tecnico della registrazione Dedicante D di t Interprete • Titolare del copyright Dedicatario Intervistato • Traduttore Designer del libro Intervistatore • Xilografo Designer dell’ex-libris Legatore Antonella De Robbio – Corso Metadati 17
    • Come si esprimono i metadati? La biblioteca ibrida presenta le sue risorse Documenti e collezioni di documenti, nella biblioteca tradizionale e in quella digitale, hanno in associazione ai loro contenuti qualcosa che è noto come metadato La rappresentazione di forme e contenuti avviene attraverso i metadati Un'efficace gestione dell'informazione digitale deve necessariamente includere la presentazione delle risorse Antonella De Robbio – Corso Metadati 18
    • Biblioteca digitale e metadati Fornisce i propri documenti di metadati appropriati Creare collezioni di metadati a fianco delle collezioni di documenti ll i i d ti Espone le proprie collezioni di metadati p p p Congloba le tecniche documentarie e biblioteconomiche tradizionali con le nuove applicazioni per il trattamento delle risorse elettroniche Antonella De Robbio – Corso Metadati 19
    • Elaborazione automatica Grazie ai metadati un programma può elaborare un documento come se ne conoscesse il significato Tre T scenari diversi (in ordine di difficoltà) i di i (i di diffi ltà) - applicazione che gestisce metadati che conosce - applicazioni che si scambiano metadati concordati - applicazioni che si scambiano metadati senza accordo preventivo (tipico di Internet) Antonella De Robbio – Corso Metadati 20
    • A bi t Internet ... Ambiente I t t Per internet occorre quindi sviluppare dei modelli che permettano alle applicazioni di interagire anche in assenza di un accordo p preventivo Per questo servono degli standard per: rappresentare i metadati scambiare i metadati estrarre est a e significati dai metadati t amite tramite motori inferenziali Antonella De Robbio – Corso Metadati 21
    • Ri Risorse e URI URI= Uniform Resource Identifier Le risorse sono identificate da URI La risorsa identificata da una URI puo’ essere astratta = non ’ recuperabile in Rete p Antonella De Robbio – Corso Metadati 22
    • Id tifi t i Identificatori La maggior parte degli schemi di metadati prevedono degli elementi, come i numeri standard, che servono ad g , , identificare in maniera univoca il lavoro o l’oggetto al quale il metadato si riferisce. La localizzazione di un oggetto digitale può essere indicata anche usando il nome di un file, URL (Uniform Resource Locator), o qualche identificatore più permanente come il PURL (P i Persistent URL) o il DOI (Di i l Object Identifier) Digital Obj Id ifi ). Si preferiscono gli identificatori permanenti perché spesso le localizzazioni degli oggetti vengono cambiate e il tradizionale URL –con il record di metadati- non risulta più valido. Antonella De Robbio – Corso Metadati 23
    • identificatori Tradizionali: ISBN; ISSN, SICI, BICI ; , , ampliamento e revisione delle strutture per ospitare le RER Emergenti: International Standard Work Codes ISWC si International alle quot;operequot; intese come (ISTC) 1. riferiscono Standard Textual Work Code FRBR riuniscono, sottoStandard Audiovisual Number (ISAN) 2. International un unico identificatore, le differenti manifestazioni inStandard Musical Work Code (ISWC) 3. International cui un'opera può manifestarsi. La gestione di questi identificatori è demandata ai quot;resolversquot; o quot;risolutoriquot; Antonella De Robbio – Corso Metadati 24
    • I metadati possono essere t d ti Interni alla risorsa utili ai motori di ricerca Esterni alla risorsa entro collezioni di metadati esposizione di metadati p metadati in banche dati integrate con altri contenitori collezioni a modello distribuito (DoIS) servizi di accesso ai contenuti i i i t ti Antonella De Robbio – Corso Metadati 25
    • Dove sono collocati i metadati? Dove sono collocati i metadati? Dentro alladocumento Interni al risorsa: Fuori dal documento utili ai motori di ricerca Esterni alla risorsa: metadato •entro collezioni di metadati t d ti metadato •esposizione di metadati risorsa •in basidati integrate con in risorsa altri contenitori •collezioni a modello distribuito (OA) •servizi di accesso ai Non tutti gli oggetti possono includeretmetadati: opere d’arte, contenuti ti sculture … Antonella De Robbio – Corso Metadati 26
    • <!DOCTYPE HTML PUBLIC quot;-//W3C//DTD HTML 3.2//ENquot;> <HTML> <head> <title>Intervento di Maurizio Messina al 9. Seminario Vinay</title> <META NAME= DC.Title Intervento di Maurizio Messina al 9. Seminario Vinay quot;> NAME=quot;DC Titlequot;Intervento 9 > <META NAME=quot;DC.Creatorquot; CONTENT=quot;Messina, Maurizioquot;> <META NAME=quot;DC.Creator.Addressquot; CONTENT=quot;quot;> <META NAME DC.Subject CONTENT=quot;Libraries, Multimedia, Biblioteche, META NAME=quot;DC.Subjectquot; CONTENT Libraries, Multimedialit`quot;> <META NAME=quot;DC.Descriptionquot; CONTENT=quot;Relazione 9. Seminario Vinayquot;> <META NAME=quot;DC.Publisherquot; CONTENT=quot;AIB- Associazione Italiana Biblioteche - Sezione Venetoquot;> <META NAME=quot;DC.Datequot; CONTENT=quot;1998-06-24quot;> <META NAME=quot;DC.Typequot; CONTENT=quot;Textquot;> yp Metadato embedded <META NAME=quot;DC.Formatquot; CONTENT=quot;text/htmlquot;> <META NAME=quot;DC.Identifierquot; CONTENT=quot;http://www.aib.it/aib/sezioni/veneto/messina.htmquot;> <META NAME=quot;DC.Sourcequot; CONTENT=quot;http://www.aib.itquot;> <META NAME=quot;DC.Languagequot; CONTENT=quot;italianquot;> <META NAME=quot;DC.Relationquot; CONTENT=quot;http://www.aib.it/aib/sezioni/veneto/vinay9.htmquot;> </head> Antonella De Robbio – Corso Metadati 27
    • Metadato esterno (Eprints) Antonella De Robbio – Corso Metadati 28
    • Metadato esterno (Eprints) Antonella De Robbio – Corso Metadati 29
    • Quanti sono i formati di metadati? Popolazioni di metadati e infodiversità. L’indagine DESIRE d l 1996 id tifi L’i d i del identificava e descriveva oltre 20 quot;popolazioniquot; diverse I metadati sono numerosi e di t d ti i diversi per i natura tipologica, implementazione, ambiti di provenienza p descrivono oggetti di natura/specie diverse scopo tipologia funzione Antonella De Robbio – Corso Metadati 30
    • Popolazioni di metadati e infodiversità come i biologia ... in bi l i Il termine quot;metadiversità”coniato da Clifford Lynch i i i con significato di quot;metadato in un contesto di biodiversità metadato che può relazionarsi con un'ampia gamma di tipi di informazione che includono dati bibliografici, p f g f , dati su modellizzazioni di oggetti di musei, tassonomie sviluppate da biologi, prodotti della ricerca e i d i i geospaziali indagini i li [Michael Day] Antonella De Robbio – Corso Metadati 31
    • Come sono strutturati i metadati? 1. tipologico strutturale, o intraspecifico al record 2. funzionale, correlato alla funzione stessa del metadato in relazione all'ambiente ll' bi t 3. di comunità, in una suddivisione in domini sulla b d i i ll base d ll specifiche delle ifi h attività di comunità di utenti. Antonella De Robbio – Corso Metadati 32
    • Perché usare sistemi di metadati? Biblioteca ibrida: servizio di accesso all'informazione Il sistema di metadati è la componente logica di qua s as biblioteca, digitale o og ca d qualsiasi b b oteca, d g ta e tradizionale l’organizzazione informativa è g fondamentale I metadati possono essere usati p molti p per scopi non solo catalografici: diritti di proprietà intellettuale, e ce e co e-commerce firma digitale, PICS tariffazione servizi, livelli di riservatezza di un documento, MMIR metadescrizioni diDe Robbio – Corso Metadati Antonella oggetti non testuali 33
    • Un sistema di metadati consente Ricerca, che consiste nell’individuare l’esistenza di un documento; Localizzazione, ovvero rintracciare una particolare occorrenza del documento; Selezione, Selezione realizzabile analizzando, valutando e analizzando filtrando una serie di documenti; Interoperabilità semantica, che consiste nel permettere la ricerca in ambiti disciplinari diversi grazie a una serie di equivalenze fra descrittori; Gestione risorse, ossia gestire le raccolte di documenti g grazie all’intermediazione di banche dati e cataloghi; Disponibilità, ovvero ottenere informazioni sull effettiva sull’effettiva disponibilità del documento. Antonella De Robbio – Corso Metadati 34
    • A cosa servono i metadati? In relazione al contesto In relazione alle risorse Documentare Presentazione Contestualizzare Localizzazione Conservare Selezione Gestire adeguata all’uso date, persone, p Acquisizione strutture … termini Gestire Manipolazione profili e accessi Utilizzazione Antonella De Robbio – Corso Metadati 35
    • Cosa si dice sui metadati? You call it corn as we call it maize quot;Poi c'è il problema della più che dati sui dati: quot;I metadati sono nulla di catalogazione e dei metadati. Su questideimio punto sono metadati: i record il cataloghi di vista è che siano tentativo così t ti sconsiderato di tqualsiasi altra t un t come un header TEI, otrovare una sorta di terza via tra id t t i t forma di descrizione. il deserto dei motori di ricerca e della ricerca a testo libero Potremmo chiamarla catalogazione, e la per alcuni tale termine porta in sébibliografico eccessivo, ma grande architettura del controllo un bagaglio eccessivo che i bibliotecari hanno sviluppato negli ultimi centocinquant'anni. come le Anglo-American Cataloging Rules e USMARC. Così alcuni lo estendono adiluna situazione del che, Penso che i metadati siano prodotto di quelli tipo senzachiamatelo granturco, noicatalogazione, maisquot;, quot;Voi alcuna conoscenza della lo chiamiamo mariguardo per essa, come alchimistineutrale né i metadati sono un buon termine bibliografi cercano la pietrale basi” che ci offrirà una catalogazione per coprire tutte filosofale [Priscillasenza spese e accesso efficace senza vocabolari controllati. efficace Caplan, 1995] Non esiste nessuna cosa del genere e prima si abbandona meglio èquot;. è . [Michael Gorman, Roma novembre 2001] Antonella De Robbio – Corso Metadati 36
    • La nuova terminologia ci aiuta g Martin Dill M ti Dillon diff differenzia i metadati per: i t d ti Presentazione delle risorse (resource discovery) D Descrizione delle risorse i i d ll i (resource description). Nella lingua inglese il termine quot;discoveryquot; ha un significato dup ce, d d sco e y a u s g cato duplice, di scoperta, ma anche di quot;presentazionequot;. Antonella De Robbio – Corso Metadati 37
    • L legge d l metadato La l del t d t Non esiste solo il Dublin Core Anche il MARC è un metadato Ad ogni metadato il suo utente Ad ogni comunità di utente il proprio i ità t t i metadato specifico ;-) Antonella De Robbio – Corso Metadati 38
    • If formati di metadati sono ti t d ti Numerosi Differenti per scopo tipologia ti l i funzione Possono essere automatici creati manualmente Antonella De Robbio – Corso Metadati 39
    • Gli schemi di metadati h i t d ti Chiamati anche “Schema” sono set di metadati progettati per un obiettivo specifico, come quello di presentare un tipo particolare di risorsa informativa informativa. La semantica dello schema è la definizione o il significato degli elementi stessi. I valori assegnati agli elementi di metadati sono il contenuto. contenuto Generalmente, gli schemi di metadati specificano il nome degli elementi e la loro semantica. In maniera facoltativa, gli schemi di metadati possono specificare le regole di contenuto ossia come il contenuto deve essere formulato (per esempio, come identificare il titolo principale), le regole di rappresentazione del contenuto (per esempio, le regole sulla itt in i l ) l i titi t t ( scrittura i maiuscolo) e i valori consentiti di contenuto (per esempio, la terminologia usata deve appartenere ad un vocabolario specifico e controllato). Antonella De Robbio – Corso Metadati 40
    • Schemi più diff i S h i iù diffusi Antonella De Robbio – Corso Metadati 41
    • D bli Core Dublin C Il Dublin Core Metadata Element Set è il frutto delle discussioni di un workshop tenutosi nel 1995 e sponsorizzato d OCLC e dal N ti i t da d l National C t f l Center for Computing Application (NCSA). Poiché il workshop si è svolto a Dublin, nell’Ohio, il set di p , , elementi fu chiamato Dublin Core. Il contenuto sviluppo del Dublin Core e le sue individuazioni specifiche sono gestite dal Dublin Core Metadata Initiative (DCMI). L’obiettivo iniziale del Dublin Core era quello di stabilire un set di elementi che potessero essere usati dagli autori per presentare le loro risorse nel Web. Antonella De Robbio – Corso Metadati 42
    • D bli Core Dublin C Abbreviazione di Dublin Metadata Core Element Set Formato di metadata definito dal OCLC/NCSA Metadata Workshop (marzo 1995) Dublin Core è anche uno standard DC definisce un set minimo di elementi per descrivere le risorse di rete a sintassi indipendente di p 15 elementi con qualificatori Il set minimo degli elementi DC comprende: title, creator, g p , , subject, description, publisher, contributor, date, type, format, identifier, source, language, relation, coverage, rights i h Antonella De Robbio – Corso Metadati 43
    • Scopi del Dublin Core Nato per descrivere pagine web attraverso etichette da applicare alla risorsa informativa ti h tt d li ll i i f ti Convivenza con altri schemi di metadati Facilita i motori nella raccolta delle informazione in rete – limitazione del rumore –iinserimento del metadato entro i TAG in HTML e i t d l t d t t i XML Antonella De Robbio – Corso Metadati 44
    • P Perché è nato il Dublin Core hé t D bli C Creazione di metadati da parte degli stessi creatori delle risorse Rappresentazione degli aspetti essenziali relativi alla descrizione di una risorsa/oggetto Definizione della semantica della descrizione (HTML non bsta, non ne tiene conto) Miglioramento “resource discovery” resource discovery Collaborazione attraverso consenso Antonella De Robbio – Corso Metadati 45
    • Caratteristiche principali del Dublin Core Ciascun elemento può essere: opzionale p ripetibile Indipendenza della sintassi Enstensione Interdisciplinarietà Internazionale Antonella De Robbio – Corso Metadati 46
    • D bli Core Dublin C 15 etichette Metadato di tipo descritivo record bibliografici Campi tipizzati vocabolario controllato ISO 8601 (date) tipi di risorse URLs, ISBNs , RC 1766 Antonella De Robbio – Corso Metadati (lingue) 47
    • Elementi D bli Core (1) El i Dublin C Titolo Pubblicatore Creatore C t C t ib t Contributore (persona, Data organizzazione, i i Tipo (e.g. servizio) collezione, evento, , , Soggetto (lista di immagine, oggetto parole chiave dal fisico, software, , , vocabolario suono, …) controllato) Formato Antonella De Robbio – Corso Metadati 48
    • El Elementi D bli Core (2) i Dublin C Identificatore Diritti (proprieta’ F t Fonte intellettuale intellettuale, Lingua (lingua) copyright) Relazione Descrizione D i i (collegamento a una ( g (riassunto, indice, o risorsa correlata) testo libero) t t lib ) Copertura (es. luogo, tempo, a giurisdizione) Antonella De Robbio – Corso Metadati 49
    • <head> <meta http-equiv=quot;Content-Typequot; content=quot;text/html; charset=iso-8859-1quot;> p q yp ; <meta name=quot;DC.Creatorquot; content=quot;Solimine, Giovanniquot;> <meta name=quot;DC.Datequot; content=quot;2000-08-10quot;> <meta name=quot;DC.Descriptionquot; content=quot;Relazione 11. Seminario Angela Vinayquot;> p g y <meta name=quot;DC.Formatquot; content=quot;text/htmlquot;> <meta name=quot;DC.Identifierquot; content=quot;http://www.aib.it/aib/sezioni/veneto/vinay11/solimine00.htmquot;> <meta name=quot;DC.Languagequot; content=quot;italianquot;> <meta name=quot;DC.Publisherquot; content=quot;AIB - Associazione Italiana Biblioteche - Sezione Venetoquot;> <meta name=quot;DC.Relationquot; content=quot;http://www.aib.it/aib/sezioni/veneto/vinay11.htmquot;> <meta name=quot;DC.Sourcequot; content=quot;http://www.aib.itquot;> <meta < t name=quot;DC.Subjectquot; content=quot;Biblioteche, Bibli t quot;DC S bj tquot; t t quot;Bibli t h Biblioteconomia, E i Economia, i Finaziamenti, Cooperazione, Bilancio, Servizi, Costi, Ricavi, Acquisti librariquot;> <meta name=quot;DC.Typequot; content=quot;Textquot;> name=quot;DC Typequot; <meta name=quot;DC.Titlequot; content=quot;AIB. Sezione Veneto. Seminario Angela Vinay. 11. BibliotECONOMIA: L'economia della cooperazione bibliotecaria > bibliotecariaquot;> <title>11&deg; Seminario Angela Vinay - BibliotECONOMIA</title> </head> Antonella De Robbio – Corso Metadati 50
    • I qualificatori DC lifi t i Sono di due tipi scheme=contesto per i h interpretazione di un valore i l basato su standard esterni (DDC) e regole di codifica difi ISO 8601 per data, ISO 639/1 per la lingua type=raffina la semantica di un elemento DC.CREATORE.MUSICISTA Ogni elemento ha un qualificatore raccomandato Antonella De Robbio – Corso Metadati 51
    • DC e lo spazio dei nomi DC può essere esteso con altri elementi all’interno del modello DC ll’i t d l d ll Si possono utilizzare altri elementi definiti p in namespaces diversi I namespaces servono ad identificare in maniera univoca il set di metadati che stiamo utilizzando Antonella De Robbio – Corso Metadati 52
    • METS Metadata Encoding and Transmission Standard Antonella De Robbio – Corso Metadati 53
    • Un documento METS contiene sette sezioni principali: 1. METS Header – contiene metadati che descrivono il documento METS incluse le informazioni riguardanti l’autore e l’editore ecc. 2. Metadati descrittivi – si riferiscono ai metadati descrittivi esterni al documento METS (per esempio, un record MARC in un OPAC o un Encoded Archival esempio Description, un finding aid conservato in un webserver) o si riferiscono ai metadati inseriti all’interno del documento o a entrambi. 3. Metadati Amministrativi – forniscono informazioni riguardanti la creazione e il g deposito del file, i diritti di proprietà intellettuale, la risorsa originale dalla à quale è stato creato l’oggetto per la biblioteca digitale e la provenienza dei files dai quali è composto l’oggetto digitale. 4 4. Sezione di file – elenca tutti i files di contenuto che contengono la versione elettronica dell’oggetto digitale. 5. Mappa strutturale – delinea una struttura gerarchica dell’oggetto digitale e collega gli elementi di questa struttura con i files di contenuto e i metadati che si riferiscono a ciascun elemento elemento. 6. Links strutturali – permettono ai creatori di METS di registrare i nodi della struttura gerarchica tracciata nella mappa strutturale. 7. Comportamento – associa comportamenti effettuabili con il contenuto di un oggetto METS. Antonella De Robbio – Corso Metadati 54
    • MODS Metadata Object Description Schema D i ti S h E’ uno schema XML E E’ costituito da elementi a carattere bibliografico che può avere svariate applicazioni, specialmente in ambito bibliotecario. bibliotecario Deriva dal formato bibliografico MARC 21 (MAchine Readable (MAchine-Readable Cataloging) comprende un certo numero di campi le cui etichette sono espresse in chiaro anziché in forma numerica. Antonella De Robbio – Corso Metadati 55
    • MODS: Struttura MODS St tt Si compone di elementi principali elementi secondari (sottoelementi) attributi degli elementi attributi dei sottoelementi Il contenuto è incluso nell’elemento di livello inferiore per evitare forme di “contenuto inferiore, contenuto misto”. Per esempio <titleInfo> [elemento principale]: non contiene dati; funge solo da “wrapper” ⌧<title> [sottoelementi]: contengono i dati ⌧<partNumber> ⌧<partName> Antonella De Robbio – Corso Metadati 56
    • MODS Att ib ti MODS: Attributi Possono essere associati ad elementi di qualunque livello e vengono definiti congiuntamente all’elemento al quale sono associati. associati Modificano l’elemento Gli attributi più comuni sono: type encoding authority Antonella De Robbio – Corso Metadati 57
    • MODS Namespace MODS: N Lo schema di MODS viene dichiarato nel seguente modo: <mods xmlns:mods: quot;http://www.loc.gov/mods/quot;> Antonella De Robbio – Corso Metadati 58
    • MAG Antonella De Robbio – Corso Metadati 59
    • ONIX Antonella De Robbio – Corso Metadati 60
    • TEI Text Encoding Initiative Antonella De Robbio – Corso Metadati 61
    • LOM Learning Object Metadata Il IEEE Learning Technology Standard Committee (LTSC) ha creato uno standard (IEEE ( ) ( 1484.12.1-2002) di metadati per la descrizione di learning object (Learning Object Metadata - LOM) che consente l uso e il ri-uso di risorse per l’uso ri uso l’e-learning, l’insegnamento supportato dalla tecnologia come come il computer-based g p training e l’insegnamento a distanza. Il LOM definisce un set minimo di attributi per la ti l li gestione, localizzazione e valutazione dei i l t i d i learning objects. Antonella De Robbio – Corso Metadati 62
    • LOM l otto categorie LOM: le tt t i Categoria Generale: contiene informazioni sull’oggetto nella sua interezza; Categoria Ciclo Vitale: contiene metadati riguardanti l evoluzione l’evoluzione di un oggetto; Categoria Tecnica: contiene le descrizioni delle caratteristiche tecniche e dei requisiti; Categoria Didattica: contiene gli attributi didattico pedagogici; Categoria Diritti: descrive i diritti di proprietà intellettuale e le condizioni d uso; d’uso; Categoria Relazione: identifica gli oggetti correlati; Categoria Annotazione: contiene I commenti e l’autore e la data dei commenti; Categoria Classificazione: individua altri identificatori dei sistemi di classificazione per gli oggetti. Antonella De Robbio – Corso Metadati 63
    • EAD The Encoded Archival Description Antonella De Robbio – Corso Metadati 64
    • EAD e finding aids EAD fu creato per marcare i dati contenuti nei finding aids per gli archivi e collezioni speciali in modo che questi possano essere visibili e consultabili on line. on-line i finding aids sono uno strumento importantissimo per la descrizione delle risorse. Sono differenti dai semplici records per tre ragioni: sono più lunghi, sono più narrativi ed esplicativi, sono fortemente strutturati in maniera gerarchica. i finding aids presentano all’inizio una descrizione della collezione nella sua interezza indicano che tipo di materiali contiene e perché sono rilevanti. descrivono le serie nelle quali sono organizzate le collezioni, per q g ,p esempio corrispondenza, records di business, documenti personali, discorsi di propaganda presentano in maniera articolata i contenuti dei contenitori fisici e delle cartelle che costituiscono la collezione. collezione Antonella De Robbio – Corso Metadati 65
    • DDI Antonella De Robbio – Corso Metadati 66
    • O Oggetti visivi – CDWA tti i i i I metadati utilizzati per descrivere oggetti visivi come pitture o sculture richiedono dei requisiti particolari. L’Art Information Task Force (AITF) ha creato una struttura concettuale, chiamata Categories for the Descriptions of Works of Art (CDWA), che permettere di p ( ), p descrivere e consente l’accesso agli oggetti visivi e alle immagini. Sono state definite circa 30 categorie e la maggior parte di queste sotto st uttu ate in agg o pa te d strutturate sottocategorie multiple. Alcuni esempi di elementi descrittivi specifici per le opere d’arte sono: Orientazione Dimensioni Condizione d arte Orientazione, Dimensioni, Condizione, Iscrizione, Trattamento di Conservazione e Storia dell’Esibizione e del Prestito. Antonella De Robbio – Corso Metadati 67
    • VRA per slide e foto di opere d’arte I metadati per questi materiali devono essere in grado di t d ti ti t i li d i d descrivere i livelli molteplici delle risorse visive, per esempio un dipinto originale, una slide del dipinto o un’immagine digitalizzata d ll lid di it li t della slide. The VRA Core Categories sviluppa ed espande la struttura concettuale CDWA e stabilisce un unico set di elementi di metadati che può essere utilizzato sia per descrivere l’opera d’arte originale (il dipinto vero e proprio, la fotografia, la scultura, l architettura ecc.) sia l’immagine di essa (le l’architettura l immagine rappresentazioni visive). VRA Core Categories è costituita da 17 elementi di metadati che possono essere utilizzati ed applicati per descrivere ciascuna di queste versioni e per collegarle l’una con l’altra: Tipo di Record, Tipo, Titolo, Misure, Materiale, Tecnica, Creatore, Data, Localizzazione, Creatore Data Localizzazione Codice ID, Stile/Periodo, ID Stile/Periodo Cultura, Soggetto, Relazione, Descrizione, Risorsa e Diritti. Antonella De Robbio – Corso Metadati 68
    • MPEG Multimedia Metadata L’ISO/IEC Moving Picture Experts Group (MPEG) ha creato un set di standards per la rappresentazione p pp codificata dei files audio e video digitali. I due standards che prevedono metadati sono: MPEG-7, Multimedia C t t D MPEG 7 M lti di Content Description Interface (ISO/IEC i ti I t f 15938): stabilisce gli elementi di metadati, la struttura e le relazioni utilizzati per descrivere oggetti audiovisivi tra cui immagini fisse, g afi i , modelli 3D, musica, audio, discorsi, video fisse grafici 3D m si a a dio dis o si ideo e collezioni multimediali. È uno standard composto da diverse parti MPEG-21, Multimedia F MPEG 21 M lti di Framework (ISO/IEC 21000): è stato creato k 21000) t t t per rispondere all’esigenza di avere una struttura centrale che assicuri l’interoperabilità degli oggetti digitali multimediali Antonella De Robbio – Corso Metadati 69
    • PICS Platform for Internet Content Selection www.w3.org/PICS/ Recommendation dal 1996 Condivisione e interscambio di valutazioni su siti e pagine Web p g etichette PICS trasportate negli header HTTP o come marcatori META ⌧from document server ⌧f d ⌧or an independent label bureau firmati elettronicamente e associati con un digest Antonella De Robbio – Corso Metadati 70
    • PICS: Esempio <html> <head> <META http equiv quot;PICS Labelquot; content ' http-equiv=quot;PICS-Labelquot; content=' (PICS-1.1 quot;http://www.gcf.org/v2.5quot; labels on quot;1999.11.05T08:15-0500quot; until ”2001.12.31T23:59-0000quot; for quot;http://w3.org/PICS/Overview.htmlquot; ratings (suds 0.5 density 0 color/hue 1)) 05 '> </head> <body> <p>qui va il documento</p> / </body>y </html> Antonella De Robbio – Corso Metadati 71
    • PICS: Applicazioni PICS A li i i Protezione dei minori CyberPatrol, EvalWeb NetNanny, CyberPatrol EvalWeb, NetNanny … Utente genera o ottiene un profilo L’applicazione confronta rating e profilo e L applicazione compie una delle seguenti azioni: suggest search monitor warn block Antonella De Robbio – Corso Metadati 72
    • Etichette Recreational Software Advisory Council (RSAC): Violenza (category (transmit-as quot;vquot;) (name quot;Violencequot;) ( (label ( (name quot;Conflictquot;) ( ) (description quot;Harmless p conflict; some damage to objectsquot;) (value 0)) (label (name quot;Fightingquot;) (description quot;Creatures injured or killed; damage to objects; fighting ) fightingquot;) (value 1)) (label (name quot;Killingquot;) (description quot;Humans injured or killed with small amount of bloodquot;) ( l bl dquot;) (value 2)) (l b l ( (label (name quot;Bl d and quot;Blood d Gorequot;) (description quot;Humans injured or killed; blood and gore ) (value 3)) (label (name gorequot;) quot;Wanton Violencequot;) (description quot;Wanton and gratuitous violence; torture; rapequot;) (value 4))) Antonella De Robbio – Corso Metadati 73
    • PICS P bl PICS: Problemi i Chi sceglie le etichette? Chi ne definisce la sintassi? Come determinarne il significato? A quale dato sono associate? Antonella De Robbio – Corso Metadati 74
    • R Regole di sintassi l i t i Ci sono anche regole di sintassi su come devono essere codificati gli elementi e il loro contenuto. Un sistema di metadati che non prevede regole prescritte di sintassi è chiamato sintax independent. I metadati possono essere codificati in qualsiasi tipo di sintassi determinabile. determinabile La maggior parte degli schemi di metadati attuale usa SGML (Standard Generalized Mark-up Language) o XML (Extensible Mark- Up Language). p g g ) XML è una forma estesa di HTML, creata dal World Wide Web Consortium (W3C), che tiene conto di sets di etichette definite localmente e consente un facile scambio di informazione strutturata. SGML è un macro-insieme di HTML e XML che consente t tt t i i h t un ricco mark-up (marcatura) del documento. Poiché XML ha ormai un ruolo cruciale nello scambio di varietà di dati nel Web, gli strumenti XML stanno diventando sempre più disponibili su larga scala. Antonella De Robbio – Corso Metadati 75
    • Standard, profilo e registro Standard: documento riconosciuto con generale consenso, consenso o con approvazione organismo ufficiale Profilo: Profilo sottoinsieme di specifiche che caratterizzano una particolare applicazione di un i i l li i formato, protocollo…fornisce maggiori specifiche per i l implementatori (Bath Profile Z39.50, DC t t i (B th P fil Z39 50 Euler Profile) Registro: Registro un sistema che registra la semantica, la struttura e i formati di scambio di ogni tipo di dato (database, messaggi, documenti) Antonella De Robbio – Corso Metadati 76
    • Progetto Euler per la matematica Nasce nel 1998 nel quadro di “Telematics for Libraries” Consente l’accesso integrato a specifiche risorse informative in rete nel campo della matematica p Realizza una Biblioteca digitale di matematica europea con integrazione delle eterogenee risorse già esistenti iff Integra differenti contenitori i f i i i i i informativi: basi dati bibliografiche i i i i fi (MATHZbl), OPACS, riviste elettroniche, archivi di pre-prints , letteratura grigia e risorse Internet controllate Descrizione delle risorse eterogenee provenienti dai vari contenitori informativi basate su DC Utilizzo di chiave di de duplicazione de-duplicazione One-shop point = unico punto d'accesso utilizzando un’unica interfaccia disponibile sul WWW. Antonella De Robbio – Corso Metadati 77
    • Antonella De Robbio – Corso Metadati 78
    • Antonella De Robbio – Corso Metadati 79
    • Ti i di metadati Tipi t d ti vi sono differenti suddivisioni tipologiche in gruppi differenti scuole di pensiero diverse categorie diverse di metadati: t i di t d ti semantici, descrittivi, di presentazione, amministrativo- gestionali (MAG), di i i t ti ti li (MAG) utilizzo, tecnici, per utenze particolari … Differenti funzionalità di metadati p g conducono a differenti tipologie Antonella De Robbio – Corso Metadati 80
    • Il Getty Standards Program suddivide i metadati in 5 categorie Amministrativi gestionali MAG (usati per la gestione e amministrazione delle risorse informative) Descrittivi (dal MARC al Dublin Core) Conservazione (compresa migrazione) Tecnici (comportamento dei metadati e funzionamento dei sistemi)) Utilizzo (relativi al livello e al tipo di utilizzo dell’utente) dell utente) Antonella De Robbio – Corso Metadati 81
    • 1. Suddivisione dei metadati per tipologia strutturale Antonella De Robbio – Corso Metadati 82
    • Qual è la funzione dei metadati? Suddivisione dei metadati per tipologia funzionale Amministrativi utilizzati nella gestione e amministrazione delle risorse informative Descrittivi utilizzati per descrivere o identificare risorse informative Di conservazione riferiti alla gestione della conservazione delle risorse informative Tecnici riferiti al funzionamento di un sistema e al comportamento dei metadati Di utilizzo riferiti al livello e al tipo di utilizzo delle risorse informative Antonella De Robbio – Corso Metadati 83
    • Amministrativi: metadati utilizzati nella gestione e nell amministrazione delle nell'amministrazione risorse informative Informazioni sull'acquisizione Tracciato storico dei diritti di proprietà intellettuale, cessione e passaggi ai fini della riproduzione Documentazione dei requisiti di accesso legale Informazioni sulla reperibilità Criteri di selezione per la digitalizzazione [= formato, set di caratteri]] Controllo della versione e distinguibilità fra oggetti informativi simili i f ti i i ili Tracce di controllo create da sistemi di gestione di metadati [recordkeeping] Antonella De Robbio – Corso Metadati 84
    • Antonella De Robbio – Corso Metadati 85
    • Descrittivi: metadati utilizzati per descrivere o identificare risorse informative Registrazioni catalografiche Indicazioni di aiuto per il reperimento Indicizzazione su database specialistici Connessioni fra risorse tramite link Web Annotazioni di utenti Metadati per sistemi di gestione [recordkeeping] generati dai programmi di creazione delle registrazioni Antonella De Robbio – Corso Metadati 86
    • Antonella De Robbio – Corso Metadati 87
    • Antonella De Robbio – Corso Metadati 88
    • Conservazione: metadati riferiti alla gestione della conservazione delle risorse informative Documentazione della condizione fisica delle risorse Documentazione delle azioni intraprese per conservare l versioni fisiche e digitali delle le i i fi i h di it li d ll risorse, per esempio ripristino [refreshing] e migrazione dei dati Antonella De Robbio – Corso Metadati 89
    • Antonella De Robbio – Corso Metadati 90
    • Schemi di metadati per la conservazione digitale A livello internazionale: National Library of Australia, il British Cedars Project (CURL Exemplars in Digital Archives), A hi ) un gruppo di lavoro unitario del OCLC l it i d l il Research Libraries GRoup (RLG) ha creato una struttura che delinea tipi di presentazione di metadati. p p Un gruppo supplementare, PREMIS (PREservation Metadata: Implementation Strategies)- sponsorizzato anche da OCLC e RLG – sta creando un nucleo di elementi e strategie per la codifica, il deposito e la gestione di metadati di conservazione all’interno di sistema di conservazione digitale digitale. Molte di queste iniziative sono basate o sono compatibili con ISO Reference Model for an Open Archival Information S t I f ti System (OAIS) (OAIS). Antonella De Robbio – Corso Metadati 91
    • Tecnici: metadati riferiti al funzionamento di un sistema e al comportamento dei metadati Documentazione sull'hardware e il software Informazioni sulla digitalizzazione, per digitalizzazione esempio formati, rapporti di compressione, procedure di graduazione [scaling routines] d d i li ti Tracciato storico dei tempi di risposta di p p sistema Dati di autenticazione e sicurezza, per sicurezza esempio chiavi crittografiche, password Antonella De Robbio – Corso Metadati 92
    • I METS websites b it Per quanto riguarda i metadati tecnici, i METS websites rendono disponibili schemi b it d di ibili h i per testi e immagini fisse digitali. L’ultimo standard è chiamato MIX, Metadata for Images in XML Schema ed è basato su uno standard NISO, Z39.87, Data Dictionary : technical Metadata for Digital Still Images. Antonella De Robbio – Corso Metadati 93
    • Di utilizzo: metadati riferiti al livello e al tipo di utilizzo delle risorse informative Registrazioni di visualizzazione [exhibit records] Tracciato storico dell'uso e gestione dei profili utenti fili t ti Informazioni sulla riutilizzazione del contenuto e sull'esistenza di una pluralità di versioni [multi-versioning information multi versioning Antonella De Robbio – Corso Metadati 94
    • St tt Strutturali (SGML, XML, EAD, MOA2) li (SGML XML EAD collegano le varie componenti delle risorse per un’adeguata e completa fruizione, che un adeguata spesso avviene attraverso la mappatura di schemi di metadata diversi diversi. forniscono dati di identificazione e localizzazione del documento, come il codice identificativo, l’indirizzo del file sul server, l indirizzo l’archivio digitale di appartenenza e il suo indirizzo Internet Internet. Antonella De Robbio – Corso Metadati 95
    • Antonella De Robbio – Corso Metadati 96
    • Antonella De Robbio – Corso Metadati 97
    • Comunità di metadati ... C ità t d ti I metadati riflettono le esigenze delle comunità dai quali provengono Differenti comunità producono documenti intellettuali peculiari all’utenza specifica che vi afferisce (matematici, fi i i chimici, …) fisici, hi i i ) Comunità diverse parlano e necessitano di linguaggi specifici con i quali formulano la propria produzione intellettuale I metadati prodotti da queste comunità riflettono necessariamente la struttura e la forma dei documenti da esse prodotti p Antonella De Robbio – Corso Metadati 98
    • Quali sono i domini di appartenenza dei metadati? Suddivisione dei metadati per domini di appartenenza C a t e g o r ia d i A t t iv it à d i d o m in io C a t e g o r ia d i A t t iv it à d i d o m in io d o m in io d o m in io In d u str ia M a n u fa t t i A c c a d e m ic o P r o g e t t i u n iv e r s it a r i e V e n d it o r i d i s o ft w a r e a c c a d e m ic i V e n d it o r i d i h a r d w a r e S u b ject G atew a y s T e le c o m u n ic a z io n i I n iz ia t iv e W 3 C I n t e r n e t S e r v ic e P r o v id e r s S e r v i z i d e i m o t o r i d i r ic e r c a B a n c h e e a s s ic u r a z io n i P u b b lic it à D e t t a g lio E d it o r i a D is t r ib u z io n i E d u c a z io n e e C o r s i in t e r a t t iv i M u s ic a /v id e o /m u lt im e d ia d is t r in s e g n a m e n t o E d u c a z io n e p e r m a n e n t e e I n d u s t r ia r e g is t r a z io n i m u s ic a c o n t in u a d u r a n t e l'a r c o d e lla R iv is t e s c ie n t ific h e v it a A g e n z ie s t a m p a I n s e g n a m e n t o a d is t a n z a Q u o t id ia n i S c u o la G e s t io n e d e i d ir it t i C u r r ic u la A u d io -v id e o I n d u s t r ia fi lm o g r a fic a R ic e r c a L a b o r a t o r i d i r ic e r c a P r o d u z io n i b r o a d c a s t e C o m p a g n ie d i r ic e r c a a r c h iv ia z io n e d e lle p r o d u z io n i S o c ie t à p r o fe s s io n a li m u lt i m e d ia li B e n i c u lt u r a li B ib lio t e c h e I n f o r m a z io n i F o r n it o r i d i in fo r m a z io n i S e r v i z i b ib lio t e c a r i g e o g r a f ic h e g e o s p a z ia li M u sei P o r t a li d i m u s e i A r c h iv i A lt r i d o m i n i T ra sp o rti S e r v i z i d i s p e d iz io n e p o s t a e le t t r o n ic a S a n it à S e r v i z i g o v e r n a t iv i Antonella De Robbio – Corso Metadati A m b ie n t e 99
    • Possono essere creati Chi produce i metadati? •manualmente Publisher side •automaticamente autori Agenzie catalografiche nazionali webmaster b istituzioni Repository/site manager Archivi A hi i Autori, Biblioteche creatori risorse. metadati Musei. Editori. Terze parti: servizi di risoluzione URN agenzie identificatori: ISBN, ISSN, BICI, SICI, ... i id tifi t i ISBN ISSN BICI SICI Service side servizi di ricerca Antonella De Robbio – Corso Metadati 100 creatori: terze parti
    • Comunità di metadati ... I metadati riflettono le esigenze delle comunità dai quali provengono Differenti comunità producono documenti intellettuali p peculiari all’utenza specifica che vi afferisce (matematici, fisici, chimici, …) Comunità diverse parlano e necessitano di linguaggi specifici con i quali formulano la propria produzione intellettuale I metadati prodotti da queste comunità riflettono necessariamente la struttura e la forma dei documenti da esse prodotti conseguenza dell’ampia gamma di comunità con dell ampia interesse nei metadati è lo sconcertante numero di standard eDe Robbio – Corso Metadati o sotto sviluppo 101 Antonella formati esistenti
    • I metadati sono sempre ad accesso aperto? Formati proprietari e formati standard molte comunità di soggetti, in numerosi soggetti settori di mercato, sono fortemente attaccati ai loro formati sui formati proprietari vi sono stati investimenti: in termini di documentazione, conoscenza e documentazione apprendimento, sono stati sviluppati entro i sistemi creati per manipolare i dati e offrire servizi ad utenze specifiche. Esiste tensione tra questo continuo progredire di formati specialisti e qualsiasi requisito per un livello di interoperabilità Antonella De Robbio – Corso Metadati 102
    • Qual è la relazione tra metadati e interoperabilità? Il problema della diversità L'interoperabilità è l'abilità dei sistemi di L'i t bilità l' bilità d i i t i fornire/accettare servizi in termini di comunicazione comprensione reciproca i i i i attuata attraverso un colloquio reso possibile nonostante le differenze. o ibile o o t te diffe e e ai fini dell’interoperabilità è necessario individuare uno schema di riferimento semplice utilizzare terminologia controllata per una corretta corrispondenza semantica tra elementi implementare servizi cross-domain per l’accesso a risorse provenienti da domini differenti i i ti d d i i diff ti Antonella De Robbio – Corso Metadati 103
    • Interoperabilità: soluzioni I t bilità l i i Antonella De Robbio – Corso Metadati 104
    • La mappatura: i crosswalk pp da un confronto tra popolazioni diverse emergono basse aree di sovrapposizione i i una risposta al problema della diversità è la produzione di crosswalk c oss alk o mapping di metadati t a uno o più fo mati tra no formati ai fini della comparazione tra formati al fine di stabilire il loro potenziale di interoperabilità come base per la produzione di uno specifico programma di conversione di formati per la produzione di sistemi di ricerca, i quali dovrebbero permettere l'interrogazione di formati di metadati eterogenei. centralità del Dublin Core formato strutturato semplice facilità di creazione direttamente dai creatori di risorse Antonella De Robbio – Corso Metadati 105
    • Antonella De Robbio – Corso Metadati 106
    • Quali prospettive per i metadati? XML ...il linguaggio flessibile XML = eXtensible Markup Language XML può essere definito in molti modi diversi XML è una sintassi per marcare i documenti XML è una famiglia di tecnologie correlate f i li t l i l t XML consente di aggiungere metadati (semantica) ai propri dati separare il contenuto dalla presentazione definire i i i d fi i in maniera rigorosa il linguaggio di markup li i k utilizzato utilizzare un formato neutrale e testuale Antonella De Robbio – Corso Metadati 107
    • M t d ti basati su XML Metadati b ti XML Schema RDF (Resource Description Framework) RDF Schema Antonella De Robbio – Corso Metadati 108
    • Lo stack XML/RDF/DC Il modello attuale prevede l’utilizzo di tre p standard come strati diversi (layers comunicativi)) XML stabilisce la sintassi di base (struttura fisica) RDF definisce la struttura delle relazioni (struttura logica) DC definisce i contenuti (struttura per i contenuti) Antonella De Robbio – Corso Metadati 109
    • M t d ti e infrastrutture tecniche Metadati i f t tt t i h INTEROPERABILITA’ XML – Metalinguaggio con regole per costruire linguaggi di marcature RDF – Infrastruttura che promuove interoperabilità dei metadata ANSI/NISO Z39.50-1995 –PProtocollo di rete per la ricerca su un largo numero ll l i l di database eterogenei Antonella De Robbio – Corso Metadati 110
    • <?xlm version=1.0”?> <libro> <autore>Antonella De Robbio</autore> <titolo>Diritto d’autore</titolo> </libro> <XML permetterà non solo di scambiare informazioni <?xlm version=1.0”?> i tra differenti sistemi operativi, <libro> ma anche si superare confini <titolo>Antonella De Robbio</titolo> nazionali e culturali./> <autore>Diritto d’autore</autore> </libro> <XML e XSL permetteranno agli editori di scrivere <?xlm version=1.0”?> una sola volta <libro autore=“Antonella De Robbio”> e pubblicare ovunque, <titolo>Diritto d’autore</titolo> su carta </libro> </lib > o in forma elettronica./> Antonella De Robbio – Corso Metadati 111
    • …esempio i Nell’esempio precedente i tre documenti hanno lo stesso contenuto informativo seppure presentato con strutture diverse Per i P noi umani i nomi degli elementi sono i i d li l ti di grande aiuto per interpretare il contenuto Ma cosa dire del seguente esempio, esempio ovvero come un calcolatore vede il documento doc mento Antonella De Robbio – Corso Metadati 112
    • Antonella De Robbio – Corso Metadati 113
    • … ma da solo XML non è sufficiente ... XML è troppo flessibile mentre è necessario un modello estremamente i d ll t t semplice per esprimere delle conoscenze processabili automaticamente HTML è estremamente semplice ma non flessibile e perciò può solo rappresentare informazioni senza tener conto della semantica Antonella De Robbio – Corso Metadati 114
    • XML non è facile come HTML Può essere un limite? Con C HTML chiunque poteva pubblicare in hi t bbli i Web XML è complesso e non tutti saranno in g grado di utilizzarlo Ritorno all’epoca pre-Web? O selezione obbligata di ciò che verrà pubblicato? Antonella De Robbio – Corso Metadati 115
    • <?xlmversion=1.0”?><v><x> aaaa</x><y>bbbb</y></v> </ >< >bbbb</ ></ > Cosa si può dire? che aaaa è y di bbbb o che bbbb è x di aaaa? Dal punto di vista della macchina i nomi degli elementi non aiutano, e non aiuta l’indentazione; quello che serve è una struttura rigida per specificare la “direzione” della relazione A questo scopo il W3C ha inventato RDF (Resource Description Framework). D i i F k) RDF aiuta la macchina a stabilire le relazioni Antonella De Robbio – Corso Metadati 116
    • Resource Description Framework (RDF) RDF è un modello di metadati RDF è una piattaforma per il trattamento dei metadati RDF costituisce una ipotesi di soluzione tit i i t i l i individuata dal W3C al problema della rappresentazione dei metadati t i d i t d ti RDF è complementare a XML p <http://www.w3.org/RDF/> Antonella De Robbio – Corso Metadati 117
    • Primi passi con RDF I dati sono descritti da asserzioni Un asserzione e’ Un’asserzione e composta da Una risorsa ⌧Pagina Web o parte di essa, intero sito Web… essa Web ⌧…sottoalbero XML …un libro … qualunque cosa dotata di URI una proprieta’ i t ’ ⌧e.g. Titolo, Data, Tipo un valore ⌧es. stringa, numero, frammento XML, un’altra risorsa Antonella De Robbio – Corso Metadati 118
    • S Scopo e fi lità di RDF finalità realizzare un meccanismo per la descrizione di risorse definizione di un meccanismo neutrale rispetto ai domini adattabile alla descrizione di informazioni di qualsiasi dominio permettere la definizione di semantiche per dati in formato XML secondo modalità standardizzate e che mirano l'interoperabilità Antonella De Robbio – Corso Metadati 119
    • C Cosa offre RDF ff RDF offre l'interoperabilità tra applicazioni che scambiano sul Web informazioni comprensibili dalle macchine il modello RDF consente di rappresentare metadati in una sintassi per la codifica e la trasmissione di metadati scambio secondo modalità che favoriscano l'interoperabilità fra server e client Web, sviluppati in modo indipendente Antonella De Robbio – Corso Metadati 120
    • RDF può essere usato ò t da agenti software intelligenti per facilitare la condivisione e lo scambio di conoscenza nella valutazione di contenuto nel descrivere collezioni di pagine che rappresentano un unico quot;documentoquot; logico pe desc e e diritti di proprietà te ettua e di pagine per descrivere i d tt d p op età intellettuale d pag e Web p per esprimere le preferenze sulla riservatezza da parte p p p di un utente così come le politiche di riservatezza di un sito Web Antonella De Robbio – Corso Metadati 121
    • Il modello RDF d ll Il modello dei dati RDF offre una struttura concettuale astratta per la definizione e l'uso di metadati Per creare e scambiare questi metadati è necessaria anche una sintassi concreta. A grandi linee la sintassi di RDF usa XML di li l i t i (Extensible Markup Language) all'interno di un modello che poggia su tre concetti d ll h i t tti base: il soggetto, l'oggetto e il predicato Antonella De Robbio – Corso Metadati 122
    • E Esempio i composizione di una frase soggetto predicato e oggetto (RDF fa lo stesso: è uno schema) struttura da riempire di significati Io catalogo un documento Antonella De Robbio – Corso Metadati 123
    • il soggetto, l'oggetto e il predicato soggetto l oggetto Il Soggetto è la risorsa descritta, L’Oggetto è quell'affermazione che L’O tt ll' ff i h attribuisce ad una caratteristica della i d itt risorsa descritta un determinato valore. d t i t l Il Predicato è la caratteristica o l'aspetto p specifico utilizzato per la descrizione del soggetto, che determina la proprietà della gg , p p risorsa descritta. Antonella De Robbio – Corso Metadati 124
    • Altre visioni di RDF Sintassi XML standard per rappresentare grafi etichettati diretti Sintassi XML standard per rappresentare fatti in logica del primo ordine senza variabili Asserzione := (predicato,soggetto,oggetto) Predicato = URI Soggetto = URI soggetto tt di t predicato tt oggetto Oggetto = URI o costante Oggetto = Predicato(Soggetto)
    • RDF RDF definisce delle terne: Risorsa TipoDiProprietà Valore Ciascuna terna definisce una proprietà della risorsa Per risorsa si intende qualunque entità identificabile tramite una URI http://www.aib.it/aib/lis/opac1.html TipoDiProprietà: autore: Ti DiP i tà t Valore: “Antonella De Robbio” Antonella De Robbio – Corso Metadati 126
    • Rappresentazione di RDF Le terne di RDF possono essere rappresentate in molti modi anche modi, graficamente www.aib.it/aib/lis/opac1.htm URI Antonella De Robbio XML è usato per la sua sintassi rigorosa Antonella De Robbio – Corso Metadati 127
    • Esempio di modello RDF Autore http://www.aib.it/aib/lis/opac1.htm http://www.aib.it/aib/lis/opac1.htm “La persona il cui nome e’ Antonella De Robbio, email A t ll D R bbi il derobbio@aib.it e’ l’autore di nome Email http://www.aib.it/aib/lis/opac1.htm” Antonella De Robbio derobbio@aib.it Antonella De Robbio – Corso Metadati 128
    • L’ l L’elemento RDF t L'elemento RDF è un semplice involucro che delimita i confini in un documento h d li it fi i i d t XML entro cui il contenuto è esplicitamente da intendere mappabile in una istanza di modello di dati RDF Antonella De Robbio – Corso Metadati 129
    • Si t Sintassi i <?xml version=quot;1 0quot; encoding=quot;UTF-8quot;?> version= 1.0 encoding= UTF-8 ?> <rdf:RDF xmlns:rdf=quot;http://www.w3.org/1999/02/22-rdf-syntax- ns#quot; xmlns:rdfs=quot;http://www.w3.org/2000/01/rdf-schema#quot;> <rdf:description < df d i ti about=quot;http://www.math.unipd.it/~derobbio/home/antohp.htmquot;> <s:Creator>Antonella De Robbio</s:Creator> </rdf:description> </rdf:RDF> RISORSA SPAZIO DI DENOMINAZIONE = PROPRIETA’ - VALORE VOCABOLARIO DI DOMINIO = ( questo caso costante) ELENCO DI PROPRIETA (in q ) PROPRIETA’ Antonella De Robbio – Corso Metadati 130
    • S h Schema RDF Lo schema RDF è come una sorta di dizionario In RDF il significato, fondamentale per la comprensione delle asserzioni, è espresso asserzioni attraverso il riferimento ad uno schema Attraverso la condivisione degli schemi, RDF favorirà il riutilizzo delle definizioni di metadati Antonella De Robbio – Corso Metadati 131
    • Il web semantico Il progetto è stato lanciato nel 1998 dal W3 allo scopo di rendere le informazioni che popolano la rete h l l t comprensibili alle macchine p processabili anche da programmi progettati in maniera indipendente Il web non deve servire solo a visualizzare documenti ma anche e soprattutto alla integrazione e riutilizzo delle informazioni tra applicazioni diverse Antonella De Robbio – Corso Metadati 132
    • Il web semantico In un certo senso abbiamo bisogno di un web che sia computer-friendly per essere più user-friendly Più le macchine saranno in grado di interpretare autonomamente le p informazioni della rete più efficaci saranno i loro servizi a: trovare informazioni pertinenti prendere decisioni d d i i i Antonella De Robbio – Corso Metadati 133
    • Ri Risorse utili tili Metadata UKOLN http://www.ukoln.ac.uk/metadata/ Sito IFLA http://www.ifla.org/II/metadata.htm Dublic C D bli Core http://dublincore.org/ Antonella De Robbio – Corso Metadati 134
    • Ri Risorse utili (2) tili Mapping between metadata formats h // k l http://www.ukoln.ac.uk/metadata/interoperability/ k/ d / bl / A review of metadata: a survey of current resource description formats Work Package 3 of Telematics for Research project DESIRE (RE 1004) http://www.ukoln.ac.uk/metadata/desire/overview/rev_toc.htm Antonella De Robbio – Corso Metadati 135
    • Ri Risorse utili (3) tili Gruppo di studio ICCU sugli standard e le applicazioni di metadati nei beni culturali li i i t d ti i b i lt li http://www.iccu.sbn.it/metadati.htm tradotto la versione 1.1 del quot;Dublin Core Metadata Element Set” ha implementato il Dublin Core sul sistema SBN-on line partecipa al progetto europeo DELOS NOE Lista dei progetti che utilizzano i metadati in It li i Italia Antonella De Robbio – Corso Metadati 136
    • Il gruppo è articolato in due sottogruppi: metadati descrittivi p predisposizione di modello di raccolta dei dati descrittivi p per individuare gli elementi dimetadati ritenuti essenziali all' identificazione dell'oggetto digitale riferimento ad un modello logico (FRBR) mapping per confronto relativo ai Metadati o ai Profili metadati gestionali-amministrativi e strutturali definizione di un set di metadati relativi ⌧modalità e politica di accesso alle risorse digitali ⌧aspetti organizzativi e di gestione degli oggetti digitali con i relativi servizi ⌧strategie di conservazione di lungo periodo degli oggetti medesimi Antonella De Robbio – Corso Metadati 137
    • Al Alcuni generatori... i t i DC-dot http://www.ukoln.ac.uk/metadata/dcdot/ META builder http://vancouver-webpages.com/META/mk-metas.html DONOR metadatagenerator http://www.kb.nl/coop/donor/mg-start.html Automatic RDF Metadata Generator http://www.scit.wlv.ac.uk/~ex1253/metadata.html Antonella De Robbio – Corso Metadati 138
    • Antonella De Robbio – Corso Metadati 139
    • 008010812s2000 k 720 $a Solimine $h Giovanni 513 $a Relazione 11 Seminario Angela Vinay 11. 546 $a italian 260 $b AIB - Associazione Italiana Biblioteche - Sezione Veneto $c 2000 787 $a http://www.aib.it/aib/sezioni/veneto/vinay11.htm 787 $a http://www.aib.it 8 $ // i i 680 $a Biblioteche, Biblioteconomia, Economia, Finaziamenti, Cooperazione, Bilancio Servizi Costi Ricavi Cooperazione Bilancio, Servizi, Costi, Ricavi, Acquisti librari 655 $a Text 24510$a AIB. Sezione Veneto. Seminario Angela Vinay. 11. g y BibliotECONOMIA: L'economia della cooperazione bibliotecaria 856 $u http://www.aib.it/aib/sezioni/veneto/vinay11/solimine00.htm $q $ text/html /h l http://www.bibsys.no/meta/d2m/distr/ Antonella De Robbio – Corso Metadati 140
    • Antonella De Robbio – Corso Metadati 141
    • Molto più precisa la “voce” Inglese Metadata di Wikipedia rispetto alla italiana Antonella De Robbio – Corso Metadati 142