Slideshow transcript
Slide 1: Servizio di popolamento automatico per una piattaforma semantica di gestione di biblioteche elettroniche Relatore: Chiar.mo Prof. Semeraro Giovanni Corelatore: Chiar.mo Dott. Iaquinta Leo Laureando: Picariello Vincenzo matr. 450334 1
Slide 2: Outline Biblioteca digitale FEDORA(Flexible Extensible Digital Object Repository Architecture) Popolamento automatico di un repository Outline 2
Slide 3: Biblioteca digitale Biblioteca digitale è la biblioteca della società dell’informazione; si basa sulla connettività e su una disponibilità organizzata in rete dell’informazione; è una realtà virtuale che produce servizi reali; richiede tecnologia per connettere risorse di molti; è un sistema informativo organizzato e integrato; è un servizio di accesso ai contenuti delle varie collezioni; ha per obiettivo l’accesso universale. Biblioteca digitale 3
Slide 4: Biblioteca digitale La biblioteca digitale può essere definita in termini di: contenuti: le risorse, oggetti digitali veri e propri (ossia le sequenze di bit che li rappresentano) e i metadati associati ad essi, i quali includono i metadati descrittivi (Dublin Core); servizi: consentono la fruibilità degli oggetti digitali da parte degli utenti, avvalendosi delle informazioni veicolate dai metadati; utenti: tutti i soggetti che hanno accesso alla rete possono essere definiti “utilizzatori delle risorse digitali”; tecnologie: che consentono la conservazione e l'archiviazione a lungo termine, la diffusione degli strumenti per il commercio elettronico, e la definizione di standard per la gestione digitale dei diritti (Digital Rights Management). Biblioteca digitale 4
Slide 5: Metadati Metadati La componente della biblioteca digitale in cui l’interoperabilità è influenzata nel modo più evidente e decisivo è quello dei metadati, ovvero di quelle informazioni, generalmente strutturate e scandite in campi, relative a documenti primari, che ne permettono una più efficiente organizzazione, gestione e recupero. Dublin Core È un sistema di metadati costituito da un nucleo d’elementi essenziali ai fini della descrizione di qualsiasi materiale digitale accessibile via rete informatica; si propone come uno standard di descrizione delle risorse in formato elettronico. È stato concepito allo scopo di descrivere risorse informative generiche che potessero essere recuperate in una sola sessione di ricerca, trattando i documenti come oggetti forniti d’etichette (tag) che ne evidenziano determinate caratteristiche. Biblioteca digitale 5
Slide 6: Fedora Repository Fedora è un software open source della “University of Virginia Library and Cornell University”. Modello di oggetto digitale flessibile ed estensibile Oggetto digitale (Digital Object D.O.) contenuti di tipo eterogeneo Behavior Definition e Behavior Mechanism Object Caratteristiche principali: è open source; accetta dati in un qualsiasi tipo di formato digitale; utilizza per metadati lo standard DublinCore; gestione di relazioni tra oggetti; sfrutta l’inserimento e l’archiviazione dei metadati nello standard XML. Fedora 6
Slide 7: Modello Digital Object identificativo unico e Identificatore Digital Object persistente dell’oggetto elemento che associa un servizio esternoview: lo scopo di fornire Service con una vista estensibile dell’oggetto metodi per disseminare contenuto o del contenuto è il componente dell’oggetto digitale che rappresenta il vero e proprio Content view: contenuto multimediale (immagine,dati e metadati insieme di testo, video) è un file in formato FOXML (Fedora Objectmetadati necessari la Internal view: XML) che facilita gestione l’oggetto a gestire dell’oggetto e in cui sono descritte tutte le proprietà dell’oggetto Fedora 7
Slide 8: Fedora Relationship ontology Il FEDORA Object Model permette di asserire delle relazioni tra gli oggetti archiviati, in modo che un certo numero d’oggetti collegati tra loro possano andare a costituire gli items di una collezione, i componenti di un oggetto più grande oppure un insieme di risorse con un qualcosa in comune. Relazioni tra DO RELS-EXT (\"RELationShips-External\") Oggetti digitali identificati tramite URI (Uniform Resource Identifiers) ottenuta concatenando il PID alla stringa \"info:fedora/“ Il Fedora relationship ontology rappresenta un insieme di relazioni; le relazioni possono essere ridefinite o estese; le relazioni sono dichiarate dalla prospettiva di un oggetto ad un altro come il seguente pattern: <subjectFedoraObject> <relationshipProperty> <targetFedoraObject> Fedora 8
Slide 9: Movie Domain Internet Movie Database (http://www.imdb.com) EachMovie Dataset 72.916 utenti 1.628 film Valutazione degli utenti scala 0 e 5 Informazioni principali: Titolo, Regista, Cast, Genere, Trama e Keywords. Si sono definite le seguenti tipologie di DO: coll:FilmsCollection coll:ActorsCollection film:nomefilm act:nomeattore Ingest 9
Slide 10: Automatic ingesting Ingesting di Digital Objects di tipo collezione (coll:nomecollezione) Si è pensato di definire DO per le collezioni Films e Actors, al fine di creare oggetti concettualmente intesi come classe di oggetti, dove i singoli film e i singoli attori rappresentano istanze di queste due classi. Sui singoli membri delle collezioni sono stati definiti i seguenti Datastream, oltre a quello indispensabile relativo al DublinCore: MemberQuery MemberList ViewStylesheet Ingest 10
Slide 11: Automatic ingesting Ingesting di Digital Objects di tipo non-collezione (film:nomefilm) Sui singoli membri della collezione FilmsCollection sono stati definiti i seguenti Datastream: DC RELS-EXT Photo Rating Trailer Trama Sono stati definiti due Disseminator per rendere fruibili l’immagine e il video associati al DO e dei meccanismi tali da legare essi alla particolare risorsa definita. Ingesting di Digital Objects di tipo non-collezione (act:nomeattore) Sui singoli membri della collezione ActorsCollection sono stati definiti i seguenti Datastream: DC Photo RELS-EXT Ingest 11
Slide 12: RDF Il Resource Description Framework (RDF) è un framework per la descrizione della conoscenza nel web. È lo strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati; è alla base del web semantico e permette la condivisione d’informazioni sul web. L’RDF si basa su tre principi chiave: qualunque cosa può essere identificata da un URI; the least power: utilizzare il linguaggio meno espressivo per definire qualunque cosa; qualunque cosa può dire qualunque cosa su qualunque cosa. Il data model RDF è semplice, ed è basato su tre tipi di oggetti: Risorsa: qualunque cosa descritta da una espressione RDF viene detta risorsa; una risorsa può essere una pagina Web o un elemento XML all’interno del documento sorgente; Proprietà: è un aspetto specifico, una caratteristica, un attributo, o una relazione utilizzata per descrivere una risorsa; Espressione: una risorsa, con una proprietà distinta da un nome, e un valore della proprietà per la specifica risorsa, costituisce un’espressione RDF. Ingest 12
Slide 13: Relazioni RDF Graficamente, le relazioni tra Risorse, Proprietà e Espressioni vengono rappresentate mediante grafi etichettati orientati, in cui le Risorse vengono identificate come nodi (graficamente delle ellissi), le Proprietà come archi orientati etichettati, e i valori come rettangoli. Una rappresentazione grafica della descrizione RDF utilizzata nel nostro dominio è la seguente: act:TomHanks f entO stitu isCo act:TimAllen film:ToyStory isMemberOf act:DonRickles isMemberOf coll:FilmsCollection coll:ActorsCollection Ingest 13
Slide 14: Grazie per l’attenzione… End 14



Add a comment on Slide 1
If you have a SlideShare account, login to comment; else you can comment as a guest- Favorites & Groups
Showing 1-50 of 0 (more)