Servizio di popolamento automatico per una piattaforma semantica di gestione di biblioteche elettroniche Laureando : Picar...
Outline <ul><li>Biblioteca digitale </li></ul><ul><li>FEDORA( F lexible  E xtensible  D igital  O bject  R epository  A rc...
Biblioteca digitale <ul><li>Biblioteca digitale </li></ul><ul><ul><li>è la biblioteca della società dell’informazione;  </...
<ul><li>La biblioteca digitale può essere definita in termini di: </li></ul><ul><ul><li>contenuti : le risorse, oggetti di...
Metadati <ul><li>Metadati </li></ul><ul><ul><li>La componente della biblioteca digitale in cui l’interoperabilità è influe...
Fedora Repository <ul><li>Fedora è un software open source della “University of Virginia Library and Cornell University”. ...
Modello Digital Object Fedora Identificatore Digital Object Service view :  metodi per disseminare contenuto   Internal vi...
<ul><li>Il FEDORA Object Model permette di asserire delle relazioni tra gli oggetti archiviati, in modo che un certo numer...
Movie Domain <ul><ul><li>Internet Movie Database ( http://www.imdb.com ) </li></ul></ul><ul><li>EachMovie  Dataset </li></...
Automatic ingesting <ul><li>Ingesting di Digital Objects di tipo collezione (coll:nomecollezione) </li></ul><ul><li>Si è p...
Automatic ingesting <ul><li>Ingesting di Digital Objects di tipo non-collezione (film:nomefilm) </li></ul><ul><li>Sui sing...
RDF <ul><li>Il  R esource  D escription  F ramework ( RDF ) è un framework per la descrizione della conoscenza nel web. È ...
Relazioni RDF <ul><li>Graficamente, le relazioni tra  Risorse ,  Proprietà  e  Espressioni  vengono rappresentate mediante...
Grazie per l’attenzione… End
Upcoming SlideShare
Loading in …5
×

Presentazione Laurea Picariello Vincenzo Matr. 450334

2,099 views

Published on

Servizio di popolamento automatico per una piattaforma semantica di gestione di biblioteche elettroniche

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Presentazione Laurea Picariello Vincenzo Matr. 450334

  1. 1. Servizio di popolamento automatico per una piattaforma semantica di gestione di biblioteche elettroniche Laureando : Picariello Vincenzo matr. 450334 Relatore : Chiar.mo Prof. Semeraro Giovanni Corelatore : Chiar.mo Dott. Iaquinta Leo
  2. 2. Outline <ul><li>Biblioteca digitale </li></ul><ul><li>FEDORA( F lexible E xtensible D igital O bject R epository A rchitecture ) </li></ul><ul><li>Popolamento automatico di un repository </li></ul>Outline
  3. 3. Biblioteca digitale <ul><li>Biblioteca digitale </li></ul><ul><ul><li>è la biblioteca della società dell’informazione; </li></ul></ul><ul><ul><li>si basa sulla connettività e su una disponibilità organizzata in rete dell’informazione; </li></ul></ul><ul><ul><li>è una realtà virtuale che produce servizi reali; </li></ul></ul><ul><ul><li>richiede tecnologia per connettere risorse di molti; </li></ul></ul><ul><ul><li>è un sistema informativo organizzato e integrato; </li></ul></ul><ul><ul><li>è un servizio di accesso ai contenuti delle varie collezioni; </li></ul></ul><ul><ul><li>ha per obiettivo l’accesso universale. </li></ul></ul>Biblioteca digitale
  4. 4. <ul><li>La biblioteca digitale può essere definita in termini di: </li></ul><ul><ul><li>contenuti : le risorse, oggetti digitali veri e propri (ossia le sequenze di bit che li rappresentano) e i metadati associati ad essi, i quali includono i metadati descrittivi (Dublin Core); </li></ul></ul><ul><ul><li>servizi : consentono la fruibilità degli oggetti digitali da parte degli utenti, avvalendosi delle informazioni veicolate dai metadati; </li></ul></ul><ul><ul><li>utenti : tutti i soggetti che hanno accesso alla rete possono essere definiti “utilizzatori delle risorse digitali”; </li></ul></ul><ul><ul><li>tecnologie : che consentono la conservazione e l'archiviazione a lungo termine, la diffusione degli strumenti per il commercio elettronico, e la definizione di standard per la gestione digitale dei diritti ( Digital Rights Management ). </li></ul></ul>Biblioteca digitale Biblioteca digitale
  5. 5. Metadati <ul><li>Metadati </li></ul><ul><ul><li>La componente della biblioteca digitale in cui l’interoperabilità è influenzata nel modo più evidente e decisivo è quello dei metadati, ovvero di quelle informazioni, generalmente strutturate e scandite in campi, relative a documenti primari, che ne permettono una più efficiente organizzazione, gestione e recupero. </li></ul></ul><ul><li>Dublin Core </li></ul><ul><ul><li>È un sistema di metadati costituito da un nucleo d’elementi essenziali ai fini della descrizione di qualsiasi materiale digitale accessibile via rete informatica; si propone come uno standard di descrizione delle risorse in formato elettronico. </li></ul></ul><ul><ul><li>È stato concepito allo scopo di descrivere risorse informative generiche che potessero essere recuperate in una sola sessione di ricerca, trattando i documenti come oggetti forniti d’etichette (tag) che ne evidenziano determinate caratteristiche. </li></ul></ul>Biblioteca digitale
  6. 6. Fedora Repository <ul><li>Fedora è un software open source della “University of Virginia Library and Cornell University”. </li></ul><ul><li>Modello di oggetto digitale flessibile ed estensibile </li></ul><ul><li>Oggetto digitale ( Digital Object D.O. ) </li></ul><ul><ul><li>contenuti di tipo eterogeneo </li></ul></ul><ul><ul><li>Behavior Definition e Behavior Mechanism Object </li></ul></ul><ul><li>Caratteristiche principali: </li></ul><ul><ul><li>è open source; </li></ul></ul><ul><ul><li>accetta dati in un qualsiasi tipo di formato digitale; </li></ul></ul><ul><ul><li>utilizza per metadati lo standard DublinCore; </li></ul></ul><ul><ul><li>gestione di relazioni tra oggetti; </li></ul></ul><ul><ul><li>sfrutta l’inserimento e l’archiviazione dei metadati nello standard XML. </li></ul></ul>Fedora
  7. 7. Modello Digital Object Fedora Identificatore Digital Object Service view : metodi per disseminare contenuto Internal view : metadati necessari a gestire l’oggetto Content view : insieme di dati e metadati identificativo unico e persistente dell’oggetto elemento che associa un servizio esterno con lo scopo di fornire una vista estensibile dell’oggetto o del contenuto è il componente dell’oggetto digitale che rappresenta il vero e proprio contenuto multimediale (immagine, testo, video) è un file in formato FOXML (Fedora Object XML) che facilita la gestione dell’oggetto e in cui sono descritte tutte le proprietà dell’oggetto
  8. 8. <ul><li>Il FEDORA Object Model permette di asserire delle relazioni tra gli oggetti archiviati, in modo che un certo numero d’oggetti collegati tra loro possano andare a costituire gli items di una collezione, i componenti di un oggetto più grande oppure un insieme di risorse con un qualcosa in comune. </li></ul><ul><li>Relazioni tra DO </li></ul><ul><ul><li>RELS-EXT (&quot; REL ation S hips- Ext ernal&quot;) </li></ul></ul><ul><li>Oggetti digitali </li></ul><ul><ul><li>identificati tramite URI ( U niform R esource I dentifiers) ottenuta concatenando il PID alla stringa &quot;info:fedora/“ </li></ul></ul><ul><li>Il Fedora relationship ontology </li></ul><ul><ul><li>rappresenta un insieme di relazioni; </li></ul></ul><ul><ul><li>le relazioni possono essere ridefinite o estese; </li></ul></ul><ul><ul><li>le relazioni sono dichiarate dalla prospettiva di un oggetto ad un altro come il seguente pattern: </li></ul></ul><ul><li><subjectFedoraObject> <relationshipProperty> <targetFedoraObject> </li></ul>Fedora Relationship ontology Fedora
  9. 9. Movie Domain <ul><ul><li>Internet Movie Database ( http://www.imdb.com ) </li></ul></ul><ul><li>EachMovie Dataset </li></ul><ul><ul><li>72.916 utenti </li></ul></ul><ul><ul><li>1.628 film </li></ul></ul><ul><ul><li>Valutazione degli utenti scala 0 e 5 </li></ul></ul><ul><li>Informazioni principali: </li></ul><ul><ul><li>Titolo, Regista, Cast, Genere, Trama e Keywords. </li></ul></ul><ul><li>Si sono definite le seguenti tipologie di DO: </li></ul><ul><ul><li>coll :FilmsCollection </li></ul></ul><ul><ul><li>coll :ActorsCollection </li></ul></ul><ul><ul><li>film :nomefilm </li></ul></ul><ul><ul><li>act :nomeattore </li></ul></ul>Ingest
  10. 10. Automatic ingesting <ul><li>Ingesting di Digital Objects di tipo collezione (coll:nomecollezione) </li></ul><ul><li>Si è pensato di definire DO per le collezioni Films e Actors, al fine di creare oggetti concettualmente intesi come classe di oggetti, dove i singoli film e i singoli attori rappresentano istanze di queste due classi. </li></ul><ul><li>Sui singoli membri delle collezioni sono stati definiti i seguenti Datastream, oltre a quello indispensabile relativo al DublinCore : </li></ul><ul><ul><li>MemberQuery </li></ul></ul><ul><ul><li>MemberList </li></ul></ul><ul><ul><li>ViewStylesheet </li></ul></ul>Ingest
  11. 11. Automatic ingesting <ul><li>Ingesting di Digital Objects di tipo non-collezione (film:nomefilm) </li></ul><ul><li>Sui singoli membri della collezione FilmsCollection sono stati definiti i seguenti Datastream: </li></ul><ul><ul><li>DC </li></ul></ul><ul><ul><li>RELS-EXT </li></ul></ul><ul><ul><li>Photo </li></ul></ul><ul><ul><li>Rating </li></ul></ul><ul><ul><li>Trailer </li></ul></ul><ul><ul><li>Trama </li></ul></ul><ul><li>Sono stati definiti due Disseminator per rendere fruibili l’immagine e il video associati al </li></ul><ul><li>DO e dei meccanismi tali da legare essi alla particolare risorsa definita. </li></ul><ul><li>Ingesting di Digital Objects di tipo non-collezione (act:nomeattore) </li></ul><ul><li>Sui singoli membri della collezione ActorsCollection sono stati definiti i seguenti Datastream: </li></ul><ul><ul><li>DC </li></ul></ul><ul><ul><li>Photo </li></ul></ul><ul><ul><li>RELS-EXT </li></ul></ul>Ingest
  12. 12. RDF <ul><li>Il R esource D escription F ramework ( RDF ) è un framework per la descrizione della conoscenza nel web. È lo strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati; è alla base del web semantico e permette la condivisione d’informazioni sul web. </li></ul><ul><li>L’RDF si basa su tre principi chiave: </li></ul><ul><ul><li>qualunque cosa può essere identificata da un URI; </li></ul></ul><ul><ul><li>the least power: utilizzare il linguaggio meno espressivo per definire qualunque cosa; </li></ul></ul><ul><ul><li>qualunque cosa può dire qualunque cosa su qualunque cosa. </li></ul></ul><ul><li>Il data model RDF è semplice, ed è basato su tre tipi di oggetti: </li></ul><ul><ul><li>Risorsa : qualunque cosa descritta da una espressione RDF viene detta risorsa; una risorsa può essere una pagina Web o un elemento XML all’interno del documento sorgente; </li></ul></ul><ul><ul><li>Proprietà : è un aspetto specifico, una caratteristica, un attributo, o una relazione utilizzata per descrivere una risorsa; </li></ul></ul><ul><ul><li>Espressione : una risorsa, con una proprietà distinta da un nome, e un valore della proprietà per la specifica risorsa, costituisce un’espressione RDF. </li></ul></ul>Ingest
  13. 13. Relazioni RDF <ul><li>Graficamente, le relazioni tra Risorse , Proprietà e Espressioni vengono rappresentate mediante grafi etichettati orientati, in cui le Risorse vengono identificate come nodi (graficamente delle ellissi), le Proprietà come archi orientati etichettati, e i valori come rettangoli. Una rappresentazione grafica della descrizione RDF utilizzata nel nostro dominio è la seguente: </li></ul>Ingest isMemberOf isCostituentOf isMemberOf film:ToyStory coll:FilmsCollection act:TomHanks act:TimAllen act:DonRickles coll:ActorsCollection
  14. 14. Grazie per l’attenzione… End

×