L'enorme archivio di dati: il Web

865 views

Published on

Talk "L'enorme archivio di dati: il Web" event during 29° Mercoledì di Nexa, Turin, Italy

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
865
On SlideShare
0
From Embeds
0
Number of Embeds
15
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

L'enorme archivio di dati: il Web

  1. 1. NEXA Center for Internet & SocietyLenorme archivio di dati: il WebGiuseppe RizzoDottorando di RicercaDipartimento di Automatica ed InformaticaPolitecnico di TorinoEmail: giuseppe.rizzo@polito.it29° Mercoledì di NexaCentro NEXA su Internet & SocietàPolitecnico di TorinoTorino, 9 Marzo 2011
  2. 2. Agenda NEXA Center for Internet & Society ♦ Idea ♦ Il Web dei documenti ♦ Il Web dei dati ♦ Linked Data ♦ Come condividere i dati ♦ ConclusioniTorino, 9 Marzo 2011 2
  3. 3. Idea NEXA Center for Internet & Society Il Web è uno spazio di informazione globale, un enorme archivio distribuito di datiTorino, 9 Marzo 2011 3
  4. 4. Il Web dei documenti NEXA Center for Internet & SocietyTorino, 9 Marzo 2011 4
  5. 5. Documento NEXA Center for Internet & Society ♦ E lelemento atomico di scambio dellinformazione ♦ E il contenitore di differenti tipi di informazione: ■ codice, usato dalle applicazioni per creare le viste o interfacce di presentazione ■ testo, immagini e video, comprensibili alluomoTorino, 9 Marzo 2011 5
  6. 6. Esempio: Wikipedia NEXA Center for Internet & Society I dati e le informazioni di formattazione sono aggregati e presentati allutilizzatore I riferimenti ipertestuali sono annegati nel documentoTorino, 9 Marzo 2011 6
  7. 7. Web dei dati NEXA Center for Internet & SocietyTorino, 9 Marzo 2011 7
  8. 8. NEXA Center for Internet & Society ♦ Lelemento atomico di informazione è il dato ♦ Al dato non è associata la formattazione: il dato è grezzo, “raw” ♦ La vista viene creata dal fruitore dellinformazioneTorino, 9 Marzo 2011 8
  9. 9. Esempio: DBpedia NEXA Center for Internet & Society Wikipedia DBpediaTorino, 9 Marzo 2011 9
  10. 10. Dati vs Documenti NEXA Center for Internet & Society ♦ Le informazioni sono strutturate ♦ Una macchina può attingere allinformazione grezza senza doverla filtrare per rimuovere il rumoreTorino, 9 Marzo 2011 10
  11. 11. Il Web NEXA Center for Internet & Society ♦ Spazio di informazione globale ♦ Archivi di dati sparsi per la rete ♦ Dati tra loro “linked”, collegati : Linked Data ♦ Il fruitore può aggregare e collezionare dati provenienti da archivi distribuitiTorino, 9 Marzo 2011 11
  12. 12. Linked Data NEXA Center for Internet & SocietyRif. Tim Berners-Lee, "The Great Unveiling" in Long Beach, CA. USA, 4, Feb 2009.Torino, 9 Marzo 2011 12
  13. 13. Esempio di Linked Data NEXA Center for Internet & Society Archivio sui livelli Archivio sui livelli di ozono nellaria di traffico della della città di Torino + citta di Torino Quartiere Ora Livello Numero ... ozono macchineTorino, 9 Marzo 2011 13
  14. 14. App da data.gov NEXA Center for Internet & Societyhttp://www.data.gov/semantic/Castnet/html/exhibit- http://www.data.gov/raw/8- http://www.data.gov/raw/9Torino, 9 Marzo 2011 14
  15. 15. Interoperabilità NEXA Center for Internet & SocietyRif. Tim Berners-Lee, "The Great Unveiling" in Long Beach, CA. USA, 4, Feb 2009.Torino, 9 Marzo 2011 15
  16. 16. Condivisione dei dati NEXA Center for Internet & Society ♦ Utilizzo di URI1 per lidentificazione delle risorse ♦ Utilizzo del protocollo HTTP per permettere di navigare le relazioni e consultare le risorse ♦ Uso di standard RDF2 per la rappresentazione delle relazioni tra risorse ed un punto di accesso dove esplorare le inferenze ♦ Creare i collegamenti tra le varie URI al fine di scoprire nuovi dati 1 URI : Uniform Resource Identifier, è lindirizzo Web con il quale si identificano le risorse 2 RDF: Resource Description Framework, definisce come rappresentare le risorseTorino, 9 Marzo 2011 16
  17. 17. URI NEXA Center for Internet & Societyhttp://example.com/over/there?name=ferret#nose autorità percorso domanda* schema della frammento*comunicazione *: campi opzionali. Torino, 9 Marzo 2011 17
  18. 18. RDF NEXA Center for Internet & Society ♦ E un formalismo con il quale si definiscono le risorse e le relazioni tra esse ♦ Si basa sul concetto di dichiarazione ♦ La dichiarazione è composta da tre elementi, tripla: il soggetto, il predicato, loggetto ♦ Ogni elemento è descritto mediante una URI. Loggetto inoltre può essere descritto da un “literal” ossia da una sequenza di caratteriTorino, 9 Marzo 2011 18
  19. 19. Conclusioni NEXA Center for Internet & Society ♦ Il Web dei dati permette di collegare informazioni tra archivi di dati non strettamente collegati ♦ Dati aperti permettono il libero consumo e la libera navigazione da parte del fruitore ♦ Dati aperti creano linfrastruttura su cui il Linked Data si basa ♦ Il Web ha bisogno di “Raw data now” ma anche di dati facili da usare, riusare e distribuireTorino, 9 Marzo 2011 19
  20. 20. Questioni aperte NEXA Center for Internet & Society ♦ Affidabilità dei dati: il Web è uno spazio aperto in cui tutti possono aggiungere informazioni. Si demanda al fornitore la responsabilità su quello che viene pubblicato ♦ Dati con riferimenti temporali e spaziali ♦ Freschezza dei dati: aggiornati in tempo realeTorino, 9 Marzo 2011 20
  21. 21. NEXA Center for Internet & Society Grazie per il vostro tempo e per la vostra attenzione!Torino, 9 Marzo 2011 21

×