Confluència de dades la trajectòria de les biblioteques del CBUC en la unifi...
Evolució del web al web semàntic i Linked Open Data
1. Evolució del web al web
semàntic i Linked Open Datasemàntic i Linked Open Data
Gerard Casamayor
2. Web de documents vs. Web de dades
• Web de documents (WWW)
– Tim Berners-Lee 1989
– Web per a l’intercanvi de documents entre humans.
• Web de dades (Web semàntic)• Web de dades (Web semàntic)
– Tim Berners-Lee 2001
– Extensió del web de documents.
– El significat de les dades és ben definit (semàntic).
– Això permet a aplicacions intercanviar dades i en
facilita la reutilització i el processament.
3. Web de documents vs. web de dades
Elements
• Hipertext
• Multimedia
• Enllaços entre documents
• Navegador
Estàndards
• Llenguatges d’etiquetatge: HTML
• Localitzadors de documents: URIs (URLs)
• Protocols d’intercanvi de documents: HTTP
• Tripletes
• Conjunts de dades (datasets)
• Vocabularis i ontologies
• Enllaços entre datasets
• Aplicacions de procés de dades
• Llenguatges de codificació de dades i
ontologies: RDF, RDFs, OWL, SKOS
• Localitzadors de dades: URIs
• Protocols d’intercanvi de dades: HTTP
4. Les dades: una tripleta RDF
http://dbpedia.org/resource/Allen_Woody dbpedia:influences http://dbpedia.org/resource/Ingmar_Bergman
Recursos(URIs)
Subjecte
Predicat
Objecte
Variants: RDF/XML, JSON-LD, Turtle, etc.
6. Les dades: graf RDF
Woody Allen
influences
Ingmar Bergman
director
Wild Strawberrys
starringstarring
Ingrid Thulin
starring
Bibi Andersson
Les tripletes formen un graf
interconectat
7. Publicació de dades: Open Link Data
• Linked data: principis per a la publicació de
dades al Web.
– Ús d’estàndards de la Web (URIs, RDF, HTTP).
– Incloure enllaços a recursos externs.– Incloure enllaços a recursos externs.
– Visió pràctica del Web Semàntic.
• Dades obertes
– Linking Open Data project i LOD cloud.
8. P u b lic a c ió d e d a d e s : e l n ú v o l
LOD cloud.
• Datasets: DBPedia, Freebase, GeoNames, YAGO, Reegle, etc.
• Vocabularis: DBPedia ontology, UMBEL, FOAF, Reegle, etc.
9. Aplicacions
• Integració de dades heterogènies i documents.
– URIs i HTTP: enllaços a recursos.
– Anotació de documents amb metadades (RDFa, Microdata,
Microformat, etc.)
• Cerca
– Cerques programàtiques: SPARQL– Cerques programàtiques: SPARQL
– Cerques semàntiques de documents.
• Raonament
– Inferir nova informació a partir d’informació existent.
– Prendre decisions informades.
• Intercanvi i reutilització de dades
• Visualització de dades i documents
10. D’on venen les dades?
• Conversió de dades existents
– Servei de creació de RDF de Last.fm
• Creació manual
– Wiki semàntica Freebase
• Extreta de documents• Extreta de documents
estructurats (taules, figures).
– DBPedia
• Extreta del text de documents
– Requereix ús d’eines de
processament del llenguatge natural.
– BBC News Labs