• Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
482
On Slideshare
0
From Embeds
0
Number of Embeds
2

Actions

Shares
Downloads
9
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Web Semántica y Linked Data Rafael Ramos - @rrasmo Betabeers Zaragoza
  • 2. Sumario ● Conceptos ● Arquitectura ● Estado actual
  • 3. Conceptos
  • 4. La Visión "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001 http://www.scientificamerican.com/article/the-semantic-web/
  • 5. Semántica ● Estudio del significado (?) – Concepto denotado por símbolos Objeto Concepto Símbolo “Oso”
  • 6. Datos Datos comprensibles por máquinas Datos estructurados Datos que pueden ser procesados
  • 7. Web ● URL – ● HTTP – ● Identificadores universales Protocolo de transporte HTML – Lenguaje de presentación Hipertexto
  • 8. Limitaciones de la Web ● Lenguaje natural ● Búsqueda imprecisa ● Enlaces sin significado #?*!$ ??? #?*!$
  • 9. Web de Documentos Web de Datos
  • 10. Es necesario... ● Formato común ● Vocabularios compartidos ● Identificadores globales => Base de datos global
  • 11. La Web Semántica “The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries.” W3C Semantic Web Activity http://www.w3.org/2001/sw/
  • 12. Arquitectura
  • 13. RDF ● Resource Description Framework ● Modelo de datos – – ● Almacenamiento Intercambio Se basa en objetos atómicos interconectados http://www.w3.org/RDF/ Recurso
  • 14. Triplas ● La estructura básica es la Tripla – (Sujeto, Predicado, Objeto) ● Representa relaciones entre objetos ● Los recursos y los enlaces tienen identificador (URI) Jua n amigoDe Luis
  • 15. Grafos ● Las triplas forman grafos ● Nodos – – nombre Recursos Con URI Literales “Juan” Juan Sin URI ● Siempre son objeto Pueden ser distribuidos amigoDe ● ● 30 edad ● Luis viveEn Zaragoza
  • 16. URIs ● URIs – Identificadores globales ● ● ● Identidad Localización http://dbpedia.org/resource/Johnny_Cash Namespaces – Parte de la URI que denota un dataset – Se pueden asociar a prefijos PREFIX dbpedia: <http://dbpedia.org/resource/> PREFIX foaf: <http://xmlns.com/foaf/0.1/> dbpedia:Johnny_Cash foaf:name “Johnny Cash”
  • 17. Serialización - Turtle @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix @prefix @prefix @prefix dc: <http://purl.org/dc/elements/1.1/> . foaf: <http://xmlns.com/foaf/0.1/> . s: <http://www.w3.org/2000/01/rdf-schema#> . con: <http://www.w3.org/2000/10/swap/pim/contact#> . <http://www.w3.org/People/Berners-Lee/card#i> a foaf:Person ; foaf:img <http://www.w3.org/Press/Stock/Berners-Lee/2001-europaeum-eighth.jpg> ; foaf:name "Tim Berners-Lee" . foaf:knows <http://bblfish.net/people/henry/card#me>, <http://danbri.org/foaf#danbri> ; http://www.w3.org/TR/turtle/
  • 18. Serialización - RDF/XML <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:s="http://www.w3.org/2000/01/rdf-schema#" xmlns:con="http://www.w3.org/2000/10/swap/pim/contact#"> <rdf:Description rdf:about="http://www.w3.org/People/Berners-Lee/card#i"> <rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Person"/> <foaf:img rdf:resource="http://www.w3.org/Press/Stock/Berners-Lee/2001-europaeum-eighth. jpg"/> <foaf:name>Tim Berners-Lee</foaf:name> <foaf:knows rdf:resource="http://bblfish.net/people/henry/card#me"/> <foaf:knows rdf:resource="http://danbri.org/foaf#danbri"/> </rdf:Description> </rdf:RDF> http://www.w3.org/TR/rdf-syntax-grammar/
  • 19. RDFS ● RDF Schema ● Vocabulario para definir esquemas de datos en RDF – – ● Clases Propiedades Permite crear jerarquías de clases e imponer restricciones en las propiedades rdfs:Class rdfs:subClassOf rdf:Property rdfs:Literal rdfs:Resource rdfs:subPropertyOf rdfs:domain rdfs:range http://www.w3.org/TR/rdf-schema/
  • 20. Esquemas de datos rdfs:Class rdfs:Class rdf:Property rdf:type rdf:type rdfs:domain Person birthPlace rdf:type rdfs:range Place rdfs:subClassOf Artist rdf:type T-Box rdf:type A-Box dbpedia:Jimmy_Page dbpedia-owl:birthPlace dbpedia:Heston
  • 21. Esquemas de datos ● El esquema de datos forma parte de los datos – Flexibilidad para el cambio – Datos auto-descriptivos – Esquemas compartidos
  • 22. Vocabularios ● Foaf: personas, relaciones sociales ● Dublin Core: metadatos genéricos ● SKOS: organización del conocimiento ● Good Relations: comercio electrónico ● SIOC: comunidades sociales ● … – Conviene reutilizar y combinar vocabularios existentes – Se pueden extender fácilmente
  • 23. SPARQL ● SPARQL Protocol and RDF Query Language ● Lenguaje de consulta para RDF – Similar a SQL ● Basado en patrones, devuelve datos que encajan ● Protocolo – Enviar consulta en HTTP GET – Obtener resultados en respuesta GET /sparql/?query=EncodedQuery HTTP/1.1 Host: www.example User-agent: my-sparql-client/0.1 http://www.w3.org/TR/rdf-sparql-query/
  • 24. Select PREFIX PREFIX PREFIX PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> rdfs: <http://www.w3.org/2000/01/rdf-schema#> dbpedia: <http://dbpedia.org/resource/> dbpediaowl: <http://dbpedia.org/ontology/> SELECT ?place ?country WHERE { dbpedia:Jimmy_Page dbpedia-owl:birthPlace ?place . ?place dbpediaowl:country ?country } ● Devuelve una lista de valores válidos para cada variable place dbpedia:Heston country dbpedia:United_Kingdom
  • 25. Construct PREFIX PREFIX PREFIX PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> rdfs: <http://www.w3.org/2000/01/rdf-schema#> dbpedia: <http://dbpedia.org/resource/> dbpediaowl: <http://dbpedia.org/ontology/> CONSTRUCT { dbpedia:Jimmy_Page foaf:based_near ?country } WHERE { dbpedia:Jimmy_Page dbpedia-owl:birthPlace ?place . ?place dbpediaowl:country ?country } ● Construye un grafo a partir de los valores encontrados dbpedia:Jimmy_Page foaf:based_near dbpedia:United_Kingdom
  • 26. Ontologías ● Clasificación de conceptos “An ontology is an explicit, formal specification of a shared conceptualization” Thomas R. Gruber: A Translation Approach to Portable Ontology Specifications.Knowledge Acquisition, 5(2):199-220, 1993. ● Clases, instancias, atributos ● Restricciones sobre clases y propiedades – Lógica formal
  • 27. OWL ● ● Web Ontology Language Permite definir ontologías (esquemas de clases) mediante lógica formal – Clases – Conjunción, Disjunción, Negación... Propiedades Hombre ⊑ Humano ● ● Inversas, Transitivas, Funcionales... owl:unionOf owl:intersectionOf owl:complementOf ● owl:TransitiveProperty owl:cardinality owl:SymmetricProperty owl:hasValue owl:FunctionalProperty owl:InverseFunctionalProperty Asunción de Mundo Abierto – Mujer ⊓ Hombre = ∅ Ausencia de información no implica falsedad
  • 28. Web Semántica ● Datos enlazados ● Lógica ● Datos abiertos ● Inferencia ● Grafo global ● Ontologías
  • 29. Linked Data ● Recomendaciones para publicar datos enlazados en la Web – Usar URIs como identificadores – Usar URIs HTTP a las que se pueda acceder – Al acceder a una URI, devolver datos RDF – Incluir enlaces a otras URIs para poder descubrir más cosas http://linkeddata.org/
  • 30. Consideraciones ● ● ● ● Linked Data puede usarse para publicar en la Web o internamente en empresas. No es necesario usar toda la pila de estándares. No siempre es la opción adecuada (rendimiento, escalabilidad...). Puede usarse RDF para exponer los datos, y otra BD para almacenamiento y operaciones.
  • 31. Estado actual
  • 32. Linking Open Data cloud http://lod-cloud.net/
  • 33. 5-star Open Data (1) Disponible en la Web con licencia abierta (2) Formato estructurado (e.g. Excel) (3) Formato no propietario (e.g. CSV) (4) Estándares semánticos (RDF, SPARQL) (5) Enlaces a otros datasets http://5stardata.info/
  • 34. Proyectos ● Schema.org – ● Facebook Open Graph – ● Vocabulario básico de metadatos Integración de páginas HTML+RDFa en Facebook Google Rich Snippets – Resultados enriquecidos por metadatos
  • 35. Herramientas ● Almacenes – ● Navegadores – ● Jena, Sesame, Owlim, Virtuoso OpenLink Data Explorer, Tabulator, Disco Editores – Protégé, TopQuadrant
  • 36. DBPedia ● Información de Wikipedia en RDF ● Datos sacados de InfoBoxes ● Disponible como – Linked Data – SPARQL http://dbpedia.org
  • 37. Preguntas