Web semántica y linked data la web como bd

10,666 views

Published on

Published in: Technology
  • Be the first to comment

Web semántica y linked data la web como bd

  1. 1. Web Semántica y LinkedData: La Web como BDAlvaro GravesEmail: alvaro@graves.clTwitter: @alvarograves
  2. 2. Parte I: Principios básicos
  3. 3. ¿Qué es la Web Semántica?Extensión de la Web tradicionalRed de cosas (“recursos”), no documentosMáquinas como ciudadanos de primera clase
  4. 4. ¿Cómo describirinformación sobrecosas en la Web? Y cómo hacer que las máquinas la puedan usar (Pssst: Usando RDF)
  5. 5. RDF (Resource Description Framework) Alvaro’s homepage is http://graves.cl
  6. 6. RDF (Resource Description Framework) Alvaro’s homepage is http://graves.cl Sujeto Predicado Objeto
  7. 7. RDF triple homepage Alvaro http://graves.cl
  8. 8. Grafo RDF homepage Alvaro http://graves.cl email alvaro@graves.cl
  9. 9. Grafo RDF homepage Alvaro http://graves.cl email alvaro@graves.cl conoce Eduardo
  10. 10. Grafo RDF conoce Ubaldo homepage Alvaro http://graves.cl email alvaro@graves.cl conoce conoce Eduardo
  11. 11. ¿Cómo llamamos alo que llamamos(en la Web)?
  12. 12. URI (Universal Resource Identifier) Similar a una URL No es “locator”, sino “identifier” “Una patente identifica un auto, pero no lo localiza” HTTP URIs Identifica funcionalmente un recurso en la Web Una URI identifica sólo una cosa
  13. 13. Todo se identifica con una URI URIs Mi página: http://graves.cl Yo http://alvaro.graves.cl URIs también son para predicados Ej: Angelina Jolie sabe actuar Ej: El helado sabe a chocolate CURIE: http://example.org/xyz se puede escribir como PREFIX ex: <http://example.org/> ex:xyz
  14. 14. Blank nodesA veces no podemos (o no queremos) identificaruniversalmente algún recurso Ej. Yo tengo un amigo que vive en Santiago Blank nodes identifica un recurso localmente (no globalmente)
  15. 15. Literales Valores se definen como strings Pueden ser tipados Pueden estar en un idioma apellido http://alvaro.graves.cl "Graves"
  16. 16. RDF per se define unasintaxis de grafo, peroprovee poca semántica (Se necesitan más vocabularios y ontologías)
  17. 17. RDFS (RDF Schema)Define concepto de clase (y subclase)Define concepto de propiedad (y subpropiedad)Ej.<http://alvaro.graves.cl> rdf:type foaf:Person . foaf:Person rdfs:subClassOf rdfs:Class .
  18. 18. Vocabularios y OntologíasVocabulario: Define un conjunto de términos paradescribir un dominioOntología: Modelo formal de una parte del mundoLa distinción es cuán expresivo es el modelo
  19. 19. Ejemplo: FOAFFriend-of-a-Friend (FOAF) modela relaciones socialesNamespace: http://xmlns.com/foaf/0.1/Clase: foaf:PersonPropiedades Primer nombre: foaf:firstName Apellido: foaf:lastName Conoce a: foaf:knows
  20. 20. Vocabularios comunesFOAF (redes sociales)SIOC (comunidades online)Dublin Core (Metadatos en general)OWL (Metaontología)
  21. 21. Dominio y RangoSimilar a las funciones matemáticas Dominio: De qué clase “sale” esta propiedad Rango: A qué clase “llega” esta propiedad ex:Robinfoaf:knows tiene dominio y rango foaf:Person Si X foaf:knows ex:Batman foaf:knows => X rdf:type foaf:Person Si ex:Robin foaf:knows Y ex:Batman => Y rdf:type foaf:Person
  22. 22. OWL (Web Ontology Language)Provee restricciones lógicasSirve para expresar cosas comoUna persona tiene exactamente una madre yexactamente un padrePredicado “ex:madreDe” es inverso de “ex:tieneMadre”
  23. 23. Parte II: Linked Data
  24. 24. The novelty of the SemanticWeb is not the “semantic”but the “web” Frank Van HarmelenA little semantics goes along way Jim Hendler
  25. 25. Linked Data“Buenas prácticas” para la Web Semántica Identificar URIs Proveer HTTP URIs de manera de poder referenciar en la Web Proveer información útil (para humanos y máquinas) al derreferencear Enlazar a otras URIs relacionadas
  26. 26. Linked Data cloud (2007)
  27. 27. Linked Data cloud (2008)
  28. 28. Linked Data cloud (2009)
  29. 29. Linked Data cloud (2010)
  30. 30. Linked Data cloud (2011)
  31. 31. Linked Data cloudUsar y compartir miles de millones de datosdisponibles en la WebMecanismos estándar para acceder a ellosMecanismo estándar para explorar y descubrir másdatos
  32. 32. ¿Cómo publicar Linked Data?URIs dereferenceables Por ejemplo http://lodspeakr.org :-) RDF/XML, Turtle, NTriples, RDFJSONSPARQL endpoints Fuseki, 4Store, VirtuosoRDFa (RDF “embebido” en HTML) Drupal
  33. 33. Turtle@prefix foaf: <http://xmlns.com/foaf/0.1/> .@prefix owl: <http://www.w3.org/2002/07/owl#> .@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .<http://alvaro.graves.cl> a foaf:Person ; owl:sameAs <http://tw.rpi.edu/instances/AlvaroGraves> ; foaf:depiction <http://tw.rpi.edu/wiki.tw/images/2/21/Alvaro.jpg> ; foaf:family_name "Graves" ; foaf:givenname "Alvaro" .
  34. 34. RDF/XML<?xml version="1.0" encoding="utf-8"?><rdf:RDF xmlns:admin="http://webns.net/mvcb/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <foaf:Person rdf:about="http://alvaro.graves.cl"> <owl:sameAs rdf:resource="http://tw.rpi.edu/instances/AlvaroGraves"/> <foaf:depiction rdf:resource="http://tw.rpi.edu/wiki.tw/images/2/21/Alvaro.jpg"/> <foaf:family_name>Graves</foaf:family_name> <foaf:givenname>Alvaro</foaf:givenname> </foaf:Person></rdf:RDF>
  35. 35. Triple Stores Bases de datos que soportan RDF (grafos dirigidos con etiquetas AllegroGraph Virtuoso Joseki/Fuseki 4store Muchos otros....
  36. 36. Lenguaje de consulta: SPARQL DIsponible en triple stores (tambien en RDBMS) SPARQL 1.1: Permite expresiones regulares sobre predicadosPREFIX ex: <http://example.org/>PREFIX foaf: <http://xmlns.com/foaf/0.1/>SELECT ?x ?apellido WHERE{?x a foaf:Person ; foaf:familyName ?apellido; foaf:name Juan; foaf:knows ex:pedro .}
  37. 37. Idea: ¿Y si dejamos unabase de datos abierta paraque cualquiera puedaejecutar consultas?
  38. 38. SPARQL endpointsDBpedia - http://dbpedia.org/sparqlData.gov - http://semantic.data.gov/sparqlData.gov.uk - http://data.gov.uk/sparqlDrugBank - http://www4.wiwiss.fu-berlin.de/drugbank/sparqlLOGD - http://logd.tw.rpi.edu/sparqlBiblioteca del Congreso de Chile - http://datos.bcn.cl/sparql
  39. 39. HTML+RDFa <p about="http://alvaro.graves.cl"> My name is <span property=”foaf:name”>Alvaro Graves</span>. Im a PhD student in <a rel="foaf:schoolHomepage" href="http:// www.rpi.edu">Rensselaer Polytechnic Institute</a>. </p> Tu sitio == Tu API
  40. 40. Beneficios de RDFaFácil de usar si existen templatesNo hay que administrar algo nuevoMejora el SEO (BestBuy, Schema.org)
  41. 41. ....Pero yo uso una RDBMSExisten herramientas para mapear schemasrelacionales y publicar datos en RDF Triplify D2R
  42. 42. De RDF a Linked DataDifícil: Enlazar correctamenteUso de predicados owl:sameAs skos:broader / skos:narrower rdfs:seeAlso dcterms:related foaf:primaryTopicOf / foaf:primaryTopic
  43. 43. De RDF a Linked Data (2) Enlazar a URIs de múltiples datasetsPREFIX : <http://logd.tw.rpi.edu/id/us/state/>PREFIX dbpedia: <http://dbpedia.org/resources/>PREFIX cyc: <http://sw.opencyc.org/concept/>PREFIX cyc: <http://rdf.freebase.com/ns/m/>:Wyoming owl:sameAs dbpedia:Wyoming, cyc:Mx4rvViOeZwpEbGdrcN5Y29ycA, fb:0846v .
  44. 44. Parte III: Aplicaciones
  45. 45. Publicación de datoscientíficosProblemas actuales implican trabajos multi/inter/transdisciplinarios Ej. No existe un científico que estudie el Cambio Climático Si existen geólogos, biólogos, químicos, economistas, etc.¿Cómo compartir datos e información entrecomunidades tan diversas?
  46. 46. IBM WatsonMeta: Ganar a los mejores delmundo en Jeopardy! Jeopardy presenta una respuesta, se contesta una preguntaWatson usó tecnologíassemánticas (entre otras) paraentender las preguntas
  47. 47. BestBuyUno de los retail tecnológicosmás grandes en USAMeta: aumentar visibilidad deproductosUso de RDFa en las páginasde sus productos aumentó en30% el tráfico en su sitio
  48. 48. Vocabulario Top-down creado por Google, Yahoo! yBingPermite describir entidades en una página(restaurantes, personas, episodio de TV, etc.)Soporte de Microdata y RDFa 1.1
  49. 49. Búsqueda de expertiseen NASAProblema: Necesidad de ubicarexpertos en NASA 3 proyectos previos (autorreporte de expertise) fallaronUso de SemWeb para integrar datosextraídos de multiples bases dedatosSistema: 300K + 20K/añoAhorro de 38M USD en costos
  50. 50. Linking Open GovernmentData (LOGD)Mayo 2009: Data.gov Primer portal de datos abiertosHoy: > 400.000 datasets Calidad de datos: De todo tipoLOGD: Convertir datos aRDF y enlazar a LOD cloud http://logd.tw.rpi.edu
  51. 51. Datos tabulares a RDF
  52. 52. 2 procesosConversión automática Rápida, fácil, representación de baja calidadConversión manual Curación humana, representación de alta calidad
  53. 53. Demos
  54. 54. Presupuesto + NYT
  55. 55. Seguridad pública
  56. 56. Detección de errores
  57. 57. ConclusionesLa Web Semántica no es el futuro Está siendo usada ahora para resolver problemas actualesFacilita la integración, exploración y compartir datosReduce barreras de entradas “SemWeb no hace más cosas, sino que las hace más fácil”
  58. 58. Muchas GraciasAlvaro Graves WWW: http://graves.cl Email: alvaro@graves.cl Twitter: @alvarogravesLODSPeaKr http://lodspeakr.orgLOGD http://logd.tw.rpi.edu

×