Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Linked Open Data - Datos Abiertos Enlazados

3,950 views

Published on

Charla impartida en el I Congreso de Ingeniería Web y Seguridad Informática, organizado por ADWYS en Cádiz. 24 de Febrero de 2011

Published in: Education

Linked Open Data - Datos Abiertos Enlazados

  1. 1. Linked Open Data<br />Jose Emilio LabraGayo<br />Universidad of Oviedo, España<br />http://www.di.uniovi.es/~labra<br />
  2. 2. La charla en 1’<br />¿Qué pasa?<br />¿Porqué?<br />¿Cómo?<br />La era de los datos<br />Razones para publicar datos<br />Datos abiertos enlazados<br />Web Semántica<br />
  3. 3. ¡Cuidado…llega la <br />Web de datos!<br />
  4. 4. Evolución de la Web<br />Crecimiento casi exponencial<br />Noviembre 2010: 250 millones de sitios Web<br />Fuente: Netcraftwebserversurvey<br />
  5. 5. http://www.facebook.com/note.php?note_id=76191543919<br />http://beerpla.net/2008/08/14/how-to-find-out-the-number-of-videos-on-youtube/<br />Datos multimedia<br />Dispositivos + baratos: Cámaras, móviles, …<br />Facebook: 15.000 mill. fotos (2009)<br />Youtube: 144 mill. de vídeos (2009)<br />Flickr: 5.000 mill. fotos (2010)<br />y más…..<br />Fuente: http://www.coverpop.com/pop/flickr_interesting<br />
  6. 6. Internet de las cosas<br />Cada vez más dispositivos estarán conectados a Internet<br />Frigoríficos, coches, …<br />Frigorífico con Internet<br />
  7. 7. Y lo que falta…<br />Aumento de sensores y generadores de datos<br />Ejemplo: Acelerador de partículas LHC producirá 15 petabytes de datos/año <br />http://www.youtube.com/watch?v=sfEbMV295Kk&feature=player_embedded<br />
  8. 8. Aún así…<br />Muchos datos no se están publicando<br />Reticencias para publicar datos<br />Razones para liberar datos<br />Incluso exigir datos abiertos<br />
  9. 9. Razones para liberar datos<br />Facilitan la investigación<br />Tasa de descubrimiento se acelera con mejores accesos a los datos<br />Por el bien común de la humanidad<br />
  10. 10. Razones para liberar datos<br />Los sistemas abiertos facilitan las contribuciones externas<br />
  11. 11. Razones para liberar datos<br />Eficiencia y calidad de los sistemas<br />Datos públicos no disponibles perjudican el desarrollo de sistemas<br />Ej. ¿Lista de municipios?<br />
  12. 12. Razones para liberar datos<br />Trasparencia<br />Fomentar participación<br />Generar confianza<br />Evaluar al gobierno<br />
  13. 13. Razones para liberar datos<br />Esta presentación hubiera sido muchísimo más aburrida si no hubiese tenido acceso a los datos parcial o totalmente abiertos de Google, Flickr, Wikipedia, Slideshare, etc. etc. etc. <br />
  14. 14. Si realmente quieres algo…<br />…déjalo libre<br />
  15. 15. Como ciudadanos…<br />…también podemos demandar datos abiertos…<br />
  16. 16. …demandar datos abiertos<br />Cuando pertenecen a la humanidad<br />
  17. 17. …demandar datos abiertos<br />Hechos independientes y verificables ó de conocimiento común<br />Ejemplo: conocimiento científico<br />
  18. 18. …demandar datos abiertos<br />Cuando han sido creados con dinero público<br />Los hemos pagado con nuestros impuestos<br />¡Son nuestros!<br />
  19. 19. OK, ¡vivan los datos abiertos!pero…<br />¿Cómo publicarlos?<br />
  20. 20. El mayor reto = Integración<br />En general, el problema no es informatizar algo<br />El problema es integrar los sistemas<br />Interoperabilidad<br />No basta con publicar datos…<br />
  21. 21. Modelo de Estrellas*<br />* Enunciado por Tim Berners-Lee en Gov 2.0 Expo 2010<br />http://www.youtube.com/watch?v=ga1aSJXCFe0<br />
  22. 22. Formatos no estructurados<br />Formatos “caja negra”: Imágenes, vídeos, música, etc.<br />Formatos binarios: PDF, PS, etc.<br />Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc.<br />★<br />
  23. 23. Ejemplo: Servicio Público de Empleo<br />★<br />http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/<br />
  24. 24. ★ ★<br />Formatos estructurados<br />Los datos tienen una estructura<br />Ejemplo: Hojas de cálculo<br />Problema con formatos propietarios<br />Requieren herramientas que no son públicas<br />
  25. 25. Ejemplo: Servicio Público de empleo<br />★ ★<br />http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9<br />
  26. 26. ★ ★ ★<br />Formatos no propietarios<br />Utilizar formatos abiertos estructurados<br />Ejemplos: CSV, HTML<br />Problema: Contenido depende del contexto<br />
  27. 27. CSV<br />★ ★ ★<br />“Commaseparatedvalues” valores delimitados por comas<br />
  28. 28. HTML<br />★ ★ ★ <br />HTML pensado para representar información que se visualiza en el navegador<br />El procesamiento puede requerir “screenscrapping” <br />
  29. 29. ★ ★ ★ ★<br />URIs para identificar datos<br />Utilizar una URI para identificar un dato<br />Diferentes representaciones para cada tipo de dato<br />Negociación de contenido<br />http://puzzles.org/pieza23471<br />
  30. 30. ★ ★ ★ ★<br />Negociación de contenido<br />El protocolo HTTP permite al cliente informar al servidor qué tipo de contenido prefiere<br />El servidor puede devolver representaciones diferentes según preferencias del cliente<br />servidor<br />cliente<br />
  31. 31. ★ ★ ★ ★<br />¿Varias representaciones para lo mismo?<br />Ejemplo: Códigos de barras<br />
  32. 32. XML<br />★ ★ ★ ★<br />XML permite representar información estructurada<br />Los documentos pueden validarse (XML Schema)<br />El significado de las etiquetas depende de la aplicación<br />
  33. 33. ★ ★ ★ ★ ★<br />Linked Open Data<br />Identificar datos mediante URIs<br />Usar URIs dereferenciables<br />Proporcionar información útil al dereferenciar cada URI<br />Enlazar con otras URIs<br />
  34. 34. ★ ★ ★ ★ ★<br />Linking Open Data (2007)<br />
  35. 35. ★ ★ ★ ★ ★<br />Linking Open Data (2008)<br />
  36. 36. ★ ★ ★ ★ ★<br />Linking Open Data (2009)<br />
  37. 37. ★ ★ ★ ★ ★<br />Linking Open Data (2010)<br />
  38. 38. RDF<br />ResourceDescription Framework (1998)<br />Descripción de recursos<br />Recurso = se identifica con URI<br />Tripletas: Sujeto Predicado Objeto<br />
  39. 39. Tripletas RDF<br />http://uniovi.es/people/juan<br />http://purl.org/dc/elements/1.1/creator<br />http://biology.uniovi.es<br />Objeto<br />Valor de una propiedad<br />Puede ser:<br /> URI<br /> Literal<br /> Nodo anónimo<br />Predicado<br />Identificado por URI<br />Sujeto<br />Puede ser:<br /> URI<br />Nodo anónimo (bNode)<br />Abreviar URIs mediante espacios de nombres<br />Ejemplos:<br />dc: http://purl.org/dc/elements/1.1/<br />foaf: http://xmlns.com/foaf/0.1/<br /> rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#<br />
  40. 40. Grafo RDF<br />Puede representarse en N-Triples<br />@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .<br />@prefix foaf: <http://xmlns.com/foaf/0.1/> .<br />@prefix dc: <http://purl.org/dc/elements/1.1/> .<br /><http://biology.uniovi.es> dc:creator <http://uniovi.es/people/juan>.<br /><http://biology.uniovi.es> foaf:name "Faculty of Biology".<br /><http://uniovi.es/people/juan> rdf:type <http://uniovi.es/Teacher> .<br />foaf:name<br />Faculty of Biology<br />http://uniovi.es/Teacher<br />rdf:type<br />http://uniovi.es/people/juan<br />http://biology.uniovi.es<br />dc:creator<br />
  41. 41. RDF es composicional<br />graph3.rdf<br />graph2.rdf<br />http://uniovi.es/Teacher<br />http://uniovi.es/people/Juan<br />rdf:type<br />r:hasStaff<br />http://uniovi.es/people/Luis<br />http://uniovi.es/people/lLuis<br />dc:creator<br />http://uniovi.es<br />http://chemistry.uniovi.es<br />r:hasStaff<br />foaf:name<br />foaf:name<br />University of Oviedo<br />Faculty of Chemistry<br />graph1.rdf<br />foaf:name<br />Faculty of Biology<br />http://biology.uniovi.es<br />http://uniovi.es/Teacher<br />http://uniovi.es/people/juan<br />rdf:type<br />dc:creator<br />
  42. 42. RDF es composicional<br />graph1.rdf + graph2.rdf+ graph3.rdf<br />Faculty of Biology<br />http://biology.uniovi.es<br />foaf:name<br />dc:creator<br />rdf:type<br />http://uniovi.es/Teacher<br />http://uniovi.es/people/Juan<br />rdf:type<br />r:hasStaff<br />http://uniovi.es/people/lLuis<br />dc:creator<br />http://chemistry.uniovi.es<br />http://uniovi.es<br />r:hasStaff<br />foaf:name<br />foaf:name<br />University of Oviedo<br />Faculty of Chemistry<br />
  43. 43. Formatos RDF<br />Existen varios formatos:<br />N3<br />RDF/XML<br />N-Triples<br />Turtle<br />etc.<br />¡Lo más importante es el modelo de grafo!<br />
  44. 44. RDF Schema<br />Extiende RDF con un vocabulario de esquema<br />Class, Property, Resource,…<br />type, subClassOf, subPropertyOf,…<br />range, domain,…<br />RDF Schemapermite inferencias<br />
  45. 45. RDF Schema<br />Ejemplo<br />foaf:Person<br />rdfs:subClassOf<br />http://uniovi.es/Teacher<br />Significado:<br />if x rdf:type <http://uniovi.es/Teacher>.<br />then x rdf:type foaf:Person<br />
  46. 46. Inferencia en RDFS<br />foaf:Person<br />rdfs:subClassOf<br />http://uniovi.es/Teacher<br />rdf:type<br />rdf:type<br />http://uniovi.es/People/juan<br />
  47. 47. SPARQL<br />Simple Protocol and RDF Query Language<br />Lenguaje de consultaspara la web semántica<br />Encaje de grafos<br />Extraeinformación de modelos RDF<br />Un protocolo<br />Define un mecanismoparainvocar un servicio<br />También define un vocabulariopararesultados<br />
  48. 48. SPARQL<br />Ejemplo<br />prefix r: <http://example.org#> <br />select ?n where { <br /> ?x dc:creator ?p .<br /> ?x foaf:name ?n . <br /> ?p rdf:type <http://uniovi.es/Teacher>.<br />}<br />“Nombres de recursos cuyo autor sea un profesor”<br />
  49. 49. Ejemplo SPARQL<br />http://uniovi.es/Teacher<br />rdf:type<br />dc:creator<br />?p<br />?x<br />?n<br />foaf:name<br />?n<br />?x<br />?p<br />?p<br />Resultados<br />Faculty of Biology<br />?x<br />?n<br />Faculty of Biology<br />http://biology.uniovi.es<br />foaf:name<br />http://uniovi.es/Teacher<br />dc:creator<br />rdf:type<br />http://uniovi.es/people/juan<br />rdf:type<br />http://uniovi.es/people/Luis<br />r;hasStaff<br />dc:creator<br />http://uniovi.es<br />r:hasStaff<br />http://chemistry.uniovi.es<br />foaf:name<br />Faculty of Chemistry<br />foaf:name<br />University of Oviedo<br />Faculty of Chemistry<br />select ?n where {<br /> ?x dc:creator ?p .<br /> ?x foaf:name ?n .<br /> ?p rdf:type <http://uniovi.es/Teacher> .<br />}<br />
  50. 50. SPARQL + Inferencia<br />Las consultas SPARQL pueden combinarse con la inferencia<br />Ejemplo:<br />prefix r: <http://example.org#> <br />select ?n where { <br /> ?x dc:creator ?p .<br /> ?x foaf:name ?n . <br /> ?p rdf:type foaf:Person . <br />}<br />“Nombres de recursos cuyo autor sea una persona”<br />
  51. 51. SPARQL + Inferencia<br />foaf:Person<br />rdf:type<br />dc:creator<br />?p<br />?x<br />?n<br />foaf:name<br />?n<br />?x<br />?p<br />?p<br />Resultados<br />Faculty of Biology<br />?x<br />?n<br />foaf:Person<br />Faculty of Biology<br />rdf:type<br />http://biology.uniovi.es<br />foaf:name<br />rdfs:subclassOf<br />http://uniovi.es/Teacher<br />dc:creator<br />rdf:type<br />http://uniovi.es/people/juan<br />rdf:type<br />rdf:type<br />http://uniovi.es/people/Luis<br />r;hasStaff<br />dc:creator<br />http://uniovi.es<br />r:hasStaff<br />http://chemistry.uniovi.es<br />foaf:name<br />Faculty of Chemistry<br />foaf:name<br />University of Oviedo<br />Faculty of Chemistry<br />select ?n where {<br /> ?x dc:creator ?p .<br /> ?x foaf:name ?n .<br /> ?p rdf:type foaf:Person .<br />}<br />
  52. 52. Ontologías<br />RDFS permite hacer inferencias sencillas<br />No es muy expresivo<br />OWL (Web OntologyLanguage) lenguaje común para definir ontologías<br />Más expresivo<br />Basado en lógica descriptiva<br />
  53. 53. ¿Qué es una Ontología?<br />Ontología = Formalización de un dominio<br />Utiliza lenguajes formales<br />Permite definir vocabulario de un dominio<br />Compartir el significado entre aplicaciones<br />Inferir nuevo conocimiento<br />Otros términos relacionados:<br /> Taxonomía: Clasficación jerárquica<br /> Tesauro: Definiciones de términos<br />
  54. 54. Ejemplos de dominios<br />Biología<br />Medicina<br />Comida<br />Aviación<br />Animales<br />…etc<br />
  55. 55. Ontologías en Web Semántica<br />Múltiples ontologías de dominios específicos<br />Complejidad vs Expresividad<br />
  56. 56. Un pequeño ejercicio<br />Datos de desempleo en municipios de Cádiz<br />RDF<br />Excel<br />HTML + <br />Google Maps<br />
  57. 57. Ejercicio: Datos Excel<br />Nombres de municipios (sin normalizar)<br />. . .<br />ALGAR<br />BOSQUE, EL (al revés)<br />ALCALA DEL VALLE (sin acentos)<br />BENALUP-CASAS VIEJAS (con guión)<br />. . .<br />https://www.redtrabaja.es/es/redtrabaja/static/Redirect.do?page=statsMunicipios<br />
  58. 58. Convertidos en RDF<br />
  59. 59. Enlazando con DBPedia<br />
  60. 60. Ejercicio: HTML<br />
  61. 61. Comparando<br />¿Hay más desempleo en Cádiz o en Asturias?<br />PREFIX : <http://observa.org#><br />PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#><br />PREFIX fn: <http://www.w3.org/2005/xpath-functions#><br />SELECT ?munCadiz (?paradosCadiz / ?pobCadiz)<br /> ?munAsturias (?paradosAsturias / ?pobAsturias)<br />WHERE<br />{<br /> ?m1 :region :Cadiz .<br /> ?m1 :populationTotal ?popCadiz .<br /> ?m1 rdfs:label ?munCadiz .<br /> ?data1 :municipio ?muniCadiz .<br /> ?data1 :fecha "2010-8".<br /> ?data1 :parados ?paradosCadiz .<br /> ?muniAsturias :region :Asturias .<br /> ?muniAsturias :populationTotal ?popAsturias .<br /> ?muniAsturias rdfs:label ?labAsturias .<br /> ?data2 :municipio ?muniAsturias .<br /> ?data2 :fecha "2010-8" .<br /> ?data2 :parados ?paradosAsturias .<br />FILTER (fn:abs(?popCadiz - ?popAsturias) < 1000) .<br />}<br />Media: 5,7% más de paro en municipios con una diferencia de 1000hab en Cádiz<br />
  62. 62. Conclusiones<br />Datos abiertos enlazados facilitarán la integración y calidad de los sistemas<br />Datos no enlazados dificultan la integración<br />Ejemplo: Algeciras, Zahara…<br />
  63. 63. Nuevos retos<br />Legalidad: licencias, copyrights, patentes…<br />Privacidad<br />Cambios<br />Escalabilidad<br />Tiempo Real<br />. . .<br />
  64. 64. Fin de la presentación<br />Másinformación: <br />http://purl.org/weso<br />WESO Research Group<br />

×