Linked Open Data - Datos Abiertos Enlazados

3,430 views
3,225 views

Published on

Charla impartida en el I Congreso de Ingeniería Web y Seguridad Informática, organizado por ADWYS en Cádiz. 24 de Febrero de 2011

Published in: Education
3 Comments
7 Likes
Statistics
Notes
No Downloads
Views
Total views
3,430
On SlideShare
0
From Embeds
0
Number of Embeds
176
Actions
Shares
0
Downloads
0
Comments
3
Likes
7
Embeds 0
No embeds

No notes for slide

Linked Open Data - Datos Abiertos Enlazados

  1. 1. Linked Open Data<br />Jose Emilio LabraGayo<br />Universidad of Oviedo, España<br />http://www.di.uniovi.es/~labra<br />
  2. 2. La charla en 1’<br />¿Qué pasa?<br />¿Porqué?<br />¿Cómo?<br />La era de los datos<br />Razones para publicar datos<br />Datos abiertos enlazados<br />Web Semántica<br />
  3. 3. ¡Cuidado…llega la <br />Web de datos!<br />
  4. 4. Evolución de la Web<br />Crecimiento casi exponencial<br />Noviembre 2010: 250 millones de sitios Web<br />Fuente: Netcraftwebserversurvey<br />
  5. 5. http://www.facebook.com/note.php?note_id=76191543919<br />http://beerpla.net/2008/08/14/how-to-find-out-the-number-of-videos-on-youtube/<br />Datos multimedia<br />Dispositivos + baratos: Cámaras, móviles, …<br />Facebook: 15.000 mill. fotos (2009)<br />Youtube: 144 mill. de vídeos (2009)<br />Flickr: 5.000 mill. fotos (2010)<br />y más…..<br />Fuente: http://www.coverpop.com/pop/flickr_interesting<br />
  6. 6. Internet de las cosas<br />Cada vez más dispositivos estarán conectados a Internet<br />Frigoríficos, coches, …<br />Frigorífico con Internet<br />
  7. 7. Y lo que falta…<br />Aumento de sensores y generadores de datos<br />Ejemplo: Acelerador de partículas LHC producirá 15 petabytes de datos/año <br />http://www.youtube.com/watch?v=sfEbMV295Kk&feature=player_embedded<br />
  8. 8. Aún así…<br />Muchos datos no se están publicando<br />Reticencias para publicar datos<br />Razones para liberar datos<br />Incluso exigir datos abiertos<br />
  9. 9. Razones para liberar datos<br />Facilitan la investigación<br />Tasa de descubrimiento se acelera con mejores accesos a los datos<br />Por el bien común de la humanidad<br />
  10. 10. Razones para liberar datos<br />Los sistemas abiertos facilitan las contribuciones externas<br />
  11. 11. Razones para liberar datos<br />Eficiencia y calidad de los sistemas<br />Datos públicos no disponibles perjudican el desarrollo de sistemas<br />Ej. ¿Lista de municipios?<br />
  12. 12. Razones para liberar datos<br />Trasparencia<br />Fomentar participación<br />Generar confianza<br />Evaluar al gobierno<br />
  13. 13. Razones para liberar datos<br />Esta presentación hubiera sido muchísimo más aburrida si no hubiese tenido acceso a los datos parcial o totalmente abiertos de Google, Flickr, Wikipedia, Slideshare, etc. etc. etc. <br />
  14. 14. Si realmente quieres algo…<br />…déjalo libre<br />
  15. 15. Como ciudadanos…<br />…también podemos demandar datos abiertos…<br />
  16. 16. …demandar datos abiertos<br />Cuando pertenecen a la humanidad<br />
  17. 17. …demandar datos abiertos<br />Hechos independientes y verificables ó de conocimiento común<br />Ejemplo: conocimiento científico<br />
  18. 18. …demandar datos abiertos<br />Cuando han sido creados con dinero público<br />Los hemos pagado con nuestros impuestos<br />¡Son nuestros!<br />
  19. 19. OK, ¡vivan los datos abiertos!pero…<br />¿Cómo publicarlos?<br />
  20. 20. El mayor reto = Integración<br />En general, el problema no es informatizar algo<br />El problema es integrar los sistemas<br />Interoperabilidad<br />No basta con publicar datos…<br />
  21. 21. Modelo de Estrellas*<br />* Enunciado por Tim Berners-Lee en Gov 2.0 Expo 2010<br />http://www.youtube.com/watch?v=ga1aSJXCFe0<br />
  22. 22. Formatos no estructurados<br />Formatos “caja negra”: Imágenes, vídeos, música, etc.<br />Formatos binarios: PDF, PS, etc.<br />Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc.<br />★<br />
  23. 23. Ejemplo: Servicio Público de Empleo<br />★<br />http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/<br />
  24. 24. ★ ★<br />Formatos estructurados<br />Los datos tienen una estructura<br />Ejemplo: Hojas de cálculo<br />Problema con formatos propietarios<br />Requieren herramientas que no son públicas<br />
  25. 25. Ejemplo: Servicio Público de empleo<br />★ ★<br />http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9<br />
  26. 26. ★ ★ ★<br />Formatos no propietarios<br />Utilizar formatos abiertos estructurados<br />Ejemplos: CSV, HTML<br />Problema: Contenido depende del contexto<br />
  27. 27. CSV<br />★ ★ ★<br />“Commaseparatedvalues” valores delimitados por comas<br />
  28. 28. HTML<br />★ ★ ★ <br />HTML pensado para representar información que se visualiza en el navegador<br />El procesamiento puede requerir “screenscrapping” <br />
  29. 29. ★ ★ ★ ★<br />URIs para identificar datos<br />Utilizar una URI para identificar un dato<br />Diferentes representaciones para cada tipo de dato<br />Negociación de contenido<br />http://puzzles.org/pieza23471<br />
  30. 30. ★ ★ ★ ★<br />Negociación de contenido<br />El protocolo HTTP permite al cliente informar al servidor qué tipo de contenido prefiere<br />El servidor puede devolver representaciones diferentes según preferencias del cliente<br />servidor<br />cliente<br />
  31. 31. ★ ★ ★ ★<br />¿Varias representaciones para lo mismo?<br />Ejemplo: Códigos de barras<br />
  32. 32. XML<br />★ ★ ★ ★<br />XML permite representar información estructurada<br />Los documentos pueden validarse (XML Schema)<br />El significado de las etiquetas depende de la aplicación<br />
  33. 33. ★ ★ ★ ★ ★<br />Linked Open Data<br />Identificar datos mediante URIs<br />Usar URIs dereferenciables<br />Proporcionar información útil al dereferenciar cada URI<br />Enlazar con otras URIs<br />
  34. 34. ★ ★ ★ ★ ★<br />Linking Open Data (2007)<br />
  35. 35. ★ ★ ★ ★ ★<br />Linking Open Data (2008)<br />
  36. 36. ★ ★ ★ ★ ★<br />Linking Open Data (2009)<br />
  37. 37. ★ ★ ★ ★ ★<br />Linking Open Data (2010)<br />
  38. 38. RDF<br />ResourceDescription Framework (1998)<br />Descripción de recursos<br />Recurso = se identifica con URI<br />Tripletas: Sujeto Predicado Objeto<br />
  39. 39. Tripletas RDF<br />http://uniovi.es/people/juan<br />http://purl.org/dc/elements/1.1/creator<br />http://biology.uniovi.es<br />Objeto<br />Valor de una propiedad<br />Puede ser:<br /> URI<br /> Literal<br /> Nodo anónimo<br />Predicado<br />Identificado por URI<br />Sujeto<br />Puede ser:<br /> URI<br />Nodo anónimo (bNode)<br />Abreviar URIs mediante espacios de nombres<br />Ejemplos:<br />dc: http://purl.org/dc/elements/1.1/<br />foaf: http://xmlns.com/foaf/0.1/<br /> rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#<br />
  40. 40. Grafo RDF<br />Puede representarse en N-Triples<br />@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .<br />@prefix foaf: <http://xmlns.com/foaf/0.1/> .<br />@prefix dc: <http://purl.org/dc/elements/1.1/> .<br /><http://biology.uniovi.es> dc:creator <http://uniovi.es/people/juan>.<br /><http://biology.uniovi.es> foaf:name "Faculty of Biology".<br /><http://uniovi.es/people/juan> rdf:type <http://uniovi.es/Teacher> .<br />foaf:name<br />Faculty of Biology<br />http://uniovi.es/Teacher<br />rdf:type<br />http://uniovi.es/people/juan<br />http://biology.uniovi.es<br />dc:creator<br />
  41. 41. RDF es composicional<br />graph3.rdf<br />graph2.rdf<br />http://uniovi.es/Teacher<br />http://uniovi.es/people/Juan<br />rdf:type<br />r:hasStaff<br />http://uniovi.es/people/Luis<br />http://uniovi.es/people/lLuis<br />dc:creator<br />http://uniovi.es<br />http://chemistry.uniovi.es<br />r:hasStaff<br />foaf:name<br />foaf:name<br />University of Oviedo<br />Faculty of Chemistry<br />graph1.rdf<br />foaf:name<br />Faculty of Biology<br />http://biology.uniovi.es<br />http://uniovi.es/Teacher<br />http://uniovi.es/people/juan<br />rdf:type<br />dc:creator<br />
  42. 42. RDF es composicional<br />graph1.rdf + graph2.rdf+ graph3.rdf<br />Faculty of Biology<br />http://biology.uniovi.es<br />foaf:name<br />dc:creator<br />rdf:type<br />http://uniovi.es/Teacher<br />http://uniovi.es/people/Juan<br />rdf:type<br />r:hasStaff<br />http://uniovi.es/people/lLuis<br />dc:creator<br />http://chemistry.uniovi.es<br />http://uniovi.es<br />r:hasStaff<br />foaf:name<br />foaf:name<br />University of Oviedo<br />Faculty of Chemistry<br />
  43. 43. Formatos RDF<br />Existen varios formatos:<br />N3<br />RDF/XML<br />N-Triples<br />Turtle<br />etc.<br />¡Lo más importante es el modelo de grafo!<br />
  44. 44. RDF Schema<br />Extiende RDF con un vocabulario de esquema<br />Class, Property, Resource,…<br />type, subClassOf, subPropertyOf,…<br />range, domain,…<br />RDF Schemapermite inferencias<br />
  45. 45. RDF Schema<br />Ejemplo<br />foaf:Person<br />rdfs:subClassOf<br />http://uniovi.es/Teacher<br />Significado:<br />if x rdf:type <http://uniovi.es/Teacher>.<br />then x rdf:type foaf:Person<br />
  46. 46. Inferencia en RDFS<br />foaf:Person<br />rdfs:subClassOf<br />http://uniovi.es/Teacher<br />rdf:type<br />rdf:type<br />http://uniovi.es/People/juan<br />
  47. 47. SPARQL<br />Simple Protocol and RDF Query Language<br />Lenguaje de consultaspara la web semántica<br />Encaje de grafos<br />Extraeinformación de modelos RDF<br />Un protocolo<br />Define un mecanismoparainvocar un servicio<br />También define un vocabulariopararesultados<br />
  48. 48. SPARQL<br />Ejemplo<br />prefix r: <http://example.org#> <br />select ?n where { <br /> ?x dc:creator ?p .<br /> ?x foaf:name ?n . <br /> ?p rdf:type <http://uniovi.es/Teacher>.<br />}<br />“Nombres de recursos cuyo autor sea un profesor”<br />
  49. 49. Ejemplo SPARQL<br />http://uniovi.es/Teacher<br />rdf:type<br />dc:creator<br />?p<br />?x<br />?n<br />foaf:name<br />?n<br />?x<br />?p<br />?p<br />Resultados<br />Faculty of Biology<br />?x<br />?n<br />Faculty of Biology<br />http://biology.uniovi.es<br />foaf:name<br />http://uniovi.es/Teacher<br />dc:creator<br />rdf:type<br />http://uniovi.es/people/juan<br />rdf:type<br />http://uniovi.es/people/Luis<br />r;hasStaff<br />dc:creator<br />http://uniovi.es<br />r:hasStaff<br />http://chemistry.uniovi.es<br />foaf:name<br />Faculty of Chemistry<br />foaf:name<br />University of Oviedo<br />Faculty of Chemistry<br />select ?n where {<br /> ?x dc:creator ?p .<br /> ?x foaf:name ?n .<br /> ?p rdf:type <http://uniovi.es/Teacher> .<br />}<br />
  50. 50. SPARQL + Inferencia<br />Las consultas SPARQL pueden combinarse con la inferencia<br />Ejemplo:<br />prefix r: <http://example.org#> <br />select ?n where { <br /> ?x dc:creator ?p .<br /> ?x foaf:name ?n . <br /> ?p rdf:type foaf:Person . <br />}<br />“Nombres de recursos cuyo autor sea una persona”<br />
  51. 51. SPARQL + Inferencia<br />foaf:Person<br />rdf:type<br />dc:creator<br />?p<br />?x<br />?n<br />foaf:name<br />?n<br />?x<br />?p<br />?p<br />Resultados<br />Faculty of Biology<br />?x<br />?n<br />foaf:Person<br />Faculty of Biology<br />rdf:type<br />http://biology.uniovi.es<br />foaf:name<br />rdfs:subclassOf<br />http://uniovi.es/Teacher<br />dc:creator<br />rdf:type<br />http://uniovi.es/people/juan<br />rdf:type<br />rdf:type<br />http://uniovi.es/people/Luis<br />r;hasStaff<br />dc:creator<br />http://uniovi.es<br />r:hasStaff<br />http://chemistry.uniovi.es<br />foaf:name<br />Faculty of Chemistry<br />foaf:name<br />University of Oviedo<br />Faculty of Chemistry<br />select ?n where {<br /> ?x dc:creator ?p .<br /> ?x foaf:name ?n .<br /> ?p rdf:type foaf:Person .<br />}<br />
  52. 52. Ontologías<br />RDFS permite hacer inferencias sencillas<br />No es muy expresivo<br />OWL (Web OntologyLanguage) lenguaje común para definir ontologías<br />Más expresivo<br />Basado en lógica descriptiva<br />
  53. 53. ¿Qué es una Ontología?<br />Ontología = Formalización de un dominio<br />Utiliza lenguajes formales<br />Permite definir vocabulario de un dominio<br />Compartir el significado entre aplicaciones<br />Inferir nuevo conocimiento<br />Otros términos relacionados:<br /> Taxonomía: Clasficación jerárquica<br /> Tesauro: Definiciones de términos<br />
  54. 54. Ejemplos de dominios<br />Biología<br />Medicina<br />Comida<br />Aviación<br />Animales<br />…etc<br />
  55. 55. Ontologías en Web Semántica<br />Múltiples ontologías de dominios específicos<br />Complejidad vs Expresividad<br />
  56. 56. Un pequeño ejercicio<br />Datos de desempleo en municipios de Cádiz<br />RDF<br />Excel<br />HTML + <br />Google Maps<br />
  57. 57. Ejercicio: Datos Excel<br />Nombres de municipios (sin normalizar)<br />. . .<br />ALGAR<br />BOSQUE, EL (al revés)<br />ALCALA DEL VALLE (sin acentos)<br />BENALUP-CASAS VIEJAS (con guión)<br />. . .<br />https://www.redtrabaja.es/es/redtrabaja/static/Redirect.do?page=statsMunicipios<br />
  58. 58. Convertidos en RDF<br />
  59. 59. Enlazando con DBPedia<br />
  60. 60. Ejercicio: HTML<br />
  61. 61. Comparando<br />¿Hay más desempleo en Cádiz o en Asturias?<br />PREFIX : <http://observa.org#><br />PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#><br />PREFIX fn: <http://www.w3.org/2005/xpath-functions#><br />SELECT ?munCadiz (?paradosCadiz / ?pobCadiz)<br /> ?munAsturias (?paradosAsturias / ?pobAsturias)<br />WHERE<br />{<br /> ?m1 :region :Cadiz .<br /> ?m1 :populationTotal ?popCadiz .<br /> ?m1 rdfs:label ?munCadiz .<br /> ?data1 :municipio ?muniCadiz .<br /> ?data1 :fecha "2010-8".<br /> ?data1 :parados ?paradosCadiz .<br /> ?muniAsturias :region :Asturias .<br /> ?muniAsturias :populationTotal ?popAsturias .<br /> ?muniAsturias rdfs:label ?labAsturias .<br /> ?data2 :municipio ?muniAsturias .<br /> ?data2 :fecha "2010-8" .<br /> ?data2 :parados ?paradosAsturias .<br />FILTER (fn:abs(?popCadiz - ?popAsturias) < 1000) .<br />}<br />Media: 5,7% más de paro en municipios con una diferencia de 1000hab en Cádiz<br />
  62. 62. Conclusiones<br />Datos abiertos enlazados facilitarán la integración y calidad de los sistemas<br />Datos no enlazados dificultan la integración<br />Ejemplo: Algeciras, Zahara…<br />
  63. 63. Nuevos retos<br />Legalidad: licencias, copyrights, patentes…<br />Privacidad<br />Cambios<br />Escalabilidad<br />Tiempo Real<br />. . .<br />
  64. 64. Fin de la presentación<br />Másinformación: <br />http://purl.org/weso<br />WESO Research Group<br />

×