04. Tecnología de portales #OpenData. Tecnologías Semánticas en la Web de Datos
Upcoming SlideShare
Loading in...5
×
 

04. Tecnología de portales #OpenData. Tecnologías Semánticas en la Web de Datos

on

  • 903 views

Cuarta entrega. Material del curso sobre Linked Data impartido en la entidad pública empresarial Red.es por Asunción Gómez-Pérez y Oscar Corcho (Ontology Engineering Group - Universidad ...

Cuarta entrega. Material del curso sobre Linked Data impartido en la entidad pública empresarial Red.es por Asunción Gómez-Pérez y Oscar Corcho (Ontology Engineering Group - Universidad Politécnica de Madrid).

Statistics

Views

Total Views
903
Views on SlideShare
901
Embed Views
2

Actions

Likes
0
Downloads
14
Comments
0

1 Embed 2

http://cc.bingj.com 2

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

04. Tecnología de portales #OpenData. Tecnologías Semánticas en la Web de Datos 04. Tecnología de portales #OpenData. Tecnologías Semánticas en la Web de Datos Document Transcript

  • 12/12/12 Índice1.  Web de Linked Data: Conceptos Básicos A. Gómez Pérez (30 min)2.  RDF, RDF Schema y SPARQL O. Corcho (90 min)3.  Vocabularios A. Gómez Pérez (90 min)4.  Herramientas de publicación de datos para portales de datos abiertos O. Corcho (30 min) Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 1 Herramientas de publicación de datos para portales de datos abiertos Asunción Gómez-Pérez, Oscar Corcho Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net ocorcho@fi.upm.es Agradecimientos: D. Vila, B. Villazón Curso en Red.es. 13 de Diciembre de 2012 1
  • 12/12/12 Metodología de generación y publicación de Linked Data •  El proceso de publicación en Linked Data tiene un modelo de ciclo de vida incremental iterativo Especificar Especificar Modelar Explotar Modelar Generar RDF Enlazar Publicar Generar RDF Publicar Enlazar Explotar Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 3 MetodologíaEspecificar Especificación •  Análisis de fuentes de datos Modelar •  Diseño de URIs •  Definición de licenciasGenerar RDF Enlazar Publicar Explotar Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 4 2
  • 12/12/12 Especificación GeoLinkedData – Análisis de las fuentes de datos Año Provincia Índice de producción industrial Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 5 Especificación Diseño de URIs•  Usar URIs “cool”, en lugar de URIs opacas, siempre que sea posible •  URI “cool”: http://dbpedia.org/resource/Azuaga •  URI opaca: http://www.geonames.org/2521436/•  Existen varias propuestas para la generación de URIs •  Reino Unido: •  http://data.gov.uk/resources/uris •  España: borrador en progreso de la Secretaría de Estado para la función pública (Norma Técnica de Interoperabilidad de reutilización de recursos de información) Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 6 3
  • 12/12/12 Especificación Diseño de URIs (NTI – Borrador) •  URI base •  http://www.sede.gob.es/datosabiertos ó •  http://{organismo}.gob.es/datosabiertos •  URI completa •  Hash URI http://{base}/{carácter}/{sector}/{dominio}[/{concepto}]?[.{ext}]? •  Slash URI http://{base}/{carácter}/{sector}/{dominio} [.{ext}]?[#{concepto}]? •  Ejemplos: •  http://idee.gob.es/datosabiertos/recurso/medio-ambiente/geo/ Municipio/alcorcon •  http://idee.gob.es/datosabiertos/recurso/medio-ambiente/geo/ Municipio/alcorcon.n3 •  http://idee.gob.es/datosabiertos/voc/medio-ambiente/geo/Municipio Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 7 Especificación Diseño de URIs (NTI – Borrador)http://{base}/{carácter}/{sector}/{dominio}[/{concepto}]?[.{ext}]? Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 8 4
  • 12/12/12 Especificación Diseño de URIs (NTI – Borrador)http://{base}/{carácter}/{sector}/{dominio}[/{concepto}]?[.{ext}]? Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 9 Especificación Diseño de URIs (NTI – Borrador)http://{base}/{carácter}/{sector}/{dominio}[/{concepto}]?[.{ext}]? •  Seleccionar identificadores alfanuméricos cortos únicos, que sean representativos, intuitivos y semánticos. •  Usar siempre minúsculas, salvo en los casos en los que se recomienda utilizar el nombre de la clase o concepto. Habitualmente, los nombres de las clases se representan con el primer carácter de cada palabra en mayúsculas. •  Eliminar todos los acentos, diéresis y símbolos de puntuación. Como excepción puede usarse el guión (-). •  Eliminar conjunciones y artículos en los casos de que el concepto a representar contenga más de una palabra. •  Puede usarse el guión (-) como separador entre palabras. •  Evitar en la medida de lo posible la abreviatura de palabras, salvo que la abreviatura sea intuitiva. Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 10 5
  • 12/12/12 Especificación Diseño de URIs (NTI – Borrador)http://{base}/{carácter}/{sector}/{dominio}[/{concepto}]?[.{ext}]? •  ID: http://datos.gob.es/recurso/sector-publico/territorio/Provincia/Segovia •  No funciona correctamente aún (sólo redirección a HTML) •  .rdf •  http://datos.gob.es/recurso/sector-publico/territorio/Provincia/ Segovia.rdf •  curl -H "Accept: application/rdf+xml” http://datos.gob.es/recurso/sector- publico/territorio/Provincia/Segovia.rdf •  .n3 •  http://datos.gob.es/recurso/sector-publico/territorio/Provincia/ Segovia.n3 •  curl -H "Accept: text/rdf+n3" http://datos.gob.es/recurso/sector-publico/ territorio/Provincia/Segovia.n3 •  .html •  http://datos.gob.es/recurso/sector-publico/territorio/Provincia/ Segovia.html •  curl -H "Accept: text/html" http://datos.gob.es/recurso/sector-publico/ territorio/Provincia/Segovia.html •  Ejemplo de uso: http://geo.linkeddata.es/page/resource/Provincia/Segovia Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 11 Especificación Definición de la licencia •  Múltiples posibilidades •  The UK Open Government License •  Open Database License •  Public Domain Dedication and License •  Open Data Commons Attribution License •  The Creative Commons Licenses •  También es posible reutilizar y aplicar una licencia existente de las fuentes de datos del gobierno. •  GeoLinkedData: Reutilizamos la licencia original de las fuentes de datos del gobierno. Las fuentes de datos IGN y INE tienen sus propias liciencias, similares a Attribution-Share Alike 2.5 Generic License http://creativecommons.org/licenses/by-sa/2.5/ Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 12 6
  • 12/12/12 Metodología Especificar Generación de RDF •  Tomar las fuentes de datos seleccionadas en la Modelar actividad de especificación y transformarlas a RDF de acuerdo con el vocabulario creado en la actividad de modelado Generar RDF •  Algunas herramientas •  CSV y hojas de cálculo Enlazar •  Apache Any23, RDF Refine, XLWrap, RDF123, NOR2O, Tabels •  Bases de datos relacionales Publicar •  D2R Server, ODEMapster, Morph, W3C RDB2RDF WG – R2RML Explotar •  XML •  GRDDL, ReDeFer •  http://www.w3.org/wiki/ConverterToRdf Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 13 Generación GeoLinkedData - TransformaciónIndustry Production Index YearProvince !"#$"% Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 14 7
  • 12/12/12 Generación GeoLinkedData - Transformación•  R2RML es un lenguaje declarativo para describir mapeos entre los esquemas de las bases de datos relacionales y los vocabularios. www.oeg-upm.net/index.php/en/downloads/9-r2o-odempaster Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 15 Generación GeoLinkedData - Transformación•  Creación de los mapeos (todavía no está en R2RML) Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 16 8
  • 12/12/12 Generación GeoLinkedData - Transformación•  Herramienta para la generación de información de geometría en RDF.•  La geometría debe estar disponible en GML o WKT http://www.oeg-upm.net/index.php/en/downloads/151-geometry2rdf Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 17 Generación GeoLinkedData - Transformación Oracle STO UTIL package SELECT TO_CHAR(SDO_UTIL.TO_GML311GEOMETRY(geometry)) AS Gml311Geometry FROM "BCN200"."BCN200_0301L_RIO" c WHERE c.Etiqueta=Arroyo Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 18 9
  • 12/12/12 Generación GeoLinkedData - Transformación Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 Generación de enlaces EnlazadoEspecificar ModelarGenerar RDF Herramienta Silk http:// otalex.linkeddata.es/. Enlazar ../Azuaga SameAs SameAs Publicar SameAs Explotar http://dbpedia.org/ SameAs http:// SameAs http:// geo.linkeddata.es/ www.geonames.or resource/Azuaga .../Azuaga g/2521436/ DBpedia GeoLinked Data GeoNames Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 20 10
  • 12/12/12 Generación de enlaces Enlazado Identificar conjuntos de http://ckan.net datos con los que se puede enlazar Descubrir relaciones entre conjuntos de datosLIMES Silkhttp://aksw.org/Projects/limes http://www4.wiwiss.fu-berlin.de/bizer/silk/ Validar las relaciones descubiertas sameAs Validator http://oeg-dev.dia.fi.upm.es:8080/sameAs/ Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 21 Generación de enlaces GeoLinkedData - Enlazado GeoLinked Data DBPedia GeoNames owl:sameAs owl:sameAs …. …. …. http:// http:// http://dbpedia.org/ geo.linkeddata.es/... sws.geonames.org/ resource/Madrid /Madrid 6355233/ …. …. …. Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 22 11
  • 12/12/12 Generación de enlaces GeoLinkedData – Validación de enlaces http://oegdev.dia.fi.upm.es:8080/sameAs/ Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 23 PublicaciónEspecificar HTML Linked Data SPARQL Modelar Pubby Incluyendo “provenance” Pubby 0.3.3 http://www4.wiwiss.fu-berlin.de/pubby/Generar RDF Enlazar Virtuoso 6.1.4 Publicar Explotar 10.243.266 Tripletas http://otalex.linkeddata.es/resource/Municipio/Azuaga Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 24 12
  • 12/12/12 Publicación Registro de conjuntos de datos•  Registrar el conjunto de datos en el CKAN Registry•  Generar ficheros sitemap para el conjunto de datos, usando sitemap4rdf•  Enviar el fichero sitemap a Google y Sindicehttp://www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOpenData/DataSets/CKANmetainformation Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 25 Publicación Registro de conjuntos de datos (NTI – borrador)•  Usar dcat ! Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 26 13
  • 12/12/12 Explotación Visualización Especificar http://oeg-dev.dia.fi.upm.es/projects/map4rdf/ map4rdf: Modelar •  Visor sobre Google maps de recursos RDF •  Recursos RDF con información geoespacial Generar RDF •  Usado en otras aplicaciones como AEMET, Goodrelations, GeoLinked Data, El Viajero… Enlazar Publicar SPARQL Explotar map4rdf Triplestore Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 27 http://geo.linkeddata.es/ Acceso uniforme a varias bases de Generación Especificación datos del IGN de RDF 7 bases de datos geográficas &()*+,$#-.% •  Granularidad •  Escala •  Multilingualidad !"#$"% Geometry column W3C ! VocabularyModel O. hasStatisticalData Statistics hasLat/Long WGS84 hasLat/Long SCOVO on hydrOntology hasLocation/isLocated FAO O. FAO Time UNESCO GeopoliticalEGM / ERM ! hasGeometry hasGeometry ontology W3C TimeGeoNames! GML Legend GML ! Ontology Specification Specification ! Thesaurus 14
  • 12/12/12 Resumen de algunas iniciativas Fase BNE IGN AEMET PRISA INE hydrontology Scovo Modelado SSN ontology Wgs84 DC SIOC DataCube time MARiMbAGeneración de geometry2rdf RDF NOR2O CSV parser CSV parser NOR2O Silk Silk Silk NOR2O DBPEDIAGeneración de DNB DBPEDIA VIAF Geolinkeddata.es Geolinkeddata.es enlaces LIBRIS Geonames Geolinkeddata.es DBPEDIA Publicación Pubby sitemap4rdf SPARQL Explotación map4rdf Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 29 Mensajes para llevarse a casa •  URI •  Seguir guías existentes para la creación de URIs (por ejemplo, las del UK Cabinet Office) •  Reutilizar URIs existentes de fuentes de datos de autoridad •  Modelos •  Reutilizar modelos existentes siempre que sea posible •  Crear modelos y vocabularios de fuentes de datos de autoridad ya existentes •  Generación •  En muchas ocasiones se necesitan herramientas específicas del dominio •  Enlazado •  Las herramientas genéricas funcionan generalmente bien •  Enlaces a otros conjuntos de datos con… •  Equivalencias (sameAs) bne:Cervantes Dbpedia:cervantes sameAs •  Otros enlances Person Municipality birthPlace •  Descubrimiento •  Además del registro datos.gob.es, utilizar sitemap4rdf para darle información a los motores de búsqueda, y registrarse en CKAN. •  Utilizar un ciclo iterativo en el desarrollo (varias fases) Tecnologías Semánticas en la Web de Datos. Red.es. 13 de diciembre de 2012 30 15