En los últimos años han aparecido numerosas iniciativas de apertura de datos así como plataformas y portales que les dan soporte. Sin embargo, en ocasiones se publican datos sin acompañarlos de descripciones o información de contexto que facilite su reutilización e integración con otros datos o aplicaciones. Durante la intervención se mostrará la necesidad de describir los datos que se publican de acuerdo a vocabularios, en el mejor de los casos, consensuados. Además se tratará la publicación de los mismos y los formatos utilizados en la web.
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
Vocabularios abiertos para datos abiertos - María Poveda - EDAUA16
1. Vocabularios abiertos para
datos abiertos
María Poveda Villalón
Agradecimientos: Asunción Gómez Pérez
mpoveda@fi.upm.es
ETSI Informaticos
Universidad Politécnica de Madrid
Campus de Montegancedo s/n
28660 Boadilla del Monte, Madrid, Spain
Twitter: @MariaPovedaV
17 Marzo 2016, Alicante
2. Context – Ontology Engineering Group
Directors: A. Gómez-Pérez, O. Corcho
Position: 8th in the UPM ranking (200 groups)
Founded: 1994
Ø Research Group (30 people)
Ø Experience on
1. Ontologies, Semantic Web, Linked Data, Open Data
2. Semantic E-science
3. Multilingualism
Ø ODI Madrid : Madrid Node of the Open Data Institute
Ø Projects
§ 27 EU projects (7 as coordinator)
§ 54 National Projects
§ 27 contracts with companies
Ø Standardization activities
§ >25 @ W3C, ISO, OASIS, etc.
Ø Impact of publications H-index (scholar)
§ Asunción Gómez-Pérez (h:50, citations 14852)
§ Oscar Corcho García (h: 36, citations 8152)
Ø Services to the Spanish community
§ esDbpedia
§ linkeddata.es
§ vocab.linkeddata.es
http://www.oeg-upm.net/
https://github.com/oeg-upm
@oeg-upm
170+ Past Collaborators
50+ Past Visitors
Slide taken from “Open Data” by A. Gómez-Pérez”
3. License
• This work is licensed under the Creative Commons
Attribution – Non Commercial – Share Alike License
• You are free:
• to Share — to copy, distribute and transmit the work
• to Remix — to adapt the work
• Under the following conditions
• Attribution — You must attribute the work by inserting
• “[source http://www.oeg-upm.net/]” at the footer of each
reused slide
• a credits slide stating: “Vocabularios abiertos para datos
abiertos” by M. Poveda Villalón”
• Non-commercial
• Share-Alike
4. Ventajas de los datos abiertos
• Transparencia y control democrático
• Empoderamiento
• Participación ciudadana
• Mejora y creación de nuevos productos y servicios
• Innovación
• Mejora en la eficiencia de los servicios ofrecidos por
el gobierno
• Nuevos conocimientos a partir de fuentes de datos
combinadas
• …
6. ¿Qué son los datos abiertos (open data)?
• “Los datos abiertos son datos que pueden ser
accedidos, reutilizados y redistribuidos libremente por
cualquiera”
[fuente: Open Data Handbook, http://opendatahandbook.org/en/what-is-open-data/ ]
Slide taken from “Open Data” by A. Gómez-Pérez”
7. ¿Qué son los datos abiertos (open data)?
• “Los datos abiertos son datos que pueden ser
accedidos, reutilizados y redistribuidos libremente por
cualquiera”
• Elementos clave:
• Disponibilidad y Acceso: los datos deben estar disponibles
como un todo, con un coste máximo que sea el de su
reproducción, y preferiblemente en Internet. Asimismo,
deben ser fáciles de modificar.
• Reutilización y Redistribución: los datos deben darse con
una licencia que permita la reutilización y redistribución,
incluyendo la mezcla con otros conjuntos de datos.
• Participación Universal: todos deben poder usarlos,
reutilizarlos y redistribuirlos.
[fuente: Open Data Handbook, http://opendatahandbook.org/en/what-is-open-data/ ]
Slide taken from “Open Data” by A. Gómez-Pérez”
10. Datos Abiertos y Enlazados (I)
★ En la web, cualquier formato
pero con licencia abierta
• Ej: Un pdf
http://www.ayto-torrejon.es/plantilla.asp?nPagina=1&ccClave=34
11. Datos Abiertos y Enlazados (II)
★ En la web, cualquier formato
pero con licencia abierta
• Ej: Un pdf
★★ Formato estructurado,
procesable
• Ej: tabla en excel
ftp://ftp.ibge.gov.br/
12. Datos Abiertos y Enlazados (III)
★ En la web, cualquier formato
pero con licencia abierta
• Ej: Un pdf
★★ Formato estructurado,
procesable
• Ej: tabla en excel
★★★ Formato no propietario
• Ej: csv en lugar de excel
13. Datos Abiertos y Enlazados (IV)
http://datos.bne.es/persona/XX1718747.rdf
★ En la web, cualquier formato
pero con licencia abierta
• Ej: Un pdf
★★ Formato estructurado,
procesable
• Ej: tabla en excel
★★★ Formato no propietario
• Ej: csv en lugar de excel
★★★★ RDF y estándares web
• Ej: URI como identificadores
14. Datos Abiertos y Enlazados (V)
★ En la web, cualquier formato
pero con licencia abierta
• Ej: Un pdf
★★ Formato estructurado,
procesable
• Ej: tabla en excel
★★★ Formato no propietario
• Ej: csv en lugar de excel
★★★★ RDF y estándares web
• Ej: URI como identificadores
★★★★★ Enlaza con otros datos
• Ej: apunta a URIs de otros
proveedores de datos
http://datos.bne.es/persona/XX1718747.rdf
15. Datos Abiertos Enlazados - Beneficios
Integración de datos
• Distintos formatos
• Distinta granularidad
• Distintos idiomas
Interoperabilidad
• Tecnología web estandar
18. Los Vocabularios definen los conceptos y las relaciones
utilizadas para describir y representar un área de interés.
Definición adaptada de: http://www.w3.org/standards/semanticweb/ontology
Vocabularios (ontologías)
19. Ciudad
Fecha
de
creación
Fecha
de
establecimiento
Estado
La6tud
Longitud
Al6tude
ID COL1 COL2 COL3 COL4 COL5 COL6
1200013 28/04/1992 01/01/1993 -67.052 -10.074 205.894 12
1200054 01/03/1963 01/01/1977 -69.563 -10.943 234.867 12
1200104 21/12/1938 01/01/1939 -68.748 -11.016 188.324 12
1200138 28/04/1992 01/01/1993 -67.952 -9.820 198.174 12
1200179 28/04/1992 01/01/1993 -67.674 -10.570 212.303 12
1200203 07/09/1904 01/01/1939 -72.673 -7.631 183.080 12
1200252 28/04/1992 01/01/1993 -68.745 -11.028 206.036 12
1200302 21/12/1938 01/01/1939 -70.354 -8.160 159.822 12
1200328 28/04/1992 01/01/1993 -71.951 -9.193 264.978 12
1200336 01/03/1963 01/01/1977 -72.917 -7.593 187.066 12
1200344 01/03/1963 01/01/1977 -69.260 -8.836 162.134 12
1200351 28/04/1992 01/01/1993 -72.790 -8.954 214.911 12
1200385 01/03/1963 01/01/1977 -67.188 -10.335 129.189 12
1200807 28/04/1992 01/01/1993 -67.541 -9.601 134.323 12Data taken from ftp://ftp.ibge.gov.br/
Conceptos y relaciones
Punto
20. Ciudad
Fecha
de
creación
Fecha
de
establecimiento
Estado
La6tud
Longitud
Al6tude
ID COL1 COL2 COL3 COL4 COL5 COL6
1200013 28/04/1992 01/01/1993 -67.052 -10.074 205.894 12
1200054 01/03/1963 01/01/1977 -69.563 -10.943 234.867 12
1200104 21/12/1938 01/01/1939 -68.748 -11.016 188.324 12
1200138 28/04/1992 01/01/1993 -67.952 -9.820 198.174 12
1200179 28/04/1992 01/01/1993 -67.674 -10.570 212.303 12
1200203 07/09/1904 01/01/1939 -72.673 -7.631 183.080 12
1200252 28/04/1992 01/01/1993 -68.745 -11.028 206.036 12
1200302 21/12/1938 01/01/1939 -70.354 -8.160 159.822 12
1200328 28/04/1992 01/01/1993 -71.951 -9.193 264.978 12
1200336 01/03/1963 01/01/1977 -72.917 -7.593 187.066 12
1200344 01/03/1963 01/01/1977 -69.260 -8.836 162.134 12
1200351 28/04/1992 01/01/1993 -72.790 -8.954 214.911 12
1200385 01/03/1963 01/01/1977 -67.188 -10.335 129.189 12
1200807 28/04/1992 01/01/1993 -67.541 -9.601 134.323 12Data taken from ftp://ftp.ibge.gov.br/
establecida en
creada en
longitud
altitude
latitud
es parte de
Conceptos y relaciones
Punto
situada en
21. Vocabularios (ontologías) - beneficios
• Proporcionar semántica / contexto
• Facilita la reutilización
• Facilita la integración de datos
• Facilita el mantenimiento de los datos
• Razonamiento, inferencia
• Desambiguación, prevención de errores
22. Who’s birthday is today?
Linda was born on the
11/05/1983
Oliver was born on the
05/11/1986
23. Who’s birthday is today?
Linda was born on the
11/05/1983
5th of November 2015
Oliver was born on the
05/11/1986
28. Who’s birthday is today?
Linda was born on the
11/05/1983
5th of November 2015
Oliver was born on the
05/11/1986
29. Who’s birthday is today?
Linda was born on the
11/05/1983
5th of November 2015
Oliver was born on the
05/11/1986
Happy birthday Linda!
30. Describe your data
Linda was born on the
11/05/1983
Oliver was born on the
05/11/1986
5th of November 2015
U.K date format
DD/MM/YYYY
U.S. date format
MM/DD/YYYY
31. Describe your data
Linda was born on the
11/05/1983
Oliver was born on the
05/11/1986
5th of November 2015
U.K date format
DD/MM/YYYY
U.S. date format
MM/DD/YYYY
Happy birthday Linda and Oliver!
33. Just one more thing
Keep describing
Linda was born on the
11/05/1983
Oliver was born on the
05/11/1986
U.K date format
DD / MM / YYYY
U.S. date format
MM / DD / YYYY
DDYYYY MM
ISO 8601
34. Just one more thing
Keep describing
Linda was born on the
11/05/1983
Oliver was born on the
05/11/1986
U.K date format
DD / MM / YYYY
U.S. date format
MM / DD / YYYY
DDYYYY MM
ISO 8601
35. Just one more thing
Keep describing
Linda was born on the
11/05/1983
Oliver was born on the
05/11/1986
U.K date format
DD / MM / YYYY
U.S. date format
MM / DD / YYYY
DDYYYY MM
ISO 8601
36. Vocabularios 5 estrellas (I)
★ En la web, con licencia
abierta
• Ej: Un pdf describiendo los
datos y sus descripciones
Diagramas
UML, E/R,
texto…
37. Vocabularios 5 estrellas (II)
★ En la web
• Ej: Un pdf describiendo los
datos y sus descripciones
★★ Formato estructurado
• Ej: por ejemplo XML, OWL,
38. Vocabularios 5 estrellas (III)
★ En la web
• Ej: Un pdf describiendo los
datos y sus descripciones
★★ Formato estructurado
• Ej: por ejemplo XML
★★★ Incluye descripciones
• Ej: etiquetas, definiciones,
metadatos, etc.
http://purl.org/net/VideoGameOntology
39. Vocabularios 5 estrellas (IV)
★ En la web
• Ej: Un pdf describiendo los
datos y sus descripciones
★★ Formato estructurado
• Ej: por ejemplo XML
★★★ Incluye descripciones
• Ej: etiquetas, definiciones,
metadatos, etc.
★★★★ Varios formatos
• Ej: html, ttl, xml, etc.
http://purl.org/net/VideoGameOntology
40. Vocabularios 5 estrellas (V)
★ En la web
• Ej: Un pdf describiendo los
datos y sus descripciones
★★ Formato estructurado
• Ej: por ejemplo XML
★★★ Incluye descripciones
• Ej: etiquetas, definiciones,
metadatos, etc.
★★★★ Varios formatos
• Ej: html, ttl, xml, etc.
★★★★★ Enlaza con otros
vocabularios
• Ej: reutiliza definiciones,
extiende otros vocabularios, etc.
gr:ProductOrService
vgo:GameProduct
schema:Product
vgo:Character
vgo:Item
vgo:PlayingArea
vgo:Game
vgo:Achievement
∪
42. Conclusiones
• No sólo necesitamos datos
• Describir datos mediante vocabularios consensuados
Datos
Información
Conoci-
miento
43. Conclusiones
• No sólo necesitamos datos
• Describir datos mediante vocabularios consensuados
• ¡Publica, documenta y abre los vocabularios!
Datos
Información
Conoci-
miento
44. o Vocabularies on the semantic web
• http://www.w3.org/standards/semanticweb/ontology
o Linked Open Vocabularies (LOV): a gateway to reusable
semantic vocabularies on the Web
• http://goo.gl/QE3mXl
o http://vocab.linkeddata.es
o http://smartcity.linkeddata.es
o OnToology: http://ontoology.linkeddata.es/
o Cómo licenciar RDF:
http://www.cosasbuenas.es/blog/how-to-license-rdf
¡Gracias!
¿Preguntas?
45. Vocabularios abiertos para
datos abiertos
María Poveda Villalón
Agradecimientos: Asunción Gómez Pérez
mpoveda@fi.upm.es
ETSI Informaticos
Universidad Politécnica de Madrid
Campus de Montegancedo s/n
28660 Boadilla del Monte, Madrid, Spain
Twitter: @MariaPovedaV
17 Marzo 2016, Alicante
46. Foundations
Unique identifiers: URI
identify or name a resource
RDF(S) models
El QuijoteCervantes
Is creator of
WorkPerson
Is creator of
Is a Is a
http://datos.bne.es/resource/XX1718747 http://datos.bne.es/resource/XX3383563
http://datos.bne.es/def/C1005 http://datos.bne.es/def/C1001
Equivalence links to other datasets
Same As
http://viaf.org/viaf/17220427
Cervantes
Same AsSame As
http://dbpedia.org/resource/Miguel_de_Cervantes
Cervantes
Data navigation
Subject Object
predicate
Slide taken from “Open Data” by A. Gómez-Pérez”
47. The model (Ontology) and the data
Work
Language
translation
Year
Publication date
Library
Located at
Person
Is creator of
Has subject
El Quijote Cervantes
Is creator of
Catalán
translation
1960
Publication date
BNE
Located in
Has subject
Vida de Cervantes
birthPlace
Place
birthPlace
Alcalá de Henares
Ontology
Data
Slide taken from “Open Data” by A. Gómez-Pérez”