1. MOLDEAS
M´todos Sem´nticos de Reutilizaci´n de Datos
e a o
Abiertos Enlazados en las Licitaciones P´blicas
u
Tesis Doctoral presentada por
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez
Dirigida por
Profesor Doctor D. Jos´ Emilio Labra Gayo
e
Sistemas y Servicios Inform´ticos para Internet
a
Departamento de Inform´tica
a
Universidad de Oviedo
Oviedo, 14 de Junio de 2012
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
2. MOLDEAS
1 Objeto de la Investigaci´n
o
2 Marco te´rico y conceptual
o
3 Marco metodol´gico
o
4 Resultados y Evaluaci´n
o
5 Conclusiones
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
3. MOLDEAS
Objeto de la Investigaci´n
o
1 Objeto de la Investigaci´n.
o
Formulaci´n del Problema.
o
Justificaci´n del Estudio.
o
Objetivo General.
Objetivos Espec´ıficos.
Hip´tesis.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
4. MOLDEAS
Objeto de la Investigaci´n
o
Formulaci´n del Problema
o
Problema
¿Por qu´ aplicar m´todos sem´nticos y los principios de Linked
e e a
Data y Open Data al dominio de las licitaciones p´blicas?
u
Contexto
¿Cu´les son las licitaciones p´blicas sobre ((construcci´n de puentes
a u o
y carreteras)) publicadas en la regi´n de B´lgica cuyo idioma es
o e
holand´s durante 2011 y cuyo importe est´ entre 100 y 200K
e a
euros?
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
5. MOLDEAS
Objeto de la Investigaci´n
o
Formulaci´n del Problema
o
Problema
¿Por qu´ aplicar m´todos sem´nticos y los principios de Linked
e e a
Data y Open Data al dominio de las licitaciones p´blicas?
u
Contexto
¿Cu´les son las licitaciones p´blicas sobre ((construcci´n de puentes
a u o
y carreteras)) publicadas en la regi´n de B´lgica cuyo idioma es
o e
holand´s durante 2011 y cuyo importe est´ entre 100 y 200K
e a
euros?
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
6. MOLDEAS
Objeto de la Investigaci´n
o
Justificaci´n del Estudio
o
Motivaci´n
o
Profundizaci´n en el ´rea de estudio.
o a
Corriente de investigaci´n en continua evoluci´n.
o o
Investigaci´n e Innovaci´n.
o o
Servicios de valor a˜adido.
n
Sector estrat´gico en las Administraciones P´blicas (AAPP).
e u
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
7. MOLDEAS
Objeto de la Investigaci´n
o
Justificaci´n del Estudio
o
Motivaci´n Cient´
o ıfica
Formalizaci´n del conocimiento de un dominio.
o
Aplicaci´n de modelos est´ndar a un dominio.
o a
Integraci´n de fuentes de datos.
o
Mejora y consolidaci´n de las t´cnicas actuales.
o e
Generaci´n de conocimiento, nuevos datos y enfoques.
o
Aportaciones a otros investigadores, comunidad.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
8. MOLDEAS
Objeto de la Investigaci´n
o
Justificaci´n del Estudio
o
Motivaci´n Tecnol´gica
o o
Aplicaci´n de nuevas soluciones t´cnicas.
o e
Gesti´n avanzada de la informaci´n y datos.
o o
Mejora de los procesos de acceso a la informaci´n.
o
Cobertura a las necesidades de la cadena de valor del proceso
administrativo.
Impulso de un sector trascendente: econ´mico, social,
o
financiero, etc.
Generaci´n de nuevas oportunidades de negocio.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
9. MOLDEAS
Objeto de la Investigaci´n
o
Objetivo General
Sem´ntica + Linked Data + Open Data
a
Aplicaci´n de la tecnolog´ y m´todos sem´nticos al dominio de la
o ıa e a
contrataci´n p´blica electr´nica para dar soporte a los principios de
o u o
las iniciativas de Linked Data y Open Data.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
10. MOLDEAS
Objeto de la Investigaci´n
o
Objetivos Espec´
ıficos
1 Estudiar, analizar y valorar:
Contrataci´n P´blica y e-Procurement.
o u
Web Sem´ntica, Linked Data y Open Data.
a
2 Definir m´todos basados en sem´ntica para gestionar la
e a
informaci´n de los anuncios de licitaci´n.
o o
3 Implementar y reutilizar los componentes software.
4 Promover el uso de est´ndares, la reutilizaci´n de informaci´n
a o o
y los modelos de conocimiento compartido.
5 Aplicar los m´todos sem´nticos definidos al contexto de
e a
e-Procurement.
6 Establecer un conjunto de prueba y validaci´n.
o
7 Difundir, formar y transferir la tecnolog´ y conocimiento.
ıa
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
11. MOLDEAS
Objeto de la Investigaci´n
o
Hip´tesis
o
Hip´tesis de la Investigaci´n
o o
Es posible mejorar el acceso a la informaci´n contenida en los
o
anuncios de licitaci´n de las distintas instituciones p´blicas
o u
europeas, tanto en t´rminos cuantitativos como cualitativos,
e
mediante m´todos sem´nticos basados en aplicar y cumplir los
e a
principios de la iniciativa Linked Data y de la misma forma
mantener y favorecer los principios de la corriente Open Data.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
12. MOLDEAS
Objeto de la Investigaci´n
o
Hip´tesis
o
T´rminos cualitativos
e
¿Se puede mejorar el acceso a la informaci´n y datos utilizando
o
sem´ntica?
a
T´rminos cuantitativos
e
¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n
u o
utilizando sem´ntica?
a
Aplicar, cumplir, mantener y favorecer
¿Se puede realizar este enfoque cumpliendo con los principios y
corrientes actuales?
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
13. MOLDEAS
Objeto de la Investigaci´n
o
Hip´tesis
o
T´rminos cualitativos
e
¿Se puede mejorar el acceso a la informaci´n y datos utilizando
o
sem´ntica?
a
T´rminos cuantitativos
e
¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n
u o
utilizando sem´ntica?
a
Aplicar, cumplir, mantener y favorecer
¿Se puede realizar este enfoque cumpliendo con los principios y
corrientes actuales?
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
14. MOLDEAS
Objeto de la Investigaci´n
o
Hip´tesis
o
T´rminos cualitativos
e
¿Se puede mejorar el acceso a la informaci´n y datos utilizando
o
sem´ntica?
a
T´rminos cuantitativos
e
¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n
u o
utilizando sem´ntica?
a
Aplicar, cumplir, mantener y favorecer
¿Se puede realizar este enfoque cumpliendo con los principios y
corrientes actuales?
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
15. MOLDEAS
Marco te´rico y conceptual
o
2 Marco te´rico y conceptual
o
Contrataci´n P´blica y e-Procurement.
o u
Web Sem´ntica.
a
Linked Data y Open Data.
e-Procurement y Sem´ntica.
a
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
16. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
e-Procurement
Sector estrat´gico. 17 % del PIB.
e
Impulsado desde la Uni´n Europea (adopci´n paulatina).
o o
Plan de Acci´n 2004 y Europa 2020.
o
M´ltiples fases y etapas (mara˜a de requisitos t´cnicos).
u n e
Informaci´n y datos valiosos. Sociedad de la Informaci´n.
o o
Marco legal definido y en evoluci´n (homogeneizaci´n).
o o
16K anuncios de licitaci´n nuevos al d´
o ıa.
Necesidad de impulso de la participaci´n de las peque˜as y
o n
medianas empresas (PYMES).
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
17. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Fases de e-Procurement
Figura: Diagrama de Complejidad y Fases de e-Procurement.
Fuente: Uni´n Europea.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
18. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Definici´n de e-Procurement
o
Contrataci´n P´blica Electr´nica
o u o
La contrataci´n electr´nica es un t´rmino general utilizado para
o o e
designar la sustituci´n de los procedimientos basados en soporte de
o
papel por el tratamiento y la comunicaci´n mediante TIC a lo
o
largo de toda la cadena de contrataci´n p´blica.
o u
Publicaci´n de los anuncios de licitaci´n.
o o
Suministro del pliego de condiciones.
Presentaci´n de ofertas.
o
Adjudicaci´n.
o
Facturaci´n y pago.
o
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
19. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Definici´n de e-Procurement
o
Contrataci´n P´blica Electr´nica
o u o
La contrataci´n electr´nica es un t´rmino general utilizado para
o o e
designar la sustituci´n de los procedimientos basados en soporte de
o
papel por el tratamiento y la comunicaci´n mediante TIC a lo
o
largo de toda la cadena de contrataci´n p´blica.
o u
Publicaci´n de los anuncios de licitaci´n.
o o
Suministro del pliego de condiciones.
Presentaci´n de ofertas.
o
Adjudicaci´n.
o
Facturaci´n y pago.
o
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
20. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Silos de Informaci´n
o
Figura: Silos de Informaci´n en e-Procurement de la Uni´n Europea.
o o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
21. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Multiling¨ismo y multiculturalidad.
u
Figura: Concepto “mesitas”, “mesas de caf´”, etc.
e
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
22. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Acciones de la Uni´n Europea
o
Tenders Electronic Daily (TED) y Sistema de Informaci´n
o
para la contrataci´n p´blica europea (SIMAP).
o u
Clasificaciones Est´ndar de Productos y Servicios (CPV).
a
Clasificaci´n de regiones (NUTS).
o
Plataformas de Contrataci´n.
o
Proyectos destacados:
1 e-Certis.
2 Fiscalis 2013.
3 ePRIOR.
4 PEPPOL-Pan-European Public Procurement Online.
5 STORK -Secure idenTity acrOss euRope linKed.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
23. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Acciones de la Uni´n Europea
o
Tenders Electronic Daily (TED) y Sistema de Informaci´n
o
para la contrataci´n p´blica europea (SIMAP).
o u
Clasificaciones Est´ndar de Productos y Servicios (CPV).
a
Clasificaci´n de regiones (NUTS).
o
Plataformas de Contrataci´n.
o
Proyectos destacados:
1 e-Certis.
2 Fiscalis 2013.
3 ePRIOR.
4 PEPPOL-Pan-European Public Procurement Online.
5 STORK -Secure idenTity acrOss euRope linKed.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
24. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Modelo de Informaci´n
o
TED (XML-Schema).
CODICE (XML-Schema).
opXML (XML-Schema).
...
Valoraci´n
o
Sobre-especificaci´n.
o
Escasa convergencia (nombrado, especificidad, etc.) e
interoperabilidad.
Falta de consenso.
Replicaci´n de esfuerzos.
o
Necesidades transversales: publicaci´n de informaci´n, gesti´n
o o o
de pagos, etc.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
25. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Modelo de Informaci´n
o
TED (XML-Schema).
CODICE (XML-Schema).
opXML (XML-Schema).
...
Valoraci´n
o
Sobre-especificaci´n.
o
Escasa convergencia (nombrado, especificidad, etc.) e
interoperabilidad.
Falta de consenso.
Replicaci´n de esfuerzos.
o
Necesidades transversales: publicaci´n de informaci´n, gesti´n
o o o
de pagos, etc.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
26. MOLDEAS
Marco te´rico y conceptual
o
Contrataci´n P´blica Electr´nica
o u o
Principales Problemas
Puntos de Mejora
Dispersi´n de la informaci´n.
o o
Mismo anuncio en m´s de una fuente.
a
Heterogeneidad de los formatos de los anuncios.
Diversidad de formatos de explotaci´n.
o
Multiling¨ismo y multiculturalidad.
u
Otros: almacenamiento, etc.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
27. MOLDEAS
Marco te´rico y conceptual
o
Web Sem´ntica
a
Web Sem´ntica
a
Caracter´
ısticas Principales
Modelo de datos est´ndar para representar recursos. Grafo
a
RDF (sujeto, predicado, objeto).
Formalizaci´n del conocimiento mediante ontolog´ basadas
o ıas
en l´gica (DL).
o
Facilidad para su extensi´n y crecimiento din´mico.
o a
Aplicaci´n de est´ndares en representaci´n (OWL2) y acceso
o a o
(SPARQL).
Baja intrusividad con sistemas existentes.
Mejora de la interoperabilidad e integraci´n.
o
Soporte para la creaci´n de sistemas basados en conocimiento.
o
Gran variedad de vocabularios, conjuntos de datos, etc., en
distintos dominios.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
28. MOLDEAS
Marco te´rico y conceptual
o
Datos Enlazados
Linked Data
Principios
1 Use URIs as names for
things.
2 When someone looks up a
URI, provide useful
information, using the
standards (RDF*, SPARQL).
3 Include links to other URIs. Figura: Modelo 5 (W3C).
4 Use HTTP URIs.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
29. MOLDEAS
Marco te´rico y conceptual
o
Datos Enlazados
Linked Data
Ventajas
Realizaci´n pr´ctica de la Web Sem´ntica.
o a a
Identificaci´n unica, uso de HTTP URIs.
o ´
Modelo y acceso est´ndar.
a
Enriquecimiento de recursos, creaci´n de enlaces.
o
Estructuraci´n, modelo est´ndar RDF.
o a
Expresividad, vocabularios y datasets.
Reutilizaci´n de informaci´n y datos.
o o
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
30. MOLDEAS
Marco te´rico y conceptual
o
Datos Abiertos
Open Data
Los 8 principios
Data Must Be Complete.
. . . Primary.
. . . Timely.
. . . Accessible.
. . . Machine processable.
Access Must Be Non-Discriminatory.
Data Formats Must Be Non-Proprietary.
Data Must Be License-free.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
31. MOLDEAS
Marco te´rico y conceptual
o
Datos Abiertos
Open Data
Ventajas
Inclusi´n.
o
Transparencia.
Responsabilidad.
Reutilizaci´n de informaci´n del sector p´blico (PSI).
o o u
Generaci´n de m´ltiples vistas de los datos.
o u
Creaci´n de servicios de valor a˜adido.
o n
Integraci´n de fuentes de datos.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
32. MOLDEAS
Marco te´rico y conceptual
o
Datos Abiertos
Iniciativas Open Data
Figura: Datos Abiertos en Espa˜a.
n
Fuente: http://datos.gob.es
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
33. MOLDEAS
Marco te´rico y conceptual
o
Datos Abiertos Enlazados
Linking Open Data
Figura: Linking Open Data cloud.
203 datasets, 25 billones de tripletas RDF y unos 395 millones
de enlaces entre los datos (Sept. 2010).
Dominios: Media, Geographic, Government (42,09 %),
Publications, Cross-domain, Life sciences, etc. (Ago. 2011).
393 datasets (Jun. 2012).
Fuente: R. Cyganiak & A. Jentzsch.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
34. MOLDEAS
Marco te´rico y conceptual
o
Datos Abiertos Enlazados
Ciclos de Vida en Linked Data
Linked Data Design Considerations [1].
Linked Data Patterns [2].
Grupo de trabajo del W3C-Government Linked Data (GLD)
[3]:
1 Publishing Open Government Data [4] y Best Practices [5,6].
2 Government Linked Data-Life Cycle y Linked Data Cookbook
[7].
LOD2 Stack [8], proyecto europeo LOD2.
Toward a Basic Profile for Linked Data [9], IBM y W3C.
Metodolog´ BCN y UNIOVI [10].
ıa
Linked Open Data: The Essentials [11].
Otros: por pa´ (UK, EEUU, etc.), empresa (Talis Platform,
ıs
TopQuadrant, etc.), etc.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
35. MOLDEAS
Marco te´rico y conceptual
o
Datos Abiertos Enlazados
Ciclos de Vida en Linked Data
Problemas encontrados
Marem´gnum recetas/metodolog´
a ıas/buenas pr´cticas.
a
Diferentes niveles de abstracci´n y mezcla en las tareas.
o
Baja definici´n de responsables en las tareas.
o
Baja especificaci´n de resultados de las tareas.
o
Ajuste a casu´
ıstica concreta.
Especificaciones te´ricas o en desarrollo.
o
Ausencia de relaci´n entre las mismas.
o
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
36. MOLDEAS
Marco te´rico y conceptual
o
Contraci´n P´blica Electr´nica y Sem´ntica
o u o a
e-Procurement y Sem´ntica
a
Actividades e Iniciativas
Taxonom´ de productos y servicios: CPA, CPC, CPV,
ıas
NAICS, etc.
Vocabularios XML de negocio: ebXML, XBRL, SBVR o
SCOR.
Vocabularios basados en sem´ntica: GoodRelations,
a
ProductOntology, Organizations ontology, FOAF, etc.
Ontolog´ Rep´blica Checa y proyecto LOTED.
ıas: u
Proyectos europeos: LOD2 (WP9), LATC, PlanetData, etc.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
37. MOLDEAS
Marco te´rico y conceptual
o
Resumen
Puntos Clave
...a considerar...
e-Procurement dominio heterog´neo: informaci´n, datos,
e o
proveedores, etc.
Necesidades de identificaci´n, integraci´n, modelo est´ndar,
o o a
etc.
Los principios de la Web Sem´ntica se ajustan a estas
a
necesidades.
Linked Data y Open Data corrientes actuales estrat´gicas.
e
Ausencia de un ciclo de vida concreto.
Escasas iniciativas en e-Procurement + Sem´ntica.
a
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
38. MOLDEAS
Marco te´rico y conceptual
o
Resumen
Soluci´n
o
MOLDEAS
Methods On Linked Data for E-procurement Applying Semantics
Definici´n ciclo de vida para datos abiertos enlazados.
o
Implementaci´n de los componentes software necesarios.
o
Pruebas y Validaci´n.
o
Aplicaci´n al dominio de e-Procurement.
o
Experimentaci´n.
o
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
39. MOLDEAS
Marco te´rico y conceptual
o
Resumen
Soluci´n
o
MOLDEAS
Methods On Linked Data for E-procurement Applying Semantics
Definici´n ciclo de vida para datos abiertos enlazados.
o
Implementaci´n de los componentes software necesarios.
o
Pruebas y Validaci´n.
o
Aplicaci´n al dominio de e-Procurement.
o
Experimentaci´n.
o
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
40. MOLDEAS
Marco metodol´gico
o
3 Marco metodol´gico.
o
Metodolog´ de la Investigaci´n.
ıa o
Definici´n del Ciclo de Vida para Datos Enlazados Abiertos.
o
Aplicaci´n del Ciclo de Vida al e-Procurement.
o
Creaci´n del sistema MOLDEAS.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
41. MOLDEAS
Marco metodol´gico
o
Metodolog´ de la Investigaci´n
ıa o
Tipo
Investigaci´n cuantitativa con base en evidencias emp´
o ıricas.
Car´cter descriptivo y comparativo.
a
Dise˜o
n
1 Definici´n Ciclo de Vida de Datos Enlazados Abiertos.
o
2 Aplicaci´n al dominio de e-Procurement.
o
3 Creaci´n del sistema MOLDEAS.
o
4 Definici´n y ejecuci´n de experimentos.
o o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
42. MOLDEAS
Marco metodol´gico
o
Metodolog´ de la Investigaci´n
ıa o
Tipo
Investigaci´n cuantitativa con base en evidencias emp´
o ıricas.
Car´cter descriptivo y comparativo.
a
Dise˜o
n
1 Definici´n Ciclo de Vida de Datos Enlazados Abiertos.
o
2 Aplicaci´n al dominio de e-Procurement.
o
3 Creaci´n del sistema MOLDEAS.
o
4 Definici´n y ejecuci´n de experimentos.
o o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
43. MOLDEAS
Marco metodol´gico
o
Metodolog´ de la Investigaci´n
ıa o
Universo de Estudio
Tres principales conjuntos de datos seleccionados:
1 Datos de anuncios de licitaci´n (1 Mill´n) provistos por
o o
Euroalert.net desde 2008 a 2011.
2 Cat´logos de Clasificaciones de Productos y Servicios (9:
a
CPV, CPA, NAICS, etc.) provistos por UE, ONU, EEUU, etc.
3 Organizaciones, personas y pa´ (clasificaci´n NUTS de la
ıses o
UE).
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
44. MOLDEAS
Marco metodol´gico
o
Definici´n del Ciclo de Vida para Datos Enlazados Abiertos
o
Visi´n General
o
Figura: Procesos del Ciclo de Vida de Datos Enlazados Abiertos.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
45. MOLDEAS
Marco metodol´gico
o
Definici´n del Ciclo de Vida para Datos Enlazados Abiertos
o
Visi´n Detallada-Procesos y M´todos
o e
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
46. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Consideraciones Generales
Procesos
M´todos de Producci´n y Consumo dependiente del dataset.
e o
M´todos de Publicaci´n y Validaci´n comunes.
e o o
Conjuntos de Datos
Anuncios de licitaci´n (PPN).
o
Clasificaciones est´ndar de productos y servicios (PSCs).
a
Organizaciones, personas y pa´
ıses.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
47. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Consideraciones Generales
Procesos
M´todos de Producci´n y Consumo dependiente del dataset.
e o
M´todos de Publicaci´n y Validaci´n comunes.
e o o
Conjuntos de Datos
Anuncios de licitaci´n (PPN).
o
Clasificaciones est´ndar de productos y servicios (PSCs).
a
Organizaciones, personas y pa´
ıses.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
48. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
M´todos Aplicados
e
Producci´n
o
Transformaci´n de datos est´ticos a RDF.
o a
Publicaci´n
o
Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
a
Frontend.
Consumo
Mapeo a Lenguaje de Programaci´n.
o
Validaci´n
o
Uso de Tablas de Validaci´n.
o
Realimentaci´n
o
Actualizaci´n Ocasional.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
49. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
M´todos Aplicados
e
Producci´n
o
Transformaci´n de datos est´ticos a RDF.
o a
Publicaci´n
o
Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
a
Frontend.
Consumo
Mapeo a Lenguaje de Programaci´n.
o
Validaci´n
o
Uso de Tablas de Validaci´n.
o
Realimentaci´n
o
Actualizaci´n Ocasional.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
50. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
M´todos Aplicados
e
Producci´n
o
Transformaci´n de datos est´ticos a RDF.
o a
Publicaci´n
o
Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
a
Frontend.
Consumo
Mapeo a Lenguaje de Programaci´n.
o
Validaci´n
o
Uso de Tablas de Validaci´n.
o
Realimentaci´n
o
Actualizaci´n Ocasional.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
51. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
M´todos Aplicados
e
Producci´n
o
Transformaci´n de datos est´ticos a RDF.
o a
Publicaci´n
o
Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
a
Frontend.
Consumo
Mapeo a Lenguaje de Programaci´n.
o
Validaci´n
o
Uso de Tablas de Validaci´n.
o
Realimentaci´n
o
Actualizaci´n Ocasional.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
52. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
M´todos Aplicados
e
Producci´n
o
Transformaci´n de datos est´ticos a RDF.
o a
Publicaci´n
o
Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
a
Frontend.
Consumo
Mapeo a Lenguaje de Programaci´n.
o
Validaci´n
o
Uso de Tablas de Validaci´n.
o
Realimentaci´n
o
Actualizaci´n Ocasional.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
53. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Resultados
Anuncios de Licitaci´n
o No de Elementos Tripletas
PPN 2008 112843 677058
PPN 2009 399766 2398601
PPN 2009 431813 2590880
PPN 2011 67044 402264
Cat´logo de Anuncios de Licitaci´n (total)
a o
PPNs 1011466 6068803
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
54. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Clasificaciones Est´ndar de Productos y Servicios
a
Clasificaci´no Acr´nimo
o Organismo
Common Procurement Vocabulary, (2003 y CPV UE
2008)
Combined Nomenclature 2012 (desde 1995) CN “
Central Product Classification, version 2 CPC ...
(2008)
Clasificaci´n de Productos por Actividad
o CPA “
(2008)
International Standard Industrial Classifica- ISIC ONU
tion of All Economic Activities, Rev.4
North American Industry Classification Sys- NAICS EEUU
tem 2007 y 2012
Standard International Trade Classification, SITC ONU
Revision 4
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
55. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Clasificaciones Est´ndar de Productos y Servicios
a
Figura: Enlaces entre las distintas Clasificaciones Est´ndar de Productos
a
y Servicios.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
56. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Resultados-I
PSC # Tripletas Links Links CPV
2008
CPV 2003 8323 546135 8322 462 (del CPV
2008 al 2003)
CPV 2008 10357 803311 10355 N/A
CN 2012 14552 137484 2590 2390
CPC 2008 4408 100819 4408 4375 y 1503 (ex-
actos)
CPA 2008 5429 92749 5429 5399
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
57. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Resultados-II
PSC # Tripletas
Links Links
CPV
2008
ISIC v4 766 18986 766 765
NAICS 2007 2328 36292 2328 2300
NAICS 2012 2212 35390 2212 2186
SITC v4 4017 70887 3941 3811
Cat´logo de Clasificaciones Est´ndar de Productos (total)
a a
PSCs 52392 1842053 40351 23191
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
58. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Organizaciones, personas y pa´
ıses
Figura: Organizations Ontology del W3C.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
59. MOLDEAS
Marco metodol´gico
o
Aplicaci´n del Ciclo de Vida al e-Procurement
o
Resultados
Dataset # Tripletas
Enlaces exter-
nos
Organizaciones 50000 1150020 50000 (pa´
ıses)
Personas 50000 900219 50000 (pa´
ıses)
Pa´
ıses 246 1756 1779
Organizaciones, Personas y Pa´
ıses (total)
Agregado 100246 2051995 101779
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
60. MOLDEAS
Marco metodol´gico
o
Sistema MOLDEAS
MOLDEAS y los procesos del Ciclo de Vida
Figura: Visi´n Funcional de MOLDEAS y los procesos del Ciclo de Vida
o
de Linked Data.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
61. MOLDEAS
Marco metodol´gico
o
Sistema MOLDEAS
MOLDEAS web (REST+Jquery)
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
62. MOLDEAS
Marco metodol´gico
o
Sistema MOLDEAS
MOLDEAS web-Resultados (Jquery+Exhibit)
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
63. MOLDEAS
Marco metodol´gico
o
Sistema MOLDEAS
MOLDEAS-Linked Data Frontend (Pubby)
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
64. MOLDEAS
Resultados y Evaluaci´n
o
4 Resultados y Evaluaci´n.
o
Metodolog´ ıa.
Expresividad y Cumplimiento de Criterios.
1 Punto de Vista Cuantitativo.
2 Punto de Vista Cualitativo.
Sistema MOLDEAS.
1 Consumo de Datos Enlazados Abiertos.
2 Rendimiento de Consultas en SPARQL.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
65. MOLDEAS
Resultados y Evaluaci´n
o
Metodolog´
ıa
Pasos de ejecuci´n
o
1 Definici´n de los objetivos del experimento.
o
2 Selecci´n de una regla de asignaci´n de las unidades experimentales
o o
a las condiciones de estudio.
Cualitativos: tipo de entorno hardware y software, etc.
Cuantitativos: tama˜o de la muestra, de la memoria y n´mero
n u
de posibilidades de expresar una consulta.
3 Especificaci´n de las medidas de trabajo en cuanto a la respuesta.
o
4 Especificaci´n de un modelo.
o
5 Ejecuci´n de un experimento piloto.
o
6 Esquematizaci´n de los pasos a seguir.
o
7 Determinaci´n del tama˜o muestral.
o n
8 Revisi´n de las decisiones anteriores.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
66. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Visi´n del experimento
o
Punto de Vista Cuantitativo
¿Cu´l es la posibilidad de uso de datos enlazados para facilitar el
a
acceso a un mayor n´mero de recursos relacionados con los
u
anuncios de licitaci´n?
o
Punto de Vista Cualitativo
Evaluaci´n, grado de cumplimiento y comparaci´n con otros
o o
enfoques de:
Principios de Open Data y Linked Data.
Buenas pr´cticas.
a
Patrones de dise˜o.
n
Caracter´ısticas de pertenencia a la nube de datos enlazados y
registro CKAN.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
67. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Visi´n del experimento
o
Punto de Vista Cuantitativo
¿Cu´l es la posibilidad de uso de datos enlazados para facilitar el
a
acceso a un mayor n´mero de recursos relacionados con los
u
anuncios de licitaci´n?
o
Punto de Vista Cualitativo
Evaluaci´n, grado de cumplimiento y comparaci´n con otros
o o
enfoques de:
Principios de Open Data y Linked Data.
Buenas pr´cticas.
a
Patrones de dise˜o.
n
Caracter´ısticas de pertenencia a la nube de datos enlazados y
registro CKAN.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
68. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Expresividad
Punto de Vista Cuantitativo.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
69. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo
1-Definici´n de los objetivos del experimento
o
1 ¿Cu´l es la expresividad actual, en t´rminos de n´mero de
a e u
conceptos para realizar consultas, para el acceso a la
informaci´n de anuncios de licitaci´n?
o o
2 ¿Cu´l es la ventaja de uso de un modelo RDF para la
a
expresi´n y recuperaci´n de la informaci´n de los anuncios de
o o o
licitaci´n?
o
3 ¿C´mo favorecen los datos enlazados el aumento de
o
expresividad en la ejecuci´n de consultas y por tanto facilitan
o
la recuperaci´n de los anuncios de licitaci´n?
o o
4 ¿Cu´l es el beneficio real del uso de datos enlazados para
a
representar la informaci´n?
o
5 ¿Se incurre en alg´n error al aumentar la expresividad?
u
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
70. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo
2-Selecci´n de una regla de asignaci´n de las unidades
o o
experimentales a las condiciones de estudio
1 Base documental D constituida por 1 mill´n de anuncios de
o
licitaci´n.
o
2 Vocabulario controlado, V, del CPV 2008, formado por
#V = 10357 c´digos/t´rminos distintos.
o e
3 Cada documento d ∈ D, etiquetado con al menos un c´digo
o
v ∈ V.
4 9 Clasificaciones Est´ndar de Productos y Servicios.
a
5 Clasificaci´n “puente”: ProductOntology (PO)
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
71. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo
3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
o
1 No de enlaces entre una PSC y el CPV 2008.
2 No de enlaces entre una PSC y el CPV 2008 a trav´s de PO.
e
3 Ganancia de expresividad en t´rminos porcentuales.
e
4-Especificaci´n de un modelo
o
El nuevo vocabulario controlado V psc , enlazado con Vpsc ,
dispone de #V psc t´rminos.
e
La ganancia se calcula como:
% = { (#V psc + #V)/#V − 1} ∗ 100 (1)
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
72. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo
3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
o
1 No de enlaces entre una PSC y el CPV 2008.
2 No de enlaces entre una PSC y el CPV 2008 a trav´s de PO.
e
3 Ganancia de expresividad en t´rminos porcentuales.
e
4-Especificaci´n de un modelo
o
El nuevo vocabulario controlado V psc , enlazado con Vpsc ,
dispone de #V psc t´rminos.
e
La ganancia se calcula como:
% = { (#V psc + #V)/#V − 1} ∗ 100 (1)
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
73. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo
5-Ejecuci´n de un experimento piloto
o
Sea V = {1, 2, 3} y Vpsc = {A, B, C , D, E }.
El conjunto de pares enlaces es: {(A, 1), (B, 2), (C , 1)(E , 2)}.
Por tanto, el conjunto V psc = {A, B, C , E } y el % de
ganancia en expresividad ser´:
a
% = { (4 + 3)/3 − 1} ∗ 100 = 133 (2)
6-Esquematizaci´n de los pasos a seguir
o
1 Extracci´n de consultas en SPARQL para establecer el n´mero
o u
de enlaces entre las mismas.
2 Procesamiento de los resultados mediante un script para
generar los resultados.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
74. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo
5-Ejecuci´n de un experimento piloto
o
Sea V = {1, 2, 3} y Vpsc = {A, B, C , D, E }.
El conjunto de pares enlaces es: {(A, 1), (B, 2), (C , 1)(E , 2)}.
Por tanto, el conjunto V psc = {A, B, C , E } y el % de
ganancia en expresividad ser´:
a
% = { (4 + 3)/3 − 1} ∗ 100 = 133 (2)
6-Esquematizaci´n de los pasos a seguir
o
1 Extracci´n de consultas en SPARQL para establecer el n´mero
o u
de enlaces entre las mismas.
2 Procesamiento de los resultados mediante un script para
generar los resultados.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
75. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo
Otros
7-Determinaci´n del tama˜o muestral (ya indicado en el
o n
punto 1).
8-Revisi´n de las decisiones anteriores.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
76. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo-Resultados Parciales
Vpsc #Vpsc #V psc #V psc % real % real %
PO m´x.
a
CPV 2003 8323 462 8312 4,46 80,25 80,36
CN 2012 14552 2390 2390 23,07 23,07 140,50
CPC 2008 4408 4402 4403 42,50 42,51 42,56
CPA 2008 5429 5399 5410 52,12 52,23 52,41
ISIC v4 766 765 765 7,38 7,38 7,39
NAICS 2007 2328 2300 2300 22,20 22,20 22,47
NAICS 2012 2212 2186 2186 21,10 21,10 21,35
SITC v4 4017 3811 3820 36,79 36,88 38,78
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
77. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo-Resultados Totales
Total
Vpsc #Vpsc #V psc #V psc % real
% % real PO
m´x.
a
42035 21715 29586 209,66 285,66 405,86
A˜adiendo enlaces entre CPV 2008 y Product Ontology-PO
n
PO ∞ 10000 N/A 96,55 96,55 ∞
Total con vocabulario de Product Ontology
∞ 31715 39586 306,21 382,21 ∞
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
78. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo-Resultados
Figura: N´mero de Elementos y Enlaces entre las PSCs y el CPV 2008.
u
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
79. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo-Resultados
Figura: Ganancia en expresividad.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
80. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo-Resultados
Valoraci´n
o
1 Extensi´n del CPV 2008, 10357 t´rminos, hasta:
o e
21715 t´rminos, con enlaces entre las PSCs y el CPV 2008.
e
29586 t´rminos, con enlaces entre las PSCs y el CPV 2008 a
e
trav´s de PO.
e
2 Se establece un:
8,65 % y 6,64 % (PO) de enlaces exactos.
91,35 % y 93,36 % (PO) de enlaces autom´ticos.
a
3 Cifras de ganancia:
Real: 209,66 %.
Real con PO: 285,66 %
M´ximo: 405,86 %.
a
4 Los enlaces y la reconciliaci´n de entidades se realizan bajo un
o
umbral µ (n primeros resultados normalizados).
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
81. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo-Resultados
Figura: Evoluci´n N´mero de T´rminos.
o u e
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
82. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cuantitativo-Conclusiones
Puntos Clave
Aumento del vocabulario de entrada del CPV 2008 con
Linked Data.
Mejora de la expresividad para la realizaci´n de consultas en
o
SPARQL.
Incremento del n´mero de anuncios de licitaci´n a los que
u o
se puede acceder.
Establecimiento de una f´rmula para el c´lculo de la
o a
ganancia del enlazado de datos.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
83. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Cumplimiento de Criterios
Punto de Vista Cualitativo.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
84. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo
1-Definici´n de los objetivos del experimento
o
1 ¿El ciclo de vida seguido y los datos generados certifican la
aplicaci´n de buenas pr´cticas y principios de Linked Data?
o a
2 ¿Qu´ nivel del modelo de 5
e se puede establecer?
3 ¿Qu´ porcentaje de patrones de dise˜o se han aplicado en los datos
e n
generados?
4 ¿Los datos generados pueden pertenecer a la nube de datos
enlazados abiertos?
5 ¿Los datos generados pueden pertenecer a un registro CKAN?
6 ¿Se certifica el cumplimiento de los principios de Open Data?
7 ¿Se puede asegurar que los datos son enlazados y abiertos?
8 ¿Qu´ beneficios se obtienen del cumplimiento de estos objetivos?
e
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
85. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo
2-Selecci´n de una regla de asignaci´n de las unidades
o o
experimentales a las condiciones de estudio
1 Dataset RDF de los anuncios de licitaci´n p´blica.
o u
Boletines y Publicaciones oficiales: TED y BOE.
Plataformas de contrataci´n: AGE.
o
Servicios de terceros: Euroalert.net y Licitaciones.es
Basados en sem´ntica: LOTED.
a
2 Dataset RDF de las PSCs.
Publicaciones oficiales: UE, ONU, etc.
Servicios de terceros.
3 Dataset RDF de las organizaciones.
Boletines y Publicaciones oficiales: TED y BORME.
Plataformas de contrataci´n: AGE.
o
Servicios y BBDD de terceros.
Basadas en Open Data: OpenCorporates.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
86. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo
3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
o
1 Valor positivo, ⊕, si es un criterio que debe tener y se cumple
(173).
2 Valor negativo, , si es un criterio que debe tener y no se
cumple (0).
3 Valor no aplicable, , si es un criterio que se desconoce, que
se solapa con otro o no est´ asociado a ese enfoque (23).
a
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
87. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo
Dise˜o de Tablas de Validaci´n
n o
T 1 -Tabla de Validaci´n de Caracter´
o ısticas Linked Data.
T 2 -. . . de Linked Data Patterns.
T 3 -. . . de Principios de Linked Data.
3
T1 -. . . del Modelo .
T 4 -. . . de Principios de Open Data.
4
T1 -. . . sobre Caracter´
ısticas de Open Data.
T 5 -. . . sobre Caracter´
ısticas para pertenecer a la nube de
Linking Open Data.
T 6 -. . . para registrar el dataset en CKAN.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
88. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo
4-Especificaci´n de un modelo
o
No aplicable.
5-Ejecuci´n de un experimento piloto
o
Valoraci´n inicial con s´lo un conjunto de datos.
o o
6-Esquematizaci´n de los pasos a seguir
o
1 Establecimiento del modelo de referencia, con los valores
admitidos.
2 Revisi´n uno a uno de los criterios.
o
3 Agregaci´n de los resultados y valoraciones.
o
4 Extracci´n de estad´
o ısticas, contraste de hip´tesis, validaci´n y
o o
evaluaci´n.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
89. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo
4-Especificaci´n de un modelo
o
No aplicable.
5-Ejecuci´n de un experimento piloto
o
Valoraci´n inicial con s´lo un conjunto de datos.
o o
6-Esquematizaci´n de los pasos a seguir
o
1 Establecimiento del modelo de referencia, con los valores
admitidos.
2 Revisi´n uno a uno de los criterios.
o
3 Agregaci´n de los resultados y valoraciones.
o
4 Extracci´n de estad´
o ısticas, contraste de hip´tesis, validaci´n y
o o
evaluaci´n.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
90. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo
4-Especificaci´n de un modelo
o
No aplicable.
5-Ejecuci´n de un experimento piloto
o
Valoraci´n inicial con s´lo un conjunto de datos.
o o
6-Esquematizaci´n de los pasos a seguir
o
1 Establecimiento del modelo de referencia, con los valores
admitidos.
2 Revisi´n uno a uno de los criterios.
o
3 Agregaci´n de los resultados y valoraciones.
o
4 Extracci´n de estad´
o ısticas, contraste de hip´tesis, validaci´n y
o o
evaluaci´n.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
91. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo
Otros
7-Determinaci´n del tama˜o muestral (ya indicado en el
o n
punto 1).
8-Revisi´n de las decisiones anteriores.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
92. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo-Resultados
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
93. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo-Resultados
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
94. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo-Resultados
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
95. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo-
Resultados en % ⊕ entre aplicables
Versi´n
o ⊕ Total % ⊕ entre aplicables
Referencia 173 0 23 196 100
Anuncios de Licitaci´n
o
TED 32 12 152 “ 72,72
Plataforma de 35 9 152 “ 79,54
Contrataci´n
o
BOE 30 12 154 “ 71,42
Servicios Ex- 25 14 157 “ 64,10
ternos
LOTED 92 34 70 “ 73,01
MOLDEAS 121 10 65 “ 92,36
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
96. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo-
Resultados en % ⊕ entre aplicables
Versi´n
o ⊕ Total % ⊕ entre aplicables
Referencia 173 0 23 196 100
Cat´logo de Clasificaciones de Productos
a
CSV/ 25 12 159 “ 67,56
MSExcel
Servicios on- 21 21 154 “ 50
line
MOLDEAS 166 7 23 “ 93,86
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
97. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo-
Resultados en % ⊕ entre aplicables
Versi´n
o ⊕ Total % ⊕ entre aplicables
Referencia 173 0 23 196 100
Organizaciones
TED 20 9 167 “ 68,96
Plataforma de 35 10 151 “ 77,77
Contrataci´n
o
BORME 23 1 172 “ 95,83
Servicios Ex- 20 20 156 “ 50
ternos
BBDD exter- 12 9 175 “ 57,14
na
Open Corpo- 85 33 78 “ 72,03
rates
MOLDEAS 121 10 65 “ 92,36
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
98. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo-Resultados
Valoraci´n
o
1 El ciclo de vida asegura los principios y criterios de Linked
Data y Open Data.
2 Se establece un nivel de 5 para los datasets transformados.
3 Se ha aplicado un alto porcentaje de patrones de dise˜o,
n
calidad impl´
ıcita para la reutilizaci´n de datos.
o
4 Los datasets transformados pueden pertenecer a la nube de
Linking Open Data y a un registro CKAN.
5 En general, el enfoque de MOLDEAS mejora cualitativamente
la informaci´n y datos respecto a otros enfoques.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
99. MOLDEAS
Resultados y Evaluaci´n
o
Expresividad y Cumplimiento de Criterios
Punto de Vista Cualitativo-Conclusiones
Puntos Clave
Mejora cualitativa la informaci´n y datos.
o
Aumento de la visi´n global de los datos, expresividad y
o
estructuraci´n.
o
Aplicaci´n intensiva de est´ndares.
o a
Incremento del conocimiento en el dominio de e-Procurement.
Impulso de la reutilizaci´n de la informaci´n y datos, mayor
o o
poder de redistribuci´n.
o
Minimizaci´n de restricciones tecnol´gicas.
o o
Minimizaci´n de aspectos discriminatorios.
o
Aumento de la transparencia, inclusi´n y responsabilidad.
o
Alineaci´n con las actuales propuestas estrat´gicas de futuro.
o e
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
100. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
101. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
Objetivos Generales
Consumir los datos enlazados desde un lenguaje de programaci´n.
o
Crear un sistema de recuperaci´n de informaci´n.
o o
1-Definici´n de los objetivos del experimento
o
1 ¿Es posible implementar un sistema de recuperaci´n de informaci´n
o o
utilizando datos enlazados?
2 ¿Es posible explotar las relaciones sem´nticas establecidas para
a
mejorar la recuperaci´n de informaci´n?
o o
3 ¿Cu´l es el mejor enfoque para la recuperaci´n de informaci´n en
a o o
los anuncios de licitaci´n?
o
4 ¿C´mo afectan los resultados en la implementaci´n actual del
o o
sistema MOLDEAS?
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
102. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
Objetivos Generales
Consumir los datos enlazados desde un lenguaje de programaci´n.
o
Crear un sistema de recuperaci´n de informaci´n.
o o
1-Definici´n de los objetivos del experimento
o
1 ¿Es posible implementar un sistema de recuperaci´n de informaci´n
o o
utilizando datos enlazados?
2 ¿Es posible explotar las relaciones sem´nticas establecidas para
a
mejorar la recuperaci´n de informaci´n?
o o
3 ¿Cu´l es el mejor enfoque para la recuperaci´n de informaci´n en
a o o
los anuncios de licitaci´n?
o
4 ¿C´mo afectan los resultados en la implementaci´n actual del
o o
sistema MOLDEAS?
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
103. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
2-Selecci´n de una regla de asignaci´n de las unidades
o o
experimentales a las condiciones de estudio
1 Unidad experimental de este estudio ser´ un repositorio RDF.
a
2 Base documental D constituida por 1 mill´n de anuncios de
o
licitaci´n.
o
3 Vocabulario controlado, V, del CPV 2008, formado por 10357
c´digos/t´rminos distintos.
o e
4 Cada documento d ∈ D, etiquetado con al menos un c´digo
o
v ∈ V.
5 11 consultas, Qstr , proporcionadas por Euroalert.net.
6 Las medidas de evaluaci´n dependen del no de c´digos CPV
o o
generados por MOLDEAS.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
104. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
Qi Consulta de Usuario-Qstr No de C´digos
o
CPV relevantes-
i
#Qcpv
Q1 ... 463
Q2 ... 35
Q3 ... 7
Q4 ... 26
Q5 ... 277
...
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
105. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
Qi Consulta de Usuario-Qstr No de C´digos
o
CPV relevantes-
i
#Qcpv
Q6 ... 1
Q7 ... 117
Q8 ... 13
Q9 ... 10
Q10 ... 173
Q11 ... 13
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
106. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
M´todo
e Descripci´n o Tecnolog´
ıa
M1 Se indexan las descripciones de los Apache Lucene y Solr
c´digos CPV y proceso de b´sque-
o u
da sint´ctica de las consultas Qi .
a
M2 Se extraen una serie de c´digos o M 1 + ponderaci´n o
CPV candidatos seg´n jerarqu´
u ıa. broader/ narrower
M3 . . . seg´n jerarqu´ con Spreading
u ıa M 1 + ONTOSPREAD
Activation.
M4 . . . seg´n hist´rico de las relaciones
u o M 1 + Apache Mahout
entre c´digos de los anuncios pre-
o
vios.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
107. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
o
1 Para cada consulta se recogen los c´digos CPV 2008
o
generados.
2 Se comparan con los indicados en las consultas Qi .
3 Se obtienen las medidas Precisi´n, Recall, Accuracy y
o
Specificity (PRAS).
5-Ejecuci´n de un experimento piloto
o
En primer lugar se realiza una consulta para verificar el proceso de
b´squeda en cada m´todo y la obtenci´n de medidas.
u e o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
108. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
o
1 Para cada consulta se recogen los c´digos CPV 2008
o
generados.
2 Se comparan con los indicados en las consultas Qi .
3 Se obtienen las medidas Precisi´n, Recall, Accuracy y
o
Specificity (PRAS).
5-Ejecuci´n de un experimento piloto
o
En primer lugar se realiza una consulta para verificar el proceso de
b´squeda en cada m´todo y la obtenci´n de medidas.
u e o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
109. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
6-Esquematizaci´n de los pasos a seguir
o
1 A cada consulta Qstr , identificada como Qi , se le aplica un
m´todo M i , devuelve al #Qcpv elementos.
e i
M i
2 Cada conjunto resultado Qcpv se compara con el conjunto
i
esperado Qcpv con un script.
3 Se generan los valores PRAS para cada m´todo M i y consulta
e
de entrada Qi .
Otros
1 4-Especificaci´n de un modelo (N/A).
o
2 7-Determinaci´n del tama˜o muestral (ya indicado en el
o n
punto 1).
3 8-Revisi´n de las decisiones anteriores.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
110. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos
6-Esquematizaci´n de los pasos a seguir
o
1 A cada consulta Qstr , identificada como Qi , se le aplica un
m´todo M i , devuelve al #Qcpv elementos.
e i
M i
2 Cada conjunto resultado Qcpv se compara con el conjunto
i
esperado Qcpv con un script.
3 Se generan los valores PRAS para cada m´todo M i y consulta
e
de entrada Qi .
Otros
1 4-Especificaci´n de un modelo (N/A).
o
2 7-Determinaci´n del tama˜o muestral (ya indicado en el
o n
punto 1).
3 8-Revisi´n de las decisiones anteriores.
o
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
111. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos-
¯
Resultados Agregados (X )
M´todo
e Precisi´n
o Recall Accuracy Specificity
1
M 0, 28 0, 26 0, 99 1, 00
M2 0, 11 0, 11 0, 98 0, 99
M3 0, 23 0, 23 0, 99 1, 00
M4 0, 03 0, 03 0, 96 0, 98
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
112. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos-Resultados
Valoraci´n
o
1 El tipo y formato de una fuente de datos no es impedimento
para la construcci´n de servicios en un dominio determinado.
o
2 Las relaciones sem´nticas de los datos se pueden explotar para
a
recuperar informaci´n.
o
3 El enfoque tradicional sint´ctico, M 1 , se comporta m´s
a a
cercano a las expectativas del usuario.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
113. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Consumo de Datos Enlazados Abiertos-Conclusiones
Principal Punto Clave
La casu´ıstica de un sistema de soporte a la decisi´n o de
o
recuperaci´n a la informaci´n en e-Procurement es muy
o o
compleja, existen muchas variables de informaci´n que se
o
pueden optimizar.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS
114. MOLDEAS
Resultados y Evaluaci´n
o
Sistema MOLDEAS
Sistema MOLDEAS
Rendimiento de Consultas en SPARQL.
ıa ´
Jose Mar´ Alvarez Rodr´
ıguez MOLDEAS