• Save
PhD Presentation
Upcoming SlideShare
Loading in...5
×
 

PhD Presentation

on

  • 1,022 views

Defence of the PhD about eProcurement and Linked Data made by Jose María Alvarez, supervised by Jose Emilio Labra at the University of Oviedo.

Defence of the PhD about eProcurement and Linked Data made by Jose María Alvarez, supervised by Jose Emilio Labra at the University of Oviedo.

Statistics

Views

Total Views
1,022
Views on SlideShare
946
Embed Views
76

Actions

Likes
0
Downloads
0
Comments
0

4 Embeds 76

http://www.josemalvarez.es 68
http://red.gnoss.com 5
http://www.linkedin.com 2
https://www.linkedin.com 1

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

PhD Presentation PhD Presentation Presentation Transcript

  • MOLDEAS M´todos Sem´nticos de Reutilizaci´n de Datos e a o Abiertos Enlazados en las Licitaciones P´blicas u Tesis Doctoral presentada por ıa ´ Jose Mar´ Alvarez Rodr´ ıguez Dirigida por Profesor Doctor D. Jos´ Emilio Labra Gayo e Sistemas y Servicios Inform´ticos para Internet a Departamento de Inform´tica a Universidad de Oviedo Oviedo, 14 de Junio de 2012 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS 1 Objeto de la Investigaci´n o 2 Marco te´rico y conceptual o 3 Marco metodol´gico o 4 Resultados y Evaluaci´n o 5 Conclusiones ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o 1 Objeto de la Investigaci´n. o Formulaci´n del Problema. o Justificaci´n del Estudio. o Objetivo General. Objetivos Espec´ıficos. Hip´tesis. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Formulaci´n del Problema o Problema ¿Por qu´ aplicar m´todos sem´nticos y los principios de Linked e e a Data y Open Data al dominio de las licitaciones p´blicas? u Contexto ¿Cu´les son las licitaciones p´blicas sobre ((construcci´n de puentes a u o y carreteras)) publicadas en la regi´n de B´lgica cuyo idioma es o e holand´s durante 2011 y cuyo importe est´ entre 100 y 200K e a euros? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Formulaci´n del Problema o Problema ¿Por qu´ aplicar m´todos sem´nticos y los principios de Linked e e a Data y Open Data al dominio de las licitaciones p´blicas? u Contexto ¿Cu´les son las licitaciones p´blicas sobre ((construcci´n de puentes a u o y carreteras)) publicadas en la regi´n de B´lgica cuyo idioma es o e holand´s durante 2011 y cuyo importe est´ entre 100 y 200K e a euros? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Justificaci´n del Estudio o Motivaci´n o Profundizaci´n en el ´rea de estudio. o a Corriente de investigaci´n en continua evoluci´n. o o Investigaci´n e Innovaci´n. o o Servicios de valor a˜adido. n Sector estrat´gico en las Administraciones P´blicas (AAPP). e u ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Justificaci´n del Estudio o Motivaci´n Cient´ o ıfica Formalizaci´n del conocimiento de un dominio. o Aplicaci´n de modelos est´ndar a un dominio. o a Integraci´n de fuentes de datos. o Mejora y consolidaci´n de las t´cnicas actuales. o e Generaci´n de conocimiento, nuevos datos y enfoques. o Aportaciones a otros investigadores, comunidad. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Justificaci´n del Estudio o Motivaci´n Tecnol´gica o o Aplicaci´n de nuevas soluciones t´cnicas. o e Gesti´n avanzada de la informaci´n y datos. o o Mejora de los procesos de acceso a la informaci´n. o Cobertura a las necesidades de la cadena de valor del proceso administrativo. Impulso de un sector trascendente: econ´mico, social, o financiero, etc. Generaci´n de nuevas oportunidades de negocio. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Objetivo General Sem´ntica + Linked Data + Open Data a Aplicaci´n de la tecnolog´ y m´todos sem´nticos al dominio de la o ıa e a contrataci´n p´blica electr´nica para dar soporte a los principios de o u o las iniciativas de Linked Data y Open Data. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Objetivos Espec´ ıficos 1 Estudiar, analizar y valorar: Contrataci´n P´blica y e-Procurement. o u Web Sem´ntica, Linked Data y Open Data. a 2 Definir m´todos basados en sem´ntica para gestionar la e a informaci´n de los anuncios de licitaci´n. o o 3 Implementar y reutilizar los componentes software. 4 Promover el uso de est´ndares, la reutilizaci´n de informaci´n a o o y los modelos de conocimiento compartido. 5 Aplicar los m´todos sem´nticos definidos al contexto de e a e-Procurement. 6 Establecer un conjunto de prueba y validaci´n. o 7 Difundir, formar y transferir la tecnolog´ y conocimiento. ıa ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Hip´tesis o Hip´tesis de la Investigaci´n o o Es posible mejorar el acceso a la informaci´n contenida en los o anuncios de licitaci´n de las distintas instituciones p´blicas o u europeas, tanto en t´rminos cuantitativos como cualitativos, e mediante m´todos sem´nticos basados en aplicar y cumplir los e a principios de la iniciativa Linked Data y de la misma forma mantener y favorecer los principios de la corriente Open Data. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Hip´tesis o T´rminos cualitativos e ¿Se puede mejorar el acceso a la informaci´n y datos utilizando o sem´ntica? a T´rminos cuantitativos e ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n u o utilizando sem´ntica? a Aplicar, cumplir, mantener y favorecer ¿Se puede realizar este enfoque cumpliendo con los principios y corrientes actuales? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Hip´tesis o T´rminos cualitativos e ¿Se puede mejorar el acceso a la informaci´n y datos utilizando o sem´ntica? a T´rminos cuantitativos e ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n u o utilizando sem´ntica? a Aplicar, cumplir, mantener y favorecer ¿Se puede realizar este enfoque cumpliendo con los principios y corrientes actuales? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Objeto de la Investigaci´n o Hip´tesis o T´rminos cualitativos e ¿Se puede mejorar el acceso a la informaci´n y datos utilizando o sem´ntica? a T´rminos cuantitativos e ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n u o utilizando sem´ntica? a Aplicar, cumplir, mantener y favorecer ¿Se puede realizar este enfoque cumpliendo con los principios y corrientes actuales? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o 2 Marco te´rico y conceptual o Contrataci´n P´blica y e-Procurement. o u Web Sem´ntica. a Linked Data y Open Data. e-Procurement y Sem´ntica. a ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o e-Procurement Sector estrat´gico. 17 % del PIB. e Impulsado desde la Uni´n Europea (adopci´n paulatina). o o Plan de Acci´n 2004 y Europa 2020. o M´ltiples fases y etapas (mara˜a de requisitos t´cnicos). u n e Informaci´n y datos valiosos. Sociedad de la Informaci´n. o o Marco legal definido y en evoluci´n (homogeneizaci´n). o o 16K anuncios de licitaci´n nuevos al d´ o ıa. Necesidad de impulso de la participaci´n de las peque˜as y o n medianas empresas (PYMES). ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Fases de e-Procurement Figura: Diagrama de Complejidad y Fases de e-Procurement. Fuente: Uni´n Europea. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Definici´n de e-Procurement o Contrataci´n P´blica Electr´nica o u o La contrataci´n electr´nica es un t´rmino general utilizado para o o e designar la sustituci´n de los procedimientos basados en soporte de o papel por el tratamiento y la comunicaci´n mediante TIC a lo o largo de toda la cadena de contrataci´n p´blica. o u Publicaci´n de los anuncios de licitaci´n. o o Suministro del pliego de condiciones. Presentaci´n de ofertas. o Adjudicaci´n. o Facturaci´n y pago. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Definici´n de e-Procurement o Contrataci´n P´blica Electr´nica o u o La contrataci´n electr´nica es un t´rmino general utilizado para o o e designar la sustituci´n de los procedimientos basados en soporte de o papel por el tratamiento y la comunicaci´n mediante TIC a lo o largo de toda la cadena de contrataci´n p´blica. o u Publicaci´n de los anuncios de licitaci´n. o o Suministro del pliego de condiciones. Presentaci´n de ofertas. o Adjudicaci´n. o Facturaci´n y pago. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Silos de Informaci´n o Figura: Silos de Informaci´n en e-Procurement de la Uni´n Europea. o o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Multiling¨ismo y multiculturalidad. u Figura: Concepto “mesitas”, “mesas de caf´”, etc. e ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Acciones de la Uni´n Europea o Tenders Electronic Daily (TED) y Sistema de Informaci´n o para la contrataci´n p´blica europea (SIMAP). o u Clasificaciones Est´ndar de Productos y Servicios (CPV). a Clasificaci´n de regiones (NUTS). o Plataformas de Contrataci´n. o Proyectos destacados: 1 e-Certis. 2 Fiscalis 2013. 3 ePRIOR. 4 PEPPOL-Pan-European Public Procurement Online. 5 STORK -Secure idenTity acrOss euRope linKed. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Acciones de la Uni´n Europea o Tenders Electronic Daily (TED) y Sistema de Informaci´n o para la contrataci´n p´blica europea (SIMAP). o u Clasificaciones Est´ndar de Productos y Servicios (CPV). a Clasificaci´n de regiones (NUTS). o Plataformas de Contrataci´n. o Proyectos destacados: 1 e-Certis. 2 Fiscalis 2013. 3 ePRIOR. 4 PEPPOL-Pan-European Public Procurement Online. 5 STORK -Secure idenTity acrOss euRope linKed. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Modelo de Informaci´n o TED (XML-Schema). CODICE (XML-Schema). opXML (XML-Schema). ... Valoraci´n o Sobre-especificaci´n. o Escasa convergencia (nombrado, especificidad, etc.) e interoperabilidad. Falta de consenso. Replicaci´n de esfuerzos. o Necesidades transversales: publicaci´n de informaci´n, gesti´n o o o de pagos, etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Modelo de Informaci´n o TED (XML-Schema). CODICE (XML-Schema). opXML (XML-Schema). ... Valoraci´n o Sobre-especificaci´n. o Escasa convergencia (nombrado, especificidad, etc.) e interoperabilidad. Falta de consenso. Replicaci´n de esfuerzos. o Necesidades transversales: publicaci´n de informaci´n, gesti´n o o o de pagos, etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Principales Problemas Puntos de Mejora Dispersi´n de la informaci´n. o o Mismo anuncio en m´s de una fuente. a Heterogeneidad de los formatos de los anuncios. Diversidad de formatos de explotaci´n. o Multiling¨ismo y multiculturalidad. u Otros: almacenamiento, etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Web Sem´ntica a Web Sem´ntica a Caracter´ ısticas Principales Modelo de datos est´ndar para representar recursos. Grafo a RDF (sujeto, predicado, objeto). Formalizaci´n del conocimiento mediante ontolog´ basadas o ıas en l´gica (DL). o Facilidad para su extensi´n y crecimiento din´mico. o a Aplicaci´n de est´ndares en representaci´n (OWL2) y acceso o a o (SPARQL). Baja intrusividad con sistemas existentes. Mejora de la interoperabilidad e integraci´n. o Soporte para la creaci´n de sistemas basados en conocimiento. o Gran variedad de vocabularios, conjuntos de datos, etc., en distintos dominios. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Datos Enlazados Linked Data Principios 1 Use URIs as names for things. 2 When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL). 3 Include links to other URIs. Figura: Modelo 5 (W3C). 4 Use HTTP URIs. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Datos Enlazados Linked Data Ventajas Realizaci´n pr´ctica de la Web Sem´ntica. o a a Identificaci´n unica, uso de HTTP URIs. o ´ Modelo y acceso est´ndar. a Enriquecimiento de recursos, creaci´n de enlaces. o Estructuraci´n, modelo est´ndar RDF. o a Expresividad, vocabularios y datasets. Reutilizaci´n de informaci´n y datos. o o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Datos Abiertos Open Data Los 8 principios Data Must Be Complete. . . . Primary. . . . Timely. . . . Accessible. . . . Machine processable. Access Must Be Non-Discriminatory. Data Formats Must Be Non-Proprietary. Data Must Be License-free. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Datos Abiertos Open Data Ventajas Inclusi´n. o Transparencia. Responsabilidad. Reutilizaci´n de informaci´n del sector p´blico (PSI). o o u Generaci´n de m´ltiples vistas de los datos. o u Creaci´n de servicios de valor a˜adido. o n Integraci´n de fuentes de datos. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Datos Abiertos Iniciativas Open Data Figura: Datos Abiertos en Espa˜a. n Fuente: http://datos.gob.es ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Datos Abiertos Enlazados Linking Open Data Figura: Linking Open Data cloud. 203 datasets, 25 billones de tripletas RDF y unos 395 millones de enlaces entre los datos (Sept. 2010). Dominios: Media, Geographic, Government (42,09 %), Publications, Cross-domain, Life sciences, etc. (Ago. 2011). 393 datasets (Jun. 2012). Fuente: R. Cyganiak & A. Jentzsch. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Datos Abiertos Enlazados Ciclos de Vida en Linked Data Linked Data Design Considerations [1]. Linked Data Patterns [2]. Grupo de trabajo del W3C-Government Linked Data (GLD) [3]: 1 Publishing Open Government Data [4] y Best Practices [5,6]. 2 Government Linked Data-Life Cycle y Linked Data Cookbook [7]. LOD2 Stack [8], proyecto europeo LOD2. Toward a Basic Profile for Linked Data [9], IBM y W3C. Metodolog´ BCN y UNIOVI [10]. ıa Linked Open Data: The Essentials [11]. Otros: por pa´ (UK, EEUU, etc.), empresa (Talis Platform, ıs TopQuadrant, etc.), etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Datos Abiertos Enlazados Ciclos de Vida en Linked Data Problemas encontrados Marem´gnum recetas/metodolog´ a ıas/buenas pr´cticas. a Diferentes niveles de abstracci´n y mezcla en las tareas. o Baja definici´n de responsables en las tareas. o Baja especificaci´n de resultados de las tareas. o Ajuste a casu´ ıstica concreta. Especificaciones te´ricas o en desarrollo. o Ausencia de relaci´n entre las mismas. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Contraci´n P´blica Electr´nica y Sem´ntica o u o a e-Procurement y Sem´ntica a Actividades e Iniciativas Taxonom´ de productos y servicios: CPA, CPC, CPV, ıas NAICS, etc. Vocabularios XML de negocio: ebXML, XBRL, SBVR o SCOR. Vocabularios basados en sem´ntica: GoodRelations, a ProductOntology, Organizations ontology, FOAF, etc. Ontolog´ Rep´blica Checa y proyecto LOTED. ıas: u Proyectos europeos: LOD2 (WP9), LATC, PlanetData, etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Resumen Puntos Clave ...a considerar... e-Procurement dominio heterog´neo: informaci´n, datos, e o proveedores, etc. Necesidades de identificaci´n, integraci´n, modelo est´ndar, o o a etc. Los principios de la Web Sem´ntica se ajustan a estas a necesidades. Linked Data y Open Data corrientes actuales estrat´gicas. e Ausencia de un ciclo de vida concreto. Escasas iniciativas en e-Procurement + Sem´ntica. a ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Resumen Soluci´n o MOLDEAS Methods On Linked Data for E-procurement Applying Semantics Definici´n ciclo de vida para datos abiertos enlazados. o Implementaci´n de los componentes software necesarios. o Pruebas y Validaci´n. o Aplicaci´n al dominio de e-Procurement. o Experimentaci´n. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco te´rico y conceptual o Resumen Soluci´n o MOLDEAS Methods On Linked Data for E-procurement Applying Semantics Definici´n ciclo de vida para datos abiertos enlazados. o Implementaci´n de los componentes software necesarios. o Pruebas y Validaci´n. o Aplicaci´n al dominio de e-Procurement. o Experimentaci´n. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o 3 Marco metodol´gico. o Metodolog´ de la Investigaci´n. ıa o Definici´n del Ciclo de Vida para Datos Enlazados Abiertos. o Aplicaci´n del Ciclo de Vida al e-Procurement. o Creaci´n del sistema MOLDEAS. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Metodolog´ de la Investigaci´n ıa o Tipo Investigaci´n cuantitativa con base en evidencias emp´ o ıricas. Car´cter descriptivo y comparativo. a Dise˜o n 1 Definici´n Ciclo de Vida de Datos Enlazados Abiertos. o 2 Aplicaci´n al dominio de e-Procurement. o 3 Creaci´n del sistema MOLDEAS. o 4 Definici´n y ejecuci´n de experimentos. o o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Metodolog´ de la Investigaci´n ıa o Tipo Investigaci´n cuantitativa con base en evidencias emp´ o ıricas. Car´cter descriptivo y comparativo. a Dise˜o n 1 Definici´n Ciclo de Vida de Datos Enlazados Abiertos. o 2 Aplicaci´n al dominio de e-Procurement. o 3 Creaci´n del sistema MOLDEAS. o 4 Definici´n y ejecuci´n de experimentos. o o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Metodolog´ de la Investigaci´n ıa o Universo de Estudio Tres principales conjuntos de datos seleccionados: 1 Datos de anuncios de licitaci´n (1 Mill´n) provistos por o o Euroalert.net desde 2008 a 2011. 2 Cat´logos de Clasificaciones de Productos y Servicios (9: a CPV, CPA, NAICS, etc.) provistos por UE, ONU, EEUU, etc. 3 Organizaciones, personas y pa´ (clasificaci´n NUTS de la ıses o UE). ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Definici´n del Ciclo de Vida para Datos Enlazados Abiertos o Visi´n General o Figura: Procesos del Ciclo de Vida de Datos Enlazados Abiertos. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Definici´n del Ciclo de Vida para Datos Enlazados Abiertos o Visi´n Detallada-Procesos y M´todos o e ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Consideraciones Generales Procesos M´todos de Producci´n y Consumo dependiente del dataset. e o M´todos de Publicaci´n y Validaci´n comunes. e o o Conjuntos de Datos Anuncios de licitaci´n (PPN). o Clasificaciones est´ndar de productos y servicios (PSCs). a Organizaciones, personas y pa´ ıses. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Consideraciones Generales Procesos M´todos de Producci´n y Consumo dependiente del dataset. e o M´todos de Publicaci´n y Validaci´n comunes. e o o Conjuntos de Datos Anuncios de licitaci´n (PPN). o Clasificaciones est´ndar de productos y servicios (PSCs). a Organizaciones, personas y pa´ ıses. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Resultados Anuncios de Licitaci´n o No de Elementos Tripletas PPN 2008 112843 677058 PPN 2009 399766 2398601 PPN 2009 431813 2590880 PPN 2011 67044 402264 Cat´logo de Anuncios de Licitaci´n (total) a o PPNs 1011466 6068803 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Clasificaciones Est´ndar de Productos y Servicios a Clasificaci´no Acr´nimo o Organismo Common Procurement Vocabulary, (2003 y CPV UE 2008) Combined Nomenclature 2012 (desde 1995) CN “ Central Product Classification, version 2 CPC ... (2008) Clasificaci´n de Productos por Actividad o CPA “ (2008) International Standard Industrial Classifica- ISIC ONU tion of All Economic Activities, Rev.4 North American Industry Classification Sys- NAICS EEUU tem 2007 y 2012 Standard International Trade Classification, SITC ONU Revision 4 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Clasificaciones Est´ndar de Productos y Servicios a Figura: Enlaces entre las distintas Clasificaciones Est´ndar de Productos a y Servicios. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Resultados-I PSC # Tripletas Links Links CPV 2008 CPV 2003 8323 546135 8322 462 (del CPV 2008 al 2003) CPV 2008 10357 803311 10355 N/A CN 2012 14552 137484 2590 2390 CPC 2008 4408 100819 4408 4375 y 1503 (ex- actos) CPA 2008 5429 92749 5429 5399 ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Resultados-II PSC # Tripletas Links Links CPV 2008 ISIC v4 766 18986 766 765 NAICS 2007 2328 36292 2328 2300 NAICS 2012 2212 35390 2212 2186 SITC v4 4017 70887 3941 3811 Cat´logo de Clasificaciones Est´ndar de Productos (total) a a PSCs 52392 1842053 40351 23191 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Organizaciones, personas y pa´ ıses Figura: Organizations Ontology del W3C. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Resultados Dataset # Tripletas Enlaces exter- nos Organizaciones 50000 1150020 50000 (pa´ ıses) Personas 50000 900219 50000 (pa´ ıses) Pa´ ıses 246 1756 1779 Organizaciones, Personas y Pa´ ıses (total) Agregado 100246 2051995 101779 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Sistema MOLDEAS MOLDEAS y los procesos del Ciclo de Vida Figura: Visi´n Funcional de MOLDEAS y los procesos del Ciclo de Vida o de Linked Data. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Sistema MOLDEAS MOLDEAS web (REST+Jquery) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Sistema MOLDEAS MOLDEAS web-Resultados (Jquery+Exhibit) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Marco metodol´gico o Sistema MOLDEAS MOLDEAS-Linked Data Frontend (Pubby) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o 4 Resultados y Evaluaci´n. o Metodolog´ ıa. Expresividad y Cumplimiento de Criterios. 1 Punto de Vista Cuantitativo. 2 Punto de Vista Cualitativo. Sistema MOLDEAS. 1 Consumo de Datos Enlazados Abiertos. 2 Rendimiento de Consultas en SPARQL. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Metodolog´ ıa Pasos de ejecuci´n o 1 Definici´n de los objetivos del experimento. o 2 Selecci´n de una regla de asignaci´n de las unidades experimentales o o a las condiciones de estudio. Cualitativos: tipo de entorno hardware y software, etc. Cuantitativos: tama˜o de la muestra, de la memoria y n´mero n u de posibilidades de expresar una consulta. 3 Especificaci´n de las medidas de trabajo en cuanto a la respuesta. o 4 Especificaci´n de un modelo. o 5 Ejecuci´n de un experimento piloto. o 6 Esquematizaci´n de los pasos a seguir. o 7 Determinaci´n del tama˜o muestral. o n 8 Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Visi´n del experimento o Punto de Vista Cuantitativo ¿Cu´l es la posibilidad de uso de datos enlazados para facilitar el a acceso a un mayor n´mero de recursos relacionados con los u anuncios de licitaci´n? o Punto de Vista Cualitativo Evaluaci´n, grado de cumplimiento y comparaci´n con otros o o enfoques de: Principios de Open Data y Linked Data. Buenas pr´cticas. a Patrones de dise˜o. n Caracter´ısticas de pertenencia a la nube de datos enlazados y registro CKAN. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Visi´n del experimento o Punto de Vista Cuantitativo ¿Cu´l es la posibilidad de uso de datos enlazados para facilitar el a acceso a un mayor n´mero de recursos relacionados con los u anuncios de licitaci´n? o Punto de Vista Cualitativo Evaluaci´n, grado de cumplimiento y comparaci´n con otros o o enfoques de: Principios de Open Data y Linked Data. Buenas pr´cticas. a Patrones de dise˜o. n Caracter´ısticas de pertenencia a la nube de datos enlazados y registro CKAN. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Expresividad Punto de Vista Cuantitativo. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 1-Definici´n de los objetivos del experimento o 1 ¿Cu´l es la expresividad actual, en t´rminos de n´mero de a e u conceptos para realizar consultas, para el acceso a la informaci´n de anuncios de licitaci´n? o o 2 ¿Cu´l es la ventaja de uso de un modelo RDF para la a expresi´n y recuperaci´n de la informaci´n de los anuncios de o o o licitaci´n? o 3 ¿C´mo favorecen los datos enlazados el aumento de o expresividad en la ejecuci´n de consultas y por tanto facilitan o la recuperaci´n de los anuncios de licitaci´n? o o 4 ¿Cu´l es el beneficio real del uso de datos enlazados para a representar la informaci´n? o 5 ¿Se incurre en alg´n error al aumentar la expresividad? u ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 2-Selecci´n de una regla de asignaci´n de las unidades o o experimentales a las condiciones de estudio 1 Base documental D constituida por 1 mill´n de anuncios de o licitaci´n. o 2 Vocabulario controlado, V, del CPV 2008, formado por #V = 10357 c´digos/t´rminos distintos. o e 3 Cada documento d ∈ D, etiquetado con al menos un c´digo o v ∈ V. 4 9 Clasificaciones Est´ndar de Productos y Servicios. a 5 Clasificaci´n “puente”: ProductOntology (PO) o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 No de enlaces entre una PSC y el CPV 2008. 2 No de enlaces entre una PSC y el CPV 2008 a trav´s de PO. e 3 Ganancia de expresividad en t´rminos porcentuales. e 4-Especificaci´n de un modelo o El nuevo vocabulario controlado V psc , enlazado con Vpsc , dispone de #V psc t´rminos. e La ganancia se calcula como: % = { (#V psc + #V)/#V − 1} ∗ 100 (1) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 No de enlaces entre una PSC y el CPV 2008. 2 No de enlaces entre una PSC y el CPV 2008 a trav´s de PO. e 3 Ganancia de expresividad en t´rminos porcentuales. e 4-Especificaci´n de un modelo o El nuevo vocabulario controlado V psc , enlazado con Vpsc , dispone de #V psc t´rminos. e La ganancia se calcula como: % = { (#V psc + #V)/#V − 1} ∗ 100 (1) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 5-Ejecuci´n de un experimento piloto o Sea V = {1, 2, 3} y Vpsc = {A, B, C , D, E }. El conjunto de pares enlaces es: {(A, 1), (B, 2), (C , 1)(E , 2)}. Por tanto, el conjunto V psc = {A, B, C , E } y el % de ganancia en expresividad ser´: a % = { (4 + 3)/3 − 1} ∗ 100 = 133 (2) 6-Esquematizaci´n de los pasos a seguir o 1 Extracci´n de consultas en SPARQL para establecer el n´mero o u de enlaces entre las mismas. 2 Procesamiento de los resultados mediante un script para generar los resultados. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 5-Ejecuci´n de un experimento piloto o Sea V = {1, 2, 3} y Vpsc = {A, B, C , D, E }. El conjunto de pares enlaces es: {(A, 1), (B, 2), (C , 1)(E , 2)}. Por tanto, el conjunto V psc = {A, B, C , E } y el % de ganancia en expresividad ser´: a % = { (4 + 3)/3 − 1} ∗ 100 = 133 (2) 6-Esquematizaci´n de los pasos a seguir o 1 Extracci´n de consultas en SPARQL para establecer el n´mero o u de enlaces entre las mismas. 2 Procesamiento de los resultados mediante un script para generar los resultados. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo Otros 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Parciales Vpsc #Vpsc #V psc #V psc % real % real % PO m´x. a CPV 2003 8323 462 8312 4,46 80,25 80,36 CN 2012 14552 2390 2390 23,07 23,07 140,50 CPC 2008 4408 4402 4403 42,50 42,51 42,56 CPA 2008 5429 5399 5410 52,12 52,23 52,41 ISIC v4 766 765 765 7,38 7,38 7,39 NAICS 2007 2328 2300 2300 22,20 22,20 22,47 NAICS 2012 2212 2186 2186 21,10 21,10 21,35 SITC v4 4017 3811 3820 36,79 36,88 38,78 ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Totales Total Vpsc #Vpsc #V psc #V psc % real % % real PO m´x. a 42035 21715 29586 209,66 285,66 405,86 A˜adiendo enlaces entre CPV 2008 y Product Ontology-PO n PO ∞ 10000 N/A 96,55 96,55 ∞ Total con vocabulario de Product Ontology ∞ 31715 39586 306,21 382,21 ∞ ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Figura: N´mero de Elementos y Enlaces entre las PSCs y el CPV 2008. u ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Figura: Ganancia en expresividad. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Valoraci´n o 1 Extensi´n del CPV 2008, 10357 t´rminos, hasta: o e 21715 t´rminos, con enlaces entre las PSCs y el CPV 2008. e 29586 t´rminos, con enlaces entre las PSCs y el CPV 2008 a e trav´s de PO. e 2 Se establece un: 8,65 % y 6,64 % (PO) de enlaces exactos. 91,35 % y 93,36 % (PO) de enlaces autom´ticos. a 3 Cifras de ganancia: Real: 209,66 %. Real con PO: 285,66 % M´ximo: 405,86 %. a 4 Los enlaces y la reconciliaci´n de entidades se realizan bajo un o umbral µ (n primeros resultados normalizados). ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Figura: Evoluci´n N´mero de T´rminos. o u e ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Conclusiones Puntos Clave Aumento del vocabulario de entrada del CPV 2008 con Linked Data. Mejora de la expresividad para la realizaci´n de consultas en o SPARQL. Incremento del n´mero de anuncios de licitaci´n a los que u o se puede acceder. Establecimiento de una f´rmula para el c´lculo de la o a ganancia del enlazado de datos. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Cumplimiento de Criterios Punto de Vista Cualitativo. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 1-Definici´n de los objetivos del experimento o 1 ¿El ciclo de vida seguido y los datos generados certifican la aplicaci´n de buenas pr´cticas y principios de Linked Data? o a 2 ¿Qu´ nivel del modelo de 5 e se puede establecer? 3 ¿Qu´ porcentaje de patrones de dise˜o se han aplicado en los datos e n generados? 4 ¿Los datos generados pueden pertenecer a la nube de datos enlazados abiertos? 5 ¿Los datos generados pueden pertenecer a un registro CKAN? 6 ¿Se certifica el cumplimiento de los principios de Open Data? 7 ¿Se puede asegurar que los datos son enlazados y abiertos? 8 ¿Qu´ beneficios se obtienen del cumplimiento de estos objetivos? e ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 2-Selecci´n de una regla de asignaci´n de las unidades o o experimentales a las condiciones de estudio 1 Dataset RDF de los anuncios de licitaci´n p´blica. o u Boletines y Publicaciones oficiales: TED y BOE. Plataformas de contrataci´n: AGE. o Servicios de terceros: Euroalert.net y Licitaciones.es Basados en sem´ntica: LOTED. a 2 Dataset RDF de las PSCs. Publicaciones oficiales: UE, ONU, etc. Servicios de terceros. 3 Dataset RDF de las organizaciones. Boletines y Publicaciones oficiales: TED y BORME. Plataformas de contrataci´n: AGE. o Servicios y BBDD de terceros. Basadas en Open Data: OpenCorporates. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 Valor positivo, ⊕, si es un criterio que debe tener y se cumple (173). 2 Valor negativo, , si es un criterio que debe tener y no se cumple (0). 3 Valor no aplicable, , si es un criterio que se desconoce, que se solapa con otro o no est´ asociado a ese enfoque (23). a ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo Dise˜o de Tablas de Validaci´n n o T 1 -Tabla de Validaci´n de Caracter´ o ısticas Linked Data. T 2 -. . . de Linked Data Patterns. T 3 -. . . de Principios de Linked Data. 3 T1 -. . . del Modelo . T 4 -. . . de Principios de Open Data. 4 T1 -. . . sobre Caracter´ ısticas de Open Data. T 5 -. . . sobre Caracter´ ısticas para pertenecer a la nube de Linking Open Data. T 6 -. . . para registrar el dataset en CKAN. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 4-Especificaci´n de un modelo o No aplicable. 5-Ejecuci´n de un experimento piloto o Valoraci´n inicial con s´lo un conjunto de datos. o o 6-Esquematizaci´n de los pasos a seguir o 1 Establecimiento del modelo de referencia, con los valores admitidos. 2 Revisi´n uno a uno de los criterios. o 3 Agregaci´n de los resultados y valoraciones. o 4 Extracci´n de estad´ o ısticas, contraste de hip´tesis, validaci´n y o o evaluaci´n. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 4-Especificaci´n de un modelo o No aplicable. 5-Ejecuci´n de un experimento piloto o Valoraci´n inicial con s´lo un conjunto de datos. o o 6-Esquematizaci´n de los pasos a seguir o 1 Establecimiento del modelo de referencia, con los valores admitidos. 2 Revisi´n uno a uno de los criterios. o 3 Agregaci´n de los resultados y valoraciones. o 4 Extracci´n de estad´ o ısticas, contraste de hip´tesis, validaci´n y o o evaluaci´n. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 4-Especificaci´n de un modelo o No aplicable. 5-Ejecuci´n de un experimento piloto o Valoraci´n inicial con s´lo un conjunto de datos. o o 6-Esquematizaci´n de los pasos a seguir o 1 Establecimiento del modelo de referencia, con los valores admitidos. 2 Revisi´n uno a uno de los criterios. o 3 Agregaci´n de los resultados y valoraciones. o 4 Extracci´n de estad´ o ısticas, contraste de hip´tesis, validaci´n y o o evaluaci´n. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo Otros 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Resultados ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Resultados ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Resultados ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo- Resultados en % ⊕ entre aplicables Versi´n o ⊕ Total % ⊕ entre aplicables Referencia 173 0 23 196 100 Anuncios de Licitaci´n o TED 32 12 152 “ 72,72 Plataforma de 35 9 152 “ 79,54 Contrataci´n o BOE 30 12 154 “ 71,42 Servicios Ex- 25 14 157 “ 64,10 ternos LOTED 92 34 70 “ 73,01 MOLDEAS 121 10 65 “ 92,36 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo- Resultados en % ⊕ entre aplicables Versi´n o ⊕ Total % ⊕ entre aplicables Referencia 173 0 23 196 100 Cat´logo de Clasificaciones de Productos a CSV/ 25 12 159 “ 67,56 MSExcel Servicios on- 21 21 154 “ 50 line MOLDEAS 166 7 23 “ 93,86 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo- Resultados en % ⊕ entre aplicables Versi´n o ⊕ Total % ⊕ entre aplicables Referencia 173 0 23 196 100 Organizaciones TED 20 9 167 “ 68,96 Plataforma de 35 10 151 “ 77,77 Contrataci´n o BORME 23 1 172 “ 95,83 Servicios Ex- 20 20 156 “ 50 ternos BBDD exter- 12 9 175 “ 57,14 na Open Corpo- 85 33 78 “ 72,03 rates MOLDEAS 121 10 65 “ 92,36 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Resultados Valoraci´n o 1 El ciclo de vida asegura los principios y criterios de Linked Data y Open Data. 2 Se establece un nivel de 5 para los datasets transformados. 3 Se ha aplicado un alto porcentaje de patrones de dise˜o, n calidad impl´ ıcita para la reutilizaci´n de datos. o 4 Los datasets transformados pueden pertenecer a la nube de Linking Open Data y a un registro CKAN. 5 En general, el enfoque de MOLDEAS mejora cualitativamente la informaci´n y datos respecto a otros enfoques. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Conclusiones Puntos Clave Mejora cualitativa la informaci´n y datos. o Aumento de la visi´n global de los datos, expresividad y o estructuraci´n. o Aplicaci´n intensiva de est´ndares. o a Incremento del conocimiento en el dominio de e-Procurement. Impulso de la reutilizaci´n de la informaci´n y datos, mayor o o poder de redistribuci´n. o Minimizaci´n de restricciones tecnol´gicas. o o Minimizaci´n de aspectos discriminatorios. o Aumento de la transparencia, inclusi´n y responsabilidad. o Alineaci´n con las actuales propuestas estrat´gicas de futuro. o e ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Sistema MOLDEAS Consumo de Datos Enlazados Abiertos. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos Objetivos Generales Consumir los datos enlazados desde un lenguaje de programaci´n. o Crear un sistema de recuperaci´n de informaci´n. o o 1-Definici´n de los objetivos del experimento o 1 ¿Es posible implementar un sistema de recuperaci´n de informaci´n o o utilizando datos enlazados? 2 ¿Es posible explotar las relaciones sem´nticas establecidas para a mejorar la recuperaci´n de informaci´n? o o 3 ¿Cu´l es el mejor enfoque para la recuperaci´n de informaci´n en a o o los anuncios de licitaci´n? o 4 ¿C´mo afectan los resultados en la implementaci´n actual del o o sistema MOLDEAS? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos Objetivos Generales Consumir los datos enlazados desde un lenguaje de programaci´n. o Crear un sistema de recuperaci´n de informaci´n. o o 1-Definici´n de los objetivos del experimento o 1 ¿Es posible implementar un sistema de recuperaci´n de informaci´n o o utilizando datos enlazados? 2 ¿Es posible explotar las relaciones sem´nticas establecidas para a mejorar la recuperaci´n de informaci´n? o o 3 ¿Cu´l es el mejor enfoque para la recuperaci´n de informaci´n en a o o los anuncios de licitaci´n? o 4 ¿C´mo afectan los resultados en la implementaci´n actual del o o sistema MOLDEAS? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 2-Selecci´n de una regla de asignaci´n de las unidades o o experimentales a las condiciones de estudio 1 Unidad experimental de este estudio ser´ un repositorio RDF. a 2 Base documental D constituida por 1 mill´n de anuncios de o licitaci´n. o 3 Vocabulario controlado, V, del CPV 2008, formado por 10357 c´digos/t´rminos distintos. o e 4 Cada documento d ∈ D, etiquetado con al menos un c´digo o v ∈ V. 5 11 consultas, Qstr , proporcionadas por Euroalert.net. 6 Las medidas de evaluaci´n dependen del no de c´digos CPV o o generados por MOLDEAS. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos Qi Consulta de Usuario-Qstr No de C´digos o CPV relevantes- i #Qcpv Q1 ... 463 Q2 ... 35 Q3 ... 7 Q4 ... 26 Q5 ... 277 ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos Qi Consulta de Usuario-Qstr No de C´digos o CPV relevantes- i #Qcpv Q6 ... 1 Q7 ... 117 Q8 ... 13 Q9 ... 10 Q10 ... 173 Q11 ... 13 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos M´todo e Descripci´n o Tecnolog´ ıa M1 Se indexan las descripciones de los Apache Lucene y Solr c´digos CPV y proceso de b´sque- o u da sint´ctica de las consultas Qi . a M2 Se extraen una serie de c´digos o M 1 + ponderaci´n o CPV candidatos seg´n jerarqu´ u ıa. broader/ narrower M3 . . . seg´n jerarqu´ con Spreading u ıa M 1 + ONTOSPREAD Activation. M4 . . . seg´n hist´rico de las relaciones u o M 1 + Apache Mahout entre c´digos de los anuncios pre- o vios. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 Para cada consulta se recogen los c´digos CPV 2008 o generados. 2 Se comparan con los indicados en las consultas Qi . 3 Se obtienen las medidas Precisi´n, Recall, Accuracy y o Specificity (PRAS). 5-Ejecuci´n de un experimento piloto o En primer lugar se realiza una consulta para verificar el proceso de b´squeda en cada m´todo y la obtenci´n de medidas. u e o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 Para cada consulta se recogen los c´digos CPV 2008 o generados. 2 Se comparan con los indicados en las consultas Qi . 3 Se obtienen las medidas Precisi´n, Recall, Accuracy y o Specificity (PRAS). 5-Ejecuci´n de un experimento piloto o En primer lugar se realiza una consulta para verificar el proceso de b´squeda en cada m´todo y la obtenci´n de medidas. u e o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 6-Esquematizaci´n de los pasos a seguir o 1 A cada consulta Qstr , identificada como Qi , se le aplica un m´todo M i , devuelve al #Qcpv elementos. e i M i 2 Cada conjunto resultado Qcpv se compara con el conjunto i esperado Qcpv con un script. 3 Se generan los valores PRAS para cada m´todo M i y consulta e de entrada Qi . Otros 1 4-Especificaci´n de un modelo (N/A). o 2 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 3 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 6-Esquematizaci´n de los pasos a seguir o 1 A cada consulta Qstr , identificada como Qi , se le aplica un m´todo M i , devuelve al #Qcpv elementos. e i M i 2 Cada conjunto resultado Qcpv se compara con el conjunto i esperado Qcpv con un script. 3 Se generan los valores PRAS para cada m´todo M i y consulta e de entrada Qi . Otros 1 4-Especificaci´n de un modelo (N/A). o 2 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 3 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos- ¯ Resultados Agregados (X ) M´todo e Precisi´n o Recall Accuracy Specificity 1 M 0, 28 0, 26 0, 99 1, 00 M2 0, 11 0, 11 0, 98 0, 99 M3 0, 23 0, 23 0, 99 1, 00 M4 0, 03 0, 03 0, 96 0, 98 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos-Resultados Valoraci´n o 1 El tipo y formato de una fuente de datos no es impedimento para la construcci´n de servicios en un dominio determinado. o 2 Las relaciones sem´nticas de los datos se pueden explotar para a recuperar informaci´n. o 3 El enfoque tradicional sint´ctico, M 1 , se comporta m´s a a cercano a las expectativas del usuario. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos-Conclusiones Principal Punto Clave La casu´ıstica de un sistema de soporte a la decisi´n o de o recuperaci´n a la informaci´n en e-Procurement es muy o o compleja, existen muchas variables de informaci´n que se o pueden optimizar. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Sistema MOLDEAS Rendimiento de Consultas en SPARQL. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL Objetivo General Mejorar el rendimiento de las consultas en SPARQL. 1-Definici´n de los objetivos del experimento o 1 ¿Cu´les son las mejoras que se pueden aplicar sobre una a consulta en SPARQL para mejorar el tiempo de ejecuci´n? o 2 ¿Cu´l es la combinaci´n de mejoras que obtiene un mejor a o tiempo de respuesta? 3 ¿Cu´l es el coste de la combinaci´n de estas mejoras? a o 4 ¿Existe alg´n elemento externo de configuraci´n que implique u o un incremento en el tiempo de ejecuci´n de las consultas? o 5 ¿C´mo afectan los resultados en la implementaci´n actual del o o sistema MOLDEAS? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL Objetivo General Mejorar el rendimiento de las consultas en SPARQL. 1-Definici´n de los objetivos del experimento o 1 ¿Cu´les son las mejoras que se pueden aplicar sobre una a consulta en SPARQL para mejorar el tiempo de ejecuci´n? o 2 ¿Cu´l es la combinaci´n de mejoras que obtiene un mejor a o tiempo de respuesta? 3 ¿Cu´l es el coste de la combinaci´n de estas mejoras? a o 4 ¿Existe alg´n elemento externo de configuraci´n que implique u o un incremento en el tiempo de ejecuci´n de las consultas? o 5 ¿C´mo afectan los resultados en la implementaci´n actual del o o sistema MOLDEAS? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL 2-Selecci´n de una regla de asignaci´n de las unidades o o experimentales a las condiciones de estudio 1 Unidad experimental de este estudio ser´ un repositorio RDF. a 2 Base documental D constituida por 1 mill´n de anuncios de o licitaci´n. o 3 Vocabulario controlado, V, del CPV 2008, formado por 10357 c´digos/t´rminos distintos. o e 4 Cada documento d ∈ D, etiquetado con al menos un c´digo o v ∈ V y un c´digos NUTS. o 5 Casos de test Tk (tratamiento) para cada consulta Qk con caracter´ ısticas Fk . 6 Ejecuci´n de 3 r´plicas por cada Tk con reinicio y o e calentamiento del entorno de pruebas. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o Tiempo de ejecuci´n en segundos. o 5-Ejecuci´n de un experimento piloto o Una muestra de consultas, s´lo un a˜o de anuncios de o n licitaci´n. o Ejecuci´n de todos los tratamientos. o Toma de tiempos y obtenci´n de resultados. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o Tiempo de ejecuci´n en segundos. o 5-Ejecuci´n de un experimento piloto o Una muestra de consultas, s´lo un a˜o de anuncios de o n licitaci´n. o Ejecuci´n de todos los tratamientos. o Toma de tiempos y obtenci´n de resultados. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL 6-Esquematizaci´n de los pasos a seguir o 1 Preparaci´n y entrenamiento del entorno de ejecuci´n. o o 2 Ejecuci´n del script de consultas. o 3 Procesamiento de los resultados. Otros 1 5-Especificaci´n de un modelo (N/A). o 2 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 3 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL 6-Esquematizaci´n de los pasos a seguir o 1 Preparaci´n y entrenamiento del entorno de ejecuci´n. o o 2 Ejecuci´n del script de consultas. o 3 Procesamiento de los resultados. Otros 1 5-Especificaci´n de un modelo (N/A). o 2 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 3 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL ID C´digo o CPV C´digos o CPV ex- C´digos NUTS o inicial pandidos Q1 15331137 48611000, 48611000, UK, PL, RO 50531510, 15871210 Q2 50531510 34144100, 44212211, ES, FR, DE 44212212, 50531500 Q3 34144100 44212211, 31140000, PL, CZ, RO 31140000, 34144100 Q4 64122000 64216120, 79571000, BE, SE, DE 15871210, 64121000 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL ID C´digo o CPV C´digos o CPV ex- C´digos NUTS o inicial pandidos Q5 79320000 75241000, 75100000, UK, FR, AT 75000000, 60112000 Q6 44100000 44110000, 44170000, NL, SE, DE 44190000, UB03 Q7 31000000 33141000, 39000000, DE, IT, HU 44000000, 31600000 Q8 50000000 50512000, 50333100, UK, IR, FR 50530000, 50532300 Q9 15841400 15841300, 15511700, ES, FR, DK 44921210, 03131400 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL ID Descripci´n o F1 Consulta simple: 1 c´digo CPV y 1 c´digo NUTS o o F2 F1 con uso de la cl´usula LIMIT de SPARQL a F3 Consulta expandida: n c´digos CPV y n c´digo NUTS o o F4 Reescritura de las consultas SPARQL: FILTER, etc. F5 Uso de grafos nombrados en la consulta SPARQL: cla´sula u FROM F6 Separaci´n de las consultas en SPARQL en simples (F1 ) o F7 Consultas simples distribuidas con 5 hilos (1 por c´digo o CPV) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL Test/ Carac- F1 F2 F3 F4 F5 F6 F7 No consultas ter´ ıstica SPARQL T1 1 T2 1 T3 1 T4 1 T5 1 1 T6(n CPVs y 4 m NUTS) 2 T6 (≡) 4 1 T7 (1 CPV y 5 m NUTS) 2 T7 (≡) 5 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL Test/ Carac- F1 F2 F3 F4 F5 F6 F7 No consultas ter´ ıstica SPARQL 1 T8 (≡) 20 2 T8 (≡) 20 1 T9 (1 CPV y 15 1 NUTS ) 2 T9 (≡) 15 1 T10 (≡) 60 2 T10 (≡) 60 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL-Resultados Agregados Test ¯ X Tiempo ¯ X Ganancia Test ¯ X Tiempo ¯ X Ganancia (seg.) ( %) (seg.) ( %) 1 T7 15,81 30,58 T1 3,21 N/A 2 T7 10,51 96,54 T2 3,25 1,21 1 T8 32,33 −36,11 T3 20,548 N/A 2 T8 18,45 11,21 T4 20,552 −0,02 1 T9 22,53 −8,77 T5 20,545 −0,01 2 1 T9 12,61 63,36 T6 20,52 0,14 1 2 T10 71,01 −70,97 T6 11,80 74,37 2 T10 35,08 −40,42 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL-Resultados Gr´ficos a Figura: Tiempo de ejecuci´n medio con referencia T1 . o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL-Resultados Gr´ficos a Figura: Tiempo de ejecuci´n medio con referencia T3 . o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL-Resultados Gr´ficos a Figura: Ganancia media con referencia T3 en ( %). ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL-Resultados Valoraci´n o 1 Existen diversas mejoras aplicables a las consultas en SPARQL (LIMIT, FILTER, etc.) que mejoran el rendimiento. 2 2 El tratamiento T7 genera el mejor tiempo de ejecuci´n o utilizando consultas simples paralelas, con uso de cla´sulas u LIMIT y FILTER en SPARQL. 3 La generaci´n de consultas a partir de una expandida no o genera sobrecarga significativa en el tiempo de ejecuci´n. o 4 Una cach´ de consultas con resultados predefinidos o ´ e ındices en el repositorio puede mejorar el rendimiento. 5 Los resultados han implicado una refactorizaci´n del c´digo o o inicial de moldeas-api. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Rendimiento de Consultas en SPARQL-Conclusiones Puntos Clave La ejecuci´n de consultas sobre grandes conjuntos de o datos puede ser lenta. La ejecuci´n de consultas en paralelo mejora el tiempo de o ejecuci´n. o El tiempo de generaci´n de las consultas es despreciable. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones 5 Conclusiones. Grado de Cumplimiento de Objetivos. Consecuci´n Hip´tesis de la Investigaci´n. o o o Principales Aportaciones. Visi´n Cient´ o ıfica. Trabajo Futuro. Impacto y Difusi´n. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Grado de Cumplimiento de Objetivos Objetivo General Aplicaci´n de la tecnolog´ y m´todos sem´nticos al dominio de la o ıa e a contrataci´n p´blica electr´nica para dar soporte a los principios de o u o las iniciativas de Linked Data y Open Data. Se cumple Definici´n de un ciclo de vida para los datos enlazados o abiertos. Aplicaci´n del ciclo de vida al dominio de e-Procurement, o componentes de MOLDEAS. Experimentaci´n y validaci´n de los principios de Linked o o Data y Open Data. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Grado de Cumplimiento de Objetivos Objetivo General Aplicaci´n de la tecnolog´ y m´todos sem´nticos al dominio de la o ıa e a contrataci´n p´blica electr´nica para dar soporte a los principios de o u o las iniciativas de Linked Data y Open Data. Se cumple Definici´n de un ciclo de vida para los datos enlazados o abiertos. Aplicaci´n del ciclo de vida al dominio de e-Procurement, o componentes de MOLDEAS. Experimentaci´n y validaci´n de los principios de Linked o o Data y Open Data. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Grado de Cumplimiento de Objetivos Objetivo Cap´ ıtulo Estudiar, analizar y valorar: Contrataci´n P´blica y e- o u 2 Procurement . . . Web Sem´ntica, Linked Data y Open Data a 3 Definir m´todos basados en sem´ntica para producir, publicar, e a 4 consumir y validar informaci´n de los anuncios de licitaci´n. o o Definir los algoritmos y procesos para dar soporte a los m´todos e 5-6 anteriores. Implementar y reutilizar los componentes software. 6 Promover: uso de est´ndares, reutilizaci´n de informaci´n y a o o Todos modelos de conocimiento compartido. Aplicar los m´todos sem´nticos definidos al contexto de e- e a 5 Procurement. Establecer un conjunto de prueba y validaci´n. o 7 Difundir, formar y transferir la tecnolog´ y conocimiento. ıa A-B ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Consecuci´n Hip´tesis de la Investigaci´n o o o Hip´tesis de la Investigaci´n o o Es posible mejorar el acceso a la informaci´n contenida en los o anuncios de licitaci´n de las distintas instituciones p´blicas o u europeas, tanto en t´rminos cuantitativos como cualitativos, e mediante m´todos sem´nticos basados en aplicar y cumplir los e a principios de la iniciativa Linked Data y de la misma forma mantener y favorecer los principios de la corriente Open Data. Se cumple Resultados del experimento desde un punto de vista cuantitativo. Resultados del experimento desde un punto de vista cualitativo. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Consecuci´n Hip´tesis de la Investigaci´n o o o Hip´tesis de la Investigaci´n o o Es posible mejorar el acceso a la informaci´n contenida en los o anuncios de licitaci´n de las distintas instituciones p´blicas o u europeas, tanto en t´rminos cuantitativos como cualitativos, e mediante m´todos sem´nticos basados en aplicar y cumplir los e a principios de la iniciativa Linked Data y de la misma forma mantener y favorecer los principios de la corriente Open Data. Se cumple Resultados del experimento desde un punto de vista cuantitativo. Resultados del experimento desde un punto de vista cualitativo. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Principales Aportaciones 1 Repaso del estado actual de e-Procurement y aplicaci´n de o tecnolog´ sem´nticas. ıas a 2 Ciclo de vida para Linked Data. 3 Sistema MOLDEAS. Modelo de informaci´n y datos en e-Procurement: anuncios, o cat´logo de clasificaciones, organizaciones, etc. a Reconciliaci´n de entidades. o Implementaci´n de un conjunto de componentes para el o consumo y explotaci´n de datos. o Dise˜o de criterios de validaci´n de los datos generados. n o Demostraci´n de la mejora cuantitativa y cualitativa en el o acceso a la informaci´n y datos. o 4 Generaci´n de know-how. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Principales Problemas en e-Procurement Puntos Clave Mitigaci´n de la dispersi´n de informaci´n. o o o Identificaci´n unica de la informaci´n y datos. o ´ o Estandarizaci´n de los modelos y formatos de representaci´n o o de la informaci´n y datos. o Soporte intr´ ınseco al multiling¨ismo/multiculturalidad. u Enfoque no intrusivo e integrador de soluciones existentes. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Visi´n Cient´ o ıfica Puntos Clave Aumento del vocabulario de entrada del CPV 2008 con Linked Data. Mejora de la expresividad para la realizaci´n de consultas en o SPARQL. Incremento del n´mero de anuncios de licitaci´n a los que u o se puede acceder. Establecimiento de una f´rmula para el c´lculo de la o a ganancia del enlazado de datos. Mejora cualitativa la informaci´n y datos mediante la o aplicaci´n intensiva de est´ndares. o a Aumento de la visi´n global de los datos, expresividad y o estructuraci´n. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Visi´n Cient´ o ıfica Puntos Clave Incremento del conocimiento en el dominio de e-Procurement. Impulso de la reutilizaci´n de la informaci´n y datos, mayor o o poder de redistribuci´n. o Minimizaci´n de restricciones tecnol´gicas. o o Minimizaci´n de aspectos discriminatorios. o Aumento de la transparencia, inclusi´n y responsabilidad. o Alineaci´n con las actuales propuestas estrat´gicas de o e futuro. Determinaci´n de aspectos claves en la creaci´n de consultas o o en SPARQL. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Trabajo Futuro L´ ıneas de Investigaci´n o Sem´ntica + Linked Data + Open Data a Catalogaci´n de vocabularios y conjuntos de datos de forma o precisa. Mejora de los algoritmos de reconciliaci´n de entidades. o Establecimiento de m´tricas de calidad. e Mejora del rendimiento de las consultas. Creaci´n de un o benchmark con datos reales. Estudio de la aplicaci´n de Linking Open Data a otras etapas o de e-Procurement, otros procesos administrativos, etc. Mejora del sistema de recuperaci´n de informaci´n o o (operadores de agregaci´n). o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Trabajo Futuro L´ ıneas de Investigaci´n o Sem´ntica + Linked Data + Open Data a Procesamiento de consultas federadas de forma eficiente. B´squeda sobre fuentes de datos heterog´neas. u e Descubrimiento autom´tico de datasets. a Gesti´n de datasets din´micos como los provenientes de o a sensores, sistemas reactivos, etc. Calidad de los datos: procedencia, valores, etc. Usabilidad en la interacci´n con datos enlazados. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Trabajo Futuro L´ ıneas de Tecnolog´ ıa Campos de Mejora Mejora del sistema de consumo de datos enlazados de MOLDEAS, personalizaci´n y prueba intensiva de los o algoritmos disponibles. Mejora del sistema de visualizaci´n y consumo de datos o enlazados desde el punto de vista del usuario final. Continuaci´n del desarrollo del sistema de validaci´n de datos o o enlazados. Contribuci´n con nuevas herramientas a la comunidad de o Linked Data. Capitalizaci´n del conocimiento y de la propiedad industrial e o intelectual. Nuevas oportunidades de negocio y servicios. ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Impacto y Difusi´n o Publicaciones derivadas del estudio Revistas internacionales con ´ ındice de impacto 1 Jose Mar´ Alvarez Rodr´ ıa ıguez, Jos´ Emilio Labra Gayo, Francisco e Cifuentes Silva, Giner Alor-Hern´ndez, Cauthemoc S´nchez y Jaime a a Alberto Guzman Luna. Towards a Pan-European E-Procurement platform to Aggregate, Publish and Search Public Procurement Notices powered by Linked Open Data: The MOLDEAS Approach. International Journal of Software Engineering and Knowledge Engineering (IJSEKE). 2011. IF: 0,262. 2 Jose Mar´ Alvarez Rodr´ ıa ıguez, Jos´ Emilio Labra Gayo y Patricia e Ordo˜ez De Pablos. Survey of New Trends on e-Procurement n Applying Semantics. International Journal of Computers in Industry Focused Topic Issue on New Trends on e-Procurement Applying Semantics. 2014. IF: 1,620. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Impacto y Difusi´n o Publicaciones derivadas del estudio Revistas internacionales 1 Jose Mar´ Alvarez Rodr´ ıa ıguez, Jos´ Emilio Labra Gayo y Patricia Ordo˜ez De e n Pablos. An Extensible Framework to Sort Out Nodes in Graph-based Structures Powered by the Spreading Activation Technique: The ONTOSPREAD approach. IJKSR. 2011. 2 Jorge Gonz´lez Lorenzo, Jos´ Emilio Labra Gayo y Jose Mar´ Alvarez a e ıa Rodr´ıguez. A MapReduce implementation of the Spreading Activation algorithm for processing large knowledge bases based on semantic networks. IJKSR. 3 Jose Mar´ Alvarez Rodr´ ıa ´ ıguez, Jos´ Emilio Labra Gayo, Ram´n Calmeau, Angel e o Mar´ y Jose Luis Mar´ Query Expansion Methods and Performance ın ın. Evaluation for Reusing Linking Open Data of the European Public Procurement Notices. Current Topics in Artificial Intelligence. 14th Conference of the Spanish Association for Artificial Intelligence, CAEPIA 2011, La Laguna, Spain, November 8-11, 2011, Selected Papers. 4 Jose Mar´ Alvarez Rodr´ ıa ´ ıguez, Jos´ Emilio Labra Gayo, Ram´n Calmeau, Angel e o Mar´ y Jose Luis Mar´ Innovative Services to ease the Access to the Public ın ın. Procurement Notices using Linking Open Data and Advanced Methods based on Semantics. International Journal of Electronic Government. 2012. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Impacto y Difusi´n o Publicaciones derivadas del estudio Cap´ ıtulos de libros 1 Jose Luis Mar´ Mai Rodr´ ın, ´ ıguez, Ram´n Calmeau, Angel o Mar´ Jose Mar´ Alvarez Rodr´ ın, ıa ıguez y Jos´ Emilio Labra e Gayo. Euroalert.net: aggregating public procurement data to deliver commercial services to SMEs. “E-Procurement Management for Successful Electronic Government System”. IGI Global. 2012. 2 Jose Mar´ Alvarez Rodr´ ıa ıguez, Luis Polo Paredes, Emilio Rubiera Azcona, Jos´ Emilio Labra Gayo y Patricia Ordo˜ez e n De Pablos. Enhancing the Access to Public Procurement Notices by Promoting Product Scheme Classifications to the Linked Open Data Initiative. “Cases on Open-Linked Data and Semantic Web Applications”. IGI Global. 2012 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Impacto y Difusi´n o Publicaciones derivadas del estudio Conferencias Internacionales 1 Jose Mar´ Alvarez Rodr´ ıa ıguez, Jos´ Emilio Labra Gayo y Patricia Ordo˜ez De e n Pablos. Enhancing the Access to Large Data Sets by means of Linking Controlled Vocabularies. WSKS 2012. 2012. 2 Jose Mar´ Alvarez Rodr´ ıa ıguez, Jos´ Emilio Labra Gayo y Patricia Ordo˜ez De e n Pablos. An Extensible Framework to Sort Out Nodes in Graph-based Structures Powered by the Spreading Activation Technique: The ONTOSPREAD approach. WSKS 2011. 2011. 3 Jorge Gonz´lez Lorenzo, Jos´ Emilio Labra Gayo y Jose Mar´ Alvarez a e ıa Rodr´ıguez. A MapReduce implementation of the Spreading Activation algorithm for processing large knowledge bases based on semantic networks. WSKS 2011. 2011. 4 Jose Mar´ Alvarez Rodr´ ıa ´ ıguez, Jos´ Emilio Labra Gayo, Ram´n Calmeau, Angel e o Mar´ y Jose Luis Mar´ Innovative Services to ease the Access to the Public ın ın. Procurement Notices using Linking Open Data and Advanced Methods based on Semantics. MeTTeG. 2011. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Impacto y Difusi´n o Publicaciones derivadas del estudio Otros 1 3 art´ ıculos en Workshops internacionales. 2 2 posters en eventos internacionales. 3 4 art´ ıculos en Workshops nacionales. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Conclusiones Impacto y Difusi´n o Otras publicaciones relevantes en el ´mbito de la a Sem´ntica a Revistas internacionales con ´ ındice de impacto 1 Alejandro Rodr´ıguez Gonz´lez, Javier Torres-Ni˜o, Gandhi Hern´ndez-Chan, a n a Enrique Jim´nez-Domingo y Jose Mar´ Alvarez Rodr´ e ıa ıguez. Using Agents to Parallelize a Medical Reasoning System Based on Ontologies and Description Logics. International Journal Expert Systems With Applications. 2012. IF: 1,926. Aceptado. 2 Miguel Garc´ Rodr´ ıa ıguez, Jose Mar´ Alvarez Rodr´ ıa ıguez, Diego Berrueta Mu˜oz, n Luis Polo Paredes, Jos´ Emilio Labra Gayo y Patricia Ordo˜ez De Pablos. e n Towards a Practical Solution for Data Grounding in a Semantic Web Services Environment. Journal of Universal Computer Science. 2012. IF: 0,788. Aceptado. 3 Cristina Casado Lumbreras, Alejandro Rodr´ ıguez Gonz´lez, Jose Mar´ Alvarez a ıa Rodr´ıguez y Ricardo Colomo Palacios. PsyDis: towards a diagnosis support system for psychological disorders.. International Journal Expert Systems With Applications. 2012. IF: 1,926. Aceptado. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Fin ¡GRACIAS! ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Fin M´todos Sem´nticos de Reutilizaci´n de Datos e a o Abiertos Enlazados en las Licitaciones P´blicas u Tesis Doctoral presentada por ıa ´ Jose Mar´ Alvarez Rodr´ ıguez Dirigida por Profesor Doctor D. Jos´ Emilio Labra Gayo e Sistemas y Servicios Inform´ticos para Internet a Departamento de Inform´tica a Universidad de Oviedo Oviedo, 14 de Junio de 2012 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Referencias Referencias 1 T. Heath y C. Bizer. Linked Data: Evolving the Web into a Global Data Space, tomo 1. Morgan & Claypool, 2011. 2 L. Dodds y I. Davis. Linked Data Patterns. A pattern catalogue for modelling, publishing, and consuming Linked Data, agosto 2011. 3 W3C Members. Government Linked Data Working Group Charter. W3C group, W3C, 2011. 4 D. Bennett y A. Harvey. Publishing Open Government Data. W3C working draft, W3C, 2009. 5 W3C Members. Best Practices Discussion Summary. W3C government linked data working group first f2f, W3C, 2011. 6 D. Berrueta, S. Fern´ndez, y I. Frade. Cooking HTTP content a negotiation with Vapour. En In Proceedings of 4th workshop on Scripting for the Semantic Web 2008 (SFSW2008), co-located with ESWC2008. 2008. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Referencias Referencias 7 B. Hyland, B. Villaz´n Terrazas, y S. Capadisli. Cookbook for o Open Government Linked Data . W3C task force-government linked data group, W3C, 2011. 8 M. Nally, S. Speicher, J. Arwe, y A. Le Hors. Linked Data Basic Profile 1.0. W3C Member Submission. 2012. 9 TenForce. D1.4 – Early LOD2 Stack prototype. Deliverable of European Project, LOD2 Project, 2011. 10 FA. Cifuentes-Silva, C. Sifaqui, y JE. Labra Gayo. Towards an architecture and adoption process for linked data technologies in open government contexts: a case study for the Library of Congress of Chile. En I-SEMANTICS, p´ginas 79–86. 2011. a 11 F. Bauer y M. Kaltenb¨ck. Linked Open Data: The Essentials: o A Quick Start Guide for Decision Makers, tomo 1. 2012. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • MOLDEAS Glosario AGE: Administraci´n General del Estado. o BOE: Bolet´ Oficial del Estado. ın BORME: Bolet´ Oficial del Registro Mercantil del Estado. ın EEUU: Estados Unidos. PSC: Product Scheme Classification. UE: Uni´n Europea. o UK: Reino Unido. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS