SlideShare a Scribd company logo
1 of 156
MOLDEAS




          M´todos Sem´nticos de Reutilizaci´n de Datos
           e           a                     o
          Abiertos Enlazados en las Licitaciones P´blicas
                                                  u

                       Tesis Doctoral presentada por

                                 ıa ´
                         Jose Mar´ Alvarez Rodr´
                                               ıguez

                                      Dirigida por
                Profesor Doctor D. Jos´ Emilio Labra Gayo
                                      e
                    Sistemas y Servicios Inform´ticos para Internet
                                               a
                            Departamento de Inform´tica
                                                     a
                                Universidad de Oviedo


                          Oviedo, 14 de Junio de 2012

                          ıa ´
                  Jose Mar´ Alvarez Rodr´
                                        ıguez   MOLDEAS
MOLDEAS




    1     Objeto de la Investigaci´n
                                  o

    2     Marco te´rico y conceptual
                  o

    3     Marco metodol´gico
                       o

    4     Resultados y Evaluaci´n
                               o

    5     Conclusiones




                            ıa ´
                    Jose Mar´ Alvarez Rodr´
                                          ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o




        1    Objeto de la Investigaci´n.
                                     o
                     Formulaci´n del Problema.
                                o
                     Justificaci´n del Estudio.
                                o
                     Objetivo General.
                     Objetivos Espec´ıficos.
                     Hip´tesis.
                        o




                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Formulaci´n del Problema
          o


     Problema
     ¿Por qu´ aplicar m´todos sem´nticos y los principios de Linked
            e          e         a
     Data y Open Data al dominio de las licitaciones p´blicas?
                                                      u

     Contexto
     ¿Cu´les son las licitaciones p´blicas sobre ((construcci´n de puentes
         a                         u                         o
     y carreteras)) publicadas en la regi´n de B´lgica cuyo idioma es
                                         o       e
     holand´s durante 2011 y cuyo importe est´ entre 100 y 200K
            e                                    a
     euros?




                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Formulaci´n del Problema
          o


     Problema
     ¿Por qu´ aplicar m´todos sem´nticos y los principios de Linked
            e          e         a
     Data y Open Data al dominio de las licitaciones p´blicas?
                                                      u

     Contexto
     ¿Cu´les son las licitaciones p´blicas sobre ((construcci´n de puentes
         a                         u                         o
     y carreteras)) publicadas en la regi´n de B´lgica cuyo idioma es
                                         o       e
     holand´s durante 2011 y cuyo importe est´ entre 100 y 200K
            e                                    a
     euros?




                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Justificaci´n del Estudio
           o



     Motivaci´n
             o
         Profundizaci´n en el ´rea de estudio.
                     o        a
             Corriente de investigaci´n en continua evoluci´n.
                                     o                     o
             Investigaci´n e Innovaci´n.
                        o            o
             Servicios de valor a˜adido.
                                 n
             Sector estrat´gico en las Administraciones P´blicas (AAPP).
                          e                              u




                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Justificaci´n del Estudio
           o



     Motivaci´n Cient´
             o       ıfica
         Formalizaci´n del conocimiento de un dominio.
                    o
             Aplicaci´n de modelos est´ndar a un dominio.
                     o                a
             Integraci´n de fuentes de datos.
                      o
             Mejora y consolidaci´n de las t´cnicas actuales.
                                 o          e
             Generaci´n de conocimiento, nuevos datos y enfoques.
                     o
             Aportaciones a otros investigadores, comunidad.




                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Justificaci´n del Estudio
           o


     Motivaci´n Tecnol´gica
             o        o
         Aplicaci´n de nuevas soluciones t´cnicas.
                 o                        e
             Gesti´n avanzada de la informaci´n y datos.
                  o                          o
             Mejora de los procesos de acceso a la informaci´n.
                                                            o
             Cobertura a las necesidades de la cadena de valor del proceso
             administrativo.
             Impulso de un sector trascendente: econ´mico, social,
                                                    o
             financiero, etc.
             Generaci´n de nuevas oportunidades de negocio.
                     o



                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Objetivo General




     Sem´ntica + Linked Data + Open Data
          a
     Aplicaci´n de la tecnolog´ y m´todos sem´nticos al dominio de la
              o                ıa    e          a
     contrataci´n p´blica electr´nica para dar soporte a los principios de
                 o u             o
     las iniciativas de Linked Data y Open Data.




                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Objetivos Espec´
                ıficos

        1    Estudiar, analizar y valorar:
                     Contrataci´n P´blica y e-Procurement.
                               o u
                     Web Sem´ntica, Linked Data y Open Data.
                              a
        2    Definir m´todos basados en sem´ntica para gestionar la
                      e                      a
             informaci´n de los anuncios de licitaci´n.
                      o                             o
        3    Implementar y reutilizar los componentes software.
        4    Promover el uso de est´ndares, la reutilizaci´n de informaci´n
                                   a                      o              o
             y los modelos de conocimiento compartido.
        5    Aplicar los m´todos sem´nticos definidos al contexto de
                          e         a
             e-Procurement.
        6    Establecer un conjunto de prueba y validaci´n.
                                                        o
        7    Difundir, formar y transferir la tecnolog´ y conocimiento.
                                                      ıa

                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Hip´tesis
    o



     Hip´tesis de la Investigaci´n
         o                       o
     Es posible mejorar el acceso a la informaci´n contenida en los
                                                    o
     anuncios de licitaci´n de las distintas instituciones p´blicas
                           o                                u
     europeas, tanto en t´rminos cuantitativos como cualitativos,
                          e
     mediante m´todos sem´nticos basados en aplicar y cumplir los
                  e             a
     principios de la iniciativa Linked Data y de la misma forma
     mantener y favorecer los principios de la corriente Open Data.




                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Hip´tesis
    o


     T´rminos cualitativos
       e
     ¿Se puede mejorar el acceso a la informaci´n y datos utilizando
                                               o
     sem´ntica?
         a

     T´rminos cuantitativos
      e
     ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n
                                   u                            o
     utilizando sem´ntica?
                   a

     Aplicar, cumplir, mantener y favorecer
     ¿Se puede realizar este enfoque cumpliendo con los principios y
     corrientes actuales?


                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Hip´tesis
    o


     T´rminos cualitativos
       e
     ¿Se puede mejorar el acceso a la informaci´n y datos utilizando
                                               o
     sem´ntica?
         a

     T´rminos cuantitativos
      e
     ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n
                                   u                            o
     utilizando sem´ntica?
                   a

     Aplicar, cumplir, mantener y favorecer
     ¿Se puede realizar este enfoque cumpliendo con los principios y
     corrientes actuales?


                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Objeto de la Investigaci´n
                         o



 Hip´tesis
    o


     T´rminos cualitativos
       e
     ¿Se puede mejorar el acceso a la informaci´n y datos utilizando
                                               o
     sem´ntica?
         a

     T´rminos cuantitativos
      e
     ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n
                                   u                            o
     utilizando sem´ntica?
                   a

     Aplicar, cumplir, mantener y favorecer
     ¿Se puede realizar este enfoque cumpliendo con los principios y
     corrientes actuales?


                                      ıa ´
                              Jose Mar´ Alvarez Rodr´
                                                    ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o




        2   Marco te´rico y conceptual
                    o
                    Contrataci´n P´blica y e-Procurement.
                              o u
                    Web Sem´ntica.
                             a
                    Linked Data y Open Data.
                    e-Procurement y Sem´ntica.
                                         a




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 e-Procurement


            Sector estrat´gico. 17 % del PIB.
                         e
            Impulsado desde la Uni´n Europea (adopci´n paulatina).
                                  o                 o
            Plan de Acci´n 2004 y Europa 2020.
                        o
            M´ltiples fases y etapas (mara˜a de requisitos t´cnicos).
             u                            n                 e
            Informaci´n y datos valiosos. Sociedad de la Informaci´n.
                     o                                            o
            Marco legal definido y en evoluci´n (homogeneizaci´n).
                                            o                o
            16K anuncios de licitaci´n nuevos al d´
                                    o             ıa.
            Necesidad de impulso de la participaci´n de las peque˜as y
                                                  o              n
            medianas empresas (PYMES).



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Fases de e-Procurement




              Figura: Diagrama de Complejidad y Fases de e-Procurement.

    Fuente: Uni´n Europea.
               o
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Definici´n de e-Procurement
        o

    Contrataci´n P´blica Electr´nica
               o u               o
    La contrataci´n electr´nica es un t´rmino general utilizado para
                  o        o            e
    designar la sustituci´n de los procedimientos basados en soporte de
                         o
    papel por el tratamiento y la comunicaci´n mediante TIC a lo
                                             o
    largo de toda la cadena de contrataci´n p´blica.
                                          o u

            Publicaci´n de los anuncios de licitaci´n.
                     o                             o
            Suministro del pliego de condiciones.
            Presentaci´n de ofertas.
                      o
            Adjudicaci´n.
                      o
            Facturaci´n y pago.
                     o
            ...

                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Definici´n de e-Procurement
        o

    Contrataci´n P´blica Electr´nica
               o u               o
    La contrataci´n electr´nica es un t´rmino general utilizado para
                  o        o            e
    designar la sustituci´n de los procedimientos basados en soporte de
                         o
    papel por el tratamiento y la comunicaci´n mediante TIC a lo
                                             o
    largo de toda la cadena de contrataci´n p´blica.
                                          o u

            Publicaci´n de los anuncios de licitaci´n.
                     o                             o
            Suministro del pliego de condiciones.
            Presentaci´n de ofertas.
                      o
            Adjudicaci´n.
                      o
            Facturaci´n y pago.
                     o
            ...

                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Silos de Informaci´n
                   o




        Figura: Silos de Informaci´n en e-Procurement de la Uni´n Europea.
                                  o                            o
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Multiling¨ismo y multiculturalidad.
          u




                     Figura: Concepto “mesitas”, “mesas de caf´”, etc.
                                                              e


                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Acciones de la Uni´n Europea
                   o


            Tenders Electronic Daily (TED) y Sistema de Informaci´n
                                                                 o
            para la contrataci´n p´blica europea (SIMAP).
                              o u
            Clasificaciones Est´ndar de Productos y Servicios (CPV).
                              a
            Clasificaci´n de regiones (NUTS).
                      o
            Plataformas de Contrataci´n.
                                     o
            Proyectos destacados:
                1   e-Certis.
                2   Fiscalis 2013.
                3   ePRIOR.
                4   PEPPOL-Pan-European Public Procurement Online.
                5   STORK -Secure idenTity acrOss euRope linKed.



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Acciones de la Uni´n Europea
                   o


            Tenders Electronic Daily (TED) y Sistema de Informaci´n
                                                                 o
            para la contrataci´n p´blica europea (SIMAP).
                              o u
            Clasificaciones Est´ndar de Productos y Servicios (CPV).
                              a
            Clasificaci´n de regiones (NUTS).
                      o
            Plataformas de Contrataci´n.
                                     o
            Proyectos destacados:
                1   e-Certis.
                2   Fiscalis 2013.
                3   ePRIOR.
                4   PEPPOL-Pan-European Public Procurement Online.
                5   STORK -Secure idenTity acrOss euRope linKed.



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Modelo de Informaci´n
                    o
            TED (XML-Schema).
            CODICE (XML-Schema).
            opXML (XML-Schema).
            ...

    Valoraci´n
            o
        Sobre-especificaci´n.
                         o
            Escasa convergencia (nombrado, especificidad, etc.) e
            interoperabilidad.
            Falta de consenso.
            Replicaci´n de esfuerzos.
                     o
            Necesidades transversales: publicaci´n de informaci´n, gesti´n
                                                o              o        o
            de pagos, etc.
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Modelo de Informaci´n
                    o
            TED (XML-Schema).
            CODICE (XML-Schema).
            opXML (XML-Schema).
            ...

    Valoraci´n
            o
        Sobre-especificaci´n.
                         o
            Escasa convergencia (nombrado, especificidad, etc.) e
            interoperabilidad.
            Falta de consenso.
            Replicaci´n de esfuerzos.
                     o
            Necesidades transversales: publicaci´n de informaci´n, gesti´n
                                                o              o        o
            de pagos, etc.
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contrataci´n P´blica Electr´nica
             o   u            o

 Principales Problemas



    Puntos de Mejora
        Dispersi´n de la informaci´n.
                o                 o
            Mismo anuncio en m´s de una fuente.
                              a
            Heterogeneidad de los formatos de los anuncios.
            Diversidad de formatos de explotaci´n.
                                               o
            Multiling¨ismo y multiculturalidad.
                     u
            Otros: almacenamiento, etc.




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Web Sem´ntica
          a

 Web Sem´ntica
        a
    Caracter´
            ısticas Principales
        Modelo de datos est´ndar para representar recursos. Grafo
                              a
        RDF (sujeto, predicado, objeto).
            Formalizaci´n del conocimiento mediante ontolog´ basadas
                       o                                   ıas
            en l´gica (DL).
                o
            Facilidad para su extensi´n y crecimiento din´mico.
                                     o                   a
            Aplicaci´n de est´ndares en representaci´n (OWL2) y acceso
                    o        a                      o
            (SPARQL).
            Baja intrusividad con sistemas existentes.
            Mejora de la interoperabilidad e integraci´n.
                                                      o
            Soporte para la creaci´n de sistemas basados en conocimiento.
                                  o
            Gran variedad de vocabularios, conjuntos de datos, etc., en
            distintos dominios.
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Datos Enlazados

 Linked Data


  Principios
     1    Use URIs as names for
          things.
     2    When someone looks up a
          URI, provide useful
          information, using the
          standards (RDF*, SPARQL).
     3    Include links to other URIs.                      Figura: Modelo 5 (W3C).
     4    Use HTTP URIs.



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Datos Enlazados

 Linked Data


    Ventajas
        Realizaci´n pr´ctica de la Web Sem´ntica.
                 o    a                   a
            Identificaci´n unica, uso de HTTP URIs.
                       o ´
            Modelo y acceso est´ndar.
                               a
            Enriquecimiento de recursos, creaci´n de enlaces.
                                               o
            Estructuraci´n, modelo est´ndar RDF.
                        o             a
            Expresividad, vocabularios y datasets.
            Reutilizaci´n de informaci´n y datos.
                       o              o
            ...



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Datos Abiertos

 Open Data


    Los 8 principios
        Data Must Be Complete.
            . . . Primary.
            . . . Timely.
            . . . Accessible.
            . . . Machine processable.
            Access Must Be Non-Discriminatory.
            Data Formats Must Be Non-Proprietary.
            Data Must Be License-free.



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Datos Abiertos

 Open Data


    Ventajas
        Inclusi´n.
               o
            Transparencia.
            Responsabilidad.
            Reutilizaci´n de informaci´n del sector p´blico (PSI).
                       o              o              u
            Generaci´n de m´ltiples vistas de los datos.
                    o      u
            Creaci´n de servicios de valor a˜adido.
                  o                         n
            Integraci´n de fuentes de datos.
                     o




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Datos Abiertos

 Iniciativas Open Data




                                Figura: Datos Abiertos en Espa˜a.
                                                              n

    Fuente: http://datos.gob.es

                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Datos Abiertos Enlazados

 Linking Open Data




                                 Figura: Linking Open Data cloud.


            203 datasets, 25 billones de tripletas RDF y unos 395 millones
            de enlaces entre los datos (Sept. 2010).
            Dominios: Media, Geographic, Government (42,09 %),
            Publications, Cross-domain, Life sciences, etc. (Ago. 2011).
            393 datasets (Jun. 2012).
    Fuente: R. Cyganiak & A. Jentzsch.

                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Datos Abiertos Enlazados

 Ciclos de Vida en Linked Data

            Linked Data Design Considerations [1].
            Linked Data Patterns [2].
            Grupo de trabajo del W3C-Government Linked Data (GLD)
            [3]:
                1   Publishing Open Government Data [4] y Best Practices [5,6].
                2   Government Linked Data-Life Cycle y Linked Data Cookbook
                    [7].
            LOD2 Stack [8], proyecto europeo LOD2.
            Toward a Basic Profile for Linked Data [9], IBM y W3C.
            Metodolog´ BCN y UNIOVI [10].
                     ıa
            Linked Open Data: The Essentials [11].
            Otros: por pa´ (UK, EEUU, etc.), empresa (Talis Platform,
                         ıs
            TopQuadrant, etc.), etc.
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Datos Abiertos Enlazados

 Ciclos de Vida en Linked Data


    Problemas encontrados
        Marem´gnum recetas/metodolog´
               a                    ıas/buenas pr´cticas.
                                                 a
            Diferentes niveles de abstracci´n y mezcla en las tareas.
                                           o
            Baja definici´n de responsables en las tareas.
                        o
            Baja especificaci´n de resultados de las tareas.
                            o
            Ajuste a casu´
                         ıstica concreta.
            Especificaciones te´ricas o en desarrollo.
                              o
            Ausencia de relaci´n entre las mismas.
                              o
            ...



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Contraci´n P´blica Electr´nica y Sem´ntica
           o   u            o          a

 e-Procurement y Sem´ntica
                    a


    Actividades e Iniciativas
         Taxonom´ de productos y servicios: CPA, CPC, CPV,
                  ıas
         NAICS, etc.
            Vocabularios XML de negocio: ebXML, XBRL, SBVR o
            SCOR.
            Vocabularios basados en sem´ntica: GoodRelations,
                                       a
            ProductOntology, Organizations ontology, FOAF, etc.
            Ontolog´ Rep´blica Checa y proyecto LOTED.
                   ıas: u
            Proyectos europeos: LOD2 (WP9), LATC, PlanetData, etc.



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Resumen

 Puntos Clave

    ...a considerar...
          e-Procurement dominio heterog´neo: informaci´n, datos,
                                       e              o
          proveedores, etc.
             Necesidades de identificaci´n, integraci´n, modelo est´ndar,
                                       o            o             a
             etc.
             Los principios de la Web Sem´ntica se ajustan a estas
                                         a
             necesidades.
             Linked Data y Open Data corrientes actuales estrat´gicas.
                                                               e
             Ausencia de un ciclo de vida concreto.
             Escasas iniciativas en e-Procurement + Sem´ntica.
                                                       a
             ...

                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Resumen

 Soluci´n
       o


    MOLDEAS
    Methods On Linked Data for E-procurement Applying Semantics

             Definici´n ciclo de vida para datos abiertos enlazados.
                    o
             Implementaci´n de los componentes software necesarios.
                         o
             Pruebas y Validaci´n.
                               o
             Aplicaci´n al dominio de e-Procurement.
                     o
             Experimentaci´n.
                          o
             ...



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco te´rico y conceptual
         o
   Resumen

 Soluci´n
       o


    MOLDEAS
    Methods On Linked Data for E-procurement Applying Semantics

             Definici´n ciclo de vida para datos abiertos enlazados.
                    o
             Implementaci´n de los componentes software necesarios.
                         o
             Pruebas y Validaci´n.
                               o
             Aplicaci´n al dominio de e-Procurement.
                     o
             Experimentaci´n.
                          o
             ...



                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o




       3   Marco metodol´gico.
                        o
                  Metodolog´ de la Investigaci´n.
                             ıa                o
                  Definici´n del Ciclo de Vida para Datos Enlazados Abiertos.
                          o
                  Aplicaci´n del Ciclo de Vida al e-Procurement.
                          o
                  Creaci´n del sistema MOLDEAS.
                        o




                              ıa ´
                      Jose Mar´ Alvarez Rodr´
                                            ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o



 Metodolog´ de la Investigaci´n
          ıa                 o


    Tipo
    Investigaci´n cuantitativa con base en evidencias emp´
               o                                         ıricas.
    Car´cter descriptivo y comparativo.
       a

    Dise˜o
        n
      1 Definici´n Ciclo de Vida de Datos Enlazados Abiertos.
               o
       2   Aplicaci´n al dominio de e-Procurement.
                   o
       3   Creaci´n del sistema MOLDEAS.
                 o
       4   Definici´n y ejecuci´n de experimentos.
                  o           o



                              ıa ´
                      Jose Mar´ Alvarez Rodr´
                                            ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o



 Metodolog´ de la Investigaci´n
          ıa                 o


    Tipo
    Investigaci´n cuantitativa con base en evidencias emp´
               o                                         ıricas.
    Car´cter descriptivo y comparativo.
       a

    Dise˜o
        n
      1 Definici´n Ciclo de Vida de Datos Enlazados Abiertos.
               o
       2   Aplicaci´n al dominio de e-Procurement.
                   o
       3   Creaci´n del sistema MOLDEAS.
                 o
       4   Definici´n y ejecuci´n de experimentos.
                  o           o



                              ıa ´
                      Jose Mar´ Alvarez Rodr´
                                            ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o



 Metodolog´ de la Investigaci´n
          ıa                 o


    Universo de Estudio
    Tres principales conjuntos de datos seleccionados:
       1   Datos de anuncios de licitaci´n (1 Mill´n) provistos por
                                        o         o
           Euroalert.net desde 2008 a 2011.
       2   Cat´logos de Clasificaciones de Productos y Servicios (9:
              a
           CPV, CPA, NAICS, etc.) provistos por UE, ONU, EEUU, etc.
       3   Organizaciones, personas y pa´ (clasificaci´n NUTS de la
                                        ıses         o
           UE).




                              ıa ´
                      Jose Mar´ Alvarez Rodr´
                                            ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Definici´n del Ciclo de Vida para Datos Enlazados Abiertos
          o

 Visi´n General
     o




          Figura: Procesos del Ciclo de Vida de Datos Enlazados Abiertos.

                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez          MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Definici´n del Ciclo de Vida para Datos Enlazados Abiertos
          o

 Visi´n Detallada-Procesos y M´todos
     o                        e




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez          MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Consideraciones Generales


    Procesos
        M´todos de Producci´n y Consumo dependiente del dataset.
          e                o
            M´todos de Publicaci´n y Validaci´n comunes.
             e                  o            o

    Conjuntos de Datos
            Anuncios de licitaci´n (PPN).
                                o
            Clasificaciones est´ndar de productos y servicios (PSCs).
                              a
            Organizaciones, personas y pa´
                                         ıses.




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Consideraciones Generales


    Procesos
        M´todos de Producci´n y Consumo dependiente del dataset.
          e                o
            M´todos de Publicaci´n y Validaci´n comunes.
             e                  o            o

    Conjuntos de Datos
            Anuncios de licitaci´n (PPN).
                                o
            Clasificaciones est´ndar de productos y servicios (PSCs).
                              a
            Organizaciones, personas y pa´
                                         ıses.




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 M´todos Aplicados
  e
    Producci´n
            o
    Transformaci´n de datos est´ticos a RDF.
                o              a

    Publicaci´n
             o
    Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
               a
    Frontend.

    Consumo
    Mapeo a Lenguaje de Programaci´n.
                                  o

    Validaci´n
            o
    Uso de Tablas de Validaci´n.
                             o

    Realimentaci´n
                 o
    Actualizaci´n Ocasional.
               o
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 M´todos Aplicados
  e
    Producci´n
            o
    Transformaci´n de datos est´ticos a RDF.
                o              a

    Publicaci´n
             o
    Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
               a
    Frontend.

    Consumo
    Mapeo a Lenguaje de Programaci´n.
                                  o

    Validaci´n
            o
    Uso de Tablas de Validaci´n.
                             o

    Realimentaci´n
                 o
    Actualizaci´n Ocasional.
               o
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 M´todos Aplicados
  e
    Producci´n
            o
    Transformaci´n de datos est´ticos a RDF.
                o              a

    Publicaci´n
             o
    Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
               a
    Frontend.

    Consumo
    Mapeo a Lenguaje de Programaci´n.
                                  o

    Validaci´n
            o
    Uso de Tablas de Validaci´n.
                             o

    Realimentaci´n
                 o
    Actualizaci´n Ocasional.
               o
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 M´todos Aplicados
  e
    Producci´n
            o
    Transformaci´n de datos est´ticos a RDF.
                o              a

    Publicaci´n
             o
    Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
               a
    Frontend.

    Consumo
    Mapeo a Lenguaje de Programaci´n.
                                  o

    Validaci´n
            o
    Uso de Tablas de Validaci´n.
                             o

    Realimentaci´n
                 o
    Actualizaci´n Ocasional.
               o
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 M´todos Aplicados
  e
    Producci´n
            o
    Transformaci´n de datos est´ticos a RDF.
                o              a

    Publicaci´n
             o
    Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data
               a
    Frontend.

    Consumo
    Mapeo a Lenguaje de Programaci´n.
                                  o

    Validaci´n
            o
    Uso de Tablas de Validaci´n.
                             o

    Realimentaci´n
                 o
    Actualizaci´n Ocasional.
               o
                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Resultados



          Anuncios de Licitaci´n
                              o    No de Elementos        Tripletas
          PPN 2008                 112843                 677058
          PPN 2009                 399766                 2398601
          PPN 2009                 431813                 2590880
          PPN 2011                 67044                  402264
                   Cat´logo de Anuncios de Licitaci´n (total)
                      a                            o
          PPNs                     1011466                6068803




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Clasificaciones Est´ndar de Productos y Servicios
                   a

      Clasificaci´no                                               Acr´nimo
                                                                     o       Organismo
      Common Procurement Vocabulary, (2003 y                      CPV        UE
      2008)
      Combined Nomenclature 2012 (desde 1995)                     CN         “
      Central Product Classification, version 2                    CPC        ...
      (2008)
      Clasificaci´n de Productos por Actividad
                 o                                                CPA        “
      (2008)
      International Standard Industrial Classifica-                ISIC       ONU
      tion of All Economic Activities, Rev.4
      North American Industry Classification Sys-                  NAICS      EEUU
      tem 2007 y 2012
      Standard International Trade Classification,                 SITC       ONU
      Revision 4


                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Clasificaciones Est´ndar de Productos y Servicios
                   a




    Figura: Enlaces entre las distintas Clasificaciones Est´ndar de Productos
                                                          a
    y Servicios.




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Resultados-I


      PSC                 #                  Tripletas            Links   Links      CPV
                                                                          2008
      CPV 2003            8323               546135               8322    462 (del CPV
                                                                          2008 al 2003)
      CPV 2008            10357              803311               10355   N/A
      CN 2012             14552              137484               2590    2390
      CPC 2008            4408               100819               4408    4375 y 1503 (ex-
                                                                          actos)
      CPA 2008            5429               92749                5429    5399
                                                        ...




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez         MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Resultados-II



      PSC                    #                     Tripletas
                                                        Links    Links
                                                                     CPV
                                                        2008
      ISIC v4       766         18986        766        765
      NAICS 2007 2328           36292        2328       2300
      NAICS 2012 2212           35390        2212       2186
      SITC v4       4017        70887        3941       3811
            Cat´logo de Clasificaciones Est´ndar de Productos (total)
               a                          a
      PSCs          52392       1842053      40351      23191




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez      MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Organizaciones, personas y pa´
                              ıses




                           Figura: Organizations Ontology del W3C.




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Aplicaci´n del Ciclo de Vida al e-Procurement
           o

 Resultados



      Dataset                    #                      Tripletas
                                                       Enlaces exter-
                                                       nos
      Organizaciones 50000             1150020         50000 (pa´
                                                                ıses)
      Personas       50000             900219          50000 (pa´
                                                                ıses)
      Pa´
        ıses         246               1756            1779
                  Organizaciones, Personas y Pa´
                                               ıses (total)
      Agregado       100246            2051995         101779




                                  ıa ´
                          Jose Mar´ Alvarez Rodr´
                                                ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Sistema MOLDEAS

 MOLDEAS y los procesos del Ciclo de Vida




    Figura: Visi´n Funcional de MOLDEAS y los procesos del Ciclo de Vida
                o
    de Linked Data.


                              ıa ´
                      Jose Mar´ Alvarez Rodr´
                                            ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Sistema MOLDEAS

 MOLDEAS web (REST+Jquery)




                              ıa ´
                      Jose Mar´ Alvarez Rodr´
                                            ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Sistema MOLDEAS

 MOLDEAS web-Resultados (Jquery+Exhibit)




                              ıa ´
                      Jose Mar´ Alvarez Rodr´
                                            ıguez   MOLDEAS
MOLDEAS
 Marco metodol´gico
              o
   Sistema MOLDEAS

 MOLDEAS-Linked Data Frontend (Pubby)




                              ıa ´
                      Jose Mar´ Alvarez Rodr´
                                            ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o




        4   Resultados y Evaluaci´n.
                                 o
                    Metodolog´ ıa.
                    Expresividad y Cumplimiento de Criterios.
                           1   Punto de Vista Cuantitativo.
                           2   Punto de Vista Cualitativo.
                    Sistema MOLDEAS.
                           1   Consumo de Datos Enlazados Abiertos.
                           2   Rendimiento de Consultas en SPARQL.




                                       ıa ´
                               Jose Mar´ Alvarez Rodr´
                                                     ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o



 Metodolog´
          ıa

     Pasos de ejecuci´n
                     o
        1   Definici´n de los objetivos del experimento.
                   o
        2   Selecci´n de una regla de asignaci´n de las unidades experimentales
                   o                           o
            a las condiciones de estudio.
                  Cualitativos: tipo de entorno hardware y software, etc.
                  Cuantitativos: tama˜o de la muestra, de la memoria y n´mero
                                       n                                  u
                  de posibilidades de expresar una consulta.
        3   Especificaci´n de las medidas de trabajo en cuanto a la respuesta.
                       o
        4   Especificaci´n de un modelo.
                       o
        5   Ejecuci´n de un experimento piloto.
                   o
        6   Esquematizaci´n de los pasos a seguir.
                         o
        7   Determinaci´n del tama˜o muestral.
                       o          n
        8   Revisi´n de las decisiones anteriores.
                  o

                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Visi´n del experimento
     o
     Punto de Vista Cuantitativo
     ¿Cu´l es la posibilidad de uso de datos enlazados para facilitar el
        a
     acceso a un mayor n´mero de recursos relacionados con los
                           u
     anuncios de licitaci´n?
                         o

     Punto de Vista Cualitativo
     Evaluaci´n, grado de cumplimiento y comparaci´n con otros
             o                                    o
     enfoques de:
            Principios de Open Data y Linked Data.
            Buenas pr´cticas.
                     a
            Patrones de dise˜o.
                            n
            Caracter´ısticas de pertenencia a la nube de datos enlazados y
            registro CKAN.
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Visi´n del experimento
     o
     Punto de Vista Cuantitativo
     ¿Cu´l es la posibilidad de uso de datos enlazados para facilitar el
        a
     acceso a un mayor n´mero de recursos relacionados con los
                           u
     anuncios de licitaci´n?
                         o

     Punto de Vista Cualitativo
     Evaluaci´n, grado de cumplimiento y comparaci´n con otros
             o                                    o
     enfoques de:
            Principios de Open Data y Linked Data.
            Buenas pr´cticas.
                     a
            Patrones de dise˜o.
                            n
            Caracter´ısticas de pertenencia a la nube de datos enlazados y
            registro CKAN.
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios




     Expresividad
     Punto de Vista Cuantitativo.




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo
     1-Definici´n de los objetivos del experimento
              o
        1   ¿Cu´l es la expresividad actual, en t´rminos de n´mero de
                a                                e            u
            conceptos para realizar consultas, para el acceso a la
            informaci´n de anuncios de licitaci´n?
                     o                         o
        2   ¿Cu´l es la ventaja de uso de un modelo RDF para la
                 a
            expresi´n y recuperaci´n de la informaci´n de los anuncios de
                    o             o                 o
            licitaci´n?
                    o
        3   ¿C´mo favorecen los datos enlazados el aumento de
               o
            expresividad en la ejecuci´n de consultas y por tanto facilitan
                                      o
            la recuperaci´n de los anuncios de licitaci´n?
                         o                             o
        4   ¿Cu´l es el beneficio real del uso de datos enlazados para
                a
            representar la informaci´n?
                                    o
        5   ¿Se incurre en alg´n error al aumentar la expresividad?
                              u
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo


     2-Selecci´n de una regla de asignaci´n de las unidades
              o                          o
     experimentales a las condiciones de estudio
        1   Base documental D constituida por 1 mill´n de anuncios de
                                                    o
            licitaci´n.
                    o
        2   Vocabulario controlado, V, del CPV 2008, formado por
            #V = 10357 c´digos/t´rminos distintos.
                          o       e
        3   Cada documento d ∈ D, etiquetado con al menos un c´digo
                                                              o
            v ∈ V.
        4   9 Clasificaciones Est´ndar de Productos y Servicios.
                                a
        5   Clasificaci´n “puente”: ProductOntology (PO)
                      o



                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo

     3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
                  o
        1   No de enlaces entre una PSC y el CPV 2008.
        2   No de enlaces entre una PSC y el CPV 2008 a trav´s de PO.
                                                            e
        3   Ganancia de expresividad en t´rminos porcentuales.
                                         e

     4-Especificaci´n de un modelo
                  o
            El nuevo vocabulario controlado V                  psc ,   enlazado con Vpsc ,
            dispone de #V psc t´rminos.
                               e
            La ganancia se calcula como:

                              % = { (#V          psc     + #V)/#V − 1} ∗ 100                 (1)


                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez     MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo

     3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
                  o
        1   No de enlaces entre una PSC y el CPV 2008.
        2   No de enlaces entre una PSC y el CPV 2008 a trav´s de PO.
                                                            e
        3   Ganancia de expresividad en t´rminos porcentuales.
                                         e

     4-Especificaci´n de un modelo
                  o
            El nuevo vocabulario controlado V                  psc ,   enlazado con Vpsc ,
            dispone de #V psc t´rminos.
                               e
            La ganancia se calcula como:

                              % = { (#V          psc     + #V)/#V − 1} ∗ 100                 (1)


                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez     MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo
     5-Ejecuci´n de un experimento piloto
              o
            Sea V = {1, 2, 3} y Vpsc = {A, B, C , D, E }.
            El conjunto de pares enlaces es: {(A, 1), (B, 2), (C , 1)(E , 2)}.
            Por tanto, el conjunto V psc = {A, B, C , E } y el % de
            ganancia en expresividad ser´:
                                         a

                                  % = { (4 + 3)/3 − 1} ∗ 100 = 133         (2)

     6-Esquematizaci´n de los pasos a seguir
                    o
        1   Extracci´n de consultas en SPARQL para establecer el n´mero
                    o                                             u
            de enlaces entre las mismas.
        2   Procesamiento de los resultados mediante un script para
            generar los resultados.
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo
     5-Ejecuci´n de un experimento piloto
              o
            Sea V = {1, 2, 3} y Vpsc = {A, B, C , D, E }.
            El conjunto de pares enlaces es: {(A, 1), (B, 2), (C , 1)(E , 2)}.
            Por tanto, el conjunto V psc = {A, B, C , E } y el % de
            ganancia en expresividad ser´:
                                         a

                                  % = { (4 + 3)/3 − 1} ∗ 100 = 133         (2)

     6-Esquematizaci´n de los pasos a seguir
                    o
        1   Extracci´n de consultas en SPARQL para establecer el n´mero
                    o                                             u
            de enlaces entre las mismas.
        2   Procesamiento de los resultados mediante un script para
            generar los resultados.
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo




     Otros
         7-Determinaci´n del tama˜o muestral (ya indicado en el
                      o          n
         punto 1).
            8-Revisi´n de las decisiones anteriores.
                    o




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo-Resultados Parciales


       Vpsc                  #Vpsc        #V   psc       #V     psc   % real   % real   %
                                                                               PO       m´x.
                                                                                          a
       CPV 2003              8323         462            8312         4,46     80,25    80,36
       CN 2012               14552        2390           2390         23,07    23,07    140,50
       CPC 2008              4408         4402           4403         42,50    42,51    42,56
       CPA 2008              5429         5399           5410         52,12    52,23    52,41
       ISIC v4               766          765            765          7,38     7,38     7,39
       NAICS 2007            2328         2300           2300         22,20    22,20    22,47
       NAICS 2012            2212         2186           2186         21,10    21,10    21,35
       SITC v4               4017         3811           3820         36,79    36,88    38,78
                                                         ...




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez     MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo-Resultados Totales



                                                    Total
          Vpsc     #Vpsc        #V    psc     #V     psc    % real
                                                             %       % real PO
                                                             m´x.
                                                               a
                42035 21715      29586     209,66 285,66     405,86
           A˜adiendo enlaces entre CPV 2008 y Product Ontology-PO
            n
          PO    ∞       10000    N/A       96,55   96,55     ∞
                   Total con vocabulario de Product Ontology
                ∞       31715    39586     306,21 382,21     ∞




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez     MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo-Resultados




      Figura: N´mero de Elementos y Enlaces entre las PSCs y el CPV 2008.
               u
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo-Resultados




                                 Figura: Ganancia en expresividad.



                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo-Resultados
     Valoraci´n
             o
       1 Extensi´n del CPV 2008, 10357 t´rminos, hasta:
                o                       e
                    21715 t´rminos, con enlaces entre las PSCs y el CPV 2008.
                            e
                    29586 t´rminos, con enlaces entre las PSCs y el CPV 2008 a
                            e
                    trav´s de PO.
                        e
        2   Se establece un:
                    8,65 % y 6,64 % (PO) de enlaces exactos.
                    91,35 % y 93,36 % (PO) de enlaces autom´ticos.
                                                             a
        3   Cifras de ganancia:
                    Real: 209,66 %.
                    Real con PO: 285,66 %
                    M´ximo: 405,86 %.
                      a
        4   Los enlaces y la reconciliaci´n de entidades se realizan bajo un
                                         o
            umbral µ (n primeros resultados normalizados).
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo-Resultados




                             Figura: Evoluci´n N´mero de T´rminos.
                                            o   u         e


                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cuantitativo-Conclusiones


     Puntos Clave
         Aumento del vocabulario de entrada del CPV 2008 con
         Linked Data.
            Mejora de la expresividad para la realizaci´n de consultas en
                                                       o
            SPARQL.
            Incremento del n´mero de anuncios de licitaci´n a los que
                             u                           o
            se puede acceder.
            Establecimiento de una f´rmula para el c´lculo de la
                                     o              a
            ganancia del enlazado de datos.




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios




     Cumplimiento de Criterios
     Punto de Vista Cualitativo.




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo

     1-Definici´n de los objetivos del experimento
              o
        1   ¿El ciclo de vida seguido y los datos generados certifican la
            aplicaci´n de buenas pr´cticas y principios de Linked Data?
                    o               a
        2   ¿Qu´ nivel del modelo de 5
               e                                         se puede establecer?
        3   ¿Qu´ porcentaje de patrones de dise˜o se han aplicado en los datos
                e                              n
            generados?
        4   ¿Los datos generados pueden pertenecer a la nube de datos
            enlazados abiertos?
        5   ¿Los datos generados pueden pertenecer a un registro CKAN?
        6   ¿Se certifica el cumplimiento de los principios de Open Data?
        7   ¿Se puede asegurar que los datos son enlazados y abiertos?
        8   ¿Qu´ beneficios se obtienen del cumplimiento de estos objetivos?
               e


                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez      MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo
     2-Selecci´n de una regla de asignaci´n de las unidades
              o                          o
     experimentales a las condiciones de estudio
        1   Dataset RDF de los anuncios de licitaci´n p´blica.
                                                    o u
                Boletines y Publicaciones oficiales: TED y BOE.
                Plataformas de contrataci´n: AGE.
                                          o
                Servicios de terceros: Euroalert.net y Licitaciones.es
                Basados en sem´ntica: LOTED.
                                 a
        2   Dataset RDF de las PSCs.
                Publicaciones oficiales: UE, ONU, etc.
                Servicios de terceros.
        3   Dataset RDF de las organizaciones.
                Boletines y Publicaciones oficiales: TED y BORME.
                Plataformas de contrataci´n: AGE.
                                          o
                Servicios y BBDD de terceros.
                Basadas en Open Data: OpenCorporates.
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo



     3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
                  o
        1   Valor positivo, ⊕, si es un criterio que debe tener y se cumple
            (173).
        2   Valor negativo,             , si es un criterio que debe tener y no se
            cumple (0).
        3   Valor no aplicable, , si es un criterio que se desconoce, que
            se solapa con otro o no est´ asociado a ese enfoque (23).
                                       a




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo

     Dise˜o de Tablas de Validaci´n
         n                       o
            T 1 -Tabla de Validaci´n de Caracter´
                                  o             ısticas Linked Data.
            T 2 -. . . de Linked Data Patterns.
            T 3 -. . . de Principios de Linked Data.
             3
            T1 -. . . del Modelo .
            T 4 -. . . de Principios de Open Data.
             4
            T1 -. . . sobre Caracter´
                                    ısticas de Open Data.
            T 5 -. . . sobre Caracter´
                                     ısticas para pertenecer a la nube de
            Linking Open Data.
            T 6 -. . . para registrar el dataset en CKAN.


                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo
     4-Especificaci´n de un modelo
                   o
     No aplicable.

     5-Ejecuci´n de un experimento piloto
              o
     Valoraci´n inicial con s´lo un conjunto de datos.
             o               o

     6-Esquematizaci´n de los pasos a seguir
                    o
        1   Establecimiento del modelo de referencia, con los valores
            admitidos.
        2   Revisi´n uno a uno de los criterios.
                  o
        3   Agregaci´n de los resultados y valoraciones.
                    o
        4   Extracci´n de estad´
                    o          ısticas, contraste de hip´tesis, validaci´n y
                                                        o               o
            evaluaci´n.
                    o
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo
     4-Especificaci´n de un modelo
                   o
     No aplicable.

     5-Ejecuci´n de un experimento piloto
              o
     Valoraci´n inicial con s´lo un conjunto de datos.
             o               o

     6-Esquematizaci´n de los pasos a seguir
                    o
        1   Establecimiento del modelo de referencia, con los valores
            admitidos.
        2   Revisi´n uno a uno de los criterios.
                  o
        3   Agregaci´n de los resultados y valoraciones.
                    o
        4   Extracci´n de estad´
                    o          ısticas, contraste de hip´tesis, validaci´n y
                                                        o               o
            evaluaci´n.
                    o
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo
     4-Especificaci´n de un modelo
                   o
     No aplicable.

     5-Ejecuci´n de un experimento piloto
              o
     Valoraci´n inicial con s´lo un conjunto de datos.
             o               o

     6-Esquematizaci´n de los pasos a seguir
                    o
        1   Establecimiento del modelo de referencia, con los valores
            admitidos.
        2   Revisi´n uno a uno de los criterios.
                  o
        3   Agregaci´n de los resultados y valoraciones.
                    o
        4   Extracci´n de estad´
                    o          ısticas, contraste de hip´tesis, validaci´n y
                                                        o               o
            evaluaci´n.
                    o
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo




     Otros
         7-Determinaci´n del tama˜o muestral (ya indicado en el
                      o          n
         punto 1).
            8-Revisi´n de las decisiones anteriores.
                    o




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo-Resultados




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo-Resultados




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo-Resultados




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo-
 Resultados en % ⊕ entre aplicables

       Versi´n
            o                      ⊕             Total     % ⊕ entre aplicables
       Referencia                 173  0   23     196             100
                                     Anuncios de Licitaci´n
                                                         o
       TED                        32 12 152         “            72,72
       Plataforma de              35   9 152        “            79,54
       Contrataci´n
                 o
       BOE                        30          12   154     “       71,42
       Servicios Ex-              25          14   157     “       64,10
       ternos
       LOTED                       92         34   70      “       73,01
       MOLDEAS                    121         10   65      “       92,36



                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo-
 Resultados en % ⊕ entre aplicables


          Versi´n
               o                ⊕               Total    % ⊕ entre aplicables
          Referencia           173 0      23     196            100
                           Cat´logo de Clasificaciones de Productos
                              a
          CSV/                  25 12 159         “            67,56
          MSExcel
          Servicios on-          21       21      154     “         50
          line
          MOLDEAS               166           7   23      “        93,86




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo-
 Resultados en % ⊕ entre aplicables
       Versi´n
            o                      ⊕                     Total     % ⊕ entre aplicables
       Referencia                 173         0    23     196             100
                                                Organizaciones
       TED                        20           9 167       “              68,96
       Plataforma de              35          10 151       “              77,77
       Contrataci´n
                 o
       BORME                      23           1   172     “              95,83
       Servicios Ex-              20          20   156     “               50
       ternos
       BBDD exter-                12          9    175     “              57,14
       na
       Open Corpo-                85          33   78      “              72,03
       rates
       MOLDEAS                    121         10   65      “              92,36

                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo-Resultados


     Valoraci´n
             o
       1 El ciclo de vida asegura los principios y criterios de Linked

         Data y Open Data.
        2   Se establece un nivel de 5 para los datasets transformados.
        3   Se ha aplicado un alto porcentaje de patrones de dise˜o,
                                                                 n
            calidad impl´
                        ıcita para la reutilizaci´n de datos.
                                                 o
        4   Los datasets transformados pueden pertenecer a la nube de
            Linking Open Data y a un registro CKAN.
        5   En general, el enfoque de MOLDEAS mejora cualitativamente
            la informaci´n y datos respecto a otros enfoques.
                        o



                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Expresividad y Cumplimiento de Criterios

 Punto de Vista Cualitativo-Conclusiones

     Puntos Clave
            Mejora cualitativa la informaci´n y datos.
                                           o
            Aumento de la visi´n global de los datos, expresividad y
                              o
            estructuraci´n.
                        o
            Aplicaci´n intensiva de est´ndares.
                    o                  a
            Incremento del conocimiento en el dominio de e-Procurement.
            Impulso de la reutilizaci´n de la informaci´n y datos, mayor
                                     o                 o
            poder de redistribuci´n.
                                 o
            Minimizaci´n de restricciones tecnol´gicas.
                      o                         o
            Minimizaci´n de aspectos discriminatorios.
                      o
            Aumento de la transparencia, inclusi´n y responsabilidad.
                                                o
            Alineaci´n con las actuales propuestas estrat´gicas de futuro.
                    o                                    e
            ...

                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS




     Sistema MOLDEAS
     Consumo de Datos Enlazados Abiertos.




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos

     Objetivos Generales
            Consumir los datos enlazados desde un lenguaje de programaci´n.
                                                                        o
            Crear un sistema de recuperaci´n de informaci´n.
                                          o              o

     1-Definici´n de los objetivos del experimento
              o
        1   ¿Es posible implementar un sistema de recuperaci´n de informaci´n
                                                               o             o
            utilizando datos enlazados?
        2   ¿Es posible explotar las relaciones sem´nticas establecidas para
                                                    a
            mejorar la recuperaci´n de informaci´n?
                                 o                o
        3   ¿Cu´l es el mejor enfoque para la recuperaci´n de informaci´n en
                a                                       o              o
            los anuncios de licitaci´n?
                                    o
        4   ¿C´mo afectan los resultados en la implementaci´n actual del
               o                                           o
            sistema MOLDEAS?

                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos

     Objetivos Generales
            Consumir los datos enlazados desde un lenguaje de programaci´n.
                                                                        o
            Crear un sistema de recuperaci´n de informaci´n.
                                          o              o

     1-Definici´n de los objetivos del experimento
              o
        1   ¿Es posible implementar un sistema de recuperaci´n de informaci´n
                                                               o             o
            utilizando datos enlazados?
        2   ¿Es posible explotar las relaciones sem´nticas establecidas para
                                                    a
            mejorar la recuperaci´n de informaci´n?
                                 o                o
        3   ¿Cu´l es el mejor enfoque para la recuperaci´n de informaci´n en
                a                                       o              o
            los anuncios de licitaci´n?
                                    o
        4   ¿C´mo afectan los resultados en la implementaci´n actual del
               o                                           o
            sistema MOLDEAS?

                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos

     2-Selecci´n de una regla de asignaci´n de las unidades
              o                          o
     experimentales a las condiciones de estudio
        1   Unidad experimental de este estudio ser´ un repositorio RDF.
                                                   a
        2   Base documental D constituida por 1 mill´n de anuncios de
                                                    o
            licitaci´n.
                    o
        3   Vocabulario controlado, V, del CPV 2008, formado por 10357
            c´digos/t´rminos distintos.
             o       e
        4   Cada documento d ∈ D, etiquetado con al menos un c´digo
                                                              o
            v ∈ V.
        5   11 consultas, Qstr , proporcionadas por Euroalert.net.
        6   Las medidas de evaluaci´n dependen del no de c´digos CPV
                                   o                      o
            generados por MOLDEAS.

                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos



       Qi      Consulta de Usuario-Qstr                                  No de C´digos
                                                                                  o
                                                                         CPV relevantes-
                                                                             i
                                                                         #Qcpv
       Q1      ...                                                       463
       Q2      ...                                                       35
       Q3      ...                                                       7
       Q4      ...                                                       26
       Q5      ...                                                       277
                                                         ...




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez         MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos



       Qi       Consulta de Usuario-Qstr                           No de C´digos
                                                                            o
                                                                   CPV relevantes-
                                                                       i
                                                                   #Qcpv
       Q6       ...                                                1
       Q7       ...                                                117
       Q8       ...                                                13
       Q9       ...                                                10
       Q10      ...                                                173
       Q11      ...                                                13




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos


       M´todo
        e                  Descripci´n o                             Tecnolog´
                                                                             ıa
       M1                  Se indexan las descripciones de los       Apache Lucene y Solr
                           c´digos CPV y proceso de b´sque-
                             o                              u
                           da sint´ctica de las consultas Qi .
                                    a
       M2                  Se extraen una serie de c´digos  o        M 1 + ponderaci´n o
                           CPV candidatos seg´n jerarqu´
                                                  u           ıa.    broader/ narrower
       M3                  . . . seg´n jerarqu´ con Spreading
                                    u          ıa                    M 1 + ONTOSPREAD
                           Activation.
       M4                  . . . seg´n hist´rico de las relaciones
                                    u      o                         M 1 + Apache Mahout
                           entre c´digos de los anuncios pre-
                                    o
                           vios.




                                     ıa ´
                             Jose Mar´ Alvarez Rodr´
                                                   ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos


     3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
                  o
        1   Para cada consulta se recogen los c´digos CPV 2008
                                               o
            generados.
        2   Se comparan con los indicados en las consultas Qi .
        3   Se obtienen las medidas Precisi´n, Recall, Accuracy y
                                           o
            Specificity (PRAS).

     5-Ejecuci´n de un experimento piloto
              o
     En primer lugar se realiza una consulta para verificar el proceso de
     b´squeda en cada m´todo y la obtenci´n de medidas.
      u                   e                 o



                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos


     3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta
                  o
        1   Para cada consulta se recogen los c´digos CPV 2008
                                               o
            generados.
        2   Se comparan con los indicados en las consultas Qi .
        3   Se obtienen las medidas Precisi´n, Recall, Accuracy y
                                           o
            Specificity (PRAS).

     5-Ejecuci´n de un experimento piloto
              o
     En primer lugar se realiza una consulta para verificar el proceso de
     b´squeda en cada m´todo y la obtenci´n de medidas.
      u                   e                 o



                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos
     6-Esquematizaci´n de los pasos a seguir
                    o
        1   A cada consulta Qstr , identificada como Qi , se le aplica un
            m´todo M i , devuelve al #Qcpv elementos.
             e                           i

                                      M                  i
        2   Cada conjunto resultado Qcpv se compara con el conjunto
                      i
            esperado Qcpv con un script.
        3   Se generan los valores PRAS para cada m´todo M i y consulta
                                                   e
            de entrada Qi .

     Otros
      1 4-Especificaci´n de un modelo (N/A).
                     o
        2   7-Determinaci´n del tama˜o muestral (ya indicado en el
                         o          n
            punto 1).
        3   8-Revisi´n de las decisiones anteriores.
                    o
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez       MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos
     6-Esquematizaci´n de los pasos a seguir
                    o
        1   A cada consulta Qstr , identificada como Qi , se le aplica un
            m´todo M i , devuelve al #Qcpv elementos.
             e                           i

                                      M                  i
        2   Cada conjunto resultado Qcpv se compara con el conjunto
                      i
            esperado Qcpv con un script.
        3   Se generan los valores PRAS para cada m´todo M i y consulta
                                                   e
            de entrada Qi .

     Otros
      1 4-Especificaci´n de un modelo (N/A).
                     o
        2   7-Determinaci´n del tama˜o muestral (ya indicado en el
                         o          n
            punto 1).
        3   8-Revisi´n de las decisiones anteriores.
                    o
                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez       MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos-
                       ¯
 Resultados Agregados (X )



                M´todo
                  e             Precisi´n
                                       o          Recall     Accuracy   Specificity
                  1
                M                 0, 28            0, 26       0, 99      1, 00
                M2                0, 11            0, 11       0, 98      0, 99
                M3                0, 23            0, 23       0, 99      1, 00
                M4                0, 03            0, 03       0, 96      0, 98




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez     MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos-Resultados



     Valoraci´n
             o
       1 El tipo y formato de una fuente de datos no es impedimento

         para la construcci´n de servicios en un dominio determinado.
                           o
        2   Las relaciones sem´nticas de los datos se pueden explotar para
                              a
            recuperar informaci´n.
                               o
        3   El enfoque tradicional sint´ctico, M 1 , se comporta m´s
                                       a                          a
            cercano a las expectativas del usuario.




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS

 Consumo de Datos Enlazados Abiertos-Conclusiones




     Principal Punto Clave
     La casu´ıstica de un sistema de soporte a la decisi´n o de
                                                        o
     recuperaci´n a la informaci´n en e-Procurement es muy
                o               o
     compleja, existen muchas variables de informaci´n que se
                                                         o
     pueden optimizar.




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
MOLDEAS
 Resultados y Evaluaci´n
                      o
   Sistema MOLDEAS




     Sistema MOLDEAS
     Rendimiento de Consultas en SPARQL.




                                   ıa ´
                           Jose Mar´ Alvarez Rodr´
                                                 ıguez   MOLDEAS
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation
PhD Presentation

More Related Content

Similar to PhD Presentation

El desarrollo industrial en slp,
El desarrollo industrial en slp,El desarrollo industrial en slp,
El desarrollo industrial en slp,cristopher9082010
 
El desarrollo industrial en slp,
El desarrollo industrial en slp,El desarrollo industrial en slp,
El desarrollo industrial en slp,angel2893
 
Despliegue de necesidades de información.
Despliegue de necesidades de información.Despliegue de necesidades de información.
Despliegue de necesidades de información.Adrian Zaragoza Tapia
 
Metodología de la investigación
Metodología de la investigaciónMetodología de la investigación
Metodología de la investigaciónfabri72
 
Metodología de la investigación científica aplicada a las ciencias administra...
Metodología de la investigación científica aplicada a las ciencias administra...Metodología de la investigación científica aplicada a las ciencias administra...
Metodología de la investigación científica aplicada a las ciencias administra...washo
 
3. objetivos, justificacion y marco teorico
3.  objetivos, justificacion y marco teorico3.  objetivos, justificacion y marco teorico
3. objetivos, justificacion y marco teoricoEdgar Condor Capcha
 
Tecnologías semánticas en sanidad
Tecnologías semánticas en sanidadTecnologías semánticas en sanidad
Tecnologías semánticas en sanidadSngular Meaning
 
Presentación cuantitativa 1
Presentación cuantitativa 1Presentación cuantitativa 1
Presentación cuantitativa 1CONASIN PERU
 
Clase justificacion[1]
Clase justificacion[1]Clase justificacion[1]
Clase justificacion[1]Jorge Luis A L
 
Estudio demercado
Estudio demercadoEstudio demercado
Estudio demercadotefytorresb
 
Investigación Aplicada al Diplomado aeropuertos asa ipn
Investigación Aplicada al Diplomado aeropuertos asa ipnInvestigación Aplicada al Diplomado aeropuertos asa ipn
Investigación Aplicada al Diplomado aeropuertos asa ipnFacultad de Arquitectura UNAM
 
ante proyecto feria de la ciencia
ante proyecto feria de la cienciaante proyecto feria de la ciencia
ante proyecto feria de la cienciaoskitarlds
 
RECOPILACION DE INFORMACION PARA TRABAJOS DE INVESTIGACION
RECOPILACION DE INFORMACION PARA TRABAJOS DE INVESTIGACION RECOPILACION DE INFORMACION PARA TRABAJOS DE INVESTIGACION
RECOPILACION DE INFORMACION PARA TRABAJOS DE INVESTIGACION ChoqueTarquiBetty
 
FORMATO PARA LA PRESENTACIÓN DE PROYECTOS DE INVESTIGACIÓN
FORMATO PARA LA PRESENTACIÓN DE PROYECTOS DE INVESTIGACIÓNFORMATO PARA LA PRESENTACIÓN DE PROYECTOS DE INVESTIGACIÓN
FORMATO PARA LA PRESENTACIÓN DE PROYECTOS DE INVESTIGACIÓNMauro Hoyos
 

Similar to PhD Presentation (20)

El desarrollo industrial en slp,
El desarrollo industrial en slp,El desarrollo industrial en slp,
El desarrollo industrial en slp,
 
El desarrollo industrial en slp,
El desarrollo industrial en slp,El desarrollo industrial en slp,
El desarrollo industrial en slp,
 
Asesoramiento de tesis
Asesoramiento de tesisAsesoramiento de tesis
Asesoramiento de tesis
 
Despliegue de necesidades de información.
Despliegue de necesidades de información.Despliegue de necesidades de información.
Despliegue de necesidades de información.
 
Metodología de la investigación
Metodología de la investigaciónMetodología de la investigación
Metodología de la investigación
 
Etapa del proceso de investigación (parte 1)
Etapa del proceso de investigación  (parte 1)Etapa del proceso de investigación  (parte 1)
Etapa del proceso de investigación (parte 1)
 
Clase 2 aspectos generales
Clase 2 aspectos generalesClase 2 aspectos generales
Clase 2 aspectos generales
 
Metodología de la investigación científica aplicada a las ciencias administra...
Metodología de la investigación científica aplicada a las ciencias administra...Metodología de la investigación científica aplicada a las ciencias administra...
Metodología de la investigación científica aplicada a las ciencias administra...
 
3. objetivos, justificacion y marco teorico
3.  objetivos, justificacion y marco teorico3.  objetivos, justificacion y marco teorico
3. objetivos, justificacion y marco teorico
 
Unidad 3 problema
Unidad 3 problema Unidad 3 problema
Unidad 3 problema
 
El proceso de investigacion
El proceso de investigacionEl proceso de investigacion
El proceso de investigacion
 
Tecnologías semánticas en sanidad
Tecnologías semánticas en sanidadTecnologías semánticas en sanidad
Tecnologías semánticas en sanidad
 
Presentación cuantitativa 1
Presentación cuantitativa 1Presentación cuantitativa 1
Presentación cuantitativa 1
 
Clase justificacion[1]
Clase justificacion[1]Clase justificacion[1]
Clase justificacion[1]
 
Casos Colombianos de Marketing
Casos Colombianos de MarketingCasos Colombianos de Marketing
Casos Colombianos de Marketing
 
Estudio demercado
Estudio demercadoEstudio demercado
Estudio demercado
 
Investigación Aplicada al Diplomado aeropuertos asa ipn
Investigación Aplicada al Diplomado aeropuertos asa ipnInvestigación Aplicada al Diplomado aeropuertos asa ipn
Investigación Aplicada al Diplomado aeropuertos asa ipn
 
ante proyecto feria de la ciencia
ante proyecto feria de la cienciaante proyecto feria de la ciencia
ante proyecto feria de la ciencia
 
RECOPILACION DE INFORMACION PARA TRABAJOS DE INVESTIGACION
RECOPILACION DE INFORMACION PARA TRABAJOS DE INVESTIGACION RECOPILACION DE INFORMACION PARA TRABAJOS DE INVESTIGACION
RECOPILACION DE INFORMACION PARA TRABAJOS DE INVESTIGACION
 
FORMATO PARA LA PRESENTACIÓN DE PROYECTOS DE INVESTIGACIÓN
FORMATO PARA LA PRESENTACIÓN DE PROYECTOS DE INVESTIGACIÓNFORMATO PARA LA PRESENTACIÓN DE PROYECTOS DE INVESTIGACIÓN
FORMATO PARA LA PRESENTACIÓN DE PROYECTOS DE INVESTIGACIÓN
 

More from CARLOS III UNIVERSITY OF MADRID

Engineering 4.0: Digitization through task automation and reuse
Engineering 4.0:  Digitization through task automation and reuseEngineering 4.0:  Digitization through task automation and reuse
Engineering 4.0: Digitization through task automation and reuseCARLOS III UNIVERSITY OF MADRID
 
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...CARLOS III UNIVERSITY OF MADRID
 
Sailing the V: Engineering digitalization through task automation and reuse i...
Sailing the V: Engineering digitalization through task automation and reuse i...Sailing the V: Engineering digitalization through task automation and reuse i...
Sailing the V: Engineering digitalization through task automation and reuse i...CARLOS III UNIVERSITY OF MADRID
 
AI4SE: Challenges and opportunities in the integration of Systems Engineering...
AI4SE: Challenges and opportunities in the integration of Systems Engineering...AI4SE: Challenges and opportunities in the integration of Systems Engineering...
AI4SE: Challenges and opportunities in the integration of Systems Engineering...CARLOS III UNIVERSITY OF MADRID
 
Challenges in the integration of Systems Engineering and the AI/ML model life...
Challenges in the integration of Systems Engineering and the AI/ML model life...Challenges in the integration of Systems Engineering and the AI/ML model life...
Challenges in the integration of Systems Engineering and the AI/ML model life...CARLOS III UNIVERSITY OF MADRID
 
OSLC KM: Elevating the meaning of data and operations within the toolchain
OSLC KM: Elevating the meaning of data and operations within the toolchainOSLC KM: Elevating the meaning of data and operations within the toolchain
OSLC KM: Elevating the meaning of data and operations within the toolchainCARLOS III UNIVERSITY OF MADRID
 
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...CARLOS III UNIVERSITY OF MADRID
 
Systems and Software Architecture: an introduction to architectural modelling
Systems and Software Architecture: an introduction to architectural modellingSystems and Software Architecture: an introduction to architectural modelling
Systems and Software Architecture: an introduction to architectural modellingCARLOS III UNIVERSITY OF MADRID
 
Detection of fraud in financial blockchain-based transactions through big dat...
Detection of fraud in financial blockchain-based transactions through big dat...Detection of fraud in financial blockchain-based transactions through big dat...
Detection of fraud in financial blockchain-based transactions through big dat...CARLOS III UNIVERSITY OF MADRID
 
News headline generation with sentiment and patterns: A case study of sports ...
News headline generation with sentiment and patterns: A case study of sports ...News headline generation with sentiment and patterns: A case study of sports ...
News headline generation with sentiment and patterns: A case study of sports ...CARLOS III UNIVERSITY OF MADRID
 

More from CARLOS III UNIVERSITY OF MADRID (20)

Proyecto IVERES-UC3M
Proyecto IVERES-UC3MProyecto IVERES-UC3M
Proyecto IVERES-UC3M
 
RTVE: Sustainable Development Goal Radar
RTVE: Sustainable Development Goal  RadarRTVE: Sustainable Development Goal  Radar
RTVE: Sustainable Development Goal Radar
 
Engineering 4.0: Digitization through task automation and reuse
Engineering 4.0:  Digitization through task automation and reuseEngineering 4.0:  Digitization through task automation and reuse
Engineering 4.0: Digitization through task automation and reuse
 
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
LOTAR-PDES: Engineering digitalization through task automation and reuse in t...
 
SESE 2021: Where Systems Engineering meets AI/ML
SESE 2021: Where Systems Engineering meets AI/MLSESE 2021: Where Systems Engineering meets AI/ML
SESE 2021: Where Systems Engineering meets AI/ML
 
Sailing the V: Engineering digitalization through task automation and reuse i...
Sailing the V: Engineering digitalization through task automation and reuse i...Sailing the V: Engineering digitalization through task automation and reuse i...
Sailing the V: Engineering digitalization through task automation and reuse i...
 
Deep Learning Notes
Deep Learning NotesDeep Learning Notes
Deep Learning Notes
 
H2020-AHTOOLS Use Case 3 Functional Design
H2020-AHTOOLS Use Case 3 Functional DesignH2020-AHTOOLS Use Case 3 Functional Design
H2020-AHTOOLS Use Case 3 Functional Design
 
AI4SE: Challenges and opportunities in the integration of Systems Engineering...
AI4SE: Challenges and opportunities in the integration of Systems Engineering...AI4SE: Challenges and opportunities in the integration of Systems Engineering...
AI4SE: Challenges and opportunities in the integration of Systems Engineering...
 
INCOSE IS 2019: AI and Systems Engineering
INCOSE IS 2019: AI and Systems EngineeringINCOSE IS 2019: AI and Systems Engineering
INCOSE IS 2019: AI and Systems Engineering
 
Challenges in the integration of Systems Engineering and the AI/ML model life...
Challenges in the integration of Systems Engineering and the AI/ML model life...Challenges in the integration of Systems Engineering and the AI/ML model life...
Challenges in the integration of Systems Engineering and the AI/ML model life...
 
Blockchain en la Industria Musical
Blockchain en la Industria MusicalBlockchain en la Industria Musical
Blockchain en la Industria Musical
 
OSLC KM: Elevating the meaning of data and operations within the toolchain
OSLC KM: Elevating the meaning of data and operations within the toolchainOSLC KM: Elevating the meaning of data and operations within the toolchain
OSLC KM: Elevating the meaning of data and operations within the toolchain
 
Blockchain y sector asegurador
Blockchain y sector aseguradorBlockchain y sector asegurador
Blockchain y sector asegurador
 
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
OSLC KM (Knowledge Management): elevating the meaning of data and operations ...
 
Systems and Software Architecture: an introduction to architectural modelling
Systems and Software Architecture: an introduction to architectural modellingSystems and Software Architecture: an introduction to architectural modelling
Systems and Software Architecture: an introduction to architectural modelling
 
Detection of fraud in financial blockchain-based transactions through big dat...
Detection of fraud in financial blockchain-based transactions through big dat...Detection of fraud in financial blockchain-based transactions through big dat...
Detection of fraud in financial blockchain-based transactions through big dat...
 
News headline generation with sentiment and patterns: A case study of sports ...
News headline generation with sentiment and patterns: A case study of sports ...News headline generation with sentiment and patterns: A case study of sports ...
News headline generation with sentiment and patterns: A case study of sports ...
 
Blockchain y la industria musical
Blockchain y la industria musicalBlockchain y la industria musical
Blockchain y la industria musical
 
Preparing your Big Data start-up pitch
Preparing your Big Data start-up pitchPreparing your Big Data start-up pitch
Preparing your Big Data start-up pitch
 

Recently uploaded

Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 

Recently uploaded (16)

Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 

PhD Presentation

  • 1. MOLDEAS M´todos Sem´nticos de Reutilizaci´n de Datos e a o Abiertos Enlazados en las Licitaciones P´blicas u Tesis Doctoral presentada por ıa ´ Jose Mar´ Alvarez Rodr´ ıguez Dirigida por Profesor Doctor D. Jos´ Emilio Labra Gayo e Sistemas y Servicios Inform´ticos para Internet a Departamento de Inform´tica a Universidad de Oviedo Oviedo, 14 de Junio de 2012 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 2. MOLDEAS 1 Objeto de la Investigaci´n o 2 Marco te´rico y conceptual o 3 Marco metodol´gico o 4 Resultados y Evaluaci´n o 5 Conclusiones ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 3. MOLDEAS Objeto de la Investigaci´n o 1 Objeto de la Investigaci´n. o Formulaci´n del Problema. o Justificaci´n del Estudio. o Objetivo General. Objetivos Espec´ıficos. Hip´tesis. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 4. MOLDEAS Objeto de la Investigaci´n o Formulaci´n del Problema o Problema ¿Por qu´ aplicar m´todos sem´nticos y los principios de Linked e e a Data y Open Data al dominio de las licitaciones p´blicas? u Contexto ¿Cu´les son las licitaciones p´blicas sobre ((construcci´n de puentes a u o y carreteras)) publicadas en la regi´n de B´lgica cuyo idioma es o e holand´s durante 2011 y cuyo importe est´ entre 100 y 200K e a euros? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 5. MOLDEAS Objeto de la Investigaci´n o Formulaci´n del Problema o Problema ¿Por qu´ aplicar m´todos sem´nticos y los principios de Linked e e a Data y Open Data al dominio de las licitaciones p´blicas? u Contexto ¿Cu´les son las licitaciones p´blicas sobre ((construcci´n de puentes a u o y carreteras)) publicadas en la regi´n de B´lgica cuyo idioma es o e holand´s durante 2011 y cuyo importe est´ entre 100 y 200K e a euros? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 6. MOLDEAS Objeto de la Investigaci´n o Justificaci´n del Estudio o Motivaci´n o Profundizaci´n en el ´rea de estudio. o a Corriente de investigaci´n en continua evoluci´n. o o Investigaci´n e Innovaci´n. o o Servicios de valor a˜adido. n Sector estrat´gico en las Administraciones P´blicas (AAPP). e u ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 7. MOLDEAS Objeto de la Investigaci´n o Justificaci´n del Estudio o Motivaci´n Cient´ o ıfica Formalizaci´n del conocimiento de un dominio. o Aplicaci´n de modelos est´ndar a un dominio. o a Integraci´n de fuentes de datos. o Mejora y consolidaci´n de las t´cnicas actuales. o e Generaci´n de conocimiento, nuevos datos y enfoques. o Aportaciones a otros investigadores, comunidad. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 8. MOLDEAS Objeto de la Investigaci´n o Justificaci´n del Estudio o Motivaci´n Tecnol´gica o o Aplicaci´n de nuevas soluciones t´cnicas. o e Gesti´n avanzada de la informaci´n y datos. o o Mejora de los procesos de acceso a la informaci´n. o Cobertura a las necesidades de la cadena de valor del proceso administrativo. Impulso de un sector trascendente: econ´mico, social, o financiero, etc. Generaci´n de nuevas oportunidades de negocio. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 9. MOLDEAS Objeto de la Investigaci´n o Objetivo General Sem´ntica + Linked Data + Open Data a Aplicaci´n de la tecnolog´ y m´todos sem´nticos al dominio de la o ıa e a contrataci´n p´blica electr´nica para dar soporte a los principios de o u o las iniciativas de Linked Data y Open Data. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 10. MOLDEAS Objeto de la Investigaci´n o Objetivos Espec´ ıficos 1 Estudiar, analizar y valorar: Contrataci´n P´blica y e-Procurement. o u Web Sem´ntica, Linked Data y Open Data. a 2 Definir m´todos basados en sem´ntica para gestionar la e a informaci´n de los anuncios de licitaci´n. o o 3 Implementar y reutilizar los componentes software. 4 Promover el uso de est´ndares, la reutilizaci´n de informaci´n a o o y los modelos de conocimiento compartido. 5 Aplicar los m´todos sem´nticos definidos al contexto de e a e-Procurement. 6 Establecer un conjunto de prueba y validaci´n. o 7 Difundir, formar y transferir la tecnolog´ y conocimiento. ıa ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 11. MOLDEAS Objeto de la Investigaci´n o Hip´tesis o Hip´tesis de la Investigaci´n o o Es posible mejorar el acceso a la informaci´n contenida en los o anuncios de licitaci´n de las distintas instituciones p´blicas o u europeas, tanto en t´rminos cuantitativos como cualitativos, e mediante m´todos sem´nticos basados en aplicar y cumplir los e a principios de la iniciativa Linked Data y de la misma forma mantener y favorecer los principios de la corriente Open Data. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 12. MOLDEAS Objeto de la Investigaci´n o Hip´tesis o T´rminos cualitativos e ¿Se puede mejorar el acceso a la informaci´n y datos utilizando o sem´ntica? a T´rminos cuantitativos e ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n u o utilizando sem´ntica? a Aplicar, cumplir, mantener y favorecer ¿Se puede realizar este enfoque cumpliendo con los principios y corrientes actuales? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 13. MOLDEAS Objeto de la Investigaci´n o Hip´tesis o T´rminos cualitativos e ¿Se puede mejorar el acceso a la informaci´n y datos utilizando o sem´ntica? a T´rminos cuantitativos e ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n u o utilizando sem´ntica? a Aplicar, cumplir, mantener y favorecer ¿Se puede realizar este enfoque cumpliendo con los principios y corrientes actuales? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 14. MOLDEAS Objeto de la Investigaci´n o Hip´tesis o T´rminos cualitativos e ¿Se puede mejorar el acceso a la informaci´n y datos utilizando o sem´ntica? a T´rminos cuantitativos e ¿Se puede acceder a un mayor n´mero de anuncios de licitaci´n u o utilizando sem´ntica? a Aplicar, cumplir, mantener y favorecer ¿Se puede realizar este enfoque cumpliendo con los principios y corrientes actuales? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 15. MOLDEAS Marco te´rico y conceptual o 2 Marco te´rico y conceptual o Contrataci´n P´blica y e-Procurement. o u Web Sem´ntica. a Linked Data y Open Data. e-Procurement y Sem´ntica. a ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 16. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o e-Procurement Sector estrat´gico. 17 % del PIB. e Impulsado desde la Uni´n Europea (adopci´n paulatina). o o Plan de Acci´n 2004 y Europa 2020. o M´ltiples fases y etapas (mara˜a de requisitos t´cnicos). u n e Informaci´n y datos valiosos. Sociedad de la Informaci´n. o o Marco legal definido y en evoluci´n (homogeneizaci´n). o o 16K anuncios de licitaci´n nuevos al d´ o ıa. Necesidad de impulso de la participaci´n de las peque˜as y o n medianas empresas (PYMES). ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 17. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Fases de e-Procurement Figura: Diagrama de Complejidad y Fases de e-Procurement. Fuente: Uni´n Europea. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 18. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Definici´n de e-Procurement o Contrataci´n P´blica Electr´nica o u o La contrataci´n electr´nica es un t´rmino general utilizado para o o e designar la sustituci´n de los procedimientos basados en soporte de o papel por el tratamiento y la comunicaci´n mediante TIC a lo o largo de toda la cadena de contrataci´n p´blica. o u Publicaci´n de los anuncios de licitaci´n. o o Suministro del pliego de condiciones. Presentaci´n de ofertas. o Adjudicaci´n. o Facturaci´n y pago. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 19. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Definici´n de e-Procurement o Contrataci´n P´blica Electr´nica o u o La contrataci´n electr´nica es un t´rmino general utilizado para o o e designar la sustituci´n de los procedimientos basados en soporte de o papel por el tratamiento y la comunicaci´n mediante TIC a lo o largo de toda la cadena de contrataci´n p´blica. o u Publicaci´n de los anuncios de licitaci´n. o o Suministro del pliego de condiciones. Presentaci´n de ofertas. o Adjudicaci´n. o Facturaci´n y pago. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 20. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Silos de Informaci´n o Figura: Silos de Informaci´n en e-Procurement de la Uni´n Europea. o o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 21. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Multiling¨ismo y multiculturalidad. u Figura: Concepto “mesitas”, “mesas de caf´”, etc. e ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 22. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Acciones de la Uni´n Europea o Tenders Electronic Daily (TED) y Sistema de Informaci´n o para la contrataci´n p´blica europea (SIMAP). o u Clasificaciones Est´ndar de Productos y Servicios (CPV). a Clasificaci´n de regiones (NUTS). o Plataformas de Contrataci´n. o Proyectos destacados: 1 e-Certis. 2 Fiscalis 2013. 3 ePRIOR. 4 PEPPOL-Pan-European Public Procurement Online. 5 STORK -Secure idenTity acrOss euRope linKed. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 23. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Acciones de la Uni´n Europea o Tenders Electronic Daily (TED) y Sistema de Informaci´n o para la contrataci´n p´blica europea (SIMAP). o u Clasificaciones Est´ndar de Productos y Servicios (CPV). a Clasificaci´n de regiones (NUTS). o Plataformas de Contrataci´n. o Proyectos destacados: 1 e-Certis. 2 Fiscalis 2013. 3 ePRIOR. 4 PEPPOL-Pan-European Public Procurement Online. 5 STORK -Secure idenTity acrOss euRope linKed. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 24. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Modelo de Informaci´n o TED (XML-Schema). CODICE (XML-Schema). opXML (XML-Schema). ... Valoraci´n o Sobre-especificaci´n. o Escasa convergencia (nombrado, especificidad, etc.) e interoperabilidad. Falta de consenso. Replicaci´n de esfuerzos. o Necesidades transversales: publicaci´n de informaci´n, gesti´n o o o de pagos, etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 25. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Modelo de Informaci´n o TED (XML-Schema). CODICE (XML-Schema). opXML (XML-Schema). ... Valoraci´n o Sobre-especificaci´n. o Escasa convergencia (nombrado, especificidad, etc.) e interoperabilidad. Falta de consenso. Replicaci´n de esfuerzos. o Necesidades transversales: publicaci´n de informaci´n, gesti´n o o o de pagos, etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 26. MOLDEAS Marco te´rico y conceptual o Contrataci´n P´blica Electr´nica o u o Principales Problemas Puntos de Mejora Dispersi´n de la informaci´n. o o Mismo anuncio en m´s de una fuente. a Heterogeneidad de los formatos de los anuncios. Diversidad de formatos de explotaci´n. o Multiling¨ismo y multiculturalidad. u Otros: almacenamiento, etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 27. MOLDEAS Marco te´rico y conceptual o Web Sem´ntica a Web Sem´ntica a Caracter´ ısticas Principales Modelo de datos est´ndar para representar recursos. Grafo a RDF (sujeto, predicado, objeto). Formalizaci´n del conocimiento mediante ontolog´ basadas o ıas en l´gica (DL). o Facilidad para su extensi´n y crecimiento din´mico. o a Aplicaci´n de est´ndares en representaci´n (OWL2) y acceso o a o (SPARQL). Baja intrusividad con sistemas existentes. Mejora de la interoperabilidad e integraci´n. o Soporte para la creaci´n de sistemas basados en conocimiento. o Gran variedad de vocabularios, conjuntos de datos, etc., en distintos dominios. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 28. MOLDEAS Marco te´rico y conceptual o Datos Enlazados Linked Data Principios 1 Use URIs as names for things. 2 When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL). 3 Include links to other URIs. Figura: Modelo 5 (W3C). 4 Use HTTP URIs. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 29. MOLDEAS Marco te´rico y conceptual o Datos Enlazados Linked Data Ventajas Realizaci´n pr´ctica de la Web Sem´ntica. o a a Identificaci´n unica, uso de HTTP URIs. o ´ Modelo y acceso est´ndar. a Enriquecimiento de recursos, creaci´n de enlaces. o Estructuraci´n, modelo est´ndar RDF. o a Expresividad, vocabularios y datasets. Reutilizaci´n de informaci´n y datos. o o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 30. MOLDEAS Marco te´rico y conceptual o Datos Abiertos Open Data Los 8 principios Data Must Be Complete. . . . Primary. . . . Timely. . . . Accessible. . . . Machine processable. Access Must Be Non-Discriminatory. Data Formats Must Be Non-Proprietary. Data Must Be License-free. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 31. MOLDEAS Marco te´rico y conceptual o Datos Abiertos Open Data Ventajas Inclusi´n. o Transparencia. Responsabilidad. Reutilizaci´n de informaci´n del sector p´blico (PSI). o o u Generaci´n de m´ltiples vistas de los datos. o u Creaci´n de servicios de valor a˜adido. o n Integraci´n de fuentes de datos. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 32. MOLDEAS Marco te´rico y conceptual o Datos Abiertos Iniciativas Open Data Figura: Datos Abiertos en Espa˜a. n Fuente: http://datos.gob.es ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 33. MOLDEAS Marco te´rico y conceptual o Datos Abiertos Enlazados Linking Open Data Figura: Linking Open Data cloud. 203 datasets, 25 billones de tripletas RDF y unos 395 millones de enlaces entre los datos (Sept. 2010). Dominios: Media, Geographic, Government (42,09 %), Publications, Cross-domain, Life sciences, etc. (Ago. 2011). 393 datasets (Jun. 2012). Fuente: R. Cyganiak & A. Jentzsch. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 34. MOLDEAS Marco te´rico y conceptual o Datos Abiertos Enlazados Ciclos de Vida en Linked Data Linked Data Design Considerations [1]. Linked Data Patterns [2]. Grupo de trabajo del W3C-Government Linked Data (GLD) [3]: 1 Publishing Open Government Data [4] y Best Practices [5,6]. 2 Government Linked Data-Life Cycle y Linked Data Cookbook [7]. LOD2 Stack [8], proyecto europeo LOD2. Toward a Basic Profile for Linked Data [9], IBM y W3C. Metodolog´ BCN y UNIOVI [10]. ıa Linked Open Data: The Essentials [11]. Otros: por pa´ (UK, EEUU, etc.), empresa (Talis Platform, ıs TopQuadrant, etc.), etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 35. MOLDEAS Marco te´rico y conceptual o Datos Abiertos Enlazados Ciclos de Vida en Linked Data Problemas encontrados Marem´gnum recetas/metodolog´ a ıas/buenas pr´cticas. a Diferentes niveles de abstracci´n y mezcla en las tareas. o Baja definici´n de responsables en las tareas. o Baja especificaci´n de resultados de las tareas. o Ajuste a casu´ ıstica concreta. Especificaciones te´ricas o en desarrollo. o Ausencia de relaci´n entre las mismas. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 36. MOLDEAS Marco te´rico y conceptual o Contraci´n P´blica Electr´nica y Sem´ntica o u o a e-Procurement y Sem´ntica a Actividades e Iniciativas Taxonom´ de productos y servicios: CPA, CPC, CPV, ıas NAICS, etc. Vocabularios XML de negocio: ebXML, XBRL, SBVR o SCOR. Vocabularios basados en sem´ntica: GoodRelations, a ProductOntology, Organizations ontology, FOAF, etc. Ontolog´ Rep´blica Checa y proyecto LOTED. ıas: u Proyectos europeos: LOD2 (WP9), LATC, PlanetData, etc. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 37. MOLDEAS Marco te´rico y conceptual o Resumen Puntos Clave ...a considerar... e-Procurement dominio heterog´neo: informaci´n, datos, e o proveedores, etc. Necesidades de identificaci´n, integraci´n, modelo est´ndar, o o a etc. Los principios de la Web Sem´ntica se ajustan a estas a necesidades. Linked Data y Open Data corrientes actuales estrat´gicas. e Ausencia de un ciclo de vida concreto. Escasas iniciativas en e-Procurement + Sem´ntica. a ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 38. MOLDEAS Marco te´rico y conceptual o Resumen Soluci´n o MOLDEAS Methods On Linked Data for E-procurement Applying Semantics Definici´n ciclo de vida para datos abiertos enlazados. o Implementaci´n de los componentes software necesarios. o Pruebas y Validaci´n. o Aplicaci´n al dominio de e-Procurement. o Experimentaci´n. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 39. MOLDEAS Marco te´rico y conceptual o Resumen Soluci´n o MOLDEAS Methods On Linked Data for E-procurement Applying Semantics Definici´n ciclo de vida para datos abiertos enlazados. o Implementaci´n de los componentes software necesarios. o Pruebas y Validaci´n. o Aplicaci´n al dominio de e-Procurement. o Experimentaci´n. o ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 40. MOLDEAS Marco metodol´gico o 3 Marco metodol´gico. o Metodolog´ de la Investigaci´n. ıa o Definici´n del Ciclo de Vida para Datos Enlazados Abiertos. o Aplicaci´n del Ciclo de Vida al e-Procurement. o Creaci´n del sistema MOLDEAS. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 41. MOLDEAS Marco metodol´gico o Metodolog´ de la Investigaci´n ıa o Tipo Investigaci´n cuantitativa con base en evidencias emp´ o ıricas. Car´cter descriptivo y comparativo. a Dise˜o n 1 Definici´n Ciclo de Vida de Datos Enlazados Abiertos. o 2 Aplicaci´n al dominio de e-Procurement. o 3 Creaci´n del sistema MOLDEAS. o 4 Definici´n y ejecuci´n de experimentos. o o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 42. MOLDEAS Marco metodol´gico o Metodolog´ de la Investigaci´n ıa o Tipo Investigaci´n cuantitativa con base en evidencias emp´ o ıricas. Car´cter descriptivo y comparativo. a Dise˜o n 1 Definici´n Ciclo de Vida de Datos Enlazados Abiertos. o 2 Aplicaci´n al dominio de e-Procurement. o 3 Creaci´n del sistema MOLDEAS. o 4 Definici´n y ejecuci´n de experimentos. o o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 43. MOLDEAS Marco metodol´gico o Metodolog´ de la Investigaci´n ıa o Universo de Estudio Tres principales conjuntos de datos seleccionados: 1 Datos de anuncios de licitaci´n (1 Mill´n) provistos por o o Euroalert.net desde 2008 a 2011. 2 Cat´logos de Clasificaciones de Productos y Servicios (9: a CPV, CPA, NAICS, etc.) provistos por UE, ONU, EEUU, etc. 3 Organizaciones, personas y pa´ (clasificaci´n NUTS de la ıses o UE). ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 44. MOLDEAS Marco metodol´gico o Definici´n del Ciclo de Vida para Datos Enlazados Abiertos o Visi´n General o Figura: Procesos del Ciclo de Vida de Datos Enlazados Abiertos. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 45. MOLDEAS Marco metodol´gico o Definici´n del Ciclo de Vida para Datos Enlazados Abiertos o Visi´n Detallada-Procesos y M´todos o e ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 46. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Consideraciones Generales Procesos M´todos de Producci´n y Consumo dependiente del dataset. e o M´todos de Publicaci´n y Validaci´n comunes. e o o Conjuntos de Datos Anuncios de licitaci´n (PPN). o Clasificaciones est´ndar de productos y servicios (PSCs). a Organizaciones, personas y pa´ ıses. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 47. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Consideraciones Generales Procesos M´todos de Producci´n y Consumo dependiente del dataset. e o M´todos de Publicaci´n y Validaci´n comunes. e o o Conjuntos de Datos Anuncios de licitaci´n (PPN). o Clasificaciones est´ndar de productos y servicios (PSCs). a Organizaciones, personas y pa´ ıses. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 48. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 49. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 50. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 51. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 52. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o M´todos Aplicados e Producci´n o Transformaci´n de datos est´ticos a RDF. o a Publicaci´n o Fichero est´tico en RDF, Endpoint de SPARQL y Linked Data a Frontend. Consumo Mapeo a Lenguaje de Programaci´n. o Validaci´n o Uso de Tablas de Validaci´n. o Realimentaci´n o Actualizaci´n Ocasional. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 53. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Resultados Anuncios de Licitaci´n o No de Elementos Tripletas PPN 2008 112843 677058 PPN 2009 399766 2398601 PPN 2009 431813 2590880 PPN 2011 67044 402264 Cat´logo de Anuncios de Licitaci´n (total) a o PPNs 1011466 6068803 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 54. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Clasificaciones Est´ndar de Productos y Servicios a Clasificaci´no Acr´nimo o Organismo Common Procurement Vocabulary, (2003 y CPV UE 2008) Combined Nomenclature 2012 (desde 1995) CN “ Central Product Classification, version 2 CPC ... (2008) Clasificaci´n de Productos por Actividad o CPA “ (2008) International Standard Industrial Classifica- ISIC ONU tion of All Economic Activities, Rev.4 North American Industry Classification Sys- NAICS EEUU tem 2007 y 2012 Standard International Trade Classification, SITC ONU Revision 4 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 55. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Clasificaciones Est´ndar de Productos y Servicios a Figura: Enlaces entre las distintas Clasificaciones Est´ndar de Productos a y Servicios. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 56. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Resultados-I PSC # Tripletas Links Links CPV 2008 CPV 2003 8323 546135 8322 462 (del CPV 2008 al 2003) CPV 2008 10357 803311 10355 N/A CN 2012 14552 137484 2590 2390 CPC 2008 4408 100819 4408 4375 y 1503 (ex- actos) CPA 2008 5429 92749 5429 5399 ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 57. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Resultados-II PSC # Tripletas Links Links CPV 2008 ISIC v4 766 18986 766 765 NAICS 2007 2328 36292 2328 2300 NAICS 2012 2212 35390 2212 2186 SITC v4 4017 70887 3941 3811 Cat´logo de Clasificaciones Est´ndar de Productos (total) a a PSCs 52392 1842053 40351 23191 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 58. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Organizaciones, personas y pa´ ıses Figura: Organizations Ontology del W3C. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 59. MOLDEAS Marco metodol´gico o Aplicaci´n del Ciclo de Vida al e-Procurement o Resultados Dataset # Tripletas Enlaces exter- nos Organizaciones 50000 1150020 50000 (pa´ ıses) Personas 50000 900219 50000 (pa´ ıses) Pa´ ıses 246 1756 1779 Organizaciones, Personas y Pa´ ıses (total) Agregado 100246 2051995 101779 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 60. MOLDEAS Marco metodol´gico o Sistema MOLDEAS MOLDEAS y los procesos del Ciclo de Vida Figura: Visi´n Funcional de MOLDEAS y los procesos del Ciclo de Vida o de Linked Data. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 61. MOLDEAS Marco metodol´gico o Sistema MOLDEAS MOLDEAS web (REST+Jquery) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 62. MOLDEAS Marco metodol´gico o Sistema MOLDEAS MOLDEAS web-Resultados (Jquery+Exhibit) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 63. MOLDEAS Marco metodol´gico o Sistema MOLDEAS MOLDEAS-Linked Data Frontend (Pubby) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 64. MOLDEAS Resultados y Evaluaci´n o 4 Resultados y Evaluaci´n. o Metodolog´ ıa. Expresividad y Cumplimiento de Criterios. 1 Punto de Vista Cuantitativo. 2 Punto de Vista Cualitativo. Sistema MOLDEAS. 1 Consumo de Datos Enlazados Abiertos. 2 Rendimiento de Consultas en SPARQL. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 65. MOLDEAS Resultados y Evaluaci´n o Metodolog´ ıa Pasos de ejecuci´n o 1 Definici´n de los objetivos del experimento. o 2 Selecci´n de una regla de asignaci´n de las unidades experimentales o o a las condiciones de estudio. Cualitativos: tipo de entorno hardware y software, etc. Cuantitativos: tama˜o de la muestra, de la memoria y n´mero n u de posibilidades de expresar una consulta. 3 Especificaci´n de las medidas de trabajo en cuanto a la respuesta. o 4 Especificaci´n de un modelo. o 5 Ejecuci´n de un experimento piloto. o 6 Esquematizaci´n de los pasos a seguir. o 7 Determinaci´n del tama˜o muestral. o n 8 Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 66. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Visi´n del experimento o Punto de Vista Cuantitativo ¿Cu´l es la posibilidad de uso de datos enlazados para facilitar el a acceso a un mayor n´mero de recursos relacionados con los u anuncios de licitaci´n? o Punto de Vista Cualitativo Evaluaci´n, grado de cumplimiento y comparaci´n con otros o o enfoques de: Principios de Open Data y Linked Data. Buenas pr´cticas. a Patrones de dise˜o. n Caracter´ısticas de pertenencia a la nube de datos enlazados y registro CKAN. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 67. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Visi´n del experimento o Punto de Vista Cuantitativo ¿Cu´l es la posibilidad de uso de datos enlazados para facilitar el a acceso a un mayor n´mero de recursos relacionados con los u anuncios de licitaci´n? o Punto de Vista Cualitativo Evaluaci´n, grado de cumplimiento y comparaci´n con otros o o enfoques de: Principios de Open Data y Linked Data. Buenas pr´cticas. a Patrones de dise˜o. n Caracter´ısticas de pertenencia a la nube de datos enlazados y registro CKAN. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 68. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Expresividad Punto de Vista Cuantitativo. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 69. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 1-Definici´n de los objetivos del experimento o 1 ¿Cu´l es la expresividad actual, en t´rminos de n´mero de a e u conceptos para realizar consultas, para el acceso a la informaci´n de anuncios de licitaci´n? o o 2 ¿Cu´l es la ventaja de uso de un modelo RDF para la a expresi´n y recuperaci´n de la informaci´n de los anuncios de o o o licitaci´n? o 3 ¿C´mo favorecen los datos enlazados el aumento de o expresividad en la ejecuci´n de consultas y por tanto facilitan o la recuperaci´n de los anuncios de licitaci´n? o o 4 ¿Cu´l es el beneficio real del uso de datos enlazados para a representar la informaci´n? o 5 ¿Se incurre en alg´n error al aumentar la expresividad? u ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 70. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 2-Selecci´n de una regla de asignaci´n de las unidades o o experimentales a las condiciones de estudio 1 Base documental D constituida por 1 mill´n de anuncios de o licitaci´n. o 2 Vocabulario controlado, V, del CPV 2008, formado por #V = 10357 c´digos/t´rminos distintos. o e 3 Cada documento d ∈ D, etiquetado con al menos un c´digo o v ∈ V. 4 9 Clasificaciones Est´ndar de Productos y Servicios. a 5 Clasificaci´n “puente”: ProductOntology (PO) o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 71. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 No de enlaces entre una PSC y el CPV 2008. 2 No de enlaces entre una PSC y el CPV 2008 a trav´s de PO. e 3 Ganancia de expresividad en t´rminos porcentuales. e 4-Especificaci´n de un modelo o El nuevo vocabulario controlado V psc , enlazado con Vpsc , dispone de #V psc t´rminos. e La ganancia se calcula como: % = { (#V psc + #V)/#V − 1} ∗ 100 (1) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 72. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 No de enlaces entre una PSC y el CPV 2008. 2 No de enlaces entre una PSC y el CPV 2008 a trav´s de PO. e 3 Ganancia de expresividad en t´rminos porcentuales. e 4-Especificaci´n de un modelo o El nuevo vocabulario controlado V psc , enlazado con Vpsc , dispone de #V psc t´rminos. e La ganancia se calcula como: % = { (#V psc + #V)/#V − 1} ∗ 100 (1) ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 73. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 5-Ejecuci´n de un experimento piloto o Sea V = {1, 2, 3} y Vpsc = {A, B, C , D, E }. El conjunto de pares enlaces es: {(A, 1), (B, 2), (C , 1)(E , 2)}. Por tanto, el conjunto V psc = {A, B, C , E } y el % de ganancia en expresividad ser´: a % = { (4 + 3)/3 − 1} ∗ 100 = 133 (2) 6-Esquematizaci´n de los pasos a seguir o 1 Extracci´n de consultas en SPARQL para establecer el n´mero o u de enlaces entre las mismas. 2 Procesamiento de los resultados mediante un script para generar los resultados. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 74. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo 5-Ejecuci´n de un experimento piloto o Sea V = {1, 2, 3} y Vpsc = {A, B, C , D, E }. El conjunto de pares enlaces es: {(A, 1), (B, 2), (C , 1)(E , 2)}. Por tanto, el conjunto V psc = {A, B, C , E } y el % de ganancia en expresividad ser´: a % = { (4 + 3)/3 − 1} ∗ 100 = 133 (2) 6-Esquematizaci´n de los pasos a seguir o 1 Extracci´n de consultas en SPARQL para establecer el n´mero o u de enlaces entre las mismas. 2 Procesamiento de los resultados mediante un script para generar los resultados. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 75. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo Otros 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 76. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Parciales Vpsc #Vpsc #V psc #V psc % real % real % PO m´x. a CPV 2003 8323 462 8312 4,46 80,25 80,36 CN 2012 14552 2390 2390 23,07 23,07 140,50 CPC 2008 4408 4402 4403 42,50 42,51 42,56 CPA 2008 5429 5399 5410 52,12 52,23 52,41 ISIC v4 766 765 765 7,38 7,38 7,39 NAICS 2007 2328 2300 2300 22,20 22,20 22,47 NAICS 2012 2212 2186 2186 21,10 21,10 21,35 SITC v4 4017 3811 3820 36,79 36,88 38,78 ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 77. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Totales Total Vpsc #Vpsc #V psc #V psc % real % % real PO m´x. a 42035 21715 29586 209,66 285,66 405,86 A˜adiendo enlaces entre CPV 2008 y Product Ontology-PO n PO ∞ 10000 N/A 96,55 96,55 ∞ Total con vocabulario de Product Ontology ∞ 31715 39586 306,21 382,21 ∞ ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 78. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Figura: N´mero de Elementos y Enlaces entre las PSCs y el CPV 2008. u ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 79. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Figura: Ganancia en expresividad. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 80. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Valoraci´n o 1 Extensi´n del CPV 2008, 10357 t´rminos, hasta: o e 21715 t´rminos, con enlaces entre las PSCs y el CPV 2008. e 29586 t´rminos, con enlaces entre las PSCs y el CPV 2008 a e trav´s de PO. e 2 Se establece un: 8,65 % y 6,64 % (PO) de enlaces exactos. 91,35 % y 93,36 % (PO) de enlaces autom´ticos. a 3 Cifras de ganancia: Real: 209,66 %. Real con PO: 285,66 % M´ximo: 405,86 %. a 4 Los enlaces y la reconciliaci´n de entidades se realizan bajo un o umbral µ (n primeros resultados normalizados). ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 81. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Resultados Figura: Evoluci´n N´mero de T´rminos. o u e ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 82. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cuantitativo-Conclusiones Puntos Clave Aumento del vocabulario de entrada del CPV 2008 con Linked Data. Mejora de la expresividad para la realizaci´n de consultas en o SPARQL. Incremento del n´mero de anuncios de licitaci´n a los que u o se puede acceder. Establecimiento de una f´rmula para el c´lculo de la o a ganancia del enlazado de datos. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 83. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Cumplimiento de Criterios Punto de Vista Cualitativo. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 84. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 1-Definici´n de los objetivos del experimento o 1 ¿El ciclo de vida seguido y los datos generados certifican la aplicaci´n de buenas pr´cticas y principios de Linked Data? o a 2 ¿Qu´ nivel del modelo de 5 e se puede establecer? 3 ¿Qu´ porcentaje de patrones de dise˜o se han aplicado en los datos e n generados? 4 ¿Los datos generados pueden pertenecer a la nube de datos enlazados abiertos? 5 ¿Los datos generados pueden pertenecer a un registro CKAN? 6 ¿Se certifica el cumplimiento de los principios de Open Data? 7 ¿Se puede asegurar que los datos son enlazados y abiertos? 8 ¿Qu´ beneficios se obtienen del cumplimiento de estos objetivos? e ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 85. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 2-Selecci´n de una regla de asignaci´n de las unidades o o experimentales a las condiciones de estudio 1 Dataset RDF de los anuncios de licitaci´n p´blica. o u Boletines y Publicaciones oficiales: TED y BOE. Plataformas de contrataci´n: AGE. o Servicios de terceros: Euroalert.net y Licitaciones.es Basados en sem´ntica: LOTED. a 2 Dataset RDF de las PSCs. Publicaciones oficiales: UE, ONU, etc. Servicios de terceros. 3 Dataset RDF de las organizaciones. Boletines y Publicaciones oficiales: TED y BORME. Plataformas de contrataci´n: AGE. o Servicios y BBDD de terceros. Basadas en Open Data: OpenCorporates. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 86. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 Valor positivo, ⊕, si es un criterio que debe tener y se cumple (173). 2 Valor negativo, , si es un criterio que debe tener y no se cumple (0). 3 Valor no aplicable, , si es un criterio que se desconoce, que se solapa con otro o no est´ asociado a ese enfoque (23). a ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 87. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo Dise˜o de Tablas de Validaci´n n o T 1 -Tabla de Validaci´n de Caracter´ o ısticas Linked Data. T 2 -. . . de Linked Data Patterns. T 3 -. . . de Principios de Linked Data. 3 T1 -. . . del Modelo . T 4 -. . . de Principios de Open Data. 4 T1 -. . . sobre Caracter´ ısticas de Open Data. T 5 -. . . sobre Caracter´ ısticas para pertenecer a la nube de Linking Open Data. T 6 -. . . para registrar el dataset en CKAN. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 88. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 4-Especificaci´n de un modelo o No aplicable. 5-Ejecuci´n de un experimento piloto o Valoraci´n inicial con s´lo un conjunto de datos. o o 6-Esquematizaci´n de los pasos a seguir o 1 Establecimiento del modelo de referencia, con los valores admitidos. 2 Revisi´n uno a uno de los criterios. o 3 Agregaci´n de los resultados y valoraciones. o 4 Extracci´n de estad´ o ısticas, contraste de hip´tesis, validaci´n y o o evaluaci´n. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 89. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 4-Especificaci´n de un modelo o No aplicable. 5-Ejecuci´n de un experimento piloto o Valoraci´n inicial con s´lo un conjunto de datos. o o 6-Esquematizaci´n de los pasos a seguir o 1 Establecimiento del modelo de referencia, con los valores admitidos. 2 Revisi´n uno a uno de los criterios. o 3 Agregaci´n de los resultados y valoraciones. o 4 Extracci´n de estad´ o ısticas, contraste de hip´tesis, validaci´n y o o evaluaci´n. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 90. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo 4-Especificaci´n de un modelo o No aplicable. 5-Ejecuci´n de un experimento piloto o Valoraci´n inicial con s´lo un conjunto de datos. o o 6-Esquematizaci´n de los pasos a seguir o 1 Establecimiento del modelo de referencia, con los valores admitidos. 2 Revisi´n uno a uno de los criterios. o 3 Agregaci´n de los resultados y valoraciones. o 4 Extracci´n de estad´ o ısticas, contraste de hip´tesis, validaci´n y o o evaluaci´n. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 91. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo Otros 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 92. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Resultados ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 93. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Resultados ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 94. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Resultados ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 95. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo- Resultados en % ⊕ entre aplicables Versi´n o ⊕ Total % ⊕ entre aplicables Referencia 173 0 23 196 100 Anuncios de Licitaci´n o TED 32 12 152 “ 72,72 Plataforma de 35 9 152 “ 79,54 Contrataci´n o BOE 30 12 154 “ 71,42 Servicios Ex- 25 14 157 “ 64,10 ternos LOTED 92 34 70 “ 73,01 MOLDEAS 121 10 65 “ 92,36 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 96. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo- Resultados en % ⊕ entre aplicables Versi´n o ⊕ Total % ⊕ entre aplicables Referencia 173 0 23 196 100 Cat´logo de Clasificaciones de Productos a CSV/ 25 12 159 “ 67,56 MSExcel Servicios on- 21 21 154 “ 50 line MOLDEAS 166 7 23 “ 93,86 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 97. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo- Resultados en % ⊕ entre aplicables Versi´n o ⊕ Total % ⊕ entre aplicables Referencia 173 0 23 196 100 Organizaciones TED 20 9 167 “ 68,96 Plataforma de 35 10 151 “ 77,77 Contrataci´n o BORME 23 1 172 “ 95,83 Servicios Ex- 20 20 156 “ 50 ternos BBDD exter- 12 9 175 “ 57,14 na Open Corpo- 85 33 78 “ 72,03 rates MOLDEAS 121 10 65 “ 92,36 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 98. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Resultados Valoraci´n o 1 El ciclo de vida asegura los principios y criterios de Linked Data y Open Data. 2 Se establece un nivel de 5 para los datasets transformados. 3 Se ha aplicado un alto porcentaje de patrones de dise˜o, n calidad impl´ ıcita para la reutilizaci´n de datos. o 4 Los datasets transformados pueden pertenecer a la nube de Linking Open Data y a un registro CKAN. 5 En general, el enfoque de MOLDEAS mejora cualitativamente la informaci´n y datos respecto a otros enfoques. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 99. MOLDEAS Resultados y Evaluaci´n o Expresividad y Cumplimiento de Criterios Punto de Vista Cualitativo-Conclusiones Puntos Clave Mejora cualitativa la informaci´n y datos. o Aumento de la visi´n global de los datos, expresividad y o estructuraci´n. o Aplicaci´n intensiva de est´ndares. o a Incremento del conocimiento en el dominio de e-Procurement. Impulso de la reutilizaci´n de la informaci´n y datos, mayor o o poder de redistribuci´n. o Minimizaci´n de restricciones tecnol´gicas. o o Minimizaci´n de aspectos discriminatorios. o Aumento de la transparencia, inclusi´n y responsabilidad. o Alineaci´n con las actuales propuestas estrat´gicas de futuro. o e ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 100. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Sistema MOLDEAS Consumo de Datos Enlazados Abiertos. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 101. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos Objetivos Generales Consumir los datos enlazados desde un lenguaje de programaci´n. o Crear un sistema de recuperaci´n de informaci´n. o o 1-Definici´n de los objetivos del experimento o 1 ¿Es posible implementar un sistema de recuperaci´n de informaci´n o o utilizando datos enlazados? 2 ¿Es posible explotar las relaciones sem´nticas establecidas para a mejorar la recuperaci´n de informaci´n? o o 3 ¿Cu´l es el mejor enfoque para la recuperaci´n de informaci´n en a o o los anuncios de licitaci´n? o 4 ¿C´mo afectan los resultados en la implementaci´n actual del o o sistema MOLDEAS? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 102. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos Objetivos Generales Consumir los datos enlazados desde un lenguaje de programaci´n. o Crear un sistema de recuperaci´n de informaci´n. o o 1-Definici´n de los objetivos del experimento o 1 ¿Es posible implementar un sistema de recuperaci´n de informaci´n o o utilizando datos enlazados? 2 ¿Es posible explotar las relaciones sem´nticas establecidas para a mejorar la recuperaci´n de informaci´n? o o 3 ¿Cu´l es el mejor enfoque para la recuperaci´n de informaci´n en a o o los anuncios de licitaci´n? o 4 ¿C´mo afectan los resultados en la implementaci´n actual del o o sistema MOLDEAS? ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 103. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 2-Selecci´n de una regla de asignaci´n de las unidades o o experimentales a las condiciones de estudio 1 Unidad experimental de este estudio ser´ un repositorio RDF. a 2 Base documental D constituida por 1 mill´n de anuncios de o licitaci´n. o 3 Vocabulario controlado, V, del CPV 2008, formado por 10357 c´digos/t´rminos distintos. o e 4 Cada documento d ∈ D, etiquetado con al menos un c´digo o v ∈ V. 5 11 consultas, Qstr , proporcionadas por Euroalert.net. 6 Las medidas de evaluaci´n dependen del no de c´digos CPV o o generados por MOLDEAS. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 104. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos Qi Consulta de Usuario-Qstr No de C´digos o CPV relevantes- i #Qcpv Q1 ... 463 Q2 ... 35 Q3 ... 7 Q4 ... 26 Q5 ... 277 ... ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 105. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos Qi Consulta de Usuario-Qstr No de C´digos o CPV relevantes- i #Qcpv Q6 ... 1 Q7 ... 117 Q8 ... 13 Q9 ... 10 Q10 ... 173 Q11 ... 13 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 106. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos M´todo e Descripci´n o Tecnolog´ ıa M1 Se indexan las descripciones de los Apache Lucene y Solr c´digos CPV y proceso de b´sque- o u da sint´ctica de las consultas Qi . a M2 Se extraen una serie de c´digos o M 1 + ponderaci´n o CPV candidatos seg´n jerarqu´ u ıa. broader/ narrower M3 . . . seg´n jerarqu´ con Spreading u ıa M 1 + ONTOSPREAD Activation. M4 . . . seg´n hist´rico de las relaciones u o M 1 + Apache Mahout entre c´digos de los anuncios pre- o vios. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 107. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 Para cada consulta se recogen los c´digos CPV 2008 o generados. 2 Se comparan con los indicados en las consultas Qi . 3 Se obtienen las medidas Precisi´n, Recall, Accuracy y o Specificity (PRAS). 5-Ejecuci´n de un experimento piloto o En primer lugar se realiza una consulta para verificar el proceso de b´squeda en cada m´todo y la obtenci´n de medidas. u e o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 108. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 3-Especificaci´n de las medidas de trabajo en cuanto a la respuesta o 1 Para cada consulta se recogen los c´digos CPV 2008 o generados. 2 Se comparan con los indicados en las consultas Qi . 3 Se obtienen las medidas Precisi´n, Recall, Accuracy y o Specificity (PRAS). 5-Ejecuci´n de un experimento piloto o En primer lugar se realiza una consulta para verificar el proceso de b´squeda en cada m´todo y la obtenci´n de medidas. u e o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 109. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 6-Esquematizaci´n de los pasos a seguir o 1 A cada consulta Qstr , identificada como Qi , se le aplica un m´todo M i , devuelve al #Qcpv elementos. e i M i 2 Cada conjunto resultado Qcpv se compara con el conjunto i esperado Qcpv con un script. 3 Se generan los valores PRAS para cada m´todo M i y consulta e de entrada Qi . Otros 1 4-Especificaci´n de un modelo (N/A). o 2 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 3 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 110. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos 6-Esquematizaci´n de los pasos a seguir o 1 A cada consulta Qstr , identificada como Qi , se le aplica un m´todo M i , devuelve al #Qcpv elementos. e i M i 2 Cada conjunto resultado Qcpv se compara con el conjunto i esperado Qcpv con un script. 3 Se generan los valores PRAS para cada m´todo M i y consulta e de entrada Qi . Otros 1 4-Especificaci´n de un modelo (N/A). o 2 7-Determinaci´n del tama˜o muestral (ya indicado en el o n punto 1). 3 8-Revisi´n de las decisiones anteriores. o ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 111. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos- ¯ Resultados Agregados (X ) M´todo e Precisi´n o Recall Accuracy Specificity 1 M 0, 28 0, 26 0, 99 1, 00 M2 0, 11 0, 11 0, 98 0, 99 M3 0, 23 0, 23 0, 99 1, 00 M4 0, 03 0, 03 0, 96 0, 98 ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 112. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos-Resultados Valoraci´n o 1 El tipo y formato de una fuente de datos no es impedimento para la construcci´n de servicios en un dominio determinado. o 2 Las relaciones sem´nticas de los datos se pueden explotar para a recuperar informaci´n. o 3 El enfoque tradicional sint´ctico, M 1 , se comporta m´s a a cercano a las expectativas del usuario. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 113. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Consumo de Datos Enlazados Abiertos-Conclusiones Principal Punto Clave La casu´ıstica de un sistema de soporte a la decisi´n o de o recuperaci´n a la informaci´n en e-Procurement es muy o o compleja, existen muchas variables de informaci´n que se o pueden optimizar. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS
  • 114. MOLDEAS Resultados y Evaluaci´n o Sistema MOLDEAS Sistema MOLDEAS Rendimiento de Consultas en SPARQL. ıa ´ Jose Mar´ Alvarez Rodr´ ıguez MOLDEAS