Curso Integración Web Semántica Estadísticas
Upcoming SlideShare
Loading in...5
×
 

Curso Integración Web Semántica Estadísticas

on

  • 616 views

 

Statistics

Views

Total Views
616
Slideshare-icon Views on SlideShare
616
Embed Views
0

Actions

Likes
1
Downloads
6
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Curso Integración Web Semántica Estadísticas Curso Integración Web Semántica Estadísticas Presentation Transcript

    • Curso Integración Web Semántica Estadísticas 25 Octubre 2011 Jose María Álvarez Rodríguez WESO-Universidad de Oviedo E-mail: josem.alvarez@weso.es WWW: http://josemalvarez.es
    • Recordando…
    • Receta• Elegir el dataset a RDFizar• Analizar los datos a convertir• Buscar cómo modelar estos datos • Reutilizar vocabularios + Nuevas definiciones• Enriquecer • Con qué datasets tengo/debo/quiero enlazar y qué operación • Servicios de acceso a esos datasets• Herramientas de generación • Validen los datos generados • Datos estáticos o dinámicos • Provenance… • Descripción del dataset generado
    • Mi Receta• Noménclator 2010 de Asturias• Formato MSExcel, Códigos, Descripciones textuales, jerarquía de entidades y datos estadísticos • SKOS, Dublin Core, SCOVO, Cube+SDMX, Organizations Ontology, FOAF, NUTS, etc. • DBPedia-SPARQL-Reconciliar • Google Maps API-REST WS-Buscar• Google Refine+ RDF extension • Valida RDF de salida • Datos estáticos • Provenance, licencia… • Descripción del dataset generado
    • Estadísticas conThe RDF Data Cube vocabulary http://publishing-statistical- data.googlecode.com/svn/trunk/specs/src/main/html/cube.html
    • Definiciones The RDF Data Cube vocabulary• Dataset estadístico: colección de observaciones, definida por un conjunto de dimensiones: tiempo, superficie, población + metadatos• Cubo: conjunto de dimensiones+atributos+medidas• Dimensión: identifica observaciones• Medida: fenómeno observado• Atributo: cualifica y sirve para interpretar las observaciones• Slices: cada subconjunto de observaciones en un dataset
    • Esqueleto de una entidad de población d s   Yh/ZM^ W >> Eh^  E > E  d  > ^  d , D d s s W s E W
    • Dimensiones Noménclator 2010• Región: cada una de las entidades de población• Superficie• Altitud• Distancia• Período: constante 2010• Género: Hombre o Mujer• Tipo de Vivienda: Principales y No Principales
    • Medidas Noménclator 2010• Superficie: Km2• Altitud: metros• Distancia: metros• Género: nº de personas• Tipo de Vivienda: nº de viviendas
    • Slices Noménclator 2010• Región + Intervalo 2010+ • Superficie • Altitud • Distancia • Género • Hombres • Mujeres • Tipo de Vivienda• …
    • Generar datos de n dimensiones Altitud + Género
    • URIs Utilizadasnomen-stats:http://localhost/nomenclator/stats/definitionsnomen-obs:http://localhost/nomenclator/stats/observationsURI de una observación:nomen-obs:{slice}/{ID_Concejo}/{ID_Parroquia}/{ID_Entidad}
    • Modelo Regiónnomen-stats:refArea a rdf:Property,qb:DimensionProperty;rdfs:label “Región"@es;rdfs:subPropertyOfsdmx-dimension:refArea;rdfs:range skos:Concept; (Concejo…)qb:concept sdmx-concept:refArea .
    • Modelo Tiemponomen-stats:refPeriod ardf:Property, qb:DimensionProperty;rdfs:label “Período"@es;rdfs:subPropertyOfsdmx-dimension:refPeriod;rdfs:range interval:Interval;qb:concept sdmx-concept:refPeriod .
    • Modelo Datos Físicosnomen-stats:physicalData ardf:Property, qb:DimensionProperty;rdfs:label “Datos físicos"@es;rdfs:range rdf:Resource.
    • Medida Altitudnomen-stats:altitude a rdf:Property,qb:MeasureProperty;rdfs:label “Altitud"@es;rdfs:subPropertyOfsdmx-measure:obsValue;rdfs:range xsd:decimal .
    • Medida Poblaciónnomen-stats:population ardf:Property, qb:MeasureProperty;rdfs:label “Población"@es;rdfs:subPropertyOfsdmx-measure:obsValue;rdfs:range xsd:integer .
    • Descripción Dataset con qb:Datasetnomen-stats:nomenclator2010 aqb:DataStructureDefinition;rdfs:comment “Noménclator 2010"@es;dcterms:date "2011-10-25"^^xsd:date;qb:slice nomen-stats:region/sex;qb:slice nomen-stats:region/physicaldata;qb:component[qb:dimension nomen-stats:refPeriod; ],[qb:dimension nomen-stats:refArea; ],[qb:dimension sdmx-dimension:sex; ],[qb:dimension nomen-stats:physicalData; ],[qb:measure nomen-stats:population; ] ,[qb:measure nomen-stats:altitud; ].
    • “Número de personas de género masculino enLlanuces en el año 2010” 3 dimensiones 1 unidad de medida
    • Descripción de un Slice (Subconjunto del Dataset)nomen-stats: sliceByRegionSex a qb:SliceKey;rdfs:label “Slice por cada región"@es;rdfs:comment “Año fijo, región y sexocambian"@es;qb:componentPropertynomen-stats:refPeriod; //El que queda fijo.
    • Descripción de un Slice (Estructura)nomen-stats: spopulation aqb:DataStructureDefinition;qb:component[qb:dimension nomen-stats:refPeriod; ],[qb:dimension nomen-stats:refArea; ],[qb:dimension sdmx-dimension:sex; ],[qb:measure nomen-stats:population; ];qb:sliceKey nomen-stats: sliceByRegionSex .
    • Descripción de un Slice (Definición)nomen-stats:region/sex a qb:Slice;qb:sliceStructurenomen-stats: sliceByRegionSex;nomen-stats:refPeriod<http://reference.data.gov.uk/id/gregorian-interval/2010-01-01T00:00:00/P1Y> ;qb:observationnomen-obs:region/sex/m/53/08/02, ….
    • Finalmente en RDF…nomen-obs:region/sex/m/53/08/02 a qb:Observation;qb:dataSet nomen-stats:nomenclator2010;nomen-stats:refArea<http://localhost/nomenclator/asturias/2010/53/08/02> ;nomen-stats:refPeriod<http://reference.data.gov.uk/doc/gregorian-interval/2010-01-01T00:00:00/P1Y> ;sdmx-dimension:sex sdmx-code:sex-M ;sdmx-attribute:unitMeasure<http://dbpedia.org/resource/Person>nomen-stats:population 17 ; . .
    • “Altitud en metros de Llanuces en el año 2010” 3 dimensiones,…bueno la altitud puede cambiar en cierto intervalo ¿2M años? 1 unidad de medida
    • Descripción de un Slice (Subconjunto del Dataset)nomen-stats: sliceByRegion a qb:SliceKey;rdfs:label “Slice por cada región"@es;rdfs:comment “Año y datos físicos fijos, laregión cambia"@es;qb:componentProperty nomen-stats:refPeriod;qb:componentPropertynomen-stats:physicalData;.
    • Descripción de un Slice (Estructura)nomen-stats: saltitude aqb:DataStructureDefinition; qb:component[qb:dimension nomen-stats:refPeriod; ],[qb:dimension nomen-stats:refArea; ],[qb:dimension nomen-stats:physicalData; ],[qb:measure nomen-stats:altitude; ] ;qb:sliceKey nomen-stats: sliceByRegion .
    • Descripción de un Slice (Definición)nomen-stats:region/physicaldata a qb:Slice;qb:sliceStructurenomen-stats: sliceByRegion;nomen-stats:refPeriod<http://reference.data.gov.uk/id/gregorian-interval/2010-01-01T00:00:00/P1Y> ;nomen-stats:physicalData<http://dbpedia.org/resource/Altitude>;qb:observationnomen-obs:region/physicaldata/altitude/53/08/02, ….
    • Finalmente en RDF…nomen-obs:region/physicaldata/altitude/53/08/02 aqb:Observation;qb:dataSet nomen-stats:nomenclator2010;nomen-stats:refArea<http://localhost/nomenclator/asturias/2010/53/08/02>;nomen-stats:refPeriod<http://reference.data.gov.uk/doc/gregorian-interval/2010-01-01T00:00:00/P1Y> ;nomen-stats:physicalData<http://dbpedia.org/resource/Altitude>;sdmx-attribute:unitMeasure<http://dbpedia.org/resource/Metro>nomen-stats:altitude 870 ; . .
    • Guardar el proyecto con los “datos limpios” + Crear un nuevoproyecto sólo para estadísticas
    • Volvemos a Google Refine… Crear un nuevo RDF con 3nodos raíz (hombres, mujeres y altitud)…mapear, producir…publicar! Ver fichero: recursos/rdf/nomenclator-stats- definitions.ttl
    • Algunos prefijos…@prefix sdmx: <http://purl.org/linked-data/sdmx#> .@prefix sdmx-concept: <http://purl.org/linked-data/sdmx/2009/concept#> .@prefix sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#> .@prefix sdmx-attribute: <http://purl.org/linked-data/sdmx/2009/attribute#> .@prefix sdmx-measure: <http://purl.org/linked-data/sdmx/2009/measure#> .@prefix sdmx-metadata: <http://purl.org/linked-data/sdmx/2009/metadata#> .@prefix sdmx-code: <http://purl.org/linked-data/sdmx/2009/code#> .@prefix sdmx-subject: <http://purl.org/linked-data/sdmx/2009/subject#> .@prefix dcterms: <http://dublincore.org/documents/dcmi-terms/>.@prefix qb: <http://purl.org/linked-data/cube#> .
    • Curso Integración Web Semántica …Consumo, Introducción OWL+Ejemplo, Debate+Conclusiones… Jose María Alvarez Rodríguez WESO-Universidad de Oviedo E-mail: josem.alvarez@weso.es WWW: http://josemalvarez.es