Periodismo de datos y Linked Data: El poder de los datos enlazados para generar historias

1,177 views

Published on

Charla sobre periodismo de datos y Linked Data para #6eiiic

0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,177
On SlideShare
0
From Embeds
0
Number of Embeds
19
Actions
Shares
0
Downloads
0
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide
  • http://localhost:8890/sparql?default-graph-uri=&query=PREFIX+localidata%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCity%23%3E%0D%0APREFIX+rdfs%3A+%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0D%0APREFIX+qb%3A+%3Chttp%3A%2F%2Fpurl.org%2Flinked-data%2Fcube%23%3E%0D%0APREFIX+localidata%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCity%23%3E%0D%0APREFIX+rdfs%3A+%3Chttp%3A%2F%2Fwww.w3.org%2F2000%2F01%2Frdf-schema%23%3E%0D%0APREFIX+qb%3A+%3Chttp%3A%2F%2Fpurl.org%2Flinked-data%2Fcube%23%3E%0D%0APREFIX+cityStats-dimension%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCityStats%2Fdimension%23%3E%0D%0APREFIX+sdmx-dimension%3A+%3Chttp%3A%2F%2Fpurl.org%2Flinked-data%2Fsdmx%2F2009%2Fdimension%23%3E+%0D%0APREFIX+cityStats-code%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCityStats%2Fcode%23%3E%0D%0APREFIX+cityStats%3A+%3Chttp%3A%2F%2Fdatos.localidata.com%2Fdef%2FCityStats%2Fstats%23%3E%0D%0A%0D%0ASELECT+DISTINCT+%3Fbarrio+%28sum%28%3FnumHabitantesEC2065Seccion%29+as+%3FnumHabitantesEC2065Barrio%29%0D%0AWHERE%0D%0A{+%0D%0A++%3Fseccion+localidata%3Abarrio+%3Fbar+.++%3Fbar+rdfs%3Alabel+%3Fbarrio+.%0D%0A++{%0D%0A++SELECT+DISTINCT+%3Fseccion+%28sum%28xsd%3Adouble%28%3Fnum%29%29+as+%3FnumHabitantesEC2065Seccion%29%0D%0A++WHERE+{%0D%0A+++++++%3Fobs+a+qb%3AObservation+.%0D%0A+++++++%3Fobs+qb%3AdataSet+%3Chttp%3A%2F%2Fdatos.localidata.com%2Frecurso%2FCityStats%2FProvincia%2FMadrid%2FPoblacion%2F2012%2F12%3E.%0D%0A+++++++%3Fobs+cityStats-dimension%3ArefSeccionCensal+%3Fseccion+.%0D%0A+++++++%3Fobs+cityStats-dimension%3ArefPaisNacionalidad+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fgeo%23EC%3E+.%0D%0A+++++++%3Fobs+cityStats%3AnumeroHabitantes+%3Fnum+.%0D%0A+++++++{{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y20-24%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y25-29%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y30-34%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y35-39%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y40-44%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y45-49%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y50-54%3E+}+UNION%0D%0A+++++++{%3Fobs+sdmx-dimension%3Aage+%3Chttp%3A%2F%2Feurostat.linked-statistics.org%2Fdic%2Fage%23Y55-59%3E+}}+.++%0D%0A+++++++}+GROUP+BY+%3Fseccion+%0D%0A+++++}%0D%0A}+GROUP+BY+%3Fbarrio+ORDER+BY+DESC%28%3FnumHabitantesEC2065Barrio%29%0D%0A%0D%0A+&debug=on&timeout=&format=text%2Fhtml&save=display&fname=
  • q <- paste(sparql_prefix, "SELECT DISTINCT ?s ?type ?lat ?long WHERE { ?s a localidata:LocalComercial . ?s a ?type . ?s localidata:enDivisionTerritorial <http://datos.localidata.com/recurso/Provincia/Madrid/Municipio/madrid/Distrito/01/Seccion/117>. ?s geo:geometry ?g . ?g geo:lat ?lat . ?g geo:long ?long }") d <- SPARQL(url=endpointLocalidata, query=q, ns=prefix, extra=options) res <- d$results local_lat_lon_table <- table(res$s,res$type,res$lat,res$long) # A very nice map... qmap('Madrid, Spain', zoom=16, maptype = 'watercolor', source = 'stamen') + geom_point(aes(x=long, y=lat, colour=type), data=res) + scale_color_manual(values = rainbow(10))
  • Periodismo de datos y Linked Data: El poder de los datos enlazados para generar historias

    1. 1. Periodismo de datos y Linked Data “El poder de los datos enlazados para generar historias” UCM / #6eiiic, Madrid, 25/09/2013 Oscar Corcho ocorcho@fi.upm.es, ocorcho@localidata.com @ocorcho
    2. 2. Y MEJOR algo revueltos Todos juntos… Speaker: Date: 25/09/13
    3. 3. Veamos un ejemplo… • ¿Existe correlación entre el número de locutorios que hay en un barrio y la población ecuatoriana o chilena empadronada en él? • ¿Qué datos necesito? • Locutorios y su localización • Idealmente procedente de un portal de datos abiertos • Datos del padrón por barrios • Procedente del portal de datos estadísticos de Madrid Speaker: ?
    4. 4. Disclaimer… 4<<Texto libre: proyecto, speaker, etc.>> Vamos a explorar tecnologías que en algunos casos son aún poco usables
    5. 5. Paso 1. Descargar los datos que vamos a usar (I) • Por ejemplo, datos de población del Instituto de Estadística de Madrid 5<<Texto libre: proyecto, speaker, etc.>>
    6. 6. Paso 1. Descargar los datos que vamos a usar (II) • Y también nos encontramos con una base de datos de locales comerciales, que contiene locutorios • O usamos Google Places, Open Street Map, 4square, etc. • Que proporcionan APIs de datos 6<<Texto libre: proyecto, speaker, etc.>>
    7. 7. Paso 2. Nos fijamos en los datos y en cómo conectarlos 7<<Texto libre: proyecto, speaker, etc.>> • ¿Cómo los conectamos? • 079601001 • Madrid, Distrito 1, Sección 1 • http://datos.localidata.com/recurso/Provincia/Madrid/Municip
    8. 8. Paso 3. Y creamos una red de datos enlazados • Linked Data • Utilizar la Web como una base de datos global • Movernos de una Web de documentos a una Web de datos • URIs, HTTP, RDF, enlaces y REST 8<<Texto libre: proyecto, speaker, etc.>> Base de datos del INE Base de datos del INE Base de datos de locales comerciales Base de datos de locales comerciales
    9. 9. Ejemplo: Integración de datos 9 Catas tro Catas tro BD AEMET BD AEMET BD DBpedia BD DBpedia BD IGN BD IGN C/ Alcalá, 54 1446403VK4714E0001AZ 971m2 refCatastral superficie 28014 codPostal 1910 añoConstrucción C/ Alcalá, 54 Madrid Madrid city sameAs Madrid 20º Temperatura C/ Alcalá, 54 Cafetería Simpatía vcard:adr 11012723 NúmeroPortal L-20 Código Local Ayto Madrid Ayto Madrid
    10. 10. Ejemplo: Integración de datos 10Asunción Gómez Pérez
    11. 11. Algunos ejemplos de uso de Linked Data en medios • http://rtve.linkeddata.es • http://webenemasuno.linkeddata.es/ 11<<Texto libre: proyecto, speaker, etc.>>
    12. 12. Paso 3. Y creamos una red de datos enlazados • Usando vocabularios estandarizados • Así nuestros datos pueden ser reutilizados por otros más fácilmente • Ejemplos • GeoSPARQL • DataCube • División administrativa de España (red.es) • Y haciendo nuestros datos enlazados disponibles como APIs 12<<Texto libre: proyecto, speaker, etc.>>
    13. 13. Paso 4. Y a explotar los datos… (I) • Realizando consultas • Dime cuántos locutorios hay en Madrid (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> SELECT (COUNT(DISTINCT ?item) AS ?numLocutorios) { ?item a localidata:LocalComercial . ?item localidata:clasificacionEconomica ?cE . ?cE localidata:epigrafeActividad ?epi . {?epi localidata:codigo "610002"} UNION {?epi localidata:codigo "477808"}. } 13<<Texto libre: proyecto, speaker, etc.>>
    14. 14. Paso 4. Y a explotar los datos… (I) • Realizando consultas • Dime cuántos locutorios hay en Usera (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> SELECT COUNT (DISTINCT ?item) AS ? numLocutoriosUsera { ?item a localidata:LocalComercial . ?item localidata:clasificacionEconomica ?cE . ?cE localidata:epigrafeActividad ?epi . {?epi localidata:codigo "610002"} UNION {?epi localidata:codigo "477808"}. ?item localidata:enDivisionTerritorial ?seccion . ?seccion localidata:distrito <http://datos.localidata.com/recurso/Provincia/Madrid/Muni cipio/madrid/Distrito/12> . } 14<<Texto libre: proyecto, speaker, etc.>>
    15. 15. Paso 4. Y a explotar los datos… (I) • Realizando consultas • ¿En qué barrios viven más ecuatorianos entre 20 y 59 años? (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX qb: <http://purl.org/linked-data/cube#> PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX qb: <http://purl.org/linked-data/cube#> PREFIX cityStats-dimension: <http://datos.localidata.com/def/CityStats/dimension#> PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#> PREFIX cityStats-code: <http://datos.localidata.com/def/CityStats/code#> PREFIX cityStats: <http://datos.localidata.com/def/CityStats/stats#> SELECT DISTINCT ?barrio (sum(?numHabitantesEC2065Seccion) as ? numHabitantesEC2065Barrio) WHERE { ?seccion localidata:barrio ?bar . ?bar rdfs:label ?barrio . { 15<<Texto libre: proyecto, speaker, etc.>>
    16. 16. Paso 4. Y a explotar los datos… (II) • Realizando gráficos con R 16<<Texto libre: proyecto, speaker, etc.>>
    17. 17. Paso 4. Y a explotar los datos… (III) • Obteniendo correlaciones entre personas de Ecuador empadronadas y locutorios por barrios de Madrid q <- "PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX qb: http://purl.org/linked-data/cube# … SELECT DISTINCT ?distrito ?barrio …“ dLocutoriosEC <- SPARQL(url=endpointLocalidata, query=q, ns=prefix, extra=options) resLocutoriosEC <- dLocutoriosEC$results loc_EC_frame <- data.frame(locutorios=resLocutoriosEC$numLocutorios, ecuatorianosAdultos=resLocutoriosEC$numHabitantesEC2065, chilenosAdultos=resLocutoriosEC$numHabitantesCL2065) row.names(loc_EC_frame) <- resLocutoriosEC$barrio cor <- cor(loc_EC_frame, method='pearson’) 17<<Texto libre: proyecto, speaker, etc.>>
    18. 18. Paso 4. Y a explotar los datos… (IV) • Y visualizando los datos para nuestros lectores en la Web, en un iPad… 18<<Texto libre: proyecto, speaker, etc.>>
    19. 19. ¿Alguna historia más? • Publicaremos en breve algunas en http://www.localidata.com/ • Si alguno de vosotros está interesado en utilizar nuestros datos para generar historias, hablad con nosotros 19<<Texto libre: proyecto, speaker, etc.>>
    20. 20. Periodismo de datos y Linked Data “El poder de los datos enlazados para generar historias” UCM / #6eiiic, Madrid, 25/09/2013 Oscar Corcho ocorcho@fi.upm.es, ocorcho@localidata.com @ocorcho

    ×