Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Periodismo de datos y Linked Data: El poder de los datos enlazados para generar historias

1,240 views

Published on

Charla sobre periodismo de datos y Linked Data para #6eiiic

  • Be the first to comment

Periodismo de datos y Linked Data: El poder de los datos enlazados para generar historias

  1. 1. Periodismo de datos y Linked Data “El poder de los datos enlazados para generar historias” UCM / #6eiiic, Madrid, 25/09/2013 Oscar Corcho ocorcho@fi.upm.es, ocorcho@localidata.com @ocorcho
  2. 2. Y MEJOR algo revueltos Todos juntos… Speaker: Date: 25/09/13
  3. 3. Veamos un ejemplo… • ¿Existe correlación entre el número de locutorios que hay en un barrio y la población ecuatoriana o chilena empadronada en él? • ¿Qué datos necesito? • Locutorios y su localización • Idealmente procedente de un portal de datos abiertos • Datos del padrón por barrios • Procedente del portal de datos estadísticos de Madrid Speaker: ?
  4. 4. Disclaimer… 4<<Texto libre: proyecto, speaker, etc.>> Vamos a explorar tecnologías que en algunos casos son aún poco usables
  5. 5. Paso 1. Descargar los datos que vamos a usar (I) • Por ejemplo, datos de población del Instituto de Estadística de Madrid 5<<Texto libre: proyecto, speaker, etc.>>
  6. 6. Paso 1. Descargar los datos que vamos a usar (II) • Y también nos encontramos con una base de datos de locales comerciales, que contiene locutorios • O usamos Google Places, Open Street Map, 4square, etc. • Que proporcionan APIs de datos 6<<Texto libre: proyecto, speaker, etc.>>
  7. 7. Paso 2. Nos fijamos en los datos y en cómo conectarlos 7<<Texto libre: proyecto, speaker, etc.>> • ¿Cómo los conectamos? • 079601001 • Madrid, Distrito 1, Sección 1 • http://datos.localidata.com/recurso/Provincia/Madrid/Municip
  8. 8. Paso 3. Y creamos una red de datos enlazados • Linked Data • Utilizar la Web como una base de datos global • Movernos de una Web de documentos a una Web de datos • URIs, HTTP, RDF, enlaces y REST 8<<Texto libre: proyecto, speaker, etc.>> Base de datos del INE Base de datos del INE Base de datos de locales comerciales Base de datos de locales comerciales
  9. 9. Ejemplo: Integración de datos 9 Catas tro Catas tro BD AEMET BD AEMET BD DBpedia BD DBpedia BD IGN BD IGN C/ Alcalá, 54 1446403VK4714E0001AZ 971m2 refCatastral superficie 28014 codPostal 1910 añoConstrucción C/ Alcalá, 54 Madrid Madrid city sameAs Madrid 20º Temperatura C/ Alcalá, 54 Cafetería Simpatía vcard:adr 11012723 NúmeroPortal L-20 Código Local Ayto Madrid Ayto Madrid
  10. 10. Ejemplo: Integración de datos 10Asunción Gómez Pérez
  11. 11. Algunos ejemplos de uso de Linked Data en medios • http://rtve.linkeddata.es • http://webenemasuno.linkeddata.es/ 11<<Texto libre: proyecto, speaker, etc.>>
  12. 12. Paso 3. Y creamos una red de datos enlazados • Usando vocabularios estandarizados • Así nuestros datos pueden ser reutilizados por otros más fácilmente • Ejemplos • GeoSPARQL • DataCube • División administrativa de España (red.es) • Y haciendo nuestros datos enlazados disponibles como APIs 12<<Texto libre: proyecto, speaker, etc.>>
  13. 13. Paso 4. Y a explotar los datos… (I) • Realizando consultas • Dime cuántos locutorios hay en Madrid (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> SELECT (COUNT(DISTINCT ?item) AS ?numLocutorios) { ?item a localidata:LocalComercial . ?item localidata:clasificacionEconomica ?cE . ?cE localidata:epigrafeActividad ?epi . {?epi localidata:codigo "610002"} UNION {?epi localidata:codigo "477808"}. } 13<<Texto libre: proyecto, speaker, etc.>>
  14. 14. Paso 4. Y a explotar los datos… (I) • Realizando consultas • Dime cuántos locutorios hay en Usera (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> SELECT COUNT (DISTINCT ?item) AS ? numLocutoriosUsera { ?item a localidata:LocalComercial . ?item localidata:clasificacionEconomica ?cE . ?cE localidata:epigrafeActividad ?epi . {?epi localidata:codigo "610002"} UNION {?epi localidata:codigo "477808"}. ?item localidata:enDivisionTerritorial ?seccion . ?seccion localidata:distrito <http://datos.localidata.com/recurso/Provincia/Madrid/Muni cipio/madrid/Distrito/12> . } 14<<Texto libre: proyecto, speaker, etc.>>
  15. 15. Paso 4. Y a explotar los datos… (I) • Realizando consultas • ¿En qué barrios viven más ecuatorianos entre 20 y 59 años? (aquí) PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX qb: <http://purl.org/linked-data/cube#> PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX qb: <http://purl.org/linked-data/cube#> PREFIX cityStats-dimension: <http://datos.localidata.com/def/CityStats/dimension#> PREFIX sdmx-dimension: <http://purl.org/linked-data/sdmx/2009/dimension#> PREFIX cityStats-code: <http://datos.localidata.com/def/CityStats/code#> PREFIX cityStats: <http://datos.localidata.com/def/CityStats/stats#> SELECT DISTINCT ?barrio (sum(?numHabitantesEC2065Seccion) as ? numHabitantesEC2065Barrio) WHERE { ?seccion localidata:barrio ?bar . ?bar rdfs:label ?barrio . { 15<<Texto libre: proyecto, speaker, etc.>>
  16. 16. Paso 4. Y a explotar los datos… (II) • Realizando gráficos con R 16<<Texto libre: proyecto, speaker, etc.>>
  17. 17. Paso 4. Y a explotar los datos… (III) • Obteniendo correlaciones entre personas de Ecuador empadronadas y locutorios por barrios de Madrid q <- "PREFIX localidata: <http://datos.localidata.com/def/City#> PREFIX qb: http://purl.org/linked-data/cube# … SELECT DISTINCT ?distrito ?barrio …“ dLocutoriosEC <- SPARQL(url=endpointLocalidata, query=q, ns=prefix, extra=options) resLocutoriosEC <- dLocutoriosEC$results loc_EC_frame <- data.frame(locutorios=resLocutoriosEC$numLocutorios, ecuatorianosAdultos=resLocutoriosEC$numHabitantesEC2065, chilenosAdultos=resLocutoriosEC$numHabitantesCL2065) row.names(loc_EC_frame) <- resLocutoriosEC$barrio cor <- cor(loc_EC_frame, method='pearson’) 17<<Texto libre: proyecto, speaker, etc.>>
  18. 18. Paso 4. Y a explotar los datos… (IV) • Y visualizando los datos para nuestros lectores en la Web, en un iPad… 18<<Texto libre: proyecto, speaker, etc.>>
  19. 19. ¿Alguna historia más? • Publicaremos en breve algunas en http://www.localidata.com/ • Si alguno de vosotros está interesado en utilizar nuestros datos para generar historias, hablad con nosotros 19<<Texto libre: proyecto, speaker, etc.>>
  20. 20. Periodismo de datos y Linked Data “El poder de los datos enlazados para generar historias” UCM / #6eiiic, Madrid, 25/09/2013 Oscar Corcho ocorcho@fi.upm.es, ocorcho@localidata.com @ocorcho

×