Captura y visualización de datos abiertos para acciones ciudadanas

5,047 views
5,127 views

Published on

periodismo, datos, data, journalism, open data, rdf, linked data, extraction, visualization, visualización, captura

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
5,047
On SlideShare
0
From Embeds
0
Number of Embeds
3,618
Actions
Shares
0
Downloads
15
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Captura y visualización de datos abiertos para acciones ciudadanas

  1. 1. Captura y visualización de datosabiertos para acciones ciudadanasUnai Aguileraunai.aguilera@deusto.es@unaguilI Jornada de Periodismo de Datos y Open DataUniversidad de Deusto, Donostia24 de mayo de 2013
  2. 2. PeriodismoRecopilarSintetizarPublicarInformaciónde actualidadFacilitar acceso al "lector"
  3. 3. "When information was scarce, most of our efforts weredevoted to hunting and gathering. Now that informationis abundant, processing is more important."Philip Meyer, Professor Emeritus, University ofNorth Carolina at Chapel Hill"The unifying goal is a journalistic one: providinginformation and analysis to help inform us all aboutimportant issues of the day."Aron Pilhofer, New York Times"It used to be that you would get stories by chatting to people in bars,and it still might be that you’ll do it that way sometimes. But now it’salso going to be about poring over data and equipping yourself with thetools to analyze it and picking out what’s interesting."Tim Berners-Lee, founder of the World Wide WebPeriodismo de datos
  4. 4. Do not Harm, Las Vegas Sun (2010)http://www.lasvegassun.com/hospital-care/2,9 millones de facturas analizadasDetectados 3600 errores preveniblesResultado6 modificaciones ley sanitaria
  5. 5. Iraq War Logs, Associated Presshttp://overview.ap.org/blog/2010/12/a-full-text-visualization-of-the-iraq-war-logs/11,616 SIGACT informes desde diciembre 2006Búsqueda de palabras relacionadasClusterizaciónEnfatizar visualmente la estructura
  6. 6. El indultómetro, Fundación Civiohttp://www.elindultometro.es/Uso y posible abuso de la ley de indultoInformación del BOE desde 1996Análisis gráficoTiempo medio de indultoHistórico de indultosIndultos destacados
  7. 7. FuentesProcesarVisualizarFlujo de trabajoSelecciónFiabilidadPre-procesoPatronesRelacionesRazonarResumirFacilitarAtraer
  8. 8. ¿Por dónde empezamos?
  9. 9. Catálogos de datosDatos abiertoshttp://datahub.io/http://opendata.euskadi.net/http://datacatalogs.org/Empresas privadashttp://datamarket.com/Datos abiertos y de pagoGoogle
  10. 10. Búsqueda de datosBuscadorProceso más costosoConjuntos de datos duplicadosSin catalogarOrigen dudosoLicencias de usodesempleo filetype:CSVTipo de ficherodesempleo filetype:XLSdesempleo filetype:RDF desempleo filetype:PDF
  11. 11. De personas y máquinasOrientada a personasRepresentación visual (HTML + CSS)Documentos PDFDifíciles de procesar (PDF Miner)API webhttp://www.justizia.net/Web scrapingScriptingPython+Beautiful SoapEjemplohttps://github.com/RHoK-Bilbao/desahucios
  12. 12. Machine readable dataListado personas desaparecidas durante la Guerra Civil yel Franquismo (9600 entradas)Fuente de datos: Justicia y Administración Pública. Gobierno Vascohttp://opendata.euskadi.net/w79-contdata/es/contenidos/ds_general/personas_desaparecidas/es_desapare/personas_desaparecidas.htmlNombreVecindadLugar muerteFecha muerteCausaDatos¿Qué podemos preguntar?
  13. 13. Google Fusion TablesListado personas desaparecidas durante la Guerra Civil yel Franquismo (solo 300 primeras / 9600 entradas)Fuente de datos: Justicia y Administración Pública. Gobierno Vasco
  14. 14. Linked DataSir Tim Berners-LeeLOD - Linked Open Data CloudMecanismos básicos de la webAplicados a datosHTTP -> EnlacesURIs -> RecursosRDF -> Estructurahttp://5stardata.info/
  15. 15. RDF + Linked Datahttp://helheim.deusto.es/bizkaisenseOntologías+SemanticSensorNetworkSemantic Webfor Earth andEnvironmentalTerminologyhttp://ckan.linkeddata.es/dataset/bizkaisensePublicación Aplicación webProyecto Bizkaisense
  16. 16. Procesado de datosCompararLimpiezaClusterizaciónCurvas de ajuste¿Qué quieresresponder?Combinarfuentes¿Qué quieresdemostrar?¿Qué datostienes?Data miningHadoop
  17. 17. VisualizaciónGrandes volúmenes de datosFacilitar comprensiónInteractividadRazonarExtraer conclusionesRepresentación adecuada
  18. 18. Gráficos de puntos (dispersión)Distribución de valores 2DConocer las ocurrenciasAgrupaciones (clusters)No representan tendencias
  19. 19. Gráficos de líneasRelaciones entre valoresTendenciasCambios temporalesNo representan categorías
  20. 20. Gráficos de barrasCompara categoríasOrden de las barrasPareto (mayor a menor)Cronológico
  21. 21. Gráficos circularesProporción numéricaProblemasComparación áreasMuchas categoríasMejor gráficos de barras
  22. 22. Google Chartshttps://developers.google.com/chart/InteractivosHTML5 + SVGJavascript
  23. 23. NVD3.jshttp://nvd3.org/InteractivosHTML5Javascript
  24. 24. D3.jshttp://d3js.org/InteractivosHTML5JavascriptComplementamenteExcesivamenteconfigurables
  25. 25. Geolocalización¡Cuidado con las licencias de uso!
  26. 26. Visualización++Information is BeautifulIdeas para visualizaciónFiguras estáticasUsar otras aplicacioneshttp://www.informationisbeautiful.net/
  27. 27. Proyecto LinkedStatsMapa de calor (OpenLayers)Kg residuos/personaProgresión temporalGráficas por municipio (NVD3.JS)Datos utilizadosResiduosDiputación de Bizkaia(PDF Scraping)Copy & Paste - ingPoblaciónINS(Fichero CSV)http://helheim.deusto.es/linkedstats/AutorJon Lázaro
  28. 28. ConclusionesOportunidad de trabajoPeriodistas, ingenieros, diseñadores, ...Conciencia socialGrupos interdisciplinares
  29. 29. Algunas herramientasOpenRefine+JavaScript
  30. 30. HACKATHON¿Cómo empezar?Noticia en
  31. 31. DeustoTech-InternetJoseba Abaitua@kavangoUnai Aguilera@unaguilOscar Peña@Oscar_PDRMikel Emaldi@memaldiJon Lázaro@jon_lazaroDiego López de Ipiña@dipinaDavid Buján@dbujanhttp://www.morelab.deusto.es/ @morelab_udLinked and Open Data Group
  32. 32. ReferenciasEuropean Public Data Show Casehttp://publicdata.eu/http://datajournalismhandbook.orgData Journalism HandbookLicencia Creative CommonsNow You See It: SimpleVisualization Techniquesfor Quantitative AnalysisPython Programming Languagehttp://python.org/

×