Taller visualització de dades - Media140 - Vilaweb
1. Periodisme de dades
Noves narratives visuals
Carlos Alonso
@carlosalonso
http://astillero.org
http://bcnmedialab.org
2. Qué anem a fer:
1.Periodisme de Dades
1.Introducció
1.Que és el periodisme de dades
2.Periodisme de dades Vs Visualització de dades
3.La visualització de dades no es una novetat: una mica d'història
2.Una proposta de model i procés periodístic
1.Cas pràctic: BBC
2.Cas pràctic: Víctimes d'ETA
3.Treballant amb dades
1.Per on començar: on son les dades
2.Com treballar, netejar i seleccionar dades
3.Que podem trobar a les dades: tipus de relacions, tendències, patrons i
anomalies
4.Com trobar-les: categories de visualitzacions i usos més efectius
2.Taller pràctic
25. ¿Ón son les dades?
1.Repositoris públics
2. Repositoris comercials
3. Recerca avançada
4. Scraping & APIs
5. Petició directa
6. Creació propia
26. 1. Repositoris públics
Institucións públicas:
#opendata
Generalitat de Catalunya
Ajuntament de Barcelona
(hi ha més!)
Departaments d'Estatística
Generalitat de Catalunya - Idescat
Govern d'Espanya – INE
Unió Europea – Eurostat
Departaments Cartográfics
Iniciatives privades:
CKAN
Publicdata.eu
Opengovernmentdata.org
Open Knowledge Foundation
30. 5. Petició directa
No hi ha llei de transparència a Espanya que reguli el dret a
saber dels ciutadans i les obligacions de les administracions
públiques a contestar.
AccessInfo
Pro Bono Público
Abredatos
31. 6. Creació propia
Bases de dades de creació propia
Colaboració amb l'audiéncia – Crowdsourcing
Experiències:
– Adoptaunsenador
– ElPeriódico
33. Netejar i seleccionar
Quins tipus de dades tenim?
Text, Nombre, Dates, Coordinades
Dades absolutes Vs relatives (percentatges, ràtios)
Qualitat? Biaix?
Verificar, comparar amb altres sets de dades, sanity check
Estan en el format apropiat?
Shape Vs KML
Estan totes les dades en les mateixes unitats?
34. Netejar i seleccionar
Dades en format text: estan normalitzades?
St. Andreu != Sant Andreu != S. Andreu
Codi d'entitat?
Ens permet fer mashups amb seguretat
Eines:
Google Refine
Data Wrangler
35. Netejar i seleccionar
Format Dificultat Solució
HTML Media Scraping
PDF Alta OCR
Word Media Excel
Excel Media CSV
CSV Baja :)
XML Baja :)
39. Categoríes de visualització
Que volem representar?
Quin tipus de relació?
Quines variables volem mostrar?
Tenim informació temporal?
Geogràfica?
40. Que podem veure amb
una visualització de dades
Tendències Comparacions
Patrons Relacions
Anomalies Jerarquia
Connexions Localitzacions
Correlacions Processos