Data journalism 
Fonti, tools e casi di 
studio 
Cagliari 4 e 5 dicembre 2014
Obiettivi del ddj 
● raccontare una storia interessante fondata 
su una o più basi di dati 
● approfondire determinati argomenti in 
maniera innovativa 
● aiutare il lettore alla comprensione dei dati e 
delle visualizzazioni
FLUSSO DI LAVORO DDJ 
TROVARE E 
PRENDERE I 
DATI 
SINTETIZZARE E 
RAPPRESENTARE I 
DATI RACCONTARE 
ANALIZZARE I DATI 
UNA STORIA 
SISTEMARE E 
PULIRE I DATI
LE FONTI E LA RACCOLTA 
TROVARE E 
PRENDERE I DATI
LE FONTI E LA RACCOLTA 
DATI NON 
PRONTI PER 
ESSERE 
ELABORATI 
DATI GIÀ 
PRONTI PER 
ESSERE 
ELABORATI
LE FONTI E LA RACCOLTA 
DATI NON PRONTI PER L’ELABORAZIONE 
sono quei dati contenuti in file destinati ad un utilizzo 
puramente informativo e non adatti all’elaborazione 
software 
❏ pdf 
❏ pagine web 
❏ file strutturati ma sporchi
LE FONTI E LA RACCOLTA 
PDF CON TABELLE 
fino a pochi anni fa 
erano il formato più 
comune. Ancora oggi 
sono una fonte 
potenzialmente ricca 
anche se scomoda 
http://www.pdfsearchengine.net/
LE FONTI E LA RACCOLTA 
PDF CON TABELLE 
è possibile estrarre in 
maniera automatica i 
dati anche se sono 
estremamente numerosi 
e spalmati in più pagine 
http://tabula.technology/
LE FONTI E LA RACCOLTA 
SCRAPING DA 
PAGINE WEB 
Estrazione di dati 
strutturati da un sito 
web per mezzo di 
programmi software o 
linguaggi informatici 
https://www.kimonolabs.com 
https://magic.import.io
LE FONTI E LA RACCOLTA 
FILE STRUTTURATI MA 
SPORCHI 
❏ spazi vuoti 
❏ celle unite 
❏ errori di digitazione 
❏ maiuscole/minuscole 
❏ numeri digitati come testo 
❏ valori digitati in modo 
differente (Quartu S.Elena/Quartu 
Sant’elena) 
http://openrefine.org/ 
http://www.libreoffice.org/
LE FONTI E LA RACCOLTA 
DATI GIÀ PRONTI PER L’ELABORAZIONE 
Progettati per facilitare il riuso, l’integrazione e l’analisi 
❏ Fonti della statistica ufficiale (Istat, Eurostat, Banca d’ 
italia, SISTAN..) 
❏ Fonti amministrative (open data) 
❏ Fonti alternative e “crowd” (wikipedia, openstreetmap...) 
❏ Web e social network (twitter, google...)
LE FONTI E LA RACCOLTA 
OPEN DATA 
THE OPEN DEFINITION: 
“I dati e i contenuti aperti possono essere 
liberamente utilizzati, modificati e condivisi da 
chiunque per qualunque scopo”
LE FONTI E LA RACCOLTA 
LICENZE LIBERE 
❏ Tutelano l’autore del dato 
❏ Tutelano l’utilizzatore dei dati
PULIZIA DEI DATI 
SISTEMARE E 
PULIRE I DATI
PULIZIA DEI DATI 
ESPLORAZIONE 
PULIZIA 
STANDARDIZZAZIONE 
INTEGRAZIONE
PULIZIA DEI DATI
ELABORAZIONE DEI DATI 
ANALIZZARE I DATI
ELABORAZIONE DEI DATI 
❏ totali e subtotali 
❏ tabelle di contingenza 
❏ indici 
❏ medie e mediana 
❏ percentuali
ELABORAZIONE DEI DATI 
TABELLE PIVOT 
Consentono di 
effettuare elaborazioni 
sintetiche su molti dati 
in maniera 
estremamente semplice
RAPPRESENTARE I DATI 
SINTETIZZARE E 
RAPPRESENTARE 
I DATI
RAPPRESENTARE I DATI 
DATA VISUALIZATION 
Sintetizzare le informazioni in 
modo da ottenere una visione d’ 
insieme che semplifichi l’ 
informazione e renda più 
immediata la comunicazione 
della notizia 
https://datawrapper.de/ 
http://app.raw.densitydesign.org/
RAPPRESENTARE I DATI 
RAPPRESENTAZIONI 
GEOGRAFICHE 
Individuare la distribuzione dei 
fenomeni e della distribuizione 
dei dari nel territorio 
https://cartodb.com/ 
https://www.mapbox.com/
RAPPRESENTARE I DATI 
RAPPRESENTAZIONI DEI 
GRAFI 
Visualizzare le connessioni tra i 
nodi di una rete 
http://gephi.github.io/
RACCONTARE UNA STORIA 
RACCONTARE 
UNA STORIA
RACCONTARE UNA STORIA
RACCONTARE UNA STORIA
RACCONTARE UNA STORIA
RACCONTARE UNA STORIA
GRAZIE 
mail: a.zedda@kode-solutions.net 
twitter: @andria_tzedda

Data journalism cagliari 2014

  • 1.
    Data journalism Fonti,tools e casi di studio Cagliari 4 e 5 dicembre 2014
  • 2.
    Obiettivi del ddj ● raccontare una storia interessante fondata su una o più basi di dati ● approfondire determinati argomenti in maniera innovativa ● aiutare il lettore alla comprensione dei dati e delle visualizzazioni
  • 3.
    FLUSSO DI LAVORODDJ TROVARE E PRENDERE I DATI SINTETIZZARE E RAPPRESENTARE I DATI RACCONTARE ANALIZZARE I DATI UNA STORIA SISTEMARE E PULIRE I DATI
  • 4.
    LE FONTI ELA RACCOLTA TROVARE E PRENDERE I DATI
  • 5.
    LE FONTI ELA RACCOLTA DATI NON PRONTI PER ESSERE ELABORATI DATI GIÀ PRONTI PER ESSERE ELABORATI
  • 6.
    LE FONTI ELA RACCOLTA DATI NON PRONTI PER L’ELABORAZIONE sono quei dati contenuti in file destinati ad un utilizzo puramente informativo e non adatti all’elaborazione software ❏ pdf ❏ pagine web ❏ file strutturati ma sporchi
  • 7.
    LE FONTI ELA RACCOLTA PDF CON TABELLE fino a pochi anni fa erano il formato più comune. Ancora oggi sono una fonte potenzialmente ricca anche se scomoda http://www.pdfsearchengine.net/
  • 8.
    LE FONTI ELA RACCOLTA PDF CON TABELLE è possibile estrarre in maniera automatica i dati anche se sono estremamente numerosi e spalmati in più pagine http://tabula.technology/
  • 9.
    LE FONTI ELA RACCOLTA SCRAPING DA PAGINE WEB Estrazione di dati strutturati da un sito web per mezzo di programmi software o linguaggi informatici https://www.kimonolabs.com https://magic.import.io
  • 10.
    LE FONTI ELA RACCOLTA FILE STRUTTURATI MA SPORCHI ❏ spazi vuoti ❏ celle unite ❏ errori di digitazione ❏ maiuscole/minuscole ❏ numeri digitati come testo ❏ valori digitati in modo differente (Quartu S.Elena/Quartu Sant’elena) http://openrefine.org/ http://www.libreoffice.org/
  • 11.
    LE FONTI ELA RACCOLTA DATI GIÀ PRONTI PER L’ELABORAZIONE Progettati per facilitare il riuso, l’integrazione e l’analisi ❏ Fonti della statistica ufficiale (Istat, Eurostat, Banca d’ italia, SISTAN..) ❏ Fonti amministrative (open data) ❏ Fonti alternative e “crowd” (wikipedia, openstreetmap...) ❏ Web e social network (twitter, google...)
  • 12.
    LE FONTI ELA RACCOLTA OPEN DATA THE OPEN DEFINITION: “I dati e i contenuti aperti possono essere liberamente utilizzati, modificati e condivisi da chiunque per qualunque scopo”
  • 13.
    LE FONTI ELA RACCOLTA LICENZE LIBERE ❏ Tutelano l’autore del dato ❏ Tutelano l’utilizzatore dei dati
  • 14.
    PULIZIA DEI DATI SISTEMARE E PULIRE I DATI
  • 15.
    PULIZIA DEI DATI ESPLORAZIONE PULIZIA STANDARDIZZAZIONE INTEGRAZIONE
  • 16.
  • 17.
    ELABORAZIONE DEI DATI ANALIZZARE I DATI
  • 18.
    ELABORAZIONE DEI DATI ❏ totali e subtotali ❏ tabelle di contingenza ❏ indici ❏ medie e mediana ❏ percentuali
  • 19.
    ELABORAZIONE DEI DATI TABELLE PIVOT Consentono di effettuare elaborazioni sintetiche su molti dati in maniera estremamente semplice
  • 20.
    RAPPRESENTARE I DATI SINTETIZZARE E RAPPRESENTARE I DATI
  • 21.
    RAPPRESENTARE I DATI DATA VISUALIZATION Sintetizzare le informazioni in modo da ottenere una visione d’ insieme che semplifichi l’ informazione e renda più immediata la comunicazione della notizia https://datawrapper.de/ http://app.raw.densitydesign.org/
  • 22.
    RAPPRESENTARE I DATI RAPPRESENTAZIONI GEOGRAFICHE Individuare la distribuzione dei fenomeni e della distribuizione dei dari nel territorio https://cartodb.com/ https://www.mapbox.com/
  • 23.
    RAPPRESENTARE I DATI RAPPRESENTAZIONI DEI GRAFI Visualizzare le connessioni tra i nodi di una rete http://gephi.github.io/
  • 24.
    RACCONTARE UNA STORIA RACCONTARE UNA STORIA
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.