Raccontare storie guidati da numeri, tabelle e infografiche 
Andrea Nelson Mauro 
@nelsonmau 
www.dataninja.it 
Corso di Data Driven Journalism 
Scuola di Giornalismo Radiotelevisivo di Perugia 
, 7 giugno 2014
Il sito di Dataninja con i nostri progetti principali
Informazioni, slides, esperimenti, tutorial e tool per i data journalist
Una storia che viene da lontano 
Il primo uso del computer a fini giornalistici risale al 1952 negli USA: nasce 
il C.A.R. ( Computer Assisted Reporting 
). 
Nel 1967 Philip Meyer consacra questa pratica con un’inchiesta di 
successo ( 1968: A Newspaper's Role Between the Riots 
). 
Nel 1973 Meyer stesso fonda il , coniugando 
tecnologia e metodo scientifico ( Giornalismo e metodo scientifico 
).
Il vecchio e caro giornalismo, ma con numeri e tabelle 
Quest'anno hanno partecipato 520 progetti, ridotti a 75 dopo la prima 
selezione (tre italiani): i vincitori finali saranno solo 8.
Ingredienti: 
disponibilità di dati quantitativi (numeri o roba misurabile) 
possibilità di processarli e analizzarli (viva i calcolatori) 
metodo scientifico (mica per altro, è che funziona) 
onestà intellettuale (anche nota come deontologia professionale) 
fiuto per la notizia 
competenze narrative (non solo l'italiano, ma anche forme e colori) 
Da giornalisti, dobbiamo sempre raccontare storie... 
... ormai sempre più basate su dati digitali!
Richiede competenze multi-disciplinari e quindi team di professionisti: 
giornalista 
data scientist / statistico 
sviluppatore 
designer / grafico 
Porta facilmente a prodotti giornalistici di lunga vita o a temi su cui 
tornare a più riprese. 
Ci sono ampie libertà di riutilizzo e riciclo. 
Il rilascio dei dati permette di costruire comunità attorno ad essi: non solo 
giornalismo informativo, quindi, ma anche di servizio.
Richiede molta accortezza nell'uso degli strumenti statistici. 
Si rischiano prodotti giornalistici “belli”, ma fini a se stessi. 
Spesso è necessario imparare a usare software con curve di 
apprendimento abbastanza ripide. 
Gli strumenti e le piattaforme cambiano molto velocemente e bisogna 
rimanere aggiornati. 
Spesso si usano servizi di terze parti di cui non si ha il controllo. 
Tutti quelli del giornalismo...
Non c'è limite ai temi che si possono affrontare: sociale, politico, 
scientifico, economico, sportivo, persino gossip... 
La ricerca con metodo è un approccio tipico del giornalismo d'inchiesta, 
ma si sposa bene anche con quello di cronaca, il reportage, persino 
l'intervista... 
Il racconto e la visualizzazione dei dati si esprimono al meglio su web, ma 
possono essere molto efficaci anche sulla carta, nel foto e video 
giornalismo, in tv e alla radio...
La teoria delle quattro fasi 
Mi imbatto in un insieme di dati e sento il profumo di una possibile 
notizia: li raccolgo, li analizzo, faccio delle ipotesi, le verifico... 
. 
Trovare 
Pulire 
Analizzare 
Raccontare
Dove cercare e come capire di aver trovato 
Tipo di dati: 
non strutturati; 
strutturati (con metadati). 
Titolarità e diritti di riutilizzo: 
open data ( opendefinition.org 
); 
copyright; 
privacy, diritto all'oblio, segreto statistico, ... 
Accesso ai dati: 
Codice dell'Amministrazione Digitale, principio dell'Open Data by 
Default (2013): 
http://goo.gl/zmjbY7 
FOIA? Non ancora... 
http://goo.gl/T8LHXK
Dove cercare e come capire di aver trovato 
Formato dei dati digitali: 
pdf, 
pagine web in html, 
csv, 
fogli di calcolo (xls, xlsx, ods), 
database, 
end-point interrogabili. 
Per essere utili devono essere : non dobbiamo leggerli 
noi, ma farli leggere alle macchine! 
L'arte dello scraping: DataMiner & Co.
Verificare, individuare errori, correggere 
Premesse sbagliate portano (quasi) sempre a conclusioni sbagliate, anche 
se il ragionamento è corretto. 
Pure se affidabile, anche la fonte può sbagliare. Così come può barare, 
truccare, mentire, nascondere, omettere, ecc. 
Da controllare sempre prima di tutto: 
coerenza interna, 
completezza, 
verosimiglianza. 
Non buttar via mai niente e tenere traccia di quello che si fa...
Verificare, individuare errori, correggere 
Strumenti dei fogli di calcolo: 
filtri e funzioni di ordinamento; 
formattazione condizionale; 
definizione esplicita dei tipi (stringa, numero, data, ...); 
semplici grafici. 
Uno strumento ad hoc: Open Refine ( openrefine.org).
Interrogare i dati e andare oltre i numeri 
Ingredienti: 
fiuto (e occhio); 
esperienza; 
propensione al dubbio q.b.; 
un pizzico di statistica e matematica. 
Preparazioni di base: 
normalizzazione; 
variazione; 
distribuzione; 
correlazione; 
filtro, ordinamento, aggregazione.
Alcuni spunti e tracce di lavoro 
Dati sulla disoccupazione o sui costi dei servizi: quelli della 
tua città/regione sono più alti o più bassi rispetto ad altri territori? 
- Le fonti ufficiali tendono a concentrarsi su dati del quarto 
trimestre. Il contesto e la prospettiva cambiano osservando dati che 
mostrano lo sviluppo di un fenomeno negli ultimi 5 o 10 anni. 
- Un'istituzione annuncia milioni di euro di investimenti per le 
scuole. Ma hai fatto qualche conto? Quanti studenti potranno 
beneficiarne, su quale periodo di tempo? Ricalcolare il valore pro capite di 
programmi di investimento spesso può chiarire il reale significato. 
- Prova ad eseguire semplici controlli di 
somme e totali. Verifica le modalità con le quali i dati sono stati raccolti e 
con quali ipotesi o modelli. Qual è il tasso di disoccupazione nel tuo 
paese? Controllalo e confrontalo con altri paesi o modelli alternativi.
Principali strumenti visualizzazione: 
grafici base (linee, barre, torte): 
http://datawrapper.it 
grafici gerarchici: 
http://raw.densitydesign.org/ 
mappe geografiche: 
http://cartodb.com 
grafi (detti anche reti): 
http://gephi.org 
timeline: 
http://timeline.knightlab.com/ 
Ma on line ci sono tantissimi altri strumenti: l'importante è avere chiaro il 
proprio obiettivo e non avere paura di sperimentare!
Spesso visualizzare i dati può aiutarci a "scoprire" delle notizie 
Quanto è grande la differenza del tasso di disoccupazione tra due o più 
territori? Com'è cambiato un fenomeno nel tempo? 
Visualizzare questi dati può aiutarci a comprendere in maniera più 
immediata un fenomeno e fare prendere al nostro lavoro giornalistico 
un'altra direzione: torniamo indietro, cerchiamo altri dati, li mettiamo a 
confronto.
Raccontare i dati con grafici e parole 
Occhiello 
Titolo 
Sommario 
Attacco 
Notizia 
Corpo 
Chiusa 
Tutto come al solito, però questa volta abbiamo dati e numeri. 
Li possiamo raccontare a parole oppure visualizzarli...
Alcune considerazioni al riguardo 
I nostri dati sono l' della storia o sono 
? (Ad esempio: stiamo facendo 
una ricerca su un territorio disagiato, e tra le varie informazioni 
raccogliamo e visualizziamo anche dati sulla disoccupazione, sugli 
investimenti, etc.) 
rispetto alla nostra storia? Sono utili o servono 
per farci inserire un grafico interattivo e dare più "movimento" alla 
pagina?
Ma anche no... 
La distinzione tra e non ha 
senso di esistere... ma è servita a delineare un e a 
definire una comunità di professionisti, ora riconosciuta. 
Gli strumenti, le tecniche e le metodologie del giornalismo sono ormai 
in ogni redazione che si ponga l'obiettivo di affrontare il 
racconto della nostra realtà usando tutti i dati e le informazioni oggi 
disponibili. 
Sicuramente l'analisi dati e la di notizie richiedono un'approccio 
metodologico lontano dal giornalismo d'opinione (non a caso il data 
journalism è un termine anglosassone).
Detto anche giornalismo di precisione, quantitativo, esplicativo, ...
Andrea Nelson Mauro / "nelsonmau" 
nelsonmau@dataninja.it 
@nelsonmau 
www.dataninja.it 
http://school.dataninja.it 
Newsletter 
http://dataninja.it/newsletter 
http://datamediahub.it

Introduzione al data journalism | Roma, 7 giugno 2014

  • 1.
    Raccontare storie guidatida numeri, tabelle e infografiche Andrea Nelson Mauro @nelsonmau www.dataninja.it Corso di Data Driven Journalism Scuola di Giornalismo Radiotelevisivo di Perugia , 7 giugno 2014
  • 2.
    Il sito diDataninja con i nostri progetti principali
  • 5.
    Informazioni, slides, esperimenti,tutorial e tool per i data journalist
  • 6.
    Una storia cheviene da lontano Il primo uso del computer a fini giornalistici risale al 1952 negli USA: nasce il C.A.R. ( Computer Assisted Reporting ). Nel 1967 Philip Meyer consacra questa pratica con un’inchiesta di successo ( 1968: A Newspaper's Role Between the Riots ). Nel 1973 Meyer stesso fonda il , coniugando tecnologia e metodo scientifico ( Giornalismo e metodo scientifico ).
  • 7.
    Il vecchio ecaro giornalismo, ma con numeri e tabelle Quest'anno hanno partecipato 520 progetti, ridotti a 75 dopo la prima selezione (tre italiani): i vincitori finali saranno solo 8.
  • 8.
    Ingredienti: disponibilità didati quantitativi (numeri o roba misurabile) possibilità di processarli e analizzarli (viva i calcolatori) metodo scientifico (mica per altro, è che funziona) onestà intellettuale (anche nota come deontologia professionale) fiuto per la notizia competenze narrative (non solo l'italiano, ma anche forme e colori) Da giornalisti, dobbiamo sempre raccontare storie... ... ormai sempre più basate su dati digitali!
  • 9.
    Richiede competenze multi-disciplinarie quindi team di professionisti: giornalista data scientist / statistico sviluppatore designer / grafico Porta facilmente a prodotti giornalistici di lunga vita o a temi su cui tornare a più riprese. Ci sono ampie libertà di riutilizzo e riciclo. Il rilascio dei dati permette di costruire comunità attorno ad essi: non solo giornalismo informativo, quindi, ma anche di servizio.
  • 10.
    Richiede molta accortezzanell'uso degli strumenti statistici. Si rischiano prodotti giornalistici “belli”, ma fini a se stessi. Spesso è necessario imparare a usare software con curve di apprendimento abbastanza ripide. Gli strumenti e le piattaforme cambiano molto velocemente e bisogna rimanere aggiornati. Spesso si usano servizi di terze parti di cui non si ha il controllo. Tutti quelli del giornalismo...
  • 11.
    Non c'è limiteai temi che si possono affrontare: sociale, politico, scientifico, economico, sportivo, persino gossip... La ricerca con metodo è un approccio tipico del giornalismo d'inchiesta, ma si sposa bene anche con quello di cronaca, il reportage, persino l'intervista... Il racconto e la visualizzazione dei dati si esprimono al meglio su web, ma possono essere molto efficaci anche sulla carta, nel foto e video giornalismo, in tv e alla radio...
  • 12.
    La teoria dellequattro fasi Mi imbatto in un insieme di dati e sento il profumo di una possibile notizia: li raccolgo, li analizzo, faccio delle ipotesi, le verifico... . Trovare Pulire Analizzare Raccontare
  • 13.
    Dove cercare ecome capire di aver trovato Tipo di dati: non strutturati; strutturati (con metadati). Titolarità e diritti di riutilizzo: open data ( opendefinition.org ); copyright; privacy, diritto all'oblio, segreto statistico, ... Accesso ai dati: Codice dell'Amministrazione Digitale, principio dell'Open Data by Default (2013): http://goo.gl/zmjbY7 FOIA? Non ancora... http://goo.gl/T8LHXK
  • 14.
    Dove cercare ecome capire di aver trovato Formato dei dati digitali: pdf, pagine web in html, csv, fogli di calcolo (xls, xlsx, ods), database, end-point interrogabili. Per essere utili devono essere : non dobbiamo leggerli noi, ma farli leggere alle macchine! L'arte dello scraping: DataMiner & Co.
  • 15.
    Verificare, individuare errori,correggere Premesse sbagliate portano (quasi) sempre a conclusioni sbagliate, anche se il ragionamento è corretto. Pure se affidabile, anche la fonte può sbagliare. Così come può barare, truccare, mentire, nascondere, omettere, ecc. Da controllare sempre prima di tutto: coerenza interna, completezza, verosimiglianza. Non buttar via mai niente e tenere traccia di quello che si fa...
  • 16.
    Verificare, individuare errori,correggere Strumenti dei fogli di calcolo: filtri e funzioni di ordinamento; formattazione condizionale; definizione esplicita dei tipi (stringa, numero, data, ...); semplici grafici. Uno strumento ad hoc: Open Refine ( openrefine.org).
  • 17.
    Interrogare i datie andare oltre i numeri Ingredienti: fiuto (e occhio); esperienza; propensione al dubbio q.b.; un pizzico di statistica e matematica. Preparazioni di base: normalizzazione; variazione; distribuzione; correlazione; filtro, ordinamento, aggregazione.
  • 18.
    Alcuni spunti etracce di lavoro Dati sulla disoccupazione o sui costi dei servizi: quelli della tua città/regione sono più alti o più bassi rispetto ad altri territori? - Le fonti ufficiali tendono a concentrarsi su dati del quarto trimestre. Il contesto e la prospettiva cambiano osservando dati che mostrano lo sviluppo di un fenomeno negli ultimi 5 o 10 anni. - Un'istituzione annuncia milioni di euro di investimenti per le scuole. Ma hai fatto qualche conto? Quanti studenti potranno beneficiarne, su quale periodo di tempo? Ricalcolare il valore pro capite di programmi di investimento spesso può chiarire il reale significato. - Prova ad eseguire semplici controlli di somme e totali. Verifica le modalità con le quali i dati sono stati raccolti e con quali ipotesi o modelli. Qual è il tasso di disoccupazione nel tuo paese? Controllalo e confrontalo con altri paesi o modelli alternativi.
  • 19.
    Principali strumenti visualizzazione: grafici base (linee, barre, torte): http://datawrapper.it grafici gerarchici: http://raw.densitydesign.org/ mappe geografiche: http://cartodb.com grafi (detti anche reti): http://gephi.org timeline: http://timeline.knightlab.com/ Ma on line ci sono tantissimi altri strumenti: l'importante è avere chiaro il proprio obiettivo e non avere paura di sperimentare!
  • 20.
    Spesso visualizzare idati può aiutarci a "scoprire" delle notizie Quanto è grande la differenza del tasso di disoccupazione tra due o più territori? Com'è cambiato un fenomeno nel tempo? Visualizzare questi dati può aiutarci a comprendere in maniera più immediata un fenomeno e fare prendere al nostro lavoro giornalistico un'altra direzione: torniamo indietro, cerchiamo altri dati, li mettiamo a confronto.
  • 21.
    Raccontare i daticon grafici e parole Occhiello Titolo Sommario Attacco Notizia Corpo Chiusa Tutto come al solito, però questa volta abbiamo dati e numeri. Li possiamo raccontare a parole oppure visualizzarli...
  • 22.
    Alcune considerazioni alriguardo I nostri dati sono l' della storia o sono ? (Ad esempio: stiamo facendo una ricerca su un territorio disagiato, e tra le varie informazioni raccogliamo e visualizziamo anche dati sulla disoccupazione, sugli investimenti, etc.) rispetto alla nostra storia? Sono utili o servono per farci inserire un grafico interattivo e dare più "movimento" alla pagina?
  • 23.
    Ma anche no... La distinzione tra e non ha senso di esistere... ma è servita a delineare un e a definire una comunità di professionisti, ora riconosciuta. Gli strumenti, le tecniche e le metodologie del giornalismo sono ormai in ogni redazione che si ponga l'obiettivo di affrontare il racconto della nostra realtà usando tutti i dati e le informazioni oggi disponibili. Sicuramente l'analisi dati e la di notizie richiedono un'approccio metodologico lontano dal giornalismo d'opinione (non a caso il data journalism è un termine anglosassone).
  • 24.
    Detto anche giornalismodi precisione, quantitativo, esplicativo, ...
  • 25.
    Andrea Nelson Mauro/ "nelsonmau" nelsonmau@dataninja.it @nelsonmau www.dataninja.it http://school.dataninja.it Newsletter http://dataninja.it/newsletter http://datamediahub.it