2. Il presente materiale è pubblicato con licenza Creative Commons
‘’ Attribuzione – Non commerciale – Condividi allo stesso modo
– 3.0 ‘’
(https://creativecommons.org/licenses/by-sa/4.0/)
La licenza non si estende alle immagini provenienti da altre fonti e agli
screenshot, i cui diritti restano in capo ai rispettivi proprietari, che, ove
possibile, sono stati indicati. L’autore si scusa per eventuali omissioni, e
resta a disposizione per correggerle.
3. CONTENUTI
1. DATA JOURNALISM
- Definizione
- Confronto con giornalismo
tradizionale
- I ruoli del data team
- Breve storia
- Raccolta dati: strumenti e fonti
2. INFOGRAFICHE
- Definizione
- Componenti principali
- Ambiti di utilizzo
- Storia
- Tecniche e software
- Edward Tufte
3. DATA JOURNALISM IN ITALIA
- Dati.gov.it
- <ahref
- DataBlog
- Wired.it e la mappa Dove ti curi
- InfoData del Sole24Ore
- Dataninja.it
- Un caso esemplare:
MigrantsFiles
4. Il data journalism rappresenta l’arte di scovare delle storie da un particolare tipo di
fonte, i dati, l’abilità di interpretare il tutto e di raccontarlo sotto forma di inchieste
realizzate con gli strumenti della matematica, della statistica e delle scienze sociali
e comportamentali, applicate alla pratica del giornalismo.
PROGRAMMAZIONE
INFORMATICA
STATISTICA
FIUTO PER LA
NOTIZIA
DEFINIZIONE
5. GIORNALISMO
TRADIZIONALE
MEZZI: giornali, radio, tv.
• I media sono le prime e
uniche fonti di notizie.
• La televisione mostra
notizie relativamente in
diretta.
PRODOTTO FINALE: articoli,
video.
RUOLO CHIAVE: giornalista.
DATA JOURNALISM
MEZZI: statistica, informatica,
grafica.
• Raccogliere, filtrare e
visualizzare quello che
succede dietro ciò che si
vede. I dati diventano
significativi quando visti
nella giusta prospettiva.
PRODOTTO FINALE: database
aggiornabili. Infografiche che
spiegano in modo chiaro e
intuitivo.
RUOLO CHIAVE: data team.
ERA DIGITALE
MEZZI: internet, YouTube, social
media, blog, smartphone.
• Le notizie si trasmettono in
tempo reale e da fonti
molteplici in tutto il mondo.
• Il fenomeno del CITIZEN
JOURNALIST mette in
discussione i media come
unica fonte.
PRODOTTO FINALE: articoli,
video, post.
RUOLO CHIAVE: pubblico.
6. DATA TEAM
Dirige il processo.
Individua la storia e
pone le domande.
Raccoglie, pulisce e
analizza i dati.
Fact checking.
DESIGNER
Specialista nella
visualizzazione dei dati.
Rende la storia
interessante,
accessibile,
accattivante.
Crea anche grafiche
web interattive.
SVILUPPATOREGIORNALISTA
Individua il modo
migliore per presentare
i dati.
Crea programmi con
cui l’utente interagisce
direttamente.
Supporta tutto il
processo di raccolta e
analisi dei dati.
7.
8.
9. THE COLOR OF
MONEY (1989)
L’inchiesta di Bill Dedman
sulla discriminazione razziale
da parte di banche e istituti
di credito di Atlanta, cattura
l'attenzione del pubblico con
l'ampio uso di tavole, disegni
e carte geografiche.
10. WHAT WENT
WRONG (1992)
L’inchiesta di Stephen Doig
sui danni causati dall'uragano
Andrew che ha colpito
Miami. Confrontando dati
sull’agibilità delle case, l’anno
di costruzione e la forza dei
venti, dimostra che a
distruggere i tetti della città
era stata, soprattutto, la
corruzione nell'edilizia.
11.
12. WORKFLOW
Mirko Lorenz definisce il
processo del data journalism
come un workflow, un flusso
di lavoro in cui i dati
rappresentano la base per la
ricerca, la visualizzazione e la
narrazione della storia.
Attraverso queste fasi, la
storia non rappresenta più il
prodotto del giornalismo, ma
il processo stesso. In questo
processo di rifinitura i dati
vengono raccolti, filtrati e
visualizzati trasformandosi
nella storia finale. Man mano
che il processo va avanti
aumenta il suo valore agli
occhi del pubblico.
13. REALIZZARE UN ARTICOLO
Nel 2011 il giornalista Paul
Bradshaw realizza un
modello che illustra il
processo di realizzazione di
un articolo attraverso un
diagramma a piramide
rovesciata.
Le fasi del processo sono:
raccogliere, pulire,
contestualizzare e incrociare.
RACCOGLIERE
PULIRE
CONTESTUALIZZARE
INCROCIARE
14. # 1 RACCOGLIERE
ISTAT, Eurostat,
The World Bank,
UN, WHO.
data.gov,
data.gov.uk,
dati.senato.it.
The Data Hub
della Open
Knowledge
Foundation.
Storyful.
OPEN DATA
WAREHOUSE
RICHIESTA SCRAPING
La fonte non rilascia i
dati, ma questi
possono essere
ottenuti attraverso
una richiesta scritta:
il diritto di accesso
all’informazione è un
concetto
fondamentale nel
data journalism.
Raccogliere
qualunque
informazione sia stata
digitalizzata, in
qualunque formato.
Mercury Web Parser.
DownThemAll.
Scraper Extension.
Tesseract.
Scraperwiki.
15. RACCOGLIERE
THE DATA HUB
Permette di trovare, condividere e
riutilizzare risorse disponibili di dati.
Fondata dalla Open Knowledge
Foundation, un network non-profit
internazionale che si batte per il libero
accesso ai dati.
STORYFUL
Permette di cercare dati
contemporaneamente in tutti i social
network, monitorare gli argomenti di
interesse, individuare le fonti e i trend
ed estrarre i contenuti più interessanti.
OPEN DATA
WAREHOUSE
16. RACCOGLIERE
LIMITI
Codice HTML con poche
informazioni strutturali.
Sistemi che richiedono
l’autenticazione per l’accesso.
Sistemi che usano cookies per
memorizzare le azioni dell’utente.
Blocchi all’accesso da parte dei
server amministratori.
Barriere legali del diritto d’autore
sui database.
MERCURY WEB PARSER
FIREFOX DOWN THEM ALL
CHROME SCRAPER EXTENSION
GOOGLE TESSERACT
SCRAPERWIKI
STRUMENTI
SCRAPING
17. RACCOGLIERE
SCRAPERWIKI - QUICKCODE
Piattaforma per la
costruzione collaborativa di
programmi per estrarre e
analizzare i dati pubblici.
Questi possono essere creati
utilizzando una varietà di
linguaggi di programmazione,
tra cui Python e JavaScript.
MERCURY WEB PARSER
Con una richiesta API
permette di estrarre il
contenuto rilevante di
qualsiasi pagina web-titolo,
autore, testo e immagini.
SCRAPING
18. #2 PULIRE
I dati possono essere
incompleti, duplicati e
contenere errori. È quindi
necessario pulirli per renderli
affidabili.
STRUMENTI UTILI
19. #3 CONTESTUALIZZARE
Come ogni fonte, i dati non sono
sempre affidabili. Bisogna pertanto
chiedersi sempre chi li ha raccolti,
quando, a quale scopo e con quale
metodologia. La storia assume un
maggiore impatto giornalistico e una
maggiore rilevanza civica solo se
contestualizzato.
#4 INCROCIARE
Spesso è necessario incrociare diversi
dataset per ottenere una storia
soddisfacente. La combinazione più
classica è il mash up con mappe che
consentono di visualizzare nello spazio i
contenuti, personalizzabili dall’utente.
20.
21. • Prodotto digitale o analogico su carta o su web.
• Racconta una storia visualizzando immagini.
INFORMAZIONI GRAFICA
22. DINAMICA
video e
animazioni
INTERATTIVA
l’utente può
scegliere
CI SONO TRE TIPI DI INFOGRAFICHE
#1
GRAFICA
layout,
immagini e
set di icone
#2
DATI
Informazioni
che riguardano
un fenomeno
#3
STORIA
messaggio
veicolato
STATICA
immagini
Sono formate da 3 elementi
DINAMICA
video e
animazioni
INTERATTIVA
L’utente può
scegliere
24. LE INFOGRAFICHE VENGONO UTILIZZATE
AMBITO GIORNALISTICO
Fin dal 1982
USA TODAY le utilizza nei
suoi snapshots.
AMBITO SCOLASTICO
Come supporto alla
didattica tradizionale o
come strumento per gli
studenti.
AMBITO MARKETING
Per illustrare strategie di
comunicazione e
campagne pubblicitarie:
statistiche, grafici e
business model.
25.
26. INFOGRAPHIC TIMELINE
40.000 a.C. 7.000-4.000 a.C. 1790 William Playfair
1857 Florence Nightingale 1861 Charles Joseph Minard
1972-73 Pioneer 1 e 2 1982 Edward Tufte
27. EDWARD TUFTE (Kansas City, 14 marzo 1942)
• Statistico e scultore statunitense
• Membro della American Statistical
Association
• Pioniere dell’Information Design
• The Visual Display of Quantitative
Information, 1983.
«Leonardo da Vinci dei dati»
NEW YORK TIMES
«Galileo della grafica»
BUSINESSWEEK
28. Total ink used to print the
graphic
DATA INK RATIO
“Above all else show the data.
A large share of ink on a graphic
should present data-information,
the ink changing as the data
change. Data-ink is the non-
erasable core of a graphic, the
non-redundant ink arranged in
response to variation in the
numbers represented.”
Tufte, 1983
Data-ink
DATA-INK
RATIO
Proportion of a graphic’s ink
devoted to the non-refundant
display of data-information
1.0 – proportion of a
graphic that can be erased
=
=
=
29.
30.
31. COME PER OGNI FORMA DI COMUNICAZIONE CHE MIRA
ALL’EFFICACIA, ANCHE PER LA CREAZIONE DI UN’INFOGRAFICA È
NECESSARIO UN LAVORO PREPARATORIO:
#1
Obiettivi da raggiungere
#2
Individuazione dei
destinatari e delle
loro necessità
#3
Medium su cui verrà
pubblicato il lavoro
32. PRIMA TECNICA: GESTALT
Psicologia secondo cui =
1. Il tutto è più della somma delle singole parti che lo compongono
2. il cervello umano riconduce ad unità gli elementi del campo visivo sulla base
della loro stretta relazione
SICCOME gli elementi del campo visivo non vengono percepiti singolarmente ma
come parte di un tutto, nel quale interagiscono tra loro…
ALLORA per progettare infografiche efficaci queste regole vanno sfruttate.
33.
34. SECONDA TECNICA: LE METAFORE VISIVE
HAMBURGER
Usato per indicare
gli ingredienti del
contenuto
dell’infografica.
ICEBERG
Usato per indicare
un fenomeno la cui
parte
preponderante non
è visibile.
37. LA RICERCA DI IMMAGINI E ICONE
Sito online che
offre icone e foto
utilizzabili
gratuitamente.
Motore di ricerca che filtra
icone per tipo di licenza in
funzione dell’utilizzo che se
ne vuole fare.
Sito online che
contiene 60 milioni
di immagini, video e
tracce audio
utilizzabili previo
acquisto
dell’assicurazione e
della licenza d’uso.
40. 2006 2010 2011 2016
«Giornalismo
e metodo
scientifico:
ovvero il
giornalismo di
precisione»
Primo panel sul
giornalismo di
precisione al
Festival
Internazionale
del Giornalismo
di Perugia
Freedom of
Information
Act =
from need to
right to know
Portale di open
data
della P.A.
inchieste effettuate da gruppi di attivisti e associazioni no-profit che hanno
difeso fermamente il rilascio di dati aperti
=
42. <ahref
• Fondazione di ricerca non-profit, nata
nel 2010 su iniziativa della Provincia
Autonoma di Trento.
• Tra i soci fondatori la Fondazione
Bruno Kessler e Informatica Trentina.
• OBIETTIVI PRIMARI
http://www.ahref.eu/
condivisione valutazione incentivazione
DEGLI STRUMENTI DI INFORMAZIONE
Di fronte a politiche di segretezza…
43. iData
Progetto di ricerca per lo sviluppo
di una piattaforma opensource
dedicata al data journalism.
Data Blog: primo passo pubblico.
44. Nasce nel 2011 da una idea di
Luca Tremolada e Andrea Gianotti
come strumento per analizzare i
fatti attraverso i numeri.
Ricalca soprattutto gli argomenti
economici trattati dalla testata
giornalistica cartacea.
BLOCCA la vera innovazione del
data journalism: l’aggiornamento
dei dataset da parte degli utenti.
http://www.infodata.ilsole24ore.com/
Info Data
45. http://www.wired.it/
• Versione italiana della rivista mensile
statunitense con sede a San
Francisco in California dal
marzo 1993, e di proprietà di Condé
Nast Publications.
• Nata a marzo del 2009 tratta
tematiche di carattere tecnologico e
di come queste influenzino la
cultura, l'economia, la politica e la
vita quotidiana.
Wired.it
46. • Resoconto dettagliato
della qualità delle cure in
tutti i 1.200 ospedali
italiani, pubblici e privati.
• Dati raccolti dall’Agenzia
nazionale per i servizi
sanitari regionali (Agenas) e
ricavati dalle schede di
dimissione ospedaliera.
• Solo nel 2012 resi accessibili
ai medici e ai giornalisti
accreditati.
• 2013: Wired li pubblica
integralmente in un formato
ricercabile.
indice di
rischio
% dei pazienti
deceduti
Tot. dei ricoveri
effettuati
=
Per ogni indicatore patologico
47. Dataninja.it
• Network di data
journalism attivo in Italia e
in Europa.
• Fondato nel 2012
da Alessio Cimarelli (data
scientist-journalist)
e Andrea Nelson Mauro
(data journalist).
• Nato come laboratorio di
sperimentazione nel
giornalismo.
• Cresciuto collaborando con
i più grandi gruppi
editoriali del continente E
partecipando ai principali
eventi di networking del
giornalismo globale.
• Oggi un hub di una rete di
competenze
http://www.dataninja.it/
50. 2012
Nasce l’idea di un’inchiesta sulla storia
dei naufragi dei migranti nel
Mediterraneo.
Punto di partenza = dati raccolti da
Gabriele del Grande sul suo
blog/osservatorio Fortress Europe.
Dal 1988 al 2013 sono morte lungo le
frontiere dell'Europa
almeno 27.382 persone, di cui 4.273
soltanto nel 2015 e 3.507 nel 2014.
http://fortresseurope.blogspot.it/p/la-strage.html
51. 1. Scraping della tabella originale con DataMiner.
2. Pulizia dei dati con OpenRefine.
3. Geolocalizzazione dei naufragi con API di Google Maps e CoordFinder.
più di 1600 eventi luttuosi avvenuti negli ultimi 25 anni.
54. • Inchiesta europea “The Migrants
Files”, finanziata con 7 mila euro e che
vede coinvolti 12 giornalisti di 5 testate
da 6 paesi diversi.
• Progetto ambizioso: riunire e conciliare
i maggiori database esistenti sulle
vittime delle migrazioni in Europa.
2013
1° RISULTATO = dal 2000 al 2013 sono
morti e dispersi più di 23 mila migranti,
circa il 50% in più rispetto a quanto
stimato dai due database originari presi
separatamente.
55. Confronto fra eventi luttuosi per ogni rotta di immigrazione e numero
di avvistamenti riportato da Frontex nell’ambito del suo mandato di
controllo dei confini europei.
2° RISULTATO = Stima della mortalità delle rotte storiche
dell’immigrazione.
57. • 2014: vince il Data Journalism
Awards.
• 2015: a Copenhagen vince
l’European Press Prize.
• 2016: interruzione del progetto
per adempimento degli scopi ed
esaurimento dei finanziamenti.
58.
59. 1. È una realtà già affermata in paesi come Stati Uniti e Regno Unito.
2. È un terreno fertile in Italia: nei primi nove mesi del 2016 le
richieste di specialisti sono aumentate del 137%, come riportato
dall’Italian labour market digital monitor, per lo più concentrate in
Lombardia (58%) e poi nel Lazio (17%).
3. Prima di essere una professione, quella del data scientist è
una forma mentis e come tale è trasversale, si applica a qualsiasi
ambito lavorativo, pubblico o privato che sia, e la conoscenza dei
tool necessari diventa secondaria, ma non meno importante.
60. BIBLIOGRAFIA
Francesco Tissoni
Social network. Comunicazione e marketing
Editore: Apogeo Education
Collana: PerCorsi di studio
Anno edizione: 2014
Jonathan Gray, Lucy Chambers, Liliana
Bounegru
The Data Journalism Handbook: How
Journalists Can Use Data to Improve the
New
Editore: O'Reilly Media
Anno Edizione: 2012
Martina Cavanna
Un giornalismo di precisione? Storia ed
evoluzione del data journalism
internazionale
Tesi di Laurea Università degli Studi di
Catania
Anno: 2013
SITOGRAFIA
Casi studio
• https://docs.google.com/spreadshe
ets/d/1YNqIzyQfEn4i_be2GGWESnG
2Q80E_fLASffsXdCOftI/edit#gid=108
5726718
• http://daily.wired.it/news/politica/2
013/10/04/lampedusa-naufragio-
migranti-immigrazione-mappa-
564632.html
• http://www.datajournalism.it/mar-
mediterraneo-tomba-di-migranti/
• http://fortresseurope.blogspot.it/p/
la-strage.html