Giornalismo basato sui dati
14-15/06/2017
Marco Montanari
@ingmmo, marco.montanari@gmail.com, http://www.ingmmo.com/
Sviluppatore, Appassionato di giochi, Nerd…
(o geek, visto che è la parola dell’anno)
◦ passione per i dati
◦ sviluppatore GIS
“I am a coder with journalist friends.”
Cosa è una notizia?
Struttura della notizia
5W
◦ Who is it about?
◦ What happened?
◦ When did it take place?
◦ Where did it take place?
◦ Why did it happen?
Struttura del fatto
5W
◦ Who is it about?
◦ What happened?
◦ When did it take place?
◦ Where did it take place?
◦ Why did it happen?
Dimensioni dei fatti
Ogni «W» è una dimensione
Ogni dimensione mette in correlazione un
aspetto
Più aspetti implicano più sfaccettature della
storia
Fatto
Chi
Cosa
QuandoPerché
Dove
Dimensioni dell’informazione
Ogni dimensione è un aspetto dell’elemento
che stiamo descrivendo
Le regole e i trend compaiono nel momento in
cui vediamo regolarità e irregolarità
Visita
museale
Tipo di utente
Quale
museo?
Percorso
Quando?Motivazione
Soddisfazione
Opera
preferita
Dall’osservazione al dato
Tipo di
utente
Quale
museo?
Percorso Quando? Motivazione Soddisfazion
e
Opera
preferita
20-25 Uffizi Standard 8/6/2017 Visita con
amici
Media Nascita della
venere
45-50 Mambo Personale 13/5/2017 Visita Alta --
Visita
muse
ale
Tipo di utente
Quale
museo?
Percorso
Quando?Motivazione
Soddisfazione
Opera
preferita
Dimensioni e Misure
«Dimensioni» rappresentano categorie per
classificare il fatto
«Misure» rappresentanto quantità numerabili
attorno al fatto
Vengono dal mondo della Business Intelligence
Cubi di dati
Datacube (Big Data?)
◦ Aggregazioni complesse
◦ Strumenti più specializzati (Excel le supporta)
Il dato come analisi di
un trend
Analisi import/export
Colera a Londra
https://www.theguardian.com/news/datablog/2013/mar/15/john-snow-cholera-map#data
Dati fantastici…
… E DOVE TROVARLI (EVITANDO AVVOCATI)
Forme dei dati
I dati possono trovarsi sul web in tanti formati
◦ Tabellari
◦ xls xlsx csv tsv ods dbf
◦ Strutturati
◦ xml json (shp)
◦ Linked data
◦ RDF
◦ Altro…
◦ HTML
75%
20%
5
50%
Forme dei dati
I dati possono trovarsi sul web in tanti formati
◦ Tabellari
◦ xls xlsx csv tsv ods dbf
◦ Strutturati
◦ xml json (shp)
◦ Linked data
◦ RDF
◦ Altro…
◦ HTML
75%
20%
5
50%
Fonti di dati
Open Data Internazionali
◦ http://www.europeana.eu/portal/en
◦ https://www.europeandataportal.eu/
Open Data nazionali
◦ http://dati.istruzione.it/
◦ www.sviluppoeconomico.gov.it/index.php/it/open-data
◦ http://www.beniculturali.it/mibac/export/MiBAC/sito-
MiBAC/Contenuti/MibacUnif/Comunicati/visualizza_asset.
html_892096923.html
Open Data Regionali
◦ http://dati.emilia-romagna.it/
◦ https://dati.lombardia.it/
Archivi indipendenti
◦ http://data.world
◦ http://opendatahub.org
Note generali:
https://www.provenance.org/news/intelligence/the-
profound-importance-of-open-data/
Licenze
Gli open data hanno licenze tipicamente che abilitano il riuso
◦ E’ ambiguo il discorso sul diritto di cronaca riguardo al dato «rubato»
Licenze aperte
◦ CC-BY (Creative Commons, richiede la citazione della fonte)
◦ CC-BY-SA (come sopra, ma il risultato deve essere condiviso con le
stesse condizioni del caso precedente [rielaborabile])
◦ CC-0 o PD (Dominio pubblico)
◦ IODl (Licenza Open Data italiana, simile a CC-BY-SA)
Licenze non aperte
◦ CC-BY-NC (Si può utilizzare il dato, citandolo, ma senza ottenere
guadagni economici dall’uso)
◦ CC-BY-ND (si può utilizzare il dato, citandolo, ma… non si possono
fare lavori derivati… ????)
Fonti di dati
Open Data Internazionali
◦ http://www.europeana.eu/portal/en
◦ https://www.europeandataportal.eu/
Open Data nazionali
◦ http://dati.istruzione.it/
◦ www.sviluppoeconomico.gov.it/index.php/it/open-data
◦ http://www.beniculturali.it/mibac/export/MiBAC/sito-
MiBAC/Contenuti/MibacUnif/Comunicati/visualizza_asset.
html_892096923.html
Open Data Regionali
◦ http://dati.emilia-romagna.it/
◦ https://dati.lombardia.it/
Archivi indipendenti
◦ http://data.world
◦ http://opendatahub.org
Note generali:
https://www.provenance.org/news/intelligence/the-
profound-importance-of-open-data/
What now?
ORA ABBIAMO I DATI… CHE FARNE?
Microsoft Excel è nostro amico
Tabella Pivot
◦ Aggregazioni semplici
◦ Analisi di trend e fenomeni generali
◦ Consente di scovare l’anomalia
Persino LibreOffice è nostro amico!!!
Meno intuitivo del sistema di pivot di
Excel
◦ Non consente di «sperimentare» con i dati,
ma costringe a definire a priori le relazioni
da analizzare
Elaborazione del dato
Alcuni strumenti on-line
http://rawgraphs.io/
https://plot.ly/
https://infogr.am/
https://public.tableau.com/
http://timeline.knightlab.com/
http://www.chartblocks.com/
https://storymap.knightlab.com/
https://storymap.knightlab.com/gigapixel/
http://cartodb.com
http://geojson.io
http://geocommons.com/
Domande? 
GRAZIE!
Per qualsiasi domanda:
@ingmmo
marco.montanari@gmail.com
sirmmo.blogspot.com, …
sirmmo
http://it.linkedin.com/in/montanarim/
https://www.facebook.com/marco.montanari
marco.montanari

Intro datajournalism - 14-15/06/2017

  • 1.
    Giornalismo basato suidati 14-15/06/2017
  • 2.
    Marco Montanari @ingmmo, marco.montanari@gmail.com,http://www.ingmmo.com/ Sviluppatore, Appassionato di giochi, Nerd… (o geek, visto che è la parola dell’anno) ◦ passione per i dati ◦ sviluppatore GIS “I am a coder with journalist friends.”
  • 3.
    Cosa è unanotizia?
  • 4.
    Struttura della notizia 5W ◦Who is it about? ◦ What happened? ◦ When did it take place? ◦ Where did it take place? ◦ Why did it happen?
  • 5.
    Struttura del fatto 5W ◦Who is it about? ◦ What happened? ◦ When did it take place? ◦ Where did it take place? ◦ Why did it happen?
  • 6.
    Dimensioni dei fatti Ogni«W» è una dimensione Ogni dimensione mette in correlazione un aspetto Più aspetti implicano più sfaccettature della storia Fatto Chi Cosa QuandoPerché Dove
  • 7.
    Dimensioni dell’informazione Ogni dimensioneè un aspetto dell’elemento che stiamo descrivendo Le regole e i trend compaiono nel momento in cui vediamo regolarità e irregolarità Visita museale Tipo di utente Quale museo? Percorso Quando?Motivazione Soddisfazione Opera preferita
  • 8.
    Dall’osservazione al dato Tipodi utente Quale museo? Percorso Quando? Motivazione Soddisfazion e Opera preferita 20-25 Uffizi Standard 8/6/2017 Visita con amici Media Nascita della venere 45-50 Mambo Personale 13/5/2017 Visita Alta -- Visita muse ale Tipo di utente Quale museo? Percorso Quando?Motivazione Soddisfazione Opera preferita
  • 9.
    Dimensioni e Misure «Dimensioni»rappresentano categorie per classificare il fatto «Misure» rappresentanto quantità numerabili attorno al fatto Vengono dal mondo della Business Intelligence
  • 10.
    Cubi di dati Datacube(Big Data?) ◦ Aggregazioni complesse ◦ Strumenti più specializzati (Excel le supporta)
  • 11.
    Il dato comeanalisi di un trend
  • 12.
  • 13.
  • 14.
    Dati fantastici… … EDOVE TROVARLI (EVITANDO AVVOCATI)
  • 15.
    Forme dei dati Idati possono trovarsi sul web in tanti formati ◦ Tabellari ◦ xls xlsx csv tsv ods dbf ◦ Strutturati ◦ xml json (shp) ◦ Linked data ◦ RDF ◦ Altro… ◦ HTML 75% 20% 5 50%
  • 16.
    Forme dei dati Idati possono trovarsi sul web in tanti formati ◦ Tabellari ◦ xls xlsx csv tsv ods dbf ◦ Strutturati ◦ xml json (shp) ◦ Linked data ◦ RDF ◦ Altro… ◦ HTML 75% 20% 5 50%
  • 17.
    Fonti di dati OpenData Internazionali ◦ http://www.europeana.eu/portal/en ◦ https://www.europeandataportal.eu/ Open Data nazionali ◦ http://dati.istruzione.it/ ◦ www.sviluppoeconomico.gov.it/index.php/it/open-data ◦ http://www.beniculturali.it/mibac/export/MiBAC/sito- MiBAC/Contenuti/MibacUnif/Comunicati/visualizza_asset. html_892096923.html Open Data Regionali ◦ http://dati.emilia-romagna.it/ ◦ https://dati.lombardia.it/ Archivi indipendenti ◦ http://data.world ◦ http://opendatahub.org Note generali: https://www.provenance.org/news/intelligence/the- profound-importance-of-open-data/
  • 18.
    Licenze Gli open datahanno licenze tipicamente che abilitano il riuso ◦ E’ ambiguo il discorso sul diritto di cronaca riguardo al dato «rubato» Licenze aperte ◦ CC-BY (Creative Commons, richiede la citazione della fonte) ◦ CC-BY-SA (come sopra, ma il risultato deve essere condiviso con le stesse condizioni del caso precedente [rielaborabile]) ◦ CC-0 o PD (Dominio pubblico) ◦ IODl (Licenza Open Data italiana, simile a CC-BY-SA) Licenze non aperte ◦ CC-BY-NC (Si può utilizzare il dato, citandolo, ma senza ottenere guadagni economici dall’uso) ◦ CC-BY-ND (si può utilizzare il dato, citandolo, ma… non si possono fare lavori derivati… ????)
  • 19.
    Fonti di dati OpenData Internazionali ◦ http://www.europeana.eu/portal/en ◦ https://www.europeandataportal.eu/ Open Data nazionali ◦ http://dati.istruzione.it/ ◦ www.sviluppoeconomico.gov.it/index.php/it/open-data ◦ http://www.beniculturali.it/mibac/export/MiBAC/sito- MiBAC/Contenuti/MibacUnif/Comunicati/visualizza_asset. html_892096923.html Open Data Regionali ◦ http://dati.emilia-romagna.it/ ◦ https://dati.lombardia.it/ Archivi indipendenti ◦ http://data.world ◦ http://opendatahub.org Note generali: https://www.provenance.org/news/intelligence/the- profound-importance-of-open-data/
  • 20.
    What now? ORA ABBIAMOI DATI… CHE FARNE?
  • 21.
    Microsoft Excel ènostro amico Tabella Pivot ◦ Aggregazioni semplici ◦ Analisi di trend e fenomeni generali ◦ Consente di scovare l’anomalia
  • 22.
    Persino LibreOffice ènostro amico!!! Meno intuitivo del sistema di pivot di Excel ◦ Non consente di «sperimentare» con i dati, ma costringe a definire a priori le relazioni da analizzare
  • 23.
  • 24.
  • 25.
    Domande?  GRAZIE! Per qualsiasidomanda: @ingmmo marco.montanari@gmail.com sirmmo.blogspot.com, … sirmmo http://it.linkedin.com/in/montanarim/ https://www.facebook.com/marco.montanari marco.montanari