Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Data journalism

1,980 views

Published on

Comunicare e visualizzare dati

Published in: Data & Analytics
  • Be the first to comment

Data journalism

  1. 1. Il presente materiale è pubblicato con licenza Creative Commons ‘’ Attribuzione – Non commerciale – Condividi allo stesso modo – 3.0 ‘’ (https://creativecommons.org/licenses/by-sa/4.0/) La licenza non si estende alle immagini provenienti da altre fonti e agli screenshot, i cui diritti restano in capo ai rispettivi proprietari, che, ove possibile, sono stati indicati. L’autore si scusa per eventuali omissioni, e resta a disposizione per correggerle.
  2. 2. CONTENUTI 1. DATA JOURNALISM - Definizione - Confronto con giornalismo tradizionale - I ruoli del data team - Breve storia - Raccolta dati: strumenti e fonti 2. INFOGRAFICHE - Definizione - Componenti principali - Ambiti di utilizzo - Storia - Tecniche e software - Edward Tufte 3. DATA JOURNALISM IN ITALIA - Dati.gov.it - <ahref - DataBlog - Wired.it e la mappa Dove ti curi - InfoData del Sole24Ore - Dataninja.it - Un caso esemplare: MigrantsFiles
  3. 3. Il data journalism rappresenta l’arte di scovare delle storie da un particolare tipo di fonte, i dati, l’abilità di interpretare il tutto e di raccontarlo sotto forma di inchieste realizzate con gli strumenti della matematica, della statistica e delle scienze sociali e comportamentali, applicate alla pratica del giornalismo. PROGRAMMAZIONE INFORMATICA STATISTICA FIUTO PER LA NOTIZIA DEFINIZIONE
  4. 4. GIORNALISMO TRADIZIONALE MEZZI: giornali, radio, tv. • I media sono le prime e uniche fonti di notizie. • La televisione mostra notizie relativamente in diretta. PRODOTTO FINALE: articoli, video. RUOLO CHIAVE: giornalista. DATA JOURNALISM MEZZI: statistica, informatica, grafica. • Raccogliere, filtrare e visualizzare quello che succede dietro ciò che si vede. I dati diventano significativi quando visti nella giusta prospettiva. PRODOTTO FINALE: database aggiornabili. Infografiche che spiegano in modo chiaro e intuitivo. RUOLO CHIAVE: data team. ERA DIGITALE MEZZI: internet, YouTube, social media, blog, smartphone. • Le notizie si trasmettono in tempo reale e da fonti molteplici in tutto il mondo. • Il fenomeno del CITIZEN JOURNALIST mette in discussione i media come unica fonte. PRODOTTO FINALE: articoli, video, post. RUOLO CHIAVE: pubblico.
  5. 5. DATA TEAM Dirige il processo. Individua la storia e pone le domande. Raccoglie, pulisce e analizza i dati. Fact checking. DESIGNER Specialista nella visualizzazione dei dati. Rende la storia interessante, accessibile, accattivante. Crea anche grafiche web interattive. SVILUPPATOREGIORNALISTA Individua il modo migliore per presentare i dati. Crea programmi con cui l’utente interagisce direttamente. Supporta tutto il processo di raccolta e analisi dei dati.
  6. 6. THE COLOR OF MONEY (1989) L’inchiesta di Bill Dedman sulla discriminazione razziale da parte di banche e istituti di credito di Atlanta, cattura l'attenzione del pubblico con l'ampio uso di tavole, disegni e carte geografiche.
  7. 7. WHAT WENT WRONG (1992) L’inchiesta di Stephen Doig sui danni causati dall'uragano Andrew che ha colpito Miami. Confrontando dati sull’agibilità delle case, l’anno di costruzione e la forza dei venti, dimostra che a distruggere i tetti della città era stata, soprattutto, la corruzione nell'edilizia.
  8. 8. WORKFLOW Mirko Lorenz definisce il processo del data journalism come un workflow, un flusso di lavoro in cui i dati rappresentano la base per la ricerca, la visualizzazione e la narrazione della storia. Attraverso queste fasi, la storia non rappresenta più il prodotto del giornalismo, ma il processo stesso. In questo processo di rifinitura i dati vengono raccolti, filtrati e visualizzati trasformandosi nella storia finale. Man mano che il processo va avanti aumenta il suo valore agli occhi del pubblico.
  9. 9. REALIZZARE UN ARTICOLO Nel 2011 il giornalista Paul Bradshaw realizza un modello che illustra il processo di realizzazione di un articolo attraverso un diagramma a piramide rovesciata. Le fasi del processo sono: raccogliere, pulire, contestualizzare e incrociare. RACCOGLIERE PULIRE CONTESTUALIZZARE INCROCIARE
  10. 10. # 1 RACCOGLIERE ISTAT, Eurostat, The World Bank, UN, WHO. data.gov, data.gov.uk, dati.senato.it. The Data Hub della Open Knowledge Foundation. Storyful. OPEN DATA WAREHOUSE RICHIESTA SCRAPING La fonte non rilascia i dati, ma questi possono essere ottenuti attraverso una richiesta scritta: il diritto di accesso all’informazione è un concetto fondamentale nel data journalism. Raccogliere qualunque informazione sia stata digitalizzata, in qualunque formato. Mercury Web Parser. DownThemAll. Scraper Extension. Tesseract. Scraperwiki.
  11. 11. RACCOGLIERE THE DATA HUB Permette di trovare, condividere e riutilizzare risorse disponibili di dati. Fondata dalla Open Knowledge Foundation, un network non-profit internazionale che si batte per il libero accesso ai dati. STORYFUL Permette di cercare dati contemporaneamente in tutti i social network, monitorare gli argomenti di interesse, individuare le fonti e i trend ed estrarre i contenuti più interessanti. OPEN DATA WAREHOUSE
  12. 12. RACCOGLIERE LIMITI Codice HTML con poche informazioni strutturali. Sistemi che richiedono l’autenticazione per l’accesso. Sistemi che usano cookies per memorizzare le azioni dell’utente. Blocchi all’accesso da parte dei server amministratori. Barriere legali del diritto d’autore sui database. MERCURY WEB PARSER FIREFOX DOWN THEM ALL CHROME SCRAPER EXTENSION GOOGLE TESSERACT SCRAPERWIKI STRUMENTI SCRAPING
  13. 13. RACCOGLIERE SCRAPERWIKI - QUICKCODE Piattaforma per la costruzione collaborativa di programmi per estrarre e analizzare i dati pubblici. Questi possono essere creati utilizzando una varietà di linguaggi di programmazione, tra cui Python e JavaScript. MERCURY WEB PARSER Con una richiesta API permette di estrarre il contenuto rilevante di qualsiasi pagina web-titolo, autore, testo e immagini. SCRAPING
  14. 14. #2 PULIRE I dati possono essere incompleti, duplicati e contenere errori. È quindi necessario pulirli per renderli affidabili. STRUMENTI UTILI
  15. 15. #3 CONTESTUALIZZARE Come ogni fonte, i dati non sono sempre affidabili. Bisogna pertanto chiedersi sempre chi li ha raccolti, quando, a quale scopo e con quale metodologia. La storia assume un maggiore impatto giornalistico e una maggiore rilevanza civica solo se contestualizzato. #4 INCROCIARE Spesso è necessario incrociare diversi dataset per ottenere una storia soddisfacente. La combinazione più classica è il mash up con mappe che consentono di visualizzare nello spazio i contenuti, personalizzabili dall’utente.
  16. 16. • Prodotto digitale o analogico su carta o su web. • Racconta una storia visualizzando immagini. INFORMAZIONI GRAFICA
  17. 17. DINAMICA video e animazioni INTERATTIVA l’utente può scegliere CI SONO TRE TIPI DI INFOGRAFICHE #1 GRAFICA layout, immagini e set di icone #2 DATI Informazioni che riguardano un fenomeno #3 STORIA messaggio veicolato STATICA immagini Sono formate da 3 elementi DINAMICA video e animazioni INTERATTIVA L’utente può scegliere
  18. 18. COOL Sono di moda Attention economy Viralità INFOGRAFICHE NELLA COMUNICAZIONE 2.0 Nuggets of Information Veloci e facili Squirrell behaviour
  19. 19. LE INFOGRAFICHE VENGONO UTILIZZATE AMBITO GIORNALISTICO Fin dal 1982 USA TODAY le utilizza nei suoi snapshots. AMBITO SCOLASTICO Come supporto alla didattica tradizionale o come strumento per gli studenti. AMBITO MARKETING Per illustrare strategie di comunicazione e campagne pubblicitarie: statistiche, grafici e business model.
  20. 20. INFOGRAPHIC TIMELINE 40.000 a.C. 7.000-4.000 a.C. 1790 William Playfair 1857 Florence Nightingale 1861 Charles Joseph Minard 1972-73 Pioneer 1 e 2 1982 Edward Tufte
  21. 21. EDWARD TUFTE (Kansas City, 14 marzo 1942) • Statistico e scultore statunitense • Membro della American Statistical Association • Pioniere dell’Information Design • The Visual Display of Quantitative Information, 1983. «Leonardo da Vinci dei dati» NEW YORK TIMES «Galileo della grafica» BUSINESSWEEK
  22. 22. Total ink used to print the graphic DATA INK RATIO “Above all else show the data. A large share of ink on a graphic should present data-information, the ink changing as the data change. Data-ink is the non- erasable core of a graphic, the non-redundant ink arranged in response to variation in the numbers represented.” Tufte, 1983 Data-ink DATA-INK RATIO Proportion of a graphic’s ink devoted to the non-refundant display of data-information 1.0 – proportion of a graphic that can be erased = = =
  23. 23. COME PER OGNI FORMA DI COMUNICAZIONE CHE MIRA ALL’EFFICACIA, ANCHE PER LA CREAZIONE DI UN’INFOGRAFICA È NECESSARIO UN LAVORO PREPARATORIO: #1 Obiettivi da raggiungere #2 Individuazione dei destinatari e delle loro necessità #3 Medium su cui verrà pubblicato il lavoro
  24. 24. PRIMA TECNICA: GESTALT Psicologia secondo cui = 1. Il tutto è più della somma delle singole parti che lo compongono 2. il cervello umano riconduce ad unità gli elementi del campo visivo sulla base della loro stretta relazione SICCOME gli elementi del campo visivo non vengono percepiti singolarmente ma come parte di un tutto, nel quale interagiscono tra loro… ALLORA per progettare infografiche efficaci queste regole vanno sfruttate.
  25. 25. SECONDA TECNICA: LE METAFORE VISIVE HAMBURGER Usato per indicare gli ingredienti del contenuto dell’infografica. ICEBERG Usato per indicare un fenomeno la cui parte preponderante non è visibile.
  26. 26. ICONE Universalmente comprensibili, rappresentano ciò a cui somigliano. Sono immediate e condivisibili. TERZA TECNICA: LE ICONE
  27. 27. LA RICERCA DI IMMAGINI E ICONE Sito online che offre icone e foto utilizzabili gratuitamente. Motore di ricerca che filtra icone per tipo di licenza in funzione dell’utilizzo che se ne vuole fare. Sito online che contiene 60 milioni di immagini, video e tracce audio utilizzabili previo acquisto dell’assicurazione e della licenza d’uso.
  28. 28. SOFTWARE PER CREARE INFOGRAFICHE
  29. 29. 2006 2010 2011 2016 «Giornalismo e metodo scientifico: ovvero il giornalismo di precisione» Primo panel sul giornalismo di precisione al Festival Internazionale del Giornalismo di Perugia Freedom of Information Act = from need to right to know Portale di open data della P.A. inchieste effettuate da gruppi di attivisti e associazioni no-profit che hanno difeso fermamente il rilascio di dati aperti =
  30. 30. http://www.dati.gov.it/
  31. 31. <ahref • Fondazione di ricerca non-profit, nata nel 2010 su iniziativa della Provincia Autonoma di Trento. • Tra i soci fondatori la Fondazione Bruno Kessler e Informatica Trentina. • OBIETTIVI PRIMARI http://www.ahref.eu/ condivisione valutazione incentivazione DEGLI STRUMENTI DI INFORMAZIONE Di fronte a politiche di segretezza…
  32. 32. iData Progetto di ricerca per lo sviluppo di una piattaforma opensource dedicata al data journalism. Data Blog: primo passo pubblico.
  33. 33. Nasce nel 2011 da una idea di Luca Tremolada e Andrea Gianotti come strumento per analizzare i fatti attraverso i numeri. Ricalca soprattutto gli argomenti economici trattati dalla testata giornalistica cartacea.  BLOCCA la vera innovazione del data journalism: l’aggiornamento dei dataset da parte degli utenti. http://www.infodata.ilsole24ore.com/ Info Data
  34. 34. http://www.wired.it/ • Versione italiana della rivista mensile statunitense con sede a San Francisco in California dal marzo 1993, e di proprietà di Condé Nast Publications. • Nata a marzo del 2009 tratta tematiche di carattere tecnologico e di come queste influenzino la cultura, l'economia, la politica e la vita quotidiana. Wired.it
  35. 35. • Resoconto dettagliato della qualità delle cure in tutti i 1.200 ospedali italiani, pubblici e privati. • Dati raccolti dall’Agenzia nazionale per i servizi sanitari regionali (Agenas) e ricavati dalle schede di dimissione ospedaliera. • Solo nel 2012 resi accessibili ai medici e ai giornalisti accreditati. • 2013: Wired li pubblica integralmente in un formato ricercabile. indice di rischio % dei pazienti deceduti Tot. dei ricoveri effettuati = Per ogni indicatore patologico
  36. 36. Dataninja.it • Network di data journalism attivo in Italia e in Europa. • Fondato nel 2012 da Alessio Cimarelli (data scientist-journalist) e Andrea Nelson Mauro (data journalist). • Nato come laboratorio di sperimentazione nel giornalismo. • Cresciuto collaborando con i più grandi gruppi editoriali del continente E partecipando ai principali eventi di networking del giornalismo globale. • Oggi un hub di una rete di competenze http://www.dataninja.it/
  37. 37. http://stories.dataninja.it/themigrantsfiles/ DA UNA RACCOLTA ITALIANA AD UN PROGETTO DI RESPIRO EUROPEO
  38. 38. 2012 Nasce l’idea di un’inchiesta sulla storia dei naufragi dei migranti nel Mediterraneo. Punto di partenza = dati raccolti da Gabriele del Grande sul suo blog/osservatorio Fortress Europe. Dal 1988 al 2013 sono morte lungo le frontiere dell'Europa almeno 27.382 persone, di cui 4.273 soltanto nel 2015 e 3.507 nel 2014. http://fortresseurope.blogspot.it/p/la-strage.html
  39. 39. 1. Scraping della tabella originale con DataMiner. 2. Pulizia dei dati con OpenRefine. 3. Geolocalizzazione dei naufragi con API di Google Maps e CoordFinder.  più di 1600 eventi luttuosi avvenuti negli ultimi 25 anni.
  40. 40. http://www.datajournalism.it/mar- mediterraneo-tomba-di-migranti/ Il sito datajournalism.it pubblica la mappa “Mar Mediterraneo, tomba di migranti”. Una vera e propria applicazione web interattiva che permette di esplorare il dataset geolocalizzato fino a quel momento (circa 250 eventi dal 2009). Aprile 2013
  41. 41. http://daily.wired.it/news/politica/2013/10/04/lampe dusa-naufragio-migranti-immigrazione-mappa- 564632.html Ottobre 2013 Pubblicazione su Wired dopo l’incidente presso l’isola dei Conigli, con l’articolo “Lampedusa, la mappa dei naufragi”.
  42. 42. • Inchiesta europea “The Migrants Files”, finanziata con 7 mila euro e che vede coinvolti 12 giornalisti di 5 testate da 6 paesi diversi. • Progetto ambizioso: riunire e conciliare i maggiori database esistenti sulle vittime delle migrazioni in Europa. 2013 1° RISULTATO = dal 2000 al 2013 sono morti e dispersi più di 23 mila migranti, circa il 50% in più rispetto a quanto stimato dai due database originari presi separatamente.
  43. 43. Confronto fra eventi luttuosi per ogni rotta di immigrazione e numero di avvistamenti riportato da Frontex nell’ambito del suo mandato di controllo dei confini europei. 2° RISULTATO = Stima della mortalità delle rotte storiche dell’immigrazione.
  44. 44. https://docs.google.com/spreadsheets/d/1YNqIzyQfEn 4i_be2GGWESnG2Q80E_fLASffsXdCOftI/edit#gid=1085 726718 Marzo 2014 Database finale dell’inchiesta dal 2000 al 2013 sulla base di due dataset, osservatorio Fortress Europe di Gabriele del Grande + NGO United for Intercultural Action.
  45. 45. • 2014: vince il Data Journalism Awards. • 2015: a Copenhagen vince l’European Press Prize. • 2016: interruzione del progetto per adempimento degli scopi ed esaurimento dei finanziamenti.
  46. 46. 1. È una realtà già affermata in paesi come Stati Uniti e Regno Unito. 2. È un terreno fertile in Italia: nei primi nove mesi del 2016 le richieste di specialisti sono aumentate del 137%, come riportato dall’Italian labour market digital monitor, per lo più concentrate in Lombardia (58%) e poi nel Lazio (17%). 3. Prima di essere una professione, quella del data scientist è una forma mentis e come tale è trasversale, si applica a qualsiasi ambito lavorativo, pubblico o privato che sia, e la conoscenza dei tool necessari diventa secondaria, ma non meno importante.
  47. 47. BIBLIOGRAFIA Francesco Tissoni Social network. Comunicazione e marketing Editore: Apogeo Education Collana: PerCorsi di studio Anno edizione: 2014 Jonathan Gray, Lucy Chambers, Liliana Bounegru The Data Journalism Handbook: How Journalists Can Use Data to Improve the New Editore: O'Reilly Media Anno Edizione: 2012 Martina Cavanna Un giornalismo di precisione? Storia ed evoluzione del data journalism internazionale Tesi di Laurea Università degli Studi di Catania Anno: 2013 SITOGRAFIA Casi studio • https://docs.google.com/spreadshe ets/d/1YNqIzyQfEn4i_be2GGWESnG 2Q80E_fLASffsXdCOftI/edit#gid=108 5726718 • http://daily.wired.it/news/politica/2 013/10/04/lampedusa-naufragio- migranti-immigrazione-mappa- 564632.html • http://www.datajournalism.it/mar- mediterraneo-tomba-di-migranti/ • http://fortresseurope.blogspot.it/p/ la-strage.html
  48. 48. SITOGRAFIA • http://stories.dataninja.it/themigrantsfiles/ • http://www.dataninja.it/ • http://www.infodata.ilsole24ore.com/ • http://daily.wired.it/mappa_migliori_osped ali • http://www.ahref.eu/ • http://www.dati.gov.it/ Data journalism • https://mercury.postlight.com/web-parser/ • https://chrome.google.com/webstore/deta il/scraper/mbigbapnjcgaffohmbkdlecaccepn gjd?hl=en • https://addons.mozilla.org/en- US/firefox/addon/downthemall/ • https://quickcode.io/ • https://storyful.com/ • https://imdigitaljournalism.wordpres s.com/journalism-then-and-now/ • https://www.theguardian.com/news /datablog/2011/jul/28/data- journalism • http://datajournalism.stanford.edu/ • http://gijn.org/resources/data- journalism/ • http://www.wired.it/economia/lavor o/2016/12/01/esplode-la-domanda- data-scientist-italia/

×