Seminario su Open Data:Il Data Journalism, un approcciotecnologico per lanalisi dei dati         nel giornalismo          ...
Di che parliamo"Il giornalismo Data-driven è un processo basato sullanalisied il filtraggio di grosse grandi banche dati c...
Di che parliamoPer alcuni un approcciovecchio...In fondo si tratta sempre        di verifica dei fatti.            ●  Comp...
Di che parliamoWhy Bob Woodward is wrong about the internet and journalism "But Woodward (not surprisingly, perhaps) still...
Di che parliamoAnalysing data is thefuture for journalists, saysTim Berners-Lee                   Inventor of the world   ...
Quali dati?     ●   Statistiche governative    ●   Database aziendali    ●   Report di agenzie ed istituzioni    ●   Ecc. ...
Il giornalismo è un algoritmo●   Dati da fonti diverse: ultime    notizie, stastistiche, indagini    giornalistiche●   Dob...
Nascono i Journo-Hackers● Redazioni miste: competenze giornalistiche ed    informatiche●   Input: Risoluzione dei problemi...
Nascono i Journo-Hackers                                           ProgettiBrian Boyer                                  ● ...
Un po di esempi: Everyblock.com
Un po di esempi: il NY Times                                Fonte: NY Times
Un po di esempi: (il retrobottega del) NY Times                                            Fonte: NY Times
Un po di esempi: il Chicago Tribune                                       Fonte: Chicago Tribune
Un po di esempi: (il retrobottega del) Chicago Tribune                                       Fonte: Chicago Tribune
Altri esempi: The Guardian                             Fonte: The Guardian
Altri esempi: (il retrobottega del) The Guardian                                         Fonte: The Guardian
Altri esempi: (il retrobottega del) The Guardian                                         Google fusion                    ...
Altri esempi: Pro Publica                            Fonte: Pro Publica
Altri esempi: (il retrobottega di) Pro Publica                                             Fonte: Pro Publica
In sintesi    ●   I fatti sono sacri. I fatti, oggi, sono i dati    ●   Giornalisti e comunità di lettori: fact checking, ...
Messaggio promozionale 1/2: Hacks/Hackers a PG                        Fonte: Festival del Giornalismo di Perugia
Messaggio promozionale 2/2: DDJ Handbook a PG                       Fonte: Festival del Giornalismo di Perugia
Ah già...                                                   E in Italia?
Qualche esempio: Mafiopoli                             Fonte: Corriere della Sera
Qualche esempio: I migliori ospedali in Italia                                                 Fonte: Focus
Qualche esempio: Il Giro della Nera                                      Fonte: Daniele Belleri
Qualche esempio: Patrie Galere                                 Fonte: Patrie Galere
Un po di risorse ●   Open Data – Data Journalism di Andrea Fama (ed. LSDI) ●   Corso di "Open Data Journalism" ●   Mailing...
E molti limiti ●   Editori pronti ad investire? Dubbi sul ROI ●   Aziende che non investono in questo settore:     A Torin...
E molti limiti    ●   La PA si sta muovendo solo ora. Pochi dati, poco raw,        poche stelle. E qualche sorpresa...    ...
Grazie                                     marco.trotta@gmail.com           @mrta75
Upcoming SlideShare
Loading in …5
×

Il Data Journalism, un approccio tecnologico per l'analisi dei dati nel giornalismo

1,972 views

Published on

Seminario su Open Data: Il Data Journalism, un approccio tecnologico per l'analisi dei dati nel giornalismo

24 Aprile 2012
Corso di Laboratorio Interdisciplinare
Corso di Laurea Magistrale in Scienze di Internet dell'Università di Bologna

Published in: Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,972
On SlideShare
0
From Embeds
0
Number of Embeds
67
Actions
Shares
0
Downloads
25
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

Il Data Journalism, un approccio tecnologico per l'analisi dei dati nel giornalismo

  1. 1. Seminario su Open Data:Il Data Journalism, un approcciotecnologico per lanalisi dei dati nel giornalismo 24 Aprile 2012 Corso di Laboratorio Interdisciplinare Corso di Laurea Magistrale in Scienze di Internet dellUniversità di Bologna Marco Trotta marco.trotta@gmail.com
  2. 2. Di che parliamo"Il giornalismo Data-driven è un processo basato sullanalisied il filtraggio di grosse grandi banche dati con lobiettivodi creare storie nuove. Il giornalismo Data-driven sioccupa di open data (dati aperti) che sono liberamentedisponibili in rete e analizzabili con strumenti open source(software libero). Il giornalismo Data-driven cerca dioffrire nuovi livelli di servizio per il pubblico, aiutando iconsumatori, i managers, i politici a capire i contesti e aprendere decisioni basate sulle evidenze. In questo sensoil giornalismo data driven può aiutare i giornalisti aidentificare un nuovo ruolo nella società"  Fonte: Wikipedia
  3. 3. Di che parliamoPer alcuni un approcciovecchio...In fondo si tratta sempre  di verifica dei fatti.   ● Computer Assisted   Report   ● Giornalismo di   precisione "The truth of what goes on is not on the Internet. [The Internet] can supplement. It can help advance. But the truth resides   with people. Human sources." Bob Woodward
  4. 4. Di che parliamoWhy Bob Woodward is wrong about the internet and journalism "But Woodward (not surprisingly, perhaps) still seems to see journalism assomething that lone-cowboy-style reporters do in secret by themselves,rather than a collaborative process that now involves other people —including the “people formerly known as the audience,” as journalismprofessor Jay Rosen likes to call them.That view may be a lot more romantic, and it serves the purposes ofjournalists who see themselves as a special breed, with special powersthat normal mortals don’t possess. It also serves the purposes ofnewspapers and other traditional media entities, which would like to bethe sole source of all value in the media ecosystem. But it doesn’t reallyserve the purposes of journalism or society as a whole".  Fonte: Gigaom
  5. 5. Di che parliamoAnalysing data is thefuture for journalists, saysTim Berners-Lee  Inventor of the world  wide web says reporters  should be hunting for  stories in datasets         Fonte: The Guardian 
  6. 6. Quali dati?  ● Statistiche governative ● Database aziendali ● Report di agenzie ed istituzioni ● Ecc. Digitali, ma anche no.Open Data, ma anche no...per tutto il resto cè il Deep Web
  7. 7. Il giornalismo è un algoritmo● Dati da fonti diverse: ultime notizie, stastistiche, indagini giornalistiche● Dobbiamo incrociarli con altri database?● Sistematizzazione in tabelle e ripulitura: dati duplicati, non omogenei, non consistenti● Recupero delle evidenze: dal confronto nasce una storia? Cè qualcosa che non va? Bisogna fare un ulteriore verifica?● Output: una storia, una infografica, ecc.  Fonte: The Guardian
  8. 8. Nascono i Journo-Hackers● Redazioni miste: competenze giornalistiche ed informatiche● Input: Risoluzione dei problemi di raccolta ed analisi dati con software scritti anche ad hoc● Output: visualizzazioni in infografiche, mappe interattive e vere e proprie web app consultabili in tempo reale Non solo competenze tecnologiche: anche fiuto dagiornalista. "E se incrociassi questi dati con questo dataset?" 
  9. 9. Nascono i Journo-Hackers ProgettiBrian Boyer ● New York Times ● Chicago Tribune ● The Guardian Adrian Holovaty  Aron Pilhofer Fonte: La Scimmia che vinse il Pulitzer (Bruno Mondadori)
  10. 10. Un po di esempi: Everyblock.com
  11. 11. Un po di esempi: il NY Times Fonte: NY Times
  12. 12. Un po di esempi: (il retrobottega del) NY Times Fonte: NY Times
  13. 13. Un po di esempi: il Chicago Tribune Fonte: Chicago Tribune
  14. 14. Un po di esempi: (il retrobottega del) Chicago Tribune Fonte: Chicago Tribune
  15. 15. Altri esempi: The Guardian Fonte: The Guardian
  16. 16. Altri esempi: (il retrobottega del) The Guardian Fonte: The Guardian
  17. 17. Altri esempi: (il retrobottega del) The Guardian Google fusion tables Tableau Public Tableau Public Datamarket Many Eyes Color Brewer Fonte: The Guardian
  18. 18. Altri esempi: Pro Publica Fonte: Pro Publica
  19. 19. Altri esempi: (il retrobottega di) Pro Publica Fonte: Pro Publica
  20. 20. In sintesi ● I fatti sono sacri. I fatti, oggi, sono i dati ● Giornalisti e comunità di lettori: fact checking, approfondimenti, debugging, social network strategy ● Massimo accesso ai dati e ai codici per gestirli (API, repository, ecc.); ● Pluralità di linguaggi e formati: ○ Java, Javascript, Python, Php, Ruby ○ CSV, XML, JSON ma anche XSL, PDF... e cartaceo! ● Apertura alla comunità e uso di licenze libere (quanto meno per il codice); ● Approccio geek. Modalità agile ● Informalità e sperimentazione Esempio: Hackshackers.com  80% Sudore - 10% Scrittura - 10% Risultati
  21. 21. Messaggio promozionale 1/2: Hacks/Hackers a PG Fonte: Festival del Giornalismo di Perugia
  22. 22. Messaggio promozionale 2/2: DDJ Handbook a PG Fonte: Festival del Giornalismo di Perugia
  23. 23. Ah già...      E in Italia?
  24. 24. Qualche esempio: Mafiopoli Fonte: Corriere della Sera
  25. 25. Qualche esempio: I migliori ospedali in Italia Fonte: Focus
  26. 26. Qualche esempio: Il Giro della Nera Fonte: Daniele Belleri
  27. 27. Qualche esempio: Patrie Galere Fonte: Patrie Galere
  28. 28. Un po di risorse ● Open Data – Data Journalism di Andrea Fama (ed. LSDI) ● Corso di "Open Data Journalism" ● Mailing list: Spaghetti Open Data e Data Journalism Italy ● OpenDataBlog de IlSole24Ore ● DataBlog della Fondazione Ahref ● Datagov.it E qualche dato... ● Dati.gov.it ● Dati.istat.it ● Da pochissimo anche dati.comune.bologna.it 
  29. 29. E molti limiti ● Editori pronti ad investire? Dubbi sul ROI ● Aziende che non investono in questo settore: A Torino, un anno dopo: "Cosa avete fatto?" ● Manca la formazione: Giornalista: "Mi faresti un corso di hacking di due ore?" ● Mancano ambiti seminariali informali ed informali (stile Hacks/Hackers) ● Manca di un approccio aperto: dovè il codice? Dove si possono scaricare i dati? Con quali criteri sono stati trattati? Poca apertura verso le comunità ● Manca di una cornice normativa esplicita. Cè il CAD ma il FOIA?
  30. 30. E molti limiti ● La PA si sta muovendo solo ora. Pochi dati, poco raw, poche stelle. E qualche sorpresa...  wget http://www.mit.gov.it/mit/mop_all.php?p_id=12034 --2012-04-24 13:53:58-- http://www.mit.gov.it/mit/mop_all.php?p_id=12034 Resolving www.mit.gov.it... 195.45.98.153 Connecting to www.mit.gov.it|195.45.98.153|:80... connected. HTTP request sent, awaiting response... 500 Internal Server Error 2012-04-24 13:53:58 ERROR 500: Internal Server Error. ● Mai dare i dati per scontato... wget http://dati.comune.bologna.it/download/file/fid/129 [...] Biblioteca;indirizzo;quartiere;N.pc al pubblico Archiginnasio;piazza Galvani, 1 tel. 051/276811;Santo Stefano;13
  31. 31. Grazie      marco.trotta@gmail.com @mrta75

×