SlideShare a Scribd company logo
1 of 51
Download to read offline
ETUDE DE CAS

  VISUALISER DES
DONNÉES OUVERTES

   Sébastien Pierre, FFunction inc.
@Hackons la Corruption., Novembre 2012


           www.ffctn.com


            © FFUNCTION INC, 2011        ffunction
                                         inc.
INFOGRAPHIC : SE7EN SUMMITS




      © FFUNCTION INC, 2011   ffunction
                              inc.
GOOGE DATAVIZ CHALLENGE 2010 (FINALIST)




            © FFUNCTION INC, 2011         ffunction
                                          inc.
NATIONAL GEOGRAPHIC SOCIETY'S PROJECTS




           © FFUNCTION INC, 2011         ffunction
                                         inc.
2008
 Canadian Federal
Travel & Hospitality
     Expenses




     © FFUNCTION INC, 2011   ffunction
                             inc.
SOME THINGS HAVEN'T CHANGED SINCE 2008



➔
    SCRAPING DATA
    in the absence of open-data, journalists will
    often be in the same context, having to spend
    time to collect, explore and assess the quality of
    the data.




                       © FFUNCTION INC, 2011    ffunction
                                                inc.
SOME THINGS HAVEN'T CHANGED SINCE 2008



➔
    FROM DATA TO STORY
    Each dataset is a discovery, getting a
    (compelling) story out of it is still a major
    challenge.




                         © FFUNCTION INC, 2011      ffunction
                                                    inc.
THE DATA




© FFUNCTION INC, 2011   ffunction
                        inc.
As the result of a federal government directive*,
   Travel and Hospitality Expenses have been
   published on the web in Canada since 2004
               * Called “proactive disclosure”




                       © FFUNCTION INC, 2011     ffunction
                                                 inc.
http://www.tbs-sct.gc.ca/pd-dp/gr-rg/index-eng.asp



© FFUNCTION INC, 2011                  ffunction
                                       inc.
Data is (still) not
                        directly accessible,
                        and hosted on each
                        specific ministry
                        website, in a
                        specific format.




© FFUNCTION INC, 2011                 ffunction
                                      inc.
© FFUNCTION INC, 2011   ffunction
                        inc.
ACCURACY PROBLEMS

NON-OPEN DATA                DATA MAY BE MISSING

                             DATA NOT UP TO DATE




                © FFUNCTION INC, 2011              ffunction
                                                   inc.
22Mb SQL file
 scraped by citizens
(available on Github)




  © FFUNCTION INC, 2011   ffunction
                          inc.
A DATASET WHICH TURNS OUT TO BE A BIT OPAQUE...




                       © FFUNCTION INC, 2011      ffunction
                                                  inc.
BUILDING A TOOL TO EXPLORE THE DATA




             © FFUNCTION INC, 2011    ffunction
                                      inc.
Basic analysis of the data




                             © FFUNCTION INC, 2011   ffunction
                                                     inc.
Thinking about how to represent the data




                                   © FFUNCTION INC, 2011   ffunction
                                                           inc.
Thinking about the flow of interaction




                                    © FFUNCTION INC, 2011   ffunction
                                                            inc.
Importing and visualizing the data




                                     © FFUNCTION INC, 2011   ffunction
                                                             inc.
Mapping out the different types of expenses (travel, hospitality & guidelines)




                                       © FFUNCTION INC, 2011                     ffunction
                                                                                 inc.
Simplifying the representation (expenses vs guidelines, over guidelines is in red)




                                      © FFUNCTION INC, 2011                          ffunction
                                                                                     inc.
Changing the focus (under/over guidelines instead of total spending)




                                     © FFUNCTION INC, 2011             ffunction
                                                                       inc.
Adding guides to improve reading the information




                                      © FFUNCTION INC, 2011   ffunction
                                                              inc.
Adding filtering to narrow down to subsets of the data




                                     © FFUNCTION INC, 2011   ffunction
                                                             inc.
Trying alternative representations on the data




                                     © FFUNCTION INC, 2011   ffunction
                                                             inc.
Trying even more alternative representations on the data




                                     © FFUNCTION INC, 2011   ffunction
                                                             inc.
THE RESULT
http://ffctn.com/a/expensevisualizer




             © FFUNCTION INC, 2011     ffunction
                                       inc.
© FFUNCTION INC, 2011   ffunction
                        inc.
© FFUNCTION INC, 2011   ffunction
                        inc.
I just found out the 5 top spending
Federal depts, check it out at
http://ur1.ca/a3spt




      © FFUNCTION INC, 2011           ffunction
                                      inc.
© FFUNCTION INC, 2011   ffunction
                        inc.
© FFUNCTION INC, 2011   ffunction
                        inc.
FINDINGS




         1




© FFUNCTION INC, 2011   ffunction
                        inc.
Cumulative spending




     TRENDS ONLY BECOME APPARENT
WITH THE PROPER MODE OF REPRESENTATION




             Monthly spending
              © FFUNCTION INC, 2011      ffunction
                                         inc.
PROBLEMS IN THE DATA QUALITY
      BECOME VISIBLE




       © FFUNCTION INC, 2011   ffunction
                               inc.
THINGS YOU WOULD EXPECT
ARE NOT NECESSARILY THERE




               Spending of ministers for all departments
                             © FFUNCTION INC, 2011         ffunction
                                                           inc.
DATA TO STORY: CHALLENGES



➔
    NON-OPEN DATA
    –   Missing or incomplete data: is the problem in the
        scraper or in the actual data?
    –   At least you now have a tool to assess (and improve)
        the data quality




                           © FFUNCTION INC, 2011       ffunction
                                                       inc.
DATA TO STORY: CHALLENGES



➔
    NOT WHAT I THOUGHT
    –   You might expect something about the data,
        but the visualization might prove your wrong
    –   You might have been looking for something specific
        but you cannot see it in the visualization

                                                   See my “30 min of data visualization”
                                                       workshop for more on this...



                           © FFUNCTION INC, 2011                             ffunction
                                                                             inc.
DATA TO STORY: CHALLENGES



➔
    DID I TRY HARD ENOUGH?
    –   There's no secret: you'll find something interesting if
        you explore your data enough.
    –   If everything fails, you can at least get fun facts or
        controversial examples out of it.




                            © FFUNCTION INC, 2011         ffunction
                                                          inc.
HOSPITALITY EXPENSES SKYROCKET IN 2008 !!




                © FFUNCTION INC, 2011   ffunction
                                        inc.
INDUSTRY CANADA'S BIG SPENDER



                                       2.5x
                                       As much




MINISTER                    DIRECTOR




           © FFUNCTION INC, 2011         ffunction
                                         inc.
WAR IS COSTING CANADA AN ARM AND A LEG!



 3 MILLIONS!
 (over a period of five years)




                                 © FFUNCTION INC, 2011   ffunction
                                                         inc.
THE BEST STORY IS:


           WE NEED OPEN DATA!

THIS IS NOT AN ACCEPTABLE PROACTIVE DISCLOSURE!




                  © FFUNCTION INC, 2011       ffunction
                                              inc.
TOOLS




         1




© FFUNCTION INC, 2011   ffunction
                        inc.
GOOGLE REFINE                           https://github.com/OpenRefine




                © FFUNCTION INC, 2011                   ffunction
                                                        inc.
DATA WRANGLER                           http://vis.stanford.edu/wrangler/




                © FFUNCTION INC, 2011                       ffunction
                                                            inc.
DATA WRAPPER                           http://datawrapper.de/




               © FFUNCTION INC, 2011            ffunction
                                                inc.
MANY EYES   http://www-958.ibm.com/software/data/cognos/manyeyes/




               © FFUNCTION INC, 2011                ffunction
                                                    inc.
R17                           http://www.rseventeen.com/




      © FFUNCTION INC, 2011                 ffunction
                                            inc.
THANK
           YOU!

sebastien@ffctn.com / @ffunction


    WWW.FFCTN.COM

           © FFUNCTION INC, 2011   ffunction
                                   inc.

More Related Content

Similar to Ffctn hackons la-corruption

Convio APIs, what are they good for?
Convio APIs, what are they good for?Convio APIs, what are they good for?
Convio APIs, what are they good for?Sara Hoffman
 
MOBILE COMMERCE & NFC - Essential Background
MOBILE COMMERCE & NFC - Essential BackgroundMOBILE COMMERCE & NFC - Essential Background
MOBILE COMMERCE & NFC - Essential Backgroundsnarend
 
Shoretel brilliantly simple_overview
Shoretel brilliantly simple_overviewShoretel brilliantly simple_overview
Shoretel brilliantly simple_overviewChuck Brown
 
Marketers' Benchmarks 2011
 Marketers' Benchmarks 2011 Marketers' Benchmarks 2011
Marketers' Benchmarks 2011Alex Kornfeind
 
ITS-ON-MOBILE, Corporate presentation and references
ITS-ON-MOBILE, Corporate presentation and referencesITS-ON-MOBILE, Corporate presentation and references
ITS-ON-MOBILE, Corporate presentation and referencesDatafield
 
The social intranet workshop 2011 slideshare
The social intranet workshop 2011 slideshareThe social intranet workshop 2011 slideshare
The social intranet workshop 2011 slidesharePrescient Digital Media
 

Similar to Ffctn hackons la-corruption (7)

Convio APIs, what are they good for?
Convio APIs, what are they good for?Convio APIs, what are they good for?
Convio APIs, what are they good for?
 
MOBILE COMMERCE & NFC - Essential Background
MOBILE COMMERCE & NFC - Essential BackgroundMOBILE COMMERCE & NFC - Essential Background
MOBILE COMMERCE & NFC - Essential Background
 
Shoretel brilliantly simple_overview
Shoretel brilliantly simple_overviewShoretel brilliantly simple_overview
Shoretel brilliantly simple_overview
 
Marketers' Benchmarks 2011
 Marketers' Benchmarks 2011 Marketers' Benchmarks 2011
Marketers' Benchmarks 2011
 
ITS-ON-MOBILE, Corporate presentation and references
ITS-ON-MOBILE, Corporate presentation and referencesITS-ON-MOBILE, Corporate presentation and references
ITS-ON-MOBILE, Corporate presentation and references
 
Rhl
RhlRhl
Rhl
 
The social intranet workshop 2011 slideshare
The social intranet workshop 2011 slideshareThe social intranet workshop 2011 slideshare
The social intranet workshop 2011 slideshare
 

More from montrealouvert

Serveur Weather Environnement Canada
Serveur Weather Environnement CanadaServeur Weather Environnement Canada
Serveur Weather Environnement Canadamontrealouvert
 
Présentation opendata christiangendreau
Présentation opendata christiangendreauPrésentation opendata christiangendreau
Présentation opendata christiangendreaumontrealouvert
 
Hack reduce introduction
Hack reduce introductionHack reduce introduction
Hack reduce introductionmontrealouvert
 
Données Ouvertes et les terrains contaminés
Données Ouvertes et les terrains contaminés Données Ouvertes et les terrains contaminés
Données Ouvertes et les terrains contaminés montrealouvert
 
Conférence corruption Institut du nouveau monde (INM)
Conférence corruption Institut du nouveau monde (INM)Conférence corruption Institut du nouveau monde (INM)
Conférence corruption Institut du nouveau monde (INM)montrealouvert
 
Allumer - Présentation de LDAC à Hackons la Corrutpion
Allumer - Présentation de LDAC à Hackons la CorrutpionAllumer - Présentation de LDAC à Hackons la Corrutpion
Allumer - Présentation de LDAC à Hackons la Corrutpionmontrealouvert
 
Jean Fortier Hackons la Corruption
Jean Fortier Hackons la CorruptionJean Fortier Hackons la Corruption
Jean Fortier Hackons la Corruptionmontrealouvert
 
Présentation par Nord Ouvert - Hackons la corruption
Présentation par Nord Ouvert - Hackons la corruptionPrésentation par Nord Ouvert - Hackons la corruption
Présentation par Nord Ouvert - Hackons la corruptionmontrealouvert
 
Communautaire médias sociaux et démocratie directe
Communautaire médias sociaux et démocratie directeCommunautaire médias sociaux et démocratie directe
Communautaire médias sociaux et démocratie directemontrealouvert
 
Congrès des archivestes
Congrès des archivestesCongrès des archivestes
Congrès des archivestesmontrealouvert
 
Première rencontre publique Québec Ouvert
Première rencontre publique Québec OuvertPremière rencontre publique Québec Ouvert
Première rencontre publique Québec Ouvertmontrealouvert
 
How to build an open data movement in your city, state, or province OKFN data...
How to build an open data movement in your city, state, or province OKFN data...How to build an open data movement in your city, state, or province OKFN data...
How to build an open data movement in your city, state, or province OKFN data...montrealouvert
 
Présentation avec l'équipe Gautrin à l'Assemblée Nationale à Québec
Présentation avec l'équipe Gautrin à l'Assemblée Nationale à QuébecPrésentation avec l'équipe Gautrin à l'Assemblée Nationale à Québec
Présentation avec l'équipe Gautrin à l'Assemblée Nationale à Québecmontrealouvert
 
WebÉduction Données ouvertes enjeux
WebÉduction Données ouvertes enjeuxWebÉduction Données ouvertes enjeux
WebÉduction Données ouvertes enjeuxmontrealouvert
 
WebÉducation Gouvernement 2.0
WebÉducation Gouvernement 2.0WebÉducation Gouvernement 2.0
WebÉducation Gouvernement 2.0montrealouvert
 
Présentation à WebEducation avril 2011
Présentation à WebEducation avril 2011Présentation à WebEducation avril 2011
Présentation à WebEducation avril 2011montrealouvert
 
Intracom 2011 - ActionTI - Donées Ouvertes
Intracom 2011 - ActionTI - Donées OuvertesIntracom 2011 - ActionTI - Donées Ouvertes
Intracom 2011 - ActionTI - Donées Ouvertesmontrealouvert
 
Conférence LegalIT 5.0_présentation_MontréalOuvert
Conférence LegalIT 5.0_présentation_MontréalOuvertConférence LegalIT 5.0_présentation_MontréalOuvert
Conférence LegalIT 5.0_présentation_MontréalOuvertmontrealouvert
 

More from montrealouvert (20)

Serveur Weather Environnement Canada
Serveur Weather Environnement CanadaServeur Weather Environnement Canada
Serveur Weather Environnement Canada
 
Joost ouwerkerk
Joost ouwerkerk Joost ouwerkerk
Joost ouwerkerk
 
Présentation opendata christiangendreau
Présentation opendata christiangendreauPrésentation opendata christiangendreau
Présentation opendata christiangendreau
 
Hack reduce mr-intro
Hack reduce mr-introHack reduce mr-intro
Hack reduce mr-intro
 
Hack reduce introduction
Hack reduce introductionHack reduce introduction
Hack reduce introduction
 
Données Ouvertes et les terrains contaminés
Données Ouvertes et les terrains contaminés Données Ouvertes et les terrains contaminés
Données Ouvertes et les terrains contaminés
 
Conférence corruption Institut du nouveau monde (INM)
Conférence corruption Institut du nouveau monde (INM)Conférence corruption Institut du nouveau monde (INM)
Conférence corruption Institut du nouveau monde (INM)
 
Allumer - Présentation de LDAC à Hackons la Corrutpion
Allumer - Présentation de LDAC à Hackons la CorrutpionAllumer - Présentation de LDAC à Hackons la Corrutpion
Allumer - Présentation de LDAC à Hackons la Corrutpion
 
Jean Fortier Hackons la Corruption
Jean Fortier Hackons la CorruptionJean Fortier Hackons la Corruption
Jean Fortier Hackons la Corruption
 
Présentation par Nord Ouvert - Hackons la corruption
Présentation par Nord Ouvert - Hackons la corruptionPrésentation par Nord Ouvert - Hackons la corruption
Présentation par Nord Ouvert - Hackons la corruption
 
Communautaire médias sociaux et démocratie directe
Communautaire médias sociaux et démocratie directeCommunautaire médias sociaux et démocratie directe
Communautaire médias sociaux et démocratie directe
 
Congrès des archivestes
Congrès des archivestesCongrès des archivestes
Congrès des archivestes
 
Première rencontre publique Québec Ouvert
Première rencontre publique Québec OuvertPremière rencontre publique Québec Ouvert
Première rencontre publique Québec Ouvert
 
How to build an open data movement in your city, state, or province OKFN data...
How to build an open data movement in your city, state, or province OKFN data...How to build an open data movement in your city, state, or province OKFN data...
How to build an open data movement in your city, state, or province OKFN data...
 
Présentation avec l'équipe Gautrin à l'Assemblée Nationale à Québec
Présentation avec l'équipe Gautrin à l'Assemblée Nationale à QuébecPrésentation avec l'équipe Gautrin à l'Assemblée Nationale à Québec
Présentation avec l'équipe Gautrin à l'Assemblée Nationale à Québec
 
WebÉduction Données ouvertes enjeux
WebÉduction Données ouvertes enjeuxWebÉduction Données ouvertes enjeux
WebÉduction Données ouvertes enjeux
 
WebÉducation Gouvernement 2.0
WebÉducation Gouvernement 2.0WebÉducation Gouvernement 2.0
WebÉducation Gouvernement 2.0
 
Présentation à WebEducation avril 2011
Présentation à WebEducation avril 2011Présentation à WebEducation avril 2011
Présentation à WebEducation avril 2011
 
Intracom 2011 - ActionTI - Donées Ouvertes
Intracom 2011 - ActionTI - Donées OuvertesIntracom 2011 - ActionTI - Donées Ouvertes
Intracom 2011 - ActionTI - Donées Ouvertes
 
Conférence LegalIT 5.0_présentation_MontréalOuvert
Conférence LegalIT 5.0_présentation_MontréalOuvertConférence LegalIT 5.0_présentation_MontréalOuvert
Conférence LegalIT 5.0_présentation_MontréalOuvert
 

Ffctn hackons la-corruption

  • 1. ETUDE DE CAS VISUALISER DES DONNÉES OUVERTES Sébastien Pierre, FFunction inc. @Hackons la Corruption., Novembre 2012 www.ffctn.com © FFUNCTION INC, 2011 ffunction inc.
  • 2. INFOGRAPHIC : SE7EN SUMMITS © FFUNCTION INC, 2011 ffunction inc.
  • 3. GOOGE DATAVIZ CHALLENGE 2010 (FINALIST) © FFUNCTION INC, 2011 ffunction inc.
  • 4. NATIONAL GEOGRAPHIC SOCIETY'S PROJECTS © FFUNCTION INC, 2011 ffunction inc.
  • 5. 2008 Canadian Federal Travel & Hospitality Expenses © FFUNCTION INC, 2011 ffunction inc.
  • 6. SOME THINGS HAVEN'T CHANGED SINCE 2008 ➔ SCRAPING DATA in the absence of open-data, journalists will often be in the same context, having to spend time to collect, explore and assess the quality of the data. © FFUNCTION INC, 2011 ffunction inc.
  • 7. SOME THINGS HAVEN'T CHANGED SINCE 2008 ➔ FROM DATA TO STORY Each dataset is a discovery, getting a (compelling) story out of it is still a major challenge. © FFUNCTION INC, 2011 ffunction inc.
  • 8. THE DATA © FFUNCTION INC, 2011 ffunction inc.
  • 9. As the result of a federal government directive*, Travel and Hospitality Expenses have been published on the web in Canada since 2004 * Called “proactive disclosure” © FFUNCTION INC, 2011 ffunction inc.
  • 11. Data is (still) not directly accessible, and hosted on each specific ministry website, in a specific format. © FFUNCTION INC, 2011 ffunction inc.
  • 12. © FFUNCTION INC, 2011 ffunction inc.
  • 13. ACCURACY PROBLEMS NON-OPEN DATA DATA MAY BE MISSING DATA NOT UP TO DATE © FFUNCTION INC, 2011 ffunction inc.
  • 14. 22Mb SQL file scraped by citizens (available on Github) © FFUNCTION INC, 2011 ffunction inc.
  • 15. A DATASET WHICH TURNS OUT TO BE A BIT OPAQUE... © FFUNCTION INC, 2011 ffunction inc.
  • 16. BUILDING A TOOL TO EXPLORE THE DATA © FFUNCTION INC, 2011 ffunction inc.
  • 17. Basic analysis of the data © FFUNCTION INC, 2011 ffunction inc.
  • 18. Thinking about how to represent the data © FFUNCTION INC, 2011 ffunction inc.
  • 19. Thinking about the flow of interaction © FFUNCTION INC, 2011 ffunction inc.
  • 20. Importing and visualizing the data © FFUNCTION INC, 2011 ffunction inc.
  • 21. Mapping out the different types of expenses (travel, hospitality & guidelines) © FFUNCTION INC, 2011 ffunction inc.
  • 22. Simplifying the representation (expenses vs guidelines, over guidelines is in red) © FFUNCTION INC, 2011 ffunction inc.
  • 23. Changing the focus (under/over guidelines instead of total spending) © FFUNCTION INC, 2011 ffunction inc.
  • 24. Adding guides to improve reading the information © FFUNCTION INC, 2011 ffunction inc.
  • 25. Adding filtering to narrow down to subsets of the data © FFUNCTION INC, 2011 ffunction inc.
  • 26. Trying alternative representations on the data © FFUNCTION INC, 2011 ffunction inc.
  • 27. Trying even more alternative representations on the data © FFUNCTION INC, 2011 ffunction inc.
  • 28. THE RESULT http://ffctn.com/a/expensevisualizer © FFUNCTION INC, 2011 ffunction inc.
  • 29. © FFUNCTION INC, 2011 ffunction inc.
  • 30. © FFUNCTION INC, 2011 ffunction inc.
  • 31. I just found out the 5 top spending Federal depts, check it out at http://ur1.ca/a3spt © FFUNCTION INC, 2011 ffunction inc.
  • 32. © FFUNCTION INC, 2011 ffunction inc.
  • 33. © FFUNCTION INC, 2011 ffunction inc.
  • 34. FINDINGS 1 © FFUNCTION INC, 2011 ffunction inc.
  • 35. Cumulative spending TRENDS ONLY BECOME APPARENT WITH THE PROPER MODE OF REPRESENTATION Monthly spending © FFUNCTION INC, 2011 ffunction inc.
  • 36. PROBLEMS IN THE DATA QUALITY BECOME VISIBLE © FFUNCTION INC, 2011 ffunction inc.
  • 37. THINGS YOU WOULD EXPECT ARE NOT NECESSARILY THERE Spending of ministers for all departments © FFUNCTION INC, 2011 ffunction inc.
  • 38. DATA TO STORY: CHALLENGES ➔ NON-OPEN DATA – Missing or incomplete data: is the problem in the scraper or in the actual data? – At least you now have a tool to assess (and improve) the data quality © FFUNCTION INC, 2011 ffunction inc.
  • 39. DATA TO STORY: CHALLENGES ➔ NOT WHAT I THOUGHT – You might expect something about the data, but the visualization might prove your wrong – You might have been looking for something specific but you cannot see it in the visualization See my “30 min of data visualization” workshop for more on this... © FFUNCTION INC, 2011 ffunction inc.
  • 40. DATA TO STORY: CHALLENGES ➔ DID I TRY HARD ENOUGH? – There's no secret: you'll find something interesting if you explore your data enough. – If everything fails, you can at least get fun facts or controversial examples out of it. © FFUNCTION INC, 2011 ffunction inc.
  • 41. HOSPITALITY EXPENSES SKYROCKET IN 2008 !! © FFUNCTION INC, 2011 ffunction inc.
  • 42. INDUSTRY CANADA'S BIG SPENDER 2.5x As much MINISTER DIRECTOR © FFUNCTION INC, 2011 ffunction inc.
  • 43. WAR IS COSTING CANADA AN ARM AND A LEG! 3 MILLIONS! (over a period of five years) © FFUNCTION INC, 2011 ffunction inc.
  • 44. THE BEST STORY IS: WE NEED OPEN DATA! THIS IS NOT AN ACCEPTABLE PROACTIVE DISCLOSURE! © FFUNCTION INC, 2011 ffunction inc.
  • 45. TOOLS 1 © FFUNCTION INC, 2011 ffunction inc.
  • 46. GOOGLE REFINE https://github.com/OpenRefine © FFUNCTION INC, 2011 ffunction inc.
  • 47. DATA WRANGLER http://vis.stanford.edu/wrangler/ © FFUNCTION INC, 2011 ffunction inc.
  • 48. DATA WRAPPER http://datawrapper.de/ © FFUNCTION INC, 2011 ffunction inc.
  • 49. MANY EYES http://www-958.ibm.com/software/data/cognos/manyeyes/ © FFUNCTION INC, 2011 ffunction inc.
  • 50. R17 http://www.rseventeen.com/ © FFUNCTION INC, 2011 ffunction inc.
  • 51. THANK YOU! sebastien@ffctn.com / @ffunction WWW.FFCTN.COM © FFUNCTION INC, 2011 ffunction inc.