projetjourdain.org — A Database of Data Journalism

413 views
342 views

Published on

Presentation of the website projetjourdain.org, that hosts the database of the jourdain project.

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
413
On SlideShare
0
From Embeds
0
Number of Embeds
11
Actions
Shares
0
Downloads
7
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

projetjourdain.org — A Database of Data Journalism

  1. 1. La base de données du journalisme de données Le site projetjourdain.org mercredi 16 octobre 13
  2. 2. Prologue mercredi 16 octobre 13
  3. 3. Une optique communicationelle Social Technique Sémiotique « les sciences de l’information et de la communication n’étudient jamais la communication et l’information en elles-mêmes ou pour elles-mêmes, c’est-à-dire comme des êtres abstraits (elles seraient alors une idéologie), mais bien en tant qu’elles sont matérialisées, institutionnalisées et opérationalisées dans la société. » — Jean Davallon mercredi 16 octobre 13
  4. 4. Une double articulation Analyser le journalisme de données avec et par les outils du journalisme de données : mercredi 16 octobre 13
  5. 5. Une double articulation Analyser le journalisme de données avec et par les outils du journalisme de données : • Le journalisme de données comme phénomène : l’émergence d’une nouvelle conception de la profession journalistique ? mercredi 16 octobre 13
  6. 6. Une double articulation Analyser le journalisme de données avec et par les outils du journalisme de données : • Le journalisme de données comme phénomène : l’émergence d’une nouvelle conception de la profession journalistique ? • Le journalisme de données comme processus : un système inédit de production de l’information journalistique ? mercredi 16 octobre 13
  7. 7. Structure de la représentation I. Le théâtre II. Les coulisses III. La mise en scène mercredi 16 octobre 13
  8. 8. Le Théâtre mercredi 16 octobre 13
  9. 9. Data ♥ Journalism A Love Story Cours van Negotie, publié à Amsterdam depuis 1609 mercredi 16 octobre 13 Exemple d’une feuille d’avis publiée en 1757
  10. 10. Data ♥ Journalism A Love Story La presse occidentale succombe à une fièvre statistique (tipsterism) à partir de 1830. mercredi 16 octobre 13
  11. 11. Data ♥ Journalism A Love Story Le Computer Assisted Reporting apparaît dès le début des années 1950 aux États-Unis. mercredi 16 octobre 13
  12. 12. Des apports inédits L’extension de la frontière professionnelle C’est important que nous soyons assis dans la salle de rédaction. Le contenu de notre travail dépend habituellement de conversations en face-à-face avec les reporters. — Brian Boyer, The Data Journalism Handbook mercredi 16 octobre 13
  13. 13. Des apports inédits Une démocratisation des outils Les journalistes peuvent aisément accéder à des outils jusqu’alors réservés aux professionnels : bases de données relationnelles, langages d’analyse statistique… mercredi 16 octobre 13
  14. 14. Des apports inédits Un nouveau regard critique J’ai pris conscience, avec mes modestes moyens, de ce que les chercheurs en sciences sociales savent depuis fort longtemps : il n’y a pas plus de fait brut que de données brutes. — Simon Chignard mercredi 16 octobre 13
  15. 15. Les Coulisses mercredi 16 octobre 13
  16. 16. Construire la donnée ≠ Une donnée « brute » ? mercredi 16 octobre 13 Une donnée « construite »
  17. 17. Rechercher les données La phase la plus journalistique : Recherche mercredi 16 octobre 13
  18. 18. Rechercher les données La phase la plus journalistique : • Utilisation des procédés classiques du journalisme d’investigation Recherche mercredi 16 octobre 13
  19. 19. Rechercher les données La phase la plus journalistique : • Utilisation des procédés classiques du journalisme d’investigation • Recours au croisement des sources existantes. Recherche mercredi 16 octobre 13
  20. 20. En quête d’un critère… À ce jour, il n’existe aucun diplôme de datajournaliste. mercredi 16 octobre 13
  21. 21. Recourir à des détours mercredi 16 octobre 13
  22. 22. Le Data Journalism Handbook Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme. mercredi 16 octobre 13
  23. 23. Le Data Journalism Handbook Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme. mercredi 16 octobre 13
  24. 24. Le Data Journalism Handbook Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme. mercredi 16 octobre 13
  25. 25. Le Data Journalism Handbook Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme. mercredi 16 octobre 13
  26. 26. Recueillir des données Trois types de recueil : Recueil mercredi 16 octobre 13
  27. 27. Recueillir des données Trois types de recueil : • Réutilisation de jeux de données déjà formatés. Recueil mercredi 16 octobre 13
  28. 28. Recueillir des données Trois types de recueil : • Réutilisation de jeux de données déjà formatés. • Recueil manuel. Recueil mercredi 16 octobre 13
  29. 29. Recueillir des données Trois types de recueil : • Réutilisation de jeux de données déjà formatés. • Recueil manuel. • Recueil automatisé (ou scraping) Recueil mercredi 16 octobre 13
  30. 30. Le scraping Exploiter l’architecture des pages web mercredi 16 octobre 13
  31. 31. Utiliser un code d’extraction Exemple de la bibliothèque BeautifulSoup de Python mercredi 16 octobre 13
  32. 32. Le résultat final mercredi 16 octobre 13
  33. 33. Classer les données Phase très complexe : Classement mercredi 16 octobre 13
  34. 34. Classer les données Phase très complexe : • Définition d’un système de rangement adapté. Classement mercredi 16 octobre 13
  35. 35. Classer les données Phase très complexe : • Définition d’un système de rangement adapté. • Prise en compte des relations élaborées entre les différents items mercredi 16 octobre 13 Classement
  36. 36. Des relations élaborées Le datajournalisme constitue un objet d’étude complexe : •Une organisation peut employer plusieurs datajournalistes •Un datajournaliste peut être (ou avoir été) employé par plusieurs institutions. Many-to-many relationships mercredi 16 octobre 13
  37. 37. Une architecture en trois dimensions x mercredi 16 octobre 13
  38. 38. Une architecture en trois dimensions x mercredi 16 octobre 13
  39. 39. Une architecture en trois dimensions x mercredi 16 octobre 13
  40. 40. Une architecture en trois dimensions y x mercredi 16 octobre 13
  41. 41. Une architecture en trois dimensions y x mercredi 16 octobre 13
  42. 42. Une architecture en trois dimensions y x mercredi 16 octobre 13
  43. 43. Une architecture en trois dimensions y x mercredi 16 octobre 13 z
  44. 44. Lier les bases mercredi 16 octobre 13
  45. 45. Lier les bases Table Noms mercredi 16 octobre 13 Table Organisations
  46. 46. Analyser la donnée Un tout autre regard : la pensée statistique Analyse mercredi 16 octobre 13
  47. 47. Analyser la donnée Un tout autre regard : la pensée statistique • Transformation des données en connaissances. mercredi 16 octobre 13 Analyse
  48. 48. Analyser la donnée Un tout autre regard : la pensée statistique • Transformation des données en connaissances. • Croisement d’outils mathématiques et de préceptes méthodologique. mercredi 16 octobre 13 Analyse
  49. 49. Visualiser À quoi sert une visualisation ? mercredi 16 octobre 13 Visualiser
  50. 50. Visualiser À quoi sert une visualisation ? • Création d’une représentation simple et circulante des résultats obtenus. mercredi 16 octobre 13 Visualiser
  51. 51. Visualiser À quoi sert une visualisation ? • Création d’une représentation simple et circulante des résultats obtenus. • Percevoir des liaisons et relations passées inaperçues. La visualisation a une portée maïeutique. mercredi 16 octobre 13 Visualiser
  52. 52. Simplicité Les outils D3.JS Flexibilité mercredi 16 octobre 13
  53. 53. Une polyphonie énonciative Données (format JSON) Bibliothèque Infovis Formatage CSS mercredi 16 octobre 13 Configuration infovis Formatage HTML
  54. 54. Un exemple Les datajournalistes français mercredi 16 octobre 13
  55. 55. Publier Les problématiques de la publication mercredi 16 octobre 13 Publier
  56. 56. Publier Les problématiques de la publication • Réinscription des résultats dans une nouvelle structure informationnelle mercredi 16 octobre 13 Publier
  57. 57. Publier Les problématiques de la publication • Réinscription des résultats dans une nouvelle structure informationnelle • Retranscription vers un format lisible pour le site. mercredi 16 octobre 13 Publier
  58. 58. La Scène mercredi 16 octobre 13
  59. 59. Un projet de recherche mercredi 16 octobre 13
  60. 60. Un projet de recherche mercredi 16 octobre 13
  61. 61. Un projet de recherche mercredi 16 octobre 13
  62. 62. Des jeux de données mercredi 16 octobre 13
  63. 63. Des jeux de données mercredi 16 octobre 13
  64. 64. Des jeux de données mercredi 16 octobre 13
  65. 65. Des analyses composites Croiser du texte, des jeux de données… mercredi 16 octobre 13
  66. 66. Des analyses composites …des cartes… mercredi 16 octobre 13
  67. 67. Des analyses composites et des schémas. mercredi 16 octobre 13
  68. 68. Épilogue mercredi 16 octobre 13

×