Mémoire Data-journalisme

9,465 views
9,389 views

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
9,465
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
492
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Mémoire Data-journalisme

  1. 1. UNIVERSITE DE PARIS IV – SORBONNE CELSA Ecole des hautes études en sciences de l’information et de la communication MASTER 2ème année Mention : Information et Communication Spécialité : Médias et Communication« Data-Hari » : le journalisme sacrifié sur l’autel des données ? Préparé sous la direction du Professeur Véronique RICHARD Nom, Prénom : Alexis Chailloux Promotion : 2011-2012 Option : MISC (Médias Informatisés et Stratégies de Communication) Soutenu le : 22 octobre 2012 Note du mémoire : Mention :
  2. 2. Remerciements Je voudrais remercier avant toute chose mon rapporteur universitaire, Étienne Candel,ainsi que mon rapporteur professionnel, Anthony Hamelle, pour les nombreuses pistes ouvertes etl’intérêt consacré à mon travail. Je remercie les personnes ayant pris de leur temps personnel pour s’entretenir avec moi :Caroline Goulard, à la passion contagieuse, Pierre Romera, un « ami pour la vie » grâce àTwitter, et Jean-Christophe Féraud, pour sa ferveur du journalisme « avec un grand J ». J’espèreles recroiser très vite et poursuivre nos discussions. J’adresse un immense merci à ma grand-mère, ange-gardienne bienveillante etattentionnée durant toute la période de rédaction, sans qui ce mémoire n’aurait jamais pu voir lejour dans les délais impartis. À l’heure d’écrire ces lignes, j’ai une pensée particulière pour elle. Je n’oublie pas mes deux parents, relecteurs d’une rare réactivité, pour leurscommentaires parfois fantasques, souvent rigoureux, toujours utiles. Leur investissementquotidien à mes côtés fut d’une aide précieuse. Merci encore à Marion, Claire et Alix, qui ont participé à la fastidieuse mais nécessairetâche de relecture. Merci enfin à toute la promotion des MISC 2012, pour les rires, les pleurs, les joies, lesdéprimes et les encouragements au moment, si redouté, de rédiger le mémoire. Sans ce salutaireespace de décompression, la tâche aurait été plus périlleuse encore. 2
  3. 3. Introduction En 1989, Bill Dedman reçoit le prix Pulitzer du journalisme d’investigation pour sonenquête « The Color of Money », publiée dans The Atlanta Journal1. En croisant des bases dedonnées ethno-démographiques et bancaires, il démontre, cartes à l’appui, que l’appartenanceethnique est, toutes choses égales par ailleurs, un facteur de discrimination au moment d’attribuerun prêt immobilier. En 2012, Michal J. Berens et Ken Amstrong reçoivent le prix Pulitzer du journalismed’investigation pour leur enquête « Methadone and the politics of pain », publiée dans The SeattleTimes2. En croisant des bases de données de certificats de décès, d’hospitalisations et de pauvreté,ils démontrent, cartes à l’appui, que la méthadone, analgésique réputé pour sa dangerosité, estsystématiquement prescrite par Medicaid, l’assurance-santé publique destinée aux plus démunis,à des fins d’économie budgétaire3. La première enquête relève simplement du journalisme d’investigation, quand la secondeest considérée comme une récompense pour le « journalisme de données »4. Comment expliquerune telle différence de traitement ?1 FANEN, Sophian, « Les Américains défricheurs du déchiffrage », Ecrans, [disponible en ligne], 4 janvier 2012(lorsqu’un article a été consulté en ligne, la mention « disponible en ligne » sera faite, l’URL complète et la date deconsultation étant indiquées en bibliographie).2 « Seattle Times methadone investigation wins Pulitzer Prize », The Seattle Times, [disponible en ligne], 16 avril2012.3 BERENS, Michael. J., « How we linked methadone to powerty », The Seattle Times, [disponible en ligne], 10décembre 2011.4 « Le journalisme de données récompensé », Courrier International, [disponible en ligne], 28 juin 2012. 3
  4. 4. Contextualisation Une première réponse est apportée par le concept d’ « intermédialité », défini par AndréGauderault et Philippe Marion pour décrire la genèse du cinéma. Dans ce cadre théorique, un« média naît toujours deux fois5» : une « naissance intégrative » (ou « fausse naissance »), puisune « naissance différentielle » (ou « autonomisation identitaire »). La « naissance intégrative »correspond au moment où une nouvelle technique de traitement de l’information apparaît. À cemoment, le média est encore dépendant d’autres formes médiatiques : « dépourvu de réelleépaisseur paradigmatique (…) son identité lui échappe encore6 ». La « naissance différentielle »intervient lorsque le média s’affirme dans sa singularité, en développant des spécificitésidentitaires (mode de communication, esthétique, champ sémantique, etc.). Elle coïncidegénéralement avec une reconnaissance institutionnelle, et se traduit par une augmentationsensible des ressources économiques qui lui sont allouées. À croire Sylvain Parasie, sociologue à l’Université Paris-Est Marne-la-Vallée, la« naissance intégrative » du data-journalisme7 daterait de la fin des années 1960, lorsque « l’idéed’utiliser des bases de données comme support à la production d’information apparaît enAmérique du nord8 ». Philip Meyer révèle ainsi en 1967 dans le Detroit Free Press, que lesjeunes étudiants Noirs ont autant participé aux émeutes de la ville que les jeunes Noirs sansqualification, contrairement à une théorie « populaire chez les éditorialistes9 ». Mû par l’idéed’exploiter les outils statistiques des sciences sociales à des fins d’investigation, et séduit par lespromesses du développement de l’informatique, il rédige même un manuel, The New PrecisionJournalism 10 . Cette technique, qui prend finalement le nom de CAR - Computer Assisted5 GAUDERAULT, André, MARION, Philippe, « Un média naît toujours deux fois ... », Sociétés et représentations,n° 9, 2000, pp. 21-36.6 Ibid., p. 21. Appliqué à l’objet de leur recherche, deux auteurs montrent ainsi que le cinéma des premiers tempsn’était pas considéré comme tel – le début d’un nouveau genre médiatique - mais comme un moyen parmi d’autresde réaliser des disciplines bien établis (fééries, mystères, etc.).7 Tout au long de ce mémoire, les terminologies « data-journalisme » et « journalisme de données » seront utiliséessans guillemets et indifféremment pour désigner l’objet de recherche. Lorsqu’il s’agira de souligner une orthographeparticulière, des guillemets seront systématiquement ajoutés.8 Cité dans : INIZAN, Maël, « Chicago : de la prohibition au data-journalisme », Sillicon Maniacs, [disponible enligne], 24 mars 2011.9 [« Popular with editorial writers »] in MEYER, Philip, The New Precision Journalism, 4e Éd (1973), Rowman &Littlefield Publishers, 2002, p. 14.10 Ibid., 304 p. 4
  5. 5. Reporting11 -, fait quelques émules dans les années 1980 où plusieurs prix Pulitzer sont récoltés.Elle ne jouira cependant jamais d’une reconnaissance institutionnelle propre, les journalistes quil’utilisent étant systématiquement rattachés au journalisme d’investigation, genre déjà bien établi. La « naissance différentielle » intervient dans les années 2000, lorsque des acteurs issusdu mouvement du logiciel libre, intéressés par les problématiques d’information, investissementle champ journalistique à la faveur du mouvement d’ « open data »12. La figure emblématique dece phénomène est Adrian Holovaty. Développeur et journaliste, il se fait connaître au WashingtonPost en lançant en 2005 Chicagocrime.org, carte localisant les crimes et délits à partir des fichiersde police. Il écrit l’année suivante un court texte13, présenté aujourd’hui par les commentateurscomme le « manifeste du data journalisme14 ». Le succès rencontré par ces acteurs amène lesgrands titres de presse américains – New York Times, Washington Post, Chicago Tribune, LosAngeles Times - à constituer des équipes dédiées et à les intégrer dans les rédactions, établissantainsi le data-journalisme comme une pratique légitime, dotée d’une reconnaissanceinstitutionnelle.Construction de l’objet de recherche Le « journalisme de données » mobilise deux termes polysémiques : « journalisme » et« données ». Il convient de définir quelles significations de chacun de ces deux mots sontmobilisées lorsque l’expression est employée.11 « Journalisme Assisté par Ordinateur »12 Aussi dénommé « mouvement de libération des données publiques », ce mouvement enjoint les administrationspubliques à mettre à disposition des données librement réutilisables.13 HOLOVATY, Adrian, « A fundamental way newspapers need to change », [disponible en ligne], 6 septembre2006.14 GUILLAUD, Hubert, « Les données pour comprendre le monde », InternetActu, [disponible en ligne], 19 juillet2011. 5
  6. 6. La donnée comme production humaine Le Trésor de la Langue Française Informatisé (TLFI) apporte, à l’entrée « donnée », aumoins deux significations intéressantes dans le cadre de ce travail. (i) « Quantité connue dansl’énoncé d’un problème », la donnée est avant tout un élément quantifiable, que l’on peutmesurer, manipuler, calculer. (ii) « Ensemble des indications enregistrées en machine pourpermettre l’analyse et/ou la recherche automatique d’informations », la donnée se veutégalement manipulable par les outils informatiques. L’entrée « statistiques » - « recueil dedonnées numériques concernant des faits économiques et sociaux », - permet de discerner unetroisième acception du terme « donnée » : une production humaine ayant pour objectifd’appréhender le social. Dans ce sens, la donnée est le fruit d’un processus, d’une médiation, ellen’est donc paradoxalement pas « donnée ». En résumé, la donnée est quantifiable, informatisée,mais également le fruit d’un processus du recueil. Cette dernière approche est développée par lesociologue Olivier Martin. Dans un débat sur « la vérité des chiffres15 », il présente les trois éléments qui, selon lui,composent un chiffre. C’est d’abord une notion, c’est-à-dire ce que l’on veut mesurer, plus oumoins latente selon les cas : si le statut matrimonial d’un individu est objectivable, ne serait-ceque par le droit, il semble plus périlleux dexprimer l’intelligence. C’est ensuite un process, soit ledispositif humain d’enregistrement et les méthodes statistiques appliquées aux résultats ; ladonnée est bien le résultat d’une médiation humaine. C’est enfin une institution, qui réalise lamesure dans un objectif défini : la recherche (laboratoire universitaire), le pilotage de l’actionpublique (Etat), l’information (média), le commerce (institut de sondage), la dénonciation(association), etc. Autrement dit, le chiffre statistique n’est pas simplement un nombre, mais lareprésentation d’un dispositif de mesure conçu par des humains, et commandité par uneinstitution dans un but précis. Lorsqu’il est utilisé dans le cadre des médias informatisés, le terme de « donnée » acependant tendance « à “avaler” [son] environnement, à jeter dans l’ombre des concepts15 MARTIN, Olivier, « La vérité des chiffres : une illusion ? Débat entre entre Alain Blum, démographe, et OlivierMartin, sociologue. », La Vie des idées, [disponible en ligne], 12 novembre 2009. 6
  7. 7. connexes16 ». Selon Valérie Peugeot, il est utilisé à la fois pour désigner les métadonnées - leséléments qui qualifient et donnent un sens à un document -, les données – au sens de chiffresstatistiques – et les documents numérisés – simples photographies de documents papier. Lamajorité des réalisations estampillées « data-journalisme » concernent le second sens, mais ilexiste des cas utilisant des métadonnées – une cartographie des auteurs de Wikipédia parexemple17 -, ou se servant de documents numérisés – l’enquête sur les notes de frais des députésbritanniques notamment18. Au détour d’une phrase, Pierre Romera utilise ainsi clairement le mot« donnée » pour signifier un document papier : « tu sais quand on parle de Wikileaks commerévolution c’est complètement faux. Depuis toujours les journalistes utilisent des données, ouqu’ils ont volées ou alors qu’ils ont trouvées, oubliées sur une photocopieuse.19 ».Pour une dé-ontologie du journalisme Tenter de donner une définition transnationale et atemporelle du journalisme serait, pourreprendre les mots d’Erik Neveu, retomber dans « l’illusion essentialiste20 ». En premier lieu,parce que le journalisme est ancré dans des histoires nationales propres, où les rapports auxchamps littéraires, économiques et politiques ne sont pas les mêmes. Jean Chalaby a ainsi pointéles différences entre un modèle anglo-américain, devenu la norme internationale par son soucid’indépendance, et un modèle français, marqué par sa plus lente autonomisation vis-à-vis dupouvoir politique et du monde littéraire21. Ces deux pôles sont complétés par toute une série demodèles intermédiaires, à l’instar du journalisme brésilien22. En second lieu, même au sein d’unpays donné, les frontières de la profession de journaliste se révèlent « flou[es]23 ». Dans ces16 PEUGEOT, Valérie, « Web des données, données ouvertes », France Telecom R&D, [disponible en ligne], Janvier2010, p. 25.17 http://wikiproject.oii.ox.ac.uk/mapping_wikipedia/ (consulté le 31 août 2012), cité in: « Les data en forme »,OWNI, [disponible en ligne], 17 avril 2012.18 LEON, Yann et ORMAN, Évelyne, « La ronde des chiffres du journalisme de données », La Croix, [disponible enligne], 22 octobre 2010.19 Entretien avec Pierre Romera (annexe 2)20 NEVEU, Erik, « News without journalists : real threat or horror show », Brazilian Journalism Research, Vol. 6/1,2010, p. 31.21 CHALABY, Jean, The invention of journalism, Palgrave Mc Millan, 1998, 224 p.22 MARQUES de MELO (José), 2009, « Journalistic Thinking. Brasil’s Modern Tradition », Journalism, Vol 10/1,pp. 9-27.23 RUELLAN, Denis, Le professionnalisme du flou, Presses Universitaires de Grenoble, 1993, 232 p. 7
  8. 8. conditions, il semble nécessaire de réaliser une « dé-ontologie24 » du journalisme, et accepter quele terme ne renvoie pas à une réalité univoque. Ce qui ne doit pas nous empêcher pour autant dedéfinir les grands registres de sens mobilisés lorsque le terme est employé. À l’entrée « journalisme », le Trésor de la Langue Française Informatisé en indique aumoins trois. C’est avant tout la « profession de ceux ou celles qui exercent le métier dejournaliste », une corporation avec ses rivalités, son éthique, ses contraintes économiques. C’estégalement « une manière de présenter les faits et les événements sous un éclairage propre », unetechnique permettant le recueil, l’assemblage, la vérification d’informations afin de les rendreintelligibles à un public. « Ensemble des journaux », le journalisme représente enfin une force« comme moyen d’action ou de pression » : c’est un pouvoir, une autorité, une respectabilité.Yves Jeanneret et Emmanuel Souchier proposent un triptyque comparable pour appréhender lemétier de journaliste. Il se composerait de trois éléments : « un marché », « une écriture », « uneresponsabilité »25. Erik Neveu décrit lui quatre « repères ou imaginaires professionnels26 » permettant de lierles différentes pratiques du journalisme. Premièrement, un certain « ordre du discours » au sensfoucaldien 27 , entendu comme ce qui est pensable et dicible en société. Le journalisme secaractérise par une manière de s’exprimer identifiée comme journalistique, qui se distingue desparoles politiques, littéraires ou publicitaires. Deuxièmement, une pratique de recueil et detransformation de l’information qui lui permet de ne pas répéter docilement celle produite par lessources, en particulier les plus puissantes, le pouvoir économique et politique. Troisièmement,une autorité : par la prétention à une certaine fidélité aux faits, le journaliste acquiert une parolerespectée, et une réputation de confiance. Enfin, la prégnance d’un certain nombre de mythesfondateurs de la profession28 : la noblesse du métier, le service rendu au public ou l’idée debouclier de protection de la démocratie. C’est cette approche en termes d’imaginairesprofessionnels qui sera utilisée ici.24 RASTIER, François, « Ontologie(s) », Revue des sciences et technologies de l’information, Vol. 18/1, 2004, pp.15-40.25 JEANNERET, Yves et SOUCHIER, Emmanuel, « Introduction. Internet vu du journalisme », Communication etlangages, n° 129, 3e trimestre 2001, p. 36.26 NEVEU, Art. cit., p. 32.27 FOUCAULT, Michel, L’ordre du discours, Gallimard, 1971, 81 p.28 LE BOHEC, Jacques, 2000, Les mythes professionnels des journalistes, L’Harmattan, 395 p. 8
  9. 9. Problématique Le développement du data-journalisme est porteur d’une promesse forte de transparence.« Faculté de mettre en lumière29 » selon Thierry Libaert, le terme prend ici deux significations30.Il peut s’agir de révéler des « vérités » masquées dans les chiffres par le croisement avisé de jeuxstatistiques, comme l’enquête de Philippe Meyer sur les émeutes de Détroit en 1967. Dans ce cas,la « libération » de données publiques à l’œuvre depuis quelques années n’est-elle pas uneaubaine pour ce type de travail journalistique ? La transparence peut également s’entendrecomme la prétention à « dévoiler » les coulisses du pouvoir, ses secrets inavouables etcomportements amoraux. C’est la figure installée du journaliste d’investigation, qui pose sesyeux là où les puissants ne veulent pas. Ce dernier n’a-t-il pas tout à gagner de la numérisationdes documents politiques, rendant leur accessibilité et leur transmission bien plus aisées31 ? TimBerners-Lee, l’inventeur du web, et Eric Mettout, rédacteur en chef de Lexpress.fr, ne s’ytrompent pas : pour le premier, « data journalism is the future32 », pour le second c’est « l’aveniren marche33 ». Pourtant, force est de constater que le data-journalisme est encore peu présent dans lesorganisations médiatiques « traditionnelles ». Confiné à l’étranger dans des grands titres depresse, autour de figures tutélaires – Simon Rogers au Guardian, Aaron Pilhofer au New YorkTimes, Brian Boyer au Chicago Tribune -, le journalisme de données est même absent desprincipaux titres français. Et lorsqu’un grand quotidien comme Le Monde lance un blog sur le29 LIBAERT, Thierry, La transparence en trompe-l’œil, Descartes & Cie, coll. « Gouvernance et démocratie », 2003,p. 13.30 CARDON, Dominique, « Zoomer ou dézoomer ? Les enjeux politiques des données ouvertes », OWNI, [disponibleen ligne], 21 février 2011.31 Olivier Tesquet, ancien d’OWNI passé chez Télérama, explique ainsi le péhnomène Wikileaks par cette relativefacilité pour obtenir de l’information confidentielle : « C’est beaucoup plus facile de pirater des donnéesconfidentielles comme des mémos diplomatiques aujourd’hui qu’il y a 20 ans. 850 000 personnes ont accès à desdocuments top secret sur Intellipédia, (un wiki classifié des renseignements américain) », voir INIZAN, Maël,« L’open data appliqué au journalisme », Sillicon Maniacs, [disponible en ligne], 23 octobre 2011.32 ARTHUR, Charles, « Analysing data is the future, says Time Berners-Lee », The Guardian, [disponible en ligne],22 novembre 2010.33 METTOUT, Eric, « Pourquoi le data-journalisme c’est l’avenir en marche », L’Express, [disponible en ligne], 7avril 2010. 9
  10. 10. modèle du Guardian 34 , celui-ci ferme au bout de deux articles. Les seules expériencesrevendiquées en France se trouvent à OWNI 35 , autrement dit à la marge des rédactions 36 .Comment dès lors expliquer ce paradoxe entre des promesses faramineuses et uneinstitutionnalisation encore faible dans le secteur du journalisme ? Au-delà des argumentséconomiques - une presse en crise -, ou historiques – une tradition inégale de CAR, « ComputerAssisted Reporting -, n’y a-t-il pas des raisons « communicationnelles » qui justifient cet écart ? Un deuxième type de promesses du data-journalisme, que l’on nommera « objectivistes »,pourrait abonder dans ce sens. Dans un des premiers articles sur le sujet en France, NicolasVambremeersch utilise à plusieurs reprises l’expression de « données objectives37 » pour justifierson propos. Pourtant, selon Jean-Christophe Féraud, journaliste « technologies » à Libération,« la subjectivité ne se met pas en données, or le journalisme est un genre subjectif38 ». Il pointeainsi ce qu’il perçoit comme « une tendance à vouloir objectiviser à outrance la réalité39 ». Ilajoute un second grief, estimant que le data-journalisme porte le risque d’une automatisationnéfaste du métier de journaliste : « à tous les zélotes du “data journalism”, qui sont [les] mêmesque les partisans du “robot-journalisme”, je dis : “nous ne sommes pas des numéros !”. » Ildéfend au contraire une « Information avec un grand “I”, de la chair, du sang et de l’histoirededans40 », où le journaliste se renseigne en profondeur sur un terrain, et restitue au lecteurl’information mise en perspective grâce à la « puissance narrative de l’écrit41 ». Cette opinion tranchée permet de distinguer des points de tension entre la perception dudata-journalisme et certains imaginaires du journalisme, tels que définis plus haut. Ainsi, àécouter Jean-Christophe Féraud, « l’ordre du discours » journalistique est sérieusement remis en34 Le blog « Données moi ! », avait ainsi pour signature « le blog data d’un data journaliste du Monde », et commeURL http://datablog.blog.lemonde.fr/ (consulté le 31 août 2012), clin d’œil explicite au datablog du Guardian, quirecueille toutes les réalisation du journal en matière de data-journalisme.35 OWNI se présente comme « un média d’enquête, de reportage et de data-journalism, dédié aux culturesnumériques ainsi qu’aux nouveaux enjeux de société ».36 Pour preuve, ce n’est que très récemment qu’un journaliste de formation - Guillaume Dasquié - a remplacéNicolas Voisin, entrepreneur, comme directeur de la publication. Voir : RICHÉ, Pascal, « OWNI se déchire (endeux) pour mieux redémarrer », Rue89, [disponible en ligne], 25 mai 2012.37 VAMBREMEERSH, Nicolas, « Pour un journalisme de données », Slate, [disponible en ligne], 30 juillet 2009.38 Entretien avec Jean-Christophe Féraud (Annexe 3)39 FERAUD, Jean-Christophe, « Le “data journalism” contre Albert Londres », Sur mon écran radar, [disponible enligne], 9 février 2010.40 Entretien avec Jean-Christophe Féraud (Annexe 3)41 Ibid. 10
  11. 11. cause par le journalisme de données : « le métier de journaliste cest dabord raconter les ressortsdune actualité en répondant le mieux possible aux fameux "5W42" (…). Or les chiffres à eux seulssont bien incapables de répondre à ce questionnement43 ». Alors que le terme de « data-journalisme » suggère une inscription naturelle dans lechamp journalistique, cette citation pose la question de l’effectivité de ces liens : le data-journalisme est-il « du journalisme » ? L’existence de deux signifiants suggère le contraire.Avons-nous plutôt affaire à un genre journalistique, au même titre que l’enquête, le reportage oul’interview ? Si tel est le cas, pourquoi certains journalistes se revendiquent-ils du data-journalisme, tandis que d’autres le rejettent ? Par quels mécanismes ? Finalement, et ce sera le fil directeur de ce mémoire, il s’agira de se demander commentles promesses du data-journalisme s’articulent avec les repères et imaginaires dujournalisme professionnel.Méthodologie Le choix d’une méthodologie suit logiquement la phase de problématisation, entendu quetoutes les méthodes ne conviennent pas à tous les questionnements. Une telle affirmation s’inscriten porte-à-faux avec des remises en cause récentes de la valeur scientifique de l’entretien semi-directif, en particulier dans le cadre de mémoires étudiants44. Or, comme le notent Gilles Pinsonet Valérie Sala Pala, en réponse à l’article précité, « les spécificités de chaque recherche devrontêtre prises en compte pour déterminer quelle combinaison méthodologique saura le mieux rendrecompte de l’objet de recherche 45 ». En ce sens, ce mémoire proposera trois approchescomplémentaires : l’analyse de discours, l’analyse sémiotique, ainsi que des entretiens semi-directifs, qui permettent une approche compréhensive des discours des acteurs.42 Les cinq « W » correspondent aux adverbes interrogatifs anglais « Who », « What », « When », « Where »,« Why », auxquels une production journalistique se devrait de répondre.43 FERAUD, Art. cit.44 BONGRAND, Philippe et LABORIER, Pascale, « L’entretien dans l’analyse des politiques publiques : un impenséméthodologique ? », Revue française de science politique, Vol. 55, 2005, pp. 73-111.45 PINSON, Gilles et SALA PALA, Valérie. « Peut-on vraiment se passer de lentretien en sociologie de lactionpublique ? », Revue française de science politique, Vol. 57, 2007, p. 596. 11
  12. 12. L’analyse de discours L’ « analyse de discours » est à distinguer de l’ « analyse de contenus ». Cette dernièrepermet d’analyser un corpus extrêmement large de textes, d’y repérer des occurrences et sortirdes statistiques. La première préfère une approche qualitative, se fondant davantage sur l’analysede la rhétorique employée (champs lexicaux, syntaxe, etc.), à une approche quantitative. Nousnous intéresserons dans ce cadre aux discours des promoteurs du data-journalisme, ainsi qu’àceux portés par les médias. Le corpus principal a été constitué de manière partiellementautomatisée, par la mise en place d’alertes mails quotidiennes sur les termes « journalisme +données », ainsi que « data + journalisme », faisant remonter les articles en français. Desrecherches régulières sur le web ont permis de compléter le corpus, en ciblant les articles françaisutilisant une orthographe distincte (« datajournalism » par exemple), ainsi que les articles enanglais particulièrement cités.Une sémiologie graphique et linguistique Pour Ferdinand de Saussure, la sémiologie est la « science qui étudie la vie des signes ausein de la vie sociale46 ». En linguistique, un signe se compose d’un signifié (le sens, abstrait,mental) et d’un signifiant (la forme, concrète, visible). Nous utiliserons l’analyse sémiologiquedans cette dimension linguistique, à travers l’étude des connotations des signifiants, tel le préfixe« data » dans l’expression « datajournalisme ». Elle sera également mobilisée pour analyser lesconnotations des signes graphiques, qu’ils soient plastiques – pouvant être examinés du point devue de la forme, des couleurs, de la texture, etc. -, ou iconiques – qui renvoient aux objets dumonde. Nous appliquerons cette « rhétorique de l’image47 » aux logos de certaines institutions,ainsi qu’aux dispositifs se revendiquant du data-journalisme, dans une approche plus techno-sémiotique. Ces deux dimensions - linguistique et graphique – sont cependant intimement liées,et seront donc articulées dans l’analyse.46 SAUSSURE (DE), Ferdinand, Cours de linguistique générale, Payot, édition 1973 (1916), p. 33.47 BARTHES, Roland, « Rhétorique de l’image », Communications, Vol. 4/4, pp. 40-51. 12
  13. 13. Des entretiens semi-directifs dans une démarche compréhensive Enfin, des entretiens semi-directifs se révèlent ici intéressants en raison de l’approchecompréhensive de ce travail. Or comme le notent Gilles Pinson et Valérie Sala Pala : Dans la démarche compréhensive, l’objectif du chercheur n’est pas – tout du moins dans une première phase de l’enquête – de rechercher la vérité des pratiques et représentations, de chercher à savoir si les acteurs disent la vérité ou pas, mais de comprendre pourquoi ce qu’ils disent est vérité48. En effet, selon Jean-Claude Kaufmann, « la compréhension de la personne n’est qu’uninstrument : le but est l’explication compréhensive du social49 ». C’est bien dans cette approcheque s’inscrit notre recherche : comprendre la vérité des principaux promoteurs du data-journalisme afin d’en discerner les promesses. Mais il s’agit aussi de reconnaître les limites d’unetelle méthode, en particulier le caractère un peu artificiel de l’information recueillie,nécessairement « provoquée » par l’enquêteur. La stratégie adoptée a été de reprendre dès quepossible le vocabulaire des acteurs dans la formulation des questions, afin de limiter le« conditionnement » des réponses. Une certaine honnêteté intellectuelle force cependant àconfesser que l’exercice n’est pas aisé : il est souvent tentant de faire dire à l’enquêté ce que l’onsouhaite qu’il dise, que cela soit - parfois - conscient, ou – souvent - inconscient. C’est la raisonpour laquelle, la méthode de l’entretien semi-directif a été articulée avec les précédentes. Trois entretiens ont été réalisés par nos soins. Le premier avec Caroline Goulard, 25 ans,diplômée en management des médias (IEP Rennes), formée au management des nouvellestechnologies (HEC / Telecom), co-fondatrice de la start-up de « visualisation interactive dedonnées » Dataveyes, et figure clé du data-journalisme en France50. Le deuxième avec PierreRomera, 23 ans, développeur, hacker, passé au pôle data-journalisme d’OWNI, fondateur de lastart-up Journalism++ avec son collègue Nicolas Kayser-Bril, et intervenant dans les écoles dejournalisme (ESJ Lille, CFPJ, IEP Paris). Le troisième, téléphonique, avec Jean-Christophe48 PINSON, SALA PALA, Art. cit.49 KAUFMANN, Jean-Claude, L’entretien compréhensif, Paris, Nathan, 1996, p. 16.50 « LA spécialiste française » même, aux dires d’Eric Mettout. Voir : METTOUT, Art. cit. 13
  14. 14. Féraud, journaliste économique et technologique, passé par La Tribune, l’Expansion et les Echos,aujourd’hui à Libération. « Journaliste gonzo, Twitter Addict, blogueur erratique, digitalien,Punk avec un futur51 » selon ses propres termes, il s’est fait remarquer par un billet remonté àl’encontre du data-journalisme52. Trois autres entretiens ont été mobilisés occasionnellement afin de dresser un tableaucomplet du data-journalisme en France. Deux sont tirés du mémoire de 4e année de MarlèneQuintard53, étudiante en journalisme au CELSA. Il s’agit de Karen Bastien, ancienne journaliste àLibération, fondatrice de la start-up de visualisation de données We Do Data ; ainsi que JohanHufnagel, journaliste web à Libération, Marianne et 20 Minutes, aujourd’hui co-fondateur etrédacteur en chef de Slate.fr. Enfin, un dernier réalisé par Yannick Estienne, chercheur en SIC àl’ESJ Lille, en la personne de Jean-Marc Manach54. Hacker, journaliste d’investigation passé auMonde Diplomatique, au Canard Enchaîné, à France Inter, France 5 et Internet Actu, il estaujourd’hui blogueur pour Le Monde et journaliste à OWNI, intervenant dans les écoles dejournalisme (ESJ Lille, CFPJ, IEP Paris). Manque à ce panel un entretien avec Nicolas Kayser-Bril. Âgé de 25 ans, formé enéconomie des médias (IEP Lille), directeur du « pôle datajournalisme » à OWNI avant de fonderJournalism++, c’est la deuxième figure clé du data-journalisme en France55. Deux explications àce manque : le fait qu’il réside désormais à Berlin, et le risque de faire redondance avec soncollègue Pierre Romera, avec qui il travaille depuis plus de deux ans. À défaut d’entretiencompréhensif, nous nous contenterons donc de ses nombreuses prises de parole dans les médias.51 Présentation de Jean-Christophe Féraud sur : http://monecranradar.blogspot.fr/ (consulté le 31 août 2012)52 FERAUD, Opcit.53 QUINTARD, Marlène, Le datajournalisme, un nouveau genre journalistique. Ou comment rendre accessible unebase de données complexe, Mémoire de master 1 en Journalisme, CELSA, 2012.54 ESTIENNE, Yannick, « Evolution des pratiques journalistiques sur Internet : journalisme “augmenté”, datajournalism et journalisme hacker (entretien avec Jean-Marc Manach) », Les Cahiers du journalisme, Vol. 22/23,Automne 2011, pp. 134-143.55 « un des grands spécialistes » pour Flavien Chantrel, fondateur du Blog du Modérateur. Voir : CHANTREL,Flavien, « Le data-journalisme, enjeux et perspectives : interview de Nicolas Kayser-Bril », Le blog du modérateur,[disponible en ligne], 18 mars 2011. 14
  15. 15. Hypothèses et annonce du plan Rappelons notre problématique : comment les promesses du data-journalisme s’articulent-elles avec les repères et imaginaires du journalisme professionnel ? La réponse se fera en troismouvements. Le premier tente de caractériser le data-journalisme. Il s’inscrit pour cela sous l’égide de lacatégorie descriptive de « trivialité56 », développée par Yves Jeanneret. L’hypothèse est quel’expression a été principalement « réquisitionnée57 » par des acteurs extérieurs au journalisme(hackers, acteurs économiques). Si les pratiques journalistiques auxquelles ils se réfèrent(traitement automatisé de données, visualisation de statistiques, récit non linéaire) ne sont pasnouvelles, le choix des signifiants – en particulier le terme « data » - leur confèrent une forteconnotation, autour de l’idée de richesse des données (métaphore du gisement) et d’une nécessitéà agir (une bannière « data » à rejoindre). Ce caractère injonctif est confirmé par l’analyse desdiscours de ces mêmes acteurs. À ce stade de la réflexion, l’origine des principaux acteurs dudata-journalisme soulève un premier point de tension entre data-journalisme et imaginaires dujournalisme professionnel. Le deuxième mouvement poursuit cette idée, en s’efforçant d’évaluer l’effectivité descritiques adressées par certains journalistes à un journalisme centré sur le traitement de donnéeschiffrées (prétention objectiviste, robotisation de la profession). Il y est démontré que malgrécertaines tentations objectivistes indéniables, véhiculées par un amalgame fait / donnée, lespromoteurs du data-journalisme sont conscients de la subjectivité de l’élaboration des données,La médiation humaine est revendiquée, afin que le traitement et la narration des données soientfaits par un professionnel maîtrisant la statistique et le récit journalistique : le data-journaliste.Les imaginaires liés à « l’ordre du discours » et aux pratiques journalistiques sont donc réalisésdans ces discours d’escorte. La conclusion de ce mouvement porterait à considérer le data-journalisme se renforce d’une proximité avec les imaginaires du journalisme professionnel.56 JEANNERET, Yves, Penser la trivialité. Volume 1 : La vie triviale des êtres culturels, Hermès-Lavoisier, coll.« Communication, médiation et construits sociaux », 2008, 266 p.57 LABELLE, Sarah, « “La société de l’information” : Formule, récit et réquisition », in CHOUTEAU, Marianne etNGUYEN, Céline (dir.), Mises en récit de la technique, Éditions des Archives Contemporaines, 2011, pp. 33-44 15
  16. 16. Le troisième temps, centré sur le projet politique de « rénovation » du journalisme porté parles tenants du data-journalisme, mettra en exergue les altérités entre ces deux blocs théoriques. Sicertaines convergences se font autour de l’actualisation de la figure démocratique du « journalistejusticier58 », les autres propositions mettent à mal les repères du journalisme professionnel. Dansle rôle social du journalisme d’abord : par l’individualisation de l’interprétation des réalisationsjournalistiques, les dispositifs de data-journalisme favorisent la figure de l’ « individu rationnel »,maximisant ses intérêts au détriment du reste de la collectivité. Dans l’autorité de la figure dujournaliste ensuite : en militant pour une mythique organisation horizontale de la société, lespromoteurs du data-journalisme veulent faire du journaliste un chef de projet, maillon parmid’autres, et comme les autres, dans la production de l’information.58 LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du journalisme justicierdans la France contemporaine », Quaderni, n° 45, 2001, pp. 53-68. 16
  17. 17. I. Le data-journalisme comme action collective « The only new thing in the world is the history you don’t know59. » Harry S. Truman La « trivialité » selon Yves Jeanneret ne doit pas s’entendre au sens courant –« commun », « rebattu », « facile » -, mais au sens étymologique, du latin trivium, « carrefour dequatre voies60 ». C’est un endroit de circulation, où l’on choisit le chemin à suivre. Appliqué àl’étude du social, le terme devient concept, et désigne un monde en mouvement, où « les objetsculturels circulent et sont réinvestis en permanence par les acteurs qui les utilisent61 ». Lorsque l’on veut caractériser le data-journalisme, l’idée de trivialité éclaire les limitesd’une approche essentialiste (A), qui décrit des objets stables, universels, atemporels. Le conceptest également d’une aide précieuse pour se concentrer sur les acteurs – non journalistes la plupart- qui utilisent l’expression « data-journalisme » et l’investissent de sens (B). Enfin, il permetd’étudier les connotations du signifiant « data », faux synonyme de « donnée » aux richespromesses, utilisé comme bannière par des acteurs économiques émergents (C).59 MILLER, Merle, Plain speaking : an oral biography of Harry S. Truman, Berkeley Publishing Corporation, 1974,p. 26.60 JEANNERET, Yves, « Figures politiques de la trivialité : le symbolique, le populaire, et le public », in Économiepolitique de la trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 11octobre 2011.61 JEANNERET, Yves, Penser la trivialité, Op. cit., p. 16. 17
  18. 18. A. Des signifiés multiples : l’impossible approche essentialiste Les entretiens conduits et l’analyse de discours ont permis de recueillir une grande variétéde définitions du data-journalisme. Nous les avons regroupées en deux catégories : les approches« disciplinaires » (1) et les approches « culinaires » (2). Devant cette diversité de définitions,parfois contradictoires, il semble impossible de trouver un référent au data-journalisme. Toutjuste peut-on construire un idéal-type, par définition insatisfaisant (3).1. Les approches « disciplinaires » Ces approches situent le journalisme en relation – d’assimilation, d’inclusion oud’exclusion – avec des disciplines supposées clairement identifiées, insistant ainsi sur lacontinuité avec des pratiques antérieures. Selon Pierre Romera, le data-journalisme recouvre« toutes les manières de faire du journalisme innovant62 » ; définition confirmée lorsqu’il évoquesa « start-up » : « j’ai fondé Journalism++, société spécialisée dans le data-journalisme (…)mais au sens large. On parle vraiment d’aider les médias à innover63 ». Pour son collègueNicolas Kayser-Bril, ce serait plutôt un synonyme de « journalisme digital64 », soit toutes lespossibilités pour faire du journalisme en ligne : C’est la réponse technologique à [l’arrivée d’internet] en disant : on a un nouveau canal, des nouveaux outils, des nouveaux métiers qui apparaissent, on va les utiliser pour faire du journalisme aussi. (…). On peut faire ça avec de la donnée, la dimension masse de données est extrêmement importante, mais on peut faire ça aussi avec d’autres moyens65. D’autres vont définir le terme par le regroupement de plusieurs disciplines. Les « datajournalism awards »66 présentent ainsi trois catégories de prix : « data-driven investigations »,« data visualisation and storytelling », « data driven applications », signifiant par là qu’il s’agit62 Entretien avec Pierre Romera (annexe 2)63 Ibid.64 C’est d’ailleurs le reproche que fait Caroline Goulard à cette définition quelques minutes plus tard.65 Intervention dans : PORTE (DE LA), Xavier, « Le “data-journalisme” ou comment faire du journalisme avec lesdonnées », France Culture, Place de la Toile, [disponible en ligne], diffusée le 14 novembre 2010.66 Lancés cette année par le GEN (Global Editor Network), en partenariat avec l’EJC (European Journalism Center)et Google, ils récompensent les réalisations de data-journalisme les plus réussies. Voir :http://datajournalismawards.org/ (consulté le 31 août 2012) 18
  19. 19. de sous-catégories du data-journalisme. Dans un commentaire à son propre article, CarolineGoulard le situe « dans des courants comme le web sémantique, l’ouverture des donnéespubliques, la visualisation de la complexité, la structuration de données67 ». Pierre Romera a unraisonnement similaire lorsque, plus tard dans l’entretien, il affine sa définition : Si tu veux, moi j’ai tendance à prendre le data-journalisme, et à mettre dedans : “journalisme hacker”, qui est une discipline à part entière ; “visualisation de données”, parce que c’est aussi quelque chose qui a ses codes, ses règles, avec des méthodos très particulières ; “crowdsourcing68”, c’est l’exemple que je t’ai donné avec le Guardian et les notes de frais ; et il y en a un quatrième… (silence) Oui voilà c’est tout ce dont je te parle, tout ce qui a trait à la “sécurité”, à la maîtrise de l’outil informatique69. Enfin, certains vont avoir des définitions restrictives, situant le data-journalisme aucroisement de plusieurs pratiques. Aux dires de Sylvain Parasie, le data-journaliste serait ainsi unprofil hybride entre journaliste et développeur. C’est le sens de ses articles sur la construction dela figure du « journaliste-programmeur » ou « journaliste “hacker” »70. Pour Caroline Goulard etBenoît Vidal, instigateurs du projet étudiant ActuVisu sur le data-journalisme, puis de la « start-up » Dataveyes, l’essence de data-journalisme serait plutôt à trouver au croisement de troisdisciplines - le développement, le journalisme et le design -, comme en témoigne ce visuel. Figure 1 : Image tirée de la présentation d’ActuVisu le 1 e juillet 2010, lors du « Café Data » organisé par le Social Media Club France à la Cantine, sur le thème du « Datajournalism ».67 En commentaire de : GOULARD, Caroline, « Ce qu’aurait pu être le Sarkomètre du Nouvel Obs », OWNI,[disponible en ligne], 10 février 2010.68 Le « crowdsourcing », « approvisionnement par la foule » en français, désigne le phénomène d’externalisationd’une tâche à un grand nombre de personnes.69 Entretien avec Pierre Romera (annexe 2)70 DAGIRAL, Eric et PARASIE, Sylvain, « Portrait du journaliste en programmeur : l’émergence d’une figure dejournaliste “hacker” », Les Cahiers du Journalisme, n° 22/23, 2011, pp. 144-155. 19
  20. 20. 2. Les approches « culinaires » Ces approches ont été nommées ainsi car, pour filer la métaphore culinaire, ellesdéfinissent le data-journalisme à partir de sa « cuisine », c’est-à-dire le travail de transformationd’une matière première – « les ingrédients » – en un produit fini – « le mets » - , après avoir suiviun processus de traitement– « la cuisine ». En décrivant un processus singulier, ces approchesinsistent sur la nouveauté du data-journalisme. Beaucoup d’acteurs partent ainsi de « l’ingrédient principal », en l’occurrence la donnée,pour caractériser le data-journalisme. Selon Karen Bastien, co-fondatrice de la « start-up » devisualisation de données We do data, « [la] matière première, au lieu d’être des heures de rushsde bandes son, des interviews ou du reportage terrain, va être de la “data”71 ». Et Jean-MarcManach de confirmer : « au lieu de faire de l’investigation avec des témoins, des sources, des“gorges profondes”, on va faire de l’investigation avec les données 72 ». Pour pouvoir êtretraitées, ces données doivent être structurées et permettre une lecture automatisée 73 . Ellesnécessitent même, de l’avis de Caroline Goulard, une certaine complexité pour « mériter »l’appellation « data-journalisme » : Quand OWNI fait une carte interactive où tu peux cliquer sur les régions et il y a une petite info- bulle, avec un texte, une photo et une mini vidéo, ok… La base de données derrière elle doit faire vingt lignes à tout casser : c’est pas vraiment ce que j’appelle du data-journalisme74. Certains prennent la position opposée et définissent le journalisme de données à partir du« mets ». Olivier Tredan, doctorant en SIC, estime ainsi que le data-journalisme « se singulariseavant tout par la médiation d’une interface web75 ». Karen Bastien ajoute que la réalisation dedata-journalisme répond d’une esthétique propre : « il faut mettre une couche de design etd’interface qui vont faire que l’objet chiffré va devenir intéressant, ludique. C’est71 Entretien avec Karen Bastien (annexe 4)72 Entretien avec Jean-Marc Manach (annexe 6), in ESTIENNE, Art. cit., p. 13573 KAYSER-BRIL, Nicolas, « On l’a pas en format ordinateur », ActuVisu, [disponible en ligne], 15 décembre 2009.74 Entretien avec Caroline Goulard (annexe 1)75 C’est peut-être là la principale différence entre les deux exemples introductifs de ce mémoire. Voir : TREDAN,Olivier, « Quand le journalisme se saisit du web : l’exemple du datajournalism », in 1e colloque international – LesMutations structurelles du journalisme, [disponible en ligne], Organisé par l’Université de Brasilia, Brasilia, 25-28avril 2011, p. 2. 20
  21. 21. indispensable.76 ». On perçoit dans cette approche l’idée d’ « interactivité » : pour Alain Joannès« une visualisation labellisée data journalism doit être interactive77 ». Ce terme est entenducomme récit non-linéaire, faisant croire à l’utilisateur que c’est lui qui suscite les contenus78. PourJohan Hufnagel, une telle personnalisation de la navigation serait parée de vertus pédagogiques : En bâtissant des interfaces graphiques pour accéder aux bases de données, le journalisme de données (...) offre aussi à l’usager la possibilité d’interroger n’importe quelle partie de cette base de données, de la rendre accessible et compréhensible instantanément : choix du zoom, délimitation de la zone géographique, sélection des dimensions comparées, personnalisation des critères de visualisation.79 Finalement, d’autres acteurs préfèrent une approche par la « cuisine », le processus detransformation en quelque sorte. Aux dires du même Johan Hufnagel, le data-journalisme secaractériserait par « du recueil et de la vérification de données, du récit, de la mise en forme80 » ;et de poursuivre « tout cela fait partie du travail journalistique81 ». Le propre de ce genre serait àtrouver entre « l’ingrédient » et « le mets », dans l’angle donné au sujet : « on n’est pas dans laproduction d’objet où l’on ferait juste des interfaces pour des bases de données, on raconte autrechose82 ». Dans cette approche, comme dans celle par l’« ingrédient », le « mets » importe peu : Le journalisme hacker, ce sont des processus plus ou moins automatisés et du bricolage, pour aller récupérer de la donnée. Après ce [que Jean-Marc Manach] en fait ça ne va pas forcément être un graphique interactif, ça pas forcément être une “app”, ça va être tout simplement un article, où il exploite ces données, et ça il peut le faire aussi bien sur papier que sur le web. Et pourtant ça c’est du data- journalisme83. On se trouve dans une situation marquée par une multiplicité de définitions, certainesétant même contradictoires, sur l’importance du rendu final notamment. Cela rend difficilel’établissement d’un idéal-type satisfaisant.76 Entretien avec Karen Bastien (annexe 4)77 JOANNÈS, Alain, Data journalism. Bases de données et visualisation de l’information, Éditions du CFPJ,Décembre 2010, p. 90.78 MITROPOULOU, Eléni, Médias, multimédia et interactivité : jeux de rôle et enjeux sémiotiques. Thèse dedoctorat en sémiotique, Université de Limoges, 2007.79 GOULARD, Caroline, « Journalisme de données », Art. cit.80 Entretien avec Johan Hufnagel (annexe 5)81 Ibid.82 Entretien avec Karen Bastien (annexe 4)83 Entretien avec Pierre Romera (annexe 2) 21
  22. 22. 3. Des idéaux-types insatisfaisants Ces deux grands types d’approche résultent d’un travail de typologie, mais on pourraitencore multiplier les définitions. Dans une démarche de transparence, le blog militant Uppecultdéfinit « le data-journalisme [comme] le fait de contredire (ou d’approuver) les croyances ou lesdiscours en s’appuyant sur des faits chiffrés.84 ». Dans une approche plus managériale, CarolineGoulard estime que « le journalisme de données, c’est avant tout une transformation del’organisation85 ». Finalement, il semble impossible d’arriver à une définition satisfaisante dansle « système référentiel » (ce à quoi réfère un terme) de l’approche ontologique. La confession dePierre Romera est sur ce point éclairante : Nicolas c’est mon associé aujourd’hui et toutes les trois semaines on essaie de trouver la bonne “baseline” pour notre boîte. En gros on cherche une nouvelle définition au data-journalisme, un truc qui corresponde vraiment à ce qu’on fait, et qui soit pérenne, qui survive un peu au “buzzword”86. Une solution consiste cependant à rechercher un idéal-type, au sens wébérien. Se fondantsur le hiatus irrationalis, ou postulat d’incomplétude, Weber affirme que « la réalité estirréductible au concept 87 », qu’elle est si complexe qu’aucune théorie ne peut l’épuiser.Cependant, cela n’empêche pas de définir des concepts hypothétiques – des idéaux-types –, àcomparer avec la réalité du phénomène social étudié. Transporté à la linguistique, ce concepts’avère fécond : si aucun terme ne peut englober l’intégralité d’une idée, il est possible construiredes modèles, relativement exhaustifs, se rapprochant de la vision que les acteurs s’en font. Trois travaux de recherche, entendue au sens large, peuvent être mobilisés en ce sens.Celui d’ActuVisu d’abord, projet étudiant au long-cours, dont les conclusions sont symboliséespar l’image présentée plus haut : une discipline au croisement du journalisme, du développementet du design. En entretien, Caroline Goulard précise que la « data visualisation » implique de« mobiliser de l’infographie interactive88 ». Celui de Marlène Quintard ensuite, qui, dans sonmémoire, donne cinq éléments de définition : « un travail journalistique », « un travail84 BADOUARD, Thibault, « Introduction au data-journalisme », Uppercult, [disponible en ligne], 27 février 2012.85 Entretien avec Caroline Goulard (annexe 1)86 Entretien avec Pierre Romera (annexe 2)87 GONTHIER, Frédéric, « Weber et la notion de « compréhension », Cahiers internationaux de sociologie, n°116,2004, pp. 35-54.88 Entretien avec Caroline Goulard (annexe 1) 22
  23. 23. collectif », « des références », « la donnée comme matière première », « la visualisation etl’interactivité »89. Enfin, celui d’Olivier Tredan, qui caractérise le journalisme de données comme« une pratique fondée sur le recueil, lanalyse statistique, la visualisation de données sur Internetet leur traitement journalistique90 ». Dans chacune de ces définitions, les trois éléments des« approches culinaires » reviennent en filigrane : les bases des données comme matièrespremières (« l’ingrédient principal »), une pratique journalistique (« la cuisine ») et une interfaceweb de visualisation des données, non linéaire (« le mets »), formant ainsi un idéal-type du data-journalisme. Cette multiplicité de définitions du data-journalisme, et la difficulté à élaborer un idéal-type satisfaisant montrent bien les limites d’une approche essentialiste. Comme le suggère lecadre descriptif de la trivialité, il semble plus pertinent de tenir une démarche socio-historique, ets’intéresser au type d’acteurs qui investissent l’expression de sens.B. Une expression investie et promue par des acteurs extérieurs au journalisme Il est marquant d’observer qu’à quelques exceptions près – Simon Rogers en Grande-Bretagne ou Aaron Pilhofer aux Etats-Unis - les principaux promoteurs du journalisme dedonnées n’ont pas reçu de formation en journalisme. Effectivement, la « naissance différentielle »du data-journalisme s’est faite aux Etats-Unis sous l’impulsion de « programmeurs autodidactes,entrepreneurs du web, gestionnaires de projets web, programmeurs engagés dans lescommunautés du logiciel libre ou militants de l’open data 91 », mais rarement journalistesprofessionnels. Dans le cas français, le constat est comparable, mais les acteurs diffèrent : le terme a été« réquisitionné » principalement par des entrepreneurs du web, et non des développeurs (1). Ceconcept de « réquisition » permet d’ailleurs d’observer deux traits caractéristiques du data-journalisme : une prétention abusive à la nouveauté (2) ainsi qu’une injonction à agir (3).89 QUINTARD, Marlène, Op. cit., pp. 14-15.90 TREDAN, Olivier, Art. cit., p. 1.91 PARASIE, Art. cit., p. 3. 23
  24. 24. 1. En France, une « réquisition » par des entrepreneurs web Sur le web français, le tout premier article92 traitant du journalisme de données estpourtant le fait d’un journaliste professionnel : Fabrice Gonthier - formé à l’IJBA, journalistelocal, et intervenant « multimédia » en écoles de journalisme (ESJ Lille puis CFPJ) -, quis’entretient sur son blog 93 avec Nicolas Kayser-Bril. Les terminologies utilisées sont alors« database journalism » et sa traduction française littérale « journalisme de base de données ». Lepost est repris dans l’article de veille hebdomadaire du site InternetActu94, sous la catégorie« données publiques », signe que le data-journalisme ne jouit pas encore d’une existence propreen France. Deux autres exemples soutiennent cette thèse. En mars 2008, Jean-Marc Manachévoque la campagne « free our data » lancée par le Guardian, sans évoquer aucun des signifiantsutilisés pour caractériser le data-journalisme. Dans son mémoire de recherche de master 1, rédigédurant l’été 2009, Caroline Goulard n’utilise aucune des terminologies non plus, alors qu’unpassage fait explicitement référence aux bases de données : Internet abolit les longueurs imposées par les maquettes de la presse papier, incite à écrire des articles plus courts mais autorise en revanche la publication des textes intégraux d’interviews, d’infographies interactives, de bases de données ou de documents de travail.95. En juillet 2009 toujours, un second article – intitulé « Pour un journalisme de données » -,est publié sur le tout jeune magazine en ligne, Slate96. Il est l’œuvre de Nicolas Vambremeersh,ancien blogueur politique, et dirigeant d’une agence de communication digitale, Spintank.Jusqu’en mars 2010 pourtant, la terminologie est hésitante entre « database journalism » et « datajournalism » ; en témoignent le blog lancé par Caroline Goulard97 ou l’utilisation des mots-clés92 Pour déterminer les premiers articles traitant du sujet, il a été utilisé la requête « daterange: » du moteur derecherche Google, qui permet de chercher des contenus publiés entre deux dates précises. Il est néanmoins possibleque des articles antérieurs aient été dé-publiés ou soient inaccessibles, comme le blog de Nicolas Kayser-Bril,« Window on the Media ».93 GONTIER, Fabrice, « Database journalism : “un renversement de perspective” (itw) », Esprit Blog, [disponible enligne], 4 juillet 2009.94 « A lire ailleurs du 22 juin au 9 juillet », InternetActu, [disponible en ligne], 10 juillet 2009.95 GOULARD, Caroline. Mutations des entreprises de presse liées au développement de leurs activités numériques.Mémoire de master 1 en Management des organisations, Sciences Po Rennes, 2009, p. 49.96 VAMBREMEERSH, Art. cit.97 http://databasejournalism.wordpress.com/, lancé le 1 novembre 2009, consulté le 31 août 2012. 24
  25. 25. dans les articles d’OWNI98. Le mouvement se développe alors autour de deux pôles : ActuVisu,projet de visualisation de l’information porté par des étudiants de l’IEP de Rennes et de l’HETIC,lancé en avril 2010, et représenté par Caroline Goulard ; et OWNI, qui commence à publier desarticles sur le sujet. Une convergence se fait même au sein d’OWNI entre mars et août 2010, à lafaveur du lancement du « pôle datajournalisme », dirigé par Nicolas Kayser-Brill 99 ; avantqu’ActuVisu ne quitte définitivement OWNI - non sans quelques frictions - au moment dulancement de Dataveyes,. Nicolas Kayser-Brill partira lui aussi en octobre 2011, pour fonderJournalism++ avec Pierre Romera. Il semblerait que ce soit durant ce court moment deconvergence que la terminologie se stabilise sur « data journalism » - malgré quelques hésitationsorthographiques persistantes (cf. infra) -, et son pendant français de « journalisme de données ».Ce sont en tout cas ces deux expressions reprises par les médias pour décrire le phénomène100. Les recherches de Sarah Labelle sur « la société de l’information » sont éclairantes pourcomprendre le processus d’autonomisation du data-journalisme. Comme « société del’information », « fracture numérique » ou « développement durable101 », un terme émerge, puiss’impose, sans avoir de signification précise. Le terme est alors « réquisitionné » par un certainnombre d’acteurs – dans le cas du data-journalisme : des hackers aux Etats-Unis, desentrepreneurs du web en France -, utilisé massivement, le rendant ainsi, « incontournable ». À l’instar de « la société de l’information » (Labelle, 2001), plus qu’un matériau idéologique ordinaire, c’est un signe écrit global qui s’apparente, comme la marque, à un nom de baptême pour tout un univers (Peninou, 1971) Nous sommes dans le régime de l’“incontournable”. L’inscription est omniprésente (…) Dans cet univers de réquisition (Labelle, 2007), il est moins coûteux pour tous, militant qui défend une cause ou équipe qui engage une recherche, de prétendre œuvrer pour un réel développement durable et pour la vraie société de l’information, que de remettre en cause ces catégories102. La mobilisation de ce concept aide à penser deux caractéristiques du data-journalisme : laprétention, abusive, à une nouveauté radicale dans les pratiques journalistiques, ainsi qu’uneinjonction à l’action, qui masque en réalité ce flou sémantique.98 De septembre 2009 à mars 2010, sont utilisés indifféremment les mots clés « database journalism » et « datajournalism » pour qualifier les articles, avant que ce dernier ne devienne la norme.99 GOULARD, Caroline, « La fabrique du data-journalisme », OWNI, [disponible en ligne], 20 mars 2010 ; ouKAYSER-BRIL, Nicolas, « La fabrique du data #2 », OWNI, [disponible en ligne], 25 mai 2010.100 FANEN, Sophian, « Les journalistes à data sur les données », Libération, [disponible en ligne], 3 janvier 2012.101 JEANNERET, Yves, « L’optique du sustainable : territoires médiatisés et savoirs visibles », Questions decommunication, n°17, 2010, pp. 59-80.102 Ibid. p. 60. 25
  26. 26. 2. Une prétention abusive à la nouveauté C’est le propre d’une expression « réquisitionnée » : pour justifier son utilisation courante,il faut considérer que tout ce qui se faisait auparavant était peut-être proche, mais d’une naturedifférente. Selon Philippe Breton il ne s’agit pas d’un phénomène conscient, mais de« cryptomnésie » : « nous identifions comme nouveau quelque-chose que nous connaissons déjàmais que nous avons oublié comme tel103 ». Pourtant si l’on se réfère à l’idéal-type complet dudata-journalisme, défini plus haut, aucun des éléments ne semble particulièrement novateur : letravail journalistique (la « cuisine »), n’est évidemment pas inédit, mais les deux autres élémentsnon plus. Ainsi, le traitement de bases de données à des fins journalistiques (« l’ingrédient ») étaitdéjà à l’œuvre dans les années 1960 aux Etats-Unis, avec le CAR (cf. supra). La filiation est 104d’ailleurs clairement assumée . En revanche, concernant l’interface de visualisation« interactive » (le « mets »), la tentation à faire « table rase » du passé est plus prégnante. Si nul ne prétend avoir « inventé » la visualisation de statistiques, il est intéressant à cepropos de noter l’apparition du terme « dataviz », diminutif de l’anglais « data visualization »,qui caractériserait « l’art d’organiser les données sous forme graphique 105 ». Signifiantintimement lié au data-journalisme par son préfixe commun, il suggère, par sa seule nouveauté,des réalisations graphiques inédites, sans doute plus créatives, plus esthétiques, plus pertinentes,en un mot plus abouties. Pourtant, les imaginaires créatifs – cartes de métro, lecture par flèches,nuages de mots – peuvent être assez redondants, et les formes graphiques – histogrammecirculaire, cartogramme, cosmographe – inventées il y a parfois plusieurs siècles. Deuxillustrations étayent ce propos. Premièrement, la tentative – humoristique mais signifiante - demise en abîme de la notion de « dataviz », par la « start-up » We Do Data (annexe 7)106.Deuxièmement, l’affiche de présentation d’un concours de « dataviz » organisé par Google àl’occasion des élections présidentielles françaises de 2012 (annexe 8)107.103 BRETON, Philippe, L’utopie de la communication : le mythe du « village planétaire », La Découverte, 2004,p.103.104 Entretiens avec Caroline Goulard (annexe 1) et Pierre Romera (annexe 2)105 GEVAUDAN, Camille, « Zoom sur 50 classiques de la “dataviz” », Ecrans, [disponible en ligne], 26 juin 2012.106 « La dataviz de la dataviz », réalisée à l’occasion de l’événement « Expoviz » (annexe 7)107 « Concours Google de dataviz » (annexe 8) 26
  27. 27. Michaël Friendly, psychologue et statisticien à l’Université de York au Canada, remet lareprésentation statistique dans une perspective historique de long terme108. Il montre que laplupart des inventions se sont faîtes au XIXe siècle, en particulier pendant sa seconde moitié,dans ce qu’il nomme un « âge doré109 » de la statistique graphique. Les figures clés de cemouvement sont Charles Minard (graphique à plusieurs variables, annexe 9 110 ), FlorenceNightingale (histogramme circulaire), Emile Levasseur (cartogramme), Emile Cheysson (carte enanamorphose) ou Francis Galton (concept de corrélation). Beaucoup de représentationscontemporaines répandues s’inspirent ainsi de ces inventions, parfois de manière frappante(annexes 10 et 11)111. Enfin, en ce qui concerne l’ « interactivité », les promesses de personnalisation de lanavigation ne sont pas si neuves non plus. Dans les années 1980, autour de l’ « invention » dulien hypertexte par Ted Nelson, l’image qui dominait était celle d’un « lecteur actif112 ». À ladifférence des livres traditionnels au récit linéaire, l’époque encensait le nœud, le lien,l’arborescence, le fragment ; autant de figures qui furent à la base du web tel qu’inventé par TimBerners-Lee en 1989. La promesse était celle d’un lecteur « libre », construisant son propreparcours à l’aide de grandes arborescences. Le succès des « romans dont vous êtes le héros »dans les années 1980 et 1990 en est emblématique113. Au sujet des sites d’information en ligne,John Knox observe cette « représentation idéologique » voulant que « l’internaute [puisse] seconstituer son propre chemin114 ». Il remarque pourtant que ce sont les éditeurs du site qui« déterminent le paradigme idéologique et le positionnement de chaque information à l’intérieur108 Voir son projet « Milestrones in the history of thematic cartography, statistical graphics, and data visualization »,accessible sur http://www.datavis.ca/milestones/ (consulté le 31 août 2012)109 FRIENDLY, Michael, « The golden age of statistical graphics », Statistical Science, Vol. 23, 2008, pp. 502-535.110 Voir notamment sa célèbre carte figurative des pertes de l’armée napoléonienne durant la campagne de Russie(annexe 9)111 A titre d’exemple, nous comparons en annexe 10 les représentations graphiques de Charles de Fourcroy (1782) etde Guardian (2011), et en annexe 11 les histogrammes circulaires de Florence Nightingale (1857) et d’ActuVisu(2010)112 JEANNERET, Yves, « Entre héritages et ruptures, la dynamique de l’obsolescence», in Économie politique de latrivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 8 novembre 2011.113 GANTIER, BOLKA, « L’expérience immersive du web documentaire : études de cas et pistes de réflexion », LesCahiers du journalisme, n° 22/23 – automne 2011, p. 127.114 DAGIRAL, Eric et PARASIE, Sylvain, « Presse en ligne : où en est la recherche ? », Réseaux, n° 160-161,2010/2, p. 23. 27
  28. 28. de celui-ci115 ». Encadré par les dispositifs techno-sémiotiques, le lecteur n’est donc pas si« libre » qu’il y paraît. En somme, aucun des éléments de l’idéal-type ne relève d’un changement de nature parrapport à des pratiques antérieures. Même en combinant les trois – donnée comme matièrepremière, travail journalistique, interface web de visualisation non-linéaire -, il existe desexemples antérieurs à l’apparition du terme « data-journalisme », les représentationsd’assemblées par groupes politiques après une élection par exemple, où l’utilisateur pouvaitnaviguer entre différents scrutins.3. Une injonction à agir Si les discours d’escorte des termes « réquisitionnés » réactualisent des promessesanciennes, ils sont également caractérisés par le mode de l’injonction : à l’instar du phénomèned’ « open data »116, on ne sait pas très bien ce que c’est, mais « il faut y aller ». Dans l’incapacitéde définir précisément l’objet, la rhétorique se fait impérative, et impose le terme en soulignant sanécessité. « Pour un journalisme de données117 », « Assez d’articles, on veut des contenus ! 118 » :les titres utilisant ce registre sont courants au moment où l’expression « data journalisme » faitson apparition en France. Le tableau ne serait pas complet sans mentionner le texte d’AdrianHolovaty « A fundamental way newspapers need to change119 », écrit en 2006, et considéré parbeaucoup de commentateurs comme le « manifeste » du data-journalisme, soit le texte fondateurd’un mouvement.115 KNOX, John, « Visual-verbal communication on online newspaper home pages », Visual communication, vol.6(1), 2007, p. 47. Cité et traduit in : DAGIRAL, PARASIE, Ibid.116 L’injonction est même plus forte encore dans le cas de l’open data, le signifiant « open » étant conjugué impératif.Voir GOETA, Samuel, Open data : qu’ouvre-t-on avec les données publiques ?, Mémoire de master 2 en Sciences del’Information et de la Communication, CELSA, 2011, pp. 10-11.117 VAMBREMEERSCH, Art. cit.118 GOULARD, Caroline, « Assez d’articles, on veut des contenus ! », OWNI, [disponible en ligne], 17 novembre2009 ; reproduction de l’article originel GOULARD, Caroline, « Le database journalism pour nous sauver du“frogboiling” », Database journalism, [disponible en ligne], 10 novembre 2009.119 HOLOVATY, Adrian, Art. cit. 28
  29. 29. La filiation suggérée par le terme est pertinente ici : tout comme le mouvement du logiciellibre, regroupé autour de la « figure emblématique120 » de Richard Stallman et du projet GNU, onpeut dire que le mouvement du data-journalisme s’est organisé autour d’une personne - AdrianHolovaty – et de son texte de 2006. L’article de Caroline Goulard, renommé par OWNI « assezd’articles, on veut des contenus ! », paraphrasant ainsi la dernière phrase, était initialementintitulé « le database journalism pour nous sauver du frogboiling 121 ». Or ce titre, en plusd’utiliser le registre de la salvation, fait explicitement référence à l’argumentaire d’AdrianHolovaty dans son « manifeste ». Par cette répétition de l’argumentaire, les militants français sefont « apôtres122 », diffusant la « parole122 » du data-journalisme. La métaphore religieuse estd’ailleurs très présente dans les discours d’accompagnement : on ne compte plus les « pape123 »,« bible124 » ou « voies125 » en matière de data-journalisme. Le rapport sacré au data-journalisme est doublé d’une prétention d’inéluctabilité. Danscette vision, rien de sert de lutter : le journalisme de données représente « l’avenir en marche126 ».La question n’est plus de discuter l’opportunité pour les rédactions de lancer des projets danscette direction, mais de se demander « pourquoi les médias français se s’y mettent pas127 », alorsque « quelques grands exemples anglo-saxons ont clairement montré la voie 128 ». Beaucoupd’articles sur le sujet dissertent ainsi autour du supposé « retard129 » de la France par rapport à cespays. Ce type de discours d’accompagnement a été mis en perspective par les travaux de Julie120 PROULX, Serge, « Les militants du code : la construction d’une culture technique alternative », in Le logiciellibre en tant que modèle d’innovation socio-technique. Pratique et développement de coopération dans lescommunautés, [disponible en ligne], Congrès de l’ACFAS, Université Mc Gill, Montréal, 16 mai 2006, p. 3.121 Le « frogboiling » correspond à une légende selon laquelle si une grenouille entre dans une casserole d’eaubouillante, elle en sort immédiatement, consciente du danger. En revanche, si cette même grenouille rentre dans unecasserole d’eau froide chauffée progressivement, elle ne sortira jamais et mourra de chaleur. Par analogie, oncomprend que le journalisme traditionnel ne s’intéresserait qu’aux événements extraordinaires – un incendie mortelpar exemple -, alors que le journalisme de données mettrait en perspective sur du long terme – disons les coupuresbudgétaires chez les pompiers -, jouant le rôle de lanceur d’alerte en cas de dégradation avancée d’une situation.122 ROMERA, Pierre, « Le data-journalism notre religion », OWNI, [disponible en ligne], 30 août 2011.123 FANEN, « Le journalisme à data sur les données », Art. cit.124 LEDUC, Caroline, « Le data journalisme a désormais sa bible », Journalismes, [disponible en ligne], 5 décembre2010.125 GOULARD, Caroline, « Les quatre voies du datajournalism », OWNI, [disponible en ligne], 7 avril 2010.126 METTOUT, Art. cit.127 GOULARD, Caroline, « Data journalism : pourquoi les médias français ne s’y mettent pas ? », OWNI, [disponibleen ligne], 8 mars 2010.128 Entretien avec Caroline Goulard (annexe 1)129 CASTELLI, Elodie, « Le data-journalisme peine à se développer en France », Journalismes, [disponible enligne], le 24 janvier 2010. 29
  30. 30. Bouchard sur « le retard français130 ». Elle montre que ces discours sont fondés sur l’angoisse etqu’ils ne peuvent être remis en cause : lorsque l’on est dans l’urgence il est trop tard pourréfléchir. Derrière, on perçoit un discours de type consultant, qui essaie de vendre un produit à undirigeant, pour « ne pas être à la traîne ». Une mise en perspective stimulante dès lors que lesprincipaux promoteurs français sont aujourd’hui dirigeants de « start-up ». La mobilisation du concept de « réquisition » a permis de porter notre attention sur lesacteurs de ce que l’on peut désormais appeler le « mouvement » du data-journalisme, dans unedimension socio-historique et communicationnelle. Dans une approche en termes de trivialité, ilconvient désormais de s’attacher plus en détail les des connotations signifiants choisis pourévoquer le data-journalisme.C. Une dé-ontologie du data-journalisme : les riches connotations du mot « data » Peut être encore plus que pour le « journalisme » (cf. supra), réaliser une « dé-ontologie 131 » du « data-journalisme », et donc se concentrer sur les signifiants, s’avèreindispensable à l’analyse. En étudiant les médias informatisés, Yves Jeanneret remarque ainsi que« le discours (…) est présent d’emblée dans la désignation des objets qu’il est censéaccompagner », dans la mesure où « limaginaire contenu dans les mots et les images faitdavantage quaccompagner les objets, il les constitue132 ». En partant de ce postulat, on remarque que les terminologies utilisées en France pourdésigner le data-journalisme sont fortement connotées. A l’inverse des expressions utiliséesoutre-Atlantique, elles orientent le regard sur les données (1), et suggèrent dans le même tempsun sentiment de multitude, de foisonnement (2) ainsi que l’appartenance à un mouvement pluslarge, regroupé sous une bannière « data » (3).130 BOUCHARD, Julie, Comment le retard vient aux Français. Analyse d’un discours sur la recherche, l’innovationet la compétitivité 1940-1970, Septentrion, 2008, 328 p.131 RASTIER, Art. cit.132 JEANNERET, Yves, « Autre chose qu’un discours, davantage qu’un accompagnement, mieux qu’unerésistance », in La communication entre libéralisme et démocratie, Terminal, n° 75, été 2011, L’Harmattan, pp. 107-117. 30
  31. 31. 1. La « data » au cœur de la terminologie française Les expressions employées pour qualifier le data-journalisme sont extrêmementnombreuses : « data journalism », bien sûr, mais également « database journalism », « hacker 133journalism » et leurs déclinaisons françaises respectives , ainsi que « data-drivenjournalism134 », « computational journalism 135 », ou encore « programmer-journalism 136». Cesdifférentes terminologies partagent beaucoup de références et de pratiques mais « ne mettent pasexactement l’accent sur les mêmes éléments137 ». Certaines mettent ainsi l’accent sur les outilsutilisés. C’est le cas de « computational journalism », qui insiste le rôle de l’informatique, maiségalement « data-driven journalism » par une référence aux logiciels de traitement de données : "Data driven” était plus intéressant par rapport aux technos notamment. Par exemple en visualisation de données, on utilise beaucoup une librairie en Javascript qui s’appelle D3js pour “data driven documents”, donc “data driven documents”, “data driven journalism” : je pense que ce n’est pas anodin138. Mais le plus marquant est l’opposition entre les terminologies utilisées uniquement dansle monde anglo-saxon – « programmer journalism » et « hacker journalism » -, et cellesplébiscitées en France – « database journalism » puis « data journalism », ainsi que leurstraductions littérales. Les premières insistent sur « une figure d’acteurs étrangère aux salles derédactions139 », mettant en exergue le brouillage des identités professionnelles du métier dejournaliste. Les secondes mettent au contraire l’accent sur les données, faisant miroiter lesperspectives journalistiques – entendu ici au sens de pratiques propres - d’un champ encorerelativement vierge.133 PARASIE, Art. cit.134 DAGIRAL, Eric et PARASIE, Sylvain, « Data-driven journalism and the public good : “Computer AssistedReporters and “programmer-journalists” in Chicago », à paraître.135 COHEN, Sarah, HAMILTON, James et TURNER, Fred, « Computational journalism », Communication of theACM, Vol. 54, n° 10, pp. 66-71.136 BETANCOURT, Leah, « How Programmer-Journalists are changing the news », Mashable, [disponible en ligne],11 décembre 2009.137 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste“hacker” », Art. cit., p. 144.138 Entretien avec Caroline Goulard (annexe 1)139 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste“hacker” », Art. cit., p. 144. 31
  32. 32. La connotation est plus fine encore : ce ne sont pas tant les « données » que cesterminologies évoquent mais plus précisément la « data ». Il est ainsi significatif de voir que lespromoteurs français du data-journalisme, non contents de choisir les expressions relatives auxdonnées, ont parfois préféré franciser la terminologie anglaise plutôt que de la traduirelittéralement. Ainsi, à côté des « datajournalism » et « data journalism », coexistent aujourd’huiles orthographes « datajournalisme », « data journalisme » et « data-journalisme ». Par laterminaison « -isme », et l’ajout d’un tiret, l’expression prend une tonalité toute autre, plusfrançaise, et naturalise ainsi son existence : il est à l’oreille moins perturbant d’entendre« data-journalisme » que « datajournalism140 ». La nuance peut paraître marginale au premierregard ; elle devient très signifiante au second. Un détour par l’étymologie permet de l’expliciter.2. Un sentiment de multitude Dans un article de 2005141, traduit récemment en français142, Norman Gray, astronome del’université de Glasgow, propose de relire le sens du mot « data » à la faveur des usages de lalangue. L’origine étymologique du terme est latine : « datum » est le participe passé neutresingulier du verbe « dare », « donner », également utilisé comme nom commun – « une chosedonnée ». « Data » correspondant au pluriel. Il est employé en anglais dans ce sens mais, àl’instar de « media » ou « agenda », s’impose à l’usage comme un singulier, jusqu’à ce que« datum » disparaisse purement et simplement. Dans cet usage, « data » ne peut désormais plusêtre simplement le pluriel de « datum » : Privé dancrage, il sest éloigné de ce simple sens dérivé pour un sens en soi distinct et indépendant. Il a alors construit des règles dusage pour lui-même, sans être entravé par son passé latin. (…) Data ne signifie plus juste une (foutu) [sic] datum après une autre. (…) Cette acception universelle de data comme mesurable plutôt que comptable met sans ambiguïté le mot dans la même catégorie grammaticale que le "charbon", le "blé" ou le "minerai", qui est celle des noms de masse ou dagrégat143. La distinction anglaise entre « how much » (« quelle quantité de ») et « how many »(« quel nombre de »), rend bien compte de cette distinction. Cette subtilité syntaxique est140 À prononcer avec une terminaison anglaise.141 GRAY, Norman, « Data is a singular noun », [disponible en ligne], 2 janvier 2005.142 SALAUN, Jean-Michel, « Singulière data », [disponible en ligne], 10 avril 2012.143 Ibid. Traduction de GRAY, Art. cit. 32
  33. 33. masquée par l’adverbe interrogatif « combien », traduisant indifféremment la quantité et lenombre en français. Or la traduction en « données » reproduit lemploi originel du terme : il esttout à fait possible en français d’additionner, compter, dénombrer des données ; on ne lesconsidère pas comme un bloc indivisible. On comprend dès lors la nuance à la réquisition du terme « data » plutôt que « données ».Alors que « la donnée » se représente facilement au singulier, - la donnée d’un problème, ladonnée du jour -, cela semble inconcevable, grammaticalement incorrect, pour « la data » :lorsque l’on parle de « la data », on évoque un agrégat d’éléments insécables. En utilisant ainsi unnom singulier figurant pour un tout, on signifie automatiquement la multitude, la profusion, lamasse. Johan Hufnagel, non sans quelques hésitations syntaxiques, abonde dans ce sens : « pourmoi le data c’est le recueil et le traitement de données massives (…) quand je parle de data, jefais la différence entre le data et l’infographie, les datas c’est vraiment des données massives.C’est un traitement de plusieurs centaines voire milliers de données144 ».   Figure 3 : Capture d’une présentation deFigure 2 : Couverture de The Economist, Dataveyes intitulée « transformation de notresemaine du 27 février au 5 mars 2010 paysage informationnel & journalisme de données »144 Entretien avec Johan Hufnagel (annexe 5), in QUINTARD, Op. cit. 33
  34. 34. Le  sentiment  est  renforcé  par  la  métaphore  –  très  présente  -­‐,  du  «  déluge  »145  :  pour  Karen   Bastien   «  la   data,   qui   était   en   petite   quantité   jusqu’ici,   arrive   par   flux,   par   trombe  d’eau146  ».  Elle  suggère  la  surabondance,  l’envahissement  de  l’espace  personnel  par  un  amas  de  données,  mais  également,  par  le  choix  d’un  terme  apocalyptique,  un  univers  menaçant,  incontrôlable,   confirmant   ainsi   la   manipulation   du   registre   de   l’angoisse147 .   Mais   plus  encore  que  le  data-­‐journalisme,  cet  imaginaire  sied  au  «  Big  Data148  »,  signe  que  toutes  les  expressions  composées  par  le  «  data  »  se  répondent,  dans  un  univers  sémantique  commun.  3. Le rattachement à une bannière « data » Saussure, fondamentalement opposé à l’approche classique de la grammaire, selonlaquelle un mot correspond à une chose du monde, avait posé l’idée que les mots n’ont de sensque de manière négative, par opposition les uns avec les autres. Ils signifient « par ce qu’ils nesont pas », dans la mesure où chaque mot a au moins un élément de différence avec un autre.François Rastier pousse la réflexion à son terme, et affirme que le langage se caractérise par un« système différentiel d’oppositions et non un codage d’identités référentielles149 ». Dès lors,« data-journalisme », à la différence du « journalisme de données », s’enrichit du sens des autresexpressions francisées partageant le terme « data » : « le Big Data », « l’open data », « ladataviz », « le data mining ». Passons en revue leurs différentes connotations. Par ladjonction d’un adjectif représentant la grandeur – alors que « data » le suggère déjà-, et le choix de majuscules, « Big Data » se place dans un registre pléonastique, signifiant plusfortement encore ce sentiment de multitude. Le terme « open data » évoque lui une triplesignification : une transparence politique, un mouvement social et une injonction150. « Dataviz »figure plutôt les réalisations, le « mets », en mettant l’accent sur la mobilisation d’une « narration145 BAYET, Antoine et DUCHAMP, Agathe, « Les nouveaux habits du journalisme dans le monde du déluge desdonnées », Regards Sur Le Numérique, [disponible en ligne], 10 mars 2011.146 Entretien avec Karen Bastien (annexe 4)147 BOUCHARD, Opcit.148 GUILLAUD, Hubert, « Big data : les progrès de l’analyse de données », Internet Actu, [disponible en ligne], 3octobre 2011.149 RASTIER, François, « Le silence de Saussure ou l’ontologie refusée », in BOUQUET, Simon, Saussure, L’Herne,2003, p. 26.150 GOETA, Opcit., pp. 10-11. 34
  35. 35. visuelle151 », plutôt qu’une « narration verbale151 », assimilée au journalisme traditionnel. Quant à« data mining », il procède sans équivoque de la métaphore du gisement, d’une richesse enfouie àaller déterrer. Le « data-journalisme », bien plus que le « journalisme de données » se renforce detoutes ces connotations. En témoigne cette très longue citation de Caroline Goulard : En fait ça a un sens parce que le mot “data” ce n’est pas uniquement la version anglaise de “donnée”. Quand on utilise le mot data en Français, de plus en plus c’est pour parler des données un peu “nouvelle génération”, parce tu as “Big Data”, “open data”, “data-vizualization”, “data-journalisme”. Parfois les gens en Français, ils vont dire “on a de la data”, pourquoi il ne disent pas “on a de la donnée” ? Le sous entendu pour moi là-dedans, c’est que quand tu parles de la data, tu as des données riches, volumineuses, en temps réel, profondes, tu es au dessus de la donnée. La donnée, c’est la « business intelligence » à l’ancienne, c’est les données pas valorisées, considérées comme des résidus de l’activité de l’entreprise. Aujourd’hui quand tu parles de data, c’est du volume, de la profondeur, de la richesse, de l’intelligence, du “Big Data”… C’est marrant d’ailleurs, parce qu’un truc comme le “data Tuesday” c’est un rassemblement tous les 1e mardi du mois. Tu as des gens qui viennent du “Big Data”, de “l’open data”, et de la visualisation, data-journalisme, et tu retrouves pas du tout les gens de la BI [Business Intelligence]. Eux ils ont un groupe dont j’ai oublié le nom. Et là c’est des vieux de la BI qui se disent comment on va mieux faire nos camemberts, c’est un peu la “BI à la papa” qu’il faut quand même renouveler un peu, mais dans une approche radicalement différente de ceux qui travaillent sur la data. Eux ils travaillent sur la donnée, ça va être des grands relecteurs de Tukey. Mais ça incarne des approches différentes (…) Je dirai qu’il y une différence générationnelle, pas forcément au niveau des personnes, mais au niveau des boîtes derrière152. L’idée centrale ici est celle de « données nouvelle génération », affublées de toute uneséries de qualités - « volume », « profondeur », « intelligence », « richesse » -, qui, par négation,permettent de caractériser les données « ancienne génération ». Entre les lignes, on lit ainsi unevolonté de se défaire des représentations statistiques classiques, représentées par l’image du« camembert » et la figure du statisticien John Tukey 153 . Mais on comprend que lerenouvellement « générationnel » se fait surtout au niveau des personnes et institutions quipromeuvent la « data ». Comme le suggérait Samuel Goëta dans son analyse de l’ « open data »,on se trouve face à un « mouvement social », entendu ici au sens d’ « action collective » ou« action commune ayant pour fin d’atteindre des fins partagées154 ». Ce mouvement dispose deses lieux de rencontre – les « data Tuesday » organisées par les « start-up » Data Publica, Captain151 THIBAUT, Nirina, « Datajournalism : les chiffres nous parlent, écoutons les ! », YCAW, [disponible en ligne], 6juillet 2010.152 Entretien avec Caroline Goulard (annexe 1)153 Grand statisticien du XXe siècle, John Tukey est renommé pour ses découvertes en mathématiques algorithmiques(transformée de Fourier rapide, etc.) et en représentations graphiques de statistiques (diagramme en boîte ou « boîte àmoustache, etc.)154 MANN, Patrice, L’action collective. Mobilisation et organisation des minorités actives, Armand Colin, 1991,coll. « U Sociologie », p. 20. 35
  36. 36. Dash et MFG Labs155 ou les éphémères « cafés data » du Social Media Club France (cf. supra) -,et de ses références propres, à l’esthétique plus « sexy156 » – David Mc Candless, Manuel Lima,Hans Rosling ou Nathan Yau 157 . Il est principalement porté par des acteurs économiquesémergents, qui, pour différencier leur offre d’autres entreprises déjà implantées, manipulent undouble registre d’angoisse – le déluge, l’absence de contrôle -, et d’espoir – la richesse,l’intelligence, la créativité. C’est sous l’angle de cette action collective, de cettebannière identitaire « data » que doit aussi se comprendre le data-journalisme. Sous l’égide de la catégorie descriptive de trivialité, ce premier mouvement a permis de sedétacher d’une approche ontologique, rendue de toute manière impossible par la variété desdéfinitions récoltées. Par une analyse successive du discours des acteurs ayant installél’expression dans le paysage français, puis des connotations du terme « data-journalisme », il aété possible de rattacher l’objet de recherche à une bannière plus large de la « data », décrivantune situation, prétendument neuve, marquée les métaphores contradictoires de l’agrégat(multitude, indivisibilité, danger) et de gisement (rareté, granularité, richesse). Ce doublediscours d’angoisse et d’espoir, mobilisé autour d’une bannière commune, permet à ces acteursde pousser les rédactions à l’action. Il apporte ainsi des premiers éléments de réponse à la question de la compatibilité entrepromesses du data-journalisme et imaginaires du journalisme, par la nature des promoteurs - non-journalistes -, et des discours tenus, parfois plus commerciaux que journalistiques. Il convientcependant de poursuivre la réflexion en examinant la critique « subjectiviste » adressée au data-journalisme. Si l’idéal-type défini plus haut encourage à penser qu’une médiation journalistiqueest nécessaire, la prétention de certains à un journalisme « objectif » invite à étudier cettequestion en profondeur.155 DESAUTEZ, Ludovic, « “Data Tuesday”, c’est parti », Les Echos, [disponible en ligne], 6 novembre 2011.156 DESAUTEZ, Ludovic, « Avec le 1e “data Tuesday”, la data se fait plus “sexy” », Les Echos, [disponible en ligne],17 novembre 2011.157 SCHERER, Eric, « Données publiques et journalisme : une mine de richesses ! », OWNI, [disponible en ligne], 7juillet 2010. 36

×