0
Introduction aucapitalisme linguistiqueFrédéric Kaplanfrederic.kaplan@ep!.chtwitter: @frederickaplan
... et à la nouvellecréolisationFrédéric Kaplanfrederic.kaplan@ep!.chtwitter: @frederickaplan
i"yi i Ë f i|= :=lz"t                                                                                     i               ...
L’histoire de Google tient endeux algorithmes :l’un l’a rendu populaire,l’autre l’a rendu riche.
1  l’algorithme qui arendu Google célèbre
Altavista - 1996
Google - 1998
PageRankUne intuition sur ce qui fait lalégitimité d’une sourced’information et la naturepragmatique du lien hypertexte.
PageRankLa valeur PageRank d’une pageest liée au nombre de pages qui lacitent et à leur propre valeurPageRank.
Le PageRank est la probabilitéstationnaire dune chaîne de Markov.
Beaucoup de “start-ups”proposant une valeurd’usage mais pas de valeurd’échange ne résistèrent pasà l’éclatement de la “Bul...
Google a eu une meilleure idéeque de simplement vendre dela publicité et a su transformerle capital linguistique qu’elleac...
2 l’algorithme qui arendu Google riche
Un algorithme qui organiseautomatiquement laspéculation autour des mots apermis de créer le premiermarché linguistique mon...
Le marché linguistique existaitdéjà avant Google.Il était possible depuislongtemps d’acheter certainsmots (Trademarks)> cf...
L’algorithme de Google aélargi et en partie libéralisé cemarché.
1    42    53    6    7    8    9    10
tous les mots peuvent donner         lieu à des enchères ...
L’algorithme classeautomatiquement lesannonces selon un calculen quatre étapes.
1. Enchère sur un mot clé (E)Une entreprise choisit un mot ou uneexpression, par exemple “vacances”et le prix maximum qu’e...
2. Calcul du score de qualité de lapublicité (Q)Google donne un score à la publicité surune échelle de un à dix.Ce score d...
3. Calcul du rang (R)Le Rang est l’Enchère multipliée par leScore. Une publicité ayant un bon scorepeut ainsi compenser un...
4. Calcul du prix à payer en cas declic (P)Le prix que paye une entreprise 1 si uninternaute clique sur sa publicité n’est...
Ce jeu d’enchères est recalculé pourchaque requête de chaque utilisateur— des millions de fois par seconde
Cet algorithme génère desdizaines de milliards dedollars par an.10,584 milliards de dollars pour le seulquatrième trimestr...
40                               milliards / anQuelques éléments de comparaison :Budget de Bibliothèque Nationale de Franc...
Le marché linguistique ainsi créé par Googleest déjà global et multilingue.La “Bourse des mots” qui lui est associéedonne ...
ski           orsun screen   world cup
Google a réussi à étendre ledomaine du capitalisme à lalangue elle-même, àorganiser la vente de“mots” à l’échelle planétai...
L’ensemble de ses autresprojets et innovationstechnologiques peuvent êtreanalysés à travers ce prisme.
Quand Google corrige à la volée unmot que vous avez malorthographié, il ne fait pas quevous rendre service :il transforme ...
Quand Google prolonge unephrase que vous avez commencéeà taper dans la case de recherche,il vous ramène dans le domaine de...
Parfois la statistiquel’emporte surl’orthographe.
Les technologies du capitalisme linguistiquepoussent à la régularisation de la langue.Plus nous ferons appel aux prothèses...
Nous nous exprimons chaque jour un peu plus au traversd’une des interfaces de Google ; pas simplement lorsquenous faisons ...
Nous sommes déjà des millionschaque jour à écrire et à parlerpar le biais de Google.C’est pourquoi le modèle statistiquemu...
Google suit les mouvementsde la langue minute parminute, car il a le premierdécouvert en elle un mineraid’une richesse ext...
la langue vivante    la langue   statistique   exploitablecommercialement
L’extension du domaine commercial de lalangue est permise par deux dynamiques(1) La régularisation de la langue par lamédi...
La découverte de ce territoire ducapitalisme jusqu’ici ignoré ouvre unnouveau champ de bataille économique.Google béné"cie...
Nous quittons une économie del’attention pour entrer dans uneéconomie de l’expression.L’enjeu n’est plus tant de capter le...
Une conséquence essentielleLa langue va setransformer.
Comment ?
Pas simplement en serégularisant ...
Le “Flash Crash” du 6 mai 2010 a fait prendreconscience de l’omniprésence des algorithmesdans la "nance.
Dès que les systèmes culturelsproposent des fonctionsprécises à optimiser, lesalgorithmes deviennent desalternatives perti...
Dès que le nombre d’actionsdécidées par des algorithmesdevient signi"catif par rapportaux actions humaines, la formedes sy...
Comme pour le domaine de la"nance, les algorithmes sontdevenus des acteurs majeursdu capitalisme linguistique.
Principe généralToute prothèse linguistique peutêtre utilisée par un “bot” plutôtqu’un humain.
Il nous fait donc désormais distinguer deuxtypes de ressources linguistiques:(a) les ressources primaires produites par de...
Malheureusement, sans connaître l’origined’une production, il n’est souvent pas aisé dedistinguer entre ressources primair...
Les acteurs du capitalisme linguistique doiventmodéliser la langue le plus parfaitementpossible. C’est leur capital.Google...
La modi"cation de la syntaxe dans deschaînes de traduction automatique illustre uncertain de type de pollution.  “La quali...
Un nombre croissant de textes sontmaintenant directement produits par desmachinesUn lecteur averti peut souvent détecter l...
Ces textes sont optimisés pour l’universlinguistique qu’ils investissentLe même contenu peut donner lieu à di#érentes form...
Les algorithmes qui archivent inlassablementle web ne font pas facilement la di#érenceentre ces ressources linguistiques d...
Ce sont ces tournures quirisquent de nous êtreproposées sous la forme desuggestions ou de corrections. 
Pour lutter contre cette “pollution” croissante,Google a modi"é en 2011 son service GoogleTranslate.Google a remplacé son ...
Cela ne su$ra pas.Il faut maintenant compter avec l’écriture desmachines et tous les hybrides de ce nouvelordre linguistiq...
Sur les 30 meilleurséditeurs de Wikipedia,les 2/3 sont des bots> R.Stuart Geiger, “The Lives of Bots.” in Wikipedia: A Cri...
D’ici deux ans, une proportionsigni"cative des messages surles réseaux sociaux serontpeut-être produits par desbots.> Hwan...
Ainsi, textes humains et algorithmiques semêlent pour proposer une nouvelle formed’écriture.Et c’est cette nouvelle écritu...
Avec le capitalismelinguistique, la langue elle-même se transforme pourintégrer les biais linguistiquesdes machines et les...
Nous assistons peut-être unenouvelle phase de“grammatisation” de lalangue, une nouvellerétroaction de la technologieet de ...
Dans un temps intermédiaireapparait quelque chosecomme une lingua franca, unpidgin ou un créole, dont lasyntaxe et le voca...
C’est ce phénomène inéditque j’appelle la nouvellecréolisation.
frederic.kaplan@ep!.chtwitter:@frederickaplanhttp://fkaplan.comhttp://craft.ep!.chhttp://bookapp.com
Introduction au capitalisme linguistique
Upcoming SlideShare
Loading in...5
×

Introduction au capitalisme linguistique

14,161

Published on

Published in: Economy & Finance
1 Comment
9 Likes
Statistics
Notes
No Downloads
Views
Total Views
14,161
On Slideshare
0
From Embeds
0
Number of Embeds
12
Actions
Shares
0
Downloads
90
Comments
1
Likes
9
Embeds 0
No embeds

No notes for slide

Transcript of "Introduction au capitalisme linguistique"

  1. 1. Introduction aucapitalisme linguistiqueFrédéric Kaplanfrederic.kaplan@ep!.chtwitter: @frederickaplan
  2. 2. ... et à la nouvellecréolisationFrédéric Kaplanfrederic.kaplan@ep!.chtwitter: @frederickaplan
  3. 3. i"yi i Ë f i|= :=lz"t i ËË;te â ë iË , ËË.rËË i€ËâË .P . - - 7EÊ ËËËËË -.: ==.8=? -- oa à3;: 9ll g ;âÈ u . Ë Ê Ë ig = xYAii ÎE .iiË s:;! F H u Ë Ë;-gE-r=EEi e iEgËËË 35ËËËËËËËËËEË r* *ËjËj1ËA êo iÉU . E IE6 s Ë É É s€! e!ZE ôr ùËÊ E ; IËO F É gË:; l=i"ËË r âËi* a) - â:EiË +i€; i:=ËiË; ) F) Èil i eË Ë ËËËË r , i ËÉ = â ; " t 4 ; , î : â .-rt I-ù Xù | | i çË Ë;ËË:: Ëgg9€ tsl a Ëi ÊËË | v EË ; h Ë ç F s rsl E €! €H p =53 É : s r ç Ë2 F . i = â a ÈF.:Ë!ËË!sài *x;-uçgFE;i9 3 ^ a = ; . éo o - E5 : o ; iËsÉtâËr; >V? .S rr) fr p a $-..{ o o {ËâËiÈËÈ Ë Ë È ËE : s Ë q Ë ï s * 3 . 4Ë ! à Ëk É g s 3 ; ô E i l y E 5 6 3 EÉ 3 GE,:e.I i F a r1 t4 i-l FI a tnl z : i Ê a É Ë f ieÉ ÉEË E : il ; ;+E E 93Fg Ë Ê y âiÈ â+ Hb- .9: ;ÈâE i i : = - e t - z ( J -.1 a C) 0, s Èl È .$ (n tl C) r-l IJ E I X 9 É {l =il ËËËËg E o tËiË F ;Ëî ËËË: .t{ ËË (- Ë t! z - o (- IL U È{ C) "l I d ,-{ { À : F-.1 rt) rê d c J : o z :zZz11;
  4. 4. L’histoire de Google tient endeux algorithmes :l’un l’a rendu populaire,l’autre l’a rendu riche.
  5. 5. 1 l’algorithme qui arendu Google célèbre
  6. 6. Altavista - 1996
  7. 7. Google - 1998
  8. 8. PageRankUne intuition sur ce qui fait lalégitimité d’une sourced’information et la naturepragmatique du lien hypertexte.
  9. 9. PageRankLa valeur PageRank d’une pageest liée au nombre de pages qui lacitent et à leur propre valeurPageRank.
  10. 10. Le PageRank est la probabilitéstationnaire dune chaîne de Markov.
  11. 11. Beaucoup de “start-ups”proposant une valeurd’usage mais pas de valeurd’échange ne résistèrent pasà l’éclatement de la “BulleInternet”.
  12. 12. Google a eu une meilleure idéeque de simplement vendre dela publicité et a su transformerle capital linguistique qu’elleaccumulait en un servicecréant de la valeur.
  13. 13. 2 l’algorithme qui arendu Google riche
  14. 14. Un algorithme qui organiseautomatiquement laspéculation autour des mots apermis de créer le premiermarché linguistique mondial.
  15. 15. Le marché linguistique existaitdéjà avant Google.Il était possible depuislongtemps d’acheter certainsmots (Trademarks)> cf. C.Fauré commentant Lombardo sur l’origine antique des Trademarks> http://www.christian-faure.net/2012/01/22/les-savoirs-de-lecriture-en-grece-ancienne-3-marchands-transactions-economiques-ecritures/
  16. 16. L’algorithme de Google aélargi et en partie libéralisé cemarché.
  17. 17. 1 42 53 6 7 8 9 10
  18. 18. tous les mots peuvent donner lieu à des enchères ...
  19. 19. L’algorithme classeautomatiquement lesannonces selon un calculen quatre étapes.
  20. 20. 1. Enchère sur un mot clé (E)Une entreprise choisit un mot ou uneexpression, par exemple “vacances”et le prix maximum qu’elle serait prêteà payer en cas de clic.Google propose une estimation du montant de l’enchère à proposer pour avoir debonnes chances d’être dans la première page des résultats proposés.Les acheteurs de mots peuvent aussi cibler leur publicité à des dates ou des lieuxspéci"ques.
  21. 21. 2. Calcul du score de qualité de lapublicité (Q)Google donne un score à la publicité surune échelle de un à dix.Ce score dépend essentiellement de la pertinence du texte de la publicité par rapport à larequête de l’utilisateur, de la qualité de la page vers laquelle la publicité pointe (qualité deson contenu et rapidité de chargement) et du nombre de clics moyen sur la publicité. Engros, ce score mesure à quel point la publicité “fonctionne”.C’est un point essentiel car Google ne gagne de l’argent que si les internautes choisissente#ectivement de cliquer sur le lien proposé par la publicité.L’algorithme exact qui produit le score de qualité de la publicité reste secret etmodi!able à loisir par Google.
  22. 22. 3. Calcul du rang (R)Le Rang est l’Enchère multipliée par leScore. Une publicité ayant un bon scorepeut ainsi compenser une enchère plusfaible et arriver devant.R=E*Q
  23. 23. 4. Calcul du prix à payer en cas declic (P)Le prix que paye une entreprise 1 si uninternaute clique sur sa publicité n’estpas le prix de l’enchère mais le prix del’enchère 2 juste en dessous de sapropre enchère modulé par la qualitérelative entre cette deuxième enchèreet celle de l’entreprise.Tout tient dans la formule : P1 = E2 * (Q2 / Q1) où P1 est le prix payé par l’entreprise, E2est l’enchère la plus haute en dessous de l’enchère de lentreprise 1, Q1 la qualité del’enchère 1, Q2 la qualité de l’enchère 2.
  24. 24. Ce jeu d’enchères est recalculé pourchaque requête de chaque utilisateur— des millions de fois par seconde
  25. 25. Cet algorithme génère desdizaines de milliards dedollars par an.10,584 milliards de dollars pour le seulquatrième trimestre 2011
  26. 26. 40 milliards / anQuelques éléments de comparaison :Budget de Bibliothèque Nationale de France : 226 millions d’euros / anChi#re d’a#aire de Renault en 2011 : 42 millions...
  27. 27. Le marché linguistique ainsi créé par Googleest déjà global et multilingue.La “Bourse des mots” qui lui est associéedonne une indication relativement juste desgrands mouvements sémantiquesmondiaux.
  28. 28. ski orsun screen world cup
  29. 29. Google a réussi à étendre ledomaine du capitalisme à lalangue elle-même, àorganiser la vente de“mots” à l’échelle planétaire.
  30. 30. L’ensemble de ses autresprojets et innovationstechnologiques peuvent êtreanalysés à travers ce prisme.
  31. 31. Quand Google corrige à la volée unmot que vous avez malorthographié, il ne fait pas quevous rendre service :il transforme un matériau sansvaleur en une ressourceéconomique directement rentable.
  32. 32. Quand Google prolonge unephrase que vous avez commencéeà taper dans la case de recherche,il vous ramène dans le domaine dela langue qu’il exploite, vous inviteà emprunter le chemin statistiquetracé par les autres internautes.
  33. 33. Parfois la statistiquel’emporte surl’orthographe.
  34. 34. Les technologies du capitalisme linguistiquepoussent à la régularisation de la langue.Plus nous ferons appel aux prothèseslinguistiques, laissant les algorithmescorriger et prolonger nos propos, plus cetterégularisation sera e$cace.
  35. 35. Nous nous exprimons chaque jour un peu plus au traversd’une des interfaces de Google ; pas simplement lorsquenous faisons une recherche, mais aussi quand- nous écrivons un courrier électronique avec GMail- un article avec Google Docs- nous signalons une information sur le réseau social Google+,- et même oralement, à travers les interfaces dereconnaissance vocale que Google intègre à ses applicationsmobiles.
  36. 36. Nous sommes déjà des millionschaque jour à écrire et à parlerpar le biais de Google.C’est pourquoi le modèle statistiquemultilingue que Google a$ne enpermanence et vers lequel il tente deramener chaque requête est bien plus àjour que le dictionnaire publié annuellementpar nos académiciens.
  37. 37. Google suit les mouvementsde la langue minute parminute, car il a le premierdécouvert en elle un mineraid’une richesse extraordinaire,et s’est doté des moyensnécessaires pour l’exploiter.
  38. 38. la langue vivante la langue statistique exploitablecommercialement
  39. 39. L’extension du domaine commercial de lalangue est permise par deux dynamiques(1) La régularisation de la langue par lamédiation des prothèses linguistiques(2) La multiplication et la banalisation desprothèses linguistiques
  40. 40. La découverte de ce territoire ducapitalisme jusqu’ici ignoré ouvre unnouveau champ de bataille économique.Google béné"cie certes d’une avanceimportante, mais des rivaux, ayant comprisles règles de cette nouvelle compétition,"niront par se pro"ler.
  41. 41. Nous quittons une économie del’attention pour entrer dans uneéconomie de l’expression.L’enjeu n’est plus tant de capter les regards, que d’être unmédiateur de la parole et l’écrit.Les gagnants seront ceux qui auront pu développer desrelations linguistiques intimes et durables avec un grandnombre d’utilisateurs, pour modéliser et in!échir la langue,créer un marché linguistique contrôlé et organiser laspéculation sur les mots.
  42. 42. Une conséquence essentielleLa langue va setransformer.
  43. 43. Comment ?
  44. 44. Pas simplement en serégularisant ...
  45. 45. Le “Flash Crash” du 6 mai 2010 a fait prendreconscience de l’omniprésence des algorithmesdans la "nance.
  46. 46. Dès que les systèmes culturelsproposent des fonctionsprécises à optimiser, lesalgorithmes deviennent desalternatives pertinentes àl’action humaine.
  47. 47. Dès que le nombre d’actionsdécidées par des algorithmesdevient signi"catif par rapportaux actions humaines, la formedes systèmes culturelschangent profondément.
  48. 48. Comme pour le domaine de la"nance, les algorithmes sontdevenus des acteurs majeursdu capitalisme linguistique.
  49. 49. Principe généralToute prothèse linguistique peutêtre utilisée par un “bot” plutôtqu’un humain.
  50. 50. Il nous fait donc désormais distinguer deuxtypes de ressources linguistiques:(a) les ressources primaires produites par deshumains (conversations orales ou écrites,contenus de livres scannés, etc.)(b) les ressources secondaires produites pardes machines en général à partir desressources primaires (traduction automatique,articles écrits par des algorithmes, spam). 
  51. 51. Malheureusement, sans connaître l’origined’une production, il n’est souvent pas aisé dedistinguer entre ressources primaires ousecondaires. Un humain peut dans certainscas faire la di#érence, mais il est di$cile deconstruire des algorithmes  pour faireautomatiquement cette distinction.
  52. 52. Les acteurs du capitalisme linguistique doiventmodéliser la langue le plus parfaitementpossible. C’est leur capital.Google voit les ressources secondairescomme un danger, une pollution pour sesmodèles.
  53. 53. La modi"cation de la syntaxe dans deschaînes de traduction automatique illustre uncertain de type de pollution. “La qualité se dégrade petit à petit au fur et à mesure quand on applique des algorithmes de traduction automatique” “Quality degrades gradually as and when we measure applies algorithms to machine translation” “Calidad degrada gradualmente a medida y cuando la medida se aplica algoritmos de traducción automática” “Qualité se dégrade progressivement au fur et à mesure est appliquée algorithmes de traduction automatique”
  54. 54. Un nombre croissant de textes sontmaintenant directement produits par desmachinesUn lecteur averti peut souvent détecter la mécanique sous-jacente et deviner parfois que ces textes ne sont pas écritspar des humains.Leur composition syntaxique et surtout leur positionnementpragmatique sonnent parfois faux, re!étant les biais del’algorithme qui les compose.
  55. 55. Ces textes sont optimisés pour l’universlinguistique qu’ils investissentLe même contenu peut donner lieu à di#érentes formes :Articles longs ou courts, chroniques sportives, tweets,message vocal.Il peut être exprimé en optimisant son e$cacité pour lesmoteurs de recherche (SEO) : choix de mots particuliers, detournures statistiques optimales.Comme en !nance, les algorithmes sont sans doutemeilleurs que les hommes pour produire des stratégiesoptimales dans le milieu économique du capitalismelinguistique.
  56. 56. Les algorithmes qui archivent inlassablementle web ne font pas facilement la di#érenceentre ces ressources linguistiques dégradéeset les ressources primaires.Au fur et à mesure que la quantité deressources secondaires devient signi"cativepar rapport aux ressources primaires, lesmodèles statistiques peuvent se modi"er pourintégrer le vocabulaire, les formulations etles tournures des algorithmes.
  57. 57. Ce sont ces tournures quirisquent de nous êtreproposées sous la forme desuggestions ou de corrections. 
  58. 58. Pour lutter contre cette “pollution” croissante,Google a modi"é en 2011 son service GoogleTranslate.Google a remplacé son service créateur de ressourcessecondaires en un service de traduction “on demand” quigarde toujours le texte original de la traduction, pour s’enservir pour la recherche et pour potentiellement améliorerprogressivement la traduction proposée au fur et à mesure queles algorithmes de traduction progressent. cf. Kirti Vashee / Analysis of the Shutdown Announcements of the Google Translate API
  59. 59. Cela ne su$ra pas.Il faut maintenant compter avec l’écriture desmachines et tous les hybrides de ce nouvelordre linguistique.
  60. 60. Sur les 30 meilleurséditeurs de Wikipedia,les 2/3 sont des bots> R.Stuart Geiger, “The Lives of Bots.” in Wikipedia: A Critical Point of View. 2011> http://en.wikipedia.org/wiki/Wikipedia:List_of_Wikipedians_by_number_of_recent_edits
  61. 61. D’ici deux ans, une proportionsigni"cative des messages surles réseaux sociaux serontpeut-être produits par desbots.> Hwang, Pearce and Nanis (2012) Socialbots: voices from the fronts interactions Volume 19Issue 2, March + April 2012
  62. 62. Ainsi, textes humains et algorithmiques semêlent pour proposer une nouvelle formed’écriture.Et c’est cette nouvelle écriture que d’autresalgorithmes analysent pour ensuite structurernos propres productions linguistiques.
  63. 63. Avec le capitalismelinguistique, la langue elle-même se transforme pourintégrer les biais linguistiquesdes machines et lescontraintes de l’économielinguistique planétaire.
  64. 64. Nous assistons peut-être unenouvelle phase de“grammatisation” de lalangue, une nouvellerétroaction de la technologieet de l’économie sur la languenaturelle.
  65. 65. Dans un temps intermédiaireapparait quelque chosecomme une lingua franca, unpidgin ou un créole, dont lasyntaxe et le vocabulaire sontliés aux capacités linguistiquesdes machines et aux valeursmarchandes des mots.
  66. 66. C’est ce phénomène inéditque j’appelle la nouvellecréolisation.
  67. 67. frederic.kaplan@ep!.chtwitter:@frederickaplanhttp://fkaplan.comhttp://craft.ep!.chhttp://bookapp.com
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×