Dans l'esprit du Pagerank: regards croisés sur les algorithmes,

Fabien Gandon
Fabien GandonScientific Leader for the Wimmics Research Team at Inria
"Dans l'esprit du Pagerank :
regards croisés sur les algorithmes"
#CafeLecture - Atelier de lecture transdisciplinaire - Learning Centre SophiaTech
Fabien Gandon (Directeur de recherche, Wimmics (Inria-I3S))
« Dans l'esprit du Pagerank
Une enquête sur l'algorithme de Google »
Dominique Cardon, Réseaux 2013/1 (n° 177), p. 63-95. DOI 10.3917/res.177.0063
« A quoi rêvent les algorithmes
Nos vies à l'heure des big data »
Dominique Cardon, 01/10/2015, Coédition Seuil-La République des idées
+
L’article dans ses grandes lignes
(I) Principes & Origines du PageRank en Sociométrie et Scientométrie
• Citation = Vote → Lien = Vote
• Métriques sur les formes relationnelles du social
(centralité propre, proba stationnaire) Ax=x
• « Google Juice » ou « jus de liens » pour un vote pondéré
• Hypothèse d’extériorité, de neutralité et d’honnêteté
L’article dans ses grandes lignes
(II) Paradoxe: évidement omniprésent mais nécessairement ignoré
• Agrégation organique d’une « sagesse des foules »
• Séparation (fantasmée) des algorithmes: PageRank & Adwords
• « Faites comme si on n’était pas là » / « Nous sommes incontournables »
• SEO, bombing, fermes de liens, génération de textes, etc.
• Aucune action éditoriale directe/ Ajustements des algorithmes (!!!)
L’article dans ses grandes lignes
(III) Limites: autorité/popularité, autres graphes (sociaux), ininterprétable
Dans l'esprit du Pagerank: regards croisés sur les algorithmes,
vous-êtes ici [livre]
Google est créateur de Web
Tisse des liens, de la toile et ajoute des pages (résultats de recherche)
Plus on est visible, plus on est lié
Sur le Web l’analyse modifie l’objet
Pas uniquement structurel
• « Anchor texts » utilisés dans l’indexation
• Knowledge graphs : retour du contenu structuré, contrôlé (édité)
• Liens, nœuds et réseaux de plus en plus typés
analyse des recherches
intégrer les retours des utilisateurs
Click = Vote
https://www.google.fr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0ahUKEwj4-
4bNhLbMAhUGAcAKHZNTC_AQFggcMAA&url=http%3A%2F%2Ffabien.info%2F&usg=AFQjCNHkapoAUI7E0Zt
CeS36ZuMo1DPyyg&sig2=_t7Zc1mRalqL8RLFc4mxCw
Google observe le Web et les surfeurs
indirections systématiques
Dans l'esprit du Pagerank: regards croisés sur les algorithmes,
« Vote » : Lien = Vote
• Différences de pratiques entre communautés
• Incomparabilité des pratiques entres domaines, cultures, communautés
• Question de l’uniformisation des traitements de « Lien-Vote »
• Changements dans l’intentionnalité du lien
• Très explicite au début (1990) lorsqu’il est manuel et spontané
• Très différent avec son automatisation (suggestion, génération, liage, triche, etc.)
• Différence d’intention explicite :
Vote-Lien // Signal != trace ex. I like != Click // Data-Sublata [Latour]
• Vote d’un échantillon biaisé, non représentatif
• Web = "seulement" 3 milliards de d’utilisateurs et pas n’import lesquels
• Les « traces et signaux » ne capturent que les connectés
les autres ne laissent pas de traces et donc ne sont pas comptés
• Limite de représentativité
Sources :Internet World Stats et Google Transparency Report - 2013
Boris Beaude et Ogier Maitre - Chôros - EPFL
Boris Beaude et Ogier Maitre - L'ubiquité fracturée - 2014
« La donnée brute n’existe pas » [Livre]
elle a un contexte, modèle, format, précision, etc.
• La donnée est le nouveau pétrole
• Relativité de la valeur
(pas de cours de la donnée)
• Pas extraite en pleine mer
(elle appartient souvent à quelqu’un)
• Pas une ressource naturelle
(obtenue artificiellement)
• Infiniment renouvelable
(copie = instruction de base)
• L’absence de modèle n’améliore pas forcément les biais
(implicites, incontrôlés, etc.)
Statistique vs. Exact
algorithmes à cœur ouvert
Pagerank / h-Index: importer principes et critiques
• La « recherche d’information » / « recherche scientifique »
• Interprétations difficiles / erronées des métriques
(c.f. « Les dérives de l’évaluation de la recherche » Y. Gingras)
• Domination arbitraire d’une métrique, d’un classement, etc.
Il faut, varier les métriques & documenter leur interprétation,
leur principe et leurs limites.
intermédiarité proximité propre degré harmonique Katz
(source: Wikipedia)
(PageRank)
Tension entre adhésion et manipulation
Besoin de comprendre pour interpréter, légitimer, faire confiance, … utiliser
vs. Possibilité offerte de manipuler, biaiser, détourner,… rendre inutilisable
• Asymétrie de l’information:
• Manque de compréhension, conscience, etc. [Livre]
ex. agriculteurs, « tracteurs numériques »
& constructeur propriétaire données
// « les données » vs. « les obtenues »
ou « data » vs. « sublata » [B. Latour]
• Suprématie de ceux qui peuvent créer, attirer,
provoquer du lien (href, like, #tag)
// campagnes de com., jeux concours, etc.
// les riches deviennent plus riches
• Absence d’alternatives
• Limite de l’approche CNIL
« un fichier= un usage fixé » // Gilles Babinet
“people who use Mac
computers spend as much
as 30% more on hotels”
surveiller la surveillance
• « Diffusion d’une culture statistique »…
une culture du numérique
• Documenter les algorithmes:
• entrées, sources, capteurs, etc.
• modèles, formats, représentations, etc.
• algo & paramétrage, méthodes, traitements, etc.
• pilotes, collecteurs, commanditaires, programmeurs, etc.
• sorties, forme, destinataires, réutilisations, etc.
• objectifs visés ( principe)
• Audit des algorithmes, expertises de contrôle, responsabilité.
• CCNum & Conseil d’Etat
obligation de loyauté des plateformes envers les utilisateurs. [Livre]
• Vers une conception individualisée de la vie privée et non une définition
uniforme [Livre]
Potentiel imprévisible de la donnée
une autre raison de connaitre l’objectif
• Do You Smile with Your Nose? Stylistic Variation in Twitter Emoticons
Tyler Schnoebelen, WWW2015
• Feutres sous les meubles = conducteur prudent
// objectif d’optimisation (assurances)  objectif de solidarité (mutualités)
:-) :)
lire ou ne pas lire…
les termes et conditions des applications
32 241 words18 301 words15 352 words 36 275 words19 972 words11 195 words
http://conversation.which.co.uk/technology/length-of-website-terms-and-conditions/
< < < < <
… documenter l’objectif mais de façon accessible
limites de l’observable
Dérives parfois invisibles
• Encourager des comportements individuels non voulus
• Perceptibles: addiction vs. publicité ciblée, endoctrinement vs. bulle de filtrage, etc.
• « faut-il proposer des cigarettes à un fumeur qui veut arrêter de fumer? » [Livre]
• Imperceptibles: recommandation de livres vs. Bibliothérapie
• Renforcer des structures sociales non souhaitées
• Discrimination (ex. société raciste et offres d’emploi [Livre][Latanya Sweeney])
• Inégalités, Hiérarchies, etc. le tout invisible
• Un sous-système et non un système isolé
• L’hypothèse de l’isolé ne tient pas
• Autres boucles de rétroaction (ex. médias classiques)
A court terme nous risquons moins la suprématie d’une IA qu’une amplification
aveugle des biais sociaux ou un renforcement irréfléchi des comportements
individuels par une gouvernementalité algorithmique aveugle.
Gouvernementalité algorithmique
Antoinette Rouvroy
• l’abandon d’« échelle », d’« étalon », de hiérarchie, au profit
d’une normativité immanente et évolutive en temps réel
• double statistique du monde qui semble faire table rase
des anciennes hiérarchies
• l’évitement des confrontations avec les individus ;
occasions de subjectivation raréfiées.
« Une pensée du devenir et des processus d’individuation par la relation réclame
nécessairement du « disparate » - une hétérogénéité des ordres de grandeur, une
multiplicité des régimes d’existence - que la gouvernementalité algorithmique ne
cesse précisément d’étouffer en clôturant le réel (numérisé) sur lui-même »
« Le probable préempte le possible » [Livre]
• En nous réduisant à nos traces on nous réduit à un passé visible et surtout…
on nous coupe d’un futur possible.
• Suprématie de l’observable vs.
besoin de réintégrer la projection, le modèle.
« La carte et le paysage »
• Impact sociétal du déploiement d’un algorithme sur le Web
• Dimension éthique, morale, etc.
• Se doter d’un projet social, politique, moral, etc.
au-delà du PageRank
• Google et tant d’autres…
PageRank, EdgeRank,…
• Multiplication des graphes sur le Web
(liens de pages, réseaux sociaux,
données liées, workflows, logs, etc.)
• Besoin d’autres formes d’intelligences
au-delà du raisonnement logique, de l’apprentissage statistique, etc.
• In fine, un appel à la transdisciplinarité.
#uca
1 of 29

Recommended

Transparents Formation SMS, Séminaire de Médiation Scientifique janvier 2012 by
Transparents Formation SMS, Séminaire de Médiation Scientifique janvier 2012Transparents Formation SMS, Séminaire de Médiation Scientifique janvier 2012
Transparents Formation SMS, Séminaire de Médiation Scientifique janvier 2012Fabien Gandon
4.1K views23 slides
Le PageRank est mort, vive le TrustRank ! by
Le PageRank est mort, vive le TrustRank !Le PageRank est mort, vive le TrustRank !
Le PageRank est mort, vive le TrustRank !David Degrelle - Consultant SEO Expert
1.2K views15 slides
Introduction au PageRank by
Introduction au PageRankIntroduction au PageRank
Introduction au PageRankFrançois Bernard-Sévigny
1.3K views12 slides
Semantic Web: The Inside Story by
Semantic Web: The Inside StorySemantic Web: The Inside Story
Semantic Web: The Inside StoryJames Hendler
10.3K views34 slides
Competences cognitives pour la société du savoir by
Competences cognitives pour la société du savoirCompetences cognitives pour la société du savoir
Competences cognitives pour la société du savoireraser Juan José Calderón
2.4K views10 slides
Le web affectif by
Le web affectifLe web affectif
Le web affectifJulien PIERRE
385 views39 slides

More Related Content

Similar to Dans l'esprit du Pagerank: regards croisés sur les algorithmes,

Identité et réseaux socionumériques : lien social et formes d'expression de soi by
Identité et réseaux socionumériques : lien social et formes d'expression de soiIdentité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soiAlexandre Coutant
384 views22 slides
Antonio CASILLI - Régimes de production des visualisations de données by
Antonio CASILLI - Régimes de production des visualisations de donnéesAntonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de donnéesBodyspacesociety Blog
3.1K views22 slides
Traces numériques, identités, personnalités by
Traces numériques, identités, personnalitésTraces numériques, identités, personnalités
Traces numériques, identités, personnalitésYannick Prié
2.3K views59 slides
2009 Conference Information Access & Search by
2009 Conference Information Access & Search2009 Conference Information Access & Search
2009 Conference Information Access & SearchSocial Computing
540 views8 slides
Conférence big data by
Conférence big dataConférence big data
Conférence big dataStéphane Traumat
2.9K views80 slides
Introduction à l'exploration du Web by
Introduction à l'exploration du WebIntroduction à l'exploration du Web
Introduction à l'exploration du WebSébastien
1.1K views26 slides

Similar to Dans l'esprit du Pagerank: regards croisés sur les algorithmes,(20)

Identité et réseaux socionumériques : lien social et formes d'expression de soi by Alexandre Coutant
Identité et réseaux socionumériques : lien social et formes d'expression de soiIdentité et réseaux socionumériques : lien social et formes d'expression de soi
Identité et réseaux socionumériques : lien social et formes d'expression de soi
Alexandre Coutant384 views
Antonio CASILLI - Régimes de production des visualisations de données by Bodyspacesociety Blog
Antonio CASILLI - Régimes de production des visualisations de donnéesAntonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de données
Traces numériques, identités, personnalités by Yannick Prié
Traces numériques, identités, personnalitésTraces numériques, identités, personnalités
Traces numériques, identités, personnalités
Yannick Prié2.3K views
2009 Conference Information Access & Search by Social Computing
2009 Conference Information Access & Search2009 Conference Information Access & Search
2009 Conference Information Access & Search
Social Computing540 views
Introduction à l'exploration du Web by Sébastien
Introduction à l'exploration du WebIntroduction à l'exploration du Web
Introduction à l'exploration du Web
Sébastien 1.1K views
Amar Lakel - Patrimonialisation numérique et avenir digital du document. by Amar LAKEL, PhD
Amar Lakel - Patrimonialisation numérique et avenir digital du document.Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar LAKEL, PhD263 views
SRI by SKennel
SRISRI
SRI
SKennel1.6K views
La Veille en E-Réputation et Community Management [1/3] : Les fondamentaux by Grégoire Arnould
La Veille en E-Réputation et Community Management [1/3] : Les fondamentauxLa Veille en E-Réputation et Community Management [1/3] : Les fondamentaux
La Veille en E-Réputation et Community Management [1/3] : Les fondamentaux
Grégoire Arnould4.8K views
Intelligence collective 1.0 by Antoine Taly
Intelligence collective 1.0Intelligence collective 1.0
Intelligence collective 1.0
Antoine Taly2.3K views
Les usages des reseaux sociaux arifor by Frédéric Haeuw
Les usages des reseaux sociaux ariforLes usages des reseaux sociaux arifor
Les usages des reseaux sociaux arifor
Frédéric Haeuw1.7K views
Cersic: culture informationnelle et institutions by olivier
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutions
olivier1.5K views
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ... by olivier
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
olivier1.5K views
Réseaux sociaux et recherche d'information by FFFOD
Réseaux sociaux et recherche d'informationRéseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'information
FFFOD1.9K views
Présence numérique : habitus et pratiques savantes by Louise Merzeau
Présence numérique : habitus et pratiques savantesPrésence numérique : habitus et pratiques savantes
Présence numérique : habitus et pratiques savantes
Louise Merzeau1.8K views
Sites de réseautage social, un petit monde où la confiance est aveugle by ISACA Chapitre de Québec
Sites de réseautage social, un petit monde où la confiance est aveugleSites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugle
CGT-digital-week.pptx by olivier
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
olivier772 views

More from Fabien Gandon

Walking Our Way to the Web by
Walking Our Way to the WebWalking Our Way to the Web
Walking Our Way to the WebFabien Gandon
49 views75 slides
a shift in our research focus: from knowledge acquisition to knowledge augmen... by
a shift in our research focus: from knowledge acquisition to knowledge augmen...a shift in our research focus: from knowledge acquisition to knowledge augmen...
a shift in our research focus: from knowledge acquisition to knowledge augmen...Fabien Gandon
322 views107 slides
Evaluation d’explications pour la prédiction de liens dans les graphes de con... by
Evaluation d’explications pour la prédiction de liens dans les graphes de con...Evaluation d’explications pour la prédiction de liens dans les graphes de con...
Evaluation d’explications pour la prédiction de liens dans les graphes de con...Fabien Gandon
85 views22 slides
A Never-Ending Project for Humanity Called “the Web” by
A Never-Ending Project for Humanity Called “the Web”A Never-Ending Project for Humanity Called “the Web”
A Never-Ending Project for Humanity Called “the Web”Fabien Gandon
202 views26 slides
Wimmics Overview 2021 by
Wimmics Overview 2021Wimmics Overview 2021
Wimmics Overview 2021Fabien Gandon
432 views142 slides
CovidOnTheWeb : covid19 linked data published on the Web by
CovidOnTheWeb : covid19 linked data published on the WebCovidOnTheWeb : covid19 linked data published on the Web
CovidOnTheWeb : covid19 linked data published on the WebFabien Gandon
249 views51 slides

More from Fabien Gandon(20)

a shift in our research focus: from knowledge acquisition to knowledge augmen... by Fabien Gandon
a shift in our research focus: from knowledge acquisition to knowledge augmen...a shift in our research focus: from knowledge acquisition to knowledge augmen...
a shift in our research focus: from knowledge acquisition to knowledge augmen...
Fabien Gandon322 views
Evaluation d’explications pour la prédiction de liens dans les graphes de con... by Fabien Gandon
Evaluation d’explications pour la prédiction de liens dans les graphes de con...Evaluation d’explications pour la prédiction de liens dans les graphes de con...
Evaluation d’explications pour la prédiction de liens dans les graphes de con...
Fabien Gandon85 views
A Never-Ending Project for Humanity Called “the Web” by Fabien Gandon
A Never-Ending Project for Humanity Called “the Web”A Never-Ending Project for Humanity Called “the Web”
A Never-Ending Project for Humanity Called “the Web”
Fabien Gandon202 views
CovidOnTheWeb : covid19 linked data published on the Web by Fabien Gandon
CovidOnTheWeb : covid19 linked data published on the WebCovidOnTheWeb : covid19 linked data published on the Web
CovidOnTheWeb : covid19 linked data published on the Web
Fabien Gandon249 views
Web open standards for linked data and knowledge graphs as enablers of EU dig... by Fabien Gandon
Web open standards for linked data and knowledge graphs as enablers of EU dig...Web open standards for linked data and knowledge graphs as enablers of EU dig...
Web open standards for linked data and knowledge graphs as enablers of EU dig...
Fabien Gandon674 views
from linked data & knowledge graphs to linked intelligence & intelligence graphs by Fabien Gandon
from linked data & knowledge graphs to linked intelligence & intelligence graphsfrom linked data & knowledge graphs to linked intelligence & intelligence graphs
from linked data & knowledge graphs to linked intelligence & intelligence graphs
Fabien Gandon525 views
The Web We Mix - benevolent AIs for a resilient web by Fabien Gandon
The Web We Mix - benevolent AIs for a resilient webThe Web We Mix - benevolent AIs for a resilient web
The Web We Mix - benevolent AIs for a resilient web
Fabien Gandon1.6K views
Overview of the Research in Wimmics 2018 by Fabien Gandon
Overview of the Research in Wimmics 2018Overview of the Research in Wimmics 2018
Overview of the Research in Wimmics 2018
Fabien Gandon1.4K views
Web science AI and IA by Fabien Gandon
Web science AI and IAWeb science AI and IA
Web science AI and IA
Fabien Gandon1.9K views
Normative Requirements as Linked Data by Fabien Gandon
Normative Requirements as Linked DataNormative Requirements as Linked Data
Normative Requirements as Linked Data
Fabien Gandon991 views
Wimmics Research Team Overview 2017 by Fabien Gandon
Wimmics Research Team Overview 2017Wimmics Research Team Overview 2017
Wimmics Research Team Overview 2017
Fabien Gandon4.8K views
On the many graphs of the Web and the interest of adding their missing links. by Fabien Gandon
On the many graphs of the Web and the interest of adding their missing links. On the many graphs of the Web and the interest of adding their missing links.
On the many graphs of the Web and the interest of adding their missing links.
Fabien Gandon1.5K views
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O... by Fabien Gandon
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...
One Web of pages, One Web of peoples, One Web of Services, One Web of Data, O...
Fabien Gandon1.6K views
How to supervise your supervisor? by Fabien Gandon
How to supervise your supervisor?How to supervise your supervisor?
How to supervise your supervisor?
Fabien Gandon7.3K views
Wimmics Research Team 2015 Activity Report by Fabien Gandon
Wimmics Research Team 2015 Activity ReportWimmics Research Team 2015 Activity Report
Wimmics Research Team 2015 Activity Report
Fabien Gandon5.3K views
Retours sur le MOOC "Web Sémantique et Web de données" by Fabien Gandon
Retours sur le MOOC "Web Sémantique et Web de données"Retours sur le MOOC "Web Sémantique et Web de données"
Retours sur le MOOC "Web Sémantique et Web de données"
Fabien Gandon2.4K views
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015 by Fabien Gandon
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015
Fabien Gandon1.9K views
ESWC 2015 Closing and "General Chair's minute of Madness" by Fabien Gandon
ESWC 2015 Closing and "General Chair's minute of Madness"ESWC 2015 Closing and "General Chair's minute of Madness"
ESWC 2015 Closing and "General Chair's minute of Madness"
Fabien Gandon5.5K views

Dans l'esprit du Pagerank: regards croisés sur les algorithmes,

  • 1. "Dans l'esprit du Pagerank : regards croisés sur les algorithmes" #CafeLecture - Atelier de lecture transdisciplinaire - Learning Centre SophiaTech Fabien Gandon (Directeur de recherche, Wimmics (Inria-I3S))
  • 2. « Dans l'esprit du Pagerank Une enquête sur l'algorithme de Google » Dominique Cardon, Réseaux 2013/1 (n° 177), p. 63-95. DOI 10.3917/res.177.0063 « A quoi rêvent les algorithmes Nos vies à l'heure des big data » Dominique Cardon, 01/10/2015, Coédition Seuil-La République des idées +
  • 3. L’article dans ses grandes lignes (I) Principes & Origines du PageRank en Sociométrie et Scientométrie • Citation = Vote → Lien = Vote • Métriques sur les formes relationnelles du social (centralité propre, proba stationnaire) Ax=x • « Google Juice » ou « jus de liens » pour un vote pondéré • Hypothèse d’extériorité, de neutralité et d’honnêteté
  • 4. L’article dans ses grandes lignes (II) Paradoxe: évidement omniprésent mais nécessairement ignoré • Agrégation organique d’une « sagesse des foules » • Séparation (fantasmée) des algorithmes: PageRank & Adwords • « Faites comme si on n’était pas là » / « Nous sommes incontournables » • SEO, bombing, fermes de liens, génération de textes, etc. • Aucune action éditoriale directe/ Ajustements des algorithmes (!!!)
  • 5. L’article dans ses grandes lignes (III) Limites: autorité/popularité, autres graphes (sociaux), ininterprétable
  • 8. Google est créateur de Web Tisse des liens, de la toile et ajoute des pages (résultats de recherche) Plus on est visible, plus on est lié Sur le Web l’analyse modifie l’objet
  • 9. Pas uniquement structurel • « Anchor texts » utilisés dans l’indexation • Knowledge graphs : retour du contenu structuré, contrôlé (édité) • Liens, nœuds et réseaux de plus en plus typés
  • 10. analyse des recherches intégrer les retours des utilisateurs
  • 12. Google observe le Web et les surfeurs indirections systématiques
  • 14. « Vote » : Lien = Vote • Différences de pratiques entre communautés • Incomparabilité des pratiques entres domaines, cultures, communautés • Question de l’uniformisation des traitements de « Lien-Vote » • Changements dans l’intentionnalité du lien • Très explicite au début (1990) lorsqu’il est manuel et spontané • Très différent avec son automatisation (suggestion, génération, liage, triche, etc.) • Différence d’intention explicite : Vote-Lien // Signal != trace ex. I like != Click // Data-Sublata [Latour] • Vote d’un échantillon biaisé, non représentatif • Web = "seulement" 3 milliards de d’utilisateurs et pas n’import lesquels • Les « traces et signaux » ne capturent que les connectés les autres ne laissent pas de traces et donc ne sont pas comptés • Limite de représentativité
  • 15. Sources :Internet World Stats et Google Transparency Report - 2013 Boris Beaude et Ogier Maitre - Chôros - EPFL Boris Beaude et Ogier Maitre - L'ubiquité fracturée - 2014
  • 16. « La donnée brute n’existe pas » [Livre] elle a un contexte, modèle, format, précision, etc. • La donnée est le nouveau pétrole • Relativité de la valeur (pas de cours de la donnée) • Pas extraite en pleine mer (elle appartient souvent à quelqu’un) • Pas une ressource naturelle (obtenue artificiellement) • Infiniment renouvelable (copie = instruction de base) • L’absence de modèle n’améliore pas forcément les biais (implicites, incontrôlés, etc.)
  • 19. Pagerank / h-Index: importer principes et critiques • La « recherche d’information » / « recherche scientifique » • Interprétations difficiles / erronées des métriques (c.f. « Les dérives de l’évaluation de la recherche » Y. Gingras) • Domination arbitraire d’une métrique, d’un classement, etc. Il faut, varier les métriques & documenter leur interprétation, leur principe et leurs limites. intermédiarité proximité propre degré harmonique Katz (source: Wikipedia) (PageRank)
  • 20. Tension entre adhésion et manipulation Besoin de comprendre pour interpréter, légitimer, faire confiance, … utiliser vs. Possibilité offerte de manipuler, biaiser, détourner,… rendre inutilisable • Asymétrie de l’information: • Manque de compréhension, conscience, etc. [Livre] ex. agriculteurs, « tracteurs numériques » & constructeur propriétaire données // « les données » vs. « les obtenues » ou « data » vs. « sublata » [B. Latour] • Suprématie de ceux qui peuvent créer, attirer, provoquer du lien (href, like, #tag) // campagnes de com., jeux concours, etc. // les riches deviennent plus riches • Absence d’alternatives • Limite de l’approche CNIL « un fichier= un usage fixé » // Gilles Babinet
  • 21. “people who use Mac computers spend as much as 30% more on hotels”
  • 22. surveiller la surveillance • « Diffusion d’une culture statistique »… une culture du numérique • Documenter les algorithmes: • entrées, sources, capteurs, etc. • modèles, formats, représentations, etc. • algo & paramétrage, méthodes, traitements, etc. • pilotes, collecteurs, commanditaires, programmeurs, etc. • sorties, forme, destinataires, réutilisations, etc. • objectifs visés ( principe) • Audit des algorithmes, expertises de contrôle, responsabilité. • CCNum & Conseil d’Etat obligation de loyauté des plateformes envers les utilisateurs. [Livre] • Vers une conception individualisée de la vie privée et non une définition uniforme [Livre]
  • 23. Potentiel imprévisible de la donnée une autre raison de connaitre l’objectif • Do You Smile with Your Nose? Stylistic Variation in Twitter Emoticons Tyler Schnoebelen, WWW2015 • Feutres sous les meubles = conducteur prudent // objectif d’optimisation (assurances)  objectif de solidarité (mutualités) :-) :)
  • 24. lire ou ne pas lire… les termes et conditions des applications 32 241 words18 301 words15 352 words 36 275 words19 972 words11 195 words http://conversation.which.co.uk/technology/length-of-website-terms-and-conditions/ < < < < < … documenter l’objectif mais de façon accessible
  • 26. Dérives parfois invisibles • Encourager des comportements individuels non voulus • Perceptibles: addiction vs. publicité ciblée, endoctrinement vs. bulle de filtrage, etc. • « faut-il proposer des cigarettes à un fumeur qui veut arrêter de fumer? » [Livre] • Imperceptibles: recommandation de livres vs. Bibliothérapie • Renforcer des structures sociales non souhaitées • Discrimination (ex. société raciste et offres d’emploi [Livre][Latanya Sweeney]) • Inégalités, Hiérarchies, etc. le tout invisible • Un sous-système et non un système isolé • L’hypothèse de l’isolé ne tient pas • Autres boucles de rétroaction (ex. médias classiques) A court terme nous risquons moins la suprématie d’une IA qu’une amplification aveugle des biais sociaux ou un renforcement irréfléchi des comportements individuels par une gouvernementalité algorithmique aveugle.
  • 27. Gouvernementalité algorithmique Antoinette Rouvroy • l’abandon d’« échelle », d’« étalon », de hiérarchie, au profit d’une normativité immanente et évolutive en temps réel • double statistique du monde qui semble faire table rase des anciennes hiérarchies • l’évitement des confrontations avec les individus ; occasions de subjectivation raréfiées. « Une pensée du devenir et des processus d’individuation par la relation réclame nécessairement du « disparate » - une hétérogénéité des ordres de grandeur, une multiplicité des régimes d’existence - que la gouvernementalité algorithmique ne cesse précisément d’étouffer en clôturant le réel (numérisé) sur lui-même »
  • 28. « Le probable préempte le possible » [Livre] • En nous réduisant à nos traces on nous réduit à un passé visible et surtout… on nous coupe d’un futur possible. • Suprématie de l’observable vs. besoin de réintégrer la projection, le modèle. « La carte et le paysage » • Impact sociétal du déploiement d’un algorithme sur le Web • Dimension éthique, morale, etc. • Se doter d’un projet social, politique, moral, etc.
  • 29. au-delà du PageRank • Google et tant d’autres… PageRank, EdgeRank,… • Multiplication des graphes sur le Web (liens de pages, réseaux sociaux, données liées, workflows, logs, etc.) • Besoin d’autres formes d’intelligences au-delà du raisonnement logique, de l’apprentissage statistique, etc. • In fine, un appel à la transdisciplinarité. #uca