SlideShare a Scribd company logo
1 of 19
One Index To Rule Them All
De Paul Otlet à l’internet des objets.
Ertzscheid Olivier. www.Affordance.info. Université de Nantes. Novembre 2017.
1
Préambule.
Le web a à peine plus de 25 ans.
• Aucun média n’a jamais permis de toucher autant de monde en
même temps, aussi régulièrement. Aucun média n’a jamais connu
autant de changements structurels en si peu de temps
• En moins de 25 ans le web a changé 3 fois de nature et d’objet.
• Il a changé (au moins) 3 fois d’index. 2
Le web est AVANT TOUT une histoire d’index.
A nous de faire en sorte qu’il ne devienne pas, APRÈS TOUT, une forme de mise à l’index.
• LES INDEX INCONNUS.
– Index des objets => ? … ?
– Index du génome => ? … ?
– Index des … émotions ? (web / informatique affective)
• LES INDEX CONNUS.
– Index des produits => Amazon (1994)
– Index des adresses (URL) => Yahoo! (1995)
– Index des documents => Google (1998)
– Index des profils => Facebook (2004)
3
One ring Index To Rule Them All
• Des index sur les informations et les connaissances que NOUS avons
produites. Des index bâtis sur des algorithmes que NOUS avons entraînés.
A l’aide de données que NOUS leur avons confiées. #DigitalLabor
• Ce sont les commerçants qui ont construit l’index d’Amazon :
– Index des produits => Amazon (1994)
• Ce sont les internautes qui ont construit l’index de Google et « formé »
son algorithme
– Index des documents => Google (1998)
• Ce sont les internautes qui ont fait Facebook (données servitude
volontaire)
– Index des profils => Facebook (2004)
4
On a donc plusieurs « problèmes paradoxaux ».
« Si c’est gratuit c’est vous le produit »
Si vous ne trouvez pas la solution c’est parce que c’est souvent vous le problème.
• Problème 1 : Des GAFAM / NATU / BATX que tout le monde commence à raison à trouver
effrayants et qui ne cachent pas leur ambition de réguler l’ensemble de la sphère commerciale
mais aussi publique, régalienne, politique.
• Problème 2 : Des données / pages / profils / contenus publics (ou qui pourraient rapidement le
redevenir) mais qui sont captés et - paradoxalement - rendus publics uniquement par des services
/ acteurs privés
• Problème 3 : Ces acteurs, autour de leurs index, ont fini par « propriétariser » des ressources et
des individus qui avaient vocation à rester en dehors de toute appropriation, de toute
« enclosure ». Et ils ont organisé leur mise en concurrence et des formes inédites de spéculation
(sur la langue et le vocabulaire => cf F. Kaplan et le capitalisme linguistique)
• Effet paradoxal : ces acteurs privés n’essaient même plus de garder leurs algos secrets et les
mettent en Open Source (la chaîne de valeur s’étant déplacée des algorithmes aux données*) mais
les acteurs publics ou associatifs n’arrivent pas à « passer à l’échelle ».
Résultat =>
5
* http://affordance.typepad.com//mon_weblog/2016/05/nationaliser-code-republique-algorithmique.html)
Ceux qui veulent / peuvent changer la donne ont un très gros problème de
Scalabilité / Montée en charge / Passage à l’échelle.
6
Scalabilité / Montée en charge / Passage à l’échelle.
7
ALGORITHMIQUES
Prévisibilité
Transparence
Robustesse
Bostrom et Yudowsky, 2011, « The Ethics of Artificial Intelligence » : « Les algorithmes de plus en plus complexes de prise de décision sont à la
fois souhaitables et inévitables, tant qu'ils restent transparents à l'inspection, prévisibles pour ceux qu'ils gouvernent, et robustes contre toute
manipulation. »
No-Go Zones Algorithmiques
8
On fait
quoi ?
9
On réinvente
le rêve d’Otlet
10
Réinventer le rêve d’Otlet
• Il était : « l’homme qui voulait classer le monde ».
– Nous avons des sociétés commerciales qui y sont parvenues ; mais sur les bases d’un capitalisme linguistique
dont la version triviale consiste à dire que la langue, que les mots ont une valeur marchande qui l’emporte sur
leur sens et a pour seule vocation de permettre la mise en concurrence de ressources et d’individus et à s’enrichir
de la spéculation qu’ils organisent et contrôlent.
• Il pensait que le document, que la documentation avait un rôle déterminant à jouer dans la
pacification du monde.
– Nous avons des sociétés qui dessinent le projet politique fasciste de nouveaux « sous-hommes » sans documents
(http://affordance.typepad.com/mon_weblog/2017/02/undocumented-men.html) face à de nouveaux « sur-
hommes » sur-documentés.
11
Source de l’image : http://globalnation.inquirer.net/119385/undocumented-california-youth-can-get-health-care-but-many-dont-know-it
On fait
comment ?
12
On crée un index
in-dé-pen-dant.
• C’est quoi l’idée ? Recréer les conditions d’une concurrence algorithmique saine.
• Pas de concurrence car impossible (trop coûteux) pour « petits acteurs industriels » de maintenir un index complet et à
jour du web (sauf pour Google et Microsoft) => Monopole => TINA (There Is No Alternative) => En attendant Godot un
Google Killer qui ne viendra pas.
• Pour recréer les conditions d’une concurrence il faut, pour le web, un index indépendant, qui réponde à 3 conditions :
– être ouvert et accessible à tout le monde.
– à des conditions équitables (= Accès à l’index gratuit + accès payant à l’API sauf pour projets « non-profit »).
– l’accès doit être « complet » (on doit accéder au texte intégral, pas simplement à une « vue » du document). Il ne
doit pas y avoir de « limites » à l’extraction de documents.
• Lewandowski : « an ideology free-ranking algorithm is not possible and would also not be desirable. (…) We should
trive for diversity achieved through multiple ranking algorithms competing against one another. »
13
« Why we need an independant index of the web »
https://arxiv.org/abs/1405.2212 Mai 2014.
Pourquoi ce n’est pas si compliqué que ça ?
(et pourquoi c’est urgent aussi …)
• TECHNIQUEMENT
• Parce que toutes technos du web sont dans le domaine public depuis le 30 Avril 1993.
• Parce qu’en plus la plupart des algos et des technos d’IA portées par les GAFAM sont aussi en Open
Source.
• CÔTÉ CONTENUS
• Parce que plusieurs pièces du puzzle n’attendent que d’être rassemblées : Hathi Trust (copie
suffisamment significative de la base de donnée Google Books), fondation Internet Archive, Common
Crawl, Dépôt légal du Web, Gallica / BnF, INA, Archives Ouvertes, WorldCat … + ressources propres (des
archives et des bases de données de chaque titre de presse nationale, de PQR, de chaque bibliothèque,
de chaque université, de chaque entreprise, etc).
• SOCIOLOGIQUEMENT ET POLITIQUEMENT
• Parce que les gens sont (presque) prêts. Ils ont en tout cas conscience du problème.
• COMMERCIALEMENT
• Parce qu’une offre alternative existe (Qwant, CHATONS, Framasoft, Degooglisons, DuckDuckGo) et a
besoin de passer à l’échelle
• OUI MAIS ÇA VA COÛTER CHER …
• Oui. Mais on a l’argent. Et ça vaut le coup non ?
• Et puis …
14
15
Paul Otlet n’est pas vraiment arrivé à réaliser son rêve
mais il nous a laissé ça :
• « Les buts de la documentation consistent à
pouvoir offrir sur tout ordre de fait et de
connaissance, des informations documentées :
1. universelles quant à leur objet
2. sûres et vraies
3. complètes,
4. rapides,
5. à jour
6. faciles à obtenir
7. réunies d’avance et prêtes à être communiquées,
8. mises à la disposition du plus grand nombre ».
16
Si nous n’arrivons pas à réaliser le rêve d’Otlet
• Nous aurons des informations uniquement
1. universelles quant à leur objet
2. sûres et vraies
3. complètes,
4. rapides,
5. à jour
6. faciles à obtenir
7. réunies d’avance et prêtes à être communiquées,
8. mises à la disposition du plus grand nombre
• Nous aurons donc raté l’essentiel.
17
Et c’est déjà très problématique.
18• https://www.theguardian.com/commentisfree/2016/dec/11/google-frames-shapes-and-distorts-how-we-see-world
On est passé du problème du jaguar (comment choisir un sens plutôt qu’un
autre) au problème de l’holocauste (comment savoir ce qui a du sens).
Les algorithmes n’y arriveront pas seuls. Et il ne faut pas laisser ces enjeux aux
seules mains des GAFA.
Il nous faut un index indépendant du web. Envisagé comme un commun de la
connaissance à part entière.
Index des documents Index des profils Index indépendant ;-)
19Merci de votre attention
Moralité ?

More Related Content

What's hot

Podcast cult-num-1-2-3
Podcast cult-num-1-2-3Podcast cult-num-1-2-3
Podcast cult-num-1-2-3olivier
 
Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?olivier
 
Monde selon Zuckerberg
Monde selon ZuckerbergMonde selon Zuckerberg
Monde selon Zuckerbergolivier
 
memoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-webmemoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-webolivier
 
Abf clermont-oe
Abf clermont-oeAbf clermont-oe
Abf clermont-oeolivier
 
Objets-connectes
Objets-connectesObjets-connectes
Objets-connectesolivier
 
Fadben ertzscheid-olivier
Fadben ertzscheid-olivierFadben ertzscheid-olivier
Fadben ertzscheid-olivierolivier
 
Forum medias-ertzscheid
Forum medias-ertzscheidForum medias-ertzscheid
Forum medias-ertzscheidolivier
 
Editorialisation
EditorialisationEditorialisation
Editorialisationolivier
 
Fif 85-ertzscheid
Fif 85-ertzscheidFif 85-ertzscheid
Fif 85-ertzscheidolivier
 
Montaigu web-ouvert-def
Montaigu web-ouvert-defMontaigu web-ouvert-def
Montaigu web-ouvert-defolivier
 
Attac-appetit-geants
Attac-appetit-geantsAttac-appetit-geants
Attac-appetit-geantsolivier
 
Ertzscheid Ehess
Ertzscheid EhessErtzscheid Ehess
Ertzscheid Ehessolivier
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copieolivier
 
Reseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oeReseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oeolivier
 
appetit-geants-ertzscheid
appetit-geants-ertzscheidappetit-geants-ertzscheid
appetit-geants-ertzscheidolivier
 
Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?olivier
 
Les bibliotheques numeriques
Les bibliotheques numeriquesLes bibliotheques numeriques
Les bibliotheques numeriquesolivier
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.olivier
 
FakeNews
FakeNewsFakeNews
FakeNewsolivier
 

What's hot (20)

Podcast cult-num-1-2-3
Podcast cult-num-1-2-3Podcast cult-num-1-2-3
Podcast cult-num-1-2-3
 
Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?
 
Monde selon Zuckerberg
Monde selon ZuckerbergMonde selon Zuckerberg
Monde selon Zuckerberg
 
memoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-webmemoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-web
 
Abf clermont-oe
Abf clermont-oeAbf clermont-oe
Abf clermont-oe
 
Objets-connectes
Objets-connectesObjets-connectes
Objets-connectes
 
Fadben ertzscheid-olivier
Fadben ertzscheid-olivierFadben ertzscheid-olivier
Fadben ertzscheid-olivier
 
Forum medias-ertzscheid
Forum medias-ertzscheidForum medias-ertzscheid
Forum medias-ertzscheid
 
Editorialisation
EditorialisationEditorialisation
Editorialisation
 
Fif 85-ertzscheid
Fif 85-ertzscheidFif 85-ertzscheid
Fif 85-ertzscheid
 
Montaigu web-ouvert-def
Montaigu web-ouvert-defMontaigu web-ouvert-def
Montaigu web-ouvert-def
 
Attac-appetit-geants
Attac-appetit-geantsAttac-appetit-geants
Attac-appetit-geants
 
Ertzscheid Ehess
Ertzscheid EhessErtzscheid Ehess
Ertzscheid Ehess
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copie
 
Reseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oeReseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oe
 
appetit-geants-ertzscheid
appetit-geants-ertzscheidappetit-geants-ertzscheid
appetit-geants-ertzscheid
 
Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?
 
Les bibliotheques numeriques
Les bibliotheques numeriquesLes bibliotheques numeriques
Les bibliotheques numeriques
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
 
FakeNews
FakeNewsFakeNews
FakeNews
 

Viewers also liked

Identite numerique
Identite numeriqueIdentite numerique
Identite numeriqueolivier
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseolivier
 
Internet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiInternet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiolivier
 
blogs-scientifiques
blogs-scientifiquesblogs-scientifiques
blogs-scientifiquesolivier
 
l'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmel'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmeolivier
 
identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademiqueolivier
 
Histoire et réforme de l’orthographe
Histoire et réforme de l’orthographeHistoire et réforme de l’orthographe
Histoire et réforme de l’orthographeolivier
 
Rennes-archive-ertzscheid
Rennes-archive-ertzscheidRennes-archive-ertzscheid
Rennes-archive-ertzscheidolivier
 
Editorialisation algorithmique
Editorialisation algorithmiqueEditorialisation algorithmique
Editorialisation algorithmiqueolivier
 
Pecha kucha-ertzscheid
Pecha kucha-ertzscheidPecha kucha-ertzscheid
Pecha kucha-ertzscheidolivier
 
Digital Detox
Digital DetoxDigital Detox
Digital Detoxolivier
 
Identite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociauxIdentite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociauxolivier
 
Veille rennes-def-oe
Veille rennes-def-oeVeille rennes-def-oe
Veille rennes-def-oeolivier
 
La médiation à l'heure du numérique
La médiation à l'heure du numériqueLa médiation à l'heure du numérique
La médiation à l'heure du numériqueolivier
 
Jounee numerique
Jounee numeriqueJounee numerique
Jounee numeriqueolivier
 

Viewers also liked (17)

Identite numerique
Identite numeriqueIdentite numerique
Identite numerique
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masse
 
Identité numérique et e réputation
Identité numérique et e réputationIdentité numérique et e réputation
Identité numérique et e réputation
 
Internet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiInternet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploi
 
blogs-scientifiques
blogs-scientifiquesblogs-scientifiques
blogs-scientifiques
 
l'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmel'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mème
 
identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademique
 
Elpenor
ElpenorElpenor
Elpenor
 
Histoire et réforme de l’orthographe
Histoire et réforme de l’orthographeHistoire et réforme de l’orthographe
Histoire et réforme de l’orthographe
 
Rennes-archive-ertzscheid
Rennes-archive-ertzscheidRennes-archive-ertzscheid
Rennes-archive-ertzscheid
 
Editorialisation algorithmique
Editorialisation algorithmiqueEditorialisation algorithmique
Editorialisation algorithmique
 
Pecha kucha-ertzscheid
Pecha kucha-ertzscheidPecha kucha-ertzscheid
Pecha kucha-ertzscheid
 
Digital Detox
Digital DetoxDigital Detox
Digital Detox
 
Identite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociauxIdentite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociaux
 
Veille rennes-def-oe
Veille rennes-def-oeVeille rennes-def-oe
Veille rennes-def-oe
 
La médiation à l'heure du numérique
La médiation à l'heure du numériqueLa médiation à l'heure du numérique
La médiation à l'heure du numérique
 
Jounee numerique
Jounee numeriqueJounee numerique
Jounee numerique
 

Similar to Index independant du web ertzscheid

Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteursolivier
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptxolivier
 
Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Coraia
 
Logiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheursLogiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheurspyg
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Charles Ruelle
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Philippe METAYER
 
Open data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospectiveOpen data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospectiveSilvère Mercier
 
Le renseignement humain augmenté
Le renseignement humain augmentéLe renseignement humain augmenté
Le renseignement humain augmentéTerry ZIMMER
 
Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014EricVion
 
Formation documentation movilab
Formation documentation movilabFormation documentation movilab
Formation documentation movilabYoann Duriaux
 
Atelier juriconnexion 2009
Atelier juriconnexion 2009Atelier juriconnexion 2009
Atelier juriconnexion 2009Geemik
 
Plateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprisePlateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entrepriseCecil Dijoux
 
Design, données personnelles et vie privée
Design, données personnelles et vie privéeDesign, données personnelles et vie privée
Design, données personnelles et vie privéeSylvia Fredriksson
 
Fork les gouvernements
Fork les gouvernementsFork les gouvernements
Fork les gouvernementsAudrey Tang
 

Similar to Index independant du web ertzscheid (20)

Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
 
Oeinria
OeinriaOeinria
Oeinria
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
 
Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)
 
Movilab en 2020
Movilab en 2020Movilab en 2020
Movilab en 2020
 
Logiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheursLogiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheurs
 
9 louis montagne af83
9 louis montagne af839 louis montagne af83
9 louis montagne af83
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Coex12 - Je l'ai trouvé sur internet
Coex12 - Je l'ai trouvé sur internetCoex12 - Je l'ai trouvé sur internet
Coex12 - Je l'ai trouvé sur internet
 
Open data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospectiveOpen data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospective
 
Conference efb 190112
Conference efb 190112Conference efb 190112
Conference efb 190112
 
Le renseignement humain augmenté
Le renseignement humain augmentéLe renseignement humain augmenté
Le renseignement humain augmenté
 
Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014
 
Formation documentation movilab
Formation documentation movilabFormation documentation movilab
Formation documentation movilab
 
Atelier juriconnexion 2009
Atelier juriconnexion 2009Atelier juriconnexion 2009
Atelier juriconnexion 2009
 
Plateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprisePlateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprise
 
Design, données personnelles et vie privée
Design, données personnelles et vie privéeDesign, données personnelles et vie privée
Design, données personnelles et vie privée
 
Fork les gouvernements
Fork les gouvernementsFork les gouvernements
Fork les gouvernements
 
Ibrain
IbrainIbrain
Ibrain
 

More from olivier

IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.olivier
 
programme-iut-collectif.pdf
programme-iut-collectif.pdfprogramme-iut-collectif.pdf
programme-iut-collectif.pdfolivier
 
libre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptxlibre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptxolivier
 
Bruire-2
Bruire-2Bruire-2
Bruire-2olivier
 
communiquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxcommuniquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxolivier
 
Le web a la carte
Le web a la carteLe web a la carte
Le web a la carteolivier
 
education-reseaux-sociaux
education-reseaux-sociauxeducation-reseaux-sociaux
education-reseaux-sociauxolivier
 
Revue Bruire
Revue BruireRevue Bruire
Revue Bruireolivier
 
Fenetre sur-cours
Fenetre sur-coursFenetre sur-cours
Fenetre sur-coursolivier
 
Le Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.tricesLe Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.tricesolivier
 
Google Books Milestones
Google Books MilestonesGoogle Books Milestones
Google Books Milestonesolivier
 
Communication-reseaux-sociaux
Communication-reseaux-sociauxCommunication-reseaux-sociaux
Communication-reseaux-sociauxolivier
 
Obsolescence-programmee
Obsolescence-programmeeObsolescence-programmee
Obsolescence-programmeeolivier
 
Presidentielle-google-suggest
Presidentielle-google-suggestPresidentielle-google-suggest
Presidentielle-google-suggestolivier
 
Lutter contre la haine
Lutter contre la haineLutter contre la haine
Lutter contre la haineolivier
 
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016olivier
 

More from olivier (16)

IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
 
programme-iut-collectif.pdf
programme-iut-collectif.pdfprogramme-iut-collectif.pdf
programme-iut-collectif.pdf
 
libre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptxlibre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptx
 
Bruire-2
Bruire-2Bruire-2
Bruire-2
 
communiquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxcommuniquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptx
 
Le web a la carte
Le web a la carteLe web a la carte
Le web a la carte
 
education-reseaux-sociaux
education-reseaux-sociauxeducation-reseaux-sociaux
education-reseaux-sociaux
 
Revue Bruire
Revue BruireRevue Bruire
Revue Bruire
 
Fenetre sur-cours
Fenetre sur-coursFenetre sur-cours
Fenetre sur-cours
 
Le Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.tricesLe Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.trices
 
Google Books Milestones
Google Books MilestonesGoogle Books Milestones
Google Books Milestones
 
Communication-reseaux-sociaux
Communication-reseaux-sociauxCommunication-reseaux-sociaux
Communication-reseaux-sociaux
 
Obsolescence-programmee
Obsolescence-programmeeObsolescence-programmee
Obsolescence-programmee
 
Presidentielle-google-suggest
Presidentielle-google-suggestPresidentielle-google-suggest
Presidentielle-google-suggest
 
Lutter contre la haine
Lutter contre la haineLutter contre la haine
Lutter contre la haine
 
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
 

Recently uploaded

Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxpopzair
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.docKarimKhrifech
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxlamourfrantz
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurdinaelchaine
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptxMalikaIdseaid1
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptxTxaruka
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 

Recently uploaded (20)

Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptx
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.doc
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Pâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie PelletierPâques de Sainte Marie-Euphrasie Pelletier
Pâques de Sainte Marie-Euphrasie Pelletier
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptx
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteur
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptx
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
Fondation Louis Vuitton. pptx
Fondation      Louis      Vuitton.   pptxFondation      Louis      Vuitton.   pptx
Fondation Louis Vuitton. pptx
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 

Index independant du web ertzscheid

  • 1. One Index To Rule Them All De Paul Otlet à l’internet des objets. Ertzscheid Olivier. www.Affordance.info. Université de Nantes. Novembre 2017. 1
  • 2. Préambule. Le web a à peine plus de 25 ans. • Aucun média n’a jamais permis de toucher autant de monde en même temps, aussi régulièrement. Aucun média n’a jamais connu autant de changements structurels en si peu de temps • En moins de 25 ans le web a changé 3 fois de nature et d’objet. • Il a changé (au moins) 3 fois d’index. 2
  • 3. Le web est AVANT TOUT une histoire d’index. A nous de faire en sorte qu’il ne devienne pas, APRÈS TOUT, une forme de mise à l’index. • LES INDEX INCONNUS. – Index des objets => ? … ? – Index du génome => ? … ? – Index des … émotions ? (web / informatique affective) • LES INDEX CONNUS. – Index des produits => Amazon (1994) – Index des adresses (URL) => Yahoo! (1995) – Index des documents => Google (1998) – Index des profils => Facebook (2004) 3
  • 4. One ring Index To Rule Them All • Des index sur les informations et les connaissances que NOUS avons produites. Des index bâtis sur des algorithmes que NOUS avons entraînés. A l’aide de données que NOUS leur avons confiées. #DigitalLabor • Ce sont les commerçants qui ont construit l’index d’Amazon : – Index des produits => Amazon (1994) • Ce sont les internautes qui ont construit l’index de Google et « formé » son algorithme – Index des documents => Google (1998) • Ce sont les internautes qui ont fait Facebook (données servitude volontaire) – Index des profils => Facebook (2004) 4
  • 5. On a donc plusieurs « problèmes paradoxaux ». « Si c’est gratuit c’est vous le produit » Si vous ne trouvez pas la solution c’est parce que c’est souvent vous le problème. • Problème 1 : Des GAFAM / NATU / BATX que tout le monde commence à raison à trouver effrayants et qui ne cachent pas leur ambition de réguler l’ensemble de la sphère commerciale mais aussi publique, régalienne, politique. • Problème 2 : Des données / pages / profils / contenus publics (ou qui pourraient rapidement le redevenir) mais qui sont captés et - paradoxalement - rendus publics uniquement par des services / acteurs privés • Problème 3 : Ces acteurs, autour de leurs index, ont fini par « propriétariser » des ressources et des individus qui avaient vocation à rester en dehors de toute appropriation, de toute « enclosure ». Et ils ont organisé leur mise en concurrence et des formes inédites de spéculation (sur la langue et le vocabulaire => cf F. Kaplan et le capitalisme linguistique) • Effet paradoxal : ces acteurs privés n’essaient même plus de garder leurs algos secrets et les mettent en Open Source (la chaîne de valeur s’étant déplacée des algorithmes aux données*) mais les acteurs publics ou associatifs n’arrivent pas à « passer à l’échelle ». Résultat => 5 * http://affordance.typepad.com//mon_weblog/2016/05/nationaliser-code-republique-algorithmique.html)
  • 6. Ceux qui veulent / peuvent changer la donne ont un très gros problème de Scalabilité / Montée en charge / Passage à l’échelle. 6
  • 7. Scalabilité / Montée en charge / Passage à l’échelle. 7
  • 8. ALGORITHMIQUES Prévisibilité Transparence Robustesse Bostrom et Yudowsky, 2011, « The Ethics of Artificial Intelligence » : « Les algorithmes de plus en plus complexes de prise de décision sont à la fois souhaitables et inévitables, tant qu'ils restent transparents à l'inspection, prévisibles pour ceux qu'ils gouvernent, et robustes contre toute manipulation. » No-Go Zones Algorithmiques 8
  • 10. On réinvente le rêve d’Otlet 10
  • 11. Réinventer le rêve d’Otlet • Il était : « l’homme qui voulait classer le monde ». – Nous avons des sociétés commerciales qui y sont parvenues ; mais sur les bases d’un capitalisme linguistique dont la version triviale consiste à dire que la langue, que les mots ont une valeur marchande qui l’emporte sur leur sens et a pour seule vocation de permettre la mise en concurrence de ressources et d’individus et à s’enrichir de la spéculation qu’ils organisent et contrôlent. • Il pensait que le document, que la documentation avait un rôle déterminant à jouer dans la pacification du monde. – Nous avons des sociétés qui dessinent le projet politique fasciste de nouveaux « sous-hommes » sans documents (http://affordance.typepad.com/mon_weblog/2017/02/undocumented-men.html) face à de nouveaux « sur- hommes » sur-documentés. 11 Source de l’image : http://globalnation.inquirer.net/119385/undocumented-california-youth-can-get-health-care-but-many-dont-know-it
  • 13. On crée un index in-dé-pen-dant. • C’est quoi l’idée ? Recréer les conditions d’une concurrence algorithmique saine. • Pas de concurrence car impossible (trop coûteux) pour « petits acteurs industriels » de maintenir un index complet et à jour du web (sauf pour Google et Microsoft) => Monopole => TINA (There Is No Alternative) => En attendant Godot un Google Killer qui ne viendra pas. • Pour recréer les conditions d’une concurrence il faut, pour le web, un index indépendant, qui réponde à 3 conditions : – être ouvert et accessible à tout le monde. – à des conditions équitables (= Accès à l’index gratuit + accès payant à l’API sauf pour projets « non-profit »). – l’accès doit être « complet » (on doit accéder au texte intégral, pas simplement à une « vue » du document). Il ne doit pas y avoir de « limites » à l’extraction de documents. • Lewandowski : « an ideology free-ranking algorithm is not possible and would also not be desirable. (…) We should trive for diversity achieved through multiple ranking algorithms competing against one another. » 13 « Why we need an independant index of the web » https://arxiv.org/abs/1405.2212 Mai 2014.
  • 14. Pourquoi ce n’est pas si compliqué que ça ? (et pourquoi c’est urgent aussi …) • TECHNIQUEMENT • Parce que toutes technos du web sont dans le domaine public depuis le 30 Avril 1993. • Parce qu’en plus la plupart des algos et des technos d’IA portées par les GAFAM sont aussi en Open Source. • CÔTÉ CONTENUS • Parce que plusieurs pièces du puzzle n’attendent que d’être rassemblées : Hathi Trust (copie suffisamment significative de la base de donnée Google Books), fondation Internet Archive, Common Crawl, Dépôt légal du Web, Gallica / BnF, INA, Archives Ouvertes, WorldCat … + ressources propres (des archives et des bases de données de chaque titre de presse nationale, de PQR, de chaque bibliothèque, de chaque université, de chaque entreprise, etc). • SOCIOLOGIQUEMENT ET POLITIQUEMENT • Parce que les gens sont (presque) prêts. Ils ont en tout cas conscience du problème. • COMMERCIALEMENT • Parce qu’une offre alternative existe (Qwant, CHATONS, Framasoft, Degooglisons, DuckDuckGo) et a besoin de passer à l’échelle • OUI MAIS ÇA VA COÛTER CHER … • Oui. Mais on a l’argent. Et ça vaut le coup non ? • Et puis … 14
  • 15. 15
  • 16. Paul Otlet n’est pas vraiment arrivé à réaliser son rêve mais il nous a laissé ça : • « Les buts de la documentation consistent à pouvoir offrir sur tout ordre de fait et de connaissance, des informations documentées : 1. universelles quant à leur objet 2. sûres et vraies 3. complètes, 4. rapides, 5. à jour 6. faciles à obtenir 7. réunies d’avance et prêtes à être communiquées, 8. mises à la disposition du plus grand nombre ». 16
  • 17. Si nous n’arrivons pas à réaliser le rêve d’Otlet • Nous aurons des informations uniquement 1. universelles quant à leur objet 2. sûres et vraies 3. complètes, 4. rapides, 5. à jour 6. faciles à obtenir 7. réunies d’avance et prêtes à être communiquées, 8. mises à la disposition du plus grand nombre • Nous aurons donc raté l’essentiel. 17
  • 18. Et c’est déjà très problématique. 18• https://www.theguardian.com/commentisfree/2016/dec/11/google-frames-shapes-and-distorts-how-we-see-world On est passé du problème du jaguar (comment choisir un sens plutôt qu’un autre) au problème de l’holocauste (comment savoir ce qui a du sens). Les algorithmes n’y arriveront pas seuls. Et il ne faut pas laisser ces enjeux aux seules mains des GAFA. Il nous faut un index indépendant du web. Envisagé comme un commun de la connaissance à part entière.
  • 19. Index des documents Index des profils Index indépendant ;-) 19Merci de votre attention Moralité ?