Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Gestion des donnees personnelles.

9,471 views

Published on

Conférence dans la cadre de l'école d'été en architecture de l'information. Moteurs et réseaux sociaux : quelle clef de voûte pour une architecture de l'information ?

Published in: Education, Business
  • Be the first to comment

Gestion des donnees personnelles.

  1. 1. Gestion des données personnelles Lyon-Montréal. 13 Mai 2011 Olivier Ertzscheid // Maître de conférences // Sciences de l’information et de la communication // Université de Nantes // IUT La Roche sur Yon Site : http://www.affordance.info Moteurs et réseaux sociaux Quelle clef de voûte pour une architecture de l’information ?
  2. 2. Le pitch <ul><li>CONSTAT. </li></ul><ul><ul><li>Le web : un gigantesque entrepôt de données en mouvement. </li></ul></ul><ul><ul><li>Dont des données « personnelles ». Beaucoup. </li></ul></ul><ul><ul><li>Les moteurs et les réseaux sociaux s’en nourrissent. </li></ul></ul><ul><ul><li>Nous les alimentons sans cesse. </li></ul></ul><ul><li>QUESTIONS. </li></ul><ul><ul><li>Pourquoi ? </li></ul></ul><ul><ul><li>D’où viennent ces données ? </li></ul></ul><ul><ul><li>Comment sont-elles traitées ? Dans quel but ? </li></ul></ul><ul><ul><li>Comment les « données personnelles » en sont-elles venues à occuper une telle place dans un média de masse numérique ? </li></ul></ul><ul><ul><li>Que changent-elles dans « les » pratiques documentaires ? Dans nos représentations de la documentation et de l’information ? </li></ul></ul>
  3. 3. PRÉAMBULE 1934. 1978. 2011.
  4. 4. 1934. Paul Otlet. Traité de documentation. Architecture de l’information = « traitement documentaire »
  5. 5. 1978. Le projet SAFARI <ul><li>projet des années 70 d’interconnexion des administrations à partir d’un matricule commun dont le rejet avait été à l’origine de la loi &quot;Informatique, fichiers et libertés&quot; du 6 janvier 1978. </li></ul><ul><li>http://www.legalis.net/breves-article.php3?id_article=870 </li></ul>INTERCONNEXION
  6. 6. 2011. La famille des données documentaires s’agrandit ...
  7. 7. Plus qu’interconnectées, des données réunifiées 1995 2005 2011 Web public Web privé Web « invisible » Web personnel (Desktop) Web intime (Mail) indexé non-indexé Dérive des continents documentaires, des « gisements de données » Web public Web privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs) Web public Web privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs)
  8. 8. ARCHITECTURE DE L’INFORMATION
  9. 9. Architecture ? « L’architecture, c’est ce qui reste de l’édifice, une fois la pierre ôtée. » Plotin.
  10. 10. Architecture de l’information ? « L’architecture de l’information, c’est ce qui reste une fois l’information ôtée. » du système de la navigation de la recherche de l’infrastructure des données
  11. 11. Archi de l’info selon Google <ul><li>Une architecture de serveurs (datacenters) </li></ul><ul><li>Une architecture de pages (PageRank) </li></ul><ul><li>Une architecture de relations (liens entre les pages) </li></ul><ul><li>Lectures industrielles </li></ul><ul><li>Ecosystème ouvert (galaxie de services) et entonnoir central </li></ul><ul><li>Une indexation d’info documentaires + ingénierie « de popularité » (procède par agglutination) </li></ul>Archi de l’info selon Facebook <ul><li>Une architecture de serveurs (datacenters) </li></ul><ul><li>Une architecture de profils (graphe social) </li></ul><ul><li>Une architecture de relations (liens entre les profils) </li></ul><ul><li>Industrialisation de l’intime </li></ul><ul><li>Ecosystème fermé avec droit de douanes pour services tiers. </li></ul><ul><li>Une collecte d’informations personnelles déclaratives + ingénierie virale (procède par contamination) </li></ul>2 écoles ? Similarités Différences
  12. 12. Degré zéro de l’architecture de l’info Navigation Données Serveurs & Datacenters Services
  13. 13. Architecture de l’info 1.0 Architecture de l’info 2.0 Le portail du visible La clé vers l’invisible Données Données ???
  14. 14. Architecture de l’info 2.0 Navigation Datacenters Serveurs
  15. 15. Architecture de l’info 2.0 Services Services Services
  16. 16. Architecture de l’info 2.0 Données Données Données Données
  17. 17. Architecture de l’information Entre design ... (services, navigation, etc.) Et industrie lourde (infrastructures, datacenters, gisements de données etc.)
  18. 18. DESIGN & FOUILLE DE DONNÉES
  19. 19. Design visible <ul><li>Ravalement de façade </li></ul><ul><li>Logos (colorés), Coins (arrondis), Couleurs (pastels), Polices (typos), etc. </li></ul>Design invisible <ul><li>Ergonomie « souterraine » </li></ul><ul><li>Rich snippets, Microformats, RDF </li></ul><ul><li>Web-Services </li></ul><ul><li>Web socio-sémantique </li></ul>Expérience utilisateur. Clic gagnant + LOOK... and ... FEEL
  20. 20. Design de données (exemples) « Journalisme de données » http://data.owni.fr Générateur de visualisations. http://www-958.ibm.com/software/data/cognos/manyeyes/ Nouvelle(s) expérience(s) documentaire(s)
  21. 21. Fouille de données : du datamining au web-mining Mr Google Mr Facebook données Privacy zone
  22. 22. Les nouvelles mines sont ... dans les nuages
  23. 23. Données sont aussi des métadonnées <ul><li>Géolocalisation sur Foursquare + partage dans Facebook </li></ul><ul><ul><li>Données : latitude, longitude, horaire, nom du bar lounge. </li></ul></ul><ul><ul><li>Métadonnées : comportementales </li></ul></ul><ul><li>Recherche d’info sur Google </li></ul><ul><ul><li>Ma requête sur Google = donnée « mot-clé » </li></ul></ul><ul><ul><li>Toutes mes requêtes sur Google (historique) = métadonnées documentaires </li></ul></ul>Question de point de vue
  24. 24. Avant, pendant, après. Des données sur tout. Des données partout. Des données pour tout. A. Mes données et leur historique (déclaratives, comport. et techniques) B. Les données de mes proches Couche Ingénieries relationnelles C. Les données de tout le monde Passage à l’échelle (statistique) Mes données et celles de mes proches (A and B) Mes données ou celles de mes proches et celles de tout le monde (A or B) and C Mes données et celles de tout le monde (A and C) Les données de mes proches et celles de tout le monde (B and C) Sur un site marchand AMAZON.COM Données « natives » « intentions d’achat », « préférences » Sur un site social FACEBOOK.COM Données « captives » Rétention « amis, groupes, réseaux » Dans 1 écosystème ouvert de sites GOOGLE / YOUTUBE / GMAIL Données natives et « moissonnées » Que possèdent-ils ?? Des données Qu’en font-ils ?? Des croisements Comment procèdent-ils ?? Par captation Que produisent-ils ? D’autres données, de la richesse et de la redocumentarisation
  25. 25. 1 er exemple.
  26. 26. « Données » 1. Documents d’identité
  27. 27. 2. Documenter l’identité « Information »
  28. 28. 3. « Redocumentariser » l’identité «  Redocumentariser, c’est documentariser à nouveau un document ou une collection en permettant à un bénéficiaire de réarticuler les contenus sémiotiques selon son interprétation et ses usages.  » Manuel Zacklad in « Eléments théoriques pour l’étude des pratiques grand public de la documentarisation : réseaux et communautés d’imaginaire » « connaissances »
  29. 29. Redocumentarisation par l’exemple : Facebook EST L’interface « 1 » identité documentée documentaire « n » profils « x » profondeurs
  30. 30. LA GUERRE DES DONNÉES
  31. 31. Données personnelles ? DES DONNEES « Ensemble des informations qui permettent sous quelque forme que ce soit, directement ou non, l’identification des personnes physiques auxquelles elles se rapportent ». DES TRAITEMENTS « toute opération ou ensemble d’opérations portant sur des données à caractère personnel, quel que soit le procédé utilisé ». Collecte, enregistrement, conservation, adaptation, modification, extraction, consultation, utilisation, communication par transmission, diffusion ou toute autre forme de mise à disposition, le rapprochement ou l’interconnexion, ainsi que le verrouillage, l’effacement ou la destruction » Lionel MAUREL Techniques : Adresse IP, Cookies ... Déclaratives : mon profil facebook, date de naissance ... Navigationnelles : requêtes, types d’achats ... Comportementales (diachroniques) : historique de recherche
  32. 32. C’est la loi INFORMATION. La loi impose d’informer les personnes « fichées » que des données nominatives les concernant sont collectées DROIT DE RETRAIT. NON-DIVULGATION À DES TIERS. DATE LIMITE DE VALIDITÉ . SOURCE : LIONEL MAUREL C’est le business Pot de terre des législations nationales contre ... (jack)pot de fer de la dérégulation des marchés
  33. 33. Fichiers « log » A chaque fois qu’un utilisateur se connecte, le serveur enregistre un log. 123.45.67.89 - 25/Mar/2007 10:15:32 - http://www.google.com/search?q=flowers - Firefox 2.0.0.7; Windows NT 5.1 - dac465aa86edd2dc <ul><li>«  This idea that a cookie is nonpersonal information no longer really applies in this digital age. You don't need to know a person's name to know a person — to understand their likes and their dislikes, the contents of what they read, what they put in their shopping cart. It's really personal now.  » Jeff Chester, directeur exécutif du Center for Digital Democracy </li></ul><ul><li>Personna numerique VS DATA </li></ul>COOKIES De 2003 à 2005, Google cookie expirant en 2038 ... Préconisations G29 (rassemblement CNIL européennes) : 6 mois Google : Adresse IP « anonymisée » au bout de 9 mois (2 derniers chiffres seulement) Cookies supprimés au bout de 18 mois Microsoft : cookies supprimés au bout de 6 mois Petites machineries entre amis.
  34. 34. Pacte Faustien ?? <ul><li>Pourquoi cette quête de données personnelles ? </li></ul><ul><ul><li>Pour lutter contre l’infobésité (personnalisation) </li></ul></ul><ul><ul><li>Pour maintenir un modèle économique (marketing ciblé, pub. contextuelle) </li></ul></ul><ul><ul><li>Pour améliorer l’expérience utilisateur (personnalisation) </li></ul></ul>
  35. 35. Participation active ... et massive !!!
  36. 36. Base de donnée des intentions (John Battelle) « We don’t need taxonomy of knowledge. We need taxonomy of desire, a marketplace of intent » Prabhakar Raghavan. Head of Research and Strategy chez Yahoo! Sept. 2008
  37. 37. Le carré magique des usages SHOPPING (digital cameras) HEALTH (Diabetes) TRAVEL (United 875) LOCAL (French Restaurant)
  38. 38. Recherche Universelle : le principe
  39. 39. <ul><li>Données « personnelles, sociales » (mes amis, mes amours, mes emmerdes) ? Territoires de socialisation </li></ul><ul><li>Données intentionnelles (achat, déplacement, sorties, restaurant) ? Territoire du marketing </li></ul><ul><li>Données documentaires (textes, statuts, articles, photos, vidéos, tags ...) ? Territoire de la qualification </li></ul>La guerre des données ?
  40. 40.
  41. 41. 2 ème exemple.
  42. 42. La guerre des carnets d’adresses <ul><li>Mais d’abord une devinette. </li></ul><ul><li>Bataille Google / Facebook. </li></ul><ul><li>Enjeu : amorçage. </li></ul><ul><li>Résultat : [email_address] </li></ul><ul><li>Courriel = cheval de troie idéal de nos pratiques connectées. Pourquoi ? </li></ul><ul><ul><li>&quot;synthétise&quot; notre réseau relationnel (nos &quot;contacts&quot;), </li></ul></ul><ul><ul><li>point d'entrée le plus aisé vers le cloud computing </li></ul></ul><ul><ul><li>&quot;intime&quot;, &quot;personnel » (pub contextuelle) </li></ul></ul><ul><ul><li>point pivot autour duquel hiérarchiser l'ensemble des autres données </li></ul></ul>
  43. 43. 3 ème exemple. Le cas Facebook
  44. 44. Facebook privacy policy timeline (cf http://www.eff.org/deeplinks/2010/04/facebook-timeline/) « No personal information that you submit to Thefacebook will be available to any user of the Web Site who does not belong to at least one of the groups specified by you in your privacy settings  » 2 0 0 5 « Moi et les miens »
  45. 45. We understand you may not want everyone in the world to have the information you share on Facebook; that is why we give you control of your information. Our default privacy settings limit the information displayed in your profile to your school, your specified local area, and other reasonable community limitations that we tell you about. 2 0 0 6 Moi et ma communauté étendue Privauté « par défaut » 2 0 0 7 Profile information you submit to Facebook will be available to users of Facebook who belong to at least one of the networks you allow to access the information through your privacy settings (e.g., school, geography, friends of friends). Your name, school name, and profile picture thumbnail will be available in search results across the Facebook network unless you alter your privacy settings . Arrivée du « search » Arrivée de l’opt-out
  46. 46. Certain categories of information such as your name, profile photo, list of friends and pages you are a fan of , gender, geographic region, and networks you belong to are considered publicly available to everyone, including Facebook-enhanced applications, and therefore do not have privacy settings. Information set to “everyone” is publicly available information, may be accessed by everyone on the Internet (including people not logged into Facebook), is subject to indexing by third party search engines, may be associated with you outside of Facebook (such as when you visit other sites on the internet), and may be imported and exported by us and others without privacy limitations. The default privacy setting for certain types of information you post on Facebook is set to “everyone. ” You can review and change the default settings in your privacy settings Nov. 2 0 0 9 Abolition de la frontière « plateforme » Opt-out systématique et étendu Abolition pure et simple de la privauté « profilaire », « identitaire » Déc. 2 0 0 9
  47. 47. 4 ème exemple. Syndrome de Blanche-Neige © http://www.radidesigners.com/miroir1.htm
  48. 48. L’illusion de la page blanche
  49. 49. Le syndrôme de Blanche-Neige
  50. 50. Attention !!!!!
  51. 51. Pêché originel cherche …
  52. 52. Moi …
  53. 53. CONSÉQUENCES Pour ...
  54. 54. Mon nom est personne <ul><li>Personnalisation : </li></ul><ul><ul><li>« Invisible » </li></ul></ul><ul><ul><li>« Persistante » </li></ul></ul><ul><ul><li>« Participative » </li></ul></ul>Pour l’individu
  55. 55. Une « universalité » très très très « personnalisée » <ul><li>ALGORITHMIE AMBIANTE </li></ul>Pour « la société »
  56. 56. Facebook comme nouveau panopticon. Surveillance ET sous-veillance. LITTLE SISTERS Pour les « communautés »
  57. 57. Cocktail explosif <ul><li>Personnalisation </li></ul><ul><li>+ « universalité » des recherches </li></ul><ul><li>+ Migration dans les nuages </li></ul><ul><li>+ Massification (des accès) </li></ul><ul><li>+ Communautarisation (des pratiques) </li></ul><ul><li>+ Économie de l’attention </li></ul><ul><li>+ Confusion des pratiques </li></ul>= Pour les enjeux documentaires
  58. 58. <ul><li>Ce que l’on savait déjà : </li></ul><ul><ul><li>Explosion de la masse documentaire </li></ul></ul><ul><li>Ce que l’on ne savait pas : </li></ul><ul><ul><li>Bombe à fragmentation </li></ul></ul><ul><li>Fragmentation </li></ul><ul><ul><li>Des documents (world wide web) </li></ul></ul><ul><ul><li>Des usages </li></ul></ul><ul><ul><li>Des synchronicités (world life web) </li></ul></ul><ul><ul><li>Des modalités </li></ul></ul><ul><ul><ul><li>de diffusion, d’appropriation, d’édition … </li></ul></ul></ul>BOUM ! Pour les enjeux documentaires
  59. 59. DE DOCUMENTS ...
  60. 60. 5 ème et 6 ème exemples.
  61. 61. Moteur de recherche « de voisinage » Everyblock.com / http://chicago.everyblock.com/news/ Adresse / numéro de sécurité sociale / historique déménagements et changements d'adresse depuis 10 ans / Date de naissance / Casier judiciaire / Diverses amendes / Dates mariages et divorces / le nom et n° tél voisins / Montant du bien immobilier qu'il possède (sa maison), sa date d'achat et le nom de celui qui lui a vendu / la taille du &quot;lot&quot; ( cadastre ) sur lequel elle (sa maison) est implantée / une vue satellite de chez lui / Âge moyen des femmes et des hommes habitant dans son voisinage / Nombre de meurtres , de viols, de vols de véhicule et autres larcins dans son quartier / Composition ethnique du quartier / Niveau d'éducation et les langues parlées / les permis qu'il possède (permis de conduire mais aussi permis bateau, avion, moto, etc ...)
  62. 62. http://www.Intelius.com &quot;Nous cherchons dans des milliards de données publiques pour vous aider à trouver ce que vous cherchez. Nous analysons des listes de vente, des commandes sur catalogue, des abonnements à des magazines, des enregistrements d'adresse, des enregistrements de propriété immobilière, des arrêts de cour (...) et toute une série d'autres enregistrements publics et de sources publiques pour vous .&quot;
  63. 63. CONCLUSION 1 constat. 1 morale. 2 questions. 3 conseils.
  64. 64. Changement de perspective information connaissance Documents individus DONNÉES &quot; nous sommes en train de passer d'un web de documents connectés à un web de données connectées. &quot; John Markoff. NY Times. 12 No. 2006 http://www.nytimes.com/2006/11/12/business/12web.html DONNÉES Traitement documentaire Traitement computationnel
  65. 65. Moralité ? <ul><li>Pour les moteurs … </li></ul><ul><li>Pour les réseaux sociaux </li></ul>« un document » Indexable, cherchable, Profilable, « monétisable » …
  66. 66. « L’antilope qui court dans les plaines d’Afrique ne peut être considérée comme un document…» « Mais si elle est capturée… et devient un objet d’études, on la considère alors comme un document. Elle devient une preuve physique. » Suzanne Briet
  67. 67. Quelle clé de voûte pour l’architecture de l’information ? ?
  68. 68. requêtes profils usages Documents informations Individus d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s d o n n é e s
  69. 69. Quel écosystème informationnel ? Indexation Mer des pratiques Moteurs & réseaux sociaux Monétisation Océan des données Collaboration, participation, User Generated Content Résultats Technologies de la capillarité Comportements, profils Moteurs & réseaux sociaux
  70. 70. <ul><li>« Quand la technologie devient l’architecte de notre intimité ». Hubert Guillaud in Internet Actu. En ligne : http://www.internetactu.net/2011/01/19/quand-la-technologie-devient-larchitecte-de-notre-intimite/ </li></ul><ul><li>« Scroogled » de Cory Doctorow. Trad. Française « Engooglés » </li></ul>Et 2 conseils de lecture Le mien <ul><li>Le web, TOUT le web, est un espace public. AUCUNE « intimité » n’y est possible. Au mieux peut-on espérer quelques infimes zones de privauté sur quelques parcelles d’espace semi-publics. </li></ul>
  71. 71. .Merci. .?. questions .?. questions .?. SAV : olivier.ertzscheid AT gmail.com

×