La recherche d'information en ligne : panorama et limites. Le biais de la  " navigation sociale " comme 'outil' pérenne de veille pour les documentalistes
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

La recherche d'information en ligne : panorama et limites. Le biais de la " navigation sociale " comme 'outil' pérenne de veille pour les documentalistes

on

  • 6,115 views

La recherche d'information en ligne : panorama et limites. Le biais de la " navigation sociale " comme 'outil' pérenne de veille pour les documentalistes

La recherche d'information en ligne : panorama et limites. Le biais de la " navigation sociale " comme 'outil' pérenne de veille pour les documentalistes

Statistics

Views

Total Views
6,115
Views on SlideShare
5,674
Embed Views
441

Actions

Likes
2
Downloads
120
Comments
4

13 Embeds 441

http://www.demainlaveille.fr 281
http://www.collectivitenumerique.fr 56
http://www.motrech.com 51
http://aristidet12.canalblog.com 21
http://1300334162.nvmodules.netvibes.com 14
http://www.slideshare.net 7
http://1480974737.nvmodules.netvibes.com 3
http://www.paperblog.fr 2
http://www.pearltrees.com 2
file:// 1
https://www.digimind-evolution.com 1
http://richard.peirano.free.fr 1
http://www.lelivredesable.net 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

La recherche d'information en ligne : panorama et limites. Le biais de la " navigation sociale " comme 'outil' pérenne de veille pour les documentalistes Presentation Transcript

  • 1. La recherche d’information en ligne : panorama et limites. Le biais de la « navigation sociale » comme ‘outil’ pérenne de veille pour les documentalistes Journée des enseignants-documentalistes de L’Indre – 12 juin 2009 Loïc Le Roux CDDP d’Indre et Loire
  • 2. 1ère partie : La recherche d’information en ligne : panorama et limites.
  • 3. Trois problématiques pour la recherche d’information en ligne
    • Problématique « technique »
    • (Taille du Web, Web visible et invisible, Typologie des outils …).
    • Problématique « socio-technique »
    • (Usages des outils et du Web documentaire …).
    • et aussi « techno-sociale » : outils développés pour répondre à un besoin communautaire (Flickr …)
    • Problématique pédagogique
    • (Didactisation de la recherche, méthodologie et culture de l’information…).
  • 4. 1. Problématique « technique »
    • Définition de l’Internet et mise au point préalable :
    • Internet (1969) différent du Web (1990)
    • La recherche sur le Web n’est donc pas uniquement réductible à la recherche sur Internet. Exemple : une « ressource » peut être une adresse mel ou une réponse sur un forum de chat .
    • Internet = un réseau physique
    • Le WWW = du contenu => un flux
  • 5. La taille de Web [visible]
    • Une étude de l’Université de l’Iowa évaluait en janvier 2005 la taille du Web indexable (ou Web de surface) à 11,5 milliards de pages ( il y avait « seulement » 2,5 milliards en sept. 2001 ).
    • Une autre étude plus récente de février 2007 parle de 29,7 milliards de pages.
    • Ce qu’il faut retenir : Chiffres à prendre comme ordre de grandeur : la taille du Web s’accroît de manière exponentielle ( = « infobésité »).
  • 6. Web visible et Web invisible
    • Le Web dit visible est accessible aux outils de recherche alors que le Web invisible ou profond ( deep Web ) ne l’est pas.
    • Une étude de sept. 2001 réalisée par l'entreprise BrightPlanet estime que le Web profond pouvait contenir 500 fois plus de ressources que le Web indexé par les moteurs de recherche.
  • 7. Typologies et caractéristiques des outils de recherche
    • Trois types d’outils de recherche classiques :
        • Moteurs (Google, Yahoo, Bing, Exalead, AV …)
        • Métamoteurs (Dogpile, Vivisimo, Kartoo …)
        • Annuaires (ODP…).
    • Nécessité de comprendre comment ces outils fonctionnent pour mieux s’en servir (cf. Bruillard , 2000 et la problématique pédagogique).
  • 8. [Rappel] Principe d’un moteur de recherche
  • 9. [Rappel] Principe d’un métamoteur
  • 10. [Rappel] Principe d’un annuaire
  • 11. Un taux de recouvrement faible des moteurs de recherche
    • « Les moteurs de recherche ne travaillent pas que sur le même segment du Web, et quand ils sont sur la même portion, leurs algorithmes classent les pages et les restituent souvent, de manière radicalement différente » ( BNF ).
    • Même base = résultats différents
    • Exemple sur : http://ranking .thumbshots.com/
  • 12. Google vs Yahoo Équation = didactique des sciences « cycle3 » 
  • 13. Autre exemple de recouvrement http://comparesearchengines.dogpile.com/
    • Les résultats de recherche sur Google, Yahoo, MSN et Ask Jeeves sont très différents.
    • Une étude montre que seulement 1,1% des résultats sur la première page de ces quatre principaux moteurs sont identiques (étude portant 485 460 premières pages).
    • http://comparesearchengines.dogpile.com/OverlapAnalysis.pdf (2005)
  • 14. Moteurs et clusterisation : une approche « lexico-sémantique »
    • Clusterisation : structuration automatique des résultats d’un moteur en présentant d’autres pistes de recherche reliées plus ou moins sémantiquement en vue d'affiner une nouvelle requête. Altavista le faisait déjà en 1996 : fonction refine puis Live Topics.
    • La catégorisation dynamique représente un facteur positif pour les recherches documentaires chez les élèves (désambiguïsation ).
  • 15. [Rappel] : Altavista (fonction refine => F. Bourdoncle )
    • Pour une recherche sur Bill Clinton, nous avions (en 1997) :
    • 71% Clinton, presidential, president, campaign, candidates
    • 40% Republican, republicans, dole, democrats, gop, gingrich, democratic, newt, bob
    • 22% Reform, welfare, illegal, immigrants, families, immigration, recipients, poverty, afdc
    • 18% Hillary, governor, clintons, whitewater, rodham, arkansas, scandal, starr, mcdougal
    • Vous pouviez alors choisir de rechercher à nouveau, cette fois en additionnant ou en excluant un terme.
  • 16. Moteurs de catégorisation actuels
    • Exalead, Vivisimo, Clusty, Aol Recherche et … Google ?
  • 17.
  • 18. 2. Problématique « socio-technique»
    • La r é alit é sociale du web compte aujourd ’ hui pr è s d ’ un milliard d ’ internautes ( Nielsen 2005 ).
    • L’outil de recherche se situe au carrefour de plusieurs mondes avec des logiques différentes : celui des concepteurs et des développeurs (orientations technologique et commerciale), celui des contenus de données (orientations documentaire et commerciales) et celui des comportements, des représentations et des appropriations des usagers (orientations socio-technique et commerciale).
    • Au cours d’une recherche documentaire, ces mondes s’interfèrent ce qui crée des usages hybrides entre appropriation technologique et pratique sociale dans les apprentissages.
  • 19. Le cadre socio-technique de toute recherche documentaire
    • « Intégrer dans une même analyse technique et société, sans choisir un terme au détriment de l’autre (…) Il ne s’agit pas d’articuler seulement deux pôles : technique et société, mais de voir comment interfèrent de nombreux mondes sociaux , ceux des ingénieurs et des usagers, des industriels, des services, des commerçants, etc.» .
    • Flichy (2003). L’innovation technique : récents développements en sciences sociales. Ed. de la Découverte.
  • 20. Google utilisé mais pas plébiscité…
    • « Le résultat sans doute le plus frappant est le degré de satisfaction très médiocre des utilisateurs . Pour les meilleurs moteurs (Yahoo, Google), la note moyenne sur le premier écran de 10 résultats atteint à peine 2,3 sur une échelle de 0 à 5. […] Enfin, on remarquera que rien dans cette étude ne permet d’expliquer la préférence massive des internautes pour le moteur Google , puisque, globalement Google et Yahoo ont des performances à peu près équivalentes, et se détachent de leurs concurrents. Il faut donc supposer que les raisons en sont autres que des critères de pure pertinence des résultats ». ( Véronis , 2006)
  • 21. Google : un outil technologique et social à la fois ( PageRank )
    • PageRank est l’indice de popularité d'une page Web, calculé selon un algorithme sophistiqué , élaboré par Google.
    • L'algorithme PageRank fait partie des critères utilisés pour déterminer le positionnement ( ranking ) des pages dans Google. Ainsi, pour deux pages aux contenus comparables, celle ayant le meilleur PageRank sera souvent classée devant, surtout pour les requêtes très concurrentielles.
    • Une explication en français :
    • http://www.webmaster-hub.com/publication/L-algorithme-du-PageRank-explique.html
  • 22. La « sagesse » de Google selon Google
    • "La sagesse des foules fonctionne étonnamment bien. Les systèmes qui marchent sur le web fonctionnent du bas vers le haut ('bottom-up'). (...) Par exemple Flickr ne dit pas à ses utilisateurs quel tag utiliser pour leurs photos. Loin de là. N'importe qui peut déposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la clé - Flickr offre un retour sur les tags les plus utilisés et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement à utiliser ce lexique si celui-ci fait sens. Cela rend le système étonnamment stable. Del.icio.us fait la même chose. Le succès de Google pour rendre les recherches plus pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)… » Adam Bosworth (2004)
  • 23. De la « sagesse populaire » … … à la dépendance technologique
    • La sagesse populaire de Google est-elle possible pour la recherche de documents « académiques » ? Entre notoriété et autorité , la confusion existe ( idem entre affluence et influence; entre publicité et légitimité ).
    • L’omniprésence (omnipotence ?) de l’utilisation de cet outil génère-t-il une captation technologique et intellectuelle de tout acte de recherche ? Si oui …
      • Le recoupement de l’information n’existe plus…
      • La réflexion sur l’utilisation de l’outil le plus adéquat non plus …
      • Google devient la seule perception du Web …
  • 24.
  • 25. Lecture des résultats sur Google
    • Une étude de l'enregistrement des mouvements de l'œil (oculométrie ou eye tracking) révèle la présence d'un « triangle d’or ». Ce triangle symbolise une zone spatiale parcourue par les internautes sur la première page des résultats. Il représente surtout la visibilité des sites sur le moteur (importance stratégique pour le Web marchand).
    • Le triangle est d'or parce qu'il se révèle être l'endroit où 100% des usagers regardent. Les zones rouges représentent les endroits ou l'œil s’arrête le plus souvent.
    • … Ce qui n'est pas dans Google n'existe pas …
  • 26.
  • 27.
  • 28.
  • 29. Enquiro Eye Tracking Report II :
  • 30.
  • 31. Vers de nouvelles interfaces
  • 32. Les moteurs en 2010 ? Ex. :
  • 33. … Vers un monde selon Google ?
  • 34. Un cas classique de recherche (élève)…
    • Un seul outil (Google pour + 87 %) : dépendance et captation
    • Très peu de mots-clés (deux en moyenne) : champ lexical très pauvre
    • Une interface de recherche simple
    • Pas de reformulation du sujet si mauvais résultats
    • Une lecture très linéaire des résultats (cf. « triangle d’or »)
    • Un découragement rapide + faible motivation
    • Un attrait des TIC sans passer par la documentation classique (i.e. support papier).
    • Cf. Perriault (2002). L’accès au savoir en ligne
  • 35. … pour un résultat incertain et non probant …
    • Des pages prises dans le « triangle d’or »
    • Un site jugé pertinent par son temps de réponse
    • Un site jugé pertinent par son ergonomie
    • Parfois une sur-utilisation peu efficace du Web par les utilisateurs réguliers (Tricot)
    • Une perte de temps et un coût cognitif trop élevé par rapport à l’objectif initial (risque de surcharge mentale dû à une trop grande sollicitation de l’outil et/ou de l’interface).
    • Cf . André Tricot. Apprentissages et documents numériques . Belin, 2007.
  • 36. 3. Problématique pédagogique :
    • Méthode(s) de recherche (pédagogie procédurale)
    • Répondre au mieux au besoin informationnel
    • (Le besoin informationnel comme représentation informationnelle d’un problème décisionnel).
    • Curriculum info-documentaire ( structurer dans le temps et dans ses contenus un véritable enseignement info-documentaire, articulé sur l’apprentissage progressif et systématique des notions. Cf. Duplessis).
  • 37. Pour conclure (rapidement sur le plan pédagogique …)
    • « La nouvelle fracture numérique n'est donc pas entre ceux qui peuvent s'offrir les machines et les services et ceux qui ne le peuvent pas, mais entre ceux qui savent les utiliser à leur avantage et ceux qui sont victimes de la surinformation . Ce n'est pas un problème entre ceux qui ‘possèdent’ et les autres, mais entre ceux qui "savent" et les autres ».
    • Howard Rheingold
    • => Créer une culture
  • 38. 2 nde partie : Le biais de la « navigation sociale » comme culture de veille pour les documentalistes
  • 39. Vers une culture de l’Infodoc
    • Au-delà de l’incomplétude :
    • Masse énorme et mouvante du Web…
    • Evolution perpétuelle des outils …
    • Gérer l’incertitude par :
    • Un savoir technique nécessaire …
    • … et surtout une culture de l’information-documentation.
  • 40. Origine : 1994 & Sc. informatique
    • En 1994, Paul Dourish et Matthew Chalmers énoncent trois modèles de navigation dans un espace d’information hypertextuel.
    • Ces trois modèles ne s’excluent nullement et entrent souvent en interactions .
  • 41.
    • La navigation spatiale (ex. : réalité virtuelle). Représentation d’un espace dans un environnement virtuelle. (Cf. propos de Kevin Lynch, L'image de la cité ).
    • La navigation sémantique . Concept à redéfinir car il s’agit plutôt d’une forme de navigation par interrogation lexicale (au préalable) du Web (moteurs de recherche).
  • 42.
    • La navigation sociale : manière de naviguer selon un mode relationnel afin de trouver ou d’exploiter une ou plusieurs informations laissées ou données par des usagers.
    • Elle peut être " directe " (explicite), " indirecte " (implicite), prévue ou fortuite selon la relation que nous pouvons avoir avec autrui.
    • Les frontières entre ces deux formes de navigation sociale peuvent être aussi « interchangeables » .
  • 43.
    • Ce modèle de navigation sociale concerne la manière dont plusieurs personnes peuvent agir les unes à l'égard des autres pour se diriger socialement dans un espace d'information (réel ou numérique).
    •  
    • Ce modèle peut représenter un mode d’accès généraliste prenant en compte l’avis des internaute en général (ex. le pagerank de Google ou les résultats chez Amazon…).
  • 44. Partager des connaissances et avoir une culture commune
    • En prenant comme postulat le principe de la navigation sociale, nous pouvons l’adapter au sein d’une population concernée construite dans une communauté de pratique : les enseignants-documentalistes.
  • 45. La navigation d’une communauté
    • «  Des groupes d’individus qui ont une histoire commune, interagissent fortement, partagent des connaissances et rencontrent des problèmes proches, au sein d’une même organisation ". Ces communautés " sont caractérisées par trois dimensions : un engagement mutuel, une entreprise commune et un répertoire partagé " (Benghozi)
  • 46. Chercher [peu] et trouver [juste]
  • 47. Trouver la ressource
    • Nicolas Flamel
    • Étymologie du latin : " resurgere " se relever, se rétablir, reprendre des forces ; puis issu du verbe " resourdre " rejaillir, se rétablir, rétablir.
    • La ressource est proprement une seconde ou dernière source, une chose qui relève, un moyen qui fait sortir d'embarras. ( XML Littré )
  • 48. Définition de la ressource numérique
    • Définition : tout composant d'un système. En informatique et en multimédia, 3 types de ressources sont distinguées : les ressources humaines , matérielles et logicielles :
      • ressources humaines : programmeur spécialisé, vidéaste, ingénieur du son, graphiste, réalisateur => valeurs ajoutées
      • ressources matérielles : unité centrale (processeur, mémoire centrale, cartes), unités périphériques (d'extension de mémoire, de communication),
      • ressources logicielles : système d'exploitation et système d'exploitation.
    • (Educnet)
  • 49. Trouver une méthode satisfaisante (malgré l’incomplétude) pour
    • Réduire le coût cognitif de toute recherche
    • (compréhension de la question, procédures de recherche, sélection, validation : « la charge cognitive imposée par de nombreuses stratégies de résolution des problèmes gêne l'apprentissage , tout en n’empêchant pas d’atteindre la solution du problème ». [ Tricot , 1998])
    • Réduire le temps de cette recherche (démotivation + perte de temps).
  • 50.
    • Ce qui rend une recherche difficile est peut-être la manière dont l’outil est appréhendé: omnipotence du moteur pour trouver une information.
  • 51.
    • L’outil est essentiel mais pas forcément indispensable pour trouver directement l’information (i.e. la ressource numérique) il peut servir à pointer (indirectement) où peut se trouver cette information par le biais d’un vecteur social (la communauté ici).
  • 52. La communauté Infodoc comme ressource pour la veille
    • Un constat : difficulté de trouver quotidiennement des informations pertinentes sur un moteur (explicitation du besoin d’information pas évident).
    • La communauté peut servir d’outil pour trouver l’information pertinente (sérendipité) : c’est le principe de la navigation sociale (via une « communauté de pratique »).
  • 53. Créer une navigation sociale
    • Se tenir au courant = pratiquer une veille informationnelle.
    • Connaître des gisements de ressources « humaine » + papier + numérique.
    • Avoir des repères et des liens.
  • 54. Pratiquer une veille http://www.defidoc.com/publications/dossierspecial_veille.htm
    • Listes de discussion (ex. : listes du CRU )
    • Lettres de diffusion (ex. : Café pédagogique)
    • Alertes mel (ex. : Vigilibris, lettre Tice Educnet)
    • Flux RSS (ex. : Netvibes, Google reader)
    • Portails & sites ressources (ex. : SavoirsCDI)
    • Annuaires professionnels
    • Partage de signets (ex. : del.icio.us, Diigo…)
    • Sites de communautés d’usage (ex. : Docspourdoc)
    • Veille (classique) : périodiques …
    • Innovation : Twitter et outils futurs …
  • 55. La veille est un processus d’apprentissage long (cf. Richard Peirano)
  • 56. Exemple de la veille du CDDP 37
    • Choisir les personnes ressources pertinentes = moins de perte de temps et plus de valeurs ajoutées.
    • Deux types d’outils essentiels : Netvibes docaucentre et Twitter docaucentre.
    • => Le CDDP ne fait pas de veille stratégique mais il se tient au courant.
  • 57. Le choix des réseaux humains
    • =>Forte valeur ajoutée. Exemple sur Twitter :
    • +Internet : Tristan Nitot, Framasoft, Hubert Guillaud…
    • +SIC & Bib. : affordance, Bibliobsession, BU Angers, Urfist, Blog BBF…
    • +Doc : SavoirsCDI, Doc Rouen, Richard Peirano, flux de Brigitte Pierrat …
  • 58. Le résultat au 12 juin à 15h13…