Loading…

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

Like this presentation? Why not share!

Like this? Share it with your network

Share

Rechercher de l'information sur le web

on

  • 3,701 views

Avez-vous une idée du fonctionnement de Google ou de Wikipédia ? ...

Avez-vous une idée du fonctionnement de Google ou de Wikipédia ?
Pouvez-vous évaluer la fiabilité d'un contenu sur le web ?
Savez-vous comment citer les ressources web dans un travail ?
Autant de questions qui trouveront réponse au cours de ce séminaire animé par Isabelle Motte ...

Statistics

Views

Total Views
3,701
Views on SlideShare
3,686
Embed Views
15

Actions

Likes
3
Downloads
100
Comments
0

2 Embeds 15

http://www.scoop.it 13
http://www.linkedin.com 2

Accessibility

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Rechercher de l'information sur le web Presentation Transcript

  • 1. La recherche d'information sur le web Isabelle Motte Licence Creative Commons (by-nc-sa) Dernière mise à jour : 29/10/10
  • 2. Quand je dois faire une recherche documentaire, la première chose que je fais, c'est ... J aller à la bibliothèque B faire une recherche sur internet V discuter du sujet avec un spécialiste R me procurer des travaux de l'an passé (Interaction avec les participants à l'aide de cartons de couleur)
  • 3. Pour obtenir des résultats fiables, il vaut mieux utiliser ... J Wikipédia B Google V le moteur de recherche de la BUMP R Yahoo
  • 4. Je n'ai jamais utilisé les outils suivants : J Wikipédia B Google V le moteur de recherche de la BUMP R Yahoo
  • 5. Une grande partie du web est dite « invisible » ... • Les meilleurs moteurs de recherche indexent moins de 20% du web; • Tous les types de fichiers ne sont pas indexés et les pages dynamiques et les bases de données sont difficilement indexées.
  • 6. Les outils de recherche • Les moteurs : pour une recherche précise • Les annuaires : pour une recherche large • Les métamoteurs : pour dégrossir rapidement • Les encyclopédies : pour des informations permanentes et sûres • Les bases de données spécialisées : pour des informations validées dans un domaine précis
  • 7. Web Search Strategies in Plain English
  • 8. Les moteurs : pour une recherche précise • Les moteurs de recherche indexent régulièrement des millions de pages web dans une base de données à l’aide de robots qui inventorient et ajoutent les nouvelles pages; • Chaque robot fonctionne à sa manière et ils peuvent donc produire des résultats très différents selon l’indexation utilisée : - par mots clés; - par titre; - par le texte (tout ou seulement le début) • Chaque moteur propose un formulaire de recherche avancée plus puissant;
  • 9. • Le moteur recherche l’occurrence du ou des mots dans sa base de données; • Les résultats sont classés selon un algorithme de pertinence propre (présence du mot dans le titre, dans le texte, dans les balises métas, indice de popularité, …) • Les résultats sont souvent présentés après clustering, c’est-à-dire qu’ils ne proposent qu’un seul lien pour plusieurs pages sur le même site; • Tous les moteurs de recherche présentent des options de tri personnalisables (via Options ou Préférences) • Les plus connus : Google, Yahoo! Search,Bing, Ask, Cuil, ...
  • 10. + beaucoup de types de fichiers référencés; + le plus vaste; + le plus complet au niveau des critères de recherche; + le tri par pertinence avec pondération et clustering donne d'excellents résultats; - de plus en plus de liens sponsorisés.
  • 11. Interview sur Google pour "Tout s'explique" (RTL)
  • 12. Le page rank de Google, le secret de son succès ...
  • 13. + nombreux types de fichiers référencés; + très vaste; + très complet au niveau des critères de recherche; + recherche notamment dans Yahoo! - de plus en plus de liens sponsorisés. => le concurrent le plus sérieux de Google !
  • 14. Ancien MSN Search et Live Search + fichiers Microsoft référencés; + vaste; + nouveau moteur de recherche dynamique + jointure avec la BD de Facebook (bientôt « Vos amis ont visité ce site ») + de plus en plus populaire.
  • 15. + base de données originale; - critères de recherche limités; + présentation des résultats originale. - de plus en plus de liens sponsorisés.
  • 16. nt : ne pas Inq uiéta pion e ... 'es ui n t pas v iabl ur q n'es ote urs un m isate Créé par des anciens collaborateurs Google + nesespas fait l utide suivi des activités des utilisateurs - critères de recherche limités;
  • 17. Les moteurs de recherche morts • Alltheweb (BD reprise par Yahoo) • Alta Vista (BD reprise par Yahoo) • Cuil • Openfind • Lycos (BD reprise par Yahoo) • Hotbot (BD reprise par Google) • Deja.com (BD reprise par Google) • Direct Hit (BD reprise par Teoma) • Excite • Go (BD reprise par Google) • Infoseek • NothernLight • Teoma (BD reprise par Ask)
  • 18. Les annuaires : pour une recherche large • Les annuaires recensent des sites classés par catégories; le classement est effectué par la main de l’homme et la pertinence et la qualité des sites sont donc bien meilleures; • Les responsables construisent une base de données de fiches descriptives des différents sites et la recherche des mots s’effectue sur base de la fiche descriptive et non du site; • Outre la recherche par catégorie, il est possible de réaliser une recherche par mots clés qui fournira les sites et les différentes catégories pertinentes; • Les plus connus : Yahoo! et Open Directory;
  • 19. - peu de types de fichiers référencés; + le plus vaste (car le plus ancien); - intégré au moteur de recherche Yahoo! + très populaire car beaucoup de services et d'aide en ligne; - de plus en plus de liens sponsorisés.
  • 20. - peu de types de fichiers référencés; + vaste; + très récent; + pas de liens sponsorisés.
  • 21. Les métamoteurs : pour dégrossir rapidement • Ils permettent d’interroger simultanément plusieurs moteurs de recherche mais la requête doit donc être simple; • Exemples :Yippy, ...
  • 22. Ancien Clusty,Vivissimo +méta-moteur interrogeant de nombreuses base de données +présentation des résultats par clustering autour de mots-clés
  • 23. - base de données limitée; + originalité : résultats présentés sous forme de carte.
  • 24. Les encyclopédies : pour des infos permanentes et sûres • Elles présentent une source sûre, les informations sont de qualité et permanentes; elles sont parfois payantes; • Les plus connues : Britannica et Wikipedia
  • 25. + très ancienne et très vaste; + référencement de diverses ressources évaluées (articles, ...); - il faut payer pour accéder au contenu complet; - beaucoup de pubs et de liens sponsorisés.
  • 26. Les informations de Wikipedia sont fiables parce que J les contenus sont écrits par des spécialistes. B les contenus sont révisés par des spécialistes. V les contenus sont révisés par tous les visiteurs R les contenus sont protégés après une procédure de relecture.
  • 27. Wikipédia • « Wikipédia est est un vaste projet d'encyclopédie collective établie sur Internet, universelle, multilingue et fonctionnant sur le principe du wiki. Wikipédia a pour objectif d'offrir un contenu libre, neutre et vérifiable que chacun peut éditer et améliorer. » Source : Page d'accueil de Wikipédia (http://fr.wikipedia.org/wiki/Wikipédia:A_propos ) consultée en septembre 2010
  • 28. C'est quoi un wiki ? • Un wiki permet à un groupe de personnes d'éditer communément un contenu. • Sur un wiki public, vous pouvez lire ce que la communauté du wiki a écrit. En cliquant sur un bouton "edit" ou "modifier" d'un article, vous pouvez éditer le texte de l'article. Vous pouvez ajouter ou modifier tout ce que vous voulez dans l'article que vous êtes en train de lire.
  • 29. Si n'importe qui peut modifier le contenu, est ce fiable ? Comment gère t'on les conflits d'édition ? Que se passe t'il en cas de vandalisme ?
  • 30. C'est fiable un wiki ? Le wiki est un outil communautaire qui permet de livrer des informations fiables grâce aux éléments suivants : • Les modifications récentes sont accessibles à tout moment par tout utilisateur; • Chaque page présente un long historique des versions qui permet de récupérer des informations vandalisées; • La rédaction de texte wiki suppose d'utiliser une syntaxe spécifique très légère; • Dans les gros wiki (Wikipedia), chaque auteur peut spécifier une liste de pages à suivre et veiller à leur bonne évolution; • Les articles ébauches sont signalés et le domaine scientifique est un des plus populaire et donc assez fiable.
  • 31. Wikipédia, les caractéristiques • Wikipédia est un projet collaboratif international Internet a contribué à rendre le nombre de contributeurs, valideurs très vaste et donc à renforcer la qualité des productions collectives. • Wikipédia est un pari sur l'honnêteté des utilisateurs N'importe qui peut écrire du contenu mais n'importe qui peut aussi corriger ! Les pages de discussion sont un espace pour discuter des améliorations à apporter à l'article. • Wikipédia impose la neutralité de point de vue pour éviter les guerres d'éditions Certains thèmes très controversés peuvent être protégés tant qu'un accord n'aboutit pas au travers de la page de discussion
  • 32. • Wikipédia demande une attitude critique du lecteur... comme toute autre ressource Les articles de Wikipédia sont d'une qualité variable mais les articles sont documentés par références bibliographiques pour garantir la qualité. • Wikipédia est une encyclopédie en perpétuelle construction Les contenus ne sont pas figés et peuvent être mis à jour plus rapidement que dans toute autre encyclopédie. • Wikipédia ne dispose pas (encore) de processus de relecture Wikipédia est trop jeune (née en 2002) et ne propose pas encore une couverture suffisamment large et suffisamment homogène des connaissances.
  • 33. Les bases de données spécialisées : pour des informations validées dans un domaine précis • Elles présentent une source sûre, les informations sont de qualité et spécifiques à un domaine; • Testez les bases de données de la BUMP ! • Pour les sciences expérimentales, la base de données PubMed est une référence.
  • 34. En résumé ... Moteurs Annuaires Encyclopédies et BD spécifiques Quantité de ressources Qualité des ressources
  • 35. Veillez à avoir quelques favoris avec chacun de ces outils de recherche, vous pourrez ainsi choisir le meilleur outil pour faire une recherche d’information sur le web. => remplissez bien votre boîte à outils
  • 36. La tendance actuelle : tout faire ! - Yahoo!, qui était un annuaire à la base, a développé son moteur de recherche en utilisant essentiellement des bases de données existantes (AllTheWeb, AltaVista, Lycos, ...) - Google, qui était un moteur à la base propose aujourd'hui un onglet « annuaire » qui retourne des recherches provenant de Open Directory; - Britannica, la grande encyclopédie payante, s'est transformée en un grand annuaire permettant des recherches notamment dans l'encyclopédie mais aussi dans une série de ressources évaluées et cotées très finement; MAIS quand on veut tout faire, souvent on finit par négliger certaines tâches ! Alors, informez-vous et testez régulièrement !
  • 37. Pour une recherche efficace ... • Préparer sa recherche • Evaluer les ressources • Citer les références web • Zotero : Un outil pour indexer les références web
  • 38. Préparer sa recherche • Délimiter le sujet et choisir les mots clés; • Choisir le type de document attendu; • Choisir les limites de ma recherche (langue, date de publication, zone géographique des pages, …); • Fixer le temps de recherche et la quantité d’information attendue; • Définir au mieux la question que l’on se pose; • Choisir l’outil le mieux approprié pour la recherche selon les limites choisies; • Utiliser les formulaire de recherche avancée;
  • 39. Evaluer les ressources • Vous savez maintenant comment trouver de l’information sur le web, mais il faut savoir que tous les sites ne proposent pas une information fiable; • Quelques indices de crédibilité : – l’URL : elle donne le domaine d’activité; – la source du document : il doit être possible d’obtenir le nom de l’auteur, le nom de l’institution, … – l’actualité : la date de création et la date de la dernière mise à jour; à relativiser en fonction du sujet; – les références bibliographiques : si le contenu de la page n’est pas original, les sources originales doivent être indiquées;
  • 40. Citer les références web • Une page ou un site web utilisé pour rédiger un document doit être cité; • Pour un site web, il faut donner l’auteur, le titre de la page d’accueil, l’adresse URL et la date de la consultation; • Pour une page web, il faut donner l’auteur, le titre de la page, la ressource plus large à laquelle le document est rattaché, l’adresse URL et la date de consultation; • Pour un document sur un site ftp, il faut donner l’auteur, le type de support, la date, l’adresse ftp, le répertoire et le fichier;
  • 41. Zotero, un outil pour indexer les références web • Zotero est une extension du navigateur Firefox qui permet d'indexer automatiquement les informations importantes pour citer les références web; • Cliquez sur le logo « Zotero » dans la barre inférieure pour indexer les informations sur la page en cours ; • Une fois vos références indexées, vous avez la possibilité de les exporter au format texte; • Un bel exemple d'utilisation : la liste des références web de ce document ...
  • 42. Références 1. “Accueil - Wikipédia,” http://fr.wikipedia.org/wiki/Accueil (accessed October 29, 2010). 2. “AERIS - Aide aux étudiants pour la recherche d'information scientifique,” http://aeris.11vm-serv.net/ (accessed October 29, 2010). 3. “Ask.com France - L'autre moteur de recherche,” http://fr.ask.com/ (accessed Octobre 29, 2010). 4. “Bing “ http://www.bing.com/ (accessed October 29, 2010). 5.“Encyclopedia - Britannica Online Encyclopedia,” http://www.britannica.com/ (accessed October 29, 2010).
  • 43. Références 6. “Google Recherche avancée,” http://www.google.be/advanced_search?hl=fr (accessed October 29, 2010). 7. “Infospère “ Aide à la recherche documentaire à l'UCL http://sites.uclouvain.be/infosphere/sciences/index.html (accessed October 29, 2010). 8. “Open Directory - World: Français,” http://www.dmoz.org/World/Français/ (accessed October 29, 2010).
  • 44. Références 9. “Search Engine Showdown: Search Engine Statistics,” http://www.searchengineshowdown.com/statistics/ (accessed October 29, 2010). 10. “SearchEngineWatch: Metacrawlers and Metasearch Engines,” http://searchenginewatch.com/showPage.html? page=2156241 (accessed October 29, 2010).
  • 45. Références 13. “Yahoo! Search - Moteur de recherche de sites Web, images, vidéos, shopping et actualités,” http://fr.dir.yahoo.com/ (accessed Septembre 30, 2009). 14. “Yahoo! Search - Recherche avancée,” http://fr.search.yahoo.com/web/advanced;_ylt=A0geu mW3IUZHy_4A6uFiAQx. (accessed September 30, 2009).
  • 46. Droits sur les images Iceberg : http://www.flickr.com/photos/stargazr/2512500651/sizes/o/ Google Pagerank : http://www.inqbation.com/blog/inqbation%E2%84%A2-achieves- google-page-rank-pr4-again/
  • 47. Avec un moteur de recherche, ... J les pages sont indexées de manière automatisée B les pages sont indexées par un humain
  • 48. Un méta-moteur, c'est ... J un moteur de recherche qui a peu de critères de recherche. B un outil de recherche qui interroge plusieurs moteurs. V un moteur de recherche qui indexe uniquement les données métas. R un outil de recherche qui présente les résultats sous forme de carte.
  • 49. Wikipedia est une encyclopédie qui a la(les) caractéristique(s) suivante(s) : J Tout le monde peut modifier son contenu. B Après relecture par des spécialistes, les les contenus sont protégés. V On garde une trace des différentes versions d'un article. R C'est une ressource fiable.
  • 50. Pour citer une référence web, il est nécessaire de spécifier : J la date de la dernière mise à jour de la page; B la date de consultation de la page; V le nom de l'auteur; R les mots-clés qui m'ont permis de trouver le site par une recherche web.