recherche d'information, démarches et outils - Presentation Transcript
Commande Domaine 4 du B2I : s'informer, se documenter L.4.1 : je sais interroger les bases documentaires à ma disposition L.4.2 : je sais utiliser les fonctions avancées des outils de recherche sur internet L.4.3 : je sais énoncer des critères de tri d'informations L.4.4 : je sais constituer une bibliographie incluant des documents d'origine numérique L4.01 : je sais utiliser les outils de veille documentaire
Fourre-tout
Recherche d’information : 7,67 sur 20 ! C’est la note moyenne en recherche d’information, établie pour les 1865 étudiants belges ayant répondu à l’importante l’enquête menée par le Groupe Edudoc et le Conseil Inter-Universitaire Francophone (CIUF). Les résultats de cette nouvelle enquête sur « L’évaluation des compétences documentaires des primo-arrivants », menée auprès de 35 établissements d’enseignement supérieur de Belgique, ont été présentés lors de la journée d’étude du 20 mai. On trouvera un premier écho des résultats sur le blog Enseignons.be, qui les résume ainsi : « Les jeunes incapables de s’informer sur le Net ». http://urfistinfo.blogs.com/urfist_info/2008/05/digital-natives.html
Nécessaire diversification des usages, des pratiques, des outils…
Adapter les outils aux besoins :
Intérêt des outils spécialisés
Suivre l’innovation technique des moteurs :
Nombreux outils très innovants
Oui, mais voilà, Il est probablement le plus pertinent pour une recherche simple ! http://aixtal.blogspot.com/2008/04/moteurs-google-orange-et-ask.html http://www.journaldunet.com/solutions/moteur-referencement/dossier/le-comparatif-des-moteurs-de-recherche-de-juin-2008/le-comparatif-des-moteurs-de-recherche-de-juin-2008.shtml
Google a développé 200 domaines locaux pour 120 langues prises en compte http://www.google.com/language_tools?hl=fr
Combien de mots clés utilisez-vous ?
géographique du web : mondial, francophone
linguistique : choix de la langue des ressources
des types de ressources : images, audio…
des ressources internet : web, forum, messagerie, weblogs
des formats : HTML, PDF, DOC, PPT, XLS, RTF…
des dates : nombreuses options
des champs : titre, URL, host, domaine…
thématique : choix du domaine de recherche
Règle n° 1, dite la règle de notre gentil petit n'élève à nous (car il est toujours plus intelligent qu'un ordinateur)
Règle n°2, dite règle de Polnareff
Règle n° 3, le sens s'exprime par des mots ou par des expressions Des mots clés pour répondre à une question sur l'immigration
Règle n°4, les mots clés... ne sont que des mots
http://www.boolify.org/
Un moteur de recherche, c'est une base de données !
Source : R. Viseur, CETIC
Partie visible du moteur de recherche ; trois grandes fonctions :
gestion des requêtes :
fonctions de recherche en mode simple et avancé, différentes options de filtrage, affinement...
gestion des résultats :
quels critères de classement ? question des critères de pertinence
gestion de la présentation des résultats :
Listes, cartographie, aperçu graphique…
Gestion des requêtes
Gestion des résultats Reconnaissance de la forme du mot clé et calcul d'occurence pour définir la pertinence
Gestion des résultats : l’indice de pertinence
Principes :
classement des résultats fondé sur la fréquence d’apparition et la localisation des termes de la requête dans une page web
affichage des résultats à partir du calcul d’un score pour chaque réponse :
Ex. : Requête sur le marché des DVD en France : +marché +DVD +France
> retourne les documents contenant tous les mots de la requête
>> documents contenant le plus de fois les mots de la requête classés en premier
Utilisation :
première méthode de classement utilisée sur le web, la plus répandue ;
Problèmes :
détournement par le spamdexing
http://professeurs.esiea.fr/wassner/?2007/06/03/74-l-algorithme-pagerank-comment-ca-marche#doc Gestion des résultats
Gestion des résultats : l’indice de popularité
Principes, origines :
Utilisation de la nature hypertextuelle du web : prise en compte des liens entre sites, considérés comme des liens de parenté sémantique
calcul de la notoriété d’un site en fonction du nombre de liens pointant vers le site
Utilisation :
indice de popularité lancé par Google en 98
originalité et succès de Google et de son PageRank
Avantages de l’indice de popularité :
renforcement de la pertinence
réduction du spamdexing
Gestion des résultats Clustering
Gestion des résultats : la catégorisation automatique
Technologies plus complexes ; domaine d’innovations avancées des moteurs :
cf Exalead , Grokker, certains métamoteurs
Principes :
organisation en temps réel d’un lot de résultats pour donner possibilité d’affiner ou étendre la requête
répartition des documents dans des catégories
Intérêt pour la recherche :
aide à la sélection d’un mot-résultat
aide à l’élimination des corrélations inintéressantes,
suggestion d’idées et de pistes nouvelles
enjeu essentiel : mise en ordre du « chaos informationnel
Gestion de l'affichage Par liste...
Gestion de l'affichage ...Ou autrement !
Indexation automatique Indexation manuelle Indexation automanuelle : les metatdata
C'est quoi, une base de données ? Une base de données, c'est un tableau, à partir duquel on peut sortir différente représentation d'un objet quelconque.
Tout ce qui se passe sur l’Internet est un complément de son activité principale. Plus les gens font des choses en ligne, plus ils voient d’annonces et plus Google gagne de l’argent. De plus, comme l’activité internet augmente, Google rassemble plus de données sur les besoins des consommateurs et leurs comportements et peut adapter ses annonces plus précisément, ce qui lui permet de renforcer son avantage concurrentiel et augmenter encore ses revenus. http://www.internetactu.net/2008/02/11/linnovation-agile-a-la-google-est-elle-un-modele-ou-une-anomalie/
Pour conclure http://www.googlinside.com/index.php/2007/05/27/134-une-realite-menacante
Bibliographie en plus des références sitées dans le document distribué aux enseignants, ce diaporama d'Alexandre Serres de l'URFIST Rennes à qui j'ai emprunté et adapté les diapositives 34, 27, 25, 24, 23, 22, 21, 9 http://www.uhb.fr/urfist/sortir_de_google Voir aussi de frédéric Rabat doit-on enseigner Google ? http://documentaliste.ac-rouen.fr/spip/spip.php?article191
0 comments
Post a comment