Optimisez votre recherche d’information

         et votre veille sur Internet




     « Se faire battre est excusable,
 ...
Internet une source incontournable


  En décembre 2008, Internet comptait :

  ‐ 186,7 millions de sites Web dans le mond...
Où allez‐vous la
             trouver ?




Vous pouvez chercher sur le Web            Aurez‐vous de la chance ?




     ...
Le Web ne connaît pas votre univers, votre projet,
   votre travail…




Contexte


                                      ...
Recherche / Veille



• La recherche d’information est une activité intellectuelle qui,
  pour donner des résultats intére...
Sommaire


   • Caractéristiques de l’information

   • Les outils de recherche Web (pull)
        • Annuaires
        • M...
Fiabilité à vérifier




  Un accès en consultation et en diffusion,
            ‐ il est parfois difficile de mesurer la ...
Les outils :
deux approches de l’information



      La recherche                La veille
      ponctuelle
             ...
La recherche d’information (push)

                                                                             Les annuai...
Les Moteurs
                                            Sortir de la Googlelisation



 - Utiliser plusieurs moteurs de re...
Les moteurs de recherche


A retenir : chaque moteur a...

    Sa propre logique de parcours du réseau et de visites des s...
Recherche par meta-index
Les meta-moteurs




                                                         i
                 ...
Recherche par meta-index
Les meta-moteurs



    Avantages
          Recherche sur plusieurs moteurs en même temps
       ...
La veille
sur internet (Push)




  La ill
  L veille sur internet
               it     t


  L’usager n’effectue plus de...
Le Web « informel » - Newsgroups



                                                      Les forums
   Ce sont des groupe...
Le Web « informel » Weblogs


                                                                   Les blogs
   Un mini site...
Les fils RSS


Ce sont des fichiers dynamiques qui synthétisent les dernières
mises à jour d’un site web.
En s’abonnant au...
Un fil RSS est un fichier
texte au format XML
contenant le titre de
l'information, une courte
description et un lien
vers ...
La e-réputation




   Des pistes pour contrôler l'e‐réputation de son entreprise


                    Google alertes    ...
Fils RSS ou Agents intelligents




   Quelque soit l’outil :

   Soyez sélectifs, car à vouloir trop couvrir de sources,
...
Merci pour votre écoute
            et au plaisir de vous revoir

Bibliographie et sources ayant servi à cette présentatio...
Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?
Upcoming SlideShare
Loading in...5
×

Chercher mieux pour mieux trouver ?

2,649

Published on

Published in: Technology, Business

Transcript of "Chercher mieux pour mieux trouver ?"

  1. 1. Optimisez votre recherche d’information et votre veille sur Internet « Se faire battre est excusable, se faire surprendre est impardonnable » Napoléon N lé L’Échangeur Bordeaux Aquitaine Accélérer l’intégration des TIC dans les PME Un service de démonstrations et de diffusion des usages TIC dans l entreprise l’entreprise Un observatoire sur l’économie numérique en Aquitaine Le référent régional « Passeport Numérique » Le distributeur local des certificats de signature électronique Chambersign Un service de visio‐conférence
  2. 2. Internet une source incontournable En décembre 2008, Internet comptait : ‐ 186,7 millions de sites Web dans le monde ‐ 75 millions de noms de domaine correspondent à des sites actifs actifs. ‐ La taille du Web mondial a été multipliée par 2,5 depuis décembre 2005. ‐ En 2002, on comptait déjà 25 milliards de documents, 7,5 millions de nouvelles pages par jour, 150 terabytes d ’information , 690 milliards de pages dans l’ensemble des sites intranet. ‐ Google est le moteur de recherche le plus utilisé (87,5 % du trafic) ‐77% des internautes affirment ainsi avoir recherché des informations pratiques au cours de 30 derniers jours, et 74% des informations en rapport avec l'actualité. La recherche d'informations liées à l'actualité est d'ailleurs en forte progression depuis 2 ans (+23 points) Ipsos 2008 ‐1,4 millions de recherches chaque minute dans le monde, soit un peu plus de 2 milliards de recherche chaque jour. (Comscore, 2007) ‐ Été 2008, Google déclare que leurs machines qui crawlent le Web ont détecté mille milliards d’URL (1 trillon) Netcraft 12/2008 Une histoire vécue en images… Votre supérieur vous donne … Un projet urgent Vous avez Vous avez besoin besoin d’information pertinente d’information Source : http://www.enterprisesocialsearch.com/
  3. 3. Où allez‐vous la trouver ? Vous pouvez chercher sur le Web Aurez‐vous de la chance ? Mais sera‐t‐elle pertinente ? Plus probablement, vous tomberez sur une montagne d’information…
  4. 4. Le Web ne connaît pas votre univers, votre projet, votre travail… Contexte Constats • Mondialisation des marchés • Concurrence accrue et internationale • Augmentation exponentielle des sources d’information Conséquences Trop d’information tue l’information Besoin d ’une meilleure réactivité pour une meilleure compétitivité une Besoin d ’une méthodologie définie (identifier les sources, les analyser, les diffuser)
  5. 5. Recherche / Veille • La recherche d’information est une activité intellectuelle qui, pour donner des résultats intéressants, demande du temps. • Après avoir investi temps et énergie pour réaliser une bonne recherche documentaire, il est logique de vouloir être informé des nouvelles parutions pertinentes. • La veille informationnelle est l’ensemble des stratégies mises en place pour rester informé, en y consacrant le moins d’effort possible en utilisant des processus de signalement automatisés. Recherche / Veille • Avant : Il fallait penser à reprendre périodiquement ses recherches pour demeurer au courant des nouvelles parutions dans un domaine d’intérêt. d’intérêt • Aujourd’hui : Des évolutions technologiques permettent l’automatisation de plusieurs de ces opérations. Deux méthodes sont possibles : PULL : l’utilisateur va chercher les informations PUSH : le service envoie l'information à l’utilisateur
  6. 6. Sommaire • Caractéristiques de l’information • Les outils de recherche Web (pull) • Annuaires • Moteurs • Meta‐moteurs • Les outils de veille Web (push) • La newsletter • Les forums • Les communautés • Le Blog ou Weblog • L fil RSS Les fils • Les agrégateurs de contenu • les aspirateurs et agents intelligents • Conclusion Aller chercher l'information Trois types d'information •L'information blanche : ‐ Publique et accessible, ne fait l objet d'aucune sécurisation particulière accessible l'objet d aucune ‐ Recherche quot;classiquequot; dans les outils grands publics •L'information grise Ne fait pas l'objet de publicité, mais on peut la trouver de manière indirecte ou détournée ‐ Information sensible d'accès légal Techniques avancées de recherche et de traitement de l'information, groupe de discussion, liste de diffusion •L'information noire Fait l'objet d'une haute sécurisation ‐ Relève de l'espionnage industriel. Il y a aussi la désinformation. En fait, pour le néophyte, sur Internet, il est quasiment impossible de bien distinguer le bon du mauvais.
  7. 7. Fiabilité à vérifier Un accès en consultation et en diffusion, ‐ il est parfois difficile de mesurer la pertinence et la crédibilité des informations. Des risques de désinformation volontaire ‐ pratiquée par certains sites envers les technologies concurrentes Des sites dont l'information n'est pas actualisée ‐ des liens hypertextes non valides. ‐ des pages datant parfois de plusieurs années Comment être efficace ? Le Processus de recherche d’information Identifier le sujet Les mots clés Préciser la recherche Chercher et traiter l’information l information Les outils Identifier les pistes de recherche
  8. 8. Les outils : deux approches de l’information La recherche La veille ponctuelle ll stratégique éi Annuaires Lettres d’information Forums, Mailing list Moteurs de recherche Agrégateurs RSS Portails d’information Agents intelligents Forums, Weblogs La recherche d’information Les principa o tils de recherche s r le web principaux outils sur eb RSS
  9. 9. La recherche d’information (push) Les annuaires Yahoo : 150 000 sites français indexés voilà : 70 000 sites français indexés it f iid é X annuaires et répertoires spécialisés (Viticulture, BTP, entreprises …) Ils s’appuient sur une expertise humaine Ils permettent de retrouver des sites Ils ne sont pas exhaustifs Ils s’utilisent pour une recherche sur un thème large Les Moteurs Constat Tendance générale « Googlelisation » de l’Internet 87 % des internautes utilisent Google en recherche simple Danger Google localise seulement 8 Milliards de pages ‐ sur 25 Milliards de pages visibles ‐ sur 730 Milliards de pages invisibles
  10. 10. Les Moteurs Sortir de la Googlelisation - Utiliser plusieurs moteurs de recherche en parallèle Exalead, Alltheweb, Altavista, Go, Google, Hotbot, Infotiger, Lycos, Reacteur, Teoma, Wisenut, Ujiko, Seekport etc. - Utiliser la recherche avancée de moteurs Exalead Ujiko 123 people Spock ZoomInfo Maîtriser les meilleurs moteurs de recherche En résumé Objectifs : • Détecter seulement les premières informations p p pertinentes • Obtenir peu de réponses mais les « bonnes » réponses Penser à • Lancer en parallèle plusieurs moteurs de recherche • Utiliser les opérateurs booléens (les +), les guillemets, la troncature (*) • Faire attention :aux accent, aux minuscules et aux majuscules, à l’ordre l ordre des mots « Vous avez essayé. Vous avec échoué.Tant pis. Essayez de nouveau. Échouez encore. Échouez mieux. » Samuel Beckett
  11. 11. Les moteurs de recherche A retenir : chaque moteur a... Sa propre logique de parcours du réseau et de visites des sites Des critères spécifiques d’indexation Des critères d’interrogation plus ou moins puissants Des critères d’affichage et de tris des réponses Avantages : Recherche précise par mots clés et expressions, 1 clic pour trouver une page Limites : description précise des mots clés (unicité vectorielle) Volume d’information (8 milliards de pages) Le Web Invisible Les meilleurs moteurs n'indexent que 3 à 10% du web. • Une partie du web est non accessible aux moteurs parce que : ‐ les documents sont trop volumineux pour être entièrement indexés ‐ des pages sont protégées par l'auteur (balise qui stoppe le robot) ‐ le format des documents n'est pas reconnu par les moteurs (formulaires, réseaux…) ‐les pages sont protégées par un identifiant les ou mot de passe http://dadi.enssib.fr/ Wayback machine http://www.deeppeep.org
  12. 12. Recherche par meta-index Les meta-moteurs i Vecteur Mot i Vecteur i Internaute It t Meta-moteurs* Internet Moteurs * : Elimine les références doubles Recherche par meta-index Les meta-moteurs Ils interrogent en une fois différents outils de recherche pour fournir la réponse la plus exhaustive à une question. (liste de réponses issus de plusieurs moteurs) Les méta‐moteurs moteurs classiques Metacrawler Copernic Les méta‐moteurs moteurs « graphiques » Kartoo
  13. 13. Recherche par meta-index Les meta-moteurs Avantages Recherche sur plusieurs moteurs en même temps Vision rapide des résultats par moteur Élimination des références doubles Élimination des publicités Limites Profondeur des recherches (500 maxi/moteur) Pause...
  14. 14. La veille sur internet (Push) La ill L veille sur internet it t L’usager n’effectue plus de recherche et son rôle consiste maintenant à évaluer l’information récupérée Les lettres d’information La newsletter • S’abonner • Elle est périodique • Elle fournit un titre et un résumé d’une information • On la reçoit sur sa messagerie (mail, téléphone portable, assistant personnel…) newsletter Vitisphère newsletter Ci b t l tt Cimbat
  15. 15. Le Web « informel » - Newsgroups Les forums Ce sont des groupes de discussion organisés par thèmes. so t g oupes d scuss o o ga sés pa t è es Via un navigateur, l’utilisateur peut consulter des messages postés par d’autres utilisateurs, y répondre ou poster lui‐même de nouveaux messages. Exemple :http://www.abondance.com Annuaire :http://www.forumlinker.com/ Le Web « informel » Les communautés ou réseaux sociaux Communauté d'individus ou d'organisations en relation directe ou indirecte, rassemblée en fonction de centres d'intérêts communs. LinkedIn, Viadeo, Facebook, Ecobiz Exemple :http://bordeaux-ecobiz.biz
  16. 16. Le Web « informel » Weblogs Les blogs Un mini site web dynamique très simple et interactif. Se présente comme une succession de billets empilés ( titre+paragraphes) Chaque fois qu’un article est publié, il apparaît automatiquement au sommet de la page. Les billets sont rangés dans des répertoires chronologiques et peuvent être associés à des catégories thématiques. Il existe des blogs sur tout type de sujets, initialement destinés à un usage personnel, ils sont désormais très présents dans les milieux professionnels. Exemple : http://www.demainlaveille.fr/ Exemple : Wine marketing Exemple : BTP Perception Le Web « informel » Weblogs France 60 % des chefs d’entreprises considèrent les blogs comme un élément clef de la constitution de l'opinion sur un p p produit, un service ou une entreprise. , p 21 % lisent au moins une fois par semaine des parutions dans des blogs relatifs à leur activité. L ’Atelier BNP, 2007
  17. 17. Les fils RSS Ce sont des fichiers dynamiques qui synthétisent les dernières mises à jour d’un site web. En s’abonnant au fil RSS d’un site, on reçoit les liens vers les nouveaux documents publiés sur ce site sans avoir besoin de le visiter. On parle alors de contenus syndiqués et plus généralement de syndication de contenus. Donc un fil RSS est un canal pour s'informer vite et bien sur des sujets spécifiques. Exemple : http://echangeurba.wordpress.com Http://vitisphere.com Les agrégateurs de contenu … pour une revue de presse personnalisée Ce sont des sites qui permettent de visualiser dans une fenêtre unique un ensemble d'informations en provenance de différentes sources. d informations Les agrégateurs en ligne ont l'avantage d'être accessibles de n'importe quel poste informatique. Ces agrégateurs permettent aussi, la création de dossiers thématiques affinant ainsi le regroupement des fils comme on peut le faire avec les signets des sites Internet. Exemple : NETVIBES Flux RSS par métiers
  18. 18. Un fil RSS est un fichier texte au format XML contenant le titre de l'information, une courte description et un lien vers une page décrivant plus en détail l'information Les agrégateurs de contenu Avantages ‐ Informations accessibles de n'importe quel poste informatique ‐PPermet une lecture dé t lt déconnectée ou en temps réel de l’information té t é l d l’i f ti ‐ Mise en évidence des derniers articles et centralisation des sources. ‐ La technique RSS rend impossible la diffusion de Spam. ‐ On ne communique aucune donnée personnelle : anonymat. Inconvénients ‐ Un trop grand nombre de fils est impossible à traiter pour un humain. ‐ Dans la pratique, dans la mesure où tous les sites Internet n'offrent p q, pas ce service de syndication, il convient de suivre en sus les autres systèmes de veille ‐ Certains fils RSS ne donnent qu’une partie du contenu avec lien.
  19. 19. La e-réputation Des pistes pour contrôler l'e‐réputation de son entreprise Google alertes Technorati Des outils spécifiques Les agents intelligents Ils peuvent : • envoyer la requête à plusieurs agents d’information et organiser les réponses. • utiliser des outils statistiques ou linguistiques pour analyser l’information. • aspirer des sites Web • faire une veille spécialisée sur certains thèmes, en prévenant des éventuels changements...
  20. 20. Fils RSS ou Agents intelligents Quelque soit l’outil : Soyez sélectifs, car à vouloir trop couvrir de sources, on finit par être inondé et on passe son temps à trier les résultats ! En conclusion Méthode de veille manuelle Elaboration et mise en œuvre des méthodes : 1 Utiliser les recherches thématiques (annuaires) Détecter les premiers sites classés par catégorie, Consulter les sites et déterminer les mots clés du domaine (fr/us), Construire ses profils de recherche (équations ou expressions) 2 Utiliser les moteurs de recherche Consulter en parallèle plusieurs moteurs, 3 Traiter les résultats Apprécier la fiabilité des sources Sauvegarder le fichier, Sauvegarder le lien, Imprimer.
  21. 21. Merci pour votre écoute et au plaisir de vous revoir Bibliographie et sources ayant servi à cette présentation - Le blog Demain La veille : www.demainlaveille.fr - Le blog ITLigencia : www.itligentia.com - Les fils RSS en documentation et veille : Université de Lyon- JP LARDY - RSS et blogosphère : Urfist Info - Le site ADBS (association des professionnels de l'information et de la documentation) : www.adbs.fr -Animation sur le process de recherche : http://www.enterprisesocialsearch.com -I Iconographie « pause » : Pé él hi Pénélope J li Jolicoeur Certains de ces slides et des images utilisées peuvent avoir été adaptés de présentations disponibles sur Internet, notamment sur le site Slideshare. Nous vous prions de nous excuser par avance si d’aventure leurs auteurs ne figuraient pas sur cette présentation à seul usage des entreprises participant à nos ateliers..

×