Recherche avancée et veille en finance par Véronique Mesguich

  • 2,050 views
Uploaded on

Conférence du 21/01/11 …

Conférence du 21/01/11
Véronique Mesguich & Armelle Thomas ont reçu le prix "Intelligence économique et compétitivité" 2010 pour leur ouvrage "Net Recherche: le guide pour rechercher l\'information utile et surveiller le web", paru aux éditions ADBS.

La veille financière et stratégique est devenue une arme de compétitivité incontournable pour les entreprises, grands comptes ou PME, mais aussi pour les professionnels de la finance et du marketing. De nouvelles méthodes se sont développées, de nouvelles sources sont apparues, les logiciels de veille se sont démocratisés. Des enjeux importants se dessinent autour de la veille temps réel et de l\'exploitation des réseaux sociaux. La conférence permettra de faire le point sur des sources à valeur ajoutée en matière d\'information économique et financière, de dresser un panorama des moteurs de recherche les plus performants dans ce domaine, ainsi que des logiciels de surveillance automatisée du web.

More in: Technology , Business
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,050
On Slideshare
0
From Embeds
0
Number of Embeds
2

Actions

Shares
Downloads
0
Comments
0
Likes
3

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. AFI CNAM Recherche avancée et veille en finance Véronique MESGUICH WWW.DEVINCI.FR veronique.mesguich@devinci.fr 21 janvier 2011 1Mastère Spécialisé Intelligence des Risques & Innovations / IE www.FormationContinue-ISEP.fr
  • 2. La société de l informationSurabondance de l information, « infobésité »Hyperspécialisation quiempêche une vision d ensembleet a tendance à cloisonnerMontée de l incertitude,difficulté à prévoirInfluence et désinformationUbiquité, immédiatetéMondialisation de l informationet de la communication 2
  • 3. Surabondance d outilsSurabondanced outils auxfonctionnalitéssouvent redondantesQuelle pérennité ?Comment effectuerles bons choix ?
  • 4. Du web de documents au web de conversations « Web de données » Web « de conversations »Web sémantique Web « de documents » Web multimédia 1994- 2004- Web mobile temps réel 2008-
  • 5. Ne pas confondre le web et Internet Selon le magazine américain Wired, les applications de type smartphone pourraient remplacer à terme les sites web Le web n est qu un élément parmi d autres d Internet
  • 6. The « Hype Cycle »Gartner Group 2010
  • 7. Les 3 niveaux d informationInformation blanche:Facile et accessible à tous (pas toujoursgratuite!)Nécessite sélection et traitement manuel ouautomatiséeex : le web, les ouvrages, les médiasInformation grise : a l origine, ce qui échappeaux circuits classiques de l édition. Parextension, les sources informellesInformation noire : confidentielle, obtenue viamoyens illégaux 7
  • 8. L évolution des usages de laveille, des supports et des outils Années 70 Veille technologique Bases de données Paramétrage d alertes sur scientifiques, bases de données Années 80 brevets Veille concurrentielle et stratégique - business Bases de données Systèmes d aide à la intelligence info électronique décision professionnelle Années 90 Intelligence économique Agents intelligents Développement du web Logiciels de surveillance automatisée Années 2000 : Veille collaborative Plates forme de veille Veille d opinion -Veille Web 2.0 intégrée personnelle Intelligence d entreprise Outils de text mining Web 3.0 Flux RSS Monitoring mots Années 2010: clés réseaux sociaux Veille temps réel - multimédia Addons navigateurs Firefox Outils d analyse opinion
  • 9. Veille : Différencier les besoins d informationType de Besoin Besoin Besoinbesoin d information d information d information instrumental conceptuelle décisionnelleObjectif Rôle Enrichissement Rôle d influence opérationnel de la dans le dans un connaissance et processus de processus de la réflexion décision d actionMise en Recherche Recherche ou Veilleoeuvre d informations: veille stratégique : recherche documentaire: Recherche de factuelle, Recherche de documents, recherche de documents, recherche de documents collecte sources, collecte régulière régulière d information d information, analyse stratégique
  • 10. Collecte : Les principes de baseRechercher l information à la sourceLes notions de serendipité : art de trouver desinformations pertinentes sans les chercherUtiliser différentes sources et différents supports(on ne trouve pas tout sur Internet !)Recouper les sources d informationRespecter les règles de la déontologie (SCIP,Fepie www.fepie.org)
  • 11. Recherche web : deux approches méthodologiquesL approche « mots clés » : recherche par motsclés sur texte intégral des pages web. La qualité dela recherche dépendra du choix des mots clés :nombre de mots clés, degré de précision, langue,combinaison avec opérateurs booléens...Inconvénient : le manque d exhaustivité desmoteurs et méta-moteurs (« web invisible »)L approche « exploration des sources » :identifier les sources d information les pluspertinentes par rapport à la requête, utiliser ensuiteles outils de recherche intégrés à ces sources,l exploration de liens...Inconvénient : suppose une bonne connaissancedes sources 11
  • 12. Recherche d information sur Internet : se méfier des idées reçuesLes moteurs de recherche, même les pluspuissants, n indexent qu une partie du web(notion de pages dynamiques, « web invisible »)Les moteurs de recherche n indexent pas leweb en temps réel et ne sont pas à jourL outil n est pas tout : rechercher l information« à la source » : portails spécialisés, portailsgéographiques...
  • 13. Les différentes générations1ère génération Altavista de moteurs Vieillissement de l index.(apparus en 95-96) Hotbot Voilà Algorithmes de pertinence pas Lycos toujours efficaces.2ème génération Google Bonne pertinence, index important.(apparus en 98- Yahoo99 ou plus) MSN Bing Ask3ème génération Wisenut Fonctionnalités de visualisation souvent(apparus à partir de Exalead originales Kartoo, Cuil et Wisenut ont2001) Kartoo désormais disparu Cuil4ème génération GG Custom Les moteurs personnalisables, créés par Search l utilisateur Powerset Les moteurs sémantiques Wolfram Alpha Les moteurs multimédias Truveo 123people La recherche de personnes Social Les moteurs temps réel 13 Mention
  • 14. TendancesReprésentation cartographiquedes résultats (Touchgraph, SocialComputing, Kartoo, ExaleadConstellations,Pikko )Développement des moteursverticaux ou spécialisés (Scirus,Google Scholar, Medworm )Interrogation en langage naturel(True Knowledge, Powerset)Recherche multilingue(Google Translated search)Recherche « mobile »et « temps réel » (Twitter,Friendfeed)Recherche de donnéesfactuelles(Wolfram Alpha, Google Squared)Moteurs spécialisés par pays(Yandex pour la Russie, Baidu pourla Chine..) 14www.searchenginecolossus.com
  • 15. TendancesRegroupement des acteurs.Simplification de la syntaxePersonnalisation (Google CustomSearch, Yahoo BOSS, Swicki,Mozbot, )Développement des outils departage (web social ou « 2.0 » :bookmarking social, wikis, réseauxsociaux, moteurs collaboratifs )Clustering et catégorisationautomatique (Exalead, Vivisimo )Diffusion de l information via desflux (formats RSS ou Atom)Moteurs multimédias (Truveo,Blinkx, Voxalead ) 15
  • 16. Recherche multimédiaNombreux moteurs audioet video : Blinkx, TruveoTechnologies« Speech to text » Exalead: lancement de VoxaleadGoogle Audio IndexingOptions de rechercheavancée d images(Google, Bing, Exalead ).Reconnaissance descouleursRecherche par similaritéd image : Like.com, Cydral,Google Similar Images,Tineye 16
  • 17. La prédominance de Google Près de 90 % de part de marché en France début 2011 (source : ATMonitor) Les raisons du décollage : rapidité, pertinence (algorithme du page rank), simplicité (opérateur ET par défaut), orientation « pur moteur », marketing viral Les raisons du maintien à la première place : diversification, liens sponsorisés (Adwords), bons investissements, culture d entreprise originale 17
  • 18. Les principaux critères de pertinence des moteurs- Occurrence et densité des mots-clés- Présence dans l URL, dans le titre oupositionnement dans la page- Proximité et ordre des mots-clés- Taille et styles de polices- Présence dans les méta-données(meta-keywords, meta-description)balise metakeyword désormais obsolètesur Google, Yahoo et BingCritères « off the page » :- Indice de popularité (page 18rank jusqu à quand?)
  • 19. Moteurs de recherche : la syntaxeOR : permet de chercher des synonymesou termes prochesGuillemets : pour rechercher uneexpression exacte+ : imposer l orthographe d un mot- : pour exclure un motLimitations de recherche sur Google etYahoo : type de doc, date (attention,date de dernière maj) 19
  • 20. Méta-moteurs :quand les utiliserLes méta-moteurs « on-line » sont parfois trop aléatoires. Denombreux méta-moteurs en ligne ont disparu ou ont évoluévers d autres fonctionsA utiliser pour des termes « rares » ou au contraire, pouravoir un premier aperçu des résultats pour des termes plusgénérauxLes méta-moteurs comparateurs de résultats (Allplus, Jux2,Releton )L avenir des méta-moteurs clients (Copernic ) 20
  • 21. Internet versus bases de données Intérêt d Internet : Intérêt des bases de . Multiplicité des sources données : d information . Fiabilité de l information . Interactivité . Données à valeur ajoutée . Couverture internationale . Forme structurée A utiliser pour : A utiliser pour : . Actualité immédiate . Archives de presse . Analyse sites des . Bilans entreprises entreprises . Etudes de marché . Infos sur pays . Fédérations professionnelles - portails spécialisés
  • 22. Principales bases de données utiles pour la veille concurrentielle/marketing Agrégateurs presse : Lexis, Factiva, Business Source Premier (Monde), Pressed (France), Europresse, Pikanews (Europe) Etudes de marché : Xerfi (France/Europe/Monde), Eurostaf-Les Echos; Marketline Datamonitor, Reuter Business Insight, Thomson Business Intelligence (Monde) Info financière : Diane (France), Amadeus (Europe), Osiris, Infinantials, Altares, Dun&Bradstreet (Monde)
  • 23. Agrégateurs de presse et newslettersGoogle actualités 40éditions mondialesDes agrégateurs « 2.0 »: Wikio, Synthesio,PikanewsLes newsletters : peu àpeu supplantées par lesflux mais toujours utiles
  • 24. Astuces !Remonter dans le temps(retrouver des pagesdisparues) : Waybackmachine www.archive.orgIdentifier un nom de domaine(www.indom.com)
  • 25. Activer la sérendipitéTrouver des sites portails ou fédérateurs Trouver des sites pointant vers une source connue Trouver des sites « similaires » à une source connue Trouver des listes de liens déjà constituées
  • 26. Trouver des sites « pointant »vers une source déjà connue Ex : la fonction link dans Google à partir d une URL connue Sur Yahoo, utiliser Linkdomain Ex : "journée nationale des études" linkdomain:www.adetem.org .
  • 27. Trouver des sites « similaires » à une source connueCartographiedes liensavec Touchgraph(ou Kartoo,Exalead Constellations )
  • 28. Trouver des sites « similaires » à une source connueFonction « related » chez Google
  • 29. Recherche d expertsRecherche sur les sitesuniversitaires (Google Recherche de thèses :Scholar, extraction de Dissertation abstractsnoms) (monde) ou Sudoc (France)Recherche sur les blogs Limitation aux documents PPT dans laRecherche dans les recherche avancée deréseaux sociaux via Google ou recherche deGoogle documents Powerpoint viaEx : geosciences www.slideshare.netsite:www.linkedin.com OR Moteurs de recherchessite:www.viadeo.com de personnes www.123people.com www.zoominfo.com www.pipl.com
  • 30. Personnaliser les flux RSS avec Yahoo PipesYahoo Pipes permet de filtrer les flux RSS à partir d un mot clé, de les fusionner, de les trier
  • 31. Les nouveaux médias sociauxNouveaux médias sociaux : lephénomène TwitterUne « caisse de résonance » mondialepour suivre les tendancesPrès de 20 % des messages sur Twittermentionnent le nom d une marque(source : Penn State University)Vers une veille« temps réel » ? Développement des« livestreams » permettant de mixer desdonnées issues de plusieurs réservoirs
  • 32. L homme est un document comme les autresLa redocumentarisation dumonde« Les réseaux sociauxposent aujourdhui, ausens propre, la questiondocumentaire appliquéeau facteur humain »(Olivier Ertzscheid)
  • 33. Professionnel Réseaux sociaux professionnels Mashup de flux Viadeo, Linkedin Yahoo Pipes Moteurs personnalisables Google Custom Search Bookmarking social Delicious, Diigo Flux RSS et Atom Blogs d experts Wikis Mashups WikipediaMutualisation Réseaux sociaux amicaux Personnalisation Facebook, Myspace Microblogging Twitter Partage photos, vidéos Flickr, Youtube Agrégateurs d actualité Wikio, Digg Blogs Grand public
  • 34. Syndication de contenu : les fils RSS Un fil RSS (Really simple syndication ou Rich Site Summary) est un fichier XML qui permet de publier des titres de nouvelles ou darticles, exploitables dynamiquement. Ils permettent d être alerté en permanence sur un domaine d actualité ou sur les nouveautés apparaissant sur un site précis. Format RSS ou ATOM
  • 35. Accéder aux fils RSS :pas d outil miracle Intégration aux navigateurs Firefox, IE, (versions récentes), Safari, Chrome Clic sur l icone RSS Utilisation d un agrégateur en ligne (ex : Netvibes, Google Reader, RSS Bandit, Bloglines, Newsgator, Feedreader ) www.bloglines.com www.netvibes.com Agrégateur des flux de médias francophones : Alertinfo www.geste.fr Options personnalisées de Google ou Yahoo (mon Yahoo) Logiciels de messagerie (Thunderbird, Outlook )
  • 36. Monitoring mots clés : Google actualités http://news.google.fr/ Recherche mots clésAlerte par mail ou flux (clic sur RSS) 36
  • 37. Monitoring mots clés : Google Alertswww.google.fr/alerts Choix des mots clés Actualité, pages web, forums Envoi par mail ou sous forme de flux 37
  • 38. Netvibes : syndication de flux 38
  • 39. Google Reader www.google.fr/reader Pour ajouter un flux Flux classés par thèmes 39Mastère Spécialisé Intelligence des Risques & Innovations / IE www.FormationContinue-ISEP.fr
  • 40. Twitter pour la veille?Diffusion d informationsdepuis des sites de média, blogs, réseaux sociaux Recherche et veille (alertes) e-reputation, suivi d une personne physique ou morale, d un sujet, veille marketing 40
  • 41. La recherche « temps réel »Social Mention : recherche sur blogs, Analyse automatique du microblogging, « sentiment » positif, bookmarking social, neutre ou négatif vidéos 41 www.FormationContinue-ISEP.fr
  • 42. Recherche simultanée surplusieurs réseaux sociauxRecherche par nom de personne oud entrepriseMoteurs de recherche de personnes:123people, Zoominfo, Wink, Yoname,PiplRecherche temps réel : Social MentionYoono : extension Firefox pour faciliterl accès à des réseaux sociaux 42
  • 43. Exemple : veille d opinionSurveiller l image de la sociétéCarrefour dans les médias chinoisComment dit on « Carrefour » enchinois ? 43 www.FormationContinue-ISEP.fr
  • 44. Recherche dans le Google news Chine et création du flux 44
  • 45. Traduction des flux via Google Reader 45
  • 46. Résultat 46