Session 5 Traitement et diffusion des résultats de la veille Par Ahmed Bachr Février 2008
Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Session 1 : Veille et ...
<ul><li>Plan  </li></ul><ul><li>Avant de commencer… </li></ul><ul><li>Classification de l’information </li></ul><ul><li>Ré...
<ul><li>Avant de commencer… </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veil...
<ul><li>Classification de l’information </li></ul><ul><li>Face à l’accroissement de l’information disponible en ligne, la ...
<ul><li>1. Classification de l’information :  clustering, catégorisation </li></ul><ul><li>La  catégorisation automatique ...
<ul><li>1. Classification de l’information :  clustering, catégorisation </li></ul><ul><li>Pour les domaines qui génèrent ...
<ul><li>Classification de l’information </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire...
<ul><li>Classification de l’information </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire...
<ul><li>Classification de l’information </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire...
<ul><li>2. Résumé de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire ...
<ul><li>2. Résumé de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire ...
<ul><li>2. Résumé de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire ...
<ul><li>2. Résumé de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire ...
<ul><li>2. Résumé de texte automatique </li></ul><ul><li>Outil Pertinence Summarizer </li></ul>Session 5 : Traitement et d...
<ul><li>3. Traduction de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Sémina...
<ul><li>3. Traduction de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Sémina...
<ul><li>4. Cartographie de l’information : </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Sémina...
<ul><li>4. Cartographie de l’information : </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Sémina...
<ul><li>4. Cartographie de l’information : </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Sémina...
<ul><li>4. Cartographie de l’information : </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Sémina...
<ul><li>5. Analyse sémantique du texte : text mining </li></ul>Session 5 : Traitement et diffusion des résultats de la vei...
<ul><li>5. Analyse sémantique du texte : text mining </li></ul>Session 5 : Traitement et diffusion des résultats de la vei...
<ul><li>5. Analyse sémantique du texte : text mining </li></ul>Session 5 : Traitement et diffusion des résultats de la vei...
<ul><li>5. Analyse sémantique du texte : text mining </li></ul>Session 5 : Traitement et diffusion des résultats de la vei...
<ul><li>6. Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la v...
<ul><li>6. Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la v...
<ul><li>6. Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la v...
<ul><li>6. Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la v...
Séminaire sur la veille documentaire Merci pour votre attention
Upcoming SlideShare
Loading in...5
×

Session 5 : Diffuser les résultats de la veille

11,019

Published on

Veille documentaire

Published in: Technology
0 Comments
11 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
11,019
On Slideshare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
1,084
Comments
0
Likes
11
Embeds 0
No embeds

No notes for slide

Session 5 : Diffuser les résultats de la veille

  1. 1. Session 5 Traitement et diffusion des résultats de la veille Par Ahmed Bachr Février 2008
  2. 2. Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Session 1 : Veille et méthodologie de veille Session 2 : Utiliser les outils de recherche Session 3 : Réaliser une veille manuelle Session 4 : Automatiser une cellule de veille Session 5 : traitement et diffusion de l’information de veille
  3. 3. <ul><li>Plan </li></ul><ul><li>Avant de commencer… </li></ul><ul><li>Classification de l’information </li></ul><ul><li>Résumé de texte automatique </li></ul><ul><li>Traduction de texte automatique </li></ul><ul><li>Cartographie de l’information </li></ul><ul><li>Analyse sémantique du texte </li></ul><ul><li>Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire
  4. 4. <ul><li>Avant de commencer… </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire <ul><li>Identification des besoins </li></ul><ul><li>Identification des sources (sourcing) </li></ul><ul><li>Collecte de l’information </li></ul><ul><ul><li>Méthode pull (bookmarks, navigation) </li></ul></ul><ul><ul><li>Méthode push (alertes email, RSS) </li></ul></ul><ul><li>Analyse traitement </li></ul><ul><li>Diffusion </li></ul>Veille manuelle =
  5. 5. <ul><li>Classification de l’information </li></ul><ul><li>Face à l’accroissement de l’information disponible en ligne, la catégorisation automatique de textes s’impose de plus en plus comme une technologie clé dans la gestion de la connaissance, tant interne qu’externe, au sein des organisations. </li></ul><ul><li>La catégorisation automatique de textes est un domaine scientifique et technique complexe qui requiert des technologies avancées en matière d’intelligence artificielle et de traitement du langage. </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire
  6. 6. <ul><li>1. Classification de l’information : clustering, catégorisation </li></ul><ul><li>La catégorisation automatique de textes consiste à classer de manière automatisée un corpus documentaire suivant certains critères (le sujet, le style, …). </li></ul><ul><li>Elle connaît, depuis une douzaine d’années, un fort regain d’intérêt. Cela s’explique essentiellement par la croissance exponentielle des documents numériques disponibles et par la nécessité de les organiser de façon rapide. </li></ul>Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille
  7. 7. <ul><li>1. Classification de l’information : clustering, catégorisation </li></ul><ul><li>Pour les domaines qui génèrent d’importants flux d’information, il devient difficile d’envisager un système de veille stratégique n’intégrant pas un module de catégorisation automatique. </li></ul><ul><li>Ainsi, en automatisant la classification du texte, la catégorisation libère des tâches de validation de l’information à faible valeur ajoutée et fortement consommatrice de temps. Tout cela au profit de la phase d’analyse à même d’optimiser le projet de veille. </li></ul>Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille
  8. 8. <ul><li>Classification de l’information </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Clusty est un moteur développé par l'équipe de Vivisimo spécialisée dans la fourniture de solution de clustering (catégorisation automatique des résultats par thématiques).
  9. 9. <ul><li>Classification de l’information </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire
  10. 10. <ul><li>Classification de l’information </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Option « All »
  11. 11. <ul><li>2. Résumé de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire <ul><li>Le résumé automatique permet d’extraire « à la volée » les phrases essentielles d’un texte ou d’une page web, représentant le sens général du document. </li></ul><ul><li>Utilisation d’algorithmes basés sur des calculs statistiques et des données linguistiques. Identification des concepts clés d'un texte et extraction des phrases les plus marquantes. </li></ul><ul><li>Cette technique donne actuellement d’assez bons résultats en permettant de gagner un temps appréciable quand il s’agit d’étudier le contenu de nombreux documents. </li></ul><ul><ul><li>Moins de temps à lire, sans toutefois manquer l'information essentielle. </li></ul></ul>
  12. 12. <ul><li>2. Résumé de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire <ul><li>Il existe de nombreux outils de résumé : </li></ul><ul><ul><li>Faciles à utiliser </li></ul></ul><ul><ul><li>Permettent d'augmenter de façon substantielle productivité et efficacité </li></ul></ul><ul><ul><li>Résumés concis de documents ou de pages Web </li></ul></ul><ul><ul><li>Paramétrage du résumé </li></ul></ul>
  13. 13. <ul><li>2. Résumé de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire <ul><li>Les fonctionnalités : </li></ul><ul><ul><li>Éventail de formats de textes supportés (html, pdf, txt, doc, rtf, …) </li></ul></ul><ul><ul><li>Enregistrement des résumés dans différents formats </li></ul></ul><ul><ul><li>Intégrable à différents navigateurs et clients de messagerie </li></ul></ul><ul><ul><li>Obtention de résumés à la volée dans l’application tierce </li></ul></ul>
  14. 14. <ul><li>2. Résumé de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire <ul><li>Les produits existants : </li></ul><ul><ul><li>Copernic Summarizer. Voir bref « tour animé » sur http://www.copernic.com/fr/products/summarizer/index.html </li></ul></ul><ul><ul><li>Pertinence summarizer. Plusieurs langues. Écrit en Java </li></ul></ul><ul><ul><li>Open Text Summarizer est un outil open source de résumé de texte automatique. http://libots.sourceforge.net/ </li></ul></ul><ul><ul><li>Sinope summarizer. http://www.sinope.info/en/Download </li></ul></ul>
  15. 15. <ul><li>2. Résumé de texte automatique </li></ul><ul><li>Outil Pertinence Summarizer </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire
  16. 16. <ul><li>3. Traduction de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Les technologies de la langue, et notamment les logiciels de traduction automatique, représentent des outils essentiels dans les systèmes de veille. Les logiciels de traduction automatique ne remplaceront jamais un traducteur humain et vouloir les exploiter dans ce sens ne peut mener qu'à des déceptions. Toutefois, les outils actuels peuvent apporter une aide réelle pour des usages centrés sur la compréhension de langues peu ou mal connues de l'utilisateur. Les progrès réalisés dans les domaines de la linguistique et de l'informatique permettent aujourd'hui d'utiliser, sur de simples postes de travail, des logiciels performants qui permettent d'obtenir en « premier jet » l'accès à un texte en langue étrangère.
  17. 17. <ul><li>3. Traduction de texte automatique </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire <ul><li>Quelques logiciels de traduction automatique : </li></ul><ul><ul><li>BILINGUA Ingénierie Linguistique : http://www.bilingua.com/ </li></ul></ul><ul><ul><li>GLOBALINK : http://www.bmsoftware.com/globalinkpowertranslator6.htm </li></ul></ul><ul><ul><li>SOFTISSIMO : http://www.softissimo.com/ </li></ul></ul><ul><ul><li>SYNAPSE : http://www.synapse-fr.com/ </li></ul></ul><ul><ul><li>SYSTRAN : http://www.systran.co.uk/ </li></ul></ul>
  18. 18. <ul><li>4. Cartographie de l’information : </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Présentation d’un corpus documentaire (ex. les résultats d’un moteur) sous forme d'une carte reliant entre eux les concepts voisins de la thématique de recherche.
  19. 19. <ul><li>4. Cartographie de l’information : </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Quelques outils de cartographie Newzingo cartographie l’actualité en scrutant en permanence les actualités de Google en anglais. Il en extrait les faits majeurs sous forme de « tags » et les présente en nuage de mots dans lequel la taille de chaque nouvelle est proportionnelle à son poids relatif dans les faits collectés. Plus un mot est présent dans le flux analysé, plus il est de taille importante. Un clic sur un tag permet d’accéder aux articles détaillés correspondant.
  20. 20. <ul><li>4. Cartographie de l’information : </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Quelques outils de cartographie Quintura, moteur visuel et textuel. Il représentent graphiquement le résultat des recherches. Quintura présente une fenêtre de résultats en deux sections : à gauche un nuage contextuel comprend les termes de la requête et des concepts déduits de la recherche, à droite, la liste classique des résultats.
  21. 21. <ul><li>4. Cartographie de l’information : </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Quelques outils de cartographie TagCrowd : outil de navigation et de visualisation des sites du Web 2.0 qui exploite les tags générés par les utilisateurs.
  22. 22. <ul><li>5. Analyse sémantique du texte : text mining </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Au vu du flot d'informations numériques que nous connaissons aujourd'hui , l’accès aux données textuelles utiles est devenu un vrai casse-tête. <ul><li>Le Text Mining répond, en parti, à cette problématique </li></ul><ul><li>Son objectif est de donner du sens à des informations non structurées et de faciliter la prise de décision </li></ul>
  23. 23. <ul><li>5. Analyse sémantique du texte : text mining </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Le Text Mining est un processus permettant d'analyser le texte pour extraire les informations pertinentes en vue d'une réutilisation bénéfique pour des buts précis. Des outils logiciels s'appuyant sur des méthodes (linguistiques, réseaux neuronaux, statistiques, …) traduites dans des algorithmes spécialisés vont permettre de « comprendre »  artificiellement le texte dans le but d’en extraire une quantité d'information limitée mais pertinente en vue du gain de temps et donc de productivité.
  24. 24. <ul><li>5. Analyse sémantique du texte : text mining </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire <ul><li>Critères de sélection d’un logiciel de text mining dans le cadre d’une veille </li></ul><ul><ul><li>Nombre de formats de documents supportés en entrée (en plus des documents bureautiques traditionnels, il faut aussi pouvoir gérer le SGML, le SML et le HTML) </li></ul></ul><ul><ul><li>Quantité de langues gérées nativement </li></ul></ul><ul><ul><li>Acquisition des flux HTTPS et RSS par défaut </li></ul></ul>
  25. 25. <ul><li>5. Analyse sémantique du texte : text mining </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire <ul><li>Quelques exemples d'utilisation du Text Mining </li></ul><ul><li>Analyse de clientèle : étude des réclamations des clients, raisons des changements de comportements de consommation, analyse de l'image de l'entreprise </li></ul><ul><li>Veille technologique et stratégique : sur les produits et les tendances d'un marché, sur la concurrence, sur la qualité des prestations fournies </li></ul><ul><li>Analyse de la presse, synthèse d'articles </li></ul><ul><li>Questions ouvertes, sondage, enquête d'opinion et de satisfaction </li></ul><ul><li>Routage et analyse d'email </li></ul><ul><li>Filtrage de documents, (anti-spam) </li></ul>
  26. 26. <ul><li>6. Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Définition : Les livrables de veille sont des documents émis périodiquement ou à la demande qui font la synthèse des recherches ponctuelles ou régulières sur des thèmes ou sur des concurrents selon les besoins d'un groupe d’utilisateurs.
  27. 27. <ul><li>6. Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Rapports de veille Newsletters Portail Dossiers de synthèse Identification d’experts Indicateurs Tableaux de bord Rapports d’étonnement Flash infos Revue de presse
  28. 28. <ul><li>6. Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Bulletin sous forme d’une page Web dynamique
  29. 29. <ul><li>6. Livrables de veille </li></ul>Session 5 : Traitement et diffusion des résultats de la veille Séminaire sur la veille documentaire Bulletin au format pdf
  30. 30. Séminaire sur la veille documentaire Merci pour votre attention
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×