Slideshare.net (beta)

 
Post: 
Myspace Hi5 Friendster Xanga LiveJournal Facebook Blogger Tagged Typepad Freewebs BlackPlanet gigya icons



All comments

Add a comment on Slide 1

If you have a SlideShare account, login to comment; else you can comment as a guest


Showing 1-50 of 3 (more)

Session 5 : Diffuser les résultats de la veille

From Bachr, 4 months ago

Veille documentaire

264 views  |  0 comments  |  3 favorites  |  24 downloads  |  2 embeds (Stats)
 

Groups/Events

Not added to any group/event

 
 

Privacy InfoNew!

This slideshow is Public

 
Embed in your blog
Embed (wordpress.com)
custom

Slideshow Statistics
Total Views: 264
on Slideshare: 246
from embeds: 18* * Views from embeds since 21 Aug, 07

Slideshow transcript

Slide 1: S ession 5 Traitement et diffusion des résultats de la veille Par A hmed B achr Février 2008

Slide 2: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille S ession 5 : traitement et diffusion de l’information de veille S ession 4 : A utomatiser une cellule de veille S ession 3 : Réaliser une veille manuelle S ession 2 : Utiliser les outils de recherche S ession 1 : V eille et méthodologie de veille 2

Slide 3: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille Plan A vant de commencer… 3.Classification de l’information 4.Résumé de texte automatique 5.Traduction de texte automatique 6. Cartographie de l’information 7. A nalyse sémantique du texte 8. Livrables de veille 3

Slide 4: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille A vant de commencer… Identification des besoins Identification des sources (sourcing) Collecte de l’information V eille manuelle = Méthode pull (bookmarks, navigation) Méthode push (alertes email, RSS) Analyse traitement Diffusion 4

Slide 5: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 1. Classification de l’information Face à l’accroissement de l’information disponible en ligne, la catégorisation automatique de textes s’impose de plus en plus comme une technologie clé dans la gestion de la connaissance, tant interne qu’externe, au sein des organisations. La catégorisation automatique de textes est un domaine scientifique et technique complexe qui requiert des technologies avancées en matière d’intelligence artificielle et de traitement du langage. 5

Slide 6: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 1. Classification de l’information : clustering, catégorisation La catégorisation automatique de textes consiste à classer de manière automatisée un corpus documentaire suivant certains critères (le sujet, le style, …). Elle connaît, depuis une douzaine d’années, un fort regain d’intérêt. Cela s’explique essentiellement par la croissance exponentielle des documents numériques disponibles et par la nécessité de les organiser de façon rapide. 6

Slide 7: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 1. Classification de l’information : clustering, catégorisation Pour les domaines qui génèrent d’importants flux d’information, il devient difficile d’envisager un système de veille stratégique n’intégrant pas un module de catégorisation automatique. A insi, en automatisant la classification du texte, la catégorisation libère des tâches de validation de l’information à faible valeur ajoutée et fortement consommatrice de temps. Tout cela au profit de la phase d’analyse à même d’optimiser le projet de veille. 7

Slide 8: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 1. Classification de l’information Clusty est un moteur développé par l'équipe de Vivisimo spécialisée dans la fourniture de solution de clustering (catégorisation automatique des résultats par thématiques). 8

Slide 9: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 1. Classification de l’information 9

Slide 10: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 1. Classification de l’information Option « All » 10

Slide 11: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 2. Résumé de texte automatique Le résumé automatique permet d’extraire « à la volée » les phrases essentielles d’un texte ou d’une page web, représentant le sens général du document. Utilisation d’algorithmes basés sur des calculs statistiques et des données linguistiques. Identification des concepts clés d'un texte et extraction des phrases les plus marquantes. Cette technique donne actuellement d’assez bons résultats en permettant de gagner un temps appréciable quand il s’agit d’étudier le contenu de nombreux documents. Moins de temps à lire, sans toutefois manquer l'information essentielle. 11

Slide 12: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 2. Résumé de texte automatique Il existe de nombreux outils de résumé : • Faciles à utiliser • Permettent d'augmenter de façon substantielle productivité et efficacité • Résumés concis de documents ou de pages Web • Paramétrage du résumé 12

Slide 13: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 2. Résumé de texte automatique L es fonctionnalités : • Éventail de formats de textes supportés (html, pdf, txt, doc, rtf, …) • Enregistrement des résumés dans différents formats • Intégrable à différents navigateurs et clients de messagerie • Obtention de résumés à la volée dans l’application tierce 13

Slide 14: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 2. Résumé de texte automatique L es produits existants : • Copernic S ummarizer. V oir bref « tour animé » sur http:/ www.copernic.com/ products/ / fr/ summarizer/index.html • Pertinence summarizer. Plusieurs langues. Écrit en Java • Open Text S ummarizer est un outil open source de résumé de texte automatique. http:/ libots.sourceforge.net/ / • S inope summarizer. http:/ www.sinope.info/ Download / en/ 14

Slide 15: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 2. Résumé de texte automatique Outil Pertinence S ummarizer 15

Slide 16: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 3. Traduction de texte automatique L es technologies de la langue, et notamment les logiciels de traduction automatique, représentent des outils essentiels dans les systèmes de veille. L es logiciels de traduction automatique ne remplaceront jamais un traducteur humain et vouloir les exploiter dans ce sens ne peut mener qu'à des déceptions. Toutefois, les outils actuels peuvent apporter une aide réelle pour des usages centrés sur la compréhension de langues peu ou mal connues de l'utilisateur. L es progrès réalisés dans les domaines de la linguistique et de l'informatique permettent aujourd'hui d'utiliser, sur de simples postes de travail, des logiciels performants qui permettent d'obtenir en « premier jet » l'accès à un texte en langue étrangère. 16

Slide 17: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 3. Traduction de texte automatique Quelques logiciels de traduction automatique :  BILINGUA Ingénierie Linguistique : http://www.bilingua.com/  GLOBALINK : http://www.bmsoftware.com/globalinkpowertranslator6.htm  SOFTISSIMO : http://www.softissimo.com/  SYNAPSE : http://www.synapse-fr.com/  SYSTRAN : http://www.systran.co.uk/ 17

Slide 18: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 4. Cartographie de l’information : Présentation d’un corpus documentaire (ex. les résultats d’un moteur) sous forme d'une carte reliant entre eux les concepts voisins de la thématique de recherche. 18

Slide 19: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 4. Cartographie de l’information : Quelques outils de cartographie Newzingo cartographie l’actualité en scrutant en permanence les actualités de Google en anglais. Il en extrait les faits majeurs sous forme de « tags » et les présente en nuage de mots dans lequel la taille de chaque nouvelle est proportionnelle à son poids relatif dans les faits collectés. Plus un mot est présent dans le flux analysé, plus il est de taille importante. Un clic sur un tag permet d’accéder aux articles détaillés correspondant. 19

Slide 20: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 4. Cartographie de l’information : Quelques outils de cartographie Quintura, moteur visuel et textuel. Il représentent graphiquement le résultat des recherches. Quintura présente une fenêtre de résultats en deux sections : à gauche un nuage contextuel comprend les termes de la requête et des concepts déduits de la recherche, à droite, la liste classique des résultats. 20

Slide 21: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 4. Cartographie de l’information : Quelques outils de cartographie TagCrowd : outil de navigation et de visualisation des sites du Web 2.0 qui exploite les tags générés par les utilisateurs. 21

Slide 22: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 5. Analyse sémantique du texte : text mining Au vu du flot d'informations numériques que nous connaissons aujourd'hui , l’accès aux données textuelles utiles est devenu un vrai casse-tête. Le Text Mining répond, en parti, à cette problématique Son objectif est de donner du sens à des informations non structurées et de faciliter la prise de décision 22

Slide 23: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 5. Analyse sémantique du texte : text mining Le Text Mining est un processus permettant d'analyser le texte pour extraire les informations pertinentes en vue d'une réutilisation bénéfique pour des buts précis. Des outils logiciels s'appuyant sur des méthodes (linguistiques, réseaux neuronaux, statistiques, …) traduites dans des algorithmes spécialisés vont permettre de « comprendre » artificiellement le texte dans le but d’en extraire une quantité d'information limitée mais pertinente en vue du gain de temps et donc de productivité. 23

Slide 24: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 5. Analyse sémantique du texte : text mining Critères de sélection d’un logiciel de text mining dans le cadre d’une veille  Nombre de formats de documents supportés en entrée (en plus des documents bureautiques traditionnels, il faut aussi pouvoir gérer le SGML, le SML et le HTML)  Quantité de langues gérées nativement  Acquisition des flux HTTPS et RSS par défaut 24

Slide 25: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 5. Analyse sémantique du texte : text mining Quelques exemples d'utilisation du Text Mining Analyse de clientèle : étude des réclamations des clients, raisons des changements de comportements de consommation, analyse de l'image de l'entreprise Veille technologique et stratégique : sur les produits et les tendances d'un marché, sur la concurrence, sur la qualité des prestations fournies Analyse de la presse, synthèse d'articles Questions ouvertes, sondage, enquête d'opinion et de satisfaction Routage et analyse d'email Filtrage de documents, (anti-spam) 25

Slide 26: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 6. Livrables de veille Définition : Les livrables de veille sont des documents émis périodiquement ou à la demande qui font la synthèse des recherches ponctuelles ou régulières sur des thèmes ou sur des concurrents selon les besoins d'un groupe d’utilisateurs. 26

Slide 27: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 6. Livrables de veille Rapports d’étonnement Revue de presse Newsletters Portail Rapports de veille Flash infos Tableaux de bord Indicateurs Dossiers de synthèse Identification d’experts 27

Slide 28: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 6. Livrables de veille Bulletin sous forme d’une page Web dynamique 28

Slide 29: Séminaire sur la veille documentaire Session 5 : Traitement et diffusion des résultats de la veille 6. Livrables de veille Bulletin au format pdf 29

Slide 30: Séminaire sur la veille documentaire Merci pour votre attention 30