Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Une veille intelligente dans un monde global - Proxem - Séminaire DIXIT du GFII, 13 avril 2015

1,678 views

Published on

Intervention de François Régis Chaumartin, Dirigeant, Proxem et Claude Fauconnet, chef de projet innovation numérique, Total

Séminaire DIXIT du GFII : Les nouvelles frontières de la « data intelligence » : content analytics, machine-learning, prédictif, 13 avril 2015, Paris.

Abstract : Dans un monde globalisé, les fonds documentaires sont loin d’être tous en français ou en anglais, et nécessitent pour être exploités de dépasser la barrière des langues. Claude Fauconnet (Total) et François-Régis Chaumartin (Proxem) présenteront la démarche pour effectuer une collecte multilingue sur le web et une analyse sémantique des Big data textuelles. Nous verrons avec des illustrations provenant de retours d’expériences concrets, comment analyser un ensemble de marchés, de thématiques, d’articles de presse et de technologies rapidement et dans la plupart des langues existantes.

Source : http://www.gfii.fr/fr/document/seminaire-dixit-les-nouvelles-frontieres-de-la-data-intelligence-content-analytics-machine-learning-predictif

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

Une veille intelligente dans un monde global - Proxem - Séminaire DIXIT du GFII, 13 avril 2015

  1. 1. 1 Une veille intelligente dans un monde global Témoignage du groupe Total sur ses usages des solutions d'analyses sémantiques de Proxem
  2. 2. 2 Intervenants Claude Fauconnet • Chef de projet innovation numérique François-Régis Chaumartin • Directeur général
  3. 3. 3 Agenda Analyse des big data textuelles Veille intelligente multilingue Retours d’expérience Questions & réponses
  4. 4. 4 Analyse des big data textuelles (Le métier de Proxem !)
  5. 5. 5 Analyse des big data textuelles 20% 80%
  6. 6. 6 Analyse des big data textuelles
  7. 7. 7 Analyse des big data textuelles Innovation sur la collecte • Découverte automatique des sources parlant d’un sujet sur le vaste web Innovation sur l’analyse • Constitution rapide d’un analyseur sémantique parfaitement adapté à un corpus Innovation sur l’analyse multilingue • Bascule rapide d’une langue à une autre pour disposer d’un analyseur natif
  8. 8. 8 Analyse des big data textuelles API Application Etudes
  9. 9. 9 Analyse des big data textuelles
  10. 10. 10 Analyse des big data textuelles • Sur le paramétrage du web mining & text mining • Baisse des coûts Rendre l’utilisateur autonome sur… • Grande distribution, banque, assurance, luxe, recrutement, industrie, automobile, télécom…… tout sujet • Relation clients, veille stratégique, qualité, ressources humaines…… tout enjeux métier • Anglais, français, chinois, russe, espagnol, japonais, farsi, italien, allemand, portugais…… diverses langues
  11. 11. 11 Analyse des big data textuelles Web mining • Taille du web • Accès restreint • Filtrage difficile Text mining • Complexité de la langue • Ambiguïté omniprésente • Barrière des langues
  12. 12. 12 Veille intelligente multilingue Dépasser la barrière des langues
  13. 13. 13 Veille intelligente multilingue
  14. 14. 14 Veille intelligente multilingue • Homonymes : pain@fr vs. pain@en, chat@fr vs. chat@en... • Identifier les sources pertinentes pour chaque langue Collecte dédiée à chaque langue • Chaque langue a ses spécificités (morphologie, syntaxe…) • Constitution de ressources natives ou traduction automatique ? Analyse dédiée à chaque langue • Définir un plan de classement unique, décliné dans chaque langue • Il s’agit d’un modèle (taxonomie ou ontologie) du domaine Alignement des résultats d’analyse
  15. 15. 15 Multilingue Langue 1 Langue 2 Langue 3 Traduction Traduction
  16. 16. 16 Veille intelligente multilingue voiture hybride hybrid car ‫الهجينة‬ ‫السيارات‬ 混合动力汽车 carro híbrido Hybridauto 33 600 962 000 550 000 15 900 000 26 100 000 2 330 000
  17. 17. 17 Retours d’expérience
  18. 18. 18 Veille industrielle Client Concurrent
  19. 19. 19 Recherche de matière première 10864 7051 4666 3081 2305 1342 1099 885 755 475 246
  20. 20. 20 Questions & réponses Claude Fauconnet, Chef de projet innovation numérique, Total François-Régis Chaumartin, Ph.D., Directeur général, Proxem

×