Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

805 views
663 views

Published on

Les applications des technologies de web mining pour le SEO

Published in: Marketing
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
805
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
23
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

  1. 1. SEO & FOUILLE DE TEXTES L’extraction d’information
  2. 2. Extraction d’information • « Information extraction » – Reconnaissance d’entités nommées – Identification des coréférences (ONU=Organisation des Nations Unies) – Extraction de relations – Extraction d’évènements – Extraction de terminologies…
  3. 3. Reconnaissance des entités nommées • La reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des documents • Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc.
  4. 4. Exemple : OpenCalais (Reuters)
  5. 5. Autre exemple • Dbpedia Spotlight
  6. 6. Annotation automatique
  7. 7. Extraction d’évènements
  8. 8. Extraction de faits et de relations
  9. 9. Structuration de données non structurées
  10. 10. Revminer
  11. 11. Catégorisation automatique
  12. 12. « Normalisation » des coréférences • • • • • The Beatles Beatles Beatle Beatles (The) The Beatles (Group)
  13. 13. Génération de textes automatique
  14. 14. Génération de pages hubs
  15. 15. Maillage automatique
  16. 16. Analyse du sentiment
  17. 17. Conclusion
  18. 18. Merci !

×