Equipe‐projet TATOO Extrac3on de connaissances dans les bases de données : mo3fs séquen3els et ontologies Responsable : Pa...
    Extracon de connaissances dans de grandes bases de données                                                           ...
Fouille de données / Extracon de Connaissance     Fayyad (1996) : the non-trivial process of identifying     valid, poten...
Thèmes scienfiques     Motifs séquentiels (Contraintes temporelles)    Fouille de données complexes             Textes (...
Exemple : Les mofs séquenels   Recherche de corrélaons au sein de gros volumes de    données historisées                 ...
Des données disponibles de plus en plus rapidement   Comment maintenir la connaissance extraite ?        Eviter de recom...
Fouille de données environnementales : CEMAGREF‐LIRMM (M. Teisseire) Quelques exemples …      Suivi de l’évoluon de phéno...
Conclusion    Défis de la fouille de données :          Volume, rapidité et complexité/hétérogénéité des données         ...
Upcoming SlideShare
Loading in …5
×

Equipe TATOO : Extraction de connaissances dans les bases de données : motifs séquentiels et ontologies

1,180 views

Published on

Anne Laurent (LIRMM) présente les compétences de l'équipe TATOO en extraction de connaissances dans les bases de données.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,180
On SlideShare
0
From Embeds
0
Number of Embeds
8
Actions
Shares
0
Downloads
13
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Equipe TATOO : Extraction de connaissances dans les bases de données : motifs séquentiels et ontologies

  1. 1. Equipe‐projet TATOO Extrac3on de connaissances dans les bases de données : mo3fs séquen3els et ontologies Responsable : Pascal Poncelet 
  2. 2.   Extracon de connaissances dans de grandes bases de données  EXPERTISE DONNEES Représentation Traitement Visualisation PROBLEME Fouille de données CONNAISSANCE DECISION  Mots clés : extracon de connaissances, fouille de données, mofs séquenels,  entrepôts de données, logique floue, ontologie, annotaon automaque  
  3. 3. Fouille de données / Extracon de Connaissance   Fayyad (1996) : the non-trivial process of identifying valid, potentially useful and ultimately understandable patterns in data  Nombreuses applications : marketing, santé, etc.  Algorithmes supervisés/non supervisés  Algorithmes prédictifs/descriptifs  Problématiques associées : nettoyage des données, présentation des résultats, évaluation des méthodes, …
  4. 4. Thèmes scienfiques   Motifs séquentiels (Contraintes temporelles)  Fouille de données complexes   Textes (Text Mining)   Arborescentes (Schema - Web Structure Mining)   Multidimensionnelles (Cube - Web Usage Mining)   Flots (Stream Mining)  Fouille de données approximative
  5. 5. Exemple : Les mofs séquenels   Recherche de corrélaons au sein de gros volumes de    données historisées   ⟨(Lecteur DVD) (Ecran LCD, DVD1, DVD2) (Magnétoscope)⟩ Prise en compte d’informations spatio-temporelles Données mul‐dimensionnelles 
  6. 6. Des données disponibles de plus en plus rapidement   Comment maintenir la connaissance extraite ?    Eviter de recommencer « from scratch »   Comment faire face à des données disponibles sous la  forme d’un flot ?    Impossible de stocker les données (capteurs, clickstream,  RFID, news, …) !    Comment extraire de la connaissance ?    Comment résumer ces données ? 
  7. 7. Fouille de données environnementales : CEMAGREF‐LIRMM (M. Teisseire) Quelques exemples …     Suivi de l’évoluon de phénomènes via des dépêches de presses  (exemple H1N1  traité dans l’équipe)   Evoluon de la Dengue (Nevantropic, CEMAGREF)  A parr d’une base de données de l’INVS, idenficaon des quarers à risque et des  périodes caractérisques précédant une propagaon de l’épidémie  Données Teru‐Lucas     Connaître les différentes catégories d’occupaon du sol et d’usage de l’ensemble  du territoire (agricole, naturel et urbanisé) 
  8. 8. Conclusion   Défis de la fouille de données :    Volume, rapidité et complexité/hétérogénéité des données    Temps réel    Présentaon de la connaissance extraite    Quelle est la qualité des données collectées ?    Imprécisions/incertudes    Comment insérer d’autres connaissances ?    Données externes (e.g. météo)    Connaissance experte   

×