SlideShare a Scribd company logo
1 of 29
Introduction au Datamining Concepts et techniques BOUSSAIDI Abdellah CHAÏB Ismaïl ESI, 06/04/2009
? ? ? ? ? connaissances Montagne de données Problème?
Datamining
Quoi         Comment 	     Jusqu’ou ?
Quoi? Le datamining est un processus de découvertede connaissances connaissances Datamining  Bases de données et Datawarehouses
Pourquoi? Description Prédiction
Exemples d’application Segmentation des clients  Déterminer le panier de la ménagère  Détection de Fraude
Champs d’application
Avantages Renforcer la position compétitive de l’entreprise  Identifier les facteurs qui déterminent le comportement du client ; Transformer des masses de données en information utile Meilleure  prise de décision  Identifier les investissements les plus profitables et les moins couteux.
QuoiCommentJusqu’ou ?
Le datamining est un processus itératif
Application du processus de datamining :Les Télécoms
Formaliser le problème Problématique: ,[object Object]
 Taux de turn-over,[object Object]
 Heures d’appels;
 Appels non aboutis;
 …etc.,[object Object],[object Object]
17 Estimer le modèle ,[object Object],SVM Validation Logique Floue Vérification Réseaux Bayésiens Réechan Réseaux  De Neurones Méthodes D’apprentissage Google Confidential
18 Estimer le modèle Estimation De l’erreur logiciel Implémentation Techniques De datamining Google Confidential
19 Interpréter le modèle  et tirer les conclusions Résultats Google Confidential
Interpréter le modèle et tirer les conclusions
Quoi CommentJusqu’ou ? Le textmining
Le TextMining TextMining Process
Pourquoi? 80% de l’information enregistrée,  l’est sous forme textuelle
Quoi CommentJusqu’ou ?
Logiciels de datamining Poids lourds SAS SPSS Clementine Weka (Open-source) Tendance : datamining dans la base de données Oracle Darwin Suite SQL Server Analysis Services
Limites du datamining Effort considérable de développement. Etat inapproprié des données.
Perspectives Analyse de plus de données dans un minimum de temps Exploration plus approfondie des données Datamining pour les PMEs. Datamining « domestique »
Conclusion Datamining

More Related Content

What's hot

Datamining appliqué au churn client dans les télécommunications
Datamining appliqué au churn client dans les télécommunicationsDatamining appliqué au churn client dans les télécommunications
Datamining appliqué au churn client dans les télécommunications
abdelmoumène taleb
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
Abderrahmane Filali
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
Jean-Marc Dupont
 

What's hot (20)

Data mining - Classification - arbres de décision
Data mining - Classification - arbres de décisionData mining - Classification - arbres de décision
Data mining - Classification - arbres de décision
 
Bi
BiBi
Bi
 
Datamining appliqué au churn client dans les télécommunications
Datamining appliqué au churn client dans les télécommunicationsDatamining appliqué au churn client dans les télécommunications
Datamining appliqué au churn client dans les télécommunications
 
Règles d’association
Règles d’associationRègles d’association
Règles d’association
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Data mining - Associativité
Data mining - AssociativitéData mining - Associativité
Data mining - Associativité
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Histoire du big data
Histoire du big dataHistoire du big data
Histoire du big data
 
Traitement des données manquantes et aberrantes sous R
Traitement des données manquantes et aberrantes sous RTraitement des données manquantes et aberrantes sous R
Traitement des données manquantes et aberrantes sous R
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Intégration des données avec Talend ETL
Intégration des données avec Talend ETLIntégration des données avec Talend ETL
Intégration des données avec Talend ETL
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentation
 
Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)Data mining - Segmentation(k-means, cah)
Data mining - Segmentation(k-means, cah)
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Pfe
PfePfe
Pfe
 

Viewers also liked (6)

Social Piggybacking: Leveraging Common Friends to Generate Event Streams
Social Piggybacking: Leveraging Common Friends to Generate Event StreamsSocial Piggybacking: Leveraging Common Friends to Generate Event Streams
Social Piggybacking: Leveraging Common Friends to Generate Event Streams
 
Efficient Primary-Backup replication on top of consensus
Efficient Primary-Backup replication on top of consensusEfficient Primary-Backup replication on top of consensus
Efficient Primary-Backup replication on top of consensus
 
Réplication des bases de données
Réplication des bases de donnéesRéplication des bases de données
Réplication des bases de données
 
Réplication de base de données oracle avec Golden Gate
Réplication de base de données oracle avec Golden GateRéplication de base de données oracle avec Golden Gate
Réplication de base de données oracle avec Golden Gate
 
Vertex cover Problem
Vertex cover ProblemVertex cover Problem
Vertex cover Problem
 
Np complete
Np completeNp complete
Np complete
 

Similar to Introduction au datamining, concepts et techniques

Les 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurLes 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeur
Jean-Michel Franco
 
CLICCC 2011 - Dring, Clique Et Briques - Alain Fortier
CLICCC 2011 - Dring, Clique Et Briques - Alain FortierCLICCC 2011 - Dring, Clique Et Briques - Alain Fortier
CLICCC 2011 - Dring, Clique Et Briques - Alain Fortier
Alain Fortier
 
Decizia Décisionnel et Pilotage Courte
Decizia Décisionnel et Pilotage CourteDecizia Décisionnel et Pilotage Courte
Decizia Décisionnel et Pilotage Courte
Decizia
 
Assises du Tourisme 2009 - E. Trudel, Intrawest Tremblant
Assises du Tourisme 2009 - E. Trudel, Intrawest TremblantAssises du Tourisme 2009 - E. Trudel, Intrawest Tremblant
Assises du Tourisme 2009 - E. Trudel, Intrawest Tremblant
fgchevrier
 
Data Science
Data ScienceData Science
Data Science
Soft Computing
 

Similar to Introduction au datamining, concepts et techniques (20)

Conférence Smart Data par Atlays
Conférence Smart Data par AtlaysConférence Smart Data par Atlays
Conférence Smart Data par Atlays
 
Les 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurLes 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeur
 
Seance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entrepriseSeance 1 & 2 deploiement de la bi dans l'entreprise
Seance 1 & 2 deploiement de la bi dans l'entreprise
 
Séminaire RCU
Séminaire RCUSéminaire RCU
Séminaire RCU
 
[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data
 
L'automatisation au service de la cybersécurité
L'automatisation au service de la cybersécuritéL'automatisation au service de la cybersécurité
L'automatisation au service de la cybersécurité
 
M01 avantages strategiques-24- ms
M01 avantages strategiques-24- msM01 avantages strategiques-24- ms
M01 avantages strategiques-24- ms
 
Francois Paulus Semsoft Big Data & analyse
Francois Paulus Semsoft Big Data & analyseFrancois Paulus Semsoft Big Data & analyse
Francois Paulus Semsoft Big Data & analyse
 
CLICCC 2011 - Dring, Clique Et Briques - Alain Fortier
CLICCC 2011 - Dring, Clique Et Briques - Alain FortierCLICCC 2011 - Dring, Clique Et Briques - Alain Fortier
CLICCC 2011 - Dring, Clique Et Briques - Alain Fortier
 
Decizia Décisionnel et Pilotage Courte
Decizia Décisionnel et Pilotage CourteDecizia Décisionnel et Pilotage Courte
Decizia Décisionnel et Pilotage Courte
 
Final
FinalFinal
Final
 
Final
FinalFinal
Final
 
Exploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDMExploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDM
 
Business intelligence 3 eme
Business intelligence 3 eme Business intelligence 3 eme
Business intelligence 3 eme
 
Introduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfIntroduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdf
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
 
Webinaire Business&Decision - Trifacta
Webinaire  Business&Decision - TrifactaWebinaire  Business&Decision - Trifacta
Webinaire Business&Decision - Trifacta
 
Atelier IBM Forum MDM Micropole 2014 - Part 1
Atelier IBM Forum MDM Micropole 2014 - Part 1Atelier IBM Forum MDM Micropole 2014 - Part 1
Atelier IBM Forum MDM Micropole 2014 - Part 1
 
Assises du Tourisme 2009 - E. Trudel, Intrawest Tremblant
Assises du Tourisme 2009 - E. Trudel, Intrawest TremblantAssises du Tourisme 2009 - E. Trudel, Intrawest Tremblant
Assises du Tourisme 2009 - E. Trudel, Intrawest Tremblant
 
Data Science
Data ScienceData Science
Data Science
 

More from Ismail CHAIB

Open bank project api days-presentation-dec2013
Open bank project api days-presentation-dec2013Open bank project api days-presentation-dec2013
Open bank project api days-presentation-dec2013
Ismail CHAIB
 
Make sense pecha kucha
Make sense pecha kuchaMake sense pecha kucha
Make sense pecha kucha
Ismail CHAIB
 
Presentation soutenance-tesobe
Presentation soutenance-tesobePresentation soutenance-tesobe
Presentation soutenance-tesobe
Ismail CHAIB
 

More from Ismail CHAIB (14)

The TAO of Banking APIs - Open Bank Project
The TAO of Banking APIs - Open Bank ProjectThe TAO of Banking APIs - Open Bank Project
The TAO of Banking APIs - Open Bank Project
 
Open bank project api days-presentation-dec2013
Open bank project api days-presentation-dec2013Open bank project api days-presentation-dec2013
Open bank project api days-presentation-dec2013
 
How mobile is changing everything for NGOs
How mobile is changing everything for NGOsHow mobile is changing everything for NGOs
How mobile is changing everything for NGOs
 
Make sense pecha kucha
Make sense pecha kuchaMake sense pecha kucha
Make sense pecha kucha
 
Open Learning Initiative
Open Learning InitiativeOpen Learning Initiative
Open Learning Initiative
 
The Road to Open Data
The Road to Open DataThe Road to Open Data
The Road to Open Data
 
TEDxCasbah Talk
TEDxCasbah TalkTEDxCasbah Talk
TEDxCasbah Talk
 
A tale of social entrepreneurship
A tale of social entrepreneurshipA tale of social entrepreneurship
A tale of social entrepreneurship
 
Sense combinator
Sense combinatorSense combinator
Sense combinator
 
Presentation soutenance-tesobe
Presentation soutenance-tesobePresentation soutenance-tesobe
Presentation soutenance-tesobe
 
Ouverture te dx alger - ismail
Ouverture te dx alger - ismailOuverture te dx alger - ismail
Ouverture te dx alger - ismail
 
ERP, ecueils à éviter
ERP, ecueils à éviterERP, ecueils à éviter
ERP, ecueils à éviter
 
Management de projet web
Management de projet webManagement de projet web
Management de projet web
 
#1 Best Place to Work In
#1 Best Place to Work In#1 Best Place to Work In
#1 Best Place to Work In
 

Introduction au datamining, concepts et techniques