SlideShare a Scribd company logo
1 of 40
Download to read offline
Intelligence artificielle
et
Big Data pour PMEs
Développez un avantage concurrentiel grâce à vos données
L’intelligence artificielle
De hier à aujourd’hui
1942
La 1re école
cybernétique
Attribuée à Norbert Wiener
● Science des systèmes
● Multidisciplinaire
○ Biologie
○ Sociologie
○ Mathématiques
○ Etc
● Établit et formalise le
principe de rétroaction
Le principe de rétroaction
Connaissances
+
Règles de
transformation
Exemples:
● Robinet et température de l’eau
● “Cruise control” sur une voiture
● Thermostat
● Etc
1950
La 2e école
cybernétique
Attribuée à Marvin Minsky et
Alan Turing
● Représenter la
connaissance
○ Faits
● Modéliser la pensée
○ Règles
● Arrivée des ordinateurs
○ Test de Turing
● Optimisme démesuré
1969
La grande
désillusion
Attribuée à Marvin Minsky
● Modéliser la pensée est
très complexe.
○ Parfois irrationnelle
● La connaissance est
difficile à formaliser
● Nécessite une capacité
de calcul dépassant les
moyens de l’époque
L’héritage de la
2e cybernétique
● Automatisation de la
logique de premier
ordre
○ Prolog (1972)
○ Systèmes experts
● Réseaux neuronaux
○ Perceptrons (1957)
Les systèmes experts
Faits
Règles
Application des
règles pour déduire
de nouveaux faits
Nouveaux faits
Aucun nouveaux faits
ou
conclusion atteinte
Conclusion(s)
Exemples:
● Systèmes d’analyse chimique (Dendral,1965)
● Systèmes de diagnostics médicaux (VisualDx,2001)
● Systèmes de génération d’horaires (UdeM,?)
Les réseaux
neuronaux
● Visent à imiter la nature
○ Neurones et dendrites
○ Apprentissage en
renforçant
progressivement les
liens entre les
neurones (poids)
● Entièrement numérique
● Plusieurs variétés
○ Perceptrons
○ Carte de Kohonen
○ Etc
1990
Un nouvel
espoir
● Apparition d’internet
● Théorie de
Vapnik-Chervonenkis (VC)
○ L’apprentissage est un
processus statistique
○ Nécessite des données
○ Établit les bases de
l’apprentissage
automatique
● Prix des ordinateurs
personnels baisse
~2000
La désillusion
contre-attaque
● Le rendement des
investissements logiciels
s’essoufle
● Explosion de la Bulle des
“dot com”
● Apparition des premières
entreprises “orientées
données”
○ Google (IPO 2004)
○ Facebook (2004)
~2010
Le retour de
l’intelligence
artificielle
● L’infonuagique (“Cloud”)
rend accessibles des
capacités de stockage et
de calcul autrefois
impensables
● Les outils d’apprentissage
automatique permettent
une approche “boîte noire”
relativement accessible
● Émergence de la “science
des données”
Algorithmes pour PMEs
Créez de la valeur ajoutée avec vos données
Un algorithme,
c’est quoi ?
Origine: Al Khwarizmi,
scientifique arabe
● Séquence d’opérations
● Donnant un résultat
● Dans un nombre fini
d’opérations
● Peut être programmé
(ou non)
Exemples
● Trier des valeurs
● Rechercher une valeur
● Addition/soustraction
● Google répond à votre
recherche
● Facebook vous
suggère d’aimer
quelque chose
● Publicité ciblée
● Etc
Quelques
algorithmes
utiles pour les
PMEs
● Segmentation/Classification
● Prédiction
● Détection d’anomalies
● Règles d’association
● Méthodes d’ensemble
Segmentation / Classification
Objectif
Séparer des éléments en groupes
d’éléments similaires.
Applications typiques
● Profils de clients
● Profils de paniers d’achat
Algorithmes populaires
● K-Means (S)
● X-Means (S)
● DBSCAN (S)
● BIRCH (S)
● Espérance-maximisation (C)
● K-NN (C)
● Réseaux bayesiens (C)
● SVM (C)
Prédiction
Objectif
Estimer la valeur ou la tendance
d’une mesure donnée
Applications typiques
● Chiffre d’affaires
● Seuil de réapprovisionnement
● Spéculation boursière
Algorithmes populaires
● Moyenne (...)
● Régression linéaire
● Régression logistique
● Mélanges gaussiens
● SVM
Prédiction
Application: Prix de l’essence
Client
Entreprise de stations-service 24h
Problématique
À 18h chaque jour une décision
doit être prise à savoir si on doit
commander une livraison
d’essence pour la nuit ou attendre
le nouveau prix le lendemain
matin.
Jeu de données
Système de gestion de pompes
● Niveaux d’essence des réservoirs
● Date
Système de point de vente (POS)
● Ventes d’essence
● Date (Jours de la semaine,
semaine du mois, mois, etc)
Prédiction
Application: Prix de l’essence
Analyse classique
● Les ventes et niveaux d’essence sont très périodiques et réguliers. Ils sont
aussi corrélés à certaines lois du marché (Ex: jours de paie).
18h
Prédiction
Application: Prix de l’essence
Analyse par machine learning
● On peut déduire le coût de l’essence à partir des ventes sur les POS
● On utilise une SVM avec un noyau RBF pour la prédiction
● Prédire une valeur précise du prix futur ne donne pas le résultat escompté
● Par contre, prédire la direction du prix s’avère beaucoup mieux (~83%)
contrairement à la prédiction par un expert (~71%), un gain de 12%
Détection d’anomalies
Objectif
Trouver des éléments qui diffèrent
significativement des autres
Applications typiques
● Détection de la fraude
● Optimisation de processus
(80/20)
Algorithmes populaires
● Loi de Benford
● Algorithmes de classification (2 classes)
Détection d’anomalies
Application: Problèmes de transport
Client
Entreprise effectuant des visites
aléatoires aux domiciles de
détenus purgeant leur peine à
domicile.
Problématique
Les profits ont chuté de plus de
20% dans la dernière année.
Jeu de données
Base de données du CRM
● Point de départ (Long./Lat.)
● Point d’arrivée (Long./Lat.)
● Distance à l’odomètre
● ID employé
● ID client
● Durée (Date de fin - Date de début)
● Vitesse moyenne (Distance/Durée)
● Saison
Détection d’anomalies
Application: Problèmes de transport
Analyse classique
● La distance totale parcourue est restée sensiblement la même
● Le nombre de visites est resté sensiblement le même
● La durée moyenne a diminué (ce qui devrait diminuer les coûts)
● Certains employés sont beaucoup plus efficaces que d’autres
Analyse par machine learning
● Segmenter les visites avec K-Means donne 2 clusters très distincts
● L’un deux est constitué de visites par des employés “très efficaces”
● Le client décide de surveiller les employés “inefficaces”, sans succès.
Détection d’anomalies
Problèmes de transport - Solution
Solution
La surveillance des employés “très efficaces” fournit la réponse
● Certains employés ne font pas leurs visites, passent tout droit en avant de
la résidence (pour mêler la surveillance par GPS qui fournit la route suivie),
et falsifient ainsi leurs feuilles de temps.
● Un simple changement au processus résout le problème: les employés
doivent maintenant prendre une photo du détenu.
PS: Ce problème est commun dans les environnements où la performance
est mesurée par une durée moyenne, comme les centres d’appel
Règles d’association
Objectif
Trouver des relations entre des
occurrences d’
événements/éléments
Applications typiques
● Achats connexes
● Découvrir des patterns de
comportement
Algorithmes populaires
● Apriori
● ECLAT
● FP-Growth
● GSP
● SPADE
● FreeSpan
Règles d’association
Application: Analyse du panier d’achats
Client
Entreprise possédant des
stations-service avec des
dépanneurs
Problématique
On cherche à maximiser les
ventes en augmentant les ventes
connexes (“Achats impulsifs”)
Jeu de données
Base de données des points de vente
● Factures
● Inventaire
○ Code de produit
○ Catégorie de produit
Règles d’association
Application: Analyse du panier d’achats
Analyse classique
● On peut compter les produits qui se vendent le mieux
● On peut dépendre de l’expertise d’un vendeur
● Il existe 2 types de vente: la vente directe où le client sait ce qu’il veut, et la
vente connexe qui est décidée sur le champ. La stratégie classique est de
mettre les produits à vente directe à l’arrière du magasin afin de faire
déambuler le client parmi les possibilités d’achats impulsifs dans le
magasin.
Règles d’association
Application: Analyse du panier d’achats
Analyse par machine learning
● Les règles d’association ont la forme “Si {A,B,C...} Alors {X,Y,Z...}”
● La plupart des outils fournissent aussi des métriques de support et confiance pour
chaque règle
● On peut extraire plusieurs formes de régles
○ Produits connexes afin d’optimiser les promotions
■ Ex: Si un client achète un muffin, il achète aussi un petit café
○ Catégories connexes afin d’optimiser les présentoirs
■ Ex: Si un client achète de l’essence, il achète aussi de la nourriture
● Dans un contexte de vente en ligne, on peut se servir de ces données pour proposer
des achats connexes au client
Quelques outils
Pour des heures de plaisir...
Logiciels libres
● R
● Orange
● TensorFlow
● WEKA
● NLTK
● Etc
Logiciels
commerciaux
● SAS
● SPSS
● MATLAB
● Statistica
● Etc
Big Data pour PMEs
Où trouver des données
Sources de données des PMEs
● Comptabilité
● Boutique en ligne
● Réseaux sociaux
● CRM
● Instrumentation
● Bases de données
● Open data
● Web scraping
● Compétiteurs
Comptabilité
Factures
● Tendances
● Combinaisons d’achats
● Séquences d’achats
● Prédictions
○ Ventes futures
○ Inventaire requis
Comptes client
● Profils de clients
● Segmentation
Boutique en
ligne
Factures (suite)
● Paniers d’achats
Comptes clients (suite)
● Traces numériques
Catalogue de produits
● CTR
● Taux de conversion
Réseaux
sociaux
Applications Facebook
(Clients)
● Profils détaillés
● Patterns d’intérêts
● Facteurs favorisant
l’engagement
Système de
gestion de la
relation avec la
clientèle (CRM)
Ventes
● Tunnel d’achats
● Patterns de réussite
Comptes clients (suite)
● Profils (segmentation)
Support après vente
● Détection d’anomalies
Instrumentation
Objets connectés
● Compteurs
● Caméras
● Horodateurs (“Punch”)
● Lecteurs de
codes-barres
● Station météo
Merci!

More Related Content

Similar to Guillaume Morissette - Big Data PME

seenaptic x atecna Faites confiance à vos données digitales
seenaptic x atecna Faites confiance à vos données digitalesseenaptic x atecna Faites confiance à vos données digitales
seenaptic x atecna Faites confiance à vos données digitalesJulie DULOT
 
Intro au Big Data & Machine Learning
Intro au Big Data & Machine LearningIntro au Big Data & Machine Learning
Intro au Big Data & Machine LearningEric Daoud
 
Atelier du web - Analyser sa présence sur le web
Atelier du web - Analyser sa présence sur le webAtelier du web - Analyser sa présence sur le web
Atelier du web - Analyser sa présence sur le webAtlantic 2.0
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...AQT-presentations
 
Big bang erp linked quebec - logiciels de gestion infonuagiques démystifiés
Big bang erp   linked quebec - logiciels de gestion infonuagiques démystifiésBig bang erp   linked quebec - logiciels de gestion infonuagiques démystifiés
Big bang erp linked quebec - logiciels de gestion infonuagiques démystifiésSimon Hénault
 
Offrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicOffrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicJean-Michel Franco
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiJedha Bootcamp
 
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...Clic et Site
 
Comment optimiser la performance de son réseau (points de vente, agences, dis...
Comment optimiser la performance de son réseau (points de vente, agences, dis...Comment optimiser la performance de son réseau (points de vente, agences, dis...
Comment optimiser la performance de son réseau (points de vente, agences, dis...Galigeo
 
45 minutes pour comprendre Google Tag Manager… et aller plus loin ! - Ronan C...
45 minutes pour comprendre Google Tag Manager… et aller plus loin ! - Ronan C...45 minutes pour comprendre Google Tag Manager… et aller plus loin ! - Ronan C...
45 minutes pour comprendre Google Tag Manager… et aller plus loin ! - Ronan C...WebCampDay
 
e-marketing / webmarketing
e-marketing / webmarketinge-marketing / webmarketing
e-marketing / webmarketingNetinUp Berry
 
Arnaques, crimes et analytics - Aristide Riou - Measure Camp Paris 2016
Arnaques, crimes et analytics - Aristide Riou - Measure Camp Paris 2016Arnaques, crimes et analytics - Aristide Riou - Measure Camp Paris 2016
Arnaques, crimes et analytics - Aristide Riou - Measure Camp Paris 2016Prénom Nom de famille
 
Webschool E-commerce - Comment booster vos ventes ?
Webschool E-commerce - Comment booster vos ventes ?Webschool E-commerce - Comment booster vos ventes ?
Webschool E-commerce - Comment booster vos ventes ?mariejura
 
Comarch smart analytics
Comarch smart analytics Comarch smart analytics
Comarch smart analytics Comarch France
 
Competitic big data et commerce
Competitic   big data et commerceCompetitic   big data et commerce
Competitic big data et commerceCOMPETITIC
 
Formation stratégie numérique
Formation stratégie numériqueFormation stratégie numérique
Formation stratégie numériqueDanielle Tardif
 
Salon du numérique de vaucluse 2016 conférence e-commerce
Salon du numérique de vaucluse 2016   conférence e-commerceSalon du numérique de vaucluse 2016   conférence e-commerce
Salon du numérique de vaucluse 2016 conférence e-commerceVaisonet
 
Moteur de Recommandation
Moteur de RecommandationMoteur de Recommandation
Moteur de RecommandationSoft Computing
 

Similar to Guillaume Morissette - Big Data PME (20)

seenaptic x atecna Faites confiance à vos données digitales
seenaptic x atecna Faites confiance à vos données digitalesseenaptic x atecna Faites confiance à vos données digitales
seenaptic x atecna Faites confiance à vos données digitales
 
Intro au Big Data & Machine Learning
Intro au Big Data & Machine LearningIntro au Big Data & Machine Learning
Intro au Big Data & Machine Learning
 
Atelier du web - Analyser sa présence sur le web
Atelier du web - Analyser sa présence sur le webAtelier du web - Analyser sa présence sur le web
Atelier du web - Analyser sa présence sur le web
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
 
Big bang erp linked quebec - logiciels de gestion infonuagiques démystifiés
Big bang erp   linked quebec - logiciels de gestion infonuagiques démystifiésBig bang erp   linked quebec - logiciels de gestion infonuagiques démystifiés
Big bang erp linked quebec - logiciels de gestion infonuagiques démystifiés
 
Offrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicOffrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clic
 
Connaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessiConnaître son audience grâce à la Data - Parisa MAjlessi
Connaître son audience grâce à la Data - Parisa MAjlessi
 
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
 
Comment optimiser la performance de son réseau (points de vente, agences, dis...
Comment optimiser la performance de son réseau (points de vente, agences, dis...Comment optimiser la performance de son réseau (points de vente, agences, dis...
Comment optimiser la performance de son réseau (points de vente, agences, dis...
 
45 minutes pour comprendre Google Tag Manager… et aller plus loin ! - Ronan C...
45 minutes pour comprendre Google Tag Manager… et aller plus loin ! - Ronan C...45 minutes pour comprendre Google Tag Manager… et aller plus loin ! - Ronan C...
45 minutes pour comprendre Google Tag Manager… et aller plus loin ! - Ronan C...
 
e-marketing / webmarketing
e-marketing / webmarketinge-marketing / webmarketing
e-marketing / webmarketing
 
Arnaques, crimes et analytics - Aristide Riou - Measure Camp Paris 2016
Arnaques, crimes et analytics - Aristide Riou - Measure Camp Paris 2016Arnaques, crimes et analytics - Aristide Riou - Measure Camp Paris 2016
Arnaques, crimes et analytics - Aristide Riou - Measure Camp Paris 2016
 
Webschool E-commerce - Comment booster vos ventes ?
Webschool E-commerce - Comment booster vos ventes ?Webschool E-commerce - Comment booster vos ventes ?
Webschool E-commerce - Comment booster vos ventes ?
 
Comarch smart analytics
Comarch smart analytics Comarch smart analytics
Comarch smart analytics
 
Competitic big data et commerce
Competitic   big data et commerceCompetitic   big data et commerce
Competitic big data et commerce
 
Formation stratégie numérique
Formation stratégie numériqueFormation stratégie numérique
Formation stratégie numérique
 
Importance ERP CRM
Importance ERP CRMImportance ERP CRM
Importance ERP CRM
 
Salon du numérique de vaucluse 2016 conférence e-commerce
Salon du numérique de vaucluse 2016   conférence e-commerceSalon du numérique de vaucluse 2016   conférence e-commerce
Salon du numérique de vaucluse 2016 conférence e-commerce
 
Debuteraveclesmls
DebuteraveclesmlsDebuteraveclesmls
Debuteraveclesmls
 
Moteur de Recommandation
Moteur de RecommandationMoteur de Recommandation
Moteur de Recommandation
 

More from Web à Québec

Guillaume Labbé-Morissette
Guillaume Labbé-MorissetteGuillaume Labbé-Morissette
Guillaume Labbé-MorissetteWeb à Québec
 
Frédérick Capovilla
Frédérick CapovillaFrédérick Capovilla
Frédérick CapovillaWeb à Québec
 
Cynthia Thibault-Larouche
Cynthia Thibault-LaroucheCynthia Thibault-Larouche
Cynthia Thibault-LaroucheWeb à Québec
 
Intelligence artificielle, Données massives et Internet des objets: Quels son...
Intelligence artificielle, Données massives et Internet des objets: Quels son...Intelligence artificielle, Données massives et Internet des objets: Quels son...
Intelligence artificielle, Données massives et Internet des objets: Quels son...Web à Québec
 
So you want to be a service designer - Jamin Hegeman
So you want to be a service designer - Jamin HegemanSo you want to be a service designer - Jamin Hegeman
So you want to be a service designer - Jamin HegemanWeb à Québec
 
AI & the future of the political party - Colin Megill
AI & the future of the political party - Colin MegillAI & the future of the political party - Colin Megill
AI & the future of the political party - Colin MegillWeb à Québec
 
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay Web à Québec
 
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...Web à Québec
 
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...Web à Québec
 
Complexité et systèmes opérables - Fred Hébert
Complexité et systèmes opérables - Fred HébertComplexité et systèmes opérables - Fred Hébert
Complexité et systèmes opérables - Fred HébertWeb à Québec
 

More from Web à Québec (20)

Kevin Bélanger
Kevin BélangerKevin Bélanger
Kevin Bélanger
 
Gabriel LeBreton
Gabriel LeBretonGabriel LeBreton
Gabriel LeBreton
 
Rémi Prévost
Rémi PrévostRémi Prévost
Rémi Prévost
 
Ludivine Durand
Ludivine DurandLudivine Durand
Ludivine Durand
 
Julie Simard
Julie SimardJulie Simard
Julie Simard
 
Guillaume Labbé-Morissette
Guillaume Labbé-MorissetteGuillaume Labbé-Morissette
Guillaume Labbé-Morissette
 
Katherine Mailloux
Katherine MaillouxKatherine Mailloux
Katherine Mailloux
 
Denis Martel
Denis MartelDenis Martel
Denis Martel
 
Charles Davignon
Charles DavignonCharles Davignon
Charles Davignon
 
Frédérick Capovilla
Frédérick CapovillaFrédérick Capovilla
Frédérick Capovilla
 
Cynthia Thibault-Larouche
Cynthia Thibault-LaroucheCynthia Thibault-Larouche
Cynthia Thibault-Larouche
 
Louis-André Labadie
Louis-André LabadieLouis-André Labadie
Louis-André Labadie
 
Christophe Clouzeau
Christophe ClouzeauChristophe Clouzeau
Christophe Clouzeau
 
Intelligence artificielle, Données massives et Internet des objets: Quels son...
Intelligence artificielle, Données massives et Internet des objets: Quels son...Intelligence artificielle, Données massives et Internet des objets: Quels son...
Intelligence artificielle, Données massives et Internet des objets: Quels son...
 
So you want to be a service designer - Jamin Hegeman
So you want to be a service designer - Jamin HegemanSo you want to be a service designer - Jamin Hegeman
So you want to be a service designer - Jamin Hegeman
 
AI & the future of the political party - Colin Megill
AI & the future of the political party - Colin MegillAI & the future of the political party - Colin Megill
AI & the future of the political party - Colin Megill
 
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
comment le Canada peut Gagner dans le secteur du numérique - Alex Benay
 
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
Rendre son équipe performante : plus simple qu'on le pense - Louis-Philippe C...
 
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
Turning Research Ripples Into Waves: Growing UX Research Capacity Through Col...
 
Complexité et systèmes opérables - Fred Hébert
Complexité et systèmes opérables - Fred HébertComplexité et systèmes opérables - Fred Hébert
Complexité et systèmes opérables - Fred Hébert
 

Guillaume Morissette - Big Data PME

  • 1. Intelligence artificielle et Big Data pour PMEs Développez un avantage concurrentiel grâce à vos données
  • 3. 1942 La 1re école cybernétique Attribuée à Norbert Wiener ● Science des systèmes ● Multidisciplinaire ○ Biologie ○ Sociologie ○ Mathématiques ○ Etc ● Établit et formalise le principe de rétroaction
  • 4. Le principe de rétroaction Connaissances + Règles de transformation Exemples: ● Robinet et température de l’eau ● “Cruise control” sur une voiture ● Thermostat ● Etc
  • 5. 1950 La 2e école cybernétique Attribuée à Marvin Minsky et Alan Turing ● Représenter la connaissance ○ Faits ● Modéliser la pensée ○ Règles ● Arrivée des ordinateurs ○ Test de Turing ● Optimisme démesuré
  • 6. 1969 La grande désillusion Attribuée à Marvin Minsky ● Modéliser la pensée est très complexe. ○ Parfois irrationnelle ● La connaissance est difficile à formaliser ● Nécessite une capacité de calcul dépassant les moyens de l’époque
  • 7. L’héritage de la 2e cybernétique ● Automatisation de la logique de premier ordre ○ Prolog (1972) ○ Systèmes experts ● Réseaux neuronaux ○ Perceptrons (1957)
  • 8. Les systèmes experts Faits Règles Application des règles pour déduire de nouveaux faits Nouveaux faits Aucun nouveaux faits ou conclusion atteinte Conclusion(s) Exemples: ● Systèmes d’analyse chimique (Dendral,1965) ● Systèmes de diagnostics médicaux (VisualDx,2001) ● Systèmes de génération d’horaires (UdeM,?)
  • 9. Les réseaux neuronaux ● Visent à imiter la nature ○ Neurones et dendrites ○ Apprentissage en renforçant progressivement les liens entre les neurones (poids) ● Entièrement numérique ● Plusieurs variétés ○ Perceptrons ○ Carte de Kohonen ○ Etc
  • 10. 1990 Un nouvel espoir ● Apparition d’internet ● Théorie de Vapnik-Chervonenkis (VC) ○ L’apprentissage est un processus statistique ○ Nécessite des données ○ Établit les bases de l’apprentissage automatique ● Prix des ordinateurs personnels baisse
  • 11. ~2000 La désillusion contre-attaque ● Le rendement des investissements logiciels s’essoufle ● Explosion de la Bulle des “dot com” ● Apparition des premières entreprises “orientées données” ○ Google (IPO 2004) ○ Facebook (2004)
  • 12. ~2010 Le retour de l’intelligence artificielle ● L’infonuagique (“Cloud”) rend accessibles des capacités de stockage et de calcul autrefois impensables ● Les outils d’apprentissage automatique permettent une approche “boîte noire” relativement accessible ● Émergence de la “science des données”
  • 13. Algorithmes pour PMEs Créez de la valeur ajoutée avec vos données
  • 14. Un algorithme, c’est quoi ? Origine: Al Khwarizmi, scientifique arabe ● Séquence d’opérations ● Donnant un résultat ● Dans un nombre fini d’opérations ● Peut être programmé (ou non)
  • 15. Exemples ● Trier des valeurs ● Rechercher une valeur ● Addition/soustraction ● Google répond à votre recherche ● Facebook vous suggère d’aimer quelque chose ● Publicité ciblée ● Etc
  • 16. Quelques algorithmes utiles pour les PMEs ● Segmentation/Classification ● Prédiction ● Détection d’anomalies ● Règles d’association ● Méthodes d’ensemble
  • 17. Segmentation / Classification Objectif Séparer des éléments en groupes d’éléments similaires. Applications typiques ● Profils de clients ● Profils de paniers d’achat Algorithmes populaires ● K-Means (S) ● X-Means (S) ● DBSCAN (S) ● BIRCH (S) ● Espérance-maximisation (C) ● K-NN (C) ● Réseaux bayesiens (C) ● SVM (C)
  • 18. Prédiction Objectif Estimer la valeur ou la tendance d’une mesure donnée Applications typiques ● Chiffre d’affaires ● Seuil de réapprovisionnement ● Spéculation boursière Algorithmes populaires ● Moyenne (...) ● Régression linéaire ● Régression logistique ● Mélanges gaussiens ● SVM
  • 19. Prédiction Application: Prix de l’essence Client Entreprise de stations-service 24h Problématique À 18h chaque jour une décision doit être prise à savoir si on doit commander une livraison d’essence pour la nuit ou attendre le nouveau prix le lendemain matin. Jeu de données Système de gestion de pompes ● Niveaux d’essence des réservoirs ● Date Système de point de vente (POS) ● Ventes d’essence ● Date (Jours de la semaine, semaine du mois, mois, etc)
  • 20. Prédiction Application: Prix de l’essence Analyse classique ● Les ventes et niveaux d’essence sont très périodiques et réguliers. Ils sont aussi corrélés à certaines lois du marché (Ex: jours de paie). 18h
  • 21. Prédiction Application: Prix de l’essence Analyse par machine learning ● On peut déduire le coût de l’essence à partir des ventes sur les POS ● On utilise une SVM avec un noyau RBF pour la prédiction ● Prédire une valeur précise du prix futur ne donne pas le résultat escompté ● Par contre, prédire la direction du prix s’avère beaucoup mieux (~83%) contrairement à la prédiction par un expert (~71%), un gain de 12%
  • 22. Détection d’anomalies Objectif Trouver des éléments qui diffèrent significativement des autres Applications typiques ● Détection de la fraude ● Optimisation de processus (80/20) Algorithmes populaires ● Loi de Benford ● Algorithmes de classification (2 classes)
  • 23. Détection d’anomalies Application: Problèmes de transport Client Entreprise effectuant des visites aléatoires aux domiciles de détenus purgeant leur peine à domicile. Problématique Les profits ont chuté de plus de 20% dans la dernière année. Jeu de données Base de données du CRM ● Point de départ (Long./Lat.) ● Point d’arrivée (Long./Lat.) ● Distance à l’odomètre ● ID employé ● ID client ● Durée (Date de fin - Date de début) ● Vitesse moyenne (Distance/Durée) ● Saison
  • 24. Détection d’anomalies Application: Problèmes de transport Analyse classique ● La distance totale parcourue est restée sensiblement la même ● Le nombre de visites est resté sensiblement le même ● La durée moyenne a diminué (ce qui devrait diminuer les coûts) ● Certains employés sont beaucoup plus efficaces que d’autres Analyse par machine learning ● Segmenter les visites avec K-Means donne 2 clusters très distincts ● L’un deux est constitué de visites par des employés “très efficaces” ● Le client décide de surveiller les employés “inefficaces”, sans succès.
  • 25. Détection d’anomalies Problèmes de transport - Solution Solution La surveillance des employés “très efficaces” fournit la réponse ● Certains employés ne font pas leurs visites, passent tout droit en avant de la résidence (pour mêler la surveillance par GPS qui fournit la route suivie), et falsifient ainsi leurs feuilles de temps. ● Un simple changement au processus résout le problème: les employés doivent maintenant prendre une photo du détenu. PS: Ce problème est commun dans les environnements où la performance est mesurée par une durée moyenne, comme les centres d’appel
  • 26. Règles d’association Objectif Trouver des relations entre des occurrences d’ événements/éléments Applications typiques ● Achats connexes ● Découvrir des patterns de comportement Algorithmes populaires ● Apriori ● ECLAT ● FP-Growth ● GSP ● SPADE ● FreeSpan
  • 27. Règles d’association Application: Analyse du panier d’achats Client Entreprise possédant des stations-service avec des dépanneurs Problématique On cherche à maximiser les ventes en augmentant les ventes connexes (“Achats impulsifs”) Jeu de données Base de données des points de vente ● Factures ● Inventaire ○ Code de produit ○ Catégorie de produit
  • 28. Règles d’association Application: Analyse du panier d’achats Analyse classique ● On peut compter les produits qui se vendent le mieux ● On peut dépendre de l’expertise d’un vendeur ● Il existe 2 types de vente: la vente directe où le client sait ce qu’il veut, et la vente connexe qui est décidée sur le champ. La stratégie classique est de mettre les produits à vente directe à l’arrière du magasin afin de faire déambuler le client parmi les possibilités d’achats impulsifs dans le magasin.
  • 29. Règles d’association Application: Analyse du panier d’achats Analyse par machine learning ● Les règles d’association ont la forme “Si {A,B,C...} Alors {X,Y,Z...}” ● La plupart des outils fournissent aussi des métriques de support et confiance pour chaque règle ● On peut extraire plusieurs formes de régles ○ Produits connexes afin d’optimiser les promotions ■ Ex: Si un client achète un muffin, il achète aussi un petit café ○ Catégories connexes afin d’optimiser les présentoirs ■ Ex: Si un client achète de l’essence, il achète aussi de la nourriture ● Dans un contexte de vente en ligne, on peut se servir de ces données pour proposer des achats connexes au client
  • 30. Quelques outils Pour des heures de plaisir...
  • 31. Logiciels libres ● R ● Orange ● TensorFlow ● WEKA ● NLTK ● Etc
  • 32. Logiciels commerciaux ● SAS ● SPSS ● MATLAB ● Statistica ● Etc
  • 33. Big Data pour PMEs Où trouver des données
  • 34. Sources de données des PMEs ● Comptabilité ● Boutique en ligne ● Réseaux sociaux ● CRM ● Instrumentation ● Bases de données ● Open data ● Web scraping ● Compétiteurs
  • 35. Comptabilité Factures ● Tendances ● Combinaisons d’achats ● Séquences d’achats ● Prédictions ○ Ventes futures ○ Inventaire requis Comptes client ● Profils de clients ● Segmentation
  • 36. Boutique en ligne Factures (suite) ● Paniers d’achats Comptes clients (suite) ● Traces numériques Catalogue de produits ● CTR ● Taux de conversion
  • 37. Réseaux sociaux Applications Facebook (Clients) ● Profils détaillés ● Patterns d’intérêts ● Facteurs favorisant l’engagement
  • 38. Système de gestion de la relation avec la clientèle (CRM) Ventes ● Tunnel d’achats ● Patterns de réussite Comptes clients (suite) ● Profils (segmentation) Support après vente ● Détection d’anomalies
  • 39. Instrumentation Objets connectés ● Compteurs ● Caméras ● Horodateurs (“Punch”) ● Lecteurs de codes-barres ● Station météo