3. 1942
La 1re école
cybernétique
Attribuée à Norbert Wiener
● Science des systèmes
● Multidisciplinaire
○ Biologie
○ Sociologie
○ Mathématiques
○ Etc
● Établit et formalise le
principe de rétroaction
4. Le principe de rétroaction
Connaissances
+
Règles de
transformation
Exemples:
● Robinet et température de l’eau
● “Cruise control” sur une voiture
● Thermostat
● Etc
5. 1950
La 2e école
cybernétique
Attribuée à Marvin Minsky et
Alan Turing
● Représenter la
connaissance
○ Faits
● Modéliser la pensée
○ Règles
● Arrivée des ordinateurs
○ Test de Turing
● Optimisme démesuré
6. 1969
La grande
désillusion
Attribuée à Marvin Minsky
● Modéliser la pensée est
très complexe.
○ Parfois irrationnelle
● La connaissance est
difficile à formaliser
● Nécessite une capacité
de calcul dépassant les
moyens de l’époque
7. L’héritage de la
2e cybernétique
● Automatisation de la
logique de premier
ordre
○ Prolog (1972)
○ Systèmes experts
● Réseaux neuronaux
○ Perceptrons (1957)
8. Les systèmes experts
Faits
Règles
Application des
règles pour déduire
de nouveaux faits
Nouveaux faits
Aucun nouveaux faits
ou
conclusion atteinte
Conclusion(s)
Exemples:
● Systèmes d’analyse chimique (Dendral,1965)
● Systèmes de diagnostics médicaux (VisualDx,2001)
● Systèmes de génération d’horaires (UdeM,?)
9. Les réseaux
neuronaux
● Visent à imiter la nature
○ Neurones et dendrites
○ Apprentissage en
renforçant
progressivement les
liens entre les
neurones (poids)
● Entièrement numérique
● Plusieurs variétés
○ Perceptrons
○ Carte de Kohonen
○ Etc
10. 1990
Un nouvel
espoir
● Apparition d’internet
● Théorie de
Vapnik-Chervonenkis (VC)
○ L’apprentissage est un
processus statistique
○ Nécessite des données
○ Établit les bases de
l’apprentissage
automatique
● Prix des ordinateurs
personnels baisse
11. ~2000
La désillusion
contre-attaque
● Le rendement des
investissements logiciels
s’essoufle
● Explosion de la Bulle des
“dot com”
● Apparition des premières
entreprises “orientées
données”
○ Google (IPO 2004)
○ Facebook (2004)
12. ~2010
Le retour de
l’intelligence
artificielle
● L’infonuagique (“Cloud”)
rend accessibles des
capacités de stockage et
de calcul autrefois
impensables
● Les outils d’apprentissage
automatique permettent
une approche “boîte noire”
relativement accessible
● Émergence de la “science
des données”
14. Un algorithme,
c’est quoi ?
Origine: Al Khwarizmi,
scientifique arabe
● Séquence d’opérations
● Donnant un résultat
● Dans un nombre fini
d’opérations
● Peut être programmé
(ou non)
15. Exemples
● Trier des valeurs
● Rechercher une valeur
● Addition/soustraction
● Google répond à votre
recherche
● Facebook vous
suggère d’aimer
quelque chose
● Publicité ciblée
● Etc
17. Segmentation / Classification
Objectif
Séparer des éléments en groupes
d’éléments similaires.
Applications typiques
● Profils de clients
● Profils de paniers d’achat
Algorithmes populaires
● K-Means (S)
● X-Means (S)
● DBSCAN (S)
● BIRCH (S)
● Espérance-maximisation (C)
● K-NN (C)
● Réseaux bayesiens (C)
● SVM (C)
18. Prédiction
Objectif
Estimer la valeur ou la tendance
d’une mesure donnée
Applications typiques
● Chiffre d’affaires
● Seuil de réapprovisionnement
● Spéculation boursière
Algorithmes populaires
● Moyenne (...)
● Régression linéaire
● Régression logistique
● Mélanges gaussiens
● SVM
19. Prédiction
Application: Prix de l’essence
Client
Entreprise de stations-service 24h
Problématique
À 18h chaque jour une décision
doit être prise à savoir si on doit
commander une livraison
d’essence pour la nuit ou attendre
le nouveau prix le lendemain
matin.
Jeu de données
Système de gestion de pompes
● Niveaux d’essence des réservoirs
● Date
Système de point de vente (POS)
● Ventes d’essence
● Date (Jours de la semaine,
semaine du mois, mois, etc)
20. Prédiction
Application: Prix de l’essence
Analyse classique
● Les ventes et niveaux d’essence sont très périodiques et réguliers. Ils sont
aussi corrélés à certaines lois du marché (Ex: jours de paie).
18h
21. Prédiction
Application: Prix de l’essence
Analyse par machine learning
● On peut déduire le coût de l’essence à partir des ventes sur les POS
● On utilise une SVM avec un noyau RBF pour la prédiction
● Prédire une valeur précise du prix futur ne donne pas le résultat escompté
● Par contre, prédire la direction du prix s’avère beaucoup mieux (~83%)
contrairement à la prédiction par un expert (~71%), un gain de 12%
22. Détection d’anomalies
Objectif
Trouver des éléments qui diffèrent
significativement des autres
Applications typiques
● Détection de la fraude
● Optimisation de processus
(80/20)
Algorithmes populaires
● Loi de Benford
● Algorithmes de classification (2 classes)
23. Détection d’anomalies
Application: Problèmes de transport
Client
Entreprise effectuant des visites
aléatoires aux domiciles de
détenus purgeant leur peine à
domicile.
Problématique
Les profits ont chuté de plus de
20% dans la dernière année.
Jeu de données
Base de données du CRM
● Point de départ (Long./Lat.)
● Point d’arrivée (Long./Lat.)
● Distance à l’odomètre
● ID employé
● ID client
● Durée (Date de fin - Date de début)
● Vitesse moyenne (Distance/Durée)
● Saison
24. Détection d’anomalies
Application: Problèmes de transport
Analyse classique
● La distance totale parcourue est restée sensiblement la même
● Le nombre de visites est resté sensiblement le même
● La durée moyenne a diminué (ce qui devrait diminuer les coûts)
● Certains employés sont beaucoup plus efficaces que d’autres
Analyse par machine learning
● Segmenter les visites avec K-Means donne 2 clusters très distincts
● L’un deux est constitué de visites par des employés “très efficaces”
● Le client décide de surveiller les employés “inefficaces”, sans succès.
25. Détection d’anomalies
Problèmes de transport - Solution
Solution
La surveillance des employés “très efficaces” fournit la réponse
● Certains employés ne font pas leurs visites, passent tout droit en avant de
la résidence (pour mêler la surveillance par GPS qui fournit la route suivie),
et falsifient ainsi leurs feuilles de temps.
● Un simple changement au processus résout le problème: les employés
doivent maintenant prendre une photo du détenu.
PS: Ce problème est commun dans les environnements où la performance
est mesurée par une durée moyenne, comme les centres d’appel
26. Règles d’association
Objectif
Trouver des relations entre des
occurrences d’
événements/éléments
Applications typiques
● Achats connexes
● Découvrir des patterns de
comportement
Algorithmes populaires
● Apriori
● ECLAT
● FP-Growth
● GSP
● SPADE
● FreeSpan
27. Règles d’association
Application: Analyse du panier d’achats
Client
Entreprise possédant des
stations-service avec des
dépanneurs
Problématique
On cherche à maximiser les
ventes en augmentant les ventes
connexes (“Achats impulsifs”)
Jeu de données
Base de données des points de vente
● Factures
● Inventaire
○ Code de produit
○ Catégorie de produit
28. Règles d’association
Application: Analyse du panier d’achats
Analyse classique
● On peut compter les produits qui se vendent le mieux
● On peut dépendre de l’expertise d’un vendeur
● Il existe 2 types de vente: la vente directe où le client sait ce qu’il veut, et la
vente connexe qui est décidée sur le champ. La stratégie classique est de
mettre les produits à vente directe à l’arrière du magasin afin de faire
déambuler le client parmi les possibilités d’achats impulsifs dans le
magasin.
29. Règles d’association
Application: Analyse du panier d’achats
Analyse par machine learning
● Les règles d’association ont la forme “Si {A,B,C...} Alors {X,Y,Z...}”
● La plupart des outils fournissent aussi des métriques de support et confiance pour
chaque règle
● On peut extraire plusieurs formes de régles
○ Produits connexes afin d’optimiser les promotions
■ Ex: Si un client achète un muffin, il achète aussi un petit café
○ Catégories connexes afin d’optimiser les présentoirs
■ Ex: Si un client achète de l’essence, il achète aussi de la nourriture
● Dans un contexte de vente en ligne, on peut se servir de ces données pour proposer
des achats connexes au client
34. Sources de données des PMEs
● Comptabilité
● Boutique en ligne
● Réseaux sociaux
● CRM
● Instrumentation
● Bases de données
● Open data
● Web scraping
● Compétiteurs
38. Système de
gestion de la
relation avec la
clientèle (CRM)
Ventes
● Tunnel d’achats
● Patterns de réussite
Comptes clients (suite)
● Profils (segmentation)
Support après vente
● Détection d’anomalies