SlideShare a Scribd company logo
© Analytics@Work 2014 | Statistics 
Segmenteren en profileren met beslissingsbomen 
11 November 2014 
Jan Schuurman
© Analytics@Work 2014 | Statistics 
Introductie: Analytics@Work 
•Analytics@Work is business partner voor IBM SPSS en verzorgt workshops en consultancy in de hele product range van SPSS analyse technologie. 
•Freelance inhuur Jan Schuurman: 
–Gecertificeerd expert in het gebruik van de IBM SPSS Statistics & Modeler (datamining, textmining) 
–Analyse oplossingen in Retail, Marketing Intelligence en Fraude 
•Projectbasis 
–Analytics@Work is netwerkorganisatie van specialisten in Market & Customer Intelligence
Trainingen en workshops op eigen data 
Trainingen 
•Introduction to IBM SPSS Modeler and Data Mining 
•Predictive Modeling with IBM SPSS Modeler 
•Clustering and Association Models with IBM SPSS Modeler 
•Advanced Data Preparation Using IBM SPSS Modeler 
•Introduction to IBM SPSS Text Analytics for IBM SPSS Modeler 
•Introduction to IBM SPSS Statistics 
•Introduction to Statistical Analysis Using IBM SPSS Statistics 
•Advanced Statistical Analysis Using IBM SPSS Statistics 
•Data Management and Manipulation with IBM SPSS Statistics 
Workshops 
•SPSS Advanced Statistics op eigen data 
•Introductie in datamining op eigen data 
•Advanced datamining op eigen data 
•Segmentatie & market basket technieken op eigen data 
•Introductie in textmining op eigen data 
3
© Analytics@Work 2014 | Statistics 
Agenda 
•Segmentatie, gezien vanuit het perspectief van de organisatie 
•Welke soorten segmentaties zijn er? 
•Uitleg en demonstratie van operationele segmentaties met Decision Trees 
•Andere segmentatie toepassingen 
•Vragen 
4
© Analytics@Work 2014 | Statistics 
5 
Segmentatie, bijvoorbeeld gezien vanuit het marketing perspectief van een organisatie 
•Het gaat om het optimaal afstemmen van middelen voor groepen vergelijkbare klanten 
•Segmentatie: Het opsplitsen van (potentiele) klanten in een bepaalde markt in verschillende groepen (segmenten), waarbinnen de klanten dezelfde of vergelijkbare eisen hebben die ingewilligd worden door een onderscheidende marketing mix. 
•Bijvoorbeeld de marketing mix; de beschikbare middelen van een organisatie om de match te verbeteren tussen de voordelen die klanten zoeken en de voordelen die de organisatie aanbiedt.
© Analytics@Work 2014 | Statistics 
6 
Segmenteren doe je dus … 
1.Voor het kiezen van de doelgroep 
2.Om een propositie te ontwikkelen die je onderscheidend maakt van de concurrent 
3.Om goed aangesloten te blijven met de propositie aan de behoefte van de doelgroep 
•Dit voorbeeld is gezien vanuit het marketing perspectief 
•Bij fraude gaat het bijvoorbeeld over 
–het kiezen van risico groepen 
–Ontwikkelen van bestrijdingsconcepten 
–goed aangesloten blijven op veranderend fraudegedrag
© Analytics@Work 2014 | Statistics 
7 
Welke soorten segmentaties zijn er? 
•Er zijn grofweg twee soorten segmentaties: 
•Strategische segmentaties zijn gericht op een fundamenteel andere behoefte. Marktsegmentaties. 
•Operationele segmentaties zijn gericht op een organisatie doel. Bijvoorbeeld omzet verhoging, verhoging winstgevendheid etcetera. Vaak ook gericht op het verbeteren van de efficiency. Klantsegmentaties. 
–Hier wordt vaak predictive modelling toegepast om segmenten beter te kunnen targetten 
–Bijvoorbeeld voor het beter benutten van de inkomende en uitgaande klantcontacten
© Analytics@Work 2014 | Statistics 
Segmentatie technieken in de praktijk 
•In beschrijvende segmentaties wordt vaak gebruik gemaakt van clustering technieken 
–Er worden homogene groepen gevonden, waarbinnen mensen sterk op elkaar lijken en sterk verschillen van mensen in andere groepen 
–In de praktijk zijn deze groepen weinig onderscheidend op een of meerdere externe doelvariabelen 
•In voorspellende segmentaties wordt vaak gebruik gemaakt van decision tree technieken 
–De doelvariabele is leidend om segmenten te vormen. 
–De segmenten zijn specifieke aftakkingen of groepen van geneste aftakkingen 
–Ook op deze manier worden homogene groepen gevonden, waarbinnen mensen sterk op elkaar lijken en sterk verschillen van mensen in andere groepen. Echter ze verschillen het meeste op de doelvariabele. 
8
© Analytics@Work 2014 | Statistics 
9 
Activiteiten die volgen na het segmenteren 
•Belangrijke voorwaarde om segmentatie toe te passen is het kunnen bereiken van de segmenten 
•Hiervoor is een gedetailleerd beeld nodig van 
–wie is de klant? 
–hoe en waar kan ik ze vinden? 
•Andere belangrijke voorwaarde is weten welke promotionele content je moet gebruiken. 
•Daarvoor is begrip nodig over 
–hoe de keuzes van klanten tot stand komen 
–motivaties, psychografie en gedrag
HOE KUNT U UIT AL UW DATA INFORMATIE HALEN OM UW KLANTEN ZO GOED MOGELIJK IN TE DELEN? EN EEN ZO HELDER MOGELIJK PROFIEL TE GEVEN? 
10
© Analytics@Work 2014 | Statistics 
11 
Welke variabelen van belang bij operationele segmentatie? 
•Selectie variabelen 
–Zakelijk-particulier, branche 
•Organisatiedoel variabelen 
–Satisfactie, defectie, rendement, efficiency, kredietrisico 
•Predictie en profileringsvariabelen 
–Gedragsvariabelen 
–Leeftijd, inkomen, life cycle 
–Dynamisch, statisch 
•Stuurvariabelen 
–Marketing en beleidsinstrumenten 
•Controle variabelen 
–Satisfactie, defectie, rendement, efficiency, et cetera
© Analytics@Work 2014 | Statistics 
12 
Operationele segmentaties 
•De doelvariabele in de data set is ondersteunend aan de organisatie doelstellingen Bijvoorbeeld 
–Behalen van meer omzet 
–Opsporen van fraude, et cetera 
•Segmenten zijn onderscheidend op zowel het doel als de ‘drivers’ naar het doel 
•Organisatie brede inzet 
–Segment is voor elke klant berekend 
–Segmentatie variabelen opgenomen in data en rapportage systemen 
–Geïntegreerd in werkprocessen 
–Segmenten ingezet bij uitgaande en inkomende klantcontacten
© Analytics@Work 2014 | Statistics 
13 
2 tips bij segmentatie 
•Segmenteren is in wezen het maken van een model. Het verband tussen doel (vertoond gedrag) en segmentatievariabelen moet voldoende sterk zijn 
–Geslacht als indicator van het niet afbetalen werkt niet als het onderlinge verband erg zwak is 
•De keuze van de input variabelen: 
–Die variabelen die samenhangen met de doelvariabele van het model 
–Die variabelen die bruikbaar zijn voor de bewerking van de doelgroep
UITLEG EN DEMONSTRATIE VAN DECISION TREES SEGMENTEREN VAN CREDIT RISK BIJ EEN BANK 
14
© Analytics@Work 2014 | Statistics 
De casus 
•Een bank heeft informatie over haar klanten vastgelegd 
•Met deze kenmerken wil zij regels achterhalen over klanten met een hoge kans op het niet afbetalen van een lening 
•Deze regels wil de organisatie toepassen op nieuwe klanten die een lening aangevraagd hebben 
•Kredietinformatie 
–Debt to income ratio (x100) 
–Credit card debt in thousands 
–Other debt in thousands 
–Previously defaulted = doelvariabele 
•Klantinformatie 
–Age in years 
–Level of education 
–Years with current employer 
–Years at current address 
–Household income in thousands
© Analytics@Work 2014 | Statistics 
Basisbegrippen 
•Target variabele 
•Predictor variabelen (splitvariabelen) 
•Beslisboom = vertakkingen van de target variabele m.b.v. predictorvariabelen 
•Root = de totaal verdeling van de target variabele, i.c. het gemiddelde 
•Branche = een vertakking 
•Level = het aantal lagen onder de root 
•Nodes = opsplitsingen binnen een predictor variabele 
–Intermediate nodes 
–Terminal nodes 
•De resultaten worden getoond in een beslisboom 
•De regels worden weggeschreven naar een scoringsbestand
© Analytics@Work 2014 | Statistics 
1 
2 
3 
4 
Decision trees werkt als volgt 
Bereken de totaal gemiddelde kans op niet afbetalen 
Bepaal welk klantkenmerk het meeste differentieert in deze kans 
Het meest differentiërende kenmerk wordt in klassen ingedeeld 
Waarna gekeken wordt in combinatie met welke andere klantkenmerken een nog hogere kans op niet afbetalen te vinden is 
Elk eindblok is een aparte beslisregel. 
1 
2 
3 
4 
5 
5
© Analytics@Work 2014 | Statistics 
3 algoritmen, waarom? 
•Chaid en C&RT zijn al zeer lang in gebruik en performen verschillend op een data set 
•Quest is ontwikkeld in aanvulling op C&RT: 
–predictors met veel categorieen tenderen in C&RT eerder gekozen te worden 
•De praktijk: 
–Verken de verschillende technieken op een data set 
–Vergelijk de inhoudelijke en technische performance (classificatietabel, stabiliteit etcetera)
© Analytics@Work 2014 | Statistics 
Perspectief binnen Decision Trees 
Chaid met een categorische target 
Chaid met een 
metrische target
© Analytics@Work 2014 | Statistics 
Perspectief binnen Decision Trees 
C&RT met een categorische target 
C&RT met een metrische target
© Analytics@Work 2014 | Statistics 
Perspectief binnen Decision Trees 
Quest met een categorische target
DEMONSTRATIE IBM SPSS DECISION TREES 
22
© Analytics@Work 2014 | Statistics 
Andere technische toepassingen van Decision trees 
•Classificatie & segmentatie: cases toekennen aan een groep 
•Voorspellen: regels maken en en deze inzetten om toekomstige events te voorspellen 
•Data reductie & variabel screening: selecteren van een subset van predictor variabelen. Deze kunnen indien gewenst in een formeel statistisch model opgenomen worden 
•Indentificatie van interacties: het identificeren van relaties binnen specifieke subgroepen. Ook deze kunnen indien gewenst in een formeel statistisch model opgenomen worden 
•Indikken van categorische en metrische variabelen met een minimaal verlies aan informatie in relatie tot de targetvariabele
© Analytics@Work 2014 | Statistics 
Voorbeelden van andere segmentatie toepassingen 
•Vinden van groepen in een klantdatabase met een hoge respons op een marketingactie 
•Vinden van klantgroepen die boven gemiddeld opzeggen 
•Vinden van groepen mensen die bovengemiddeld frauderen (bijvoorbeeld bij verzekeringen, uitkeringen etcetera) 
•Vinden van ouderen met een hoge kans op een bepaalde ouderdomsverschijnsel (bijv. vallen) 
•Vinden van de juiste profielen voor het aannemen van personeel 
•Vinden van klantsegmenten met een hoge versus lage loyaliteit 
•Etcetera

More Related Content

Similar to Haal meer uit IBM SPSS Statistics 11.11.14 Profileren met beslissingsbomen Analytics@Work

KAM201304: Selectiecriteria & Interne organisatie
KAM201304: Selectiecriteria & Interne organisatieKAM201304: Selectiecriteria & Interne organisatie
KAM201304: Selectiecriteria & Interne organisatie
Crowdale.com
 
Analyse brochure 2016
Analyse brochure 2016Analyse brochure 2016
Analyse brochure 2016
VELS.NL
 
Business model canvas bryo-bert celis
Business model canvas   bryo-bert celisBusiness model canvas   bryo-bert celis
Business model canvas bryo-bert celis
innovatiecentra
 
AdWords Account Audit - GAUC Training Day
AdWords Account Audit - GAUC Training DayAdWords Account Audit - GAUC Training Day
AdWords Account Audit - GAUC Training DayNetsociety
 
Presentatie kennissessie webanalytics
Presentatie kennissessie webanalytics Presentatie kennissessie webanalytics
Presentatie kennissessie webanalytics Valtech
 
College Strategische Analyse
College Strategische AnalyseCollege Strategische Analyse
College Strategische Analysedongm
 
Eduvision - Webinar Marketing Analytics en Intelligence
Eduvision - Webinar Marketing Analytics en IntelligenceEduvision - Webinar Marketing Analytics en Intelligence
Eduvision - Webinar Marketing Analytics en Intelligence
Eduvision Opleidingen
 
Sinzer Emma Verheijke
Sinzer Emma VerheijkeSinzer Emma Verheijke
Sinzer Emma Verheijke
SocialImpactFactory
 
Innovatie van business modellen
Innovatie van business modellenInnovatie van business modellen
Innovatie van business modellen
René Verhoeven
 
Onderzoeksvoorstel Klanttevredenheidsonderzoek - Offerte
Onderzoeksvoorstel Klanttevredenheidsonderzoek - OfferteOnderzoeksvoorstel Klanttevredenheidsonderzoek - Offerte
Onderzoeksvoorstel Klanttevredenheidsonderzoek - Offerte
Rene Lagendijk
 
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA
 
Fex 1610003 - big data komt naar hr @valid
Fex   1610003 - big data komt naar hr @validFex   1610003 - big data komt naar hr @valid
Fex 1610003 - big data komt naar hr @valid
Flevum
 
NewRatio Klantsegmentatie En Merkpositionering
NewRatio   Klantsegmentatie En MerkpositioneringNewRatio   Klantsegmentatie En Merkpositionering
NewRatio Klantsegmentatie En MerkpositioneringWouter77
 
Klantreisoptimalisatie: een datagedreven strategie in 6 stappen
Klantreisoptimalisatie: een datagedreven strategie in 6 stappenKlantreisoptimalisatie: een datagedreven strategie in 6 stappen
Klantreisoptimalisatie: een datagedreven strategie in 6 stappen
valantic NL
 
Business Course Marketing Data Analyse
Business Course Marketing Data AnalyseBusiness Course Marketing Data Analyse
Business Course Marketing Data Analyse
Cmotions
 
Technology Update : Data Governance
Technology Update : Data GovernanceTechnology Update : Data Governance
Technology Update : Data Governance
Media Perspectives
 
Quickscan Kostenreductie
Quickscan KostenreductieQuickscan Kostenreductie
Quickscan Kostenreductie
JGB de Groot
 
Dag van de limburgse financial 2013: Strategie concreet maken tot op de werkv...
Dag van de limburgse financial 2013: Strategie concreet maken tot op de werkv...Dag van de limburgse financial 2013: Strategie concreet maken tot op de werkv...
Dag van de limburgse financial 2013: Strategie concreet maken tot op de werkv...
Arnold Wijngaarden
 
CV
CVCV
Wa College 1
Wa College 1Wa College 1
Wa College 1
Igor ter Halle
 

Similar to Haal meer uit IBM SPSS Statistics 11.11.14 Profileren met beslissingsbomen Analytics@Work (20)

KAM201304: Selectiecriteria & Interne organisatie
KAM201304: Selectiecriteria & Interne organisatieKAM201304: Selectiecriteria & Interne organisatie
KAM201304: Selectiecriteria & Interne organisatie
 
Analyse brochure 2016
Analyse brochure 2016Analyse brochure 2016
Analyse brochure 2016
 
Business model canvas bryo-bert celis
Business model canvas   bryo-bert celisBusiness model canvas   bryo-bert celis
Business model canvas bryo-bert celis
 
AdWords Account Audit - GAUC Training Day
AdWords Account Audit - GAUC Training DayAdWords Account Audit - GAUC Training Day
AdWords Account Audit - GAUC Training Day
 
Presentatie kennissessie webanalytics
Presentatie kennissessie webanalytics Presentatie kennissessie webanalytics
Presentatie kennissessie webanalytics
 
College Strategische Analyse
College Strategische AnalyseCollege Strategische Analyse
College Strategische Analyse
 
Eduvision - Webinar Marketing Analytics en Intelligence
Eduvision - Webinar Marketing Analytics en IntelligenceEduvision - Webinar Marketing Analytics en Intelligence
Eduvision - Webinar Marketing Analytics en Intelligence
 
Sinzer Emma Verheijke
Sinzer Emma VerheijkeSinzer Emma Verheijke
Sinzer Emma Verheijke
 
Innovatie van business modellen
Innovatie van business modellenInnovatie van business modellen
Innovatie van business modellen
 
Onderzoeksvoorstel Klanttevredenheidsonderzoek - Offerte
Onderzoeksvoorstel Klanttevredenheidsonderzoek - OfferteOnderzoeksvoorstel Klanttevredenheidsonderzoek - Offerte
Onderzoeksvoorstel Klanttevredenheidsonderzoek - Offerte
 
DDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data GovernanceDDMA 3 maart 2009 Pieter Vijn over Data Governance
DDMA 3 maart 2009 Pieter Vijn over Data Governance
 
Fex 1610003 - big data komt naar hr @valid
Fex   1610003 - big data komt naar hr @validFex   1610003 - big data komt naar hr @valid
Fex 1610003 - big data komt naar hr @valid
 
NewRatio Klantsegmentatie En Merkpositionering
NewRatio   Klantsegmentatie En MerkpositioneringNewRatio   Klantsegmentatie En Merkpositionering
NewRatio Klantsegmentatie En Merkpositionering
 
Klantreisoptimalisatie: een datagedreven strategie in 6 stappen
Klantreisoptimalisatie: een datagedreven strategie in 6 stappenKlantreisoptimalisatie: een datagedreven strategie in 6 stappen
Klantreisoptimalisatie: een datagedreven strategie in 6 stappen
 
Business Course Marketing Data Analyse
Business Course Marketing Data AnalyseBusiness Course Marketing Data Analyse
Business Course Marketing Data Analyse
 
Technology Update : Data Governance
Technology Update : Data GovernanceTechnology Update : Data Governance
Technology Update : Data Governance
 
Quickscan Kostenreductie
Quickscan KostenreductieQuickscan Kostenreductie
Quickscan Kostenreductie
 
Dag van de limburgse financial 2013: Strategie concreet maken tot op de werkv...
Dag van de limburgse financial 2013: Strategie concreet maken tot op de werkv...Dag van de limburgse financial 2013: Strategie concreet maken tot op de werkv...
Dag van de limburgse financial 2013: Strategie concreet maken tot op de werkv...
 
CV
CVCV
CV
 
Wa College 1
Wa College 1Wa College 1
Wa College 1
 

More from Daniel Westzaan

Haal meer IBM SPSS Statistics 11.11.14 Voorspellen aan de hand van logistis...
Haal meer IBM SPSS Statistics 11.11.14   Voorspellen aan de hand van logistis...Haal meer IBM SPSS Statistics 11.11.14   Voorspellen aan de hand van logistis...
Haal meer IBM SPSS Statistics 11.11.14 Voorspellen aan de hand van logistis...
Daniel Westzaan
 
PoT - probeer de mogelijkheden van datamining zelf uit 30-10-2014
PoT - probeer de mogelijkheden van datamining zelf uit 30-10-2014PoT - probeer de mogelijkheden van datamining zelf uit 30-10-2014
PoT - probeer de mogelijkheden van datamining zelf uit 30-10-2014
Daniel Westzaan
 
BA Summit 2014 Imtech ICT Workshop Tips & Tricks; maak optimaal gebruik van I...
BA Summit 2014 Imtech ICT Workshop Tips & Tricks; maak optimaal gebruik van I...BA Summit 2014 Imtech ICT Workshop Tips & Tricks; maak optimaal gebruik van I...
BA Summit 2014 Imtech ICT Workshop Tips & Tricks; maak optimaal gebruik van I...
Daniel Westzaan
 
BA Summit 2014 Predictive maintenance: Met big data het lek dichten
BA Summit 2014  Predictive maintenance: Met big data het lek dichtenBA Summit 2014  Predictive maintenance: Met big data het lek dichten
BA Summit 2014 Predictive maintenance: Met big data het lek dichten
Daniel Westzaan
 
BA Summit 2014 Social media analytics volgers en vrienden zeggen niet alles
BA Summit 2014 Social media analytics volgers en vrienden zeggen niet allesBA Summit 2014 Social media analytics volgers en vrienden zeggen niet alles
BA Summit 2014 Social media analytics volgers en vrienden zeggen niet alles
Daniel Westzaan
 
BA Summit 2014 Werk efficiënter met IBM SPSS- en IBM Cognos-oplossingen speci...
BA Summit 2014 Werk efficiënter met IBM SPSS- en IBM Cognos-oplossingen speci...BA Summit 2014 Werk efficiënter met IBM SPSS- en IBM Cognos-oplossingen speci...
BA Summit 2014 Werk efficiënter met IBM SPSS- en IBM Cognos-oplossingen speci...
Daniel Westzaan
 
BA Summit 2014 Ontdek de nieuwe mogelijkheden van IBM SPSS Modeler 16.0
BA Summit 2014 Ontdek de nieuwe mogelijkheden van IBM SPSS Modeler 16.0BA Summit 2014 Ontdek de nieuwe mogelijkheden van IBM SPSS Modeler 16.0
BA Summit 2014 Ontdek de nieuwe mogelijkheden van IBM SPSS Modeler 16.0
Daniel Westzaan
 
BA Summit 2014 BMW brengt klantbeleving naar een hogere versnelling met Predi...
BA Summit 2014 BMW brengt klantbeleving naar een hogere versnelling met Predi...BA Summit 2014 BMW brengt klantbeleving naar een hogere versnelling met Predi...
BA Summit 2014 BMW brengt klantbeleving naar een hogere versnelling met Predi...
Daniel Westzaan
 
BA Summit 2014 Haal heldere inzichten uit complexe data met visualisatie
BA Summit 2014 Haal heldere inzichten uit complexe data met visualisatie BA Summit 2014 Haal heldere inzichten uit complexe data met visualisatie
BA Summit 2014 Haal heldere inzichten uit complexe data met visualisatie
Daniel Westzaan
 
BA Summit 2014 Maak kennis met de revolutionaire analytics van IBM Watson
BA Summit 2014 Maak kennis met de revolutionaire analytics van IBM WatsonBA Summit 2014 Maak kennis met de revolutionaire analytics van IBM Watson
BA Summit 2014 Maak kennis met de revolutionaire analytics van IBM Watson
Daniel Westzaan
 
BA Summit 2014 Vergroot uw inzicht: kijk vooruit met business intelligence en...
BA Summit 2014 Vergroot uw inzicht: kijk vooruit met business intelligence en...BA Summit 2014 Vergroot uw inzicht: kijk vooruit met business intelligence en...
BA Summit 2014 Vergroot uw inzicht: kijk vooruit met business intelligence en...
Daniel Westzaan
 
BA Summit 2014 Stuur uw ondernemingsstrategie met financiële en operationele ...
BA Summit 2014 Stuur uw ondernemingsstrategie met financiële en operationele ...BA Summit 2014 Stuur uw ondernemingsstrategie met financiële en operationele ...
BA Summit 2014 Stuur uw ondernemingsstrategie met financiële en operationele ...
Daniel Westzaan
 
Ba Summit 2014 Betere planning en forecasting met predictive analytics
Ba Summit 2014   Betere planning en forecasting met predictive analyticsBa Summit 2014   Betere planning en forecasting met predictive analytics
Ba Summit 2014 Betere planning en forecasting met predictive analytics
Daniel Westzaan
 

More from Daniel Westzaan (13)

Haal meer IBM SPSS Statistics 11.11.14 Voorspellen aan de hand van logistis...
Haal meer IBM SPSS Statistics 11.11.14   Voorspellen aan de hand van logistis...Haal meer IBM SPSS Statistics 11.11.14   Voorspellen aan de hand van logistis...
Haal meer IBM SPSS Statistics 11.11.14 Voorspellen aan de hand van logistis...
 
PoT - probeer de mogelijkheden van datamining zelf uit 30-10-2014
PoT - probeer de mogelijkheden van datamining zelf uit 30-10-2014PoT - probeer de mogelijkheden van datamining zelf uit 30-10-2014
PoT - probeer de mogelijkheden van datamining zelf uit 30-10-2014
 
BA Summit 2014 Imtech ICT Workshop Tips & Tricks; maak optimaal gebruik van I...
BA Summit 2014 Imtech ICT Workshop Tips & Tricks; maak optimaal gebruik van I...BA Summit 2014 Imtech ICT Workshop Tips & Tricks; maak optimaal gebruik van I...
BA Summit 2014 Imtech ICT Workshop Tips & Tricks; maak optimaal gebruik van I...
 
BA Summit 2014 Predictive maintenance: Met big data het lek dichten
BA Summit 2014  Predictive maintenance: Met big data het lek dichtenBA Summit 2014  Predictive maintenance: Met big data het lek dichten
BA Summit 2014 Predictive maintenance: Met big data het lek dichten
 
BA Summit 2014 Social media analytics volgers en vrienden zeggen niet alles
BA Summit 2014 Social media analytics volgers en vrienden zeggen niet allesBA Summit 2014 Social media analytics volgers en vrienden zeggen niet alles
BA Summit 2014 Social media analytics volgers en vrienden zeggen niet alles
 
BA Summit 2014 Werk efficiënter met IBM SPSS- en IBM Cognos-oplossingen speci...
BA Summit 2014 Werk efficiënter met IBM SPSS- en IBM Cognos-oplossingen speci...BA Summit 2014 Werk efficiënter met IBM SPSS- en IBM Cognos-oplossingen speci...
BA Summit 2014 Werk efficiënter met IBM SPSS- en IBM Cognos-oplossingen speci...
 
BA Summit 2014 Ontdek de nieuwe mogelijkheden van IBM SPSS Modeler 16.0
BA Summit 2014 Ontdek de nieuwe mogelijkheden van IBM SPSS Modeler 16.0BA Summit 2014 Ontdek de nieuwe mogelijkheden van IBM SPSS Modeler 16.0
BA Summit 2014 Ontdek de nieuwe mogelijkheden van IBM SPSS Modeler 16.0
 
BA Summit 2014 BMW brengt klantbeleving naar een hogere versnelling met Predi...
BA Summit 2014 BMW brengt klantbeleving naar een hogere versnelling met Predi...BA Summit 2014 BMW brengt klantbeleving naar een hogere versnelling met Predi...
BA Summit 2014 BMW brengt klantbeleving naar een hogere versnelling met Predi...
 
BA Summit 2014 Haal heldere inzichten uit complexe data met visualisatie
BA Summit 2014 Haal heldere inzichten uit complexe data met visualisatie BA Summit 2014 Haal heldere inzichten uit complexe data met visualisatie
BA Summit 2014 Haal heldere inzichten uit complexe data met visualisatie
 
BA Summit 2014 Maak kennis met de revolutionaire analytics van IBM Watson
BA Summit 2014 Maak kennis met de revolutionaire analytics van IBM WatsonBA Summit 2014 Maak kennis met de revolutionaire analytics van IBM Watson
BA Summit 2014 Maak kennis met de revolutionaire analytics van IBM Watson
 
BA Summit 2014 Vergroot uw inzicht: kijk vooruit met business intelligence en...
BA Summit 2014 Vergroot uw inzicht: kijk vooruit met business intelligence en...BA Summit 2014 Vergroot uw inzicht: kijk vooruit met business intelligence en...
BA Summit 2014 Vergroot uw inzicht: kijk vooruit met business intelligence en...
 
BA Summit 2014 Stuur uw ondernemingsstrategie met financiële en operationele ...
BA Summit 2014 Stuur uw ondernemingsstrategie met financiële en operationele ...BA Summit 2014 Stuur uw ondernemingsstrategie met financiële en operationele ...
BA Summit 2014 Stuur uw ondernemingsstrategie met financiële en operationele ...
 
Ba Summit 2014 Betere planning en forecasting met predictive analytics
Ba Summit 2014   Betere planning en forecasting met predictive analyticsBa Summit 2014   Betere planning en forecasting met predictive analytics
Ba Summit 2014 Betere planning en forecasting met predictive analytics
 

Haal meer uit IBM SPSS Statistics 11.11.14 Profileren met beslissingsbomen Analytics@Work

  • 1. © Analytics@Work 2014 | Statistics Segmenteren en profileren met beslissingsbomen 11 November 2014 Jan Schuurman
  • 2. © Analytics@Work 2014 | Statistics Introductie: Analytics@Work •Analytics@Work is business partner voor IBM SPSS en verzorgt workshops en consultancy in de hele product range van SPSS analyse technologie. •Freelance inhuur Jan Schuurman: –Gecertificeerd expert in het gebruik van de IBM SPSS Statistics & Modeler (datamining, textmining) –Analyse oplossingen in Retail, Marketing Intelligence en Fraude •Projectbasis –Analytics@Work is netwerkorganisatie van specialisten in Market & Customer Intelligence
  • 3. Trainingen en workshops op eigen data Trainingen •Introduction to IBM SPSS Modeler and Data Mining •Predictive Modeling with IBM SPSS Modeler •Clustering and Association Models with IBM SPSS Modeler •Advanced Data Preparation Using IBM SPSS Modeler •Introduction to IBM SPSS Text Analytics for IBM SPSS Modeler •Introduction to IBM SPSS Statistics •Introduction to Statistical Analysis Using IBM SPSS Statistics •Advanced Statistical Analysis Using IBM SPSS Statistics •Data Management and Manipulation with IBM SPSS Statistics Workshops •SPSS Advanced Statistics op eigen data •Introductie in datamining op eigen data •Advanced datamining op eigen data •Segmentatie & market basket technieken op eigen data •Introductie in textmining op eigen data 3
  • 4. © Analytics@Work 2014 | Statistics Agenda •Segmentatie, gezien vanuit het perspectief van de organisatie •Welke soorten segmentaties zijn er? •Uitleg en demonstratie van operationele segmentaties met Decision Trees •Andere segmentatie toepassingen •Vragen 4
  • 5. © Analytics@Work 2014 | Statistics 5 Segmentatie, bijvoorbeeld gezien vanuit het marketing perspectief van een organisatie •Het gaat om het optimaal afstemmen van middelen voor groepen vergelijkbare klanten •Segmentatie: Het opsplitsen van (potentiele) klanten in een bepaalde markt in verschillende groepen (segmenten), waarbinnen de klanten dezelfde of vergelijkbare eisen hebben die ingewilligd worden door een onderscheidende marketing mix. •Bijvoorbeeld de marketing mix; de beschikbare middelen van een organisatie om de match te verbeteren tussen de voordelen die klanten zoeken en de voordelen die de organisatie aanbiedt.
  • 6. © Analytics@Work 2014 | Statistics 6 Segmenteren doe je dus … 1.Voor het kiezen van de doelgroep 2.Om een propositie te ontwikkelen die je onderscheidend maakt van de concurrent 3.Om goed aangesloten te blijven met de propositie aan de behoefte van de doelgroep •Dit voorbeeld is gezien vanuit het marketing perspectief •Bij fraude gaat het bijvoorbeeld over –het kiezen van risico groepen –Ontwikkelen van bestrijdingsconcepten –goed aangesloten blijven op veranderend fraudegedrag
  • 7. © Analytics@Work 2014 | Statistics 7 Welke soorten segmentaties zijn er? •Er zijn grofweg twee soorten segmentaties: •Strategische segmentaties zijn gericht op een fundamenteel andere behoefte. Marktsegmentaties. •Operationele segmentaties zijn gericht op een organisatie doel. Bijvoorbeeld omzet verhoging, verhoging winstgevendheid etcetera. Vaak ook gericht op het verbeteren van de efficiency. Klantsegmentaties. –Hier wordt vaak predictive modelling toegepast om segmenten beter te kunnen targetten –Bijvoorbeeld voor het beter benutten van de inkomende en uitgaande klantcontacten
  • 8. © Analytics@Work 2014 | Statistics Segmentatie technieken in de praktijk •In beschrijvende segmentaties wordt vaak gebruik gemaakt van clustering technieken –Er worden homogene groepen gevonden, waarbinnen mensen sterk op elkaar lijken en sterk verschillen van mensen in andere groepen –In de praktijk zijn deze groepen weinig onderscheidend op een of meerdere externe doelvariabelen •In voorspellende segmentaties wordt vaak gebruik gemaakt van decision tree technieken –De doelvariabele is leidend om segmenten te vormen. –De segmenten zijn specifieke aftakkingen of groepen van geneste aftakkingen –Ook op deze manier worden homogene groepen gevonden, waarbinnen mensen sterk op elkaar lijken en sterk verschillen van mensen in andere groepen. Echter ze verschillen het meeste op de doelvariabele. 8
  • 9. © Analytics@Work 2014 | Statistics 9 Activiteiten die volgen na het segmenteren •Belangrijke voorwaarde om segmentatie toe te passen is het kunnen bereiken van de segmenten •Hiervoor is een gedetailleerd beeld nodig van –wie is de klant? –hoe en waar kan ik ze vinden? •Andere belangrijke voorwaarde is weten welke promotionele content je moet gebruiken. •Daarvoor is begrip nodig over –hoe de keuzes van klanten tot stand komen –motivaties, psychografie en gedrag
  • 10. HOE KUNT U UIT AL UW DATA INFORMATIE HALEN OM UW KLANTEN ZO GOED MOGELIJK IN TE DELEN? EN EEN ZO HELDER MOGELIJK PROFIEL TE GEVEN? 10
  • 11. © Analytics@Work 2014 | Statistics 11 Welke variabelen van belang bij operationele segmentatie? •Selectie variabelen –Zakelijk-particulier, branche •Organisatiedoel variabelen –Satisfactie, defectie, rendement, efficiency, kredietrisico •Predictie en profileringsvariabelen –Gedragsvariabelen –Leeftijd, inkomen, life cycle –Dynamisch, statisch •Stuurvariabelen –Marketing en beleidsinstrumenten •Controle variabelen –Satisfactie, defectie, rendement, efficiency, et cetera
  • 12. © Analytics@Work 2014 | Statistics 12 Operationele segmentaties •De doelvariabele in de data set is ondersteunend aan de organisatie doelstellingen Bijvoorbeeld –Behalen van meer omzet –Opsporen van fraude, et cetera •Segmenten zijn onderscheidend op zowel het doel als de ‘drivers’ naar het doel •Organisatie brede inzet –Segment is voor elke klant berekend –Segmentatie variabelen opgenomen in data en rapportage systemen –Geïntegreerd in werkprocessen –Segmenten ingezet bij uitgaande en inkomende klantcontacten
  • 13. © Analytics@Work 2014 | Statistics 13 2 tips bij segmentatie •Segmenteren is in wezen het maken van een model. Het verband tussen doel (vertoond gedrag) en segmentatievariabelen moet voldoende sterk zijn –Geslacht als indicator van het niet afbetalen werkt niet als het onderlinge verband erg zwak is •De keuze van de input variabelen: –Die variabelen die samenhangen met de doelvariabele van het model –Die variabelen die bruikbaar zijn voor de bewerking van de doelgroep
  • 14. UITLEG EN DEMONSTRATIE VAN DECISION TREES SEGMENTEREN VAN CREDIT RISK BIJ EEN BANK 14
  • 15. © Analytics@Work 2014 | Statistics De casus •Een bank heeft informatie over haar klanten vastgelegd •Met deze kenmerken wil zij regels achterhalen over klanten met een hoge kans op het niet afbetalen van een lening •Deze regels wil de organisatie toepassen op nieuwe klanten die een lening aangevraagd hebben •Kredietinformatie –Debt to income ratio (x100) –Credit card debt in thousands –Other debt in thousands –Previously defaulted = doelvariabele •Klantinformatie –Age in years –Level of education –Years with current employer –Years at current address –Household income in thousands
  • 16. © Analytics@Work 2014 | Statistics Basisbegrippen •Target variabele •Predictor variabelen (splitvariabelen) •Beslisboom = vertakkingen van de target variabele m.b.v. predictorvariabelen •Root = de totaal verdeling van de target variabele, i.c. het gemiddelde •Branche = een vertakking •Level = het aantal lagen onder de root •Nodes = opsplitsingen binnen een predictor variabele –Intermediate nodes –Terminal nodes •De resultaten worden getoond in een beslisboom •De regels worden weggeschreven naar een scoringsbestand
  • 17. © Analytics@Work 2014 | Statistics 1 2 3 4 Decision trees werkt als volgt Bereken de totaal gemiddelde kans op niet afbetalen Bepaal welk klantkenmerk het meeste differentieert in deze kans Het meest differentiërende kenmerk wordt in klassen ingedeeld Waarna gekeken wordt in combinatie met welke andere klantkenmerken een nog hogere kans op niet afbetalen te vinden is Elk eindblok is een aparte beslisregel. 1 2 3 4 5 5
  • 18. © Analytics@Work 2014 | Statistics 3 algoritmen, waarom? •Chaid en C&RT zijn al zeer lang in gebruik en performen verschillend op een data set •Quest is ontwikkeld in aanvulling op C&RT: –predictors met veel categorieen tenderen in C&RT eerder gekozen te worden •De praktijk: –Verken de verschillende technieken op een data set –Vergelijk de inhoudelijke en technische performance (classificatietabel, stabiliteit etcetera)
  • 19. © Analytics@Work 2014 | Statistics Perspectief binnen Decision Trees Chaid met een categorische target Chaid met een metrische target
  • 20. © Analytics@Work 2014 | Statistics Perspectief binnen Decision Trees C&RT met een categorische target C&RT met een metrische target
  • 21. © Analytics@Work 2014 | Statistics Perspectief binnen Decision Trees Quest met een categorische target
  • 22. DEMONSTRATIE IBM SPSS DECISION TREES 22
  • 23. © Analytics@Work 2014 | Statistics Andere technische toepassingen van Decision trees •Classificatie & segmentatie: cases toekennen aan een groep •Voorspellen: regels maken en en deze inzetten om toekomstige events te voorspellen •Data reductie & variabel screening: selecteren van een subset van predictor variabelen. Deze kunnen indien gewenst in een formeel statistisch model opgenomen worden •Indentificatie van interacties: het identificeren van relaties binnen specifieke subgroepen. Ook deze kunnen indien gewenst in een formeel statistisch model opgenomen worden •Indikken van categorische en metrische variabelen met een minimaal verlies aan informatie in relatie tot de targetvariabele
  • 24. © Analytics@Work 2014 | Statistics Voorbeelden van andere segmentatie toepassingen •Vinden van groepen in een klantdatabase met een hoge respons op een marketingactie •Vinden van klantgroepen die boven gemiddeld opzeggen •Vinden van groepen mensen die bovengemiddeld frauderen (bijvoorbeeld bij verzekeringen, uitkeringen etcetera) •Vinden van ouderen met een hoge kans op een bepaalde ouderdomsverschijnsel (bijv. vallen) •Vinden van de juiste profielen voor het aannemen van personeel •Vinden van klantsegmenten met een hoge versus lage loyaliteit •Etcetera