Your SlideShare is downloading. ×

Data Mining: project new credit card

419

Published on

Published in: Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
419
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. DATA MINING REPORTPROJECT: New Credit Card – BancaXA cura di:Mirko Vairo
  • 2. OBIETTIVI DI BUSINESS 1La BancaX, azienda che da oltre 40 anni opera nel campo dei servizifinanziari, ci ha ingaggiato per sviluppare un’analisi di Data Mining suun Dataset di approssimativamente 40.000 clienti. L’obiettivo di talestudio è: • Sviluppare sul DB a disposizione delle analisi statistiche – utilizzando i modelli di analisi univariata, bivariata e multivariata – per capire, da un lato, come si configura la clientela della banca e, dall’altro indagare quali siano le motivazioni che spingono un cliente a richiedere spontaneamente l’attivazione di una nuova carta di credito.
  • 3. DA COSA PARTIAMO 2BancaX, per raggiungere tale obiettivo, ci ha fornito un Dataset (Banking prediction 1) contenente varieinformazioni su: Sesso ed Età del cliente Storicità del cliente Utilizzo che ciascun cliente fa, in termini di ammontare impiegato o ottenuto, dei prodotti bancari offerti. N° di transazioni effettuate da ciascun cliente attraverso i diversi canali a disposizione (Sportelli/ATM/Internet/Telefono) Gli ordini effettuati dal cliente e non ancori evasi VARIABILE Il possesso o meno di una nuova carta di credito OBIETTIVO
  • 4. OBIETTIVI DI DATA MINING 3Attraverso l’utilizzo di questo Dataset, sono state effettuate: Inizialmente, è stato quello di analizzare il dato fornito, attraverso ANALISI analisi descrittive e grafiche. Successivamente, si è verificato se UNIVARIATE fosse necessario effettuare una pulizia del Dataset ed un’eventuale riclassificazione di alcune delle variabili. FACTOR E L’obiettivo era quello di segmentare la clientela della banca CLUSTER per studiarne le caratteristiche ed individuare eventuali ANALYSIS clusters di particolare interesse. MODELLI DI CLASSIFICAZIONE L’utiizzo di queste tecniche aveva lo scopo di capire cosa ED ASSOCIAZIONE avesse spinto il cliente ad attivare una nuova carta di credito.
  • 5. PROJECT PLAN 4 • Analisi descrittiva e grafica del DB (slide 6-9)FASE 1 • Individuazione outliers e mancanti (slide 10) • Pulizia dei dati (slide 12) • Ricodifica variabili slide (13-16)FASE 2 • Segmentazione della clientela (slide 17-23) • Sviluppo dei modelli di classificazione (slide 25-34)FASE 3 • Sviluppo dei modelli di associazione (slide 36-39) • Findings (slide 41)FASE 4 • Implicazioni manageriali (slide 42-43)
  • 6. FASE 1: ANALISI DEI DATI 5Questa fase si compone di due step: STEP 1  Analisi descrittiva e grafica del DB STEP 2  Individuazione outliers e mancanti
  • 7. ANALISI DESCRITTIVA E GRAFICA 6Il Dataset contiene le informazioni di un campione di 41.978 clienti della BancaX. Lecaratteristiche di base della clientela possono essere riassunte in 3 punti:1 – Il 59,24% dei clienti sono donne e la restante parte uomini È necessario ricodificare la variabile2 – L’età è compresa tra i 18 ed i 90 anni per poter classificare i clienti in fasce d’età.3 – La tenure del cliente in media è di 5 anni
  • 8. ANALISI DESCRITTIVA E GRAFICA (2) 7 L’utilizzo medio di ciascun prodotto Conti Risparmio Media utilizzo: 1.612$ bancario è molto basso (ad esempio, basta notare che i prestiti alle imprese Conti Correnti Media utilizzo: 323$ registrano un valore medio poco realistico, 4.137$). Questo ci porta a pensare che il dato sia fortemente Depositi Media utilizzo: 1.462$ contenuto a causa dell’elevato numero di clienti che non fa uso dei prodottiPRODOTTI BANCARI Fondi d’investimento Media utilizzo: 1.000$ (valore 0 nella relativa casella); ciò provoca l’identificazione di un numero Titoli azionari Media utilizzo: 717 $ troppo consistente di outlier. Proprio per questo motivo, prima di poter procedere alla loro identificazione ed Garanzie bancarie Media utilizzo:10$ eliminazione, in fase di analisi dei dati siamo stati costretti a trasformare i Assicurazioni vita Media utilizzo: 3$ valori “0” in nulli. Considerando lo scarso utilizzo dell’offerta da parte dei Mutui Media utilizzo: 1.324$ clienti, siamo portati a pensare che la BancaX tende a riconoscere come tali coloro che in realtà realizzano solo Prestiti alle imprese Media utilizzo:4.137$ operazioni una tantum; questo fenomeno verrà enfatizzato Prestiti al consumo Media utilizzo: 1.962$ principalmente durante la fase di clusterizzazione.
  • 9. ANALISI DESCRITTIVA E GRAFICA (3) 8 Sportelli Media utilizzo: 2,6 transaz. Relativamente ai canali di transazione, l’influenza dei non utilizzatori generaCANALI DI TRANZAZIONE effetti del tutto simili a quanto enunciato in precedenza per i prodotti bancari. Molto interessante il dato sulle transazioni attraverso l’e-banking, in ATM Media utilizzo: 3 transaz. media molto basso rispetto alle aspettative (0,026 per cliente), perché attualmente la maggior parte delle transazioni che vengono realizzate con carta di credito coinvolgono questo Internet Media utilizzo: 0,026 transaz. canale. Inatteso il dato relativo alle transazioni effettuate attraverso sportelli automatici che mostrano il livello di frequenza d’utilizzo più elevato. Telefono Media utilizzo: 0,013 transaz.
  • 10. ANALISI DESCRITTIVA E GRAFICA (4) 9L’ultimo campo compreso nel DB è quello che riguarda la variabile obiettivo della nostra analisi – ecioè il numero di clienti che hanno attivato una carta di credito. In sostanza il grafico ci mostra chesolo il 5,54% dei clienti possiede una carta (2324 su 41978); questo dato ci consente dicomprendere meglio le motivazioni per le quali la BancaX ha avviato questo un progetto d’analisi. 94,46% 5,54%
  • 11. INDIVIDUAZIONE OULIERS E MANCANTI 10Come si è preannunciato, per individuare in maniera più corretta gli outliers, sono stati creati artificiosamente dei nuovi campi(con il suffisso _missing) dove gli “0” venivano trasformati in valori nulli (vedi output clementine Tabella con valori nulli). Una voltafatto ciò sono stati calcolati gli outliers: 1) per i valori anomali il limite soglia era posto a 3 volte il range interquartile mentre 2)per i valori estremi era 6 volte; non vi erano mancanti. Il risultato finale è stato il seguente:CAMPI ANOMALI ESTREMI RECORD VALIDI VALORE NULLO Nel riquadro azzurro vengonoCustomer_ID 0 0 41978 0 messi in evidenza gli outliers relativiGender -- -- 41978 0Age 0 0 41978 0 ad ogni nuova variabile creata. LaTenure 0 0 41978 0 percentuale di record modificati perNew_Credit_Card_Flag -- -- 41978 0 ogni campo si aggira tra il 3% eSaving_Amount_missing 1276 1594 27991 13987 l’11% (naturalmente è unaCurrent_Amount_missing 384 618 9811 32167 percentuale relativa solo ai recordTime_Deposits_Amount_missing 39 27 1482 40496 validi e non a tutti quelli presenti nelFunds_Amount_missing 70 31 2092 39886 DB – infatti nella 4^ colonna sonoStocks_Amount_missing 157 239 4018 37960 indicati i valori nulli per ogniBank_Assurance_Amount_missing 25 3 1633 40345 campo).Life_Assurance_Amount_missing 36 11 957 41021Business_Loan_Amount_missing 28 14 966 41012Home_Loan_Amount_missing 23 7 1680 40298Consumer_Loan_Amount_missing 97 8 9974 32004Branch_Transactions_missing 442 276 22453 19525ATM_Transactions_missing 68 4 11825 30153Phone_Transactions_missing 6 0 171 41807Internet_Transactions_missing 15 8 365 41613Standing_Orders_missing 34 6 1673 40305
  • 12. FASE 2: PREPARAZIONE DEI DATI 11La fase 2 si compone di tre step:STEP 1  Pulizia dei datiSTEP 2  Ricodifica variabiliSTEP 3  Segmentazione della clientela
  • 13. PULIZIA DEI DATI 12Individuati valori estremi ed anomali si è proceduto alla loro eliminazione. Di sotto si riporta lo stream realizzato per la correzionedei valori.Per quanto riguarda la procedura disostituzione degli outliers è stataimpostata, attraverso il nodo Esplora, lafunzione “Forza” e successivamente si èutilizzato il parametro “Algoritmo” perl’assegnazione del nuovo valore (vedisupernodo Valore anomalo ed estremo).Fatto ciò, il passo seguente è stato quellodi reimpostare i record con valori nulli (danoi artificiosamente creati), assegnando– attraverso il supernodo “Assegnavalori” – a ciascuno di essi il valore 0.Infine, con il nodo Filtro, sono statirinominati i nuovi campi creati (senzaoutliers) apponendo a ciascuno di essi ilsuffisso _ready; il tutto è stato inseritoall’interno del nuovo DB: BankingPrediction 1 – DB pulito.
  • 14. RICODIFICA VARIABILI 13 Per un’analisi più chiara e dettagliata e per poter sviluppare i modelli di associazione, è stata necessaria la ricodifica di alcune delle variabili. Due le operazioni realizzate: 1 – Classificazione della variabile età.Dato che, come visto in precedenza, il campo età è espresso come variabilecontinua (che va da 18 a 90 anni), si è pensato che fosse più giustoriclassificarla attraverso il nodo Discretizza. Sintetizzando, la procedura haportato alla creazione di 4 fasce d’età (riportate nel grafico qui accanto).Emergono due riflessioni interessanti:a) L’80,44% del campione è composto da individui con età tra 24 e 65 anni.b) In questa classe si collocano coloro che hanno richiesto con maggiore frequenza l’attivazione della nuova carta di credito.
  • 15. RICODIFICA VARIABILI (2) 14 2 – Ricodifica prodotti bancari e canali di transazione in variabili FlagPer l’attuazione dei modelli di associazione (Market Basket Analysis), i campi _Amount e _Transaction sono statitrasformati da variabili numeriche continue a variabili Flag. Tale obiettivo è stato raggiunto attraverso la creazione diun apposito stream:Seguendo il flusso, le operazioni realizzate sono state: 1) Eliminazione di alcuni campi secondari ai fini dello studio(Gender, Tenure e Standing_orders); 2) Creazione dei campi Flag attraverso l’apposito supernodo (vedi slidesuccessiva per approfondimenti); 3) Filtraggio dei vecchi campi (numerici continui); 4) Ricodifica delle variabili 1/0 inTrue/False per poter eseguire correttamente la MBA. 5) Creazione del DB: Banking Prediction – DB per MBA.
  • 16. RICODIFICA VARIABILI (3) 15 2 – Ricodifica prodotti bancari e canali di transazione in variabili FlagAttraverso il supernodo “Creazione Flag” è stato creato un insieme di nodi Nuovo Campo che hapermesso la ricodifica dei vecchi campi. La sintesi delle variabili create è riportata nella seguentetabella.
  • 17. RICODIFICA VARIABILI (4) 16 2 – Ricodifica prodotti bancari e canali di transazione in variabili FlagUna volta trasformate tutte le variabili in flag, si è verificato attraverso il nodo Distribuzione se per alcune di esse lapercentuale di casi Veri (e cioè con valore 1) risultasse almeno superiore al 5% del totale dei casi.Solo 7 delle 14 variabili flag, inizialmente create, soddisfacevano tale criterio.
  • 18. SEGMENTAZIONE DELLA CLIENTELA 17L’ultimo step di questa fase riguarda la creazione e la descrizione dei cluster di clientela.Tre i passi seguiti: Factor Analysis Cluster Analysis Descrizione cluster
  • 19. SEGMENTAZIONE DELLA CLIENTELA 18 Factor AnalysisIl primo passo ha portato alla creazione di 5 fattori che sintetizzano i 10 prodotti offerti da BancaX. Fondi d’investimento Garanzie bancarie Conti Risparmio Prodotti di Prodotti Assicurazioni vita investimento/ Vita/Casa Depositi Risparmio Mutui Titoli azionari Finanziamenti alle I fattori costruiti dal s/w, e qui riportati, spiegano il 62% Prestiti alle imprese della varianza totale (la tabella con le correlazioni tra imprese fattori e prodotti viene riportata nella cartella relativa a Conti Correnti Conti Correnti questa fase). Prestiti al consumo Finanziamenti a privati
  • 20. SEGMENTAZIONE DELLA CLIENTELA (2) 19Cluster Analysis La tecnica utilizzata è l’algoritmo K- means che ha permesso di identificare 4 clusters finali (vedi tabella). La tabella di ANOVA (file output factor_cluster) mostra come tale soluzione sia anche significativa al test-F. Di estremo interesse l’informazione fornitaci dalla tabella riportata a lato; questa infatti ci indica che esiste un cluster di utenti, quello dei Dormienti, che sembra essere preponderante rispetto agli altri. Inizialmente si pensava che, questa anomalia, fosse dovuta al numero troppo basso di clusters; però, ci si è accorti che aumentandolo la soluzione era pressoché la stessa. L’unica interpretazione plausibile è che il Dataset di 41.978 record rappresenta, principalmente, quel campione di utenti della BancaX che è poco avvezzo all’utilizzo dei prodotti bancari che compongono la sua offerta (questo lo notiamo – nella tabella sopra riportata – dallo scarso livello di correlazione con tutti i fattori). Forse, i clienti che appartengono a questo cluster, sono proprio quelli che la banca vorrebbe coinvolgere maggiormente attraverso un prodotto più flessibile quale la carta di credito.
  • 21. SEGMENTAZIONE DELLA CLIENTELA (3) 20 Descrizione cluster “Famiglie”Questo cluster è stato così denominato per la sua attitudine ad usufruire diprodotti come i mutui per l’acquisto di immobili e quindi di beni destinatiall’uso familiare. Il grafico sulla destra dimostra chiaramente questaattitudine.Per quanto riguarda l’età media, si nota dall’istogramma Age_OPTIMAL chela maggior parte dei clienti ad esso appartenenti si colloca nella fascia 24-65anni; ciò sembra ovvio alla luce del fatto che, coloro che più frequentementerichiedono un mutuo alla banca sono famiglie – più o meno giovani – chevogliono costruire il proprio futuro.Infine, è emerso che, tra gliindividui appartenenti a questocluster, sono state attivate solo53 nuove carte di credito su untotale di 825 clienti. Questodato, correlato a quantoespresso in precedenza, mettein evidenza la scarsa attrattivitàdel cluster in questione.
  • 22. SEGMENTAZIONE DELLA CLIENTELA (4) 21Descrizione cluster “Business” Anche quello dei clienti business sembra un cluster poco interessante per le finalità della nostra ricerca, dato il numero ridotto dei suoi componenti e di quelli che al suo interno possiedono una carta di credito. D’altronde un cliente del tipo business difficilmente utilizza una carta di credito per la sua attività, mentre ricorre più spesso a strumenti quali i Finanziamenti o altre forme di debito. Come accade per le Famiglie, i clienti business si caratterizzano per il collocamento nella fascia intermedia d’età. Come ci si poteva aspettare, il numero di clienti al di sotto dei 24 anni è esiguo, proprio perché è molto difficile che clienti giovani usufruiscano di un prodotto business.
  • 23. SEGMENTAZIONE DELLA CLIENTELA (5) 22 Descrizione cluster “Dormienti”Il cluster dei dormienti, come accennato in precedenza, è quello più grande tra i 4 creati (circa 40.000 utenti – in pratica quasi tutto ilcampione). Si collocano al suo interno quei clienti che, sostanzialmente, non usufruiscono di nessuno dei prodotti bancari messi aloro disposizione o lo fanno occasionalmente. Nel corso della fase di analisi ci concentreremo in particolar modo su di essi, chesembrano essere il segmento più attraente per il nostro obiettivo.Solo il 5% di essi ha attivato una nuova carta; questo in valore Come negli altri casi, anche i dormienti si concentranoassoluto, però, si traduce in 2.211 attivazioni. Quindi, data la nella fascia d’età 24-65 anni. Però, in questo caso cresceconsistenza di questo cluster, possiamo affermare che basta una il numero di utenti che si posizionano nelle classipiccola variazione percentuale di attivazioni per poter contigue.raggiungere un numero elevato di carte vendute.
  • 24. SEGMENTAZIONE DELLA CLIENTELA (6) 23 Descrizione cluster “Privati”Nella categoria Privati vengono collocati quei clienti che fanno ampioutilizzo dei prodotti di risparmio della banca, quali: conto risparmio(mostrato nel seguente grafico ), depositi a breve-lungo termine, ecc.Tale segmento, come gli altri appena analizzati, ha registrato un L’età media in questo caso si alza molto, infatti cresconotasso di nuove attivazioni bassissimo. Dato l’esiguo numero di le fasce d’età più anziane. La spiegazione di ciò puòcomponenti, e le loro caratteristiche, ci sembra poco essere legata al fatto che, di solito, è la classe più anzianainteressante sviluppare una strategia indirizzata ad aumentare di una popolazione ad essere più spinta al risparmio (adl’attrattività, per questi utenti, del prodotto carta di credito. esempio per coloro che si avviano all’età pensionabile).
  • 25. FASE 1: MODELLAZIONE 24 Questa fase si compone di due step:STEP 1  Modelli di classificazioneSTEP 2  Modelli di associazione
  • 26. MODELLI DI CLASSIFICAZIONE 25Terminata la preparazione del DB, si è passati alla modellazione. Innanzitutto è stato costruito, attraverso alcunedelle tecniche a disposizione, un algoritmo di classificazione.Il procedimento di anali svolto è composto da 4 passi: Selezione delle variabili chiave Bilanciamento della variabile New_Credit_Card_Flag Selezione dei modelli migliori Addestramento e Test
  • 27. MODELLI DI CLASSIFICAZIONE (2) 26 Selezione delle variabili chiaveAttraverso il nodo Seleziona Variabili si è proceduto alla determinazione dei campi più interessanti, di cui tenerconto, per la creazione dei modelli.Sono state, quindi, selezionate le seguenti variabili:Come si può vedere dalla tabella, si è tenuto in considerazione solo quei campi che nella colonna valoreraggiungevano il 95% di confidenza, data la variabile obiettivo (New_Credit_Card_Flag). I restanti campi sono statimessi da parte attraverso il nodo Filtro.
  • 28. MODELLI DI CLASSIFICAZIONE (3) 27 Bilanciamento della variabile New_Credit_Card_FlagDato che il campo obiettivo era troppo sbilanciato per poter sviluppare correttamente i modelli, si è resonecessario l’utilizzo del nodo Bilanciamento per ovviare a tale problema.Il procedimento è stato il seguente:
  • 29. MODELLI DI CLASSIFICAZIONE (4) 28Selezione dei modelli miglioriSuccessivamente, grazie al nodo Classificatore modelli, abbiamo identificato le tecniche più valide per poter effettuare laclassificazione. In pratica: Il classificatore – sulla base dei parametri impostati e dei modelli spuntati (vedi grafico qui di fianco) – ha selezionato tra tutti il C5.0, la Regressione logistica e la discriminante lineare. Il migliore in assoluto, evidenziato nel riquadro rosso, risulta essere il C5.0: questo, infatti, sembra ottenere risultati ottimali in tutti i parametri di selezione.
  • 30. MODELLI DI CLASSIFICAZIONE (5) 29AddestramentoInfine, sono stati generati due supernodi: uno per l’Addestramento delle tecniche migliori e l’altro per il Test. Per ognuno di essi vengono riportati ilgrafico del lift e le tabelle di analisi (per eventuali approfondimenti visionare lo stream Modelli di classificazione). Come si può notare sia il grafico chela tabella, riportati nella slide, dimostrano la miglior capacità classificatoria del modello albero decisionale C5.0 – cerchiato in rosso il dato che ciindica il livello di precisione nella stima (molto più accurata rispetto agli altri due casi).
  • 31. MODELLI DI CLASSIFICAZIONE (6) 30 Anche per quanto riguarda il test, il modello C5.0 risulta essere quello migliore: sia per quanto riguarda il lift che per ilTest livello di precisione (cerchiato in rosso).
  • 32. MODELLI DI CLASSIFICAZIONE (7) 31Una volta selezionato il modello più accurato, possiamo proseguire con l’analisi dell’output da esso prodotto.Per prima cosa verifichiamo l’importanza dei diversi predittori. Si può notare dal grafico che il peso maggiore viene assunto dai campi ATM_transaction e Branch_transaction; hanno una discreta importanza anche le variabili Saving_amount e Internet_transaction.
  • 33. MODELLI DI CLASSIFICAZIONE (8) 32Dall’analisi dell’albero sono risultati essere di grande interesse i seguenti nodi: Questo primo nodo è molto utile per verificare l’importanza assunta dalla frequenza di operazioni compiute tramite la piattaforma web nell’indirizzare un cliente ad attivare una carta di credito. Dalle tabelle possiamo notare che tale variabile, pur essendo di grande peso non fornisce spunti rilevanti; infatti, sia che le internet_transaction siano maggiori a 0 che uguali a 0, un gran numero di clienti ha richiesto la carta. Infine, è necessario fare attenzione alla percentuale cerchiata in rosso nel nodo 116 perché, anche se essa ci segnala che il 97% di clienti hanno attivato la carta, il peso ad esso attribuito è comunque irrilevante (5,835%).
  • 34. MODELLI DI CLASSIFICAZIONE (9) 33 La sezione dell’albero riportata in questa slide sembra abbastanza complessa ma in realtà è di grande aiuto. Innanzitutto, indica che nelle due fasce d’età più giovani della clientela (dai 18 ai 65 anni) si sono verificate un gran numero di nuove attivazioni (da notare che il peso del nodo è ancora elevato 35,812 %). Sempre con riferimento alla fascia d’età sopra indicata, in questo livello si vuole mettere in risalto il dato relativo al numero consistente di attivazioni che sono state realizzate da: clienti della BancaX con una tenure maggiore ai 9 mesi (e quindi clienti abbastanza consolidati – peso del nodo 17,464%). Buona la percentuale di attivazioni nel caso di tenure inferiore a 9 mesi, anche se in questo caso il peso del nodo è poco significativo. Infine, in riferimento ai clienti di fascia 18-24 con un buon livello di storicità e che posseggono un conto corrente si rileva l’informazione più interessante in termini qualitativi; infatti, tra questi, sia coloro che posseggono un conto corrente con importi elevati che – in particolar modo – quelli con importi contenuti (se non negativi), fanno registrare percentuali di attivazione di nuove carte di credito elevate (attenzione però al peso del nodo 66 che è pari solo 1,938%). Un ultimissima considerazione è collegata alle transazioni attraverso ATM; possiamo notare a questo livello che coloro che possiedono un conto corrente (in questo caso con un saldo contenuto) e fanno un uso assiduo degli sportelli automatici per le proprie transazioni, hanno sovente attivato una nuova carta.
  • 35. MODELLI DI CLASSIFICAZIONE (10) 34Come abbiamo accennato in precedenza, tali modelli possono essere utilizzati anche per analizzare i clusters chesembrano più interessanti. Proprio per questo motivo, il C5.0 è stato lanciato anche sul segmento dei “Dormienti”; irisultati ottenuti – attraverso lo stream riportato in questa slide – hanno però condotto ad una soluzione che siavvicina moltissimo a quanto verificato per l’intero campione, questo perché il cluster in oggetto è composto da circa40.000 clienti.
  • 36. MODELLI DI ASSOCIAZIONE 35Per confermare alcune delle evidenze emerse in precedenza, grazie agli output dei modelli di classificazione, e acompletamento dello studio in questione, abbiamo utilizzato alcune delle tecniche di associazione utili per losviluppo di una Market Basket Analysis.Lo stream del procedimento attuato è il seguente:
  • 37. MODELLI DI ASSOCIAZIONE (2) 36Per prima cosa sono state selezionate le variabili di partenza. Con l’ausilio del nodo Tipo è stato assegnato, ai campiflag creati in precedenza (vedi slide 16), il ruolo sia di input che di obiettivo – passaggio necessario per poter lanciarecorrettamente una MBA. Agli altri campi presenti nel DB è stato assegnato il ruolo nessuna, cioè non sono stateprese in considerazione.
  • 38. MODELLI DI ASSOCIAZIONE (3) 37Il nodo Web è stato molto utile per comprendere, prima del lancio di qualsiasi modello, quali fossero le relazioni piùforti tra le variabili input. Il grafico mette in evidenza alcune relazioni poco rilevanti e facilmente intuibili, come ad esempio la relazione tra Saving_amount e Branch_transaction. Molto più interessante è il legame tra Current_amount e ATM_transaction, infatti è già più volte emerso che chi di solito possiede un c/c fa sovente operazioni su ATM. Le altre relazioni non sembrano fornire spunti utili ai nostri scopi.
  • 39. MODELLI DI ASSOCIAZIONE (4) 38In seguito, è stata sviluppata una MBA attraverso l’attuazione di due tecniche: 1) Apriori; 2) Carma; i loro output hanno fornito insostanza gli stessi risultati. Quanto riscontrato in precedenza, grazie al nodo Web, viene ampiamente confermato in questa tabella. Infatti, se si classificano le relazioni antecedente- conseguente sulla base del lift, vediamo che il legame migliore è registrato tra le operazioni su conto corrente (antecedente) e l’utilizzo di sportelli automatici per le transazioni (conseguente); anche il supporto della regola e il livello di confidenza sono mediamente accettabili.
  • 40. MODELLI DI ASSOCIAZIONE (5) 39Come anticipato, la tecnica Carma offre risultati del tutto analoghi alla variante utilizzata in precedenza.Inoltre, per questo secondo caso, il livello ottimale del lift nella relazione tra Current_amount eATM_transaction viene confermato anche se queste due variabili invertono il loro ruolo di antecedenti econseguenti.
  • 41. FASE 4: IMPLICAZIONI 40STEP 1  FindingsSTEP 2  Implicazioni manageriali
  • 42. FINDINGS 41Prima di passare alle implicazioni finali, è opportuno riportare in questa slide alcuni dei punti chiave emersi dallostudio:È stato rilevato che vi è un segmento della clientela molto rilevante, i Dormienti, che si componeprincipalmente di utenti giovani e maturi (fascia 24-65 anni), e che usufruiscono mediamente poco dell’offertaattuale. Questi, forse, sono alla ricerca di un prodotto più flessibile che soddisfi, in pratica, la loro esigenzaquotidiana di realizzare operazioni bancarie di piccolo calibro.L’utilizzo della carta per l’e-banking è abbastanza frequente ma, diversamente da come si potrebbe ipotizzare,l’incidenza di questo fattore nello spronare il cliente all’attivazione della carta è molto contenuta.Il numero di nuove attivazioni è più elevato per le prime fasce d’età del campione, e cioè “18-23”/“24-65”.Questo sta ad indicare che il cliente che utilizza una carta è tendenzialmente abbastanza giovane, e quindi piùaddicted nell’utilizzo di canali innovativi (come le Application per cellulari) e più attratti da nuove formulepromozionali. Per i possessori di un C/C, soprattutto con saldi non troppo elevati, si è spesso verificata la predilezione ad utilizzare gli sportelli automatici. Questo dato è molto interessante se si pensa alla possibilità di creare per questi clienti uno strumento che gli consenta di realizzare le loro classiche operazioni (versamenti, bonifici, ecc.), che solitamente vengono effettuate allo sportello, presso gli ATM o attraverso i canali innovativi indicati in precedenza.
  • 43. IMPLICAZIONI 42Riassumendo, per spingere la clientela – in particolare i cosiddetti dormienti – ad attivare nuove carte di credito,serve un prodotto che sia: giovane, flessibile, che offra una serie di servizi aggiuntivi ed innovativi e chepermetta di evitare le lunghe attese allo sportello per effettuare le classiche operazioni bancarie (ad esempio, ibonifici).La soluzione è stata proposta, ultimamente, da UBI Banca:La carta Enjoy è una carta di credito dotata di codice IBAN che permette di effettuare svariate operazioni bancarie eprevede un gran numero di servizi aggiuntivi al cliente. Insieme alla carta viene offerto anche uno smartphoneSamsung che congiuntamente ad essa permette di sfruttare il nuovissimo canale dello Smartbanking
  • 44. IMPLICAZIONI (2) 43Cosa offre la carta???Uno strumento del genere sembra soddisfare tutte le finalità che avevamo previsto, riuscendo in maniera rapida econ un investimento ridotto ad attirare quei clienti che cercano, ormai da tempo, una banca – diversa dallaconcezione classica di istituto finanziario (un ente solido ed affidabile) – che si adatti alle loro esigenze: cioè quelledi una società che evolve sempre più rapidamente e i cui bisogni sono sempre più differenziati.

×