Assignment Advance Quantitative Methods Casolat

799 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
799
On SlideShare
0
From Embeds
0
Number of Embeds
8
Actions
Shares
0
Downloads
14
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Assignment Advance Quantitative Methods Casolat

  1. 1. Advanced Quantitative Methods Course Assignment: Analisi di Segmentazione Classica “CasoLat” Gruppo “XYZ” Milano, 11 Maggio 2010 Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini
  2. 2. Indice 1. Obiettivo dell’analisi di segmentazione classica e descrizione del set di dati considerati (CasoLat); 2. Analisi preliminare e statistica descrittiva; 3. Analisi fattoriale (per l’individuazione di tali macro-elementi); 4. Analisi Cluster (per l’individuazione dei diversi segmenti). 5. Conclusioni; Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini
  3. 3. 1. Obiettivo dell’analisi di segmentazione classica e descrizione del set di dati considerati (CasoLat); Il database “dati_Casolat” è relativo ad una ricerca di mercato legata alla percezione ed alla valutazione - attraverso 17 item – del “latte Casolat”. Casolat è un latte scremato fresco da lanciare sul mercato italiano e l’azienda vuole individuare e studiare i segmenti più profittevoli per adottare un’adeguata comunicazione. L’indagine comprende una parte relativa alla valutazione di diverse motivazioni d’acquisto per un latte fresco. Gli item da valutare su una scala di importanza soggettiva da 1 a 9 (1 poco importante—9 molto importante) sono i seguenti: 1. È un latte molto buono, gustoso; 2. E’ un latte che mi dà energia; 3. E’ un latte genuino, naturale; 4. E’ un latte che fa bene alla salute; 5. E’ un latte di qualità superiore; 6. E’ un latte dissetante; 7. E’ adatto ai bambini; 8. E’ sicuro e controllato; 9. Ha un buon rapporto qualità/ prezzo; 10. E’ facile da digerire; 11. E’ un latte leggero, poco calorico; 12. E’ un latte fresco; 13. Ha una funzione depuratrice dell’organismo; 14. E’ un latte per tutta la famiglia; 15. E’ un latte ideale per la preparazione di alimenti; 16. E’ un latte che mi fa sentire in forma; 17. E’ un latte che mi sazia; Oltre a tali variabili nel database sono presenti anche alcuni elementi utili per la descrizione dei profili/segmenti da individuare in modo da verificarne l’effettiva raggiungibilità per indirizzare la comunicazione in modo adeguato. Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 2
  4. 4. 1. Obiettivo dell’analisi di segmentazione classica e descrizione del set di dati considerati (CasoLat); Con l’analisi di segmentazione classica sintetizzeremo il database della ricerca di mercato a nostra disposizione in macro-elementi di scelta del consumatore su una serie di caratteristiche del latte (17 items di partenza: motivazioni/occasioni d’uso o modalità di comportamento) e successivamente individueremo e costruiremo gruppi omogenei del target rilevante di clienti sulla base dei macro-elementi individuati. L’analisi di segmentazione classica prevede, quindi, la combinazione di due modelli statistici multivariati: • Una analisi fattoriale analisi fattoriale (per l’individuazione di tali macro-elementi); • Una cluster analysis (per l’individuazione dei diversi segmenti). Obiettivo di tale analisi è quello di focalizzare le campagne marketing dell’azienda in funzione degli specifici bisogni dei cluster di potenziali clienti individuati. Domande: a) Si individui e si valuti un modello di analisi fattoriale e si dia un’interpretazione delle componenti principali (o fattori) individuate attraverso l’analisi; b) Si individui e si analizzi un modello di cluster analysis applicato sulla base dei macro-elementi individuati nella parte precedente costruendo gruppi omogenei del target rilevante e si dia un’interpretazione dei cluster ottenuti; c) Si approfondisca l’analisi precedente con i profili socio-demografici dei diversi segmenti ottenuti incrociando l’appartenenza ai cluster con alcune caratteristiche socio-demografiche/anagrafiche del target per verificarne l’effettiva raggiungibilità; 3 Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini
  5. 5. 2. Analisi preliminare e statistica descrittiva: statistica univariata Prima di cominciare con l’analisi del caso, eliminiamo dal database le osservazioni caratterizzate dalla presenza di dati mancanti (attribuzione del valore 0 ad alcuni attributi dell’intervista); le osservazioni passano da 1001 a 906 con un decremento, ritenuto da noi accettabile, del 9,4%. Identifichiamo le caratteristiche fondamentali della distribuzione di ogni singola variabile senza analizzare per il momento le relazioni congiunte con le altre variabili. Le statistiche univariate sui 17 item evidenziano: - valori medi molto elevati: sempre > 6,86; - distribuzioni polarizzate verso valori alti con valori massimi e quartili di ordine 75 sempre coincidenti 4 Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini
  6. 6. 2. Analisi preliminare e statistica descrittiva L’analisi fattoriale studia le interrelazioni tra variabili al fine di trovarne un nuovo insieme, di dimensioni minori rispetto all’originario, che esprima ciò che è in comune fra le variabili originarie stesse. Dal punto di vista statistico, obiettivo dell’analisi fattoriale è individuare un numero ridotto di combinazioni lineari delle variabili originarie, fattori, che spieghino gran parte della varianza delle variabili stesse. Ogni combinazione lineare sarà funzione di tutte le variabili originarie, correlandosi in particolare ad alcune di esse. Le componenti saranno non correlate tra di loro. L’input effettivo della tecnica è costituito dalla matrice di correlazione tra le variabili; più forte è la correlazione, maggiore sarà la capacità di sintesi dell’analisi fattoriale. Dallo studio della matrice e del relativo diagramma di dispersione si potrà dunque cogliere la natura e l’intensità dei legami tra le singole coppie di variabili. La presenza di correlazioni importanti tra alcuni attributi (valori > 0,5 per esempio tra “sentirsi in forma” e “mi da energia”, tra “mi da energia “ e “mi sazia”, tra “è sicuro e controllato” e “è genuino e naturale”…) permette di ipotizzare fin dalle fasi di analisi preliminare un corretto funzionamento del modello di analisi fattoriale. Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 5
  7. 7. 3. Analisi fattoriale (P.C.A.) JMP: Multivariate Principal Components On Correlations Applichiamo l’algoritmo di analisi fattoriale sulle 17 variabili iniziali al fine di stabilire: - Il numero di fattori da considerare; - la varianza spiegata dai fattori di sintesi; - l’interpretabilità del modello. La colonna “percent” riporta la % di varianza spiegata da ciascuna delle nuove componenti individuate dal modello. Il primo fattore (e’ un latte molto buono, gustoso) è quello con varianza spiegata massimo (39.462%), il secondo fattore è quello con varianza spiegata second best (7.251%) e così via in ordine decrescente. Al fine di determinare il numero di fattori da considerare per ridurre la complessità del modello, è utile considerare che una percentuale del 60-70% della varianza spiegata è da ritenersi generalmente accettabile. Nel nostro caso, 7 fattori spiegherebbero il 70,5% della varianza, 6 fattori il 66,58%. Al fine di determinare il numero ottimale di fattori, puo’ risultare di supporto anche una interpretazione del grafico degli auto valori (Scree Plot); in particolare il grafico evidenzia come in corrispondenza di un appiattimento della curva, un aumento di fattori non comporta significativi incrementi della varianza spiegata. Nel nostro caso (eccezion fatta per il passaggio Da 1 a 2 fattori) si riscontrano 2 cambi di pendenza: uno, più significativo, tra i fattori 6-7 ed un altro tra 11-12. Considerando il notevole aumento di complessita’ che comporterebbe utilizzare 11 fattori invece di 7 (a fronte di un aumento di varianza spiegata di soli 14.1%) assumiamo di utilizzare 7 fattori. In ogni caso, le considerazioni relative alla percentuale di varianza spiegata ed alla riduzione di complessità vanno unite, per la scelta del corretto numero di fattori di una analisi di taglio marketing sull’effettiva interpretabilità dei fattori e sulla loro potenziale rilevanza per l’impostazione delle politiche di marketing. Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 6
  8. 8. 3. Analisi fattoriale (P.C.A.) JMP: Principal Components/Factor Analysis Factor Rotation Factoring Method: Principal Components (diagonals=1) How many rotated factors? 7 Rotation Method ‘Varimax’ Esistono infiniti output di analisi fattoriale compatibili con gli stessi dati di input. Questi infiniti output in generale non forniscono interpretazioni del fenomeno pesantemente contrastanti tra di loro, ma differiscono solo marginalmente e nelle aree di ambiguità. Tra gli infiniti output è opportuno pertanto scegliere quelli che meglio mettono in evidenza le correlazioni tra variabili e fattori. Il metodo di rotazione Varimax ha come obiettivo la minimizzazione del numero di variabili che possiedono saturazioni elevate per ciascun fattore. L’applicazione della rotazione Varimax, pertanto, mantiene inalterata la varianza complessiva spiegata dall’insieme dei fattori, 70,54%, ma modifica, massimizzandola, la percentuale di varianza spiegata da ciascun fattore (a titolo di esempio il fattore 1 spiegava da solo il 39,46% della varianza prima della rotazione e risultava correlato con la maggior parte degli item; a seguito di rotazione il fattore 1 passa al 17,65%, la % di varianza rimanente viene “spalmata” sui restanti fattori ed aumenta l’interpretabilità degli altri fattori ). 7 Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini
  9. 9. 3. Analisi fattoriale (P.C.A.) E’ importante inoltre verificare la comunabilità dei fattori, e quindi verificare quale sia la % di varianza spiegata di ogni singolo attributo di partenza. Nel caso in analisi si evidenzia come le singole variabili vengano spiegate con % che variano da un minimo del 55,3% (funzione depuratrice dell’organismo) ad un massimo del 95% (è un latte dissettante) per un valore medio che si attesta sul 70,5%. In sintesi, la complessità è stata ridotta circa del 60% (da 17 variabili a 7 fattori), la % di varianza spiegata è del 70.54% (con una perdita accettabili del 29.458%), la comunalità è sempre superiore al 55.3% (funzione depuratrice dell’organismo). Una eventuale riduzione dei fattori (6 vs 7) comporterebbe sicuramente una diminuzione della complessità ma a fronte di una diminuzione della varianza spiegata complessivamente (da 70,54% a 66,5%) ed in particolare per specifiche variabili (è un latte dissetante passerebbe dal 95% al 60%). Decidiamo, in ottica marketing, di non perdere tale dettaglio e di continuare con 7 fattori. Analizziamo dunque come si comporta il modello a livello di l’interpretabilità analizzando “la matrice dei fattori ruotata”. JMP: Factor Rotation: Varimax 8 Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini
  10. 10. 3. Analisi fattoriale (P.C.A.) Al fine di analizzare l’interpretabilità del modello, verifichiamo i valori assunti dalle singole celle della matrice dei fattori ruotata che evidenziano la correlazione di ciascuna delle 17 variabili di partenza ai 7 fattori considerati rappresentati nelle colonne della matrice. Quanto più forte è la correlazione, tanto più la singola variabile caratterizzerà i fattori ottenuti. Ogni singolo fattore è infatti ottenuto come combinazione lineare di tutte le variabili di partenza per come qui di seguito riportato: F1= b1X + b2X + b3X + ………….+ b14X (questo per tutti i fattori) Prendiamo la matrice dei fattori ruotata e la copiamo in excel. Per trovare/evidenziare le correlazioni forti, evidenzio la matrice dei valori, poi Home Formattazione condizionale Scala di colori. L’analisi della matrice ci permette dunque di meglio caratterizzare i singoli fattori e di “battezzarli” a seconda delle peculiari caratteristiche. Rotated Factor Pattern PER I GRANDI E POTERE GUSTO FRESCHEZZA DIGERIBILITA’ LEGGEREZZA CONVENIENZA PER I PICCINI DISSETANTE 1 È un latte molto buono, gustoso 0,585802 0,350436 0,2046678 -0,090928 0,1499449 0,2731628 -0,058654 2 E’ un latte che mi dà energia 0,744176 0,2256356 0,1760879 0,228521 -0,02402 0,083899 0,1073991 3 E’ un latte genuino, naturale 0,2695219 0,6747949 0,1856965 0,1700758 -0,008683 0,237591 0,0667702 4 E’ un latte che fa bene alla salute 0,4765888 0,3644414 0,2826577 0,2876339 0,2552452 0,0101203 -0,03568 5 E’ un latte di qualità superiore 0,352554 0,5270681 0,3143145 0,0441598 0,1952893 0,1271387 0,0883555 6 E’ un latte dissetante 0,2665588 0,1394061 0,089494 0,1115818 0,0966336 0,09657 0,9062882 7 E’ adatto ai bambini 0,2069754 0,327477 0,7370665 0,1483316 -0,114879 0,0365657 -0,022089 8 E’ sicuro e controllato 0,0716118 0,6388794 0,0270259 0,2552731 0,0406213 0,3953705 0,0669589 9 Ha un buon rapporto qualità/ prezzo 0,1350408 0,1599217 0,1041501 0,0653479 0,1343099 0,8817457 0,0857505 10 E’ facile da digerire 0,1515711 0,2648915 0,0954717 0,7898668 0,2247989 0,0700023 0,0985593 11 E’ un latte leggero, poco calorico 0,1811885 0,1659001 0,0243135 0,2826399 0,813613 0,1583432 0,0799922 12 E’ un latte fresco 0,145896 0,7724745 0,1041005 0,0499222 0,1749021 -0,097142 0,0789353 13 Ha una funzione depuratrice dell’organismo 0,5393826 0,3080208 0,2004226 0,251261 0,019158 0,169298 0,1868149 14 E’ un latte per tutta la famiglia 0,1927008 0,1739135 0,664877 -0,141228 0,4725455 0,0593632 0,1554397 15 E’ un latte ideale per la preparazione di alimenti 0,3657103 -0,060397 0,5631874 0,3833849 0,0558926 0,2221196 0,1430545 16 E’ un latte che mi fa sentire in forma 0,5977278 0,1908682 0,2327479 0,3210368 0,2715298 0,0864465 0,1256479 17 E’ un latte che mi sazia 0,8044785 0,0340663 0,0790655 -0,050381 0,1329641 -0,010319 0,2079367 Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 9
  11. 11. 3. Analisi fattoriale (P.C.A.) L’analisi della matrice ci permette di escludere fenomeni di cross-loading. Non sembrano esistere infatti attributi fortemente correlati a tutti i fattori individuati. Riteniamo dunque che i fattori individuati possano essere considerati come pilastri nel nostro modello (tali pilastri sono tra loro non correlati ed indipendenti; ciascuno di essi, dunque, con media 0 e varianza 1). Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 10
  12. 12. 4. Analisi Cluster I 7 fattori individuati costituiscono la base di partenza della cluster analysis. La cluster analysis è una tecnica di classificazione automatica in gruppi, omogenei internamente e disomogenei esternamente, finalizzata all’identificazione di gruppi di entità (nel nostro caso persone) che condividano determinate caratteristiche (benefici ricercati nel prodotto, attitudini, preferenze…) Nel caso in analisi utilizzeremo una segmentazione per omogeneità (Cluster Diretta, Algoritmo Kmedie). Obiettivo dell’analisi sarà dunque: • Definire il numero di cluster attraverso l’algortimo iterativo delle Kmedia; • Verificare la compattezza interna di ciascun cluster; • Verificare la respingenza esterna di ciascun cluster; • Interpretare e descrivere i cluster (interpretabilità dei cluster). Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 11
  13. 13. 4. Analisi Cluster: a)Ampiezza del Cluster Steps per valutare un buon modello: quanti cluster scelgo? 1 Ampiezza Cluster Regola operativa: evitare cluster < 1-3% oppure > 50-60% dei dati 2 Omogeneità -> Anova Test F 3 Interpretabilità JMP: Analyse Multivariate Methods Cluster Y: metto i 7 Fattori Options: cambio da ‘Hyrarchical’ a ‘Kmeans’ Number of clusters: primo tentativo con K= 3 Standardize data: YES Iterative Clustering Control Panel Number of clusters: 3. Dopo un determinato numero di iterazioni (46), l’algoritmo converge a soluzione. Un’analisi dei cluster ottenuti evidenzia una ampiezza eccessiva del cluster 3 (519 individui pari al 57,3% del campione). Decidiamo di aumentare il numero di cluster fino ad un numero massimo di 6 e di rilanciare ogni volta l’algoritmo. I risultati evidenziano la presenza di un “Gruppo unico” all’interno dei cluster considerati. La sua ampiezza non tende a diminuire e rimane pressoché costante all’aumentare del numero di cluster. Per prodotti mass-market (quali il latte) è normale trovare un cluster particolarmente consistente, di massa e dunque di difficile caratterizzazione. La scelta ottimale nel nostro caso sembra essere quella di considerare 4 cluster (“cluster 2” in jmp). Un primo tentativo a 5 cluster (“cluster 1” in jmp) aveva dato problemi in fase di interpetabilità. numerosità (% su totale) del cluster più ampio 60,0% 55,0% 50,0% 45,0% 40,0% 35,0% 12 Numero clusters 3 4 5 6
  14. 14. 4. Analisi Cluster: b) Omogeneità interna e respingenza esterna Al fine di verificare l’omogeneità interna e la respingenza esterna dei singoli cluster effettuiamo il test Anova- test F. Il Test F è determinato dal rapporto tra la varianza tra i gruppi e la varianza nei gruppi. Una soluzione di cluster analysis è accettabile quando tutte le variabili mostrano un test F significativo. La soluzione ottima comporta che ogni singolo fattore sia massimamente diverso nei cluster. Vogliamo dunque verificare che, per ogni fattore, sia alta la varianza tra i gruppi e sia bassa la varianza nei gruppi (vogliamo cioè che ogni singolo cluster sia costituito da persone con attitudini di consumo simili). I risultati dell’analisi condotta mostrano, per ogni fattore, prob >F < 0,0001, p-value dunque sempre < 5% e rapporto Test F sempre elevato e significativo. L’interpretazione dei dati statistici evidenzia dunque come i cluster determinati rispettano sia le condizioni di respingenza esterna (diversità tra i cluster, σ2 tra i gruppi ALTA) che quelle di compattezza interna (omogeneità all’interno dei cluster, σ2 nei i gruppi BASSA). Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 13
  15. 15. 4. Analisi Cluster: b) Omogeneità interna e respingenza esterna Tutti i fattori sono standardizzati (e quindi hanno media nulla e varianza uguale a 1). Se le medie non si sovrappongono, i cluster sono massimamente differenziati in termini di un certo attributo. Verifichiamo che per ogni fattore il test F (F Ratio) sia significativo e che i p-value < 5% per tutti i fattori. Per verificare la significatività statistica, si può anche analizzare la rappresentazione grafica dell’intervallo di confidenza. Nel nostro caso entrambe le condizioni sono rispettate. Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 14
  16. 16. 4 Analisi Cluster: b) Omogeneità interna e respingenza esterna E’ importante inoltre verificare la “leggibilità marketing” dei cluster stessi. A tal fine, tanto maggiori saranno i valori assunti dalle medie dei singoli cluster nei confronti dei differenti fattori, quanto maggiore sarà l’importanza di un fattore per lo specifico cluster considerato. A titolo esemplificativo, la media di 0,316 del cluster 1 nei confronti del fattore “gusto” implica che il cluster 1 assegni importanza elevata a tale fattore. Viceversa il cluster 1 non assegna rilevante importanza al fattore “dietetico” (media del -0,51). La matrice delle medie dei cluster sintetizza tali valori ed è di importante applicazione al fine di meglio descrivere ed interpretare i singoli cluster. 15 Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini
  17. 17. 4. Analisi Cluster: c) Interpretabilita’ PER I GRANDI E POTERE Denominazione Cluster NUMEROSITA' GUSTO FRESCHEZZA DIGERIBILITA' LEGGEREZZA CONVENIENZA PER I PICCINI DISSETANTE Cluster 1 218 0,316 -0,046 0,212 -0,882 -0,514 -0,674 -0,101 Buongustaio 2 129 -1,438 0,559 0,311 0,310 0,345 -0,299 -0,499 Esigente 3 110 -0,370 -1,025 -1,732 0,225 -0,090 0,136 -0,130 Price-oriented 4 449 0,350 0,112 0,230 0,285 0,175 0,381 0,223 Indifferente Esportando la matrice delle medie dei cluster in excel (cluster 2 nel file jmp), è possibile analizzare i valori medi assunti dai singoli fattori rispetto ai differenti cluster (analisi per colonna) evidenziando i valori maggiormente rilevanti.. Buongustaio Esigente L’interpretazione dei singoli cluster verrà in seguito effettuata leggendo riga per riga quali siano i fattori più rilevanti; tale analisi ci permetterà quindi di descrivere e denominare i 4 cluster. Price oriented Indifferente Buongustaio (24,1%): focalizzato sul sapore, sul gusto del prodotto; beve il latte perché gli piace e, probabilmente, ne fa un uso principalmente a colazione (e per questo vuole che il latte lo sazi e gli dia 24% energia); 50% 14% Esigente (14,2%): molto attento alla qualità del prodotto, alla sua freschezza, alla leggerezza ed alla 12% digeribilità (qualità per le quali è disposto a sacrificare il gusto); lo utilizza abitualmente in famiglia (per la preparazione di alimenti, per i bambini…); Price oriented (12,1%): focalizzato sulla convenienza del prodotto, poco influenzato dalla qualità del prodotto. Indifferente (49,6%): cluster molto omogeneo difficile da caratterizzare. E’ interessante evidenziare inoltre come uno dei fattori da noi considerati, “dissetante”, non risulti caratterizzare in particolare nessuno dei cluster determinati (assume importanza solo relativamente al 16 cluster “indifferente”). Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini
  18. 18. 4. Analisi Cluster: c) Interpretabilita’ E’ interessante inoltre comprendere i profili socio-demografica degli appartenenti ai singoli cluster. In particolare, attraverso una analisi di contingenza, è necessario verificare se esiste relazione significativa tra i cluster identificati e le ulteriori variabili descrittive presenti nel database (pack preferito, frequenza di consumo latte fresco, genere, eta’, figli, titolo di studio, shopping online, pratica abitualmente lo sport, legge quotidiani, quotidiano preferito, regione). Nello specifico, 5 attributi socio-demografici risultano significativi (prob>chiQ < 0,05) per i 4 cluster identificati. • Genere (uomo, donna); • Ha figli (si, no); • Professione (studente, pensionato, operaio, libero professionista, insegnante, impiegato, casalinga, altro); • Titolo di studio (scuola media inferiore, licenza elementare, laurea, diploma di scuola media superiore); • Pratica abitualmente sport (si, no). Il test di Pearson sull’attributo “età per classi” ha una prob> chiQu = 0,06 che interpretiamo, con un po’ di flessibilità, come significativa (il valore è infatti prossimo allo 0,05; gli attributi scartati evidenziano invece sempre prob>chiQu> 0,12). • Età (per classi): 18-30, 31-40, 41- 50, 51-60, 61-70. Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 17
  19. 19. 4. Analisi Cluster: c) Interpretabilita’ Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 18
  20. 20. 4. Analisi Cluster: chi compone i cluster BUONGUSTAIO ESIGENTE PRICE - ORIENTED INDIFFERENTE 72,5 % donne 66,6 % donne 65,4 % donne 76,3 % donne Genere 27,5 % uomini 33,4 % uomini 34,6 % uomini 23,7 % uomini Molto frammentata. Le fasce 31-40 (20,27%), La fascia da 18-40 Le fasce 18-30 (25,45%) e Le fasce 18-30 (24,7%) e 41-50 (23,16%) e 61-70 Età (classe) rappresenta 61-70 (24,55%) sono le 41-50 (23%) sono le più (22,27%) sono le più complessivamente il 47% più rappresentate. rappresentate. rappresentate. 65% si 60,47% si 44,5% si 64,37% si Figli impiegato: 20,9% impiegato: 25,2% impiegato: 27,9% casalinga: 30,3% pensionato: 19,1% casalinga: 22% pensionato: 17,8% impiegato: 23,2% casalinga: 13,6% Professione (prime 4) pensionato: 13,8% casalinga: 14,7% pensionato: 14,2% Libero professionista: studente: 11,9% studente: 13,2% studente: 7,6% 12,7% scuola sup.: 49% scuola sup.: 46% scuola sup.: 51% scuola sup.: 48% Titolo di studio (primi 2) laurea:27% scuola inf.: 27% scuola inf.: 23% laurea:31,8% Sport abitualmente 51,8% si 47,3% si 56,36% si 39,87% si Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 19
  21. 21. 5. Conclusioni – strategie di marketing Buongustaio (24,1%): -Prevalentemente donna, impiegata o casalinga con figli, sotto i 50 anni, istruzione media. - Ama il latte saporito, lo beve perché le piace, vuole che sia energetico e nutriente per cominciare bene la giornata. - Advertising consigliato: il latte scremato non possiede le caratteristiche giuste per questo cluster di consumatori (è un latte magro e non saporito, adatto a chi soffre di colesterolo, a chi segue diete ipocaloriche etc) Esigente (14,2%): -Prevalentemente donna (ma sale la percentuale di uomini rispetto al cluster precedente), con figli, sotto i 40 anni, istruzione medio-alta. - molto attento alla qualità del prodotto, alla sua freschezza, alla leggerezza ed alla digeribilità (qualità per le quali è disposto a sacrificare il gusto); lo utilizza abitualmente in famiglia (per la preparazione di alimenti, per i bambini…). - Advertising consigliato: escluderemmo campagne mkt troppo focalizzate su famiglie con bambini piccoli (il latte scremato infatti non è molto nutriente), ci focalizzeremmo su campagne tipo “vita snella”, “cereali special K”. Il cliente esigente è inoltre disposto a pagare premium price e dunque va considerato come cluster di clienti profittevoli. Price oriented (12,1%): è poco influenzato dalla caratteristiche del prodotto; suggeriamo pertanto di non investire in campagne marketing in quanto cluster di clienti sicuramente non profittevole. Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini 20

×