INDICE DELL’INCONTRO
Segmentazione per omogeneità:

La Factor Analysis e la Cluster Analysis
Analisi di segmentazione per Obiettivi

Introduzione

Analisi Discriminante
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
0
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Riprendiamo l’ultimo esempio 36 item – considerazioni sul item 37- ….
La Factor Analysis si pone l’obiettivo di condensare e ridurre i dati 
quindi di sintetizzare l’informazione contenuta in molte variabili tramite
pochi fattori sintetici
Il suo uso implica lo studio della correlazione tra le variabili al fine di
trovare un nuovo insieme di dimensioni, i fattori, meno numeroso
rispetto a quello delle variabili originarie, che esprima ciò che è in
comune tra le variabili stesse, perdendo il minor numero di informazioni
rilevanti
Ogni fattore verrà interpretato sulla base delle variabili ad esso correlate
Le applicazioni più frequenti riguardano:
 Uso esplorativo  ridurre il numero di variabili originarie al fine di
facilitare la loro lettura ed interpretazione
 Base preliminare  come propedeutica alla cluster analysis
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
1
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
I dati da raccogliere come input dell’analisi fattoriale, attraverso il
questionario, devono essere di natura quantitativa; in particolare è
opportuno raccogliere valutazioni su scala metrica a 7 o 9 punti (es.
valutazioni di importanza dei diversi attributi di un certo tipo di prodotto nel
processo di scelta)
Ad esempio:
Potrebbe indicare in che misura i seguente attributi sono importanti nelle
sue valutazioni del servizio ?
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
2
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Gli output da considerare:
Matrice delle correlazioni: contiene le correlazioni fra tutte le variabili osservate
e permette di avere una indicazione sui legami fra le variabili osservate. E’
opportuno Valutare i valori assunti dai 2 indicatori:
Indice KMO (Kaiser-Meyer-Olki): costruito comparando i coefficienti di correlazione
con quelli di correlazione parziale. Questo rapporto varia tra 0 e 1. Valori bassi
dell'indice suggeriscono la potenziale inadeguatezza dell'analisi dei fattori, perché le
correlazioni fra coppie di variabili non possono essere spiegate dalla varianza
condivisa dall'insieme delle variabili (ovvero non possono essere individuati fattori
comuni). Kaiser suggerisce che valori al di sopra di 0,7 sono da ritenersi
soddisfacenti, mentre valori al di sotto di 0,5 sono sostanzialmente inaccettabili.
Test di sfericità di Bartlett: utilizzato per verificare l'ipotesi che la matrice delle
correlazioni sia una matrice identità (con 1 sulla diagonale principale e 0 altrove),
ossia che le variabili siano indipendenti. Valori bassi di questo test, e di
conseguenza valori elevati di significatività (maggiori di 0,1), indicano che questa
ipotesi non può essere esclusa e che l'utilizzo del modello fattoriale potrebbe non
essere adeguato.
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
3
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Varianza totale spiegata. Sono riportati in tabella: gli autovalori iniziali
(indicanti fattore per fattore la varianza complessiva spiegata ed usati per
stabilire quali fattori o componenti mantenere nella soluzione); i pesi dei
fattori non ruotati - indicano quanta varianza ogni fattore è in grado di
spiegare prima della rotazione; i pesi dei fattori ruotati - migliora la
leggibilità dell'output Quanti fattori prendere in considerazione? Premesso che con la “sintesi”
effettuata attraverso una factor analysis è chiaramente opportuno perdere il
minor numero di informazioni, la scelta cadrà sul numero di fattori che
cumulativamente sono in grado di spiegare almeno la metà (50%) della
varianza, anche se sono preferibili soglie più alte (60/ 70%).
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
4
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Quanti fattori prendere in considerazione?
..osservare lo screen test
6
4
3
2
1
19
17
15
13
11
9
7
5
3
0
1
Autovalori
5
Sequenze componenti
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
5
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Matrice di componenti. Indica la correlazione dei fattori estratti con le
variabili osservate e permette l’interpretazione dei fattori.
Componente per componente si individuano le variabili con un elevato
indice di correlazione (si considera solo il valore assoluto, poiché interessa
l’entità ma non il “verso” della correlazione) ossia un indice maggiore di
0,5.
In questa soluzione, però, vengono esposte le correlazioni in ordine
gerarchico: il primo fattore sarà quindi quello che “attirerà” la maggior
parte dei coefficienti espressivi delle correlazioni tra le variabili e lo stesso
fattore.
Per avere una visione più chiara e per potere definire il nome di ognuno
dei fattori è preferibile analizzare la matrice dei componenti ruotata,
molto più leggibile ed utile a fini interpretativi.
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
6
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Matrice di componenti ruotata.
componenti sopra esaminata ruotata al
dei fattori. Dopo la rotazione infatti
correlazione di una variabile rispetto ad
La stessa variabile rispetto agli altri
indici di correlazione più contenuti.
Si tratta della matrice delle
fine di migliorare l’interpretazione
è generalmente più marcata la
uno ed un solo fattore.
fattori estratti presenterà invece
In sede di affinamento, si potranno eliminare dall’analisi le variabili che
non “girano” su nessun fattore (cioè denotano coefficienti tutti minori di
0,4) oppure che “girano” su più fattori in modo ambiguo (ad esempio, una
variabile con coefficiente 0,6 su un fattore e 0,4 su un altro).
Nei successivi tentativi è opportuno rilanciare l’analisi escludendo una
variabile per volta. Basta infatti che il modello cambi di una sola variabile
per essere potenzialmente diverso nei risultati.
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
7
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Esempio: file clima, domanda dimp_1-dimp_35
Individuazione obiettivi:
Quanti e quali fattori possiamo individuare?
Quanti cluster individuiamo?
Come li possiamo caratterizzare?
Come possiamo descriverli?
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
8
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Quanti considerare….
1- Analisi autovalori
Autovalori della matrice di correlazione: Totale
= 35 Media = 1
Autovalore
Differenza
Proporzione
Cumulata
1
13.2280932
11.5860867
0.3779
0.3779
2
1.6420065
0.4001979
0.0469
0.4249
3
1.2418086
0.1624509
0.0355
0.4603
4
1.0793576
0.0700202
0.0308
0.4912
5
1.0093374
0.0574494
0.0288
0.5200
6
0.9518880
0.0916451
0.0272
0.5472
7
0.8602429
0.0095734
0.0246
0.5718
8
0.8506695
0.0572741
0.0243
0.5961
9
0.7933954
0.0253405
0.0227
0.6188
10
0.7680549
0.0520441
0.0219
0.6407
11
0.7160108
0.0194733
0.0205
0.6612
12
0.6965375
0.0169880
0.0199
0.6811
13
0.6795495
0.0393844
0.0194
0.7005
14
0.6401650
0.0115826
0.0183
0.7188
15
0.6285824
0.0254145
0.0180
0.7367
16
0.6031679
0.0297036
0.0172
0.7540
17
0.5734643
0.0142771
0.0164
0.7704
18
0.5591872
0.0196923
0.0160
0.7863
19
0.5394950
0.0021112
0.0154
0.8017
20
0.5373837
0.0169369
0.0154
0.8171
21
0.5204468
0.0071291
0.0149
0.8320
22
0.5133178
0.0134595
0.0147
0.8466
23
0.4998583
0.0073720
0.0143
0.8609
24
0.4924863
0.0321139
0.0141
0.8750
25
0.4603724
0.0093219
0.0132
0.8881
26
0.4510505
0.0084124
0.0129
0.9010
27
0.4426381
0.0123683
0.0126
0.9137
28
0.4302698
0.0157585
0.0123
0.9260
29
0.4145113
0.0199593
0.0118
0.9378
30
0.3945520
0.0240569
0.0113
0.9491
31
0.3704951
0.0015858
0.0106
0.9597
32
0.3689094
0.0044933
0.0105
0.9702
33
0.3644161
0.0111604
0.0104
0.9806
34
0.3532557
0.0282325
0.0101
0.9907
35
0.3250232
0.0093
1.0000
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
9
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Quanti considerare….
1- Analisi autovalori anche grafica…. quanti fattori 5,6 o 7 ?
Autovalore
3
2,5
2
1,5
1
0,5
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
10
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Scelti i fattori, cercare di “nominarli”
ATTRIBUTI
che i capi prestino molta attenzione alla formazione dei loro collaboratori
che i capi coinvolgano i collaboratori
che nel mio settore ci sia un clima di fiducia
che i ruoli, funzioni e responsabilita` siano chiari
che ci sia trasparenza sulle direttive aziendali
che i capi forniscano ai collaboratori le informazioni
che ci sia migliore diffusione delle informazioni
poter dialogare con i miei capi
avere occasioni di incontro con il vertice aziendale
avere un sistema di incentivazione basato sui meriti
che i nostri capi siano l'esempio di valori positivi
poter lavorare in modo organizzato
svolgere compiti adeguati alle attitudini
percepire l'utilita` del lavoro svolto
conoscere le reali possibilita` di mantenere il posto di lavoro
che il personale sia selezionato con criteri trasparenti
migliorare la sicurezza sulla strada
che ogni ruolo disponga di strumenti di lavoro adeguati
vivere in ambienti e strutture di lavoro adeguati
avere procedure operative chiare e ben definite
che l'azienda metta la persona giusta al posto giusto
avere con i colleghi rapporti di collaborazione
che i capi sappiano creare il gruppo, fare squadra
che i capi sappiano ascoltare i collaboratori
che ci sia scambio di informazioni tra reparti
che il cliente riceva informazioni precise
che i capi definiscano con chiarezza gli obiettivi del settore
che al personale venga dato maggior potere operativo
essere valutati a tutti i livelli
che i capi vengano scelti sulla base delle loro capacita`
che i capi gestiscano responsabilmente i collaboratori
che gli organici vengano dimensionati adeguatamente
possibilita` di ruotare gli incarichi
poter avere corsi di formazione tecnica e gestionale
avere possibilita` di crescita prof.
FAT1
0,6102
0,6072
0,606
0,6013
0,5887
0,5886
0,5354
0,5125
0,481
0,4783
0,4304
0,4096
0,4046
0,3875
FAT2
FAT3
FAT4
FAT5
0,6564
0,6174
0,6043
0,6029
0,5396
0,5193
0,4683
0,4663
0,6991
0,6533
0,5349
0,528
0,5033
0,3959
0,6095
0,6084
0,5518
0,5234
0,7733
0,5534
0,4405
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
11
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
5 CLUSTER
Cluster
1
2
3
4
5
Variabile
Factor1
Factor2
Factor3
Factor4
Factor5
OVER-ALL
Frequenza
161
350
1114
324
347
Riepilogo dei cluster
Deviazione std Distanza massima
RMS
dal seme
all'osservazione
12.211
79.695
6,350694444
77.928
3,425
33.461
10.309
71.049
6,513888889
72.647
Statistiche per le variabili
STD totale
Within STD
R-quadro
100.000 0.77202
0.405027
100.000 0.70145
0.508826
100.000 0.75645
0.428776
100.000 0.95131
0.096591
100.000 0.77262
0.404098
100.000 0.79526
0.368664
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
Raggio
superato
RSQ/(1-RSQ)
0.680749
1.035.937
0.750627
0.106918
0.678128
0.583941
12
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
6 CLUSTER
Cluster
1
2
3
4
5
6
Variabile
Factor1
Factor2
Factor3
Factor4
Factor5
OVER-ALL
Frequenza
201
327
127
332
252
1057
Riepilogo dei cluster
Deviazione std Distanza massima
RMS
dal seme
all'osservazione
10.703
58.202
6,225
78.161
11.771
78.241
5,902777778
72.638
6,565972222
70.599
3,215972222
33.429
Statistiche per le variabili
STD totale
Within STD
R-quadro
100.000 0.79367
0.371455
100.000 0.70686
0.501444
100.000 0.76907
0.409821
100.000 0.83342
0.306925
100.000 0.73786
0.456748
100.000 0.76942
0.409278
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
Raggio
superato
RSQ/(1-RSQ)
0.590975
1.005.792
0.694401
0.442845
0.840765
0.692845
13
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
6 CLUSTER
Medie dei cluster
Cluster
informazione sicurezza leadership valutazione crescita
1
-0.384373740
2
0.139568666
0.600040459
3
0.514852411
0.345898962
4
-0.213770058
-0.976476618
5
6
-1.642.484.826 -0.123218857
-1.538.803.287 0.616025992
0.402066225
0.244984616
0.447494426
-1.247.039.377 0.122431925
-0.574585027
-2.411.388.477 -0.219319148
-1.366.684.613
-0.146962498
0.068241158
0.867887842
-0.594908125
-0.475087575
0.240585623
0.393314591
0.266555018
0.111287994
0.510270113
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
14
ANALISI DI SEGMENTAZIONE: FACTOR ANALYSIS
Una volta individuata la classificazione migliore si procede a
“qualificare” i cluster individuati in funzione delle variabili disponibili:






Sesso df1
Categoria professionale df2
Eta` df3
Titolo di studio df4
Struttura di appartenenza df5
Finalita` prevalente dell'attivita`dfin
Sintassi su file: clima_fattori_cluster
Descrivi – Analisi Tabelle
Inserire le variabili cluster e df1-dfin come var della tabella
Costruire le tabelle richieste specificando il test e la % per riga o colonna e
percentuale delle celle
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
15
ANALISI SEGMENTAZIONE PER OBIETTIVI
Obiettivo generale è quello di suddividere la popolazione considerata in
sub-popolazioni utilizzando una variabile dipendente conosciuta a priori :
per questo motivo si parla anche di “tecniche di classificazione” ossia quei
processi attraverso i quali si cerca di ridurre la complessita’ di specifici fattori
ambientali (ad es. mercati, concorrenti, consumatori,...) attraverso il loro
raggruppamento in insiemi aventi caratteristiche simili secondo specifici
modelli
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
16
ANALISI SEGMENTAZIONE PER OBIETTIVI
Lo scopo di tali modelli e’ duplice:
o da un lato identificare le variabili che “spiegano” in modo più
significativo
un
determinato
comportamento
cosi’
da
fornire
al
management utili informazioni per l’ottimizzazione delle scelte relative al
marketing mix
o dall’altro e’ possibile date n osservazioni, distinte in due o più gruppi,
stabilire una regola di decisione per assegnare nuove unita ai gruppi,
ciò presuppone l’identificazione di una funzione di classificazione che
separa in modo ottimale i gruppi, per ridurre il rischio di future
classificazioni erronee
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
17
ANALISI SEGMENTAZIONE PER OBIETTIVI
Indipendentemente dal settore in cui opera un azienda (largo consumo, industriale
o servizi) le applicazioni di tali metodologie sono molteplici
Considerando i clienti attuali:
a) studio del grado di conoscenza di un particolare prodotto o azienda;
b) misurazione della customer satisfaction
c) studio di diversi comportamenti d’acquisto relativamente sia alle motivazioni di
scelta sia alle occasioni d’uso di un particolare prodotto/servizio;
d) caratterizzazione dei clienti fedeli;
e) analisi delle preferenze per diverse forme distributive;
f) tipizzazione di particolari comportamenti d’acquisto;
g) all’analisi degli effetti di diversi mix di prodotto/servizio
Considerando i clienti potenziali:
a) individuazione di nuovi clienti;
b) selezione dei diversi mix di prodotto/servizi ottimali per fronteggiare la
concorrenza;
c) studio degli effetti dei diversi mix comunicazionali;
d) analisi della rete di vendita con riferimento sia alla definizione degli obiettivi sia
alla valutazione delle performance
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
18
SEGMENTAZIONE PER OBIETTIVI: DISCRIMINANTE
L'analisi discriminante consente di studiare ed esaminare le differenze esistenti fra
g gruppi (definiti a priori, con g>=2) di n osservazioni, in relazione a diverse
variabili esplicative;
Le informazioni sulle medesime variabili possono anche essere in un secondo
momento usate per classificare opportunamente nuove osservazioni, di cui non si
conosca il gruppo di appartenenza
Perché i risultati dell’ analisi discriminante siano robusti è necessario che quattro
ipotesi fondamentali siano soddisfatte:
1- per ogni variabile esplicativa, le osservazioni devono essere tra di loro
indipendenti
2- le variabili esplicative debbono seguire per ciascun gruppo una distribuzione
normale multivariata (e ciò implica che ciascuna variabile debba essere normale)
3- le varianze delle variabili esplicative per ciascun gruppo dovrebbero risultare
nella popolazione uguali o molto simili
4- per ciascuna coppia di variabili, le covarianze nella popolazione dovrebbero per i
diversi gruppi risultare uguali o molto simili
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
19
SEGMENTAZIONE PER OBIETTIVI: DISCRIMINANTE
In generale è opportuno suddividere il database in due parti, modello e
validazione, al fine di gararantirsi una buona capacità di generalizzazione del
modello
In termini di output consideriamo il principale risultato che è rappresentato
dalla tabella “Risultati della classificazione” consente di esaminare la
validità della soluzione di analisi discriminante.
E’ infatti una tabella a doppia entrata che incrocia l’appartenenza al gruppo
originale con l’appartenenza al gruppo prevista in base alle funzioni
discriminanti
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
20
SEGMENTAZIONE PER OBIETTIVI: DISCRIMINANTE
Esempio: file: dati Caffarel.sav
Analisi questionario, obiettivi
Analizziamo la propensione (“propensione”) ad acquistare il gianduiotto
Caffarel in funzione del gradimento espresso rispetto ad alcuni attributi
D4_6_1--D4_6_7 e D4_10_1—D4_10_9
Esempio - PREDITTIVA: file:discrim_predittiva.sav
Propensione a scrivere NON sostituibile
Var indipendenti: D4ANNO D1TRAT_PER D1NUOVE_PER NUOVEARIMIDEX
TRATTARIMIDEX camp_1
2010-2011 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
21