INDICE DELL’INCONTRO
Analisi di segmentazione per Obiettivi

La segmentazione ad Albero: Chaid

Cenni alle Reti Neurali
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
0
SEGMENTAZIONE PER OBIETTIVI: CHAID
perché la Segmentazione ad Albero?...
Consideriamo per esempio le domande d4-13 tot del file dati
caffarel.sav, vale a dire la spesa che ciascun intervistato sarebbe
disposto a sostenere per acquistare il gianduiotto.
Relativamente alle variabili socio demo possiamo evidenziare delle
differenze significative?
Se consideriamo il gradimento per il prodotto (dom 4_6) e/o per la
confezione (dom 4_7) e/o il percepito per la marca Caffarel (dom 4_10)
e/o per il giunduitto stesso (dom 4_14), quali conclusioni possiamo trarre
relativamente al gradimento complessivo?
Proviamo in base a quanto visto sino ad ora a procedere …… (analisi
bivariate, multivariate – regressione-….)
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
1
SEGMENTAZIONE PER OBIETTIVI: CHAID
Il metodo CHAID permette di analizzare TUTTI gli incroci possibili
evidenziandone solo quelli significativi
Si basa su una procedura iterativa:
1. nella prima fase, la popolazione viene divisa in due o più gruppi sulla
base della variabile esplicativa più significativamente legata alla
variabile dipendente prescelta ;
2. ciascuno
di
questi
gruppi
ottenuti
nella
prima
fase
viene
ulteriormente diviso in sottogruppi più piccoli sulla base delle
rimanenti variabili esplicative. Il processo di divisione termina quando
non
possono
significativi
;
più
i
essere
individuati
sottogruppi
finali
predittori
(segmenti)
statisticamente
vengono
quindi
rappresentati in un diagramma ad albero.
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
2
SEGMENTAZIONE PER OBIETTIVI: CHAID
I segmenti individuati sono mutuamente esclusivi ed esaustivi.
In altre parole, i segmenti non si sovrappongono e ciascuna unità della
popolazione è contenuta in un unico segmento.
Dal momento che ogni segmento è definito da combinazioni delle variabili
esplicative,
è
possibile
(azienda/clienti/prospect)
nel
riclassificare
segmento
ogni
osservazione
appropriato
semplicemente
conoscendo tali variabili
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
3
SEGMENTAZIONE PER OBIETTIVI: CHAID
I segmenti individuati sono mutuamente esclusivi ed esaustivi. In altre parole, i
segmenti non si sovrappongono e ciascuna unità della popolazione è contenuta
in un unico segmento.
Dal momento che ogni segmento è definito da combinazioni delle variabili
esplicative, è possibile riclassificare ogni osservazione (azienda/clienti/prospect)
nel segmento appropriato semplicemente conoscendo tali variabili
Da un punto di vista marketing l’impiego di tale tecnica risulta molto
interessante per “studiare/individuare” sottoinsiemi di clienti – nell’accezione più
ampia del termine – latenti, ossia rappresentati come risultato dell’analisi
congiunta di più variabili.
Esempio: sempre con riferimento al gianduiotto Caffarel analizziamo il prezzo
che gli intervistati sarebbero disposti a spendere
file: dati Caffarel – questionario Caffarel
sintassi: CHAID_DESCRITTIVA.sps
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
4
SEGMENTAZIONE PER OBIETTIVI: CHAID
Esempio: proviamo quindi a rispondere alle domande precedenti
file caffarel.sav,
variabili
d4_13tot d4_6_1- d4_6_7, d4_7_1-d4_7_2, d4_10_1-d4_10_9,
d4_14_1-d4_14_7, UOMO, SIGLE, BAMBINI, LAUREA, MEDIE, età.
Come e perchè ricodificate le variabili socio-demo.
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
5
SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali
Le reti neurali traggono ispirazione dalle scienze biologiche. Si tratta infatti di un’insieme connesso di
unità che agiscono in modo equivalente ad un insieme di neuroni biologici.
L’origine dello studio delle reti neurali si può far risalire alla fine degli anni ‘40, quando D.O. Hebb
propose una legge di apprendimento che sta alla base delle modello di analisi delle reti neurali.
Durante gli anni ‘50 e ‘60 si assistette ad una vera e propria esplosione di studi relativi alle reti neurali,
studi che portarono al Perceptron, che sembrò rappresentare la risposta ottimale alla domanda che
maggiormente stava a cuore dei ricercatori dell’epoca: come poter riprodurre artificialmente
l’intelligenza umana.
In realtà si trattò di una pura illusione; infatti tale modello, il Perceptron, era in grado solo di riprodurre
alcune capacità del cervello umano. Per esempio risultò particolarmente efficacie nelle previsioni
meteorologiche.
Per circa un ventennio le reti neurali restarono un dominio per pochi studiosi almeno fino alla metà
degli anni ‘80; quando grazie ai nuovi algoritmi (Back-propagation, 1986), ma soprattutto allo sviluppo
delle capacità di calcolo degli elaboratori, si tornò a parlare delle possibili applicazioni delle reti neurali.
Le reti neurali sono state originariamente create con l’intento di studiare il comportamento del sistema
nervoso. Come è noto, tale sistema è costituito da un numero elevatissimo di cellule nervose
(neuroni), collegati da connessioni dette sinapsi. Ogni neurone è in grado di eccitarsi e di trasmettere
uno stimolo elettrico in risposta alle combinazioni di stimoli che riceve dagli altri neuroni. La
trasmissione degli stimoli dipende dalla natura delle sinapsi e tale natura si modifica durante la crescita
per effetto dell’apprendimento.
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
6
SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali
La struttura generale
La struttura generale di una rete neurale è costituita da una serie di
nodi di entrata (unità di input), una o più serie di nodi intermedi (livelli e unità
nascoste) e una serie di nodi di uscita (unità di uscita). Qualora non esistano
livelli nascosti si parlerà di percettroni, altrimenti di reti multistrato.
Output
Strato nascosto
Input
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
7
SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali
Un modello di rete neurale viene specificato attraverso 5 caratteristiche:
1. il modello generale del neurone
2. l’architettura della rete
3. la modalità di attivazione dei neuroni
4. il paradigma di apprendimento
5. la legge di apprendimento
1) Il modello generale del neurone: il neurone viene specificato attraverso:
canali di ingresso: sono le fonti di informazioni del neurone;
pesi delle connessioni: riproducono le sinapsi del cervello umano e hanno il compito di
mediare il segnale trasmesso da un neurone ad un altro; w(ij)
funzione di attivazione: associa attraverso una funzione (solitamente una somma) i pesi
e i segnali in arrivo al neurone; NETj =
funzione di uscita: rappresenta il reale valore di uscita dal neurone verso il neurone
successivo (può essere una funzione lineare o no e può contenere un valore di soglia per cui
il neurone trasmette l’informazione solo se tale valore viene superato). OUT = f’(NET)
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
8
SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali
2) L’architettura della rete: è definita in funzione del tipo di neuroni e di
connessioni esistenti fra gli stessi.
Si parla di reti stratificate quando i neuroni sono connessi solo con quelli dello
stato adiacente; viceversa si ha una rete cosiddetta completamente connessa
quando ogni neurone è connesso con qualunque altro neurone della rete. Le più
usate in ambito di previsionale sono quelle stratificate.
RETI MULTISTRATO
In relazione al numero ottimale di strati nascosti in generale 1o 2 strati risultano
più che sufficienti; per quanto riguarda il numero dei nodi per ciascun strato in
letteratura vengono forniti diversi proposte :
- Media tra il numero di nodi di input e nodi di output
- Radice quadrata della somma del numero dei nodi di input e di output
- Metà del numero dei nodi di input
-.... esperienza e soprattutto tante prove!
In generale il secondo livello nascosto ha un numero di nodi superiori al primo.
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
9
SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali
3) La modalità di attivazione dei neuroni: stabilisce il modo in cui i neuroni
vengono attivati.
Esistono due tipologie di attivazione dei neuroni, il modo parallelo (sincrono) in
cui ad ogni istante t i neuroni si attivano e al tempo t+1 modificano il loro stato;
il modo sequenziale (asincrono) in cui i neuroni vengono aggiornati uno alla volta.
In generale la funzione di attivazione è quella funzione attraverso la quale i
neuroni trasmettono le informazioni ricevute dai neuroni “precedenti” (NET = )ai
neuroni “successivi” (OUT = f(NET)).
Le principali funzioni di attivazione impiegate sono quella lineare, quella a soglia,
quella logistica (in assoluto la più usata) la gaussiana e la tangente iperbolica.
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
10
SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali
4) Il paradigma di apprendimento: caratterizza il modo in cui una rete
apprende.
Esistono 3 tipologie di apprendimento: supervised learning (apprendimento con
supervisione mediante esempi), unsupervised learning (apprendimento senza
sueprvisione) e reinforcemente learning (apprendimento mediante rinforzo).
In generale un paradigma di apprendimento può essere definito come:
• inizializzazione dei pesi delle connessioni (casuale)
• sottomissione alla rete di un pattern di input e corrispondente output desiderato
• calcolo del output della rete
• aggiornamento dei pesi
• riproposta del pattern di input fino a quando l’errore non è inferiore ad
prefissato valore.
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
11
SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali
La rete adatta i pesi in funzione della differenza fra il valore di output ottenuto e
quello desiderato
d = Y* - Y
il paradigma è soddisfatto se d è moltiplicato per il valore di ciascun input x(i) e
questo prodotto e aggiunto a ciascun peso.
Negli anni ‘70 e ‘80 viene proposta l’algoritmo di apprendimento per reti
multistrato denominato : Back-propagation
In generale gli strati nascosti vengono addestrati ri-propagando all’indietro
l’errore rilevato sull’output
La funzione di attivazione impiegata è quella logistica (sigmoide) per cui
Δw(ij) = η*δ (j)*x(i)
ove δ è legato alla differenza tra il valore stimato e quello ottenuto dal modello
(errore)
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
12
SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali
Alcune considerazioni relative all’algoritmo della Back-propagation:
• i pesi iniziali, scelti in modo casuale, non devono essere troppo elevati
• è opportuno scegliere un tasso di apprendimento h alto all’inizio per favorire
l’apprendimento diminuendone poi il valore con il procedere della fase di
apprendimento.
• in alternativa si può introdurre un altro parametro (Momentum = a<1) cosicché
il cambiamento dei pesi risulti proporzionale al cambiamento precedente:
Δw(ij) = η*δ (j)*x(i) + α*wn-1(ij)
Per ottimizzare l’algoritmo nel 1987 è stato proposto di normalizzare i dati in
entrata nell’intervallo -1/2;+1/2
La Scatola Nera: il principale limite all’impiego di tale metodologia nell’analisi
dei dati di marketing è legato alla difficoltà di “spiegare” il comportamento di una
rete.
Infatti una volta ottenuta una struttura che sia in grado non solo di “fittare” al
meglio l’insieme dei dati forniti, ma anche di generalizzare interpretando delle
nuove osservazioni, resta sempre il problema di poter valutare il ruolo delle
diverse variabili indipendenti. A differenza delle tecniche statistiche non è
possibile, se non in via approssimata, attribuire un peso alle diverse variabili
esplicative.
2007-2008 Metodi quantitativi per il marketing – Anno Accademico 2007-2008 LIUC
13