statistica e democrazia

annuncio pubblicitario
TECNICHE DI SEGMENTAZIONE
PER LA PREVISIONE DELLA REDDITIVITÀ DEI CLIENTI
Guido Cuzzocrea, Alberto Saccardi *** CIDER Univ. Bocconi - NUNATAC
Servizio Analisi di Marketing *** CDE - Gruppo Mondadori .
vincitore SUGItalia ’95, Firenze 25-27 Ottobre 1995
winner SEUGI ’96, Hamburg 11-14 Giugno 1996
Abstract
Le reti neuronali non sono uno strumento universale, utilizzabile senza competenze specifiche, per ottenere
la migliore e più rapida soluzione ai problemi più complessi: questa opinione non rappresenta una novità,
così come non è una novità affermare che esistono spesso analogie tra determinate architetture di rete e
modelli statistici. Tutto ciò è tanto più vero quanto più ci si allontana dall’ambito ingegneristico in cui le
reti neuronali sono state sviluppate. Ma allora, pensando ad applicazioni di marketing, quando è opportuno
considerare una rete neuronale? Quali sono, dal punto di vista operativo, i passi da compiere per
progettare e realizzare una rete che fornisca risposte soddisfacenti? Come possiamo avvalerci di
conoscenze e strumenti statistici tradizionali per impostare correttamente l’analisi, selezionare le variabili
esplicative, comprenderne le relazioni e, infine, valutare il margine di errore dei risultati forniti da una
rete? In collaborazione con il Servizio Analisi di Marketing di CDE - Gruppo Mondadori siamo andati alla
ricerca di risposte concrete, affrontando un problema di segmentazione e classificazione dei comportamenti
di un file clienti, con gli strumenti messi a disposizione da SAS System, software per la costruzione di
soluzioni di Business Intelligence.
Introduzione
La CDE - gruppo MONDADORI da anni opera
nel settore della vendita per corrispondenza di
prodotti editoriali. Attualmente si pone sul
mercato con tre Club del libro: il ‘Club degli
Editori’, nato più di trenta anni fa, che si rivolge
ad un target molto vasto e poco caratterizzato; ‘Il
Circolo’, il club più prestigioso, che promuove
un genere di lettura altamente qualificato; il
‘Club per Voi’, che si rivolge ad un target più
contenuto di lettori non tanto attenti alla novità,
ma che considerano il prezzo come fattore
premiante.
Il reclutamento dei soci avviene tramite
l’adesione ad un’offerta che, per poter catturare
anche l’attenzione di quegli individui restii ad
acquistare per posta, deve essere molto
promozionale. Tale adesione non permette di
distinguere
il
socio
interessato
solo
all’appetibilità del lancio promozionale, dal socio
veramente interessato alla lettura. Infatti solo
quest’ultimo, con molta probabilità, continuerà
ad ordinare dai cataloghi che gli verranno spediti
mensilmente.
L’obiettivo dell’analisi è prevedere nel minor
tempo possibile il comportamento del cliente e,
conseguentemente, valutarne la redditività
prospettica. Indicazioni corrette di questo tipo
consentirebbero d’investire sul target desiderato
di soci, oltre a fornire chiavi di lettura per
applicare strategie di marketing differenziate. In
sintesi lo studio si propone di incrementare la
redditività aziendale.
L’introduzione in CDE di SAS SYSTEM,
avvenuta nel 1994, ha rappresentato una svolta di
notevole rilevanza, valorizzando le più avanzate
tecniche statistiche. Nel 1995 vengono
approcciate le reti neuronali per la previsione
della redditività dei soci de ‘Il Circolo’.
1. Il funzionamento dei Club del libro
La CDE offre al socio 13 cataloghi all’anno, di
34 pagine ognuno, con circa 100 titoli tra cui
almeno 10 novità ed il libro mese, un’opera di
rilievo individuata da esperti editoriali. Tutti i
libri presenti in catalogo vengono brevemente
introdotti e commentati per facilitare la scelta,
inoltre sono scontati del 20% e più rispetto alle
edizioni presenti in libreria.
L’unico impegno richiesto al socio è di acquistare
almeno tre libri all’anno per non essere sospeso;
tuttavia può disdire l’associazione al club in ogni
momento.
2. La banca dati
Le informazioni a disposizione per svolgere
l’analisi sono di diverso tipo. Occorre distinguere
le variabili legate alla semplice anagrafica di un
individuo, da quelle che si raccolgono dal
momento della sua adesione ad un club.
1
Tra le prime vi sono variabili sociodemografiche, quali l’area geografica, il c.a.p. e il
sesso; variabili riguardanti la provenienza
dell’anagrafica come l’appartenenza ad una o più
liste compilate oltre alle informazioni relative
agli abbonamenti ai periodici Mondadori. Tra le
seconde, il canale di reclutamento (direct mail,
stampa, member-get-member); le variabili
commerciali (ordini, rifiuti, pagamenti, resi,
sconti, omaggi); i generi di lettura ed infine
l’elasticità rispetto alle promozioni.
Il lavoro è stato svolto considerando l’insieme
informativo riguardante i soci de ‘Il Circolo’.
Fig. 1
LA BANCA DATI
Liste di
provenienza
Abbonamenti
a testate
Anagrafica
Soci
Anagrafica
Prodotti
Proposte rifiutate
Adesioni passive
Ordini
In particolare, la redditività consolidata di clienti
dopo i primi otto cataloghi di vita è la variabile
obiettivo dello studio.
Tale variabile è di natura continua. La finalità del
progetto è prevedere l’appartenenza di un socio
ad alcune classi di redditività consolidata.
Quindi, a livello di analisi, la redditività è stata
introdotta sia come variabile quantitativa
continua, sia come variabile categorica. Infatti,
dal punto di vista degli algoritmi di rete, si può
lavorare direttamente sulle classi individuate
oppure effettuare la previsione sul continuo per
poi valutare il margine di errore rispetto alle
classi di riferimento.
In particolare, riguardo la categorizzazione della
redditività consolidata, si sono costruite quattro
modalità in base a valutazioni di natura
economica.
2.3 Le variabili esplicative
Ai fini dell’utilizzo delle reti neuronali in
ambiente SAS si è dovuto organizzare la base
dati iniziale in modo da avere un record per unità
statistica, oltre a trasformare le variabili di natura
categorica in insiemi di variabili booleane.
3. La realizzazione del progetto
2.1 Il campione
Il problema della segmentazione e classificazione
dei clienti impone di analizzare coorti di soci
omogenee rispetto all’anzianità raggiunta, ove
per anzianità si intende il numero di cataloghi in
calendario dopo il primo ricevuto.
Si sono quindi considerate le coorti che hanno
aderito a ‘Il Circolo’ nell’intervallo temporale 1
Gennaio 1994 - 30 Giugno 1994 e che hanno
compiuto otto periodi di anzianità entro il 31
Marzo 1995. In questo modo al 31 Agosto 1995,
ultimo aggiornamento disponibile della banca
dati al momento dell’analisi, tutte le partite
aperte, relative ad eventuali pagamenti in
sospeso, possono considerarsi chiuse.
Da questa popolazione si è estratto un campione
casuale semplice con passo 1 / 10.
2. 2 La variabile obiettivo
La redditività del singolo socio viene misurata in
base ad un conto economico che contrappone
l’importo complessivo pagato ai costi determinati
dall’offerta introduttiva, dai cataloghi inviati,
dagli investimenti in promozioni (sconti, omaggi
editoriali, offerte fedeltà) e dai volumi resi o non
pagati.
3.1 Perchè le reti neuronali
Oltre alla curiosità di sperimentare uno strumento
relativamente nuovo e di dichiarata potenzialità
nell’ambito dell’analisi di dati, i motivi che ci
hanno suggerito l’utilizzo delle reti neuronali
sono sostanzialmente i seguenti:
1. la necessità di risolvere un problema di
previsione e di classificazione avendo a
disposizione
un
insieme
informativo
consistente e complesso;
2. la disponibilità di Software in ambiente SAS.
Riguardo la corretta previsione dell’appartenenza
ad alcune classi di redditività, la complessità è
dovuta
al
numero,
alla
natura
e
all’interconnessione tra le variabili esplicative,
complessità tale da far ipotizzare insufficiente la
capacità predittiva di un qualunque modello
statistico tradizionale.
Riguardo la disponibilità di Software, esiste,
all’interno dell’ambiente SAS System, la
possibilità di addestrare numerose architetture di
reti neuronali (tra cui le MLPs, multilayer
perceptrons),
specificandone
tutte
le
caratteristiche oppure lasciando che il sistema
operi le scelte secondo opzioni preimpostate.
2
Con particolare riferimento alle reti MLPs, la
difficoltà di utilizzo dello strumento informatico
può essere ridotta al punto di specificare soltanto
l’elenco e la natura delle variabili di input e della
variabile obiettivo. In questo caso il sistema
addestra una rete con numero di neuroni e strati
nascosti pari a zero e con funzioni di attivazione,
link, e danno che dipendono dalla natura delle
variabili.
Alternativamente è possibile dichiarare il numero
di neuroni appartenenti ad uno o più strati
nascosti, le funzioni di attivazione del singolo
nodo, quelle di link e la funzione di danno in
base alla quale avviene l’ottimizzazione
dell’algoritmo iterativo.
3.2 Allenamento e test
Le reti neuronali possono essere pensate come
algoritmi iterativi in grado di imparare a
riconoscere, sulla base di un’ampia casistica di
esempi, determinate ricorrenze empiriche. In
questo senso è opportuno separare l’insieme dei
dati a disposizione in due sottocampioni: sul
primo viene allenata la rete, mentre sul secondo
viene verificata la capacità della rete stessa di
generalizzare.
Le unità statistiche appartenenti al campione di
allenamento rappresentano gli esempi da cui
apprendere. Per approssimazioni successive la
rete cercherà di adattarsi ai dati, nel senso di
imparare a ricostruire la variabile obiettivo a
partire delle variabili esplicative. La bontà di
adattamento viene misurata in base ad una
funzione di danno che confronta la differenza tra
i valori osservati della variabile obiettivo e i
valori di uscita della rete.
La validità dell’algoritmo addestrato sul dataset
di allenamento va poi verificata sul dataset di
test. Infatti, è di fondamentale importanza
stabilire se la legge empirica appresa è
sufficientemente generale. Detto in altri termini, è
necessario verificare come si comporta la rete nel
ricostruire la variabile obiettivo considerando
nuove unità statistiche.
Si è quindi suddivisio il campione omogeneo in
due sottocampioni casuali, utilizzando una
funzione per la generazione di numeri aleatori (la
funzione RANUNI, Random Uniform, di
SAS/BASE).
3.3 L’utilizzo delle RETI senza rete
Una volta predisposta la banca dati, individuati il
campione di allenamento e di test, la variabile
obiettivo e l’insieme di tutte le possibili variabili
esplicative, si è tentato un approccio semi-
automatico all’applicazione delle reti neuronali.
Infatti è stato più volte affermato che queste
ultime sono potenti strumenti matematici,
utilizzabili senza avere particolari competenze
statistiche e\o approfondite conoscenze del
fenomeno oggetto di studio.
Abbiamo quindi addestrato alcune architetture
mettendo in input tutte le variabili a disposizione
e in output la variabile obiettivo continua oppure
la categorica.
I risultati ottenuti sono stati piuttosto deludenti,
confermando le aspettative iniziali. Infatti, le
variabili esplicative erano in numero sicuramente
troppo elevato rispetto ai contributi informativi
specifici: oltre 100 variabili delle quali una buona
parte scarsamente significative al fine della
previsione della redditività, altre con contributi
informativi duplicati, molto correlate o,
comunque, fortemente connesse.
E’ apparso subito evidente come il grande
numero di pesi e parametri ridondanti da stimare
determinasse la mancanza di robustezza della
rete. Infatti, se sul campione di allenamento i
risultati potevano considerarsi soddisfacenti, la
verifica sul campione di test forniva, in modo più
che esaustivo, una misura dell’inadeguatezza
dello strumento.
La considerazione precedente è risultata tanto più
vera quanto più complessa era l’architettura di
rete utilizzata: aumentando il numero di neuroni
e\o di strati, a parità di altre condizioni,
migliorava il fit e peggiorava ulteriormente la
capacità di generalizzare.
3.4 Adattamento e capacità di generalizzare
La relazione esistente tra bontà di adattamento e
capacità di generalizzare di una rete neuronale è
riconducibile al concetto di robustezza di un
tradizionale modello statistico: esiste una
relazione inversa tra il numero di variabili
esplicative introdotte e la stabilità del modello
stesso.
Nel caso delle reti neuronali la problematica,
però, è duplice: non solo è importante evitare
l’introduzione di variabili di input non
significative ed in grado di apportare solo
disturbo, è altrettanto importante tenere sotto
controllo la complessità dell’algoritmo. Infatti
maggiore è l’adeguamento al particolare,
ottenibile aumentando il numero di neuroni e
strati nascosti, minore è la capacità di
generalizzare: un vestito commissionato su
misura difficilmente può essere prestato ad un
amico.
3
3.5 La selezione delle variabili di input
Il primo passo da effettuare è quindi ridurre il
numero di variabili in input. Da questo punto di
vista, gli strumenti della statistica tradizionale ci
vengono incontro con le varie tecniche di
selezione di tipo stepwise: algoritmi per la
selezione automatica delle variabili esplicative
rilevanti in un modello di tipo regressivo.
Si potrebbe contestare che tali tecniche sono
disponibili solo nell’ambito dei modelli lineari
generalizzati, mentre con le reti neuronali non
esiste il limite della linearità.
Vi è quindi il rischio di eliminare variabili non
significative a livello lineare, che potrebbero
invece esserlo considerando relazioni di altro
tipo. In realtà, lavorando in ambito multivariato
con un numero di variabili esplicative
sufficientemente grande, questo rischio è
alquanto limitato. Infatti, una variabile poco
significativa in termini lineari potrebbe esserlo di
più in un contesto generale, ma ciò difficilmente
potrà essere vero per una variabile assolutamente
non significativa.
Queste considerazioni non hanno la pretesa del
rigore teorico, tuttavia permettono di formulare
una semplice indicazione pragmatica: le tecniche
di tipo stepwise possono essere di grande aiuto;
per non perdere input preziosi è preferibile
applicarle in modo non troppo restrittivo.
Nel nostro caso abbiamo applicato due processi
di selezione paralleli: uno considerando la
variabile obiettivo continua ed un algoritmo
stepwise applicato ad un modello di regressione
multipla, l’altro considerando le quattro categorie
di redditività ed un algoritmo stepwise applicato
ad un modello di regressione logistica. In
entrambi i casi è stato selezionato un insieme di
15-20 variabili, validate tenendo conto anche
delle preziose indicazioni fornite dal Servizio
Analisi di Marketing di CDE.
Un ulteriore approccio seguito è stato trasformare
l’insieme di tutte le variabili esplicative con
l’analisi delle componenti principali, per poi
selezionare le più discriminanti rispetto alle
diverse classi di redditività.
3.6 La scelta dell'architettura di rete
Delimitato l’insieme delle variabili di input,
rimane da affrontare l’importante aspetto
dell’individuazione dell’architettura di rete. Si
tratta di scegliere tra diverse strutture più o meno
complesse, in base al numero di neuroni, al
numero di strati, alle funzioni di attivazione e alle
funzioni di link.
Nell’ambiente di analisi disponibile all’interno di
SAS System esiste la possibilità di utilizzare
metodi di selezione automatici per il numero
ottimale di neuroni. Limitatamente al caso di un
solo strato nascosto, è possibile effettuare un
confronto automatico tra architetture con uno,
due, tre o più neuroni, indicando quella che ha
fornito i migliori risultati.
Abbiamo utilizzato queste opzioni automatiche
sia nel caso della variabile obiettivo continua, sia
con le classi di redditività. Nel primo caso il
numero di neuroni selezionato è pari ad uno,
mentre nel secondo, due neuroni sono la scelta
ottimale.
Fig. 2
ARCHITETTURA DI RETE (A)
Input
Observed
X1
X2
Hidden layer
Y
....
....
Predicted
Xn
Successivamente si sono considerate architetture
di rete a più strati. I miglioramenti ottenuti dal
punto di vista del fit (bontà di adattamento) sono
stati scarsi, mentre si è registrato un netto
peggioramento della capacità predittiva. Anche in
questo caso l’eccessiva complessità della rete
determina una notevole perdita di robustezza.
Per quanto riguarda le funzioni di attivazione,
link e danno va detto che la scelta deve tener
conto della natura delle variabili di input, della
variabile obiettivo e del tipo di problema
affrontato.
Dunque, la costruzione di una architettura di rete
dovrebbe essere guidata da considerazioni di
natura applicativa da un lato e statisticomodellistiche dall’altro. Per dare senso concreto a
questa affermazione, ecco come abbiamo
costruito la rete che ha prodotto i migliori
risultati.
Innanzitutto, se la decisione è quella di lavorare
direttamente con una variabile obiettivo di tipo
classificatorio e le variabili di input sono di
natura quantitativa, bisogna riconoscere che
quello da risolvere è un problema di analisi
discriminante.
4
La possibilità di introdurre uno strato di neuroni
nascosti permette di superare la linearità delle
relazioni, pur utilizzando i classici strumenti dei
modelli lineari generali. Poichè si deve effettuare
l’assegnazione a quattro classi di redditività, due
neuroni paralleli, che possano funzionare da
semafori,
massimizzano
la
capacità
discriminante. Di conseguenza, le funzioni di
attivazione sui singoli neuroni non possono che
essere logistiche, mentre quella sulla variabile
categorica obiettivo è di tipo logistico
multinomiale. Per la loss function sulle classi di
redditività, si può dire che l’assegnazione, se
corretta, generi un successo, altrimenti un
insuccesso (funzione di danno mbernoulli).
Fig. 3
ARCHITETTURA DI RETE (B)
Input
X1
Observed
Hidden layer
1
X2
....
1
....
Xn
0
1
0
0
Predicted
3.6.1 La valutazione dell’errore di previsione
Dati gli obiettivi del progetto, è di primaria
importanza concentrare l’attenzione sulla bontà
di previsione dello strumento proposto.
Applicando ciascun algoritmo di rete al campione
di test, abbiamo valutato i margini di errore
rispetto ad una tabella di contingenza 4x4:
redditività osservata in classi incrociata con
redditività prevista.
Esistono diversi indici di connessione sintetici
per valutare la bontà di classificazione rispetto
alla tabella di contingenza data. L’errore globale
di errata classificazione dipende dal numero di
casi al di fuori della diagonale principale sul
totale dei casi considerati: una misura di
quest’errore potrebbe essere semplicemente il
rapporto tra queste due frequenze.
L’utilizzo dello strumento in termini operativi
suggerisce un diverso criterio di valutazione. Il
reparto Servizio di Analisi di Marketing
considera profittevoli i soci che hanno
consolidato una redditività superiore al valore
mediano della distribuzione: in questi termini, la
misura dell’errore può essere determinata rispetto
ad una tabella di contingenza 2x2, sempre
rapportando le frequenze al di fuori della
diagonale principale rispetto al numero totale dei
casi.
Con l’obiettivo di costruire una valutazione
dell’errore ancor più connessa al risultato
economico dell’azienda, si potrebbe far
coincidere la misura dell’errore con la risposta
alla domanda: se smetto di investire sui clienti
classificati come non redditizi dalla rete, qual’è il
rischio di perdere soci buoni?
Volendo invece avere una misura del vantaggio
dell’utilizzo
dello
strumento,
potremmo
concentrarci sulla distribuzione subordinata della
redditività osservata in corrispondenza di una
previsione positiva: sul totale dei soci che la rete
assegna alle classi redditizie, quanti vi
apparterranno davvero rispetto al 50% che si
verifica spontaneamente?
3.6.2 Le prove di simulazione
Per ottenere una giustificazione statisticamente
significativa dell’architettura di rete rispetto alle
misure di errore precedentemente definite e,
contemporaneamente, validare l’intero processo
di costruzione, abbiamo effettuato numerose
prove di simulazione in base alla logica delle
tecniche di ricampionamento. In ogni prova
avviene una riestrazione casuale dei campioni di
allenamento e di test. Quindi si addestra e si
sottopone a verifica la rete, memorizzando ad
ogni passo i margini di errore ottenuti.
Per ciascun tipo di rete si sono considerati i
risultati sintetici di 100 prove di simulazione.
4. I risultati
Prima di presentare nel dettaglio i risultati
ottenuti, richiamiamo brevemente i principali
obiettivi del lavoro.
Innanzitutto si voleva progettare uno strumento
che consentisse di prevedere la redditività dei
clienti acquisiti, in modo da meglio orientare le
politiche d’investimento promozionale su
catalogo.
In secondo luogo, riducendo l’insieme di
variabili esplicative alle sole informazioni da non
socio, si volevano ottenere buone indicazioni per
la selezione dei migliori prospect per il Direct
Mail.
In conclusione, il raggiungimento dei sopra citati
obiettivi garantirebbe un miglioramento della
redditività complessiva.
4.1 La redditività del socio prevista in base ai
primi comportamenti
5
La rete che ha fornito i migliori risultati,
considerando la redditività come variabile
continua, è quella costituita da un solo neurone e
da un unico strato nascosto. Questa architettura,
come W.S. Sarle fa notare in un suo articolo del
1994, equivale ad una regressione non lineare
multipla.
Analizzando la tabella in figura 4 è possibile
valutare la bontà della classificazione proposta. Il
valore dell’indice Phi=0.884 è indubbiamente
soddisfacente, ma la constatazione più
interessante è relativa al margine di errore che si
commetterebbe smettendo di investire sui soci
previsti poco redditizi: tale errore risulta essere
inferiore all’8%.
Fig. 4
REDDITIVITA' CONTINUA - RETE CON 1 NEURONE
SINTESI DI 100 PROVE DI SIMULAZIONE SUL TEST
Percent
Row Pct
Col Pct
a patto di poter spiegare la maggior
conservatività dello strumento. Dal punto di vista
statistico la domanda che ci si pone è perchè,
considerando la redditività come variabile
continua, sia più probabile commettere errori in
eccesso piuttosto che in difetto, ossia dire che un
socio sarà profittevole erroneamente piuttosto che
il contrario. La forma della distribuzione della
redditività fornisce la risposta: tale distribuzione
risulta, infatti, essere asimmetrica con una coda
più pesante verso destra, provocando, per modelli
basati sui valori medi, una distorsione di
sovrastima dei valori di previsione.
Fig. 6
DISTRIBUZIONE DELLA REDDITIVITA’
1.6
1.4
1
2
3
4
1
3.82
39.39
72.69
1.06
2.61
20.23
0.21
0.83
3.9
0.17
0.68
3.18
2
4.92
50.74
12.44
27.35
67.11
69.1
5.88
23.69
14.86
1.42
5.76
3.59
3
0.73
7.47
2.3
11.81
28.98
37.45
12.91
51.97
40.92
6.1
24.67
19.33
4 Total
0.23
9.7
2.4
0.99
0.53
40.75
1.3
2.24
5.84
24.83
23.51
24.72
17.02
24.71
68.89
72.06
5.26
39.58
31.54
23.62
1.2
1
0.8
0.6
0.4
0.2
0
mediana media
Total
100
Considerando la redditività come variabile
categorica, i migliori risultati si sono ottenuti con
una rete a due neuroni e uno strato, equivalente
ad un modello di analisi discriminante non
lineare. La tabella in figura 5 mostra un errore di
errata classificazione complessivamente inferiore
rispetto al caso precedente, quindi il Phi sale a
0.915. Il rischio di escludere soci buoni è però
del 14%.
Fig. 5
REDDITIVITA' CATEGORICA - RETE CON 2 NEURONI
SINTESI DI 100 PROVE DI SIMULAZIONE SUL TEST
Percent
Row Pct
Col Pct
1
2
3
4
1
4.74
47.11
71.64
1.33
3.27
20.1
0.36
1.48
5.5
0.18
0.74
2.77
2
4.8
47.64
8.82
36.07
88.74
66.37
10.38
42.31
19.1
3.1
12.52
5.7
3
0.26
2.63
1.91
2.64
6.49
19.11
7.04
28.67
50.95
3.87
15.65
28.02
4 Total
0.27
10.07
2.63
1.05
0.61
40.65
1.5
2.41
6.76
24.54
27.54
26.8
17.59
24.74
71.09
69.74
6.62
54.35
13.81
25.22
4.2 La scelta dei Prospect per il Direct Mail
La progettazione di una rete neuronale per la
selezione dei migliori prospect è stata decisa in
risposta ad una chiara esigenza applicativa.
Inoltre, in presenza di patrimoni informativi
poveri, si voleva trovare conferma empirica ad
una ipotizzata maggior efficacia delle reti rispetto
alle tecniche statistiche tradizionali.
Le variabili esplicative a disposizione sono in
questo caso l’area geografica, l’appartenenza a
liste di anagrafiche, gli eventuali abbonamenti a
periodici del Gruppo Mondadori, mentre la
variabile obiettivo ha solo due classi di
redditività: al di sotto ed al di sopra della
mediana.
La miglior performance è stata ottenuta con una
rete ad un solo neurone. Dalla tabella in figura 7
emerge che il 63% dei soci viene classificato
correttamente nella categoria redditizia; questo
risultato, se confrontato col 50% della
distribuzione marginale, è di sicura valenza
applicativa.
Total
100
Considerazioni di natura applicativa indurrebbero
a considerare migliori i risultati della prima rete,
6
Fig. 7
REDDITIVITA' CATEGORICA PER RECLUTAM. - RETE CON 1 NEURONI
SINTESI DI 100 PROVE DI SIMULAZIONE SUL TEST
Percent
Row Pct
Col Pct
1
2 Total
0
26.24
25.23
51.47
50.98
49.02
75.41
38.7
1
8.56
39.97
48.53
17.64
82.36
24.59
61.3
Total
34.8
65.2
100
Successivamente la problematica è stata
affrontata utilizzando tecniche statistiche
tradizionali dell’analisi dei dati. Sulla base di
alcune prove di simulazione, possiamo affermare
che effettivamente, in presenza di patrimoni
informativi piuttosto poveri, le reti neuronali
possono offrire qualche vantaggio.
Come ulteriore indicazione sull’utilizzo delle reti
progettate, possiamo notare (tabella figura 4) che
la conoscenza del comportamento del socio nei
primi due cataloghi aumenta l’efficacia dello
strumento: sul totale dei soci previsti redditizi,
oltre l’80% lo sarà veramente.
5. Conclusioni
Sulla base del lavoro svolto emergono alcune
considerazioni riguardo l’utilizzo delle reti
neuronali in applicazioni di marketing.
In primo luogo la conoscenza del fenomeno e
l’organizzazione del patrimonio informativo sono
di fondamentale importanza: una scelta ragionata
degli input, supportata da criteri statistici, ha il
vantaggio di semplificare ed irrobustire l’analisi.
La definizione di un criterio di misurazione
dell’errore, così come un numero significativo di
prove di simulazione, sono i passi necessari per
validare la bontà di adattamento e la capacità di
generalizzare delle reti progettate.
Date queste premesse, lo strumento è di facile e
versatile impiego. L’ostacolo maggiore risiede
nella difficoltà di interpretare il ruolo svolto dalle
variabili esplicative nella previsione della
variabile
obiettivo.
Questo
aspetto,
probabilmente dovuto a scarsa conoscenza degli
algoritmi di rete, ne limita attualmente l’utilizzo
nei processi decisionali1.
Con specifico riferimento all’ambiente di analisi,
all’interno di SAS System è
possibile
organizzare le proprie banche dati in una logica
di Data Warehousing, nonché sviluppare modelli
per le analisi di marketing e le previsioni basati
sia su tecniche statistiche tradizionali che sui
moderni strumenti di Data Mining. Questa
potenzialità permette di eseguire confronti tra i
risultati in modo semplice ed omogeneo e quindi
individuare i migliori percorsi di analisi.
Dal punto di vista di CDE Mondadori, il risultato
ottenuto, come capacità di prevedere con
notevole tempestività ed accuratezza la
redditività di ogni socio, può essere
vantaggiosamente letto in termini di maggiore
comprensione
delle
esigenze
di
ogni
Prospect/Cliente. Si aprono quindi interessanti
prospettive nella definizione di offerte sempre
più personalizzate, con sicuri benefici anche in
termini di conto economico aziendale.
Bibliografia
Agresti, A. (1990). Categorical Data Analysis,
John Wiley & Sons, New York
Bouroche, J.M. e Saporta, G. (1980). L'analyse
des données, C.L.U. Editrice, Napoli.
Jobson, J.D. (1992). Applied Multivariate Data
Analysis, Springer-Verlag New York.
Sarle, W.S. (1994). Neural Networks and
Statistial Models, SAS Institute Inc., Cary,
NC, USA.
Sarle,
W.S.
(1995).
Neural
Networks
Implementation in SAS Software, SAS
Institute Inc., Cary, NC, USA.
SAS Institute Inc., SAS/STAT User's Guide,
Version 6, Fourth Edition, Cary, NC: SAS
Institute Inc., 1989.
Wasserman, P.D. (1989), Neural Computing
Theory and Practice, New York: Van
Nostrand Reinhold.
Wasserman, P.D. (1993), Advanced Methods in
Neural Computing, New York: Van Nostrand
Reinhold.
1
I più recenti contributi metodologici sono
rivolti proprio all’approfondimento di questa
problematica.
7
Scarica