Focus: la segmentazione di mercato
(scovare i migliori possibili clienti)
Cristiano Toni
docente statistica economica Università Bocconi e Responsabile Ricerche
di Mercato Freedata
1
FreeData
e-marketing & data mining
2
Chi siamo
ƒ FreeData nasce a Milano nel 1993
ƒ FreeData è una società di servizi integrati di
marketing specializzata nel settore IT-TLC.
Le nostre competenze
forniamo servizi unendo tre competenze
fondamentali:
ƒ Database Management
ƒ Data Mining
ƒ Marketing Research
3
La nostra struttura
FreeData è suddivisa in tre principali aree
aziendali:
ƒ Area Statistica
ƒ Call Center
ƒ Area I.T.
4
La nostra struttura
Area Statistica
FreeData dispone di un team altamente qualificato
in grado di applicare le più avanzate tecniche di
analisi statistica.
Collaborazione continuativa con IMQ dell’Università
Bocconi di Milano.
L’ area statistica si occupa di:
ƒ Marketing Research
ƒ Data Mining
5
Le nostre Partnership
FreeData collabora con:
ƒ Università Bocconi
analisi statistiche ed economiche
ƒ compuBase
ƒ Harte-Hanks
list brokering
ƒ Grey Direct
progetti di comunicazione “quantitativa”
6
Innovazione Tecnologica motore della
competitività:
un concetto chiaro a tutti?
7
- Conoscenza solo
sollecitata dei database
- Considerazione di
prodotti di fascia bassa
(Access e in molti casi
semplici fogli elettronici)
come leader del mercato
dei database relazionali
Techincal DM - Grandi Aziende: 1
Technical DM - Medie Aziende: 0,89
Technical DM - Piccole Aziende: 0,64
Business DM - Grandi Aziende: 0,53
Business DM - Medie Aziende: 0,22
CONOSCENZA ELEVATA
VARIABILI PROXY DI
SCARSA CONOSCENZA
CONOSCENZA SCARSA
Conoscenza delle nuove tecnologie
VARIABILI PROXY DI
ELEVATA
CONOSCENZA
- Capacità di fare
confronti fra marche di
database
- Conoscenza spontanea
della Business
Intelligence
- Conoscenza spontanea
degli Application Server
Business DM - Piccole Aziende: 0
Posizione delle figure intervistate lungo il primo asse dell'analisi delle corrispondenze, dimensione rappresentativa
del livello di conoscenza delle nuove tecnologie.
I valori riportati sono normalizzati su una scala da 0 (corrispondente alla figura intervistata con coordinata
minore) a 1 (corrispondente alla figura con coordinata maggiore)
Fonte: FreeData srl
8
Utilizzo delle nuove tecnologie
ƒ Utilizzo di Business Intelligence
ƒ Utilizzo di Application Server
ƒ Utilizzo di ERP
Utilities: 1
Finance: 0,97
PAC \ PAL \ Sanità: 0,93
Industria: 0,81
Altro settore: 0,2
Commercio: 0,01
Altri servizi: 0
Posizione dei settori merceologici delle aziende intervistate lungo il secondo asse dell'analisi delle corrispondenze,
dimensione rappresentativa dell'intensità di utilizzo delle nuove tecnologie.
I valori riportati sono normalizzati su una scala da 0 (corrispondente al settore con coordinata minore) a 1
(corrispondente al settore con coordinata maggiore)
Fonte: FreeData srl
9
FreeData & Oracle Italia
Modello di Ranking
Classificazione delle PMI
10
Idea
Sviluppo di un modello matematico-statistico
che definisca un ordinamento delle aziende
PMI
Obiettivo
Produzione di una classificazione delle aziende
PMI per l’individuazione e l’attribuzione di
Business Opportunities
11
Modelli sviluppati
ƒ Accounted / Not Accounted:
Classifica le aziende PMI in base alle caratteristiche (dimensionali,
settore di attività) delle aziende assegnate da Oracle (aziende A, B,
D). Assegnazione interpretata come approssimazione della
profittabilità aziendale.
ƒ Cliente / Non Cliente:
Classifica le aziende PMI in base alla probabilità di diventare cliente
Oracle, ricavata dall’analisi delle caratteristiche (dimensionali, settore
di attività) delle aziende estrapolate dai dati dei Fiscal Years (20002004).
ƒ Stima valore potenziale azienda:
Classifica le aziende PMI in base alla potenzialità di “spesa
incrementale”, ricavata come differenza fra la spesa potenziale
stimata e la spesa effettiva.
12
Fonti informative
ƒ Database ORACLE GCD
ƒ Sottoinsieme “Aziende Strategiche”
Definizione delle
caratteristiche delle aziende
ƒContabilità Oracle per i Fiscal Years
2000, 2001, 2002, 2003, 2004
Definizione dello stato di
cliente e calcolo della spesa
complessiva con Oracle
13
Modello Cliente / Non Cliente
Risultati:
ƒElevata numerosità di aziende clienti “piccole
dimensioni”: il 64% delle aziende con dipendenti noti hanno
meno di 100 addetti;
ƒRidotto livello di spesa con Oracle delle aziende
clienti “piccole dimensioni”: le aziende con meno di 100
dipendenti contribuiscono “solo” per il 38% al fatturato di
Oracle;
ƒElevata profittabilità delle aziende A, B, D: il primo
modello sviluppato è un buon modello per la determinazione del
potenziale di una azienda
NECESSITA’ DI UN MODELLO CHE STUDI LA
POTENZIALITA’ DI SPESA DELLE AZIENDE
14
Modello di stima del valore potenziale
Obiettivo:
Fornire una stima del potenziale di spesa con Oracle
delle aziende PMI del Database GCD
Variabili esplicative:
ƒ Numero di dipendenti
ƒ Valore del fatturato
ƒ Settore di attività
Totale aziende:
ƒ Circa 135.000 aziende presenti nel GCD, di cui:
- circa 10.000 aziende presenti nel DB di Marketing
- circa 9.000 aziende definite come clienti sulla base
dei Fiscal Years ’00-’04
15
Modello di stima del valore potenziale
Il “peso” del settore di attività:
Per “ragionare” in termini quantitativi è stato calcolata la
penetrazione delle aziende Clienti per Settore di Attività e
Dimensione
In particolare le aziende sono state suddivise in 27 (9 x 3)
Strati Indipendenti:
ƒ 9 Settori di Attività (compreso “non dichiarato”)
ƒ 3 Dimensioni:
9 1-100
dipendenti Æ Small Companies
9 101-500 dipendenti Æ Medium Companies
9 >500
dipendenti Æ Large Companies
16
Modello di stima del valore potenziale
Valutazione e stima dei Missing Values:
ƒ 133.672 aziende presenti nel GCD;
ƒ 26.415 aziende non sono considerate nell’analisi in
quanto non presentano valori per tutte o per due
variabili fra quelle considerate;
ƒ Delle restanti 107.257 aziende, 4.948 hanno un
valore mancante per una delle variabili; per i
dipendenti ed il fatturato, questo viene stimato
tramite modelli regressivi:
Dipendenti = b1 * Fatturato + b2 * Peso_Settore
Fatturato = b1 * Dipendenti + b2 * Peso_Settore
ƒ Le aziende con il settore mancante vengono considerate
come appartenenti ad un settore a se stante.
17
Modello di stima del valore potenziale
Il problema relativo al valore del fatturato:
I valori dei fatturati puntuali presentano
un’enorme disparità dovuta all’utilizzo di diverse
unità di misura
ƒ Per ciascun settore viene calcolata la mediana del
rapporto fatturato/dipendenti Æ rapporto “teorico” per
settore;
ƒ Per ogni azienda viene calcolato il rapporto fatturato/
dipendenti e viene confrontato con quello “teorico”;
ƒ In caso di eccessivo scarto in termini percentuali si procede
alla ridefinizione del fatturato dell’azienda sulla base del
rapporto “teorico”.
18
Modello di stima del valore potenziale
La stima del modello:
Per le aziende clienti di ognuno dei 27 strati
indipendenti viene stimato il modello (combinatorial
approach):
Spesa = α + β1*dipendenti + β2*fatturato
Dal modello più significativo si ottiene una stima per il
potenziale di spesa di ogni azienda delle PMI. Questa
viene “ponderata” per il peso della combinazione
settore – dimensione (proxy della probabilità di
diventare cliente)
Misura di ranking = spesa_stimata * peso
19
Conclusioni
ƒ Il modello determina un ranking per le
aziende PMI che si propone di essere più
efficiente di un ordinamento decrescente per
numero di addetti
ƒ Risulta quindi essere un punto di partenza
per un’attività volta alla creazione di Business
Opportunities
20