I test, le analisi e le ottimizzazioni

I test, le analisi e le ottimizzazioni
I test sono la chiave per migliorare le azioni di
marketing diretto. I test vanno fatti sempre e
sistematicamente. Si testano le liste e anche la
creatività, le offerte ecc. e così si migliora il tiro fino a
raggiungere i migliori risultati possibili ed avere delle
certezze.
Per comparare i test bisogna che solo una variabile
differisca dal test di controllo ; infatti solo così dal
confronto delle redemption,
percentuale dei
rispondenti sull’inviato, si calcolerà un indice,
“l’indice di redemption “ , che indica la % di
incremento o decremento rispetto al test di controllo.
Se ad esempio il test di controllo, posto =100, ha dato
1% di redemption ed il test “nuova creatività” ha dato
l’1,2%, allora l’indice di redemption del “nuova
creatività” sul controllo è 120. Cioè migliora del 20%
i risultati.
Test per verificare se un nuovo subject line di una
dem genera più aperture, se un regalo in aggiunta
all’offerta stimola e di quanto gli ordini, se nuove liste
presenti sul mercato sono più efficaci ecc. ecc.
Il test di controllo è normalmente la classica
offerta/creatività che da anni viene fatta ed in
contemporanea vengono fatti partire i test.
1
Alcune regole di base per fare i test :
1.I test vanno spediti contemporaneamente.
2.Gli indirizzi da una lista vanno estratti a passo 1/n
casuale per costruire il campione del test.
3.In fase di deduplica con altre liste i ( l’extension) ,
i test hanno priorità 1 cioè si elimina il doppio
presente nell’altra lista (extension).
4.La numerosità del test non deve essere meno di
5000 per il mailing postale (la quantità indicata
come ideale è 30000) e meno di 30000 per le
dem.
5.Ribadiamo ancora che solo 1 variabile del test
deve essere diversa rispetto al controllo.
Suggeriamo una tecnica detta a matrice che permette
con un minimo di indirizzi di testare 2 variabili ( qui
ad esempio lista e offerta) e vederne i possibili
incroci. S’immagini di debuttare per la prima volta nel
mercato con un mailing.
Abbiamo 2 offerte e 2 liste che si incrociano come da
tabella qui sotto. Si ottengono 4 combinazioni. Anche
la colonna/riga del totale verrà analizzata con il
vantaggio di avere una numerosità più consistente.
2
Lista A
Offerta A
10000
Offerta B
10000
Totale invii 20000
Lista B
10000
10000
20000
Immaginiamo delle risposte ipotetiche
Lista A
Lista B
Offerta A
100
120
Offerta B
50
77
Totale
150
197
Totale invii
20000
20000
40000
Totale
220
127
347
E le redemption , si calcola : risposte/invii * 100
Lista A
Lista B
Totale
Offerta A
1%
1,2%
1,1%
Offerta B
0,5%
0,77%
0,64%
Totale
0,75%
0,99%
0,87%
Data la redemption generale 0,87% come indice =
100, allora potremo calcolare gli indici dei test :
esempio +38% quando si usa la lista B associata con
l’offerta A. Questo evidentemente sarà il mix vincente
per l’extension della prossima campagna. L’offerta A
in maniera più rappresentativa mostra un incremento
+26% rispetto la media generale e + 71% rispetto
all’offerta B.
Quando si farà la prossima campagna, ponendo come
base (test di controllo) l’offerta A e la lista B, si
3
testeranno altre variabili : test di nuove liste, test di
nuova creatività, test di stagionalità. In quest' ultimo
caso l’unica cosa che deve variare rispetto al controllo
sarà la data di spedizione.
Oltre alla statistica bisogna applicare anche
l'esperienza. È risaputo che le 3 settimane prima di
Natale e che da luglio a ferragosto sono periodi da
evitare per fare azioni di direct marketing, mentre i
migliori mesi sono settembre e gennaio. Ad ogni
modo ogni prodotto ha la sua specifica stagionalità
quindi questa è solo una avvertenza di massima.
Altri periodi critici sono la concomitanza di elezioni
politiche. Da evitare le zone colpite da terremoti,
nubifragi ecc.
La tentazione di investire poco denaro nei test è forte
e per questo spieghiamo l'intervallo di confidenza che
dimostra perché non serve risparmiare sui test.
Intervallo di confidenza
Test troppi piccoli allargano l’intervallo di confidenza
che serve a predire la redemption che si otterrà con
l’extension . La teoria dice che dati 30000 invii postali
e una redemption del 1% allora l’intervallo di
confidenza dell’extension sarà da 0,89 a 1,11 %. Nel
95% dei casi questa predizione è valida.
4
Per ipotesi se un test venisse ripetuto per esempio 11
volte, gli 11 risultati che si otterranno si
distribuiranno su una curva “ normale/gaussiana ”.
Su 11 test immaginiamo uscirà per 5 volte 1% di
redemption., per 2 volte 0,9 e 1,1 e 1 volta 0,8 e 1,2.
Se queste redemption le mettiamo su carta esce la
curva gaussiana.
Questa è la teoria, ma dato che noi non faremo solo 1
test allora è la statistica che ci aiuta a predire i
risultati con questa formula:
La Formula dell’intervallo (Int.) è
p*q /N
+/- 1,96 √
Dove P è la redemption (1%) , Q è la non redemption
(99%) ed N la numerosità del campione.
L’intervallo di confidenza è dato dalla redemption del
test +/- Int.
Più la numerosità del test si abbassa più questo
intervallo di confidenza si allarga fino a rendere
discutibile ogni previsione. Un test di 1000 casi
vorrebbe dire un intervallo di confidenza da 0,4% a
1,6%.
La tentazione di risparmiare sugli invii del test
vanifica il nostro fine ultimo che è quello di prevedere
i risultati e che siano i più stabili possibili.
5
Esistono delle tabelle che calcolano gli intervalli di
confidenza.
Un altra veloce considerazione è la seguente : più la
redemption è bassa e più l’intervallo si restringe.
A volte può essere utile consultare questa tabella che
in base alla redemption attesa e l’intervallo
accettabile, ci indica di quanto dev’essere il campione:
In questi esempi abbiamo lavorato su un livello di
confidenza del 95% che significa accettare a priori 1
errore ogni 20 volte.
redemption
attesa
Numerosità
del campione
10000
Numerosità del
campione 20000
numerosità del
campione
30000
0,3
+- 0.11
+- 0.08
+- 0.06
0,5
+- 0.14
+- 0.10
+- 0.08
0,7
+- 0.16
+-0.12
+- 0.10
1
+- 0,20
+- 0.14
+- 0.12
In giallo lo scostamento intervallo da applicare. Se ci
attendiamo 0,30% di risposte e desideriamo un
intervallo di confidenza da 0,24 a 036% allora 30000
è la numerosità del campione che dobbiamo preparare.
Quando si fanno le previsioni si guarda sempre al
punto di minimo dell’intervallo di confidenza. Il
motivo è la duplicità nascosta* che nel test non esiste
ma invece c’e’ quando si estrae una lista dal database
6
per l’extension . *) spiegata nei precedenti capitoli del
libro bianco.
Quindi se un test di 30000 casi ottiene 1,0% di
redemption , allora la stima dell’extension sarà 0,88 %
( cioè 1 - 0,12).
Per il fatto che si guarda solo il punto di minimo
dell’intervallo ecco che allora con confidenza 97%
,cioè quasi certamente, avremo quest'altra tabella per
fare le proiezioni.
redemption 10000
20000
30000
0,3
0.19
0.22
0.24
0,5
0.36
0.40
0.42
0,7
0.54
0.58
0.60
1
0.80
0.86
0.88
In giallo il punto minimo dell’intervallo quindi la
previsione che viene fatta nella pratica.
L’intervallo di confidenza così come la statistica è il
punto debole di chi lavora nel settore e quindi poco
applicate e conosciute. Troppo spesso vediamo che
chi intende economizzare, chi cerca di prendere
scorciatoie, chi non segue schemi professionali è poi
destinato a sbagliare.
Le tecniche di direct marketing vanno prese sul serio.
Detto questo ricordiamoci che tutta la teoria sopra
vista deve essere accompagnata dal rigore e dalla
7
trasparenza di chi fa le campionature, le analisi e poi
l’estrazione dell’extension la quale deve rispettare gli
stessi parametri di estrazione del test escludendo i
nominativi usati per fare il test.
Nella pratica, dato lo scarso budget a volte disponibile
la teoria statistica va sorpassata e ci si deve affidare
alle intuizioni e alla esperienza per esempio di un
consulente o all'analisi storica dei risultati di una lista
per intuire se questa funzionerà o meno.
Le analisi.
Un test su liste esterne di 30000 invii postali permette
di fare delle analisi monovariate o incrociate. Questo
metodo statistico è più che sufficiente quando si usano
liste esterne che in genere possiedono poche variabili.
Si analizzano così la provenienza geografica, il sesso,
l’età ecc.
Un test cautelativo di 5000 contatti dice solo se
proseguire con un test più consistente o scartare a
prescindere la lista dato che ce ne sono altre da
scegliere.
Su una lista clienti il discorso “analisi” diventa più
interessante dato che si possono analizzare : la data
dell’ultima azione, la frequenza dei precedenti ordini e
8
l’importo speso. Questo tipo di approccio si chiama
RFM ( recency, frequency, monetary).
Si possono analizzare anche altre variabili come il n°
di promozioni ricevute, il tipo di prodotti acquistati, il
canale di reclutamento, la forma di pagamento, le
attività sui social media, l'uso di internet ecc.
Un analisi RFM permette di individuare dei segmenti
ad alta reattività e grazie all’analisi si individuano
spesso segmenti con indice di redemption anche doppi
rispetto alla media.
In presenza di tante variabili si può fare anche un
analisi statistica, che in gergo diciamo “scoring”. In
genere una funzione logistica è quella che si adatta
allo studio della redemption ossia di una variabili
binomiale basata su 2 esiti : risposta e non risposta.
Ma nella pratica si usa anche un modello lineare.
Facciamo un esempio : La redemption viene spiegata
da 3 variabili (x), ogni variabile avrà un suo
peso/coefficiente (a).
Ecco la funzione che spiega la Redemption = a1x1 +
a2x2 + a2 x3
Per prima cosa nel modello entrano quelle variabili
che sono più correlate alle risposte cioè che spiegano
la redemption. Variabili con modalità piatte (indici
tendenti alla media 100) non spiegano niente e
vengono scartate. Se ad esempio una variabile come il
sesso mostra la modalità uomini con indice =150 e le
9
donne indice = 50, allora in questo caso la variabile
entra nella formula perché si tratta di un indice
discriminante riferito a 2 modalità con numerosità
importante ( metà del campione è uomo e metà
donna).
Ogni modalità delle variabili che entrano nel modello
avrà un peso che approssimativamente equivale
all’indice di redemption. Anche ogni variabile avrà un
suo peso dato da quanto sa spiegare la redemption.
Per fare un esempio ammettiamo che entrano 3
variabili discriminanti nella formula : sesso – data
ultimo acquisto – forma di pagamento e che le altre
variabili “si buttano” . A questo punto ad ogni
nominativo della lista in extension verrà assegnato un
punteggio, uno score (indice di redemption).
Così il sig Rossi prenderà 200 punti in quanto uomo,
poi 170 in quanto cliente recente e 140 in quanto paga
con carta di credito. 510 è lo score totale del sig rossi.
E via via in questo modo si assegna uno score a tutti le
altre persone della lista scelta per l' estensione.
Una volta assegnati gli score a tutti i soggetti della
lista quest’ultima verrà ordinata per score dal più alto
al più basso.
In pratica avremo messo in ordine la lista da quello
con più alta probabilità di ordinare a quello con più
bassa probabilità.
10
Tutto questo serve per ottimizzare l’invio di una
campagna di direct marketing . Se pensiamo che il
costo contatto è di circa 1 euro per un mailing , si fa
presto a fare investimenti di 50000/100000 € o più .
A volte può essere utile fare il contrario cioè non
selezionare una lista ma eliminare quelle modalità con
indici tendenti a zero.
Perché fare lo scoring ? Si può decidere ad esempio di
inviare un mailing costoso solo a quel 20% di clienti
con la più alta probabilità di risposta come indicato
dal modello, oppure di mandare un catalogo solo al
50% dei clienti che hanno score sopra la media, ecc.
ecc. In sintesi si fa lo scoring per ottimizzare gli
investimenti promozionali.
Concludiamo dicendo che il modello “scoring”
presenta qualche passaggio più complesso ma per i
nostri scopi serviva descrivere un esempio veloce e
intuitivo.
Comparazione dei costi
Di seguito un interessante schema per comparare i
costi e i risultati in fase di reclutamento utilizzando 3
canali : mailing postale, email marketing, la
combinazione di essi. Si immagini di spedire 10000
11
messaggi. I dati di input dello schema sono stati
inseriti dall’autore (ITL France).
Si rimanda ad un altro capitolo del libro bianco un
approfondimento delle formule e degli indicatori. Qui
diciamo che la redemption è l’indicatore più grezzo
per analizzare le azioni di reclutamento; infatti il CPO
(costo per acquisire un ordine) è più pertinente.
I prezzi del noleggio indirizzi sono al 1000
Tipo di spesa
Noleggio Indirizzi
Francobollo
Stampa e
Confezionamento
Costi creazione
Redemption
prevista
Ordine medio
Margine
Costo spedizione
Costo regalo
Tot. Costo
operazione *)
Margine operazione
Ordini
Cpo = costo
acquisizione
Mailing
200/000
0,28
0,15
Email
20/000
0,01
0
Multicanale
220/000
0,29
0,15
4000
1%
400
0,1%
4400
1,1%
50€
40%
7€
0
14000€
50€
40%
7€
0
1060€
50€
40%
7€
0
15070€
2000€
100
-90
euro
200€
2200€
10
110
-56 euro - 87 euro
12
*) 6300 euro costo promozionale + 4000 costo
creatività + 700 costo spedizione + 3000 costo
prodotto.
Poi al costo tot. si deducono i costi di vendita
( 14000-5000) così si ottengono i soli costi
promozionali che diviso il n° di clienti danno il cpo =
costo per ordine.
Di solito il cpo è sempre negativo. Ed è calcolato
anche così : spese promozionali (costo operazione) –
margine sul prodotto + spese postali. Il totale viene
diviso sul n° delle adesioni per ottenere il costo
sostenuto per generare 1 nuovo cliente.
Il database clienti
La conoscenza della database clienti porta ad una
segmentazione della clientela e ad individuare dei
macro segmenti come :
1.inattivi
2.dormienti
3.saltuari
4.regolari
5.heavy buyers
6.apostoli ( advocate)
Per ogni categoria si invieranno messaggi su misura e
si adotteranno strategie ad hoc.
13
Con gli inattivi si può arrivare alla conclusione
d’inviare “l’ultimo messaggio” dicendo: “ dato che da
xx mesi non ordini questa è l’ultima offerta e se non
rispondi verrai cancellato dal database “.
Questo tema si collega in un certo qual modo al diritto
all’oblio che è una delle nuove regole della nuova
legge europea sulla data protection che obbliga le
aziende a cancellare dai database chi da un certo
periodo non reagisce.
All’altro estremo della scala ci sono gli Apostoli
(advocate) che sono coloro che talmente entusiasti
dei nostri prodotti si adoperano per raccomandarli e/o
venderli presso i loro amici e conoscenti.
Uno dei punti d’arrivo di chi lavora sulla lista clienti
è la conoscenza del database per saper distinguere
quel 20% della clientela che genera l’80% dei
guadagni. Non tutti i clienti valgono lo stesso e si
suppone che l’azienda adotterà diverse strategie e
modi di comunicare a seconda del tipo di cliente. In
sintesi il database clienti va profilato , il modello RFM
è quello più usato, dopodiché spazio alla creatività e
alle strategie da adottare con i diversi segmenti.
Banche dati esterne a supporto.
Le analisi possono essere fatte anche con l’aiuto di
dati esterni al database clienti come ad esempio
14
recuperando dati dai pubblici registri
( compatibilmente con le leggi locali) oppure dati
tratti dal territorio fino alla cellula territoriale più
piccola : la microzona.
Nel caso dei pubblici registri il più completo per il
settore b2b è senza dubbio il file camerale. Tramite la
partita iva si possono agganciare fino a 30
informazioni : fatturato, attività, telefono, export.
Nel caso di analisi per microzone vale il concetto
dimmi dove abiti e ti dirò chi sei. Dall’analisi
territoriale dei dati si possono dedurre dei profili.
Facciamo un passo indietro e ricordiamo che l’ Italia è
divisa in regioni, le regioni in province, e che nelle
province ci sono i comuni (unità minima
amministrativa).
In Italia esistono circa 8100 comuni, e in un comune
possono stare una o più frazioni.
Il censimento definisce le micro aree che corrisponde
ad un gruppo di case ossia un insieme di case vicine
spesso confinanti che mediamente contengono 66
famiglie.
Nel caso di un grattacielo la microzona può
corrispondere ad una sola via e n° civico, ma nel caso
di villette sparse la microzona può estendersi anche
per 1 Km.
15
A livello di microzona i dati sono pubblici e pertanto
non corrispondono mai ad una persona concreta.
Esempio : microzona 2123 sappiamo ci sono 20
vecchi, 60 adulti e 15 giovani.
Altri dati riguardano: la professione, la nazionalità, i
mq della casa, l’anno di costruzione dell’edificio, ecc.
Chi analizza e commercializza questi dati tende a fare
delle medie per cui si dirà che nella microzona 2123 i
mq medi sono 105 ( nella realtà ci può essere sia il
monolocale e il superattico).
Preso con le dovute precauzioni il dato microzona può
essere un faro per attività di direct marketing il cui
scopo è di raggiungere ad esempio famiglie che
abitano in case grandi ( si pensi alle aziende fornitrici
di gas). Attualmente i dati usati per queste analisi
risalgono al censimento del 2001.
Può succedere anche di disporre già di un database
( ad esempio un editore che dispone di 2,5 ML di
indirizzi). Se l’obiettivo del marketing è quello di
vendere una collezione editoriale per ragazzi ecco che
conoscere le microzone dove si concentrano famiglie
con ragazzi può essere una guida per selezionare dai
2,5 milioni di record coloro che vivono in certe
microzone piuttosto che in altre. Quindi ci si orienta
con i dati delle microzone con alto indice di
penetrazione delle famiglie con bambini rispetto alla
16
media nazionale. La probabilità di contattare famiglie
in target è più alta rispetto ad un metodo aleatorio.
Un cenno anche al sistema postale, cardine del
mailing classico.
I cap (codice avviamento postale ) non sono univoci
per ogni comune. Il caso tipico è il cap 20090 che
corrisponde ad 8 comuni importanti della periferia di
Milano.
Altresì le grandi città sono divise in zone per cui ad
esempio Milano dispone di 40 cap circa.
Le chiavi di aggancio tra files e database esterni con
indicatori territoriali possono essere : il cap, la
descrizione del comune, il codice comune istat, il
codice zona di censimento, le coordinate geo x/y. Con
questo ultimo dato e con l’uso della cartografia è
possibile individuare chi risiede ad esempio fino a 16
minuti da un punto vendita o a 5 km di distanza.
Un servizio nuovo e interessante è stato creato in UK,
land finder, che incrociando mappe militari, foto
spaziali e database consumatori è in grado ad esempio
di individuare terreni liberi dove proporre, ai loro
proprietari, l'uso di pannelli solari industriali.
17
Cenni usanze postali in Europa
In altre nazioni, come la Spagna, si usa indicare
nell’indirizzo il n° della porta.
In Italia invece è più che sufficiente indicare nome
della persona, via e n° civico e ovviamente cap
località e sigla provincia . Il resto delle informazioni
che si usano in Spagna ( porta, piano, blocco) in Italia
non si usano.
Questi dati si trovano anche in Italia in registri come il
catasto ma di fatto sono dati burocratici che mai nella
vita vengono usati dalle persone.
Un mailing intestato al titolare della porta 77 di via
gulli 40 – 20147 milano - sortirebbe l’effetto di
tornare indietro con la motivazione “ sconosciuto” ;
mentre invece questa pratica si suole usare in Spagna.
18