I test, le analisi e le ottimizzazioni I test sono la chiave per migliorare le azioni di marketing diretto. I test vanno fatti sempre e sistematicamente. Si testano le liste e anche la creatività, le offerte ecc. e così si migliora il tiro fino a raggiungere i migliori risultati possibili ed avere delle certezze. Per comparare i test bisogna che solo una variabile differisca dal test di controllo ; infatti solo così dal confronto delle redemption, percentuale dei rispondenti sull’inviato, si calcolerà un indice, “l’indice di redemption “ , che indica la % di incremento o decremento rispetto al test di controllo. Se ad esempio il test di controllo, posto =100, ha dato 1% di redemption ed il test “nuova creatività” ha dato l’1,2%, allora l’indice di redemption del “nuova creatività” sul controllo è 120. Cioè migliora del 20% i risultati. Test per verificare se un nuovo subject line di una dem genera più aperture, se un regalo in aggiunta all’offerta stimola e di quanto gli ordini, se nuove liste presenti sul mercato sono più efficaci ecc. ecc. Il test di controllo è normalmente la classica offerta/creatività che da anni viene fatta ed in contemporanea vengono fatti partire i test. 1 Alcune regole di base per fare i test : 1.I test vanno spediti contemporaneamente. 2.Gli indirizzi da una lista vanno estratti a passo 1/n casuale per costruire il campione del test. 3.In fase di deduplica con altre liste i ( l’extension) , i test hanno priorità 1 cioè si elimina il doppio presente nell’altra lista (extension). 4.La numerosità del test non deve essere meno di 5000 per il mailing postale (la quantità indicata come ideale è 30000) e meno di 30000 per le dem. 5.Ribadiamo ancora che solo 1 variabile del test deve essere diversa rispetto al controllo. Suggeriamo una tecnica detta a matrice che permette con un minimo di indirizzi di testare 2 variabili ( qui ad esempio lista e offerta) e vederne i possibili incroci. S’immagini di debuttare per la prima volta nel mercato con un mailing. Abbiamo 2 offerte e 2 liste che si incrociano come da tabella qui sotto. Si ottengono 4 combinazioni. Anche la colonna/riga del totale verrà analizzata con il vantaggio di avere una numerosità più consistente. 2 Lista A Offerta A 10000 Offerta B 10000 Totale invii 20000 Lista B 10000 10000 20000 Immaginiamo delle risposte ipotetiche Lista A Lista B Offerta A 100 120 Offerta B 50 77 Totale 150 197 Totale invii 20000 20000 40000 Totale 220 127 347 E le redemption , si calcola : risposte/invii * 100 Lista A Lista B Totale Offerta A 1% 1,2% 1,1% Offerta B 0,5% 0,77% 0,64% Totale 0,75% 0,99% 0,87% Data la redemption generale 0,87% come indice = 100, allora potremo calcolare gli indici dei test : esempio +38% quando si usa la lista B associata con l’offerta A. Questo evidentemente sarà il mix vincente per l’extension della prossima campagna. L’offerta A in maniera più rappresentativa mostra un incremento +26% rispetto la media generale e + 71% rispetto all’offerta B. Quando si farà la prossima campagna, ponendo come base (test di controllo) l’offerta A e la lista B, si 3 testeranno altre variabili : test di nuove liste, test di nuova creatività, test di stagionalità. In quest' ultimo caso l’unica cosa che deve variare rispetto al controllo sarà la data di spedizione. Oltre alla statistica bisogna applicare anche l'esperienza. È risaputo che le 3 settimane prima di Natale e che da luglio a ferragosto sono periodi da evitare per fare azioni di direct marketing, mentre i migliori mesi sono settembre e gennaio. Ad ogni modo ogni prodotto ha la sua specifica stagionalità quindi questa è solo una avvertenza di massima. Altri periodi critici sono la concomitanza di elezioni politiche. Da evitare le zone colpite da terremoti, nubifragi ecc. La tentazione di investire poco denaro nei test è forte e per questo spieghiamo l'intervallo di confidenza che dimostra perché non serve risparmiare sui test. Intervallo di confidenza Test troppi piccoli allargano l’intervallo di confidenza che serve a predire la redemption che si otterrà con l’extension . La teoria dice che dati 30000 invii postali e una redemption del 1% allora l’intervallo di confidenza dell’extension sarà da 0,89 a 1,11 %. Nel 95% dei casi questa predizione è valida. 4 Per ipotesi se un test venisse ripetuto per esempio 11 volte, gli 11 risultati che si otterranno si distribuiranno su una curva “ normale/gaussiana ”. Su 11 test immaginiamo uscirà per 5 volte 1% di redemption., per 2 volte 0,9 e 1,1 e 1 volta 0,8 e 1,2. Se queste redemption le mettiamo su carta esce la curva gaussiana. Questa è la teoria, ma dato che noi non faremo solo 1 test allora è la statistica che ci aiuta a predire i risultati con questa formula: La Formula dell’intervallo (Int.) è p*q /N +/- 1,96 √ Dove P è la redemption (1%) , Q è la non redemption (99%) ed N la numerosità del campione. L’intervallo di confidenza è dato dalla redemption del test +/- Int. Più la numerosità del test si abbassa più questo intervallo di confidenza si allarga fino a rendere discutibile ogni previsione. Un test di 1000 casi vorrebbe dire un intervallo di confidenza da 0,4% a 1,6%. La tentazione di risparmiare sugli invii del test vanifica il nostro fine ultimo che è quello di prevedere i risultati e che siano i più stabili possibili. 5 Esistono delle tabelle che calcolano gli intervalli di confidenza. Un altra veloce considerazione è la seguente : più la redemption è bassa e più l’intervallo si restringe. A volte può essere utile consultare questa tabella che in base alla redemption attesa e l’intervallo accettabile, ci indica di quanto dev’essere il campione: In questi esempi abbiamo lavorato su un livello di confidenza del 95% che significa accettare a priori 1 errore ogni 20 volte. redemption attesa Numerosità del campione 10000 Numerosità del campione 20000 numerosità del campione 30000 0,3 +- 0.11 +- 0.08 +- 0.06 0,5 +- 0.14 +- 0.10 +- 0.08 0,7 +- 0.16 +-0.12 +- 0.10 1 +- 0,20 +- 0.14 +- 0.12 In giallo lo scostamento intervallo da applicare. Se ci attendiamo 0,30% di risposte e desideriamo un intervallo di confidenza da 0,24 a 036% allora 30000 è la numerosità del campione che dobbiamo preparare. Quando si fanno le previsioni si guarda sempre al punto di minimo dell’intervallo di confidenza. Il motivo è la duplicità nascosta* che nel test non esiste ma invece c’e’ quando si estrae una lista dal database 6 per l’extension . *) spiegata nei precedenti capitoli del libro bianco. Quindi se un test di 30000 casi ottiene 1,0% di redemption , allora la stima dell’extension sarà 0,88 % ( cioè 1 - 0,12). Per il fatto che si guarda solo il punto di minimo dell’intervallo ecco che allora con confidenza 97% ,cioè quasi certamente, avremo quest'altra tabella per fare le proiezioni. redemption 10000 20000 30000 0,3 0.19 0.22 0.24 0,5 0.36 0.40 0.42 0,7 0.54 0.58 0.60 1 0.80 0.86 0.88 In giallo il punto minimo dell’intervallo quindi la previsione che viene fatta nella pratica. L’intervallo di confidenza così come la statistica è il punto debole di chi lavora nel settore e quindi poco applicate e conosciute. Troppo spesso vediamo che chi intende economizzare, chi cerca di prendere scorciatoie, chi non segue schemi professionali è poi destinato a sbagliare. Le tecniche di direct marketing vanno prese sul serio. Detto questo ricordiamoci che tutta la teoria sopra vista deve essere accompagnata dal rigore e dalla 7 trasparenza di chi fa le campionature, le analisi e poi l’estrazione dell’extension la quale deve rispettare gli stessi parametri di estrazione del test escludendo i nominativi usati per fare il test. Nella pratica, dato lo scarso budget a volte disponibile la teoria statistica va sorpassata e ci si deve affidare alle intuizioni e alla esperienza per esempio di un consulente o all'analisi storica dei risultati di una lista per intuire se questa funzionerà o meno. Le analisi. Un test su liste esterne di 30000 invii postali permette di fare delle analisi monovariate o incrociate. Questo metodo statistico è più che sufficiente quando si usano liste esterne che in genere possiedono poche variabili. Si analizzano così la provenienza geografica, il sesso, l’età ecc. Un test cautelativo di 5000 contatti dice solo se proseguire con un test più consistente o scartare a prescindere la lista dato che ce ne sono altre da scegliere. Su una lista clienti il discorso “analisi” diventa più interessante dato che si possono analizzare : la data dell’ultima azione, la frequenza dei precedenti ordini e 8 l’importo speso. Questo tipo di approccio si chiama RFM ( recency, frequency, monetary). Si possono analizzare anche altre variabili come il n° di promozioni ricevute, il tipo di prodotti acquistati, il canale di reclutamento, la forma di pagamento, le attività sui social media, l'uso di internet ecc. Un analisi RFM permette di individuare dei segmenti ad alta reattività e grazie all’analisi si individuano spesso segmenti con indice di redemption anche doppi rispetto alla media. In presenza di tante variabili si può fare anche un analisi statistica, che in gergo diciamo “scoring”. In genere una funzione logistica è quella che si adatta allo studio della redemption ossia di una variabili binomiale basata su 2 esiti : risposta e non risposta. Ma nella pratica si usa anche un modello lineare. Facciamo un esempio : La redemption viene spiegata da 3 variabili (x), ogni variabile avrà un suo peso/coefficiente (a). Ecco la funzione che spiega la Redemption = a1x1 + a2x2 + a2 x3 Per prima cosa nel modello entrano quelle variabili che sono più correlate alle risposte cioè che spiegano la redemption. Variabili con modalità piatte (indici tendenti alla media 100) non spiegano niente e vengono scartate. Se ad esempio una variabile come il sesso mostra la modalità uomini con indice =150 e le 9 donne indice = 50, allora in questo caso la variabile entra nella formula perché si tratta di un indice discriminante riferito a 2 modalità con numerosità importante ( metà del campione è uomo e metà donna). Ogni modalità delle variabili che entrano nel modello avrà un peso che approssimativamente equivale all’indice di redemption. Anche ogni variabile avrà un suo peso dato da quanto sa spiegare la redemption. Per fare un esempio ammettiamo che entrano 3 variabili discriminanti nella formula : sesso – data ultimo acquisto – forma di pagamento e che le altre variabili “si buttano” . A questo punto ad ogni nominativo della lista in extension verrà assegnato un punteggio, uno score (indice di redemption). Così il sig Rossi prenderà 200 punti in quanto uomo, poi 170 in quanto cliente recente e 140 in quanto paga con carta di credito. 510 è lo score totale del sig rossi. E via via in questo modo si assegna uno score a tutti le altre persone della lista scelta per l' estensione. Una volta assegnati gli score a tutti i soggetti della lista quest’ultima verrà ordinata per score dal più alto al più basso. In pratica avremo messo in ordine la lista da quello con più alta probabilità di ordinare a quello con più bassa probabilità. 10 Tutto questo serve per ottimizzare l’invio di una campagna di direct marketing . Se pensiamo che il costo contatto è di circa 1 euro per un mailing , si fa presto a fare investimenti di 50000/100000 € o più . A volte può essere utile fare il contrario cioè non selezionare una lista ma eliminare quelle modalità con indici tendenti a zero. Perché fare lo scoring ? Si può decidere ad esempio di inviare un mailing costoso solo a quel 20% di clienti con la più alta probabilità di risposta come indicato dal modello, oppure di mandare un catalogo solo al 50% dei clienti che hanno score sopra la media, ecc. ecc. In sintesi si fa lo scoring per ottimizzare gli investimenti promozionali. Concludiamo dicendo che il modello “scoring” presenta qualche passaggio più complesso ma per i nostri scopi serviva descrivere un esempio veloce e intuitivo. Comparazione dei costi Di seguito un interessante schema per comparare i costi e i risultati in fase di reclutamento utilizzando 3 canali : mailing postale, email marketing, la combinazione di essi. Si immagini di spedire 10000 11 messaggi. I dati di input dello schema sono stati inseriti dall’autore (ITL France). Si rimanda ad un altro capitolo del libro bianco un approfondimento delle formule e degli indicatori. Qui diciamo che la redemption è l’indicatore più grezzo per analizzare le azioni di reclutamento; infatti il CPO (costo per acquisire un ordine) è più pertinente. I prezzi del noleggio indirizzi sono al 1000 Tipo di spesa Noleggio Indirizzi Francobollo Stampa e Confezionamento Costi creazione Redemption prevista Ordine medio Margine Costo spedizione Costo regalo Tot. Costo operazione *) Margine operazione Ordini Cpo = costo acquisizione Mailing 200/000 0,28 0,15 Email 20/000 0,01 0 Multicanale 220/000 0,29 0,15 4000 1% 400 0,1% 4400 1,1% 50€ 40% 7€ 0 14000€ 50€ 40% 7€ 0 1060€ 50€ 40% 7€ 0 15070€ 2000€ 100 -90 euro 200€ 2200€ 10 110 -56 euro - 87 euro 12 *) 6300 euro costo promozionale + 4000 costo creatività + 700 costo spedizione + 3000 costo prodotto. Poi al costo tot. si deducono i costi di vendita ( 14000-5000) così si ottengono i soli costi promozionali che diviso il n° di clienti danno il cpo = costo per ordine. Di solito il cpo è sempre negativo. Ed è calcolato anche così : spese promozionali (costo operazione) – margine sul prodotto + spese postali. Il totale viene diviso sul n° delle adesioni per ottenere il costo sostenuto per generare 1 nuovo cliente. Il database clienti La conoscenza della database clienti porta ad una segmentazione della clientela e ad individuare dei macro segmenti come : 1.inattivi 2.dormienti 3.saltuari 4.regolari 5.heavy buyers 6.apostoli ( advocate) Per ogni categoria si invieranno messaggi su misura e si adotteranno strategie ad hoc. 13 Con gli inattivi si può arrivare alla conclusione d’inviare “l’ultimo messaggio” dicendo: “ dato che da xx mesi non ordini questa è l’ultima offerta e se non rispondi verrai cancellato dal database “. Questo tema si collega in un certo qual modo al diritto all’oblio che è una delle nuove regole della nuova legge europea sulla data protection che obbliga le aziende a cancellare dai database chi da un certo periodo non reagisce. All’altro estremo della scala ci sono gli Apostoli (advocate) che sono coloro che talmente entusiasti dei nostri prodotti si adoperano per raccomandarli e/o venderli presso i loro amici e conoscenti. Uno dei punti d’arrivo di chi lavora sulla lista clienti è la conoscenza del database per saper distinguere quel 20% della clientela che genera l’80% dei guadagni. Non tutti i clienti valgono lo stesso e si suppone che l’azienda adotterà diverse strategie e modi di comunicare a seconda del tipo di cliente. In sintesi il database clienti va profilato , il modello RFM è quello più usato, dopodiché spazio alla creatività e alle strategie da adottare con i diversi segmenti. Banche dati esterne a supporto. Le analisi possono essere fatte anche con l’aiuto di dati esterni al database clienti come ad esempio 14 recuperando dati dai pubblici registri ( compatibilmente con le leggi locali) oppure dati tratti dal territorio fino alla cellula territoriale più piccola : la microzona. Nel caso dei pubblici registri il più completo per il settore b2b è senza dubbio il file camerale. Tramite la partita iva si possono agganciare fino a 30 informazioni : fatturato, attività, telefono, export. Nel caso di analisi per microzone vale il concetto dimmi dove abiti e ti dirò chi sei. Dall’analisi territoriale dei dati si possono dedurre dei profili. Facciamo un passo indietro e ricordiamo che l’ Italia è divisa in regioni, le regioni in province, e che nelle province ci sono i comuni (unità minima amministrativa). In Italia esistono circa 8100 comuni, e in un comune possono stare una o più frazioni. Il censimento definisce le micro aree che corrisponde ad un gruppo di case ossia un insieme di case vicine spesso confinanti che mediamente contengono 66 famiglie. Nel caso di un grattacielo la microzona può corrispondere ad una sola via e n° civico, ma nel caso di villette sparse la microzona può estendersi anche per 1 Km. 15 A livello di microzona i dati sono pubblici e pertanto non corrispondono mai ad una persona concreta. Esempio : microzona 2123 sappiamo ci sono 20 vecchi, 60 adulti e 15 giovani. Altri dati riguardano: la professione, la nazionalità, i mq della casa, l’anno di costruzione dell’edificio, ecc. Chi analizza e commercializza questi dati tende a fare delle medie per cui si dirà che nella microzona 2123 i mq medi sono 105 ( nella realtà ci può essere sia il monolocale e il superattico). Preso con le dovute precauzioni il dato microzona può essere un faro per attività di direct marketing il cui scopo è di raggiungere ad esempio famiglie che abitano in case grandi ( si pensi alle aziende fornitrici di gas). Attualmente i dati usati per queste analisi risalgono al censimento del 2001. Può succedere anche di disporre già di un database ( ad esempio un editore che dispone di 2,5 ML di indirizzi). Se l’obiettivo del marketing è quello di vendere una collezione editoriale per ragazzi ecco che conoscere le microzone dove si concentrano famiglie con ragazzi può essere una guida per selezionare dai 2,5 milioni di record coloro che vivono in certe microzone piuttosto che in altre. Quindi ci si orienta con i dati delle microzone con alto indice di penetrazione delle famiglie con bambini rispetto alla 16 media nazionale. La probabilità di contattare famiglie in target è più alta rispetto ad un metodo aleatorio. Un cenno anche al sistema postale, cardine del mailing classico. I cap (codice avviamento postale ) non sono univoci per ogni comune. Il caso tipico è il cap 20090 che corrisponde ad 8 comuni importanti della periferia di Milano. Altresì le grandi città sono divise in zone per cui ad esempio Milano dispone di 40 cap circa. Le chiavi di aggancio tra files e database esterni con indicatori territoriali possono essere : il cap, la descrizione del comune, il codice comune istat, il codice zona di censimento, le coordinate geo x/y. Con questo ultimo dato e con l’uso della cartografia è possibile individuare chi risiede ad esempio fino a 16 minuti da un punto vendita o a 5 km di distanza. Un servizio nuovo e interessante è stato creato in UK, land finder, che incrociando mappe militari, foto spaziali e database consumatori è in grado ad esempio di individuare terreni liberi dove proporre, ai loro proprietari, l'uso di pannelli solari industriali. 17 Cenni usanze postali in Europa In altre nazioni, come la Spagna, si usa indicare nell’indirizzo il n° della porta. In Italia invece è più che sufficiente indicare nome della persona, via e n° civico e ovviamente cap località e sigla provincia . Il resto delle informazioni che si usano in Spagna ( porta, piano, blocco) in Italia non si usano. Questi dati si trovano anche in Italia in registri come il catasto ma di fatto sono dati burocratici che mai nella vita vengono usati dalle persone. Un mailing intestato al titolare della porta 77 di via gulli 40 – 20147 milano - sortirebbe l’effetto di tornare indietro con la motivazione “ sconosciuto” ; mentre invece questa pratica si suole usare in Spagna. 18