Milano, 7 ottobre 2008 L’attività di Customer Profiling Alberto Saccardi Agenda 1. L’analisi di Customer Profiling (CP) 2. La Segmentazione del portafoglio clienti 3. I modelli di Scoring 4. Conclusioni L’attività di Customer Profiling Segmentazione Come identificare i segmenti per l’attività di target marketing? Valutazione dei risultati Identificazione area di business Implementazione Predisposizione dei dati piano di marketing comportamentali Analisi e classificazione Decisioni strategiche Customer DataBase Scoring System Chi sono i migliori destinatari della campagna XYZ? Valutazione dei risultati Implementazione della campagna Identificazione regole marketing a priori Raccolta dei dati comportamentali Costruzione del modello di scoring Decisioni tattiche Segmentazione Marketing Segment Behavioral Clusters % VIP High Rollers Premium • Got-it-all • Frequent Flyers 20.0% • To Invest • High Time Consuming • Up-selling using Business Rules and Propensity Models • Portfolio Retention using Churn Models High Potential Customer • Young warriors • High potential 26.3% • To Improve • Medium Time Consuming • Cross-selling using Propensity Models • Product Holding Retention using Churn Models Basic Customers • Young Consumers • Conventional Savers • Abandoned hounds 51.7% • To Manage • Low Time Consuming • Basic Up & Cross-selling using Business Rules and Propensity Models • Customer Retention using Churn Models 2.0% CRM Actions • To Take Care (one-to-one) • Maximum Time Consuming • Share-of-wallet Retention using Business and Management Rules Modelli di Scoring % Population Score MIN-MAX Avg Score Cum. # Customers Cum. # Target Cum. Redemption Cum. Lift % Response Captured 5 1:0.1577-0.8055 0.2703 27509 5.00 18.73 8.37 41.83 10 2:0.0835-0.1576 0.1141 55026 10.00 13.51 6.04 60.36 15 3:0.0509-0.0834 0.0655 82537 15.00 10.59 4.73 70.96 20 4:0.033-0.0508 0.0409 110025 20.00 8.74 3.90 78.04 25 5:0.0231-0.0329 0.0276 137442 24.98 7.41 3.31 82.62 30 6:0.0169-0.023 0.0197 165356 30.05 6.42 2.87 86.12 35 7:0.0127-0.0168 0.0146 192621 35.01 5.68 2.54 88.84 40 8:0.0096-0.0126 0.0110 219814 39.95 5.09 2.27 90.88 45 9:0.0072-0.0095 0.0083 247301 44.94 4.62 2.06 92.69 50 10:0.0053-0.0071 0.0061 275370 50.04 4.21 1.88 94.12 55 11:0.0039-0.0052 0.0045 303506 55.16 3.87 1.73 95.36 60 12:0.0029-0.0038 0.0033 329490 59.88 3.60 1.61 96.27 65 13:0.0021-0.0028 0.0024 356163 64.73 3.36 1.50 97.09 70 14:0.0014-0.002 0.0017 386197 70.18 3.12 1.39 97.79 75 15:0.0009-0.0013 0.0011 414908 75.40 2.92 1.31 98.51 80 16:0.0006-0.0008 0.0007 439066 79.79 2.78 1.24 98.97 85 17:0.0003-0.0005 0.0004 474474 86.23 2.58 1.15 99.49 90 18:0.0002-0.0002 0.0002 491813 89.38 2.50 1.11 99.65 95 19:0.0001-0.0001 0.0001 517245 94.00 2.38 1.06 99.86 100 20:0-0 0.0000 550258 100.00 2.24 1.00 100.00 L’evoluzione dei progetti di Customer Profiling Master en Investigación de Mercado y Data Minin Modelli di Scoring Segmentazione Comp. Credit Scoring X Basel II Credit Scoring X Griglie Segmentazione Needs Based 2000 1990 Vendita a Distanza Telecomunicazioni New Media Finanza Editoria Social Network Analysis L’analisi dei dati Alcune premesse: Misurare e classificare fenomeni su dimensioni elementari Contare i clienti e classificarli in segmenti/mercati Segmentazione comportamentale Propensione Churn Potenziale Posizionamento Business Driven Action Plan Le fonti dei dati Dati appositamente raccolti per effettuare una particolare analisi/prendere una specifica decisione primari 1)Dati provenienti da attività di Business Intelligence 4)Dati provenienti da ricerche ad hoc 2)Dati provenienti dai sistemi di rilevazione aziendali 3)Dati provenienti da fonti istituz. o esterne all’impresa dati secondari Funzioni/personale appartenente al’impresa stessa Dati interne prodotti per altriesterne scopi,ma funzionali anche per lo svolgimento di informative analisi Fonti di mercato Costituite da istituzioni, concorrenti al di fuori dell’impresa L’organizzazione dei dati Fonti interne SIGI SAVA Repository Temporaneo Data Warehouse CDV Fonti esterne Data Warehouse Il Data Warehouse è un ambiente dati a supporto dei DSS con le seguenti caratteristiche: • • Integrato à Fonti diverse (interne – esterne) à Dati omogenei à Meta-informazione Non volatile à Profondità temporale 3-5 anni à Aggiornamenti per accodamento à Data inizio validità in chiave L’organizzazione dei dati Data Warehouse Multi Level Summary OLAP CDB Analisi Statistica L’organizzazione dei dati Gestore anagrafiche Dati Interni Dati Esterni CDB Data Mart Analisi Cliente Data Mart Analisi Prodotto Segmentazione comportamentale Modelli di Scoring Associazioni Proposta commerciale: selezione target e product mix. R.O.I. Gestore campagne Data Mart Analisi Mercato Segmentazione socio-demo Potenziali di zona L’organizzazione dei dati Gestore anagrafiche Dati Interni Dati Esterni CDB Data Mart Analisi Cliente Data Mart Analisi Prodotto Segmentazione comportamentale Modelli di Scoring Associazioni Proposta commerciale: selezione target e product mix. R.O.I. Gestore campagne Data Mart Analisi Mercato Segmentazione socio-demo Potenziali di zona L’unità logica di buiness (unità statistica) c\c C1 c\c C2 NDGC1 NDGC2 titoli C2 c\c F2 NDGF1 moglie NDGF2 marito cliente marito= c\c C1 + c\c F2 cliente moglie= cliente padre= c\c C2 NDGF3 padre + c\c C2 + c\c C1 + titoli C2 titoli C2 Un giusto equilibrio (la matrice dei dati) Customer Table Per ciascun cliente o prospect si vuole misurare il numero di auto acquistate per: A) tipologia di auto => 10 segmenti di mkt B) evoluzione storica => 0-2, 2-5 oltre 5 anni C) fedeltà => Fiat, Alfa, Lancia, Giapponesi, Euro1, Euro2, USA per poter incrociare le tre dimensioni A) x B) x C) => 10 x 3 x 7=210 variabili ! Le ricerche di mercato Ricerche Qualitative L’ obiettivo è approfondire la conoscenza di un fenomeno di mercato, mediante la raccolta e l’analisi di dati qualitativi destrutturati. Ricerche Quantitative L’ obiettivo è fornire un’accurata misurazione del fenomeno oggetto di ricerca, mediante la raccolta e l’analisi di dati quantitativi e/o dati qualitativi strutturati. Le ricerche di mercato L’esecuzione di una ricerca di mercato può essere schematizzata in quattro fasi: a)-fieldwork: la raccolta dei dati elementari; b)-trattamento elementare dei dati raccolti; c)-analisi dai dati; d)-presentazione dei risultati. Le ricerche di mercato fieldwork Sondaggio È assimilabile ad un’intervista individuale, veicolata su un sottoinsieme (campione) di una “popolazione” di riferimento. L’intervista presenta delle peculiarità: • Ha forma strutturata • Limitato numero di domande aperte/ molte domande a risposta chiusa • Modalità di contatto usate: - telefonica - personali - postali - web- based Le ricerche di mercato fieldwork Questionario E’ il format con cui vengono raccolti dati qualitativi strutturati e/o dati quantitativi La costruzione del questionario avviene attraverso: • Disegno del suo schema concettuale • Redazione • Verifica Modalità omogenee di rilevazione dei dati: le domande devono essere uguali per tutti gli intervistati e non devono lasciare spazio ad interpretazione soggettiva Le ricerche di mercato fieldwork 10 regole empiriche questionario per la costruzione di un • Definire chiaramente gli obiettivi informativi • Collegare ogni domanda a uno degli obiettivi informativi • Controllare l’ordine delle domande in modo che le risposte alle precedenti non influenzino quelle delle successive • Controllare che non vi siano palesi ripetizioni, sovrapposizioni e incoerenze • Attribuire ad ogni domanda un valore in termini di informazione ottenibile . Le ricerche di mercato fieldwork 10 • • • • regole empiriche questionario per la costruzione di un Prevedere il campo delle risposte possibili Misurare il tempo necessario per la lettura e le risposte Definire una griglia di interpretazione delle risposte Effettuare un test di prima approssimazione sulla comprensibilità delle domande, la durata della compilazione e la capacità di risposta dell’intervistato • Definire chiaramente le istruzioni per l’intervistatore o per il compilatore e testare la comprensibilità delle istruzioni . Le ricerche di mercato fieldwork Cati Metodi basati su questionario Indagini quantitative Indagini qualitative Capi/face-to-face Cawi Postali/fax/auto compilazioni Focus group Interviste in profondità Le analisi quantitative protocollo di impostazione Obiettivo d’analisi Universo statistico di riferimento Caratteri oggetto della rilevazione Costruzione liste di riferimento Scelta della precisone attesa Scelta del campione Tecniche di raccolta dei dati Fieldwork Controllo dati raccolti Analisi dei dati Presentazione Questionario Data Mart Pre-test questionario Il campionamento • Elementi introduttivi • Metodi di campionamento • La dimensione del campione Il campionamento Elementi introduttivi La ricerca quantitativa si basa: • sulla rilevazione censuaria delle unità della popolazione target; • su un sottoinsieme delle unità (campione) della popolazione target. Il fine principale di un’indagine campionaria è generalizzare i risultati ottenuti sul campione all’intera popolazione di riferimento. Il problema di tale approccio consiste nell’approssimazione con cui è possibile descrivere la popolazione attraverso il campione. Il campionamento Elementi introduttivi • Oggetto di studio di una indagine campionaria è una popolazione finita Ω={1,2,...,N}, le cui unità presentano tutte un medesimo carattere U • y , y ,...,yⁿ indicheranno i valori che la caratteristica U assume rispettivamente nelle unità 1,2,...,N della popolazione. • Si definisce campione di dimensione n della popolazione Ω un suo qualsiasi sottoinsieme c = {i ,i ,...,iⁿ }, contenente n unità • Per ottenere il campione da analizzare, si possono estrarre dalla popolazione n unità secondo due modalità principali: -Estrazione con ripetizione ogni volta viene reintrodotta l’unità già estratta dalla popolazione -Estrazione senza ripetizione tutte le unità già selezionate non possono più essere estratte Il campionamento Metodi di campionamento I metodi di campionamento si dividono in : • Probabilistici ogni unità della popolazione ha una probabilità nota e diversa da zero di essere selezionata, e quindi di entrare nel campione. Richiedono un insieme di regole note a priori, utilizzabili matematicamente, per formare il campione (piano di campionamento) • Non probabilistici la selezione delle unità avviene in base a criteri soggettivi ( presenza di particolari esigenze conoscitive), e la probabilità di selezione dei singoli elementi non è nota a priori. Il campionamento Metodi di campionamento - Probabilistici Campionamento casuale semplice Stratificato A grappoli A due o più stadi Sistematico A ogni estrazione ogni elemento della popolazione ha la stessa probabilità essere selezionato, attraverso un Se sidi hanno informazioni suppletive che garantisce èla sulla meccanismo popolazione di riferimento, casualità delleinestrazioni. La probab. possibile dividerla strati, al cui Le unità elementari della popolazione di estrazione di un elementosecondo è: sono interno le unità sono omogenee raggruppate sottoinsiemi di unità •Camp. in senza ripetizione: un determinato criterio. Da ogni strato contigue di osservazione, detti grappoli. P=1 / N*(N-1)*(N-2)*...*(N-i+1) viene estratto, in modo indipendente, Data popolazione leviene cui unità elemen. Datauna una popolazione, estratto un •Camp. Con ripetizione: un campione casuale. sono riunite in gruppi, dapprima si selez. certoP= numero 1/ N di grappoli e tutti gli elem. un campione casuale di selezionati gruppi, e poi si appartenenti ai gruppi entrano estrae un certo numero di unità elementari a far parte del campione.Di solito sono dai gruppicome selezionati. utilizzati grappoli dei gruppi naturali Vi allora duegià livelli di campionamento: o sono amministrativi esistenti, per al primo vengono scelti i gruppi o le unità i costi. Ècontenere necessario che le unità siano ordinate di rpimo un stadio, al secondo vengono secondo criterio qualsiasi; solo la scelte prima le unità elementari, unità dalla unità verrà estratta chiamate in modo casuale secondarie popolazione, le altre verranno selezionate in modo automatico secondo un criterio prefissato (es. una ogni 3). Il campionamento Metodi di campionamento – Non Probabilistici Per quote A scelta ragionata Per convenienza La popolazione viene suddivisa in gruppi omogenei in base ad alcune variabili strutturali (sesso, età, residenza…). Si individua il numero di osservazioni da raccogliere in ogni gruppo (quote): gli intervistatori scelgono il campione allo Le unitàdelle campionarie selezionate solo interno classi, insono modo da rispettare in determinateprescelte. aree di analisi, sulla base di le proporzioni L’intervistatore informazioni preliminari circa la popolaz. ha totale arbitrarietà nella scelta indagata. quindi un campionamento delle unitàÈda intervistare nelle quote basato sulla conoscenza del carattere assegnate. oggetto di studio, particolarmente adatto per campioni di piccole dimensioni. La selezione degli elementi è basata su criteri di convenienza temporale, economica o di altro genere. Ricerche di Mercato & Data Mining Issues Sampling Representativeness Filed & Data Certification Statistical Unit Identification Phenomenon Dimensions Techniques & Algorithmes Ricerche di Mercato Data Mining