DATA MINING E METODOLOGIA DELLA RICERCA SOCIALE: LA CREAZIONE DI VALORE AGGIUNTO PER L’UTENTE SAS E IL DATA MINING. PRINCIPALI AMBITI DI APPLICAZIONE E PROSPETTIVE Elena Fabbris Relazione al convegno Data Mining e Metodologia della Ricerca Sociale: la Creazione di Valore Aggiunto per l’Utente, Torino, Aula Magna del Rettorato dell’Università, 20 Febbraio 2004 1 DATA MINING E METODOLOGIA DELLA RICERCA SOCIALE: LA CREAZIONE DI VALORE AGGIUNTO PER L’UTENTE Il termine Data Mining identifica un processo di esplorazione e di modellazione del Customer Data Base (CDB) finalizzato all'estrazione dell'informazione in esso contenuta ed all’identificazione di comportamenti non facilmente individuabili ma utili ai fini del business. La capacità degli attuali strumenti informatici di raccogliere e memorizzare quantità sempre maggiori di dati ha fatto aumentare notevolmente la disponibilità di informazioni da sottoporre ad analisi statistiche. Di fronte ad una tale esplosione di dati, l'uso singolo e separato delle diverse tecniche di analisi statistica risulta spesso incapace di gestire il patrimonio informativo in essi contenuto. La discriminante tra Data Mining ed Analisi statistica risiede proprio nella possibilità di rendere processo l'analisi statistica. Gli applicativi di Data Mining infatti prevedono una trascrizione delle tecniche statistiche nell'ottica di renderle concatenabili tra loro, attraverso un flusso di inputoutput dal contenuto il più possibile omogeneo. In questa accezione la singola tecnica perde di importanza mentre il processo, ossia l'intero percorso gestionale/informativo/decisionale, diventa il "focus". Si introduce quindi il concetto di "strategia di analisi" che concretizza l'idea di una possibile integrazione tra differenti tecniche di analisi allo scopo di estrarre l'informazione contenuta nei dati. Nel portafoglio delle soluzioni SAS esistono da tempo componenti dedicate alla analisi dei dati largamente impiegate da aziende di tutti i settori merceologici per effettuare analisi del CDB. Lo strumento SAS per il Data Mining si pone come obiettivo quello di supportare al meglio lo svolgimento della attività di analisi dei dati presenti nei vari ambiti aziendali. Volendo classificare in quattro principali aree le applicazioni del Data Mining potremo ipotizzare una suddivisione di questo tipo: - il Predictive Modeling, si pone come obiettivo quello di prevedere il comportamento del cliente rispetto ad un target di interesse, fissato in base all’obiettivo di business da raggiungere. I risultati degli algoritmi predittivi (alberi decisionali, reti neurali, regressione) sono quindi disponibili e possono essere direttamente traslati in azioni e direzioni di business. Alcune aree di applicazione del Predictive Modeling sono il Target Marketing, il Credit Scoring, le Analisi di Attrition e la Fraud Detection. - la Customer Segmentation ha come obiettivo quello di identificare raggruppamenti di clienti con comportamenti simili rispetto alle variabili di analisi. E’ possibile quindi sviluppare attività di marketing mirate e differenziate per specifico segmento, ottenendo una visione più chiara e gestibile di una base dati di clienti complessa, pianificando 2 DATA MINING E METODOLOGIA DELLA RICERCA SOCIALE: LA CREAZIONE DI VALORE AGGIUNTO PER L’UTENTE una struttura per mirate azioni di marketing, identificando obiettivi specifici per il segmento e sviluppando idonee strategie per ottenerli. La Customer Segmentation è quindi di ausilio nella definizione di idonei e differenziati strumenti di ausilio alla vendita, nella creazione di specifici portafogli di clientela, allo scopo di incrementare la fidelizzazione della clientela. La suddivisione dei clienti in gruppi omogenei permette infatti di allocare le risorse di marketing in maniera ottimale e di massimizzare i risultati e quindi di fornire ai propri clienti un servizio migliore contribuendo in questo modo all’aumento della redditività. - Il Web Mining consiste nell’applicare tecniche di Data Mining ai dati di navigazione sul Web. La pagina di provenienza, la modalità di accesso alla rete, i path di navigazione e molto altro ancora, sono tutte informazioni che, opportunamente analizzate con le tecniche di data mining, permettono di definire un insieme di regole da cui trarre spunto per ottimizzare il layout dei contenuti, per aumentare soddisfazione e loyalty e per influenzare il comportamento d’acquisto dei visitatori. Oltre al Web Customer Profiling la principale metodologia di analisi del Web Mining è costituita dalla “Clickstream Analysis”, che utilizza tali dati per derivare le regole di comportamento che governano i modelli di utilizzo degli utenti di specifici siti web. - Il Text Mining si colloca nel panorama della Knowledge Discovery in Text (KDT), che si differenzia dalla Knowledge Discovery in Database (KDD), della quale abbiamo parlato nei punti precedenti, per il fatto che le informazioni analizzate sono in formato testuale e quindi non strutturate. E’ un processo automatico che permette di leggere, interpretare, classificare ed integrare informazioni contenute in documenti provenienti da diverse fonti. Uno dei principali obiettivi del Text Mining è la classificazione automatica: successivamente all’acquisizione del contenuto dei documenti si utilizzano tecniche di analisi multivariata per assegnarli ad una o più aree tematiche. 3