SAS E IL DATA MINING. PRINCIPALI AMBITI DI

DATA MINING E METODOLOGIA DELLA RICERCA SOCIALE:
LA CREAZIONE DI VALORE AGGIUNTO PER L’UTENTE
SAS E IL DATA MINING. PRINCIPALI AMBITI DI
APPLICAZIONE E PROSPETTIVE
Elena Fabbris
Relazione al convegno
Data Mining e Metodologia della Ricerca Sociale: la Creazione di Valore
Aggiunto per l’Utente, Torino, Aula Magna del Rettorato
dell’Università, 20 Febbraio 2004
1
DATA MINING E METODOLOGIA DELLA RICERCA SOCIALE:
LA CREAZIONE DI VALORE AGGIUNTO PER L’UTENTE
Il termine Data Mining identifica un processo di esplorazione e di
modellazione del Customer Data Base (CDB) finalizzato all'estrazione
dell'informazione in esso contenuta ed all’identificazione di
comportamenti non facilmente individuabili ma utili ai fini del business.
La capacità degli attuali strumenti informatici di raccogliere e
memorizzare quantità sempre maggiori di dati ha fatto aumentare
notevolmente la disponibilità di informazioni da sottoporre ad analisi
statistiche.
Di fronte ad una tale esplosione di dati, l'uso singolo e separato delle
diverse tecniche di analisi statistica risulta spesso incapace di gestire il
patrimonio informativo in essi contenuto.
La discriminante tra Data Mining ed Analisi statistica risiede proprio
nella possibilità di rendere processo l'analisi statistica. Gli applicativi di
Data Mining infatti prevedono una trascrizione delle tecniche statistiche
nell'ottica di renderle concatenabili tra loro, attraverso un flusso di inputoutput dal contenuto il più possibile omogeneo. In questa accezione la
singola tecnica perde di importanza mentre il processo, ossia l'intero
percorso gestionale/informativo/decisionale, diventa il "focus".
Si introduce quindi il concetto di "strategia di analisi" che concretizza
l'idea di una possibile integrazione tra differenti tecniche di analisi allo
scopo di estrarre l'informazione contenuta nei dati.
Nel portafoglio delle soluzioni SAS esistono da tempo componenti
dedicate alla analisi dei dati largamente impiegate da aziende di tutti i
settori merceologici per effettuare analisi del CDB.
Lo strumento SAS per il Data Mining si pone come obiettivo quello di
supportare al meglio lo svolgimento della attività di analisi dei dati
presenti nei vari ambiti aziendali.
Volendo classificare in quattro principali aree le applicazioni del Data
Mining potremo ipotizzare una suddivisione di questo tipo:
- il Predictive Modeling, si pone come obiettivo quello di prevedere il
comportamento del cliente rispetto ad un target di interesse, fissato in
base all’obiettivo di business da raggiungere. I risultati degli algoritmi
predittivi (alberi decisionali, reti neurali, regressione) sono quindi
disponibili e possono essere direttamente traslati in azioni e direzioni
di business. Alcune aree di applicazione del Predictive Modeling sono
il Target Marketing, il Credit Scoring, le Analisi di Attrition e la Fraud
Detection.
- la Customer Segmentation ha come obiettivo quello di identificare
raggruppamenti di clienti con comportamenti simili rispetto alle
variabili di analisi. E’ possibile quindi sviluppare attività di marketing
mirate e differenziate per specifico segmento, ottenendo una visione
più chiara e gestibile di una base dati di clienti complessa, pianificando
2
DATA MINING E METODOLOGIA DELLA RICERCA SOCIALE:
LA CREAZIONE DI VALORE AGGIUNTO PER L’UTENTE
una struttura per mirate azioni di marketing, identificando obiettivi
specifici per il segmento e sviluppando idonee strategie per ottenerli.
La Customer Segmentation è quindi di ausilio nella definizione di
idonei e differenziati strumenti di ausilio alla vendita, nella creazione
di specifici portafogli di clientela, allo scopo di incrementare la
fidelizzazione della clientela. La suddivisione dei clienti in gruppi
omogenei permette infatti di allocare le risorse di marketing in
maniera ottimale e di massimizzare i risultati e quindi di fornire ai
propri clienti un servizio migliore contribuendo in questo modo
all’aumento della redditività.
- Il Web Mining consiste nell’applicare tecniche di Data Mining ai dati
di navigazione sul Web. La pagina di provenienza, la modalità di
accesso alla rete, i path di navigazione e molto altro ancora, sono tutte
informazioni che, opportunamente analizzate con le tecniche di data
mining, permettono di definire un insieme di regole da cui trarre
spunto per ottimizzare il layout dei contenuti, per aumentare
soddisfazione e loyalty e per influenzare il comportamento d’acquisto
dei visitatori. Oltre al Web Customer Profiling la principale
metodologia di analisi del Web Mining è costituita dalla “Clickstream
Analysis”, che utilizza tali dati per derivare le regole di
comportamento che governano i modelli di utilizzo degli utenti di
specifici siti web.
- Il Text Mining si colloca nel panorama della Knowledge Discovery
in Text (KDT), che si differenzia dalla Knowledge Discovery in
Database (KDD), della quale abbiamo parlato nei punti precedenti,
per il fatto che le informazioni analizzate sono in formato testuale e
quindi non strutturate. E’ un processo automatico che permette di
leggere, interpretare, classificare ed integrare informazioni contenute
in documenti provenienti da diverse fonti. Uno dei principali obiettivi
del Text Mining è la classificazione automatica: successivamente
all’acquisizione del contenuto dei documenti si utilizzano tecniche di
analisi multivariata per assegnarli ad una o più aree tematiche.
3