Miner 3D Sistemi Informativi per le decisioni Professore Ing. Marco Patella Anno accademico 2006 - 2007 Presentazione a cura di Di Leo Valentina - Palmieri Francesco Knowledge Discovery La maggior parte delle aziende dispone di enormi database contenenti dati di tipo operativo Queste basi di dati costituiscono una potenziale miniera di utili informazioni Dai dati alla conoscenza dati selezionati DATA MINING dati processati dati trasformati pattern conoscenza Miner 3D Miner3D è un software di analisi, visualizzazione ed esplorazione di dati multidimensionali, con un'interfaccia potente ed intuitiva, che consente anche ad utenti meno esperti di ottenere le informazioni utili per le decisioni aziendali. Versioni e funzionalità Miner 3D Enterprise Miner 3D Professional Miner 3D Basic Power User Interface SI SI SI Selector SI SI Statistics SI SI Principal Components Analysis (PCA) SI SI K-means Clustering SI Database Connectivity SI Microsoft Excel Instant Connectivity SI SI SI Data Picking SI SI SI Movie Recorder SI SI SI Model Templates SI SI SI SI SI SI Caratteristiche Synthesized Speech and Sounds Come funziona? • • • • Miner 3D preleva i dati direttamente dal database aziendale o foglio di lavoro Excel per creare un modello Un alto livello di flessibilità permette all’utente di generare virtualmente una serie illimitata di combinazioni di tipi di grafici 2D e 3D L’interfaccia user-friendly consente di interagire col programma per incrementare il grado di personalizzazione L’intuizione umana rimane insostituibile per l’interpretazione dei risultati Caricamento Dati Miner 3D consente di importare diversi formati di dati: • • • • • Excel Database (SQL Server, Oracle, IBM DB2, MySQL, Access) Data files (CSV, TXT, DBF) Unicode Clipboard Il programma consente l’aggiornamento dei dati sia manuale, sia con il comando auto-refresh Data Organization I dati devono essere organizzati in colonne dove la prima riga è l’identificativo e le altre contengono tipi di dati simili Modelli La parte più critica per l’analisi è la scelta del modello maggiormente adeguato al dataset. Il software non è in grado di scegliere il modello ottimale Modelli di base: • Scatter 2D / 3D • Bars 2D / 3D • Lines • Tiles • Heat map • Surface Proprietà dei modelli (1) Opzioni di rappresentazione dei dati: • Transformation • • • • • • • Linear Exponential Logarithmic Scale Gain Bias Noise Proprietà dei modelli (2) Proprietà grafiche • • • • • • • • • • Color Size (dimension X, Y, Z) Height (dimension Z) Base size (dimension X, Y) Dimension X, Y Axes X, Y, Z Rotation X, Y, Z Shape Label Texture Proprietà audio • Sound effect, frequency, volume, panning, speech Selettore Il selettore è uno strumento interattivo e visivo per la creazione di query (OLAP) Comandi di selezione: • Range • Items • Sample • Substring Statistiche • • • Le statistiche base sono calcolate automaticamente al lancio del modello e possono essere personalizzate. La finestra statistiche si aggiorna automaticamente al variare delle selezioni operate dall’utente. Le funzioni disponibili sono: Media, Max, Min, Somma. Mediana, Moda, Conteggio, Deviazione standard. Viste La sezione viste modifica lo spazio di visualizzazione del modello. • • • • • • • • • Caption Axes Lattices Frame Waterlevel Fonts Colors Collars Camera Data reduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction • • • • Keep all rows: forza il programma a caricare l’intero data set K-means Clustering: clusterizza le tuple Random selection: seleziona una percentuale o un numero di tuple da caricare Uniform selection: carica una tupla ogni N oppure un range di tuple Principal Components Analysis (PCA) • Estrapola un sottoinsieme di dimensioni rilevanti per l’analisi, più semplici da visualizzare e da gestire per le proprie esigenze di reports e di calcolo. Funzionalità avanzate: K-means • • K-Means Clustering e K-Means Data Reduction offrono diverse opzioni per processare insieme di dati di grosse dimensioni. Questi metodi possono essere usati sia su cluster data sets visualizzati in 3D o per la riduzione e compressione dei databases. Il metodo K-Means implementato in Miner3D utilizza un algoritmo proprietario ad alte prestazioni, basato su algoritmi di filtro e di ricerca multidimensional binary search trees. Salvataggio dei risultati • Modello (xml) • Report (html) • Immagini (bmp, jpg, tif, tga, png) • Video (avi) Vantaggi di Miner 3D • • • • • • Visualizzazione dei dati Semplicità d’uso Flessibilità Potenza di calcolo Interattività Personalizzazione … E ora un esempio…