Miner 3D
Sistemi Informativi per le decisioni
Professore Ing. Marco Patella
Anno accademico 2006 - 2007
Presentazione a cura di
Di Leo Valentina - Palmieri Francesco
Knowledge Discovery
La maggior parte delle aziende dispone
di enormi database contenenti dati di
tipo operativo
Queste basi di dati costituiscono
una potenziale miniera di utili
informazioni
Dai dati alla conoscenza
dati selezionati
DATA MINING
dati processati
dati trasformati
pattern
conoscenza
Miner 3D
Miner3D è un software di analisi,
visualizzazione ed esplorazione di dati
multidimensionali, con un'interfaccia
potente ed intuitiva, che consente
anche ad utenti meno esperti di
ottenere le informazioni utili per le
decisioni aziendali.
Versioni e funzionalità
Miner 3D
Enterprise
Miner 3D
Professional
Miner 3D
Basic
Power User Interface
SI
SI
SI
Selector
SI
SI
Statistics
SI
SI
Principal Components Analysis
(PCA)
SI
SI
K-means Clustering
SI
Database Connectivity
SI
Microsoft Excel Instant
Connectivity
SI
SI
SI
Data Picking
SI
SI
SI
Movie Recorder
SI
SI
SI
Model Templates
SI
SI
SI
SI
SI
SI
Caratteristiche
Synthesized Speech and Sounds
Come funziona?
•
•
•
•
Miner 3D preleva i dati direttamente dal database
aziendale o foglio di lavoro Excel per creare un
modello
Un alto livello di flessibilità permette all’utente di
generare virtualmente una serie illimitata di
combinazioni di tipi di grafici 2D e 3D
L’interfaccia user-friendly consente di interagire col
programma per incrementare il grado di
personalizzazione
L’intuizione umana rimane insostituibile per
l’interpretazione dei risultati
Caricamento Dati
Miner 3D consente di importare
diversi formati di dati:
•
•
•
•
•
Excel
Database (SQL Server,
Oracle, IBM DB2,
MySQL, Access)
Data files (CSV, TXT, DBF)
Unicode
Clipboard
Il programma consente l’aggiornamento dei dati
sia manuale, sia con il comando auto-refresh
Data Organization
I dati devono essere organizzati in colonne dove la prima
riga è l’identificativo e le altre contengono tipi di dati simili
Modelli
La parte più critica per l’analisi è la scelta del modello
maggiormente adeguato al dataset. Il software non
è in grado di scegliere il modello ottimale
Modelli di base:
• Scatter 2D / 3D
• Bars 2D / 3D
• Lines
• Tiles
• Heat map
• Surface
Proprietà dei modelli (1)
Opzioni di
rappresentazione dei dati:
•
Transformation
•
•
•
•
•
•
•
Linear
Exponential
Logarithmic
Scale
Gain
Bias
Noise
Proprietà dei modelli (2)
Proprietà grafiche
•
•
•
•
•
•
•
•
•
•
Color
Size (dimension X, Y, Z)
Height (dimension Z)
Base size (dimension X, Y)
Dimension X, Y
Axes X, Y, Z
Rotation X, Y, Z
Shape
Label
Texture
Proprietà audio
•
Sound effect, frequency, volume, panning, speech
Selettore
Il selettore è uno strumento interattivo e
visivo per la creazione di query (OLAP)
Comandi di selezione:
• Range
• Items
• Sample
• Substring
Statistiche
•
•
•
Le statistiche base sono calcolate automaticamente
al lancio del modello e possono essere
personalizzate.
La finestra statistiche si aggiorna
automaticamente al variare delle
selezioni operate dall’utente.
Le funzioni disponibili sono:
Media, Max, Min, Somma.
Mediana, Moda, Conteggio,
Deviazione standard.
Viste
La sezione viste modifica lo spazio di visualizzazione del modello.
•
•
•
•
•
•
•
•
•
Caption
Axes
Lattices
Frame
Waterlevel
Fonts
Colors
Collars
Camera
Data reduction
Viene effettuata quando vengono analizzati data set troppo numerosi
Row reduction
•
•
•
•
Keep all rows: forza il programma a caricare l’intero data set
K-means Clustering: clusterizza le tuple
Random selection: seleziona una percentuale o un numero di tuple
da caricare
Uniform selection: carica una tupla ogni N oppure un range di
tuple
Principal Components Analysis (PCA)
•
Estrapola un sottoinsieme di dimensioni rilevanti per l’analisi, più
semplici da visualizzare e da gestire per le proprie esigenze di
reports e di calcolo.
Funzionalità avanzate: K-means
•
•
K-Means Clustering e K-Means Data Reduction
offrono diverse opzioni per processare insieme di
dati di grosse dimensioni. Questi metodi possono
essere usati sia su cluster data sets visualizzati in
3D o per la riduzione e compressione dei databases.
Il metodo K-Means implementato
in Miner3D utilizza un algoritmo
proprietario ad alte prestazioni,
basato su algoritmi di filtro e di
ricerca multidimensional binary
search trees.
Salvataggio dei risultati
•
Modello
(xml)
•
Report
(html)
•
Immagini
(bmp, jpg, tif, tga, png)
•
Video
(avi)
Vantaggi di Miner 3D
•
•
•
•
•
•
Visualizzazione dei dati
Semplicità d’uso
Flessibilità
Potenza di calcolo
Interattività
Personalizzazione
… E ora un
esempio…