™
Guida di Riferimento
Capitoli
1:
STATISTICA: Panoramica Generale
1
2:
Esempi Passo-Passo
9
Analitici
11
Gestione dei Dati
79
Installazioni Enterprise
107
3:
Interfaccia Utente
139
4:
Output delle Analisi
161
5:
Documenti di STATISTICA
185
6:
Grafici
207
7:
Personalizzare STATISTICA
233
8:
STATISTICA Visual Basic
241
9:
STATISTICA Query
263
10:
STATISTICA e .NET
271
A:
Ottenere Più Aiuti
279
B:
STATISTICA Enterprise Server
285
C:
La Famiglia dei Prodotti di STATISTICA
297
Appendici
Guida di Riferimento
Tutti i diritti sono riservati
Stampato in Italia
Nessuna parte di questa pubblicazione può essere riprodotta, memorizzata in un sistema di
immagazzinamento dati, trasmessa in qualunque forma o da qualunque strumento elettronico, meccanico, di
fotocopia, di registrazione, o altro senza il permesso scritto dell’editore.
StatSoft®, il logo StatSoft, STATISTICA sono marchi registrati di StatSoft Inc.
Windows® è un marchio registrato di Microsoft Corporation
ii – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Guida di Riferimento: Sommario
STATISTICA Guida di Riferimento
Sommario
1. STATISTICA: PANORAMICA GENERALE DELLE CARATTERISTICHE .............. 3
2. ESEMPI PASSO-PASSO ..................................................................................11
Analitici ...............................................................................................................11
Esempio 1: Correlazioni ................................................................................11
Esempio 2: ANOVA ........................................................................................36
Esempio 3: Gruppi di variabili ....................................................................... 44
Esempio 4: Analisi Per-gruppo ......................................................................47
Esempio 5: Pannelli di Riepilogo dei Risultati
(Qualità, Processo, Sixpacks) ...................................................................56
Esempio 6: STATISTICA Data Miner ..............................................................63
Gestione dei dati .................................................................................................79
Esempio 1: Formule di Spreadsheet e Formule Batch..................................79
Esempio 2: Dati di Input Direttamente da Excel ...........................................84
Esempio 3: Accedere ai Dati Direttamente da un Database SQL Server ......87
Esempio 4: Preparazione dei Dati – Pulitura e Filtraggio .............................92
Esempio 5: Utilizzare STATISTICA ETL (Estrarre,Trasformare e Caricare)...101
Installazioni Enterprise......................................................................................107
Esempio 1: STATISTICA Enterprise Server
Download/Offload delle Analisi dai/ai Server .......................................107
Esempio 2: Utilizzare STATISTICA in Ambienti Regolati ..............................112
Esempio 3: STATISTICA Enterprise ..............................................................121
L’Opzione di STATISTICA Enterprise Server .................................................137
Altri Esempi
STATISTICA Visual Basic: Registrare un’Analisi ...........................................252
STATISTICA Query: Accedere a Database Esterni .......................................266
3. INTERFACCIA UTENTE ................................................................................. 141
Caratteristiche Generali ....................................................................................141
Operazioni Personalizzate...........................................................................141
Accesso Alternativo agli Stessi Servizi Stili di Lavoro Personalizzati ..........142
STATISTICA Guida di Riferimento – iii
Copyright © StatSoft, 2011
Guida di Riferimento: Sommario
Supporto Per Analisi Multiple ...........................................................................142
Interfaccia Utente Interattiva ...........................................................................144
Panoramica .................................................................................................144
Il Flusso dell’Analisi Interattiva ................................................................... 145
Funzionalità delle Analisi ...........................................................................149
Tipologie di Documenti ............................................................................... 153
STATISTICA Visual Basic e Controllare STATISTICA da Altre Applicazioni .........156
Interfaccia Utente Basata su Browser Web:
STATISTICA Enterprise Server ......................................................................157
Integrazione con Microsoft Office .................................................................... 158
4. SEI CANALI PER L’OUTPUT DELLE ANALISI ................................................163
Panoramica .......................................................................................................163
1. Registri di STATISTICA ...................................................................................164
2. Finestre Singole .............................................................................................167
3. Report ...........................................................................................................167
Report di STATISTICA ..................................................................................168
Report da Registri .......................................................................................169
Report RTF (Rich Text Format) ....................................................................169
Report Acrobat (PDF) ..................................................................................170
Report HTML ...............................................................................................171
4. Microsoft Word .............................................................................................171
5. Output sul Web .............................................................................................173
Knowledge Portal ........................................................................................173
Pubblicare i Contenuti da STATISTICA Enterprise Server ............................174
Pubblicare i Contenuti dalle Applicazioni di STATISTICA Desktop ..............177
6. SharePoint o Sistema di Gestione dei Documenti di STATISTICA (SDMS) .....181
SharePoint ...................................................................................................181
Sistema di Gestione dei Documenti di STATISTICA (SDMS).........................183
5. DOCUMENTI DI STATISTICA .........................................................................187
Registri ..............................................................................................................187
Navigare nell’Albero dei Registri ................................................................189
Spreadsheet (Tabelle Multimediali)..................................................................192
Spreadsheet di Input e di Output ...............................................................196
Provider OLE DB degli Spreadsheet STATISTICA .........................................197
Report ...............................................................................................................199
iv – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Guida di Riferimento: Sommario
Navigare nell’Albero dei Report..................................................................201
Grafici ................................................................................................................202
Macro (Programmi in STATISTICA Visual Basic) ................................................203
Progetti di STATISTICA ......................................................................................204
6. GRAFICI........................................................................................................ 209
Panoramica .......................................................................................................209
Personalizzare i Grafici ......................................................................................210
Categorie Generali dei Grafici ...........................................................................219
Grafici di Dati di Input .......................................................................................220
Grafici di Blocchi di Dati ....................................................................................223
Grafici del Menu Grafici ....................................................................................225
Brushing dei Grafici e Stati di Caso ...................................................................226
Altri Grafici Specializzati....................................................................................230
Creare Grafici tramite STATISTICA Visual Basic ................................................231
7. PERSONALIZZARE STATISTICA .................................................................. 235
Personalizzare l’Interfaccia Utente Interattiva .................................................235
Personalizzare i Documenti ..............................................................................236
Personalizzazioni Locali e Permanenti ..............................................................237
Impostazioni Predefinite Generali .................................................................... 238
Personalizzare i Grafici ......................................................................................239
Mantenere Configurazioni Differenti di STATISTICA ........................................240
Configurazioni Personalizzate per Singoli Utenti in una Rete ..........................240
8. STATISTICA VISUAL BASIC.......................................................................... 243
Registrare Macro (Programmi) in STATISTICA Visual Basic (SVB) .....................246
Macro delle Analisi, Master (Log) Macro e Macro da Tastiera ..................246
Esempio: Registrare un’Analisi .........................................................................252
Oggetti e Documenti ActiveX (Una Nota Tecnica) ............................................261
9. STATISTICA QUERY...................................................................................... 265
Panoramica .......................................................................................................265
STATISTICA Query: Istruzioni Rapide, Passo-Passo ...........................................266
Elaborazione In-Loco di Dati su Server Remoti
(L’Opzione Tecnologica IDP) ........................................................................267
Cubi OLAP..........................................................................................................268
File di Database di Grandi Dimensioni ..............................................................269
STATISTICA Guida di Riferimento – v
Copyright © StatSoft, 2011
Guida di Riferimento: Sommario
10. PROGRAMMARE STATISTICA DA .NET .....................................................273
Aggiungere la Libreria degli Oggetti di STATISTICA
nel Proprio Progetto di .NET..................................................................273
Creare Manualmente la Libreria COM Interop ..........................................275
Sostenere Più Versioni di STATISTICA .........................................................275
Istanziare STATISTICA ..................................................................................276
La Versione della Libreria di STATISTICA .....................................................276
APPENDICI
A. Ottenere Più Aiuti ...................................................................................281
B. STATISTICA Enterprise Server ..................................................................287
C. La Famiglia dei Prodotti di STATISTICA ...................................................299
INDICE ...............................................................................................................313
vi – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
1
CAPITOLO
STATISTICA:
PANORAMICA GENERALE
DELLE CARATTERISTICHE
STATISTICA Guida di Riferimento –1
Copyright © StatSoft, 2011
2 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
1
CAPITOLO
STATISTICA:
PANORAMICA GENERALE
DELLE CARATTERISTICHE
STATISTICA è uno strumento analitico completo, di ricerca, e di business
intelligence. È un sistema integrato di gestione, analisi, esplorazione,
visualizzazione dei dati, e di sviluppo di applicazioni personalizzate che offre
un’ampia selezione di procedure analitiche di base e avanzate per le applicazioni di
business, di data mining, di ricerca scientifica e tecnica.
Funzionalità Analitiche
STATISTICA include non solo procedure analitiche, grafiche e di gestione dei
database generali, ma anche implementazioni complete di metodi specializzati per
l’analisi dei dati (ad es., nelle applicazioni di data mining predittivo, nei settori del
business, delle scienze sociali e della ricerca biomedica o tecnica). Tutti gli
strumenti analitici offerti nella linea di software di STATISTICA sono disponibili
come parte di un pacchetto integrato. Questi strumenti possono essere controllati
attraverso una selezione d’interfacce utente alternative compresi:
• un’interfaccia utente altamente ottimizzata (con opzioni per l’esecuzione di
STATISTICA dall’interno di Microsoft Office e di altre applicazioni),
• un’interfaccia utente poco gravosa e basata su browser (STATISTICA
Enterprise Server) che consente di far eseguire i compiti al server e
permette di lavorare in maniera collaborativa, e
STATISTICA Guida di Riferimento –3
Copyright © StatSoft, 2011
CAPITOLO 1: PANORAMICA DELLE CARATTERISTICHE
• un’interfaccia completa per la programmazione industriale standard,
compatibile con .NET (comprende un linguaggio Visual Basic .NET
compatibile), che offre accesso a più di 14.000 funzioni richiamabili
esternamente.
Le interfacce utente interattive possono essere facilmente automatizzate
attraverso le macro e personalizzate tramite diversi metodi, nonché essere
registrate in forma di script VB standard. L’ambiente integrato di sviluppo può
essere utilizzato per interfacciare STATISTICA con altre applicazioni ed
infrastrutture aziendali o per costruire delle qualsiasi estensioni personalizzate, dai
semplici collegamenti rapidi ai più avanzati progetti di sviluppo su larga scala.
Caratteristiche Uniche
Alcune delle caratteristiche uniche della linea di prodotti di STATISTICA includono:
• l’ampia e completa selezione di implementazioni di procedure analitiche,
• l’impareggiabile scelta, la qualità e la possibilità di personalizzazione della
grafica, integrata perfettamente con ogni procedura di calcolo,
• una selezione di interfacce efficaci ed user-friendly,
• la facilità di personalizzazione utilizzando l’architettura realmente aperta
virtualmente compatibile con qualsiasi ambiente aziendale di sviluppo
(incluso .NET), che espone le oltre 14.000 funzioni di STATISTICA,
• un’ampia selezione di avanzate tecnologie software (cfr. la sezione
Tecnologia Software, pag. 6) responsabile della capacità, performance
(rapidità, risposta), e numero di opzioni di personalizzazione praticamente
illimitate di STATISTICA,
• gli script di R possono essere eseguiti direttamente in STATISTICA e l’output
può essere recuperato negli Spreadsheet e nei Grafici di STATISTICA.
Una delle più importanti caratteristiche uniche della famiglia di applicazioni di
STATISTICA è che tali tecnologie consentono anche agli utenti meno esperti di
indirizzare STATISTICA secondo le proprie specifiche esigenze. È in pratica possibile
personalizzare qualsiasi aspetto di STATISTICA, incluse anche le procedure lowlevel della sua interfaccia utente. La stessa versione di STATISTICA può essere
utilizzata:
4 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
CAPITOLO 1: PANORAMICA DELLE CARATTERISTICHE
• Da utenti principianti per eseguire operazioni di routine attraverso le
schede Rapido del Pannello d’Avvio delle finestre di analisi (contenenti un
limitato numero di pulsanti facilmente intuibili), o anche accedendo a
STATISTICA con i propri browser Web (e “front end” altamente
semplificati), e
• Da analisti esperti, statistici professionisti, e sviluppatori di applicazioni
avanzate in grado d’integrare qualsiasi procedura altamente ottimizzata di
STATISTICA (più di 14.000 di funzioni) all’interno di applicazioni
personalizzate o ambienti di calcolo, attraverso l’impiego di tecnologie web
e .NET compatibili.
La “Filosofia” Generale
dell’Approccio a STATISTICA
La configurazione predefinita di STATISTICA (la sua interfaccia utente generale e le
sue opzioni di sistema) è il risultato di anni di attento ascolto dei suggerimenti da
parte degli utenti.
Abbiamo ricevuto consigli e risposte da decine di migliaia di nostri utenti, da tutti i
continenti e praticamente da qualsiasi ambito di ricerca. Una delle cose più
importanti che abbiamo appreso da questi utenti è quanto differenti siano le loro
necessità e preferenze. Per soddisfare queste diverse tipologie di bisogni,
STATISTICA è stato progettato per offrire forse una delle più flessibili e facilmente
personalizzabili interfacce utente disponibili attualmente sul mercato.
Nonostante STATISTICA fornisca accesso ad un potente arsenale di avanzate
tecnologie software (cfr. la sezione Tecnologia Software, pag. 6), non è necessario
conoscerne i dettagli, in quanto progettato per lavorare automaticamente ed
intuitivamente. Un utente principiante potrebbe non utilizzare mai oltre la metà
del pulsanti disponibili. Ciò nonostante le opzioni più avanzate sono disponibili in
schede poco distanti o tramite un semplice clic del mouse. In pratica ogni aspetto
di STATISTICA (dalla configurazione d’avvio, al modo in cui l’output viene generato
e gestito dal sistema, a come STATISTICA avvisa l’utente di proseguire ad una fase
successiva dell’analisi) può essere modificato con un clic del mouse. Inoltre,
STATISTICA ricorda le selezioni effettuate dall’utente consentendo il ripristino di
ogni fase precedentemente superata. Praticamente tutte le finestre di dialogo
usate per selezionare un’analisi o eseguire un’operazione di routine possono
STATISTICA Guida di Riferimento – 5
Copyright © StatSoft, 2011
CAPITOLO 1: PANORAMICA DELLE CARATTERISTICHE
essere facilmente sostituite (ad es., semplificate, migliorate, o combinate con
procedure personalizzate o progettate dall’utente). In definitiva STATISTICA
apparirà e funzionerà sempre come vuole l’utente.
Tecnologia Software
(Una Nota Tecnica)
La performance, la possibilità di personalizzazione, e l’ampia selezione di opzioni
che possono essere sfruttate per soddisfare i propri bisogni menzionati nella
precedente sezione non sarebbero disponibili se STATISTICA non si basasse sulle
avanzate tecnologie che guidano tutte le funzioni applicative.
STATISTICA utilizza e/o supporta virtualmente tutte le tecnologie software di
ultima generazione attualmente disponibili. Ognuna delle oltre 14.000 funzioni di
STATISTICA è accessibile attraverso applicazioni esterne. In pratica non viene
imposta nessuna limitazione in termini di quantità o complessità di dati che
possono essere archiviati e a cui l’utente può avere accesso. STATISTICA è inoltre
ottimizzato per le applicazioni Web e multimediali. Le procedure grafiche e di
calcolo vengono gestite da innumerevoli applicazioni proprietarie come, ad
esempio, la tecnologia di calcolo “a quadrupla precisione” che consente di
superare i limiti imposti dagli standard d’archiviazione IEEE floating point e di
offrire un’accuratezza di calcolo normalmente incontrata solo in specifiche
applicazioni matematiche (che offrono opzioni arbitrarie di definizione dei
parametri di precisione) e non in applicazioni generiche di elaborazione di grandi
volumi di dati quali sono i più comuni programmi statistici e di data mining.
Come risultato, STATISTICA offre una rapidità, una precisione numerica e una
capacità di risposta incomparabili, rese possibili dal “multithreading” (e
dall’avanzata architettura di elaborazione distribuita/parallela “da supercomputer”
disponibile nella versione Client-Server, cioè STATISTICA Enterprise Server).
L’accesso ai dati è basato su una tecnologia flessibile dei flussi che consente a
STATISTICA di lavorare senza difficoltà sia su semplici file dati di input archiviati sul
disco locale sia attraverso query (interrogazioni) a database multidimensionali
contenenti terabyte di dati e immagazzinati in datawarehouse remoti ed elaborati
in-loco (cioè, senza doverli importare nel dispositivo locale; questa funzionalità è
disponibile nelle diverse versioni aziendali di STATISTICA).
6 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
CAPITOLO 1: PANORAMICA DELLE CARATTERISTICHE
È possibile ad esempio eseguire contemporaneamente istanze multiple di
STATISTICA [in qualsiasi combinazione di ambiente: locale, di rete, e Client-Server
(Web-based], ognuna occupata ad eseguire analisi multiple di dati provenienti da
più file dati di input aperti ed interrogati contemporaneamente, ed i risultati
possono essere organizzati in progetti separati. I file dati di input e di output e i
grafici di STATISTICA possono essere praticamente di qualsiasi dimensione, e
caratterizzati da un’organizzazione gerarchica di documenti di diverso tipo.
L’output può essere indirizzato verso una moltitudine di canali di output quali ad
esempio le tabelle multimediali, registri ad alta prestazione, report (inclusi file .pdf
e documenti Microsoft Office), ed Internet, così come verso STATISTICA Document
Management System, che può essere perfettamente integrato con qualsiasi
applicazione di STATISTICA.
Abilitazione al Web
Una delle caratteristiche uniche della famiglia di applicazioni di STATISTICA è la sua
completa abilitazione al Web, e, nel caso STATISTICA Enterprise Server risulti
installato, sarà possibile non solo far eseguire i compiti direttamente al server, ma
accedere alle funzionalità complete del sistema STATISTICA utilizzando
un’interfaccia poco gravosa al lato client. Tale caratteristica include l’opzione per
l’esecuzione di script già pronti e una pletora di funzionalità interattive, tra le quali
le operazioni come la costruzione interattiva di modelli di data mining predittivo
tramite il trascinamento di frecce all’interno dello spazio di lavoro di STATISTICA
Data Miner (semplicemente utilizzando il browser, senza dover installare alcun
software client sulla propria macchina). Per maggiori informazioni, cfr. l’Appendice
B – STATISTICA Enterprise Server, pag. 285.
Si noti che la maggior parte delle caratteristiche descritte in questo manuale sono
disponibili in tutti i prodotti di STATISTICA, nonostante alcune sezioni del manuale
facciano riferimento solo a specifici prodotti quali STATISTICA Enterprise Server o la
linea di prodotti di STATISTICA Data Miner.
Record of Riconoscimenti
Siamo lieti di annunciare che, al momento dell’attuale stampa, STATISTICA ha
ricevuto le più alte valutazioni in ogni recensione comparativa pubblicata da media
indipendenti. Nell’industria del software, pochi prodotti hanno ottenuto gli stessi
record di STATISTICA.
STATISTICA Guida di Riferimento – 7
Copyright © StatSoft, 2011
CAPITOLO 1: PANORAMICA DELLE CARATTERISTICHE
Per maggiori informazioni su StatSoft e sulle recensioni di successo dedicate a
STATISTICA, si visiti il nostro sito Web all’indirizzo www.StatSoft.it.
8 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
CAPITOLO 1: PANORAMICA DELLE CARATTERISTICHE
2
CAPITOLO
ESEMPI PASSO-PASSO
ANALITICI
Esempio 1: Correlazioni .................................................................... 11
Esempio 2: ANOVA ............................................................................ 36
Esempio 3: Gruppi di Variabili .......................................................... 44
Esempio 4: Analisi Per-Gruppo ......................................................... 47
Esempio 5: Pannelli di Riepilogo dei Risultati
(Qualità, Processi, Sixpacks) ....................................................... 56
Esempio 6: STATISTICA Data Miner ................................................. 63
GESTIONE DEI DATI
Esempio 1: Formule di Spreadsheet e Formule Batch ................... 79
Esempio 2: Dati di Input Direttamente da Excel ............................. 84
continua STATISTICA Guida di Riferimento – 9
Copyright © StatSoft, 2011
CAPITOLO 1: PANORAMICA DELLE CARATTERISTICHE
Esempio 3: Accedere ai Dati Direttamente
da un Database SQL Server ....................................................... 87
Esempio 4: Preparazione dei Dati – Pulitura e Filtraggio .............. 92
Esempio 5: Utilizzare STATISTICA ETL (Estrarre,Trasformare
e Caricare) ................................................................................ 101
INSTALLAZIONI ENTERPRISE
Esempio 1: STATISTICA Enterprise Server –
Download/Offload delle Analisi dai/ai Server ....................... 107
Esempio 2: Utilizzare STATISTICA in Ambienti Regolati............... 112
Esempio 3: STATISTICA Enterprise ................................................ 121
L’Opzione di STATISTICA Enterprise Server ................................... 137
ALTRI ESEMPI
STATISTICA Visual Basic: Registrare un’Analisi ........................... 252
STATISTICA Query: Accedere a Database Esterni ......................... 266
10 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
2
CAPITOLO
ESEMPI PASSO-PASSO
ANALITICI
Esempio 1: Correlazioni
Avviare STATISTICA. Dopo aver installato STATISTICA, è possibile avviare il
programma selezionando STATISTICA dal sottomenu Start – Tutti i Programmi di
Windows.
È inoltre possibile avviare il programma facendo doppio clic sia su STATIST.exe in
Esplora Risorse, che sull’icona di una qualsiasi file di STATISTICA, come ad esempio
uno spreadsheet.
Quando si avvia STATISTICA per la prima volta, apparirà la finestra Interfaccia Utente ,
dove è possibile scegliere se utilizzare la barra multifunzione o i menu classici a
cascata. Tutti gli esempi presenti in questo manuale utilizzano la barra multifunzione.
Si noti che è semplice cambiare tra barra multifunzione e menu classici in ogni
momento. Quando è attiva la barra multifunzione, premere l’icona
nella barra
degli strumenti Accesso Rapido(situata nell’angolo in alto a sinistra) per visualizzare i
menu classici. Quando invece sono attivi tali menu, selezionare Barra Multifunzione
da Visualizza.
STATISTICA Guida di Riferimento –11
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
È possibile minimizzare la barra per guadagnare più spazio nella
finestra principale, sia facendo doppio clic sull’intestazione della
barra selezionata, sia premendo il tasto destro nel lato destro
delle schede e selezionando Minimizza la Barra Multifunzione dal
menu contestuale.
Dopo aver premuto OK in Interfaccia Utente, apparirà la finestra
Benvenuti in STATISTICA , che contiene le opzioni per accedere
alle funzionalità più comuni di STATISTICA.
È possibile spuntare il controllo Non mostrare più questa finestra
presente in fondo alla finestra, se si desidera che non venga
visualizzata all’avvio di STATISTICA. In base alla versione del
programma, possono apparire altre finestre.
Personalizzazione di STATISTICA. Praticamente tutti gli aspetti del comportamento
e dell’aspetto di STATISTICA (anche molte funzionalità elementari illustrate in questo
esempio, quali la directory in cui inviare l’output) possono essere permanentemente
personalizzati per soddisfare le proprie necessità. Ad esempio, è possibile
personalizzare anche il primo passaggio (l’apertura di STATISTICA); è possibile
modificare ad esempio l’impostazione predefinita della modalità a schermo intero,
l’aspetto degli spreadsheet di dati e molti altri aspetti di STATISTICA, che verranno
illustrati dettagliatamente in questo manuale.
Selezione di un file dati. Aprire Adstudy.sta in questo modo: nella scheda Home del
gruppo File, premere la freccia Apri. Dal menu a cascata selezionare Apri Esempi per
visualizzare la finestra Apri un File Dati di STATISTICA. Fare doppio clic sulla cartella
Datasets, e quindi su Adstudy. È possibile aprire file dati anche in questi modi:
1) selezionare Apri Documento dal menu Apri per visualizzare la finestra Apri dove è
possibile sfogliare fino alla posizione del file, 2) premendo il pulsante
posto in
ogni Pannello d’Avvio (la prima finestra visualizzata quando si avviano le analisi o i
grafici), oppure 3) premendo l’icona a forma di cartella sopra Apri della scheda Home.
Spreadsheet di dati (tabelle multimediali). I file dati di STATISTICA vengono
visualizzati in uno spreadsheet (cioè, uno spreadsheet corrisponde ad un unico file
dati). Tutti gli Spreadsheet di STATISTICA sono visualizzati sfruttando la potente
tecnologia alla base delle tabelle multimediali di StatSoft, e possono contenere non
12 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
solo quantità praticamente illimitate di dati, ma anche file sonori, video, documenti
integrati, script di automazione, ed interfacce utente personalizzate.
È possibile avere più di uno spreadsheet di dati aperto allo stesso tempo (collegati ad
analisi differenti).
Le funzionalità di gestione dei dati sono disponibili nella scheda Dati, che è
visualizzabile ogni volta che uno spreadsheet è aperto. I comandi sulle schede sono
organizzati in gruppi logici; ad es., la scheda Dati contiene i gruppi Trasformazioni,
Casi, Variabili, Gestisci e Modalità.
Tutti i comandi nella barra multifunzione e nei menu classici sono descritti negli Aiuti
di STATISTICA; evidenziare un opzione e premere F1 dalla tastiera per visualizzare il
rispettivo menu di Aiuti.
Specifiche di Variabile. L’intestazione delle colonne degli spreadsheet contiene i
nomi di variabile. Fare doppio clic sulla prima intestazione di variabile - GENDER – per
visualizzare la finestra con le relative specifiche di Variabile.
Formule di Spreadsheet. Utilizzando le opzioni di questa finestra, è possibile
modificare i nomi e/o i formati delle variabili , inserire delle formule per ricalcolare i
STATISTICA Guida di Riferimento – 13
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
valori delle variabili, ecc. Se nel riquadro Nome lungo (etichetta o formula con
Funzioni) l’inserimento inizia con il segno uguale (=), STATISTICA interpreta tale
stringa come una formula [i commenti devono essere posti dopo un punto e virgola
(;)]. Ad esempio, se si inserisce =(v2+v3+v4)/3 o =mean(v2:v4), i valori della variabile
corrente saranno sostituiti con la media delle variabili da due a quattro, separata per
ogni caso (riga) dello spreadsheet.
Le specifiche di tutte le variabili possono essere riviste e modificate insieme nella
finestra “combinata” Editor Specifiche di Variabile , alla quale si può accedere
premendo il pulsante Tutte le Specifiche nella finestra delle specifiche della Variabile.
Menu a scelta rapida accessibili dagli spreadsheet. Una caratteristica utile degli
spreadsheet è la lista di comandi disponibili nei menu a scelta rapida. I menu a scelta
rapida sono menu dinamici che vengono visualizzati facendo clic col pulsante destro
del mouse su di un oggetto (ad es., una cella dello spreadsheet, come mostrato
nell’illustrazione seguente). Questi menu comprendono una selezione specifica delle
operazioni di gestione dei dati ed di altre opzioni collegate alla variabile, ai casi, al
blocco di celle o altro correntemente selezionati.
14 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Sei modi di gestire l’output. In STATISTICA è possibile personalizzare la gestione
dell’output (cfr. Sei Canali per l’Output delle Analisi, pag. 163). È possibile indirizzare
tutto l’output su cinque canali di base:
• Registri, cfr. pag. 164,
• Finestre singole, cfr. pag. 167,
• Report, cfr. pag. 167,
• Microsoft Word, cfr. pag. 171,
• Il Web, cfr. pag. 173, e
• SharePoint o STATISTICA Sistema di Gestione dei Documenti (SDMS), cfr. pag.
181
I primi quattro canali di output elencati in precedenza vengono controllati tramite le
opzioni disponibili nel pannello Gestore Output della finestra Opzioni [accessibile
selezionando la scheda Strumenti e premendo Opzioni; in questa finestra, selezionare
Gestore Output nell’elenco ad albero (il pannello a sinistra) per visualizzare le
rispettive specifiche nel panello di destra ]. Le opzioni SharePoint sono situate nella
scheda Home, nel gruppo SharePoint. STATISTICA Sistema di Gestione dei Documenti
(SDMS), una soluzione completa per la gestione dei documenti, è disponibile da
StatSoft. Cfr. Appendice C – Famiglia dei Prodotti di STATISTICA per maggiori
informazioni.
STATISTICA Guida di Riferimento – 15
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Sono presenti numerosi modi per indirizzare l’output sul Web, in base alla versione di
STATISTICA disponibile; ciò significa che possono essere usate diverse combinazioni
(ad es., un registro e un report contemporaneamente), ed ogni canale può essere
personalizzato in molti modi. Inoltre, tutti gli oggetti dell’output (spreadsheet e
grafici) possono contenerne altri integrati e collegati, in modo che l’output di
STATISTICA possa essere organizzato gerarchicamente a piacimento.
Calcolare una matrice di correlazione. Ora verrà calcolata una matrice di
correlazione per le variabili nel file Adstudy.sta. Per visualizzare il Pannello d’Avvio
delle Statistiche di Base e Tabelle, selezionare la scheda Statistiche e, nel gruppo
Base, premere Statistiche di base,
16 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
oppure selezionare Statistiche – Statistiche di Base/Tabelle dal menu Start di
STATISTICA
disponibile nell’angolo in basso a sinistra dello schermo.
A questo punto, assicurarsi che non sia selezionato un blocco di celle nello
spreadsheet. Per deselezionare un blocco, fare clic in una cella qualsiasi dello
spreadsheet. Se è selezionato un blocco, STATISTICA assume che le variabili
corrispondenti siano state preselezionate intenzionalmente per l’analisi, e quando si
premerà il pulsante OK o Riepilogo per produrre i risultati, invece di richiedere una
selezione di variabili, STATISTICA genererà automaticamente le correlazioni per il
blocco evidenziato.
STATISTICA Guida di Riferimento – 17
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Nel Pannello d’Avvio delle Statistiche di Base e Tabelle (mostrato nella seguente
illustrazione),
Selezionare Matrici di correlazione e premere il pulsante OK (oppure doppio clic su
Matrici di correlazione) per visualizzare la finestra Correlazioni di Pearson e Parziali.
Analisi rapide vs. avanzate. Come per la maggior parte delle finestre di
specificazione delle analisi (e altri tipi di finestre di STATISTICA), la finestra di dialogo
Correlazioni di Pearson e Parziali viene organizzata in schede relative al tipo di
opzioni disponibili. Normalmente, sono presenti almeno due categorie di funzionalità.
La scheda Rapido contiene le opzioni usate più comunemente, permettono di
specificare rapidamente un’analisi di base, senza dover impostare numerose opzioni.
18 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
La scheda Avanzate, generalmente, contiene sia le stesse opzioni disponibili nella
scheda Rapido che ulteriori funzionalità utilizzate meno frequentemente (ad es., in
questo caso, le opzioni per salvare le matrici, per produrre statistiche poco richieste, o
per creare dei grafici). Spesso sono disponibili anche altre schede, in funzione al tipo
di analisi richiesta.
Si noti che in alcuni casi, è disponibile solamente la scheda Rapido. In STATISTICA, per
tutte le finestre, è possibile premere F1 sulla tastiera oppure fare clic sul pulsante
nell’angolo in alto a destra dello schermo per aprire gli Aiuti contenenti tutte le
informazioni relative alle opzioni disponibili sulla scheda correntemente selezionata.
La natura “auto-propositiva” delle finestre di STATISTICA. In STATISTICA tutte le
finestre sono “auto propositive”, ossia ogni volta nel quale non si avrà la sicurezza di
cosa selezionare per procedere, basterà semplicemente fare clic sul pulsante OK o
STATISTICA Guida di Riferimento – 19
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Riepilogo e STATISTICA richiederà l’input necessario (ad es., variabili da analizzare)
per raggiungere il passo logico successivo.
Pulsante Variabili. Ogni finestra di specificazione delle analisi di STATISTICA contiene
uno o più pulsanti Variabili utilizzati per visualizzare la finestra di selezione delle
variabili da usare nelle analisi.
Finestra per la selezione delle variabili. Per questo esempio, premere il pulsante
Una lista di variabili (o ALT+V sulla propria tastiera) per visualizzare la finestra di
selezione delle variabili. Si noti che questa finestra viene visualizzata anche quando si
preme il pulsante Riepilogo prima di aver indicato le variabili. (Come accennato
precedentemente, se nel file dati viene selezionato un blocco di variabili, tali variabili
saranno selezionate automaticamente per l’analisi e, quando si farà clic su Riepilogo,
verrà prodotta una matrice di correlazione per le variabili selezionate nel blocco.)
La finestra di selezione delle variabili supporta diverse modalità di selezione (incluse le
convenzioni standard di Windows SHIFT+clic e CTRL+clic per selezionare intervalli
continui o discontinui di variabili).
E’ inoltre possibile ricorrere a diverse scorciatoie ed opzioni per rivedere i contenuti
dei file dati. Ad esempio, si possono ampliare le liste delle variabili per visualizzare i
nomi lunghi o le formule (premendo il pulsante Espandi), oppure si possono rivedere
l’elenco ordinato di valori e delle statistiche descrittive per la variabile selezionata
(facendo clic sul pulsante Zoom).
20 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Per questo esempio, selezionare le variabili da 1 a 10 nella finestra di selezione.
Premere il pulsante OK. Apparirà un messaggio avvisando che una variabile di testo è
stata selezionata. Fare clic sul pulsante Continua con la selezione corrente per
ritornare alla finestra Correlazioni di Pearson e Parziali. Infine, si prema Riepilogo per
generare una matrice di correlazione per le variabili selezionate.
Si noti che invece di premere il pulsante Riepilogo, è possibile fare clic su Riepilogo:
Correlazioni disponibile sulla scheda Rapido o sulla scheda Avanzate e che fornisce gli
stessi risultati. Inoltre, a seconda delle impostazioni predefinite specificate per la
STATISTICA Guida di Riferimento – 21
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
gestione dell’output (sul pannello Gestore Output della finestra Opzioni), lo
spreadsheet Correlazioni potrà essere visualizzato in un report o una finestra singola
od inviato su un documento Word, piuttosto che in un registro come mostrato in
precedenza.
Grafici riassuntivi. STATISTICA fornisce strumenti e metodi estremamente flessibili
per creare dei risultati riassunti tramite grafici e/o tabelle. Ad esempio, riprendere
l’analisi premendo Correlazioni di Pearson… nella barra delle Analisi nell’angolo dello
schermo in basso a sinistra, oppure premendo CTRL+R sulla tastiera, e quindi fare clic
sul pulsante
per visualizzare grafici riassuntivi per ogni coppia di variabili
presente nella matrice di correlazione.
Questi grafici non solo riportano lo scatterplot dei punti corrispondente ad ogni
correlazione, ma anche le distribuzioni (istogrammi) relative ad ogni variabile, così
come il rispettivo coefficiente di correlazione ed equazione di regressione.
STATISTICA incorpora molte di queste visualizzazioni al fine di riassumere le statistiche
descrittive di base, le correlazioni, i risultati degli studi di Capacità delle Misurazioni o
di Processo, oppure altri tipi di analisi dei dati.
Spreadsheet dei risultati (tabelle multimediali). Oltre che per memorizzare i dati,
in STATISTICA gli spreadsheet vengono utilizzati per visualizzare la maggior parte degli
output numerici. Si noti che gli spreadsheet offrono molte caratteristiche ed opzioni di
visualizzazione, e, in questo esempio, le correlazioni significative sono evidenziate in
un formato differente per aiutare a distinguerle; il colore predefinito è il rosso (nello
spreadsheet Correlazioni, si veda la cella adiacente a MEASURE07, sotto GENDER). Gli
22 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
spreadsheet possono contenere da poche celle a gigabyte di output e offrono una
gamma di opzioni per facilitare l’analisi dei risultati e la loro visualizzazione in grafici
predefiniti e personalizzati, come si vedrà più avanti in questo esempio. Inoltre, come
già menzionato, gli spreadsheet di STATISTICA sono gestiti usando la potente
tecnologia delle tabelle multimediali di StatSoft. Possono gestire non solo una
quantità di dati virtualmente illimitata, ma anche video, suoni, interfacce utente
personalizzate, script di auto esecuzione ed una serie di opzioni per la
personalizzazione virtualmente illimitate (cfr. pag. 191 per ulteriori dettagli sugli
spreadsheet).
Opzioni degli spreadsheet. La maggior parte delle funzioni degli spreadsheet sono
disponibili tramite le opzioni della scheda Dati ed i menu contestuali (visualizzabili con
un clic del tasto destro in qualsiasi cella). E’ possibile provare queste opzioni per
verificare come operano, o è possibile vedere le descrizioni premendo il tasto di aiuto
(F1). È possibile cambiare tutte le caratteristiche legate all’aspetto del formato di
visualizzazione per ciascuna colonna, modificare l’output, o aggiungere casi e variabili
vuote per inserire note o output generati da altre fonti. Gli spreadsheet possono
essere stampati in diversi modi (predefinita, tabelle con griglia in qualità
presentazione). Inoltre, per il fatto che gli spreadsheet vengono utilizzati per l’input, si
può facilmente specificare una nuova analisi usando i risultati di un’analisi precedente
(ad esempio, sarebbe possibile usare questa matrice di correlazione per specificare
un’analisi di scaling multidimensionale). Per utilizzare uno spreadsheet dei risultati
come spreadsheet di input, spuntare il controllo Input (posto nella scheda Dati,
gruppo Modalità) quando tale spreadsheet è attivo.
Registri di analisi e altre opzioni di output. Tutti i risultati possono essere
visualizzati (e registrati) in finestre singole, report, o registri, i quali rappresentano la
modalità predefinita (e la più versatile) per gestire l’output dalle analisi (cfr. pagg. 164
e 187 per ulteriori dettagli sui registri). In funzione alle selezioni definite in Gestore
Output (disponibile selezionando la scheda Home e premendo Opzioni nel gruppo
Strumenti e evidenziando Gestore Output, posto sotto Analisi/Grafici), i risultati
possono essere indirizzati in un singolo registro contenente i risultati di tutte le analisi,
un registro separato di analisi contenente i risultati (spreadsheet e grafici) di una
singola analisi, il registro che contiene il file dati originale, o un preesistente registro.
In aggiunta, è possibile scegliere di indirizzare automaticamente i risultati su un
registro, o di inviarli su richiesta facendo clic sul pulsante Aggiungi al Registro nella
STATISTICA Guida di Riferimento – 23
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
scheda Home nel gruppo Output per inviare in un registro singoli spreadsheet grafici
selezionati.
Gestore Output. La scelta del tipo di registro o di utilizzarli o meno, dipende
completamente da come si preferisce registrare i propri dati e risultati. Per cambiare
l’output di destinazione dei risultati solo per una particolare analisi, fare clic sul
pulsante
presente nelle finestre di dialogo di qualsiasi analisi o grafico, e
selezionare Output per visualizzare la finestra Gestore Output di Analisi/Grafico.
Per modificare le opzioni di output per tutte le analisi, utilizzare il Gestore Output
(globale) (il pannello Gestore Output della finestra Opzioni, accessibile selezionando
la scheda Home e premendo Opzioni nel gruppo Strumenti), oppure selezionare
l’opzione Usa Impostazioni di output globali (le modifiche influenzeranno le
impostazioni globali) nella finestra Gestore Output di Analisi/Grafico.
Come per tutti i registri, singoli documenti (ad es., spreadsheet o grafici) o gruppi di
documenti possono essere stampati, estratti, copiati ed eliminati. Cfr. la panoramica
sui Registri a pag. 187 per ulteriori dettagli; si consulti anche il Manuale Elettronico
(Aiuti di STATISTICA).
Copia e Copia con Intestazioni. Il contenuto degli spreadsheet può essere copiato
negli Appunti premendo CTRL+C (il quale copia il contenuto di un blocco selezionato).
Per copiare il blocco con i suoi rispettivi nomi di variabile e di caso, selezionare la
scheda Modifica, e, nel gruppo Appunti/Dati, premere la freccia Copia e specificare
24 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Copia con Intestazioni dal menu a cascata. Quando gli spreadsheet vengono incollati
in un documento di word, saranno attivi (modificabili in-loco) come oggetti di
STATISTICA, tabelle standard formattate RTF, file di testo delimitati da tabulazioni,
testo non formattato, immagini o HTML (a seconda della scelta fatta nella finestra
Incolla Speciale di word.
Stampa di spreadsheet. Per produrre una stampa degli spreadsheet di output,
selezionare la scheda Home, e, nel gruppo File, premere Stampa (o CTRL+P) per
visualizzare la finestra Stampa Spreadsheet, nella quale è possibile specificare le
opzioni di stampa. E’ possibile usare una scorciatoia facendo clic sull’icona della
barra strumenti. Questo metodo non visualizza la finestra di dialogo Stampa posta
nell’angolo in alto a sinistra della barra multifunzione. Questo metodo non visualizza
la finestra Stampa Spreadsheet, ma stampa l’intero documento corrente. Se si
desidera stampare un documento all’interno di un registro, assicurarsi che il
documento sia selezionato nel registro e premere l’opzione Selezione nella finestra
Stampa. È possibile anche estrarre una copia del documento dal registro
(trascinandolo dall’albero, o selezionando il documento e premendo Sposta nella
scheda Registro nel gruppo Estrai) e quindi stamparlo.
Report opzionali di tutti gli output. I registri probabilmente offrono le opzioni più
flessibili per la gestione degli output (cfr. pag. 164 e 187). In alcune circostanze,
comunque, potrebbe essere utile produrre automaticamente i log di tutti i risultati (di
tutti gli spreadsheet e/o grafici) in un tradizionale report in stile word processor dove
commenti e note possono essere inseriti in posizioni arbitrarie, gli oggetti possono
essere accostati, ecc. (cfr. pag. 168 e pag. 199 per ulteriori dettagli relativi ai report).
STATISTICA Guida di Riferimento – 25
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Utilizzare le opzioni nel Gestore Output per creare tali report. Per visualizzare il
Gestore Output, selezionare la scheda Strumenti, premere Opzioni, e, in tale finestra,
evidenziare Gestore Output posto sotto Analisi/Grafici (per le modifiche globali). Per
visualizzare la finestra Gestore Output di Analisi/Grafico, premere il pulsante
in qualsiasi finestra di specifiche dell’analisi o dei grafici e selezionare
Output (per le modifiche locali).
Nel pannello Gestore Output della finestra Opzioni o nella finestra Gestore Output di
Analisi/Grafico, premere la freccia Output su Report. Dal menu a cascata, selezionare
Report Multipli (uno per ogni Analisi/Grafico), Report Singolo (comune a tutte le
Analisi/grafici), o [Seleziona File] (il quale visualizzerà la finestra Apri dove è possibile
selezionare un report esistente).
In Gestore Output, è inoltre possibile specificare il totale di informazioni da includere
negli spreadsheet dei risultati. Utilizzare l’opzione Dettaglio Supplementare per
specificare una delle seguenti possibilità: Brevi (include solamente gli spreadsheet ed i
grafici selezionati), Medie (comprende sia gli spreadsheet ed i grafici selezionati che il
nome del file dati corrente, le informazioni sulle condizioni di selezione dei casi e i
pesi di caso se specificati, la lista di tutte le variabili utilizzate dall’analisi ed i relativi
dati mancanti), Lunghe [include tutte le informazioni del formato Medie e le etichette
26 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
lunghe delle variabili (ad es., le formule), riservando una o più linee per ogni
variabile], o Complete (comprende sia tutte le informazioni del formato Lunghe che
un lista completa di tutte le etichette di testo per ogni variabile selezionata).
Interpretazione dei risultati – Manuale Elettronico di STATISTICA (Aiuti) e
Electronic Statistics Textbook. Ritornare ora all’esempio e alla matrice di
correlazione prodotta.
Ciascuna delle celle della matrice di correlazione rappresenta una valore
(nell’intervallo –1.00 +1.00) che riflette la relazione tra le variabili (si vedano le
intestazioni delle rispettive variabili e casi). Più è elevato il valore assoluto del
coefficiente di correlazione, più la relazione lineare è forte; se il valore è positivo, la
relazione è “positiva” (valori elevati di una variabile corrispondono a valori elevati di
un’altra variabile; analogamente, valori bassi di una variabile corrispondono a valori
bassi di un’altra variabile). Se il valore del coefficiente di correlazione è negativo, vale
l’opposto (bassi valori di una variabile corrispondono a valori elevati dell’altra).
Per ulteriori informazioni sull’interpretazione dei valori delle correlazioni, è possibile
rivedere una completa ed illustrata discussione degli argomenti nel Manuale
Elettronico (Aiuti di STATISTICA), che riporta il contenuto completo dell’Electronic
Statistics Textbook di StatSoft. Per visualizzare il Manuale Elettronico, selezionare la
scheda Aiuti e premere Aiuti dall’omonimo gruppo. Nella scheda Cerca del Manuale
Elettronico, inserire il termine (ad es., Correlazioni) nel campo Digitare la parola o le
parole da cercare, premere il pulsante Elenca Argomenti e quindi selezionare la voce
desiderata nel riquadro Selezionare l’argomento (in questo caso, Correlazioni Panoramica Introduttiva):
STATISTICA Guida di Riferimento – 27
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Un altro prezioso strumento di riferimento è l’Electronic Statistics Textbook di StatSoft
(una risorsa di aiuti statistici pluri-premiata e basata sul Web, raccomandata
dall’Encyclopedia Britannica per la sua “Qualità, Accuratezza, Presentazione e
Utilizzabilità”).
Per aprire questa risorsa, selezionare la scheda Aiuti, e, nell’omonimo gruppo,
premere Manuale Elettronico Statistico.
Anche molti argomenti degli Aiuti di STATISTICA Help contengono collegamenti a
questo manuale.
28 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Premere il collegamento nell’angolo in alto a destra dell’argomento corrente per
visualizzare la corrispondente pagina dell’Electronic Textbook.
STATISTICA Guida di Riferimento – 29
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Produrre grafici dagli spreadsheet. Una delle questioni più importanti (e spesso
trascurata) discusse nel Manuale Elettronico è l'importanza degli scatterplot per
esaminare le correlazioni. Ad esempio, anche coefficienti di correlazione molto grandi
ed estremamente significativi da un punto di vista statistico possono essere causati
interamente da un valore inusuale (“outlier”), ed in questi casi, il coefficiente di
correlazione (anche statisticamente significativo) non dovrebbe essere valido (cioè,
non dovrebbe avere nessuna “validità predittiva”). Seguendo questa considerazione
ed il consiglio del Manuale Elettronico, è opportuno visualizzare uno scatterplot tra le
variabili, che così fornirà una panoramica migliore sulla correlazione.
Mentre viene esaminato lo spreadsheet, è possibile valutare graficamente le
correlazioni, ad esempio, per visualizzare la correlazione tra variabili Measure06 e
Measure04. Per produrre uno scatterplot per queste due variabili, fare clic con il tasto
destro sul rispettivo coefficiente di correlazione (-0.162269). Nel menu di scelta rapida
risultante, selezionare Grafici di Dati di Input - Scatterplot per MEASURE06 Regressione, conf. al 95%, come mostrato nella seguente immagine.
Il grafico richiesto sarà visualizzato.
30 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Come si può notare dal grafico, non ci sono regolarità inusuali nei dati, quindi non
sono presenti dei motivi per essere preoccupati dagli outlier (cfr. la breve discussione
a pag. 30; consultare anche l’argomento nel Manuale Elettronico).
Personalizzazione dei Grafici. Si noti che, quando la finestra del grafico è attiva, la
scheda Modifica contiene opzioni diverse rispetto agli spreadsheet.
Sono presenti un’ampia gamma di strumenti per il disegno e la personalizzazione del
grafico. Molte di queste opzioni sono disponibili anche menu contestuali accessibili
facendo clic col tasto destro su specifiche parti del grafico. Si noti che le opzioni sui
menu di scelta rapida sono gerarchiche, e questo significa che le prime due opzioni
applicano specificatamente al grafico l’elemento selezionato, mentre le opzioni
inferiori visualizzeranno finestre di dialogo in grado di offrire ulteriori opzioni su
un’ampia varietà di elementi grafici collegati all’elemento selezionato. Premendo il
tasto destro del mouse in un qualsiasi posto nello spazio vuoto al di fuori degli assi del
grafico viene visualizzato un menu di opzioni globali (come mostrato nella seguente
immagine).
STATISTICA Guida di Riferimento – 31
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Per ulteriori informazioni sulla personalizzazione grafica, cfr. pag. 210 ed il Manuale
Elettronico.
Ora si ritorni a considerare lo spreadsheet.
Scorrimento separato negli spreadsheet. Gli spreadsheet possono essere divisi
fino a quattro sezioni (pannelli) trascinando i controlli di separazione (il piccolo
rettangolo sopra la barra di scorrimento verticale o alla sinistra della barra di
scorrimento orizzontale). Questo risulta essere molto utile se si lavora su grosse
quantità di informazioni e si vogliono consultare i risultati in parti differenti dello
spreadsheet. Quando il puntatore del mouse viene posizionato in un controllo di
separazione, il puntatore del mouse si modificherà in o . Ora, per effettuare la
separazione, lo si trascini nella posizione desiderata.
32 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
È possibile cambiare la posizione della separazione trascinando il controllo di
separazione (ora posizionato tra i pannelli) in una nuova posizione.
Si noti che i pannelli verticalmente separati scorrono insieme quando si scorrono i dati
orizzontalmente; mentre vale il contrario per i pannelli orizzontalmente separati. Per
informazioni sull’evidenziazione di blocchi di dati tra pannelli separati e la velocità
variabile di evidenziazione di blocchi di dati, si veda Come posso espandere un blocco
nella parte esterna della schermata dello Spreadsheet corrente? nel Manuale
Elettronico.
Drag-and-drop (Trascina-e-Incolla). STATISTICA, nello spreadsheet, supporta
completamente le caratteristiche standard (stile Microsoft Excel) di drag-and-drop. Ad
esempio, per spostare un blocco, , si punti il bordo della selezione (il puntatore del
mouse cambierà in una freccia) e lo si trascini in una nuova posizione.
Per copiare un blocco di dati si punti sul bordo della selezione (il puntatore del mouse
cambierà in una freccia), e si trascini la selezione in una nuova posizione mentre si
preme il tasto CTRL. Si noti che quando si trascina la selezione, viene visualizzato un
STATISTICA Guida di Riferimento – 33
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
segno più (+) di fianco al puntatore del mouse ad indicare che si sta effettuando una
copia del testo piuttosto che il suo spostamento (cfr. l’immagine che segue).
Per inserire un blocco tra colonne o righe, si punti il bordo della selezione (il
puntatore del mouse cambierà in una freccia) e quindi si trascini la selezione
premendo il tasto SHIFT.
Se si punta tra le righe, verrà visualizzata una barra di inserimento tra le righe, e
quando si rilascerà il pulsante del mouse, il blocco verrà inserito tra queste due righe
[creando nuovi casi]. Se si punta tra le colonne, verrà visualizzata una barra di
inserimento tra le colonne, e quando si rilascerà il pulsante del mouse, il blocco si
inserirà tra queste due colonne [creando nuove variabili].
Si noti che anche premendo il tasto CTRL mentre si trascina la selezione, il blocco sarà
copiato e inserito invece che spostato e inserito; apparirà un più di fianco il puntatore
del mouse (come mostrato nella successiva illustrazione).
In aggiunta, possono essere estrapolati (Riempimento Automatico) una serie di valori
all’interno di un blocco trascinando la “Maniglia di estensione” (il piccolo quadrato
posizionato sull’angolo in basso a destra del bordo del blocco
34 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Manuale Elettronico. STATISTICA fornisce un Manuale Elettronico contenente una
documentazione comprensiva su tutte le procedure e le opzioni del programma,
disponibili in un sistema sensibile al contesto (sono inclusi oltre 100 megabyte di
documentazione in formato compresso). Per accedere al manuale, selezionare la
scheda Aiuti e premere Aiuti dall’omonimo gruppo, oppure fare clic sull’icona
nell’angolo in alto a destra della barra multifunzione. E’ inoltre possibile puntare
(evidenziare) un comando del menù o selezionare una scheda in una finestra per la
quale si desiderano le informazioni, e premere F1 sulla tastiera per visualizzare la
rispettiva sezione degli Aiuti, o premere il pulsante sulla barra superiore di tutte le
finestre.
Data la sua struttura ad ipertesti dinamici, le schede organizzative (Sommario, Indice,
Cerca, e Preferiti), e le altre opzioni usate per personalizzare il sistema di Aiuti in
linea, usare il Manuale Elettronico risulta essere molto più veloce che consultare le
informazioni nei tradizionali manuali.
Inoltre, quando si passa il puntatore sopra i comandi, appaiono delle brevi spiegazioni
sulla loro funzione.
Suggeritore Statistico. Nel Manuale Elettronico di STATISTICA è integrato un
Suggeritore Statistico. Nel gruppo Aiuti dell’omonima scheda, premere Suggeritore
Statistico per visualizzare una serie di semplici domande relative la natura del
problema di ricerca e del tipo di dati. Si faccia un clic sui collegamenti appropriati per
rispondere alle domande, in modo da visualizzare i suggerimenti per le procedure
statistiche che appaiono più adeguate, contenenti i collegamenti che guidano alle
specifiche procedure disponibili all’interno del sistema STATISTICA.
STATISTICA Guida di Riferimento – 35
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
I salti diretti (collegamenti ipertestuali) presenti nel Suggeritore Statistico guidano
l’utente alle Panoramiche Introduttive, le quali affrontano dettagliatamente i rispettivi
metodi statistici e procedure.
Esempio 2: ANOVA
Eseguire il modulo ANOVA. Per questo esempio di un piano 2 x 2 (tra) x 3 (a misure
ripetute), aprire il file dati Adstudy.sta. Quindi, per iniziare un’analisi
ANOVA/MANOVA, selezionare la scheda Statistiche e nel gruppo Base premere
ANOVA per visualizzare il Pannello d’Avvio di ANOVA/MANOVA Generale.
36 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Questa finestra viene utilizzata per specificare analisi molto semplici (ad es.,
attraverso i piani ANOVA ad una via con un solo fattore tra gruppi) e analisi più
complesse (ad es., attraverso piani ANOVA a misure ripetute con più fattori tra gruppi
e un fattore entro soggetti).
Piano. Si selezioni ANOVA a misure ripetute come Tipo di analisi e Specifiche rapide
come Metodo di specificazione, quindi si faccia clic sul pulsante OK del Pannello
d’Avvio di ANOVA/MANOVA Generale per visualizzare la finestra di dialogo
ANOVA/MANOVA ANOVA Misure Ripetute.
Specificare il piano (variabili). Il primo fattore (tra gruppi) è Gender (con due livelli:
Male e Female). Il secondo fattore (tra gruppi) è Advert (con 2 livelli: Pepsi e Coke). I
due fattori sono incrociati, il che significa che ci sono soggetti sia Male che Female nei
gruppi Pepsi e Coke. Ognuno di questi soggetti ha risposto a tre domande (questo
fattore a misure ripetute verrà chiamato Response; ha tre livelli rappresentati da dalle
variabili Measure01, Measure02 e Measure03).
STATISTICA Guida di Riferimento – 37
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si faccia clic sul pulsante Variabili (sulla finestra di dialogo ANOVA/MANOVA ANOVA
Misure Ripetute) per visualizzare la finestra di dialogo per la selezione delle variabili.
Si selezionino le variabili comprese tra Measure01 e Measure03 come variabili
dipendenti (nel campo Lista variabili dipendenti) e le variabili Gender e Advert come
fattori [nel campo Predittori categoriali (fattori)].
Quindi, si faccia clic sul pulsante OK per ritornare alla finestra di dialogo precedente.
Piano a misure ripetute. Il piano degli esperimenti che si sta analizzando può essere
riassunto come segue:
Tra Gruppi
Tra Gruppi
Fattore #1: Fattore #2:
Gender
Advert
Fattore Misure Ripetute: Response
Livello #1: Livello #2: Livello #3:
Measure01
Measure02
Measure03
Soggetto 1
Male
Pepsi
9
1
6
Soggetto 2
Male
Coke
6
7
1
Soggetto 3
Female
.
.
.
Coke
.
.
.
9
.
.
.
8
.
.
.
2
.
.
.
Specificare un fattore a misure ripetute. Le selezioni minime necessarie ora sono
complete, e, se non si desidera selezionare il fattore a misure ripetute, è possibile fare
clic sul pulsante OK e vedere i risultati dell’analisi. Comunque, per l’esempio in
questione, sarà necessario specificare che le tre variabili dipendenti selezionate sono
interpretate come tre livelli di un fattore (entro soggetti) a misure ripetute. Se non si
specifica questo, STATISTICA assume che le tre variabili dipendenti sono “differenti”
ed esegue l’analisi MANOVA (ovvero, ANOVA Multivariata).
38 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Per definire il fattore a misure ripetute desiderato, si faccia clic sul pulsante Effetti
entro-sogg. disponibile sulla scheda Rapido per visualizzare la finestra di dialogo
Specificare fattore entro soggetti.
Si noti che STATISTICA ha proposto la selezione di un fattore a misure ripetute con 3
livelli (nome predefinito di R1). Si può specificare solamente un fattore entro soggetti
(a misure ripetute) tramite questa finestra di dialogo. Per specificare fattori multipli
entro soggetti, si utilizzi il modulo Modelli Lineare Generali (disponibile nel pacchetto
opzionale Modelli Lineari/Non Lineari Avanzati). Si prema il tasto F1 (o si faccia clic su
) nella finestra Specificare fattore entro soggetti per avere una spiegazione
completa sulle misure ripetute e sugli esempi di piani nel Manuale Elettronico.
Per questo esempio, modificare il nome del fattore (ad es., cambiare il nome
predefinito di R1 in RESPONSE) e fare clic sul pulsante OK per uscire dalla finestra.
Codici (che definiscono i livelli) per fattori tra gruppi. Non è necessario per
l’utente specificare manualmente i codici per i fattori tra gruppi [cioè, non è
obbligatorio dire a STATISTICA che la variabile Gender ha due livelli: 1 e 2 (o Male e
Female)] a meno che non si voglia impedire a STATISTICA l’uso, per impostazione
predefinita, di tutti i codici incontrati nel gruppo di variabili selezionate nel file dati.
Per inserire i codici in modo personalizzato, si faccia clic sul pulsante Codici fattori per
accedere alla finestra di dialogo Selezione codice per var. indip (fattori).
Prima di effettuare le selezioni, è’ possibile usare le opzioni contenute in questa
finestra di dialogo per rivedere i valori delle singole variabili facendo clic sul pulsante
Zoom, che avvia una ricerca nel file dati dei campi contenenti i codici (ad es., Gender
STATISTICA Guida di Riferimento – 39
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
e Advert) per una singola variabile o tutte, ecc. Per ora, si faccia clic sul pulsante OK;
STATISTICA caricherà automaticamente nei campi di codice tutti i valori distinti
incontrati nelle variabili selezionate,
e chiuderà la finestra di dialogo.
Eseguire l’analisi. Quando si fa clic sul pulsante OK della finestra di dialogo
ANOVA/MANOVA ANOVA Misure Ripetute, viene eseguita l’analisi, e viene
visualizzata la finestra di dialogo ANOVA Risultati, che contiene varie opzioni per gli
spreadsheet di output e per i grafici.
Questa finestra contiene molte schede, che consentono di individuare rapidamente le
opzioni dei risultati. Ad esempio, se si desidera fare un confronto pianificato, fare clic
sulla scheda Confronti. Per vedere le statistiche sui residui, selezionare la scheda
Residui. Per questo esempio, si utilizzeranno solamente le opzioni disponibili nella
scheda Rapido.
40 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Esaminare i risultati dell’analisi ANOVA. Cominciare analizzando la tabella di
riepilogo dell’ANOVA di tutti gli effetti facendo clic sul pulsante Tutti gli effetti (quello
con la seguente icona: ).
L’unico effetto (ignorando l’intercetta) in questa analisi statisticamente significativo (p
= .007) è l’effetto RESPONSE. Questo risultato può essere causato da strutture dei
valori delle medie molto diversi dell’effetto RESPONSE (per maggiori informazioni, si
consulti ANOVA – Panoramica Introduttiva nel Manuale Elettronico). Si vedranno
graficamente le medie marginali per questo effetto per vedere cosa significa
effettivamente quanto detto.
Per tornare alla finestra ANOVA Risultati (cioè, per “riprendere” l’analisi), si prema
CTRL+R o si faccia clic sul pulsante ANOVA Risultati sulla barra di analisi. Quando
viene visualizzata la finestra di dialogo ANOVA Risultati, si faccia clic sul pulsante Tutti
gli effetti/Grafici per visualizzare la finestra di dialogo Tabella di Tutti gli Effetti per
rivedere le medie di ogni singolo effetto.
STATISTICA Guida di Riferimento – 41
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Questa finestra di dialogo contiene una tabella di riepilogo chiamata Tabella di tutti gli
Effetti (contenente la gran parte delle informazioni viste nello spreadsheet tutti gli
effetti) e viene usata per analizzare i singoli effetti in forma grafica, come grafico delle
rispettive medie (o, opzionalmente, spreadsheet dei rispettivi valori della media).
Grafico di medie per un effetto principale. Nella Tabella di Tutti gli Effetti, si faccia
doppio-clic sull’effetto principale significativo RESPONSE (quello marcato con
asterisco nella colonna p) per generare il rispettivo grafico.
Il grafico indica che esiste un evidente trend decrescente; le medie per le tre risposte
consecutive diventano gradualmente più basse. Anche se non ci sono interazioni
significative in questo disegno (cfr. la discussione della Tabella di Tutti gli Effetti, pag.
41), si controllerà l’interazione di ordine più alto per esaminare la consistenza di
questo marcato trend decrescente attraverso i fattori tra gruppi.
Grafico di medie per un’interazione a tre vie. Per vedere il grafico dell’interazione
di ordine più alto, sulla finestra di dialogo Tabella di Tutti gli Effetti, si faccia doppioclic sulla riga marcata RESPONSE*GENDER*ADVERT, che rappresenta l’interazione tra i
fattori 1 (Gender), 2 (Advert), e 3 (Response). Viene visualizzata una finestra di dialogo
intermedia, Specificare organizzazione fattori nel grafico, che viene usata per
personalizzare la combinazione dei fattori nel grafico (si noti che, diversamente dal
precedente grafico di un semplice fattore, l’effetto corrente può essere visualizzato in
modi diversi).
42 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si faccia clic sul pulsante OK per accettare la combinazione predefinita e produrre il
grafico delle medie.
Come si può vedere, questo insieme di medie (diviso per i livelli dei fattori tra gruppi)
non indica alcuna deviazione saliente dal modello completo mostrato nel primo
grafico (per l’effetto principale, RESPONSE). Ora si può continuare per esaminare
interattivamente altri effetti; si eseguano i confronti post-hoc, confronti pianificati,
diagnostiche estese, ecc., per esplorare ulteriormente i risultati.
Analisi interattiva dei dati in STATISTICA. Questo esempio illustra il modo in cui
STATISTICA supporta l’analisi interattiva dei dati. Non è necessario specificare tutto
l’output che deve essere generato prima di vedere i risultati. Anche i piani di analisi
più semplici possono produrre grandi quantità di output e grafici, ma solitamente non
si può conoscere cosa sarà interessante fino a che non si avrà una possibilità di
rivedere l’output di base. Con STATISTICA, dopo aver elaborato i dati e valutato
l’output di base, è possibile selezionare specifici tipi di output, condurre test
STATISTICA Guida di Riferimento – 43
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
interattivi in sequenza, ed eseguire analisi supplementari “what-if” (cosa accade se).
Le flessibili procedure di calcolo di STATISTICA e l’ampia selezione di opzioni utilizzate
per visualizzare qualsiasi combinazione di valori di un output numerico, offrono infiniti
metodi per esplorare i dati e verificare le ipotesi.
Analisi automatizzate (macro e STATISTICA Visual Basic). Qualsiasi selezione che
viene fatta durante un’analisi interattiva dei dati (inclusi la specificazione dei progetti
e la scelta delle opzioni di output) viene automaticamente registrata nel codice
considerato come standard industriale di Visual Basic. È possibile salvare queste
macro per usi ripetuti (è possibile anche assegnare loro pulsanti nella barra strumenti,
modificarle, combinarle con altri programmi, ecc.). Per ulteriori informazioni, cfr. il
Capitolo 8 – STATISTICA Visual Basic pag. 241 o STATISTICA Visual Basic Primer.
Esempio 3: Gruppi di variabili
STATISTICA offre un’opzione unica – gruppi di variabili – per l’individuazione rapida e
semplice di sottoinsiemi di dati. I gruppi possono essere creati per organizzare grandi
insiemi di variabili e facilitare la selezione ripetuta del medesimo insieme di variabili.
Aprire EnginePerformance.sta. Questo insieme di dati descrive le performance di
grandi motori e contiene diversi parametri di processo monitorati durante la
produzione. Il file contiene le informazioni relative a 128 motori; in sede di verifica
vengono misurate l’efficienza (Efficiency), l’economicità (Fuel Economy) e la potenza
(Power); ulteriori 74 parametri sono stati raccolti durante il costruzione di ogni singolo
motore.
In questo esempio sarà necessario generare differenti analisi utilizzando il medesimo
insieme di variabili.
Selezionare la scheda Dati, e, nel gruppo Variabili, premere Gruppi per visualizzare il
Gestore Gruppi di Variabili.
44 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Premere il pulsante Nuovo per visualizzare la finestra Nuovo Gruppo,
inserire il nome Production all’interno del campo Nome gruppo, e fare clic su OK. A
questo punto verrà visualizzata la finestra Seleziona variabili per gruppo, contenente
tutte le variabili presenti nell’insieme di dati EnginePerformance.sta.
Per queste analisi, è necessario selezionare le variabili Input01-Input05, Input20,
Input30-Input35, e Input70. È possibile selezionare queste variabili usando le
convenzioni standard Windows SHIFT+click e CTRL+click per selezionare
rispettivamente intervalli di variazione e liste discontinue di elementi.
Premere il pulsante OK per chiudere la finestra Seleziona variabili per gruppo e per
tornare al Gestore Gruppi di Variabili.
STATISTICA Guida di Riferimento – 45
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Il pannello di sinistra di questa finestra contiene i nomi di tutti i gruppi definiti per
questo spreadsheet (se necessario è possibile creare numerosi gruppi per il medesimo
spreadsheet). Il pannello di destra contiene i contenuti dei gruppi correntemente
selezionati nel pannello di sinistra. Nel caso in cui entrambi i pannelli siano vuoti,
nessun gruppo è stato creato per tale spreadsheet.
È possibile apportare delle modifiche ad un gruppo premendo il pulsante Modifica,
cancellare un gruppo facendo clic su Elimina, cambiare il titolo di un gruppo
premendo Rinomina, e generare uno spreadsheet contenente le informazioni
riguardanti i gruppi definiti per lo spreadsheet di dati attivo facendo clic su Output su
Spreadsheet.
In questo esempio, premere il pulsante OK per accettare i gruppi creati e chiudere la
finestra Gestore Gruppi di Variabili. Quindi, selezionare la scheda Statistiche, e nel
gruppo Base fare clic su Regressione Multipla per visualizzare il Pannello d’Avvio della
Regressione Lineare Multipla. Sulla scheda Rapido, premere il pulsante Variabili per
aprire la finestra di selezione delle variabili.
I gruppi sono visualizzati tra parentesi quadre ed elencati (in ordine alfabetico) in cima
alla lista di variabili. In Lista variabili indipendenti, selezionare il gruppo Production
per specificare – con un unico clic del mouse - Input01-Input05, Input 20, Input 30Input35, e Input 70 come variabili indipendenti da utilizzare nell’analisi.
46 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Nel caso in cui non si fosse sicuri di quali variabili siano state incluse nella lista, si
muova il puntatore del mouse sul nome del gruppo all’interno della finestra: in questo
modo verrà visualizzato un Suggerimento indicante i numeri delle variabili.
Inoltre, è possibile visualizzare le liste di variabili (per nome) premendo il pulsante
[Gruppi] nella finestra di selezione delle variabili. Apparirà così il Gestore Gruppi di
Variabili.
Si noti che i gruppi vengono definiti per un singolo spreadsheet, e sono utilizzati solo
per la selezione delle variabili. Quindi non saranno elencati nei report od in altri
output.
Come si può osservare in questo esempio, questa funzionalità consente di risparmiare
una considerevole quantità di tempo qualora si desideri selezionare ripetutamente la
medesima lista di variabili sul medesimo spreadsheet di analisi.
Esempio 4: Analisi Per-gruppo
STATISTICA offre una potente opzione che consente di trasformare ogni analisi
statistica o grafica in un’analisi per gruppi. Quando l’utente giunge ad una finestra dei
risultati relativa ad una qualsiasi analisi, è possibile selezionare una o più variabili di
raggruppamento, e quindi creare i risultati 1) per tutti i casi presenti nei dati
combinati, e/o 2) segmentati secondo ogni possibile combinazione di valori unici
presenti nelle variabili di raggruppamento.
STATISTICA Guida di Riferimento – 47
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si tratta di uno strumento molto potente dedicato all’analisi interattiva ed esplorativa
dei dati, che consente all’utente di verificare rapidamente la presenza di andamenti o
di specifici risultati in tutti i diversi sottogruppi, campioni, o strati di dati.
Per esempio, è possibile trovarsi ad eseguire un’analisi di regressione multipla, e
decidere di ottenere i risultati segmentati per Sesso e un’altra variabile di
raggruppamento senza dover uscire dalla finestra corrente. Dopo aver selezionato
PerGruppo ), ogni volta che verrà
(abilitato) questa opzione (premendo il pulsante
selezionato uno specifico pulsante dei risultati (spreadsheet o grafici riassuntivi), tutti
i risultati saranno calcolati non solo per tutti i gruppi (opzionalmente), ma anche per
ogni combinazione unica di variabili di gruppo specificate (ad es., Sesso ed un’altra
variabile di raggruppamento).
I risultati dell’analisi PerGruppo possono essere inseriti sia in un registro predefinito
dei risultati ognuno nella relativa cartella, etichettati con la rispettiva condizione pergruppo (ad esempio, Gender=Female; Time=After1), oppure possono essere inseriti
nella medesima cartella contenente tutti gli altri risultati.
48 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
È possibile ad esempio creare più grafici a linee con lo scopo di descrivere un processo
multivariato a lotti, creando un grafico separato (“delle traiettorie”) per ogni lotto.
Esplorazione di Dati Sperimentali Utilizzando
l’Opzione Per-Gruppo
Questo esempio è basato sul file dati Tomatoes.sta, uno dei file dati descritti in
grande dettaglio nella sezione Pianificazione degli Esperimenti del Manuale
Elettronico di STATISTICA (si veda l’esempio Pianificazione e Analisi di un Esperimento
2332). In questo esempio, Connor and Young (in McLean and Anderson, 1984)
descrivono un esperimento (tratto da Youden and Zimmerman, 1936) sul ricorso a
diversi metodi di gestione dei processi di semina nella produzione di piante di
pomodoro.
Iniziare l’analisi aprendo il dataset di esempio Tomatoes.sta. Selezionare la scheda
Home. Nel gruppo File, fare clic sulla freccia Apri e selezionare Apri Esempi dal menu
a cascata per visualizzare la finestra Apri un File Dati di STATISTICA. Fare doppio clic
sulla cartella Datasets, e aprire il file dati di STATISTICA Tomatoes.sta.
STATISTICA Guida di Riferimento – 49
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Riportate sopra vi sono una serie di righe (casi) del file dati. Per un’analisi completa di
questi dati è possibile consultare gli esempi su Pianificazione degli Esperimenti
contenuti negli Aiuti.
Esplorazione delle Tendenze per Varietà
In questo esempio viene illustrato un tipico esempio di “flusso di lavoro” applicato a
dati discreti o relativi a produzioni a lotti. L’obiettivo dell’analisi sarà cioè verificare
(graficamente o analiticamente) come alcune tendenze o distribuzioni si presentino
ugualmente in tutti i campioni, parti, o lotti.
Saranno esplorati gli effetti Metodo di Produzione (Production Method), Condizione
del Suolo (Soil Condition) e Dimensione dell’irrigamento (Potsize) sulla produzione
(Pounds), e sarà valutata la presenza di determinate tendenze in corrispondenza di
ognuna della Varietà (Variety) analizzate nello studio. Invece di eseguire un’analisi
completa della varianza (così com’è descritta nell’esempio Pianificazione degli
Esperimenti degli Aiuti Elettronici), verranno utilizzati principalmente metodi grafici e
d’ispezione visuale.
Specificazione dei grafici di variabilità. Selezionare la scheda Grafici. Nel gruppo
Altri, premere 2D e dal menu a cascata selezionare Grafici di Variabilità per
visualizzare la finestra Grafico di Variabilità. Premere il pulsante Variabili, e nella
finestra Seleziona Variabili per Grafico Variabilità, selezionare POUNDS come Var.
dipendente, e SOIL CONDITION, POTSIZE, e PRODUCTION METHOD dalla lista Var. di
gruppo.
50 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Più avanti nell’esempio, verrà creato il grafico condizionato per VARIETY per illustrare
le caratteristiche Per Gruppo. Premere ora il pulsante OK.
Riordinare le variabili per il grafico di variabilità. Per ottenere il grafico più
informativo possibile, occorre riordinare le variabili in modo che PRODUCTION
METHOD sia il primo fattore nella lista dei Fattori. Si faccia un clic su questa variabile
all’interno della lista Fattori, e quindi, premendo il pulsante sinistro del mouse, la si
trascini in cima alla lista.
STATISTICA Guida di Riferimento – 51
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Infine, sempre nella finestra Grafico Variabilità, ci si assicuri che PRODUCTION
METHOD sia selezionata all’interno della lista Fattori, e si selezioni l’opzione Box
attorno ai gruppi.
Specifiche “per-gruppo.” In questo caso si desidera creare il grafico di variabilità per
PRODUCTION METHOD, SOIL CONDITION e POTSIZE in corrispondenza di tutte le
varietà combinate di pomodori, e segmentate per VARIETY (un grafico per ogni
VARIETY). Premere il pulsante Per Gruppo per visualizzare la finestra Per Gruppo.
Premere il pulsante Variabili di Gruppo per visualizzare la finestra Selezione Per
Variabili, e si specifichi VARIETY come variabile Per Gruppo.
Si noti che è possibile specificare più di una variabile PerGruppo, ed in questo caso
tutte le analisi successive verranno eseguite secondo una segmentazione determinata
da ogni combinazione unica dei valori trovati nelle variabili PerGruppo.
Visualizzazione dei grafici di variabilità. Adesso si prema OK per chiudere la
finestra di dialogo Selezione PerVariabili, e si faccia clic su OK per chiudere la finestra
di dialogo PerGruppo. Nella finestra di dialogo Grafico di Variabilità, e si prema OK
per creare i grafici.
52 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si noti come Variability Plot è stato creato 1) per Tutti i Gruppi, e 2) per ogni Variety
(Bonny, e Marglobe).
Se si osservano attentamente questi grafici, si noterà come Production Method faccia
poca differenza (nei valori osservati di Pounds) per Variety=Bonny, mentre per
Variety=Marglobe, il metodo FibrePl mostra minore variabilità nei dati, i quali
generalmente sono caratterizzati da una variabilità maggiore nella distribuzione
complessiva di tutti i dati della variabile Pounds.
Statistiche Descrittive Per Gruppo
Si utilizzino le opzioni disponibili in Statistiche Descrittive per esplorare ulteriormente
questo dataset. Selezionare la scheda Statistiche. Nel gruppo Base, premere
Statistiche di Base per visualizzare il Pannello d’Avvio Statistiche di Base e Tabelle. Si
selezioni Segmentazione e ANOVA 1-Via, e si faccia un clic sul pulsante OK per
visualizzare la finestra Statistiche Per Gruppi (Segmentazione). Si prema il pulsante
Variabili, e nella finestra Selezionare le variabili dipendenti e di gruppo, si specifichi
Pounds nella lista Variabili Dipendenti e Production Method all’interno della lista
Variabili di gruppo. Quindi si faccia clic su OK per chiudere la finestra di dialogo
standard per la selezione delle variabili, e clic su OK in Statistiche Per Gruppi
(Segmentazione) per visualizzare la finestra di dialogo Statistiche Per Gruppi Risultati.
In questo esempio si desidera calcolare le Statistiche per Gruppi, segmentate per
Varietà di pomodoro. Quindi si prema il pulsante PerGruppo, e nella finestra di
STATISTICA Guida di Riferimento – 53
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
dialogo PerGruppo, si prema il pulsante Variabili di Gruppo. All’interno della finestra
di dialogo Selezione PerVariabili, si selezioni Variety come variabile Per Gruppo.
Adesso, si prema OK in questa finestra di dialogo ed OK nella finestra PerGruppo.
Nella finestra di dialogo Statistiche Per Gruppi – Risultati, si faccia un clic, in
sequenza, sul 1) pulsante Riepilogo, 2) pulsante Analisi della Varianza, e 3) pulsante
Grafico delle Interazioni.
54 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Tutti i risultati saranno inseriti nella rispettiva cartella, oppure all’interno della cartella
Tutti Gruppi, oppure nelle cartelle Variety=Bonny o Variety=Marglobe.
Adesso è possibile visualizzare i risultati per tutti i gruppi combinati e segmentati per
Variety; come si può osservare Production Method sembra avere un certo effetto sul
prodotto (Pounds) in corrispondenza di Variety=Marglobe, mentre non vi è alcuna
indicazione sull’influenza di tale effetto su Variety=Bonny.
Riepilogo
Con STATISTICA, è possibile eseguire analisi per-gruppo ad-hoc virtualmente da
qualsiasi finestra dei risultati, con la possibilità di visualizzare i risultati per tutti i
gruppi combinati e segmentati secondo una o più variabili di gruppo. Questa
funzionalità molto importante per le analisi esplorative dei dati può essere sfruttata
per confrontare gruppi e verificare la consistenza dei risultati lungo i diversi gruppi
coinvolti nell’analisi.
Prima di concludere questa sezione, è utile fare alcune considerazioni circa i dettagli
tecnici relativi all’implementazione di queste funzionalità. Quando si eseguono analisi
per-gruppo, come in questo esempio, il programma ri-eseguirà in realtà le analisi per
ogni gruppo (e per tutti i gruppi), facendo leva sul codice macro di STATISTICA Visual
Basic registrato automaticamente nel corso delle analisi interattive, e che può essere
salvato in forma di macro come descritto altrove in questo manuale (cfr. il Capitolo 8 STATISTICA Visual Basic). Quando è richiesta l’analisi d’insiemi di dati molto grandi (ad
es., nei piani sperimentali non bilanciati molto grandi od in problemi complessi in cui
siano richiesti numerosi calcoli iterati prima della visualizzazione dei risultati), le
singole analisi potrebbero richiedere quantità significative di tempo di calcolo, in
particolare quando sono presenti molti gruppi unici identificabili nei dati (ad es.,
s’immagini un complesso modello lineare generalizzato stimato per più di 100 gruppi).
Quindi, è generalmente buona idea iniziare ogni analisi esplorativa con il calcolo di
semplici statistiche descrittive, tabelle di frequenza, e grafici con l’obiettivo di
comprendere la struttura dei dati e identificare il numero di gruppi unici
(combinazione di valori nelle variabili di gruppo) presenti nei dati
STATISTICA Guida di Riferimento – 55
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Esempio 5: Pannelli di Riepilogo dei
Risultati (Qualità, Processo, Sixpacks)
Molte analisi disponibili in STATISTICA supportano grafici e report riassuntivi
organizzati in un singolo documento. Nelle applicazioni produttive e Six Sigma, questi
tipi di visualizzazione vengono anche detti “Quality Sixpack” in quanto riassumono la
qualità di una singola variabile tramite sei grafici e tabelle singole.
STATISTICA incorpora diverse visualizzazioni per riassumere le informazioni relative
alle statistiche descrittive di base, alle correlazioni, ai risultati dell’Analisi delle
Misurazioni o agli studi della capacità di processo, oppure ad altri tipi di analisi dei
dati, come mostrato nella seguente illustrazione.
56 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Analisi della Capacità di Processo Conforme
con DIN 55319 e ISO 21747
Negli ultimi anni, i produttori Europei hanno sviluppato standard per il calcolo degli
indici di capacità di processo che tengono esplicitamente conto della variazione
sistematica e casuale di processo lungo il tempo, così come dell’eventuale presenza di
distribuzioni non-normali. Questi indici sono stati adottati, ad esempio, nella gran
parte delle aziende in cui si ricorre a produzione automatizzata e dai rispettivi
fornitori, e STATISTICA supporta totalmente tali standard.
Gli indici di Capacità di Processo misurano il numero di volte che la distribuzione
osservata (normale) dei valori può adattarsi entro i limiti di specifica per la rispettiva
parte presa in considerazione. Quindi, questi indici riassumono la qualità di un
processo e consentono di produrre prodotti o parti conformi con determinate
specifiche di pianificazione. In breve, DIN (Deutsche Industrie Norm) 55319 e ISO
21747 descrivono le regole da applicare quando si sceglie tra vari modelli distributivi e
sulla modalità di monitoraggio della variazione dipendente dal tempo osservabile nel
processo.
STATISTICA Guida di Riferimento – 57
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Ad esempio, anche se una distribuzione di dati entro ogni campione risulta Normale,
se è osservabile una variazione sistematica o casuale lungo il tempo mano a mano che
vengono considerati campioni consecutivi, la distribuzione risultante dei valori non
sarà Normale. Pertanto, in molti casi i calcoli di capacità di processo basati sulla
distribuzione normale non saranno applicabili. Inoltre, solitamente è di estremo
interesse l’identificazione di una qualsiasi fonte di variabilità o tendenza dipendente
dal tempo, in quanto possono indicare la presenza di un’eventuale problema ai
macchinari o nei processi produttivi.
Il seguente esempio illustrerà passo-per-passo come calcolare indici di capacità di
processo conformi con questi standard internazionale, e come creare un efficace
report riassuntivo in forma di singolo documento.
Selezione dei dati. Questo esempio è basato su un insieme di dati riportato in
Montgomery (1985, pag. 177, 1991, pag. 234). Verrà utilizzato il file dati Pistons.sta
contenuto nella directory degli esempi. In particolare, si è interessati al monitoraggio
della dimensione (diametro) di cerchi di pistone per motori di autovetture. Vengono
quindi estratti campioni di dimensione costante di cinque osservazioni ognuno dal
processo di produzione in corso. Come nel caso di molti processi produttivi in corso, i
campioni vengono estratti nel tempo, e quindi una qualsiasi fonte di variabilità
temporale osservata nella qualità di processo influenzerà inevitabilmente la variabilità
generale.
Premere la freccia Apri nella scheda Home e dal menu a cascata, selezionare Apri
Esempi per visualizzare la finestra Apri un File Dati di STATISTICA; aprire quindi la
cartella Datasets, e fare doppio clic su Pistons.sta o selezionare il file e premere il
pulsante Apri.
Specificazione dell’analisi. Selezionare la scheda Statistiche. Nel gruppo Statistiche
Industriali, premere il pulsante Analisi dei Processi. Nel Pannello d’Avvio Procedure di
Analisi dei Processi, selezionare Capacità Processo ISO/DIN (Modello distr. dipend.
dal tempo).
58 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Premere il pulsante OK nel Pannello d’Avvio Procedure di Analisi dei Processi. Sulla
scheda Rapido della finestra ISO 21747 - Definizione Capacità di Processo, fare clic sul
pulsante Variabili. Nella finestra Selezionare Variabili (e variabile di gruppo
opzionale), si selezioni Size all’interno della lista Variabili per le analisi, e Sample
all’interno della lista per ... (var. di Tempo/Gruppo), e premere OK.
Nella finestra ISO 21747 - Definizione Capacità di Processo, si prema il pulsante
Specif. processo per visualizzare Immettere/modificare limiti specificazione, in cui
poter inserire i limiti di specificazione. Tali limiti definiscono i valori massimo e (o)
minimo consentiti per la parte rispettiva; in questo caso si specifichino i limiti
superiore ed inferiore (LSI, LSS) in forma di 74 +/- 0.05 (LSI=73.95, LSS=74.05). Inserire
74 all’interno del campo Nominale, e si inserisca 0.05 all’interno di Delta.
Premere OK per confermare la scelta.
STATISTICA Guida di Riferimento – 59
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
In questa finestra, sono disponibili diverse altre opzioni per la modifica delle regole da
applicare per selezionare la distribuzione ed il modello (con distribuzione dipendente
dal tempo) più adatti in modo da riuscire a calcolare gli indici di capacità di processo
appropriati. È possibile fare un clic sul pulsante
nell’angolo in alto a destra della
finestra di dialogo o premere F1 per visualizzare la sezione del Manuale Elettronico di
STATISTICA contenente dettagli specifici relativi a tutte le opzioni presenti in questa
finestra di dialogo.
Ora si prema il pulsante OK all’interno della finestra ISO 21747 - Definizione Capacità
di Processo per eseguire l’analisi della variabile Size.
Visualizzazione dei risultati. Nella finestra ISO 21747 - Analisi di Capacità di
Processo, si prema il pulsante Riepilogo per ottenere la visualizzazione dei riepilogo di
analisi.
60 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Come si può osservare, tutti i dettagli più rilevanti (in base alle indicazioni raccolte in
ISO 21747 e/o in DIN 55319) sono riassunti in una singola pagina (documento),
contenente tutte le informazioni necessarie per giudicare il processo come capace o
non capace (o in dubbio).
Analisi delle Misurazioni di Attributo
Per altri esempi su questo tipo di visualizzazione (composta) in STATISTICA, sarà ora
eseguita un’analisi delle misurazioni di attributo.
In generale, ogni sistema di misurazione usato nella produzione deve essere
convalidato al fine di assicurare che i rispettivi strumenti di rilevazione misurino la
specifica qualità d’interesse con sufficiente accuratezza e precisione. Spesso, una
misura di particolare importanza è quella che determina se una parte di produzione
può essere accettata o rifiutata sulla base del rispettivo livello di qualità; in questo
caso, lo strumento di misurazione rileverà un semplice attributo di
accettazione/rifiuto.
Per determinare la qualità del sistema di misurazione, viene periodicamente eseguito
uno studio in cui la misurazione (decisione di accettazione/rifiuto) viene applicata a
parti di riferimento con deviazioni note dalle specifiche desiderate. Questo processo
viene descritto nella rispettiva sezione del Manuale Elettronico di STATISTICA, così
come nel manuale AIAG (Automotive Industry Action Group) Measurement System
Analysis (MSA) (2000).
Questo esempio illustra l’analisi descritta nel manuale MSA nelle pagg. 81-86.
Selezione dei dati. Aprire il file dati AttributeGageStudy.sta. Questo file contiene i
dati già riassunti nello studio di misurazione di attributo nel manuale MSA, (p. 84).
Specificazione dell’analisi. Selezionare la scheda Statistiche. Nel gruppo Statistiche
Industriali, premere il pulsante Analisi dei Processi. Nel Pannello d’Avvio Procedure di
Analisi dei Processi, selezionare Studio misurazione attributo (Metodo analitico) e
fare clic su OK.
Nella finestra Studio misurazioni attributo (Metodo analitico) premere il pulsante
Variabili. Selezionare Part# in Numeri parti, Reference nella lista Valori di riferimento,
e Acceptance nella lista Accettazione/Risposta, e quindi si prema OK per chiudere
questa finestra. All’interno del riquadro Limite di tolleranza per i calcoli, si specifichi -
STATISTICA Guida di Riferimento – 61
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
0,01 come Limite inferiore, si spunti l’opzione Mostra altro limite, e quindi si
specifichi 0,01 come tale limite.
Si è interessati a valutare la performance delle misurazioni relative ad un processo o
ad un particolare tipo di parte di produzione da identificare come non accettabile (che
deve cioè essere rifiutata), quando il rispettivo limite inferiore cade al di sotto di -0.01
(qui espresso come deviazione dalla specifica). Nel file dati, le probabilità Acceptance
riassumono il numero di misurazioni delle parti di riferimento, da un totale di 20 di tali
parti e misure, che sono state dichiarate non accettabili (cioè, che sono state
rifiutate).
Visualizzazione dei risultati. Adesso si prema OK nella finestra Studio misurazione
attributo (Metodo analitico). Nella finestra dei Risultati, si prema il pulsante
Riepilogo per ottenere i risultati riassuntivi.
62 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Tutti i risultati più importanti per la determinazione della distorsione e della
ripetibilità delle misurazioni degli attributi vengono riportati in una pagina singola. Per
maggiori dettagli sull’interpretazione delle statistiche e dei grafici riportati, si faccia
riferimento al Manuale Elettronico.
Esempio 6: STATISTICA Data Miner
STATISTICA Data Miner (SDM) è un sistema completo per la modellazione con fini
predittivi ed offre una vasta gamma di tecniche analitiche e opzioni per la costruzione,
la convalida e il deployment di modelli. Il tipo di interfaccia utente di default, e
probabilmente lo standard industriale, fornito in SDM segue l’approccio generale
“spazio di lavoro interattivo” che consente di costruire dei modelli trascinando le
icone negli spazi di acquisizione dei dati, preparazione dei dati, modellazione e
deployment, connettendole tramite frecce. L’interfaccia utente dello spazio di lavoro
rappresenta una potente alternativa alle tradizionali analisi dei dati interattive e può
esser utilizzata non solo come uno strumento per sviluppare e testare modelli
predittivi, ma anche per la “programmazione visuale” di spazi di lavoro analitici per
molti tipi di analisi.
STATISTICA Guida di Riferimento – 63
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Per aprire un nuovo spazio di lavoro (vuoto), selezionare la scheda Data Mining. Nel
gruppo Strumenti, premere Spazi di Lavoro e dal menu, selezionare Mie Procedure o
Tutte le Procedure.
Apparirà quindi uno spazio di lavoro vuoto.
Ora, si prema
nella barra degli strumenti per visualizzare la finestra
Seleziona Sorgente Dati per selezionare un file dati per l’analisi. Dopodiché, apparirà
64 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
la finestra Selezionare variabili dipendenti ed indipendenti; premere quindi il
pulsante
per visualizzare la finestra di selezione delle variabili. Quindi si
per creare i nodi dell’analisi e connetterli tramite le frecce
prema
per specificare il flusso di lavoro per il progetto desiderato.
La sezione successiva include una esempio passo-passo di Data Miner Recipes –
un’interfaccia utente innovativa per il data mining introdotta da StatSoft – che offre
una potente alternativa all’approccio basato su spazi di lavoro per costruire dei
modelli e può essere utilizzata da analisti con qualsiasi livello di esperienza.
Panoramica
Questo esempio riguarda STATISTICA Data Miner Recipes, un prodotto di StatSoft che
offre un’ampia selezione di metodi per il data mining predittivo.
Una tendenza generale nelle applicazioni di data mining è la crescente enfasi
dimostrata verso soluzioni basate su semplici processi analitici, piuttosto che sulla
creazione di sofisticati strumenti analitici generali. STATISTICA Data Miner Recipes
(SDMR) fornisce un’interfaccia grafica intuitiva che consente anche agli utenti meno
esperti di eseguire passo-per-passo processi analitici in forma di “ricetta” (Recipe).
Tramite semplici finestre di dialogo, è possibile eseguire diverse operazioni di data
mining quali l’analisi di regressione, di classificazione, e di analisi dei gruppi. Altre
ricette possono venire rapidamente sviluppate in forma di soluzioni personalizzate.
Le ricette completate possono essere salvate e sottoposte a deployment in forma di
file di progetto da utilizzare per la previsione di nuovi dati. Tali file possono essere
generati anche in C/C++ o script PMML, oppure inviati a STATISTICA Enterprise.
L’interfaccia utente SDMR può essere anche utilizzata da analisti avanzati per
automatizzare e per memorizzare specifici algoritmi di data mining.
SDMR fornisce soluzioni per l’intero processo di data mining – dall’interrogazione di
database esterni al deployment finale delle soluzioni – e, in generale, consiste dei
seguenti passaggi:
1. Identifica i dati dai quali effettuare le stime
• Si connette a database compatibili con ODBC o OLEDB
• Si connette a file dati di STATISTICA
STATISTICA Guida di Riferimento – 65
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
2. Pulisce i dati e rimuove i predittori ridondanti
• Metodi flessibili ed efficaci per il campionamento dei dati (semplice, stratificato,
sistematico, ecc.)
• Modi più flessibili per identificare e ricodificare i dati mancanti
• Identificazione degli outlier
• Trasformazione dei dati prima dell’esecuzione dei passaggi successivi
• Identificazione ed eliminazione dei predittori ridondanti
3. Identifica predittori importanti a partire da un grande insieme di predittori
fortemente legati alla variabile dipendente d’interesse (o target)
• Selezione delle caratteristiche per insiemi di dati molto grandi (ad es. migliaia di
variabili)
• Individuazione di interazioni importanti tra i predittori attraverso metodi di
analisi ad albero
4. Genera un insieme di modelli candidati
• Sfrutta la selezione completa di tecniche all'avanguardia per il data mining
predittivo disponibili in SDMR
• Trasferire i compiti computazionalmente gravosi a STATISTICA Enterprise Server,
liberando il computer locale per altre operazioni
5. Esegue valutazione comparative automatiche dei modelli al fine di individuare il
modello ottimale in termini di performance e complessità
6. Deployment del modello per la previsione di nuovi dati attraverso il suo efficace
motore integrato di deployment
STATISTICA Data Miner Recipes fornisce la soluzione per collegare i passi del flusso di
lavoro del data mining in un’interfaccia utente orientata ai risultati. Dalla pulitura dei
dati alla validazione dei modelli, SDMR conduce l’analisi dall’inizio alla fine in modo da
ottenere dei risultati applicabili e delle risposte rapide. Inoltre, SDMR contiene
raccolta più completa di algoritmi del data minig in un unico pacchetto, senza
richiedere all’utente conoscenze dettagliate di tali algoritmi.
I termini più generali, questi algoritmi prendono in prestito idee e metodologie da vari
settori, quali statistica, ingegneria, scienze delle intelligenze artificiali, scienze
66 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
cognitive, ecc., per “comprendere” le tendenze dei dati da poter utilizzare per fare
delle previsioni (su rischi delle assicurazioni o del credito, qualità dei processi o dei
prodotti, guasti, diagnosi mediche e così via). Il Manuale Elettronico di STATISTICA e
l’Electronic Statistics Textbook on-line forniscono introduzioni dettagliate sulle diverse
tecniche e metodi solitamente descritti come “data mining.”
In pratica, gli specifici domini e tipi di dati sono meglio analizzati utilizzando particolari
metodi ed algoritmi. Ad esempio, le tecniche di data mining che meglio modellano le
perdite assicurative sono differenti dai metodi per la previsione delle emissioni di una
fornace. È comunque presente un flusso di lavoro comune – dalla definizione dei dati
e del problema di analisi al campionamento, alla costruzione dei modelli e alla loro
valutazione – applicabile a tutti i problemi di data mining predittivo.
Data Miner Recipes consente a coloro con poca familiarità degli strumenti di data
mining, di muoversi molto rapidamente dalla definizione del problema a risultati
tangibili e fruibili.
Tramite questo approccio, è sufficiente seguire un’interfaccia utente simile ad una
ricetta per completare i passi necessari a raggiungere una soluzione. Infatti, la
maggior parte di questi passi sono completamente automatici in modo che l’unico
input richiesto è di definire i dati e le variabili per le analisi, mentre il programma
esegue in automatico i calcoli – costruisce i campioni di stima e di test, esegue la
selezione dei predittori, prova diversi algoritmi del data mining e valuta i risultati per
selezionare il miglior modello. Questa procedura può essere eseguita sia con la
STATISTICA Guida di Riferimento – 67
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
versione desktop di STATISTICA Data Miner che, se disponibile, con STATISTICA Data
Miner Server.
File di Progetto di Data Miner Recipes
Quando un progetto di Data Miner Recipes viene salvato, vengono creati due file
separati:
• Un file di Data Miner Recipes con l’estensione .dmrproj
• Un file di Registro di STATISTICA con lo stesso nome, ma con l’estensione .stw,
contenente i risultati ed i dettagli per ogni passo della “ricetta”
È importante che entrambi i file risiedano nella medesima cartella. Quindi, se si
desidera copiare un progetto di Data Miner Recipe, chiamato MyDataMinerProject, in
una nuova cartella, in una email o nel Sistema di Gestione dei documenti di STATISTICA
(SDMS), allora entrambi i file – MyDataMinerProject.dmrproj e
MyDataMinerProject.stw – devono essere copiati nella destinazione.
Di seguito sono riportati i dettagli riguardanti questi due file.
File di Data Miner Recipes (.dmrproj). I file di Data Miner Recipes sono in formato
XML (extensible markup language) è contengono tutte le informazioni riguardanti le
scelte dell’utente (o le scelte fatte automaticamente dal programma), comprese:
• Informazioni sul file dati (o le informazioni della connessione ai dati)
• Le selezioni delle variabili e le variabili metadata (ad es., le definizioni dei
predittori continui e categoriali e le variabili dipendenti)
• Le scelte nei i passi di preelaborazione (ad es., gestione dei dati mancanti,
filtraggio dei record duplicati, trasformazioni, ecc.)
• La selezione finale delle variabili sulla base degli algoritmi di selezione dei
predittori
• I risultati della stima dei modelli, della valutazione e la scelta finale dei modelli
• Tutte le informazioni necessarie per il deployment dei modelli e per prevedere
nuovi casi (ad es., calcolare i punteggi delle componenti, prevedere le
probabilità del rischio o di guasto, ecc.)
Pertanto, quando si effettua il deployment di Data Miner Recipes su STATISTICA
Enterprise per calcolare automaticamente i valori previsti in un’applicazione
68 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
enterprise (analisi dei guasti e delle carte di controllo multivariate); tutte le
informazioni necessarie a calcolare i valori previsti, le classificazioni o le probabilità di
classificazione sono contenute all’interno di questi file in formato XML.
File di Registro di Data Miner Recipes (.stw). Questi file contengono le
informazioni dettagliate per descrivere i risultati da ogni passo.
I risultati memorizzati in questo registro forniscono una panoramica completa
dell’analisi eseguita da Data Miner Recipe. Perciò, se tali analisi sono state elaborate
in un ambiente regolato (ad es., FDA, ISO, ecc.) oppure se il data mining è parte di
un’attività critica eseguita nel rispetto di specifiche procedure operative standard,
allora è solitamente raccomandato di memorizzare questo file nel Sistema di Gestione
dei Documenti di STATISTICA insieme al file di progetto di Data Miner Recipe
(.dmrproj).
Utilizzare STATISTICA Data Miner
Recipes (SDMR)
Questo esempio illustra come completare rapidamente ed efficacemente progetti di
data mining attraverso STATISTICA Data Miner Recipes, anche se la soluzione migliore
al problema (predittivo) emerge solo dopo il confronto (automatico) dell’efficacia dei
diversi algoritmi avanzati di data mining.
STATISTICA Guida di Riferimento – 69
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
In questo esempio, verrà esplorato l’utilizzo di SDMR per un’applicazione di credit
scoring. L’esempio è basato sul file dati CreditScoring.sta, contenente le osservazioni
relative a 18 variabili per 1000 clienti del passato che hanno richiesto l’erogazione di
un prestito. Ogni cliente è stato classificato come “good credit” (700 casi) oppure
come “bad credit” (300 casi). Si desidera sviluppare un modello di credit scoring da
poter utilizzare per determinare se un ad nuovo cliente sia associabile un buon rischio
di credito oppure un cattivo rischio di credito sulla base dei valori di una o più variabili
predittrici. Nel file dati è inclusa inoltre una variabile che indica
“Addestramento/Test” da applicare per la validazione.
Selezionare la scheda Data Mining in STATISTICA. Nel gruppo Recipe, fare clic su Data
Miner Recipe per visualizzare la finestra Data miner recipes. Nella scheda Recipe,
premere il pulsante Nuovo per creare un nuovo progetto. Sarà quindi selezionata la
scheda Passi.
Il pannello contenente i nodi dei singoli passi è posto nell’area in alto a sinistra della
scheda Passi. Saranno presenti i quattro nodi principali: Preparazione dei dati, Dati
per l’analisi, Ridondanza dei dati e Variabile target.
Nodi (passi). Ogni nodo (o passo) può trovarsi in quattro stati possibili, a seconda che
tutte le opzioni richieste siano state specificate. Ogni stato è rappresentato da un’icona:
una rossa indica uno stato d’attesa, che indica che il passo non può essere iniziato in
quanto in attesa del completamento del precedente; un giallo indica che il passo è
pronto, cioè è possibile iniziare tale passo dato che tutti quelli precedenti sono stati
70 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
completati; un verde è associato ad una passo completato. Si noti che è necessario
premere il pulsante Passo successivo per passare dallo stato (pronto per essere
eseguito) allo stato (completato). Il cambiamento potrà essere compiuto solo se il
passo è completato con successo (cioè tutte le informazioni richieste sono state
specificate). Infine se è stato aperto un dataset e sono state selezionate le variabili, ma
non si desidera procedere passo-passo lungo tutto il processo, è possibile spuntare il
controllo Configura tutti i passi presente nella scheda Passi. I nodi saranno quindi
rappresentati da un’icona color navy . In questo caso, si può selezionare qualsiasi
passo e modificarne le opzioni, oppure lasciarle ai valori predefiniti. Quindi premere la
freccia Passo successivo, e dal menu a cascata, selezionare Esegui fino al
completamento. STATISTICA Data Miner Recipes eseguirà l’analisi e creerà i risultati
dei modelli.
Scheda Opzioni. La scheda Opzioni di STATISTICA Data Miner Recipes è utilizzata per
impostare delle opzioni globali per le ricette che usano file dati estremamente grandi.
Tali opzioni includono le specifiche per il campionamento e per la dimensione
massima del file da salvare nel Registro del Progetto. Dato che la maggior parte sono
applicate al passo di Preparazione dei dati, dovrebbero essere configurate prima di
iniziare una nuova analisi. Le modifiche ai valori di questa scheda saranno utilizzati
solo per la ricetta corrente, a meno che non sia premuto il pulsante Salva predefiniti.
Preparazione dei Dati
Connessione ai dati. Sulla scheda Preparazione dei dati, premere il pulsante
Apri/Connetti file dati data file. Nella finestra Seleziona Sorgente Dati, fare clic sul
pulsante File per sfogliare ed aprire il file dati CreditScoring.sta (contenuto nella
cartella Datasets installata con STATISTICA). Se il file è già stato aperto, sarà elencato
nella cartella Apri Documenti Spreadsheet; sarà quindi sufficiente fare doppio clic su di
esso oppure evidenziarlo e premere OK.
Ora, sulla medesima scheda, si prema il pulsante Seleziona variabili, e nella finestra
Seleziona variabili, si selezioni:
Variabile 1 (Credit Rating) come Target, categoriale,
Variabili 3, 6 e 14 come Input, Continuo
Variabili 2, 4-5, 7-13 e 15-18 come Input, Categoriale, e
Variabile 19 (TrainTest) come variabile di Campione di Test.
STATISTICA Guida di Riferimento – 71
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Quindi premer il pulsante OK.
Selezionare la scheda Avanzate all’interno della finestra Data miner recipe, e
spuntare il controllo Utilizza un campione dei dati. Specificare Campione casuale
stratificato come strategia di campionamento al fine di assicurare che ogni classe
della variabile dipendente Credit Rating sia rappresentata da numeri
approssimativamente uguali di casi negli insiemi di addestramento e di validazione.
Quindi fare clic sul pulsante Ulteriori opzioni per visualizzare la finestra
Campionamento stratificato. Premere il pulsante Variabili di stratificazione,
selezionare Credit Rating e fare clic su OK in questa finestra ed in Campionamento
stratificato.
Premere Passo successivo per completare la Preparazione dei dati (all’interno del
pannello dei nodi, a fianco di Preparazione dei dati, lo stato passerà da a ).
Dati per l’Analisi
Dopo il completamento di Preparazione dei dati, il passo Dati per l’analisi verrà
selezionato automaticamente. Sulla scheda Dati per l’analisi, premere il pulsante
Seleziona campione test, e nella finestra Specifiche del Campione di Test, selezionare
l’opzione Variabile. Controllare che la categoria Train sia inserita all’interno della
casella Codice per il campione di analisi e Test sia inserita nella casella Codice per il
campione di test.
72 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Quindi si prema il pulsante OK. I modelli verranno stimati utilizzando il campione di
addestramento e valutati tramite il campione di test. Usando le osservazioni che non
partecipano ai calcoli della stima, le statistiche della bontà d’adattamento calcolate
per (i valori previsti da) i differenti modelli (algoritmi) di data mining potranno essere
utilizzate per valutare la capacità predittiva di ogni modello, e quindi per confrontare i
modelli e sceglierne uno o più tra tutti.
Statistiche descrittive. Questo passo calcolerà le statistiche descrittive per tutte le
variabili selezionate per l’analisi. Le statistiche descrittive forniscono informazioni utili
sui range e sulle distribuzioni dei dati usati per il progetto.
Premere Passo successivo per completare il passo con successo.
Ridondanza dei Dati
Adesso sarà selezionato il passo Ridondanza dei dati. L’obiettivo di questo passo è
eliminare predittori altamente ridondanti. Ad esempio, se il dataset contiene due
misure relative al peso, una espressa in chilogrammi e l’altra in pound, queste due
misure saranno ridondanti.
Sulla scheda Ridondanza dei dati, si selezioni l’opzione Coefficiente di correlazione e
si specifichi un Valore soglia pari a 0.8. Si prema il pulsante Passo successivo per
eliminare i predittori altamente correlati (r≥0.8). Dato che in questo esempio non
sono presenti variabili indipendenti così correlate tra loro, apparirà il seguente
messaggio.
Premere il pulsante OK. La pulitura e la preelaborazione dei dati per la costruzione del
modello è ora completa.
Variabile Target: Costruire Modelli Predittivi
Sarà ora necessario costruire i modelli predittivi per la variabile target. All’interno del
pannello dei nodi, il nodo Variabile Target presenta una struttura ramificata, con il
nodo genitore connesso ai seguenti quattro nodi figlio: Variabili importanti,
Costruzione del modello, Valutazione e Deployment.
STATISTICA Guida di Riferimento – 73
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Riduzione della dimensionalità. Il nodo Variabili importanti viene selezionato
automaticamente. In questo passo, l’obiettivo sarà ridurre la dimensione del
problema predittivo, cioè selezionare un sottoinsieme di input che presentano il
legame più forte con la variabile target (in questo esempio, Credit rating) e che quindi
contribuiranno con maggiore probabilità a produrre modelli predittivi più accurati e
utili. Questo tipo di strategia analitica è chiamata anche selezione delle caratteristiche.
Sono disponibili due modalità. Quando è selezionata l’opzione Selezione rapida dei
predittori, il programma eseguirà una scansione delle migliaia di input per individuare
quelli più fortemente legati alla variabile dipendente d’interesse. Quando invece viene
selezionata l’opzione Selezione avanzata, sono utilizzati tre metodi per trovare
interazioni importanti tra i predittori.
Per questo esempio, si selezioni l’opzione Selezione avanzata come strategia di
selezione delle caratteristiche, e quindi si prema il pulsante a fianco per visualizzare la
finestra Selezione avanzata. Inserire 12 all’interno del campo Numero di variabili da
estrarre ed Uguali all’interno del campo Probabilità a priori.
74 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Premere il pulsante OK in questa finestra, e quindi fare clic su Passo successivo per
completare questo passo. Per esaminare un riassunto dell’analisi appena eseguita,
sulla scheda Passi, premere il pulsante Report e dal menu a cascata risultante,
selezionare l’opzione Report di riepilogo per visualizzare il registro Risultati.
Questi predittori saranno ulteriormente esaminati usando i diversi algoritmi di data
mining e di apprendimento automatico, disponibili in SDMR.
Costruzione dei modelli. La finestra Data miner recipe verrà minimizzata per lasciare
spazio al registro Risultati. Si prema il pulsante Data miner recipe presente sulla Barra
delle Analisi per visualizzare nuovamente la finestra di dialogo. Ora risulterà
selezionato il nodo Costruzione del modello. In questo passo è possibile costruire
un’ampia gamma di modelli per gli input selezionati. Sulla scheda Costruzione del
modello, saranno selezionate di default le opzioni C&RT, Alberi Boosted e Rete
Neurale come modelli o algoritmi da “provare” automaticamente sui dati a
disposizione.
I calcoli necessari per la costruzione dei modelli predittivi possono essere eseguiti sia
localmente (sul proprio computer) che su STATISTICA Enterprise Server. Tuttavia,
quest’ultima opzione è disponibile solo se si dispone di un account valido di
STATISTICA Enterprise Server e si è connessi al server d’installazione della propria
azienda. Per questo esempio si prema il pulsante Costruisci modello per eseguire i
calcoli localmente sul proprio computer. Questa scelta richiederà un po’ di tempo, al
termine del quale occorrerà premere Passo successivo per completare questo passo.
Valutazione e selezione dei modelli. Adesso, sarà selezionato il nodo Valutazione.
Sulla scheda Valutazione, nel campo Seleziona i modelli, assicurarsi che tutti i modelli
STATISTICA Guida di Riferimento – 75
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
siano selezionati (che ogni controllo sia selezionato). Premere il pulsante Valuta
modelli per eseguire la valutazione comparative dei modelli e l’identificazione del
migliore in termini di performance sul campione di validazione.
Si noti che nel caso in considerazione il modello Alberi boosted presenta il tasso
d’errore minimo (32,71%). In altre parole, il 67.29% dei casi contenuti nel campione di
validazione sono stati correttamente previsti da questo modello. Si noti che i risultati
qui ottenuti potrebbero differire leggermente da quelli prodotti in altre occasioni,
data la natura casuale delle opzioni di suddivisione tra insiemi di addestramento ed
insieme di validazione.
Il seguente spreadsheet mostra la prestazione del miglior modello per la
classificazione delle osservazione nell’insieme di validazione. Le colonne indicano le
classi previste, dal modello ad Alberi boosted, e le righe rappresentano le classi
osservate.
In questa matrice, è possibile osservare come questo modello abbia classificato
correttamente 67 soggetti su 103 come “rischi di credito pessimi”, ed in maniera
errata 28 di essi. Questa informazione è solitamente molto più utile del tasso di errata
classificazione generale, che semplicemente ci dice che l’accuratezza complessiva è
pari al 67,29%.
Visualizzare nuovamente la finestra Data miner recipe e premere il pulsante Passo
successivo. Apparirà un messaggio che avvisa di selezionare un solo modello per il
deployment. Fare clic su OK e deselezionare i controlli relativi a C&RT e Rete neurale.
Si effettuerà il deployment del modello ad Alberi Boosted che ha fornito la miglior
76 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
precisione nel prevedere il campione di test. Premere nuovamente il pulsante Passo
successivo.
Deployment
Il passo finale di Deployment comporta l’utilizzo del modello migliore e la sua
applicazione su nuovi dati al fine di prevedere i clienti “buoni e pessimi”. Questo
passo fornisce inoltre l’opzione per la scrittura (write back) dell’informazione
predittiva (probabilità di classificazione calcolate dal modello migliore, classificazione
prevista, ecc.) sul file dati o database di input originale. Questa funzione è
estremamente utile per eseguire il deployment dei modelli in presenza di insiemi di
dati molto grandi.
Sulla scheda Deployment, premere il pulsante File di dati per il Deployment e fare
doppio clic sul file dati CreditScoring.sta (contenuto nella cartella Datasets installata
con STATISTICA). Per obiettivi dimostrativi, verrà utilizzato lo stesso file dati per il
deployment del modello migliore
Si prema il pulsante Passo successivo per eseguire previsioni sui dati di questo file
usando il miglior modello. Il file contenente le classificazioni e le probabilità di
previsione (titolato Summary of Deployment) è contenuto nella cartella Deployment
del registro di progetto come illustrato sotto.
STATISTICA Guida di Riferimento – 77
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Riepilogo
L’obiettivo di questo esempio è dimostrare l’efficacia del flusso di lavoro del data
miner implementato in STATISTICA Data Miner Recipes. Con pochi clic, il programma
accompagnerà l’utente attraverso il processo analitico completo – dalla definizione
dei dati di input e del problema dell’analisi, attraverso la pulitura e la preparazione dei
dati e la costruzione dei modelli, fino alla selezione finale del modello ed al
deployment.
Anche se la maggior parte delle complessità dei calcoli del data mining vengono
risolte automaticamente in STATISTICA Data Miner Recipe, il programma “applicherà
e testerà” un grande numero di algoritmi avanzati di data mining per determinare
automaticamente l’approccio di maggior successo, consentendo anche ad utenti con
scarsa esperienza di muoversi rapidamente dalla definizione alla soluzione del
problema.
Così, la metodologia e l’interfaccia utente di STATISTICA Data Miner Recipe
consentiranno di utilizzare la vasta raccolta di algoritmi di data mining disponibili, in
un unico pacchetto.
78 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
GESTIONE DEI DATI
Esempio 1: Formule di Spreadsheet
e Formule Batch
Per gli Spreadsheet di STATISTICA è possibile definire nuove variabili sulla base del
contenuto di altre variabili, e talvolta applicando vere e proprie trasformazioni di
variabili. È inoltre possibile verificare, trasformare, e ricodificare i dati sulla base di
una singola variabile (piuttosto che sulla base di un insieme di formule di
trasformazioni, cioè formule batch). Ciò è consentito tramite l’impiego di formule di
spreadsheet.
Per accedere alle formule di spreadsheet, fare doppio clic sull’intestazione di una
variabile in uno Spreadsheet di STATISTICA per visualizzare la finestra delle specifiche
di Variabile. La formula dev’essere inserita all’interno del campo Nome Lungo
(etichetta o formula con Funzioni) (anche chiamato editor di formule) presente nella
parte bassa della finestra. Quando s’inserisce un nome lungo di variabile iniziando con
un segno uguale, STATISTICA riconoscerà automaticamente una formula e ne
verificherà la correttezza formale.
La formula può fare riferimento ad altre variabili sia specificando dei rispettivi nomi
(MEASURE01, TIME), che tramite il numero assoluto della variabile secondo la sintassi
Vx, in cui x corrisponde al numero di variabile. Ad esempio, V3 corrisponde alla
variabile numero 3. V0 fa invece riferimento alla colonna dei nomi di caso.
Le Formule di Spreadsheet vengono calcolate un caso (riga) per volta. Per ogni caso
nello spreadsheet, la formula viene valutata ed i riferimenti alle altre variabili sono
sostituiti con i valori calcolati sulla base del caso corrente.
In STATISTICA, le funzioni di spreadsheet consentono alla formula di accedere ai valori
delle variabili da altri casi. Un esempio comune è la funzione Ritardo (Lag), che farà
riferimento ad una variabile e la traslerà in avanti o indietro di un certo numero di casi.
STATISTICA Guida di Riferimento – 79
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
La seguente tabella elenca diverse formule di spreadsheet e i relativi risultati.
Formula
Risultato
=contains(v1, "B12C")
Restituisce 1 se nella variabile 1 è contenuto il testo “B12C”.
Restituisce 0 se il testo non viene trovato.
=(v1+v2+v3)/3
Calcola la media delle prime tre variabili.
=(v0<=10)*1+(v0>10)*2
Ricodifica i casi 1-10 come 1. I restanti sono ricodificati pari a 2.
=((v1=1) AND (v2=5))*5
=student(v4,15)
Restituisce il valore 5 se v1=1 e v2=5, altrimenti restituisce il
valore 0.
Restituisce i valori della densità di probabilità della distribuzione
t di Student sulla base dei valori di v4 e 15 gradi di libertà.
=cusum(v3)
Esegue la somma cumulata della variabile 3.
=v1+v2
Concatena due variabili testuali: se v1='A' e v2='B', il risultato
sarà 'AB'
=vnormal(rnd(1), 50, 3)
Genera numeri casuali da una distribuzione Normale
(µ = 50, σ = 3)
=DTMonth(DTToday)
Ritorna il numero rappresentante il mese del parametro, ad es.,
3 se il mese corrente è Marzo
=match(v1, 1, 0, 2, 0, v1)
Confronta il primo valore ad un insieme di coppie
valore/risultato, ritornando il primo risultato se i valori
corrispondenti combaciano. Se non corrispondono, allora è
usato un risultato di default. Ad esempio, ritorna 0 se v1 è 1 o 2,
altrimenti ritorna v1.
=trunc((v0-1)/10)
Assegna interi successivi alla serie consecutiva di 10 casi (cioè ai
casi da 1 a 10 sarà assegnato 0, a quelli tra 11 e 20 1, ecc.)
Si noti che è possibile premere il pulsante
all’interno della finestra di
specifiche della Variabile per aprire il Visualizzatore Funzioni e visualizzare la lista
completa di Formule ed Operatori (=, +, >, e, o…).
80 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Esempio: Formula di Spreadsheet
Si apra il file dati Adstudy.sta. In questo esempio verrà creata una nuova variabile pari
alla media della variabili da 3 a 25 (cioè, da MEASURE01 a MEASURE23).
Fare doppio clic sull’intestazione della prima variabile vuota (dopo la variabile 25).
Verrà visualizzata la finestra Aggiungi Casi e/o Variabili. Si prema il pulsante OK per
accettare l’impostazione predefinita, che aggiunge un’unica variabile.
Verrà visualizzata la finestra delle specifiche di Variabile. All’interno del riquadro
Formato, si selezioni Numero. All’interno del campo Nome lungo presente in fondo
alla finestra, si inserisca: =mean(v3: v25).
Si prema il pulsante OK. Apparirà una finestra che informa l’utente circa la correttezza
della formula. Si prema Sì per continuare. La nuova variabile sarà quindi riempita con
il valore medio per ogni caso delle variabili 3-25.
Dato che è possibile fare riferimento alle variabili specificando i rispettivi nomi o
numeri, la formula appena creata può essere espressa anche come segue:
=mean(MEASURE01:MEASURE23).
STATISTICA Guida di Riferimento – 81
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Esempio: Formule Batch
Le formule di Spreadsheet sono utili per la definizione di formule da applicare ad una
variabile per volta. Tuttavia, vi sono situazioni in cui è necessario valutare
contemporaneamente molte formule associate a differenti variabili e può essere fatto
tramite le funzionalità delle funzioni batch, disponibili in STATISTICA.
Aprire il file dati Characteristics.sta. Questo file dati contiene le informazioni relative
ad una serie di pazienti. In questo esempio 1) si calcolerà l’Indice di Massa Corporea
(BMI) e 2) si convertirà il valore dell’altezza in centimetri (cm), ed infine si
aggiungeranno le due nuove variabili all’insieme di dati.
Nella scheda Dati, nel gruppo Trasformazioni, premere Trasforma per visualizzare la
finestra Formule di Trasformazione Batch.
Le uniche differenze nella sintassi tra le formule di trasformazione batch e le formule
di spreadsheet sono date dal supporto per formule multiple nell’opzione batch, e dal
fatto che le formule batch non sono allegate ad alcuna variabile specifica (infatti
possono venire liberamente copiate da file dati a file dati); tali formule non possono
iniziare col segno uguale, ma devono presentare una variabile target (ad es., v1=... o
Measure03=...) in modo che STATISTICA riconosca a quale variabile applicare ogni
formula. È disponibile inoltre un’opzione che consente di “distribuire” tutte le formule
batch nelle rispettive variabili di spreadsheet e salvarle assieme al file dati,
sostituendo effettivamente le formule di spreadsheet (se presenti).
82 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Di seguito sono riportati i calcoli usati per calcolare il BMI e per convertire Height (in)
in centimetri, e le formule da inserire nella finestra Trasformazione Batch:
Formula
Inserimento nella Finestra Trasformazione Batch
BMI = ('weight (lb)' / 'Height (in)' **2)*703
'Height (cm)' = 'height (in)' *2.54
All’interno del campo Formule, si inserisca la lista di formule di trasformazione da
applicare allo spreadsheet di dati attivo. Si separi ogni trasformazione con un invio (si
prema INVIO sulla propria tastiera).
Si prema il pulsante OK all’interno della finestra Formule di Trasformazione Batch.
Apparirà la finestra Aggiungi Nuove Variabili?; si faccia clic su Sì per aggiungere due
nuove variabili al file dati Characteristics.sta. Verrà visualizzato un messaggio che
informa l’utente se le espressioni inserite in Trasformazione Batch sono corrette. Se
sono giuste, si prema Sì per procedere. STATISTICA calcola le formule e aggiunge due
variabili, BMI e Height (cm), allo spreadsheet.
STATISTICA Guida di Riferimento – 83
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Le opzioni disponibili in Formule di Trasformazione Batch sono particolarmente
adatte (ottimizzate) per la trasformazione di grandi insiemi di dati. Le formule
verranno valutate una ad una in sequenza, poiché il risultato di una trasformazione
inserita in lista potrebbe servire come input per quella successiva. Quindi, è possibile
creare una nuova variabile con una formula e quindi usare tale variabile in formule
successive.
Si prema il pulsante , disponibile nell’angolo in alto a destra della finestra Formule
di Trasformazione Batch, per visualizzare la sezione del Manuale Elettronico di
STATISTICA relativo a tali opzioni e nel quale saranno disponibili ulteriori collegamenti
ad altre sezioni contenenti esempi di formule e regole di sintassi.
Esempio 2: Dati di Input
Direttamente da Excel
In aggiunta all’utilizzo degli spreadsheet tradizionali di STATISTICA, è possibile aprire
file di Excel all’interno delle finestre di STATISTICA e quindi eseguire delle analisi
usando il file Excel come una sorgente di dati.
Nella scheda di STATISTICA Home, nel gruppo File, premere la freccia Apri e
selezionare Apri Esempi dal menu a cascata, per visualizzare la finestra Apri un File
Dati di STATISTICA.
Dalla lista a cascata Tipo file presente sul lato inferiore della finestra, selezionare File
Excel (*.xls;*xlsx;*.xlsm). Fare doppio clic sulla cartella Datasets, selezionare il file
dati Weather report e premere Apri. Apparirà quindi la finestra Apertura file.
84 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Premere il pulsante Apri come una Cartella di Excel in modo da visualizzare il file
Excel. Si noti che quando un foglio di lavoro di Excel viene aperto in STATISTICA, i
menu di Excel e di STATISTICA vengono fusi per consentire all’utente di accedere alle
funzionalità chiave di entrambe le applicazioni.
Dal menu Statistiche, si selezioni Statistiche di Base /Tabelle. Apparirà la finestra
Seleziona Intervallo Excel per l’Analisi.
Questa finestra viene visualizzata ogni
qualvolta si seleziona un’opzione dal menu Statistiche, Data-Mining o Grafici dopo
aver aperto un foglio di lavoro di Excel all’interno di STATISTICA. Si noti che
STATISTICA determina le specifiche logiche, ma queste possono essere modificate se
STATISTICA Guida di Riferimento – 85
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
necessario. Quando ad esempio i nomi delle variabili non sono inclusi nel foglio di
lavoro di Excel, STATISTICA assegnerà automaticamente i nomi di variabile Var1, Var2,
Var3, ecc.
Per questo esempio, si faccia clic sul pulsante OK della finestra Seleziona Intervallo
Excel per l’Analisi per accettare le impostazioni predefinite; questa finestra sarà
chiusa per lasciare il posto a Rivedi/Modifica Tipi di Colonna.
In STATISTICA è possibile definire il tipo di dati per ogni specifica colonna. I tipi di dati
includono dati numerici, di testo, numerici e di testo misti, e dati mancanti. Le celle
vuote presenti in un foglio di lavoro di Excel vengono sempre trattate come dati
mancanti, così come quando una colonna numerica contiene valori di testo.
STATISTICA assegna tipi di dati predefiniti per tutte le colonne sulla base del
contenuto delle prime righe del foglio di dati (infatti, è possibile deselezionare
Rivedi/Modifica tipi di colonna prima dell’importazione all’interno della finestra
Seleziona Intervallo Excel per l’Analisi perché la successiva finestra Rivedi/Modifica
Tipi di Colonna non venga visualizzata). Tuttavia, è possibile modificare se necessario i
tipi predefiniti: si selezioni il nome della colonna d’interesse e si prema Modifica
(oppure si faccia un doppio clic sul nome della colonna che si desidera modificare) per
visualizzare la finestra Cambia Tipo di Colonna da Importare, in cui poter specificare il
tipo preferito.
86 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
In questo esempio verranno accettate le impostazioni predefinite, quindi si faccia un
clic sul pulsante Annulla all’interno di Cambia Tipo di Colonna da Importare, e si
prema il pulsante OK all’interno della finestra di dialogo Rivedi/Modifica Tipi di
Colonna. Dopo aver premuto OK, verrà visualizzato il Pannello d’Avvio relative
all’analisi o al grafico selezionato (in questo esempio, il Pannello d’Avvio di Statistiche
di Base e Tabelle), e quindi a questo punto sarà possibile procedere con l’analisi come
al solito.
Esempio 3: Accedere ai Dati Direttamente
da un Database SQL Server
STATISTICA fornisce l’accesso a praticamente tutti i database (tra i quali sistemi molto
utilizzati quali Oracle, Sybase, ecc.) tramite STATISTICA Query, accessibile dalla scheda
Home (nel gruppo File, premere la freccia Apri per accedere al sottomenu Carica Dati
Esterni) o dalla scheda Dati (nel gruppo Gestisci, premere Dati Esterni). Per importare
dei dati da un database ad uno Spreadsheet di STATISTICA per essere salvati, lo
strumento da utilizzare è STATISTICA Query.
Con STATISTICA Query è possibile accedere facilmente ai dati usando le convenzioni
OLE DB. OLE DB è un’architettura di database [basata su Component Object Model
(COM)] che fornisce un’integrazione universale ai dati lungo l’intera rete aziendale, da
mainframe a desktop, indipendentemente dal tipo di dati.
STATISTICA Query supporta tabelle multiple di database; record specifici (righe di
tabelle) possono essere selezionati specificando comandi SQL. STATISTICA Query
consente di costruire automaticamente l’espressione SQL mano a mano che l’utente
seleziona le componenti di query attraverso una semplice interfaccia grafica e le
intuitive opzioni di menu. Quindi, per creare query (interrogazioni) avanzate di dati in
maniera rapida e diretta non sarà indispensabile una conoscenza approfondita di SQL.
È inoltre possibile creare query multiple a molti database differenti, in modo da
importare i dati provenienti da diverse sorgenti in un unico spreadsheet; è possibile
quindi conservare contemporaneamente nel tempo le connessioni a diversi database.
Per questo esempio, si crei una nuova query: selezionare la scheda Home, e nel
gruppo File, premere la freccia Apri. Dal menu a cascata, selezionare Carica Dati
Esterni – Crea Query. STATISTICA Query sarà avviato ed apparirà la finestra
Connessione a Database.
STATISTICA Guida di Riferimento – 87
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Da questa finestra, è possibile scegliere le connessioni a database esistenti o definirne
di nuove. In questo esempio, verrà creata una nuova connessione a database, quindi
si prema il pulsante Nuova per visualizzare la finestra Proprietà di Data Link.
È possibile scegliere di utilizzare il provider OLE DB associato allo specifico database in
uso nella propria azienda, oppure uno dei provider OLE DB predefiniti forniti da
Microsoft e compatibili con il proprio sistema di database.
In questo esempio sarà utilizzato il database campione Northwind installato con
Microsoft SQL Server; pertanto si selezioni Microsoft OLE DB Provider for SQL Server
e quindi si prema il pulsante Avanti >>. Sarà visualizzata la finestra Proprietà Data
Link - Connessione.
88 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Selezionare un server dalla lista a cascata Selezionare o specificare un nome di server.
Quindi si selezioni l’opzione di log on adatta al proprio database SQL Server
Northwind. Specificare Utilizza sicurezza integrata di Windows NT o Utilizza
password e nome utente specifici ed inserire un Nome utente e una Password nei
campi rispettivi.
Dopodiché selezionare Northwind dal menu a cascata Selezionare il database sul
server.
Premere il pulsante Verifica connessione per tentare la connessione al database
specificato. Se tale connessione fallisce, assicurarsi che le impostazioni siano corrette.
Ad esempio, errori di battitura e maiuscole o minuscole errate possono causare questi
problemi. Se la connessione invece avviene con successo, allora si prema OK in questa
finestra.
Premere OK nella finestra Proprietà di Data Link per visualizzare Aggiungi una
Connessione a Database. Inserire Northwind nella casella Nome e fare clic su OK.
La finestra Connessione a Database sarà quindi visualizzata nuovamente con la nuova
connessione Northwind definita.
Selezionare questa connessione e premere OK. Sarà visualizzata la finestra STATISTICA
Query, con tutte le tabelle del database nell’albero a sinistra.
STATISTICA Guida di Riferimento – 89
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Fare clic col tasto destro sulla tabella Order Details, e dal menu contestuale, si
selezioni Aggiungi per aggiungere la tabella all’interno del pannello di visualizzazione
(il pannello in altro a destra della finestra di STATISTICA Query). Quindi si faccia un clic
col tasto destro in corrispondenza di Products e si aggiunga anche questa tabella
all’interno del pannello di visualizzazione. Dato che entrambe le tabelle contengono il
campo ProductID, STATISTICA Query le unisce automaticamente con questo campo
come chiave.
Per selezionare i campi da includere nella query, fare clic col tasto destro nella tabella
Order Details contenuta nel pannello di visualizzazione, e dal menu a scelta rapida, si
selezioni Seleziona Tutti i Campi. Nella tabella Product selezionare il campo
ProductName.
Fare clic sulla scheda Anteprima Dati per ottenere un’anteprima dei dati interrogati
90 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si selezioni poi la scheda Comando SQL per visualizzare l’Espressione SQL generata
dalla query.
Per inviare i dati ad uno Spreadsheet di STATISTICA, si faccia clic sulla freccia verde
presente sulla barra degli strumenti di STATISTICA Query. Verrà visualizzata la finestra
Ritorno di Dati Esterni a Spreadsheet, in cui è possibile decidere se porre i dati nello
spreadsheet corrente oppure in uno nuovo, e correggere altri parametri della query.
Si selezioni l’opzione Nuovo Spreadsheet, e quindi il pulsante Esegui Adesso per
eseguire la query. Se appare la finestra Connetti a Provider OLE DB, premere il
pulsante OK. Dopo pochi istanti, i dati saranno inseriti all’interno dello Spreadsheet di
STATISTICA.
Ora i dati potranno essere analizzati con qualunque strumento di STATISTICA. Si noti
che lo spreadsheet conserva al suo interno l’informazione sulla connessione a
database, e quindi sarà possibile ri-eseguire la query in qualsiasi istante: selezionare la
scheda Dati e nel gruppo Gestisci, premere Dati Esterni. Selezionare Rigenera Dati dal
menu contestuale. È inoltre possibile premere F5 sulla propria tastiera quando lo
spreadsheet è aperto.
STATISTICA Guida di Riferimento – 91
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Esempio 4: Preparazione dei Dati –
Pulitura e Filtraggio
Riepilogo delle Opzioni di
Filtraggio/Ricodifica dei Dati
In pratica, la maggior parte del tempo richiesto per completare un’analisi dei dati od
un progetto di data mining viene impiegato per la preparazione dei dati. Talvolta
all’incirca il 90% del tempo e degli sforzi richiesti per completare un progetto vengono
spesi per una pulitura ed una preparazione adeguata dei dati.
Quando si costruiscono modelli previsionali usando strumenti di data mining, o anche
quando si calcolano semplici statistiche descrittive (medie, distribuzioni di frequenza),
i risultati delle analisi potrebbero apparire assai fuorvianti nel caso in cui, ad esempio,
nei dati sia presente un grande numero di record duplicati (si pensi ad esempio
quando gli stessi numeri di parte vengono registrati più volte), i dati includono outlier
o valori mal codificati (fuori da intervalli di variazione validi), oppure un numero
eccessivo di valori mancanti (vuoti).
Dal sottomenu Dati – Filtro/Ricodifica Dati STATISTICA fornisce i comandi necessari
per trattare rapidamente ed efficacemente questi aspetti legati alla qualità dei dati in
modo da consentire l’esecuzione di valide analisi dei dati e progetti di data mining in
minor tempo.
Nella scheda Dati, nel gruppo Trasformazioni, premere Filtra/Ricodifica per
visualizzare un menu a cascata contenente i comandi per trattare rapidamente ed
efficacemente questi aspetti legati alla qualità dei dati, in modo da consentire
l’esecuzione di analisi e progetti di data mining validi nel minor tempo possibile.
Filtra Casi Duplicati
Si utilizzi questa opzione quando si sospetta che il proprio file dati contenga record
duplicati (ad es. osservazioni identiche).
Si supponga, ad esempio, che in un’analisi della clientela, per identificare le
caratteristiche demografiche di un cliente (“profili”), si desideri conteggiare ogni
cliente una sola volta; si ipotizzi che, tuttavia, il proprio database clienti sia
organizzato per transazioni, e quindi che ogni cliente appaia più volte. In questo caso,
92 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
è possibile usare Filtra Casi Duplicati per creare un file dati per le analisi contenente
solamente record unici (cioè, dove ogni ID cliente appare una sola volta).
Esempio di informazioni duplicate. Si apra il file dati Duplicates.sta. Dal menu
Filtra/Ricodifica, si selezioni Filtra Casi Duplicati per visualizzare la finestra Filtra Casi
Duplicati. All’interno del riquadro Input, l’opzione Variabili viene utilizzata per
specificare le basi per una distinzione dei casi duplicati. Fare clic sul pulsante Variabili,
e nella finestra standard di selezione delle variabili, si selezioni Respondent in modo
che tutti gli intervistati vengano sottoposti ad individuazione dei duplicati. Si prema
OK in questa finestra per tornare alla finestra Filtra Casi Duplicati.
All’interno del riquadro Input, si faccia un clic sul pulsante Casi per visualizzare la
finestra Condizioni di Selezione dei Casi di Spreadsheet, contenente le opzioni per la
selezione delle sole osservazioni che si desidera considerare durante le analisi. In
questo esempio, verranno filtrati tutti i casi, e quindi si prema il pulsante Annulla
nella finestra Condizioni di Selezione dei Casi di Spreadsheet.
L’opzione Usa nomi di caso è deselezionata per impostazione predefinita; in questo
esempio questa opzione verrà mantenuta deselezionata. In caso di selezione di questa
opzione, i nomi di caso verranno utilizzati come una delle basi per il processo di
distinzione, cioè STATISTICA tratterà come duplicato qualsiasi caso avente il
medesimo nome. Quando invece questa opzione è deselezionata, i nomi di caso
duplicati verranno ignorati.
Si deselezioni l’opzione I dati sono ordinati (in quanto il file dati corrente non è
ordinato – quando si dispone di file dati molto grandi, è sempre consigliabile prima
ordinare i dati).
All’interno del riquadro Output, si verifichi che tutte le variabili siano selezionate (la
notazione TUTTO sarà visualizzata accanto al pulsante Variabili). Questa opzione è
STATISTICA Guida di Riferimento – 93
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
utilizzata per selezionare le variabili all’interno dello spreadsheet di input, le quali
verranno incluse nello spreadsheet di output (filtrato); l’impostazione predefinita è
TUTTO).
Si verifichi che l’opzione Crea nuovo spreadsheet sia selezionata (impostazione
predefinita), e si selezioni l’opzione Crea spreadsheet dei duplicati. Si adottino quindi
le impostazioni predefinite per le ultime due opzioni: l’opzione Mantieni ordine è
deselezionata [i nuovi spreadsheet verranno ordinati sulla base delle variabili
selezionate come sorgente di distinzione, in questo esempio: Respondent], e l’opzione
Copia formattazione è selezionata . Si faccia clic su OK.
Saranno generati due nuovi spreadsheet. Uno degli spreadsheet (10 variabili per 51
casi) conterrà gli intervistati dello spreadsheet originale esclusi i duplicati. L’altro
spreadsheet (10 variabili per 9 casi) conterrà gli intervistati duplicati estratti dallo
spreadsheet originale.
Si osservi lo spreadsheet originale, Duplicates.sta, e si noti come alcune delle
intestazioni di variabile – Respondent, State, e Colors – sono formattate in modo
differente. Quindi si osservino i due nuovi spreadsheet; le intestazioni di variabile
relative a Respondent, State, e Colors presentano la medesima formattazione in tutti i
tre spreadsheet. STATISTICA utilizza sotto-impostazioni per creare i nuovi spreadsheet
ed assicurare che le proprietà delle variabili contenute nello spreadsheet genitore
siano conservate negli spreadsheet figli.
Adesso, si chiudano i due nuovi spreadsheet, ma si lasci aperto lo spreadsheet
Duplicates.sta. Si noti che questo spreadsheet ha dimensioni 10v per 60c. Dal menu
Filtra/Ricodifica, si selezioni Filtra Casi Duplicati per visualizzare ancora la finestra
Filtra Casi Duplicati. All’interno del riquadro Input, si prema il pulsante Variabili, e
nella finestra per la selezione delle variabili, si selezioni Respondent e si prema OK.
All’interno del riquadro Input, si deselezioni l’opzione I dati sono ordinati. All’interno
del riquadro Output, si deselezioni l’opzione Crea nuovo spreadsheet. Si prema OK. La
finestra di dialogo verrà chiusa e, invece di creare un nuovo spreadsheet contenente i
duplicati esclusi, lo spreadsheet Duplicates.sta verrà modificato. Tutti i casi duplicati
saranno rimossi da esso; al termine di questa operazione lo spreadsheet avrà
dimensioni 10v per 51c.
94 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si noti che per un confronto dell’unicità dei casi, la funzionalità di filtro dei casi
duplicati non fa nessuna distinzione tra lettere minuscole e lettere maiuscole, cioè se
si dispone di due intervistati – C. Barrett e C. BARRETT – il secondo verrà escluso.
Filtra Dati Sparsi
Non è infrequente che alcune variabili (parametri, o campi di dati) disponibili (ad
esempio) per la modellazione predittiva abbiano molti pochi dati validi. Ad esempio,
in un database della clientela (potrebbe) essere stato archiviato il dato Reddito;
tuttavia, molti pochi clienti potrebbe aver comunicato volontariamente i propri redditi
correnti, e quindi la maggior parte dei dati (in questo campo del database) potrebbero
risultare mancanti. Nei dati di produzione, un campo di dati potrebbe essere stato
predisposto per ospitare uno specifico parametro, ma il sensore potrebbe guastarsi
per un certo periodo di tempo registrando in questo modo una serie indesiderata di
dati mancanti (o non validi).
L’inclusione in un’analisi di variabili “popolate in modo sparso” potrebbe portare alla
produzione di risultati errati, od impedire all’utente di costruire validi modelli
predittivi (a seconda di come i dati mancanti vengono gestiti nel corso delle analisi).
Quindi si potrebbe desiderare d’identificare tali dati sparsi per tempo (cioè prima di
iniziare l’analisi) usando le opzioni di Filtra Dati Sparsi (accessibile dal menu
STATISTICA Guida di Riferimento – 95
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Filtra/Ricodifica, posto nella scheda Dati nel gruppo Trasformazioni), per escluderli
dalle considerazioni successive.
Tratta Variabili Invarianti
Un altro aspetto relativo alla qualità dei dati (molto simile a quello dei dati sparsi) e
che spesso viene affrontato dall’analista, in particolare in presenza di dati (di
processo) sulla produzione industriale, è l’inclusione nelle analisi di alcune variabili
(parametri) invarianti, contenenti cioè tutti valori identici.
Tali variabili non possono essere utili per la modellazione predittiva, e proprio per
questo motivo le opzioni disponibili in Tratta Variabili Invarianti (accessibile dal
menu Filtra/Ricodifica, posto nella scheda Dati nel gruppo Trasformazioni)
consentono all’utente d’identificare queste variabili automaticamente, escludendole
dalle analisi successive.
Ricodifica Outlier
I valori estremi o outlier possono talvolta influenzare fortemente le analisi e portare a
scarsa accuratezza nei modelli predittivi (di data mining). Non vi è una definizione
formale di cosa sia un “outlier” o un “valore estremo”, quindi gli strumenti grafici di
STATISTICA possono fornire il miglior metodo per l’osservazione dei dati e
l’identificazione di tali osservazioni anomale (ad es., è possibile creare box plot delle
96 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
variabili chiave per l’identificazione delle osservazioni più estreme e l’applicazione di
comuni operazioni di brushing).
Per elaborare automaticamente liste di variabili con lo scopo d’identificare e
rimuovere gli outlier, le opzioni disponibili in Ricodifica Outlier (accessibile dal menu
Filtra/Ricodifica, posto nella scheda Dati nel gruppo Trasformazioni) forniscono molti
test per l’individuazione degli outlier (approcci per l’identificazione dei valori estremi).
Gli outlier possono essere ricodificati come dati mancanti oppure come valori validi
(ad esempio, possono essere ridefiniti pari ai rispettivi valori percentili di soglia, ecc.).
Tratta Dati Mancanti
I dati mancanti o i valori non validi devono ovviamente essere trattati in maniera
consistente rispetto agli obiettivi dell’analisi. In alcuni casi, i dati mancanti o non validi
potrebbero a loro volta fornire informazioni utili sul processo o sulla variabile
d’interesse. Ad esempio, in una ricerca di marketing, non è infrequente che gli
intervistati si rifiutino di fornire informazioni personali dettagliate sulla propria salute,
sulle proprie condizioni finanziarie, ecc., e tale rifiuto potrebbe essere correlato con
altre variabili significative d’interesse (ad esempio, il rifiuto a rispondere alle domande
collegate al reddito potrebbe rappresentare un buon indicatore di alto reddito).
STATISTICA Guida di Riferimento – 97
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Le opzioni disponibili in Tratta Dati Mancanti (accessibile dal menu Filtra/Ricodifica,
posto nella scheda Dati nel gruppo Trasformazioni) consentono all’utente di
ricodificare i dati mancanti flessibilmente, definire valori o codici per dati mancanti
multipli di una singola variabile, oppure per marcare le variabili aventi più di una certa
percentuale di dati mancanti.
Imputazione di Dati Mancanti
(k-Nearest Neighbor)
Spesso non è chiara la migliore modalità di ricodifica dei dati mancanti, ed infatti
alcune volte attraverso la ricodifica dei dati mancanti per una particolare variabile in
uno specifico valore (ad es., la media), i risultati finali potrebbero essere distorti. Si
supponga ad esempio che in un questionario tutti gli intervistati che rifiutano di
dichiarare il loro importo tendano ad trovarsi in una fascia di reddito più alta. In
questo caso, l’assegnazione di un reddito medio a questi individui (cioè, la ricodifica
dei dati mancanti per la variabile Income in reddito medio per l’intero campione)
potrebbe produrre risultati altamente fuorvianti.
STATISTICA include un metodo molto efficace (applicabile ad insiemi di dati e
database molto grandi) per la sostituzione dei dati mancanti con dati mancanti
98 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
consistenti rispetto alle altre osservazioni contenute nel campione. Dettagli
riguardanti il metodo e l’algoritmo k-nearest neighbor sono consultabili nel Manuale
Elettronico alla sezione Apprendimento Automatico di STATISTICA Data Miner.
In breve, usando le opzioni disponibili in Imputazione DM (accessibile dal menu
Filtra/Ricodifica, posto nella scheda Dati nel gruppo Trasformazioni), in un primo
passaggio attraverso ai dati, l’algoritmo k-nearest neighbor estrarrà un campione (più
piccolo) tra tutti i dati disponibili. Nel secondo passaggio attraverso il file dati, quando
l’algoritmo incontra dati mancanti, questi vengono sostituiti con valori validi (osservati)
corrispondenti a simili osservazioni disponibili in campioni più piccoli. Quindi per
continuare con questo esempio, se gli intervistati con più alto reddito sono meno
propensi a non rispondere ma allo stesso tempo danno altre indicazioni sul loro livello
di ricchezza (ad esempio, la proprietà di macchine di lusso, una maggiore metratura
della propria abitazione, ecc.) l’algoritmo k-nearest neighbor inserirà accuratamente tali
individui (che hanno evitato di rispondere a proposito del proprio reddito) ad una fascia
di reddito più alta.
L’algoritmo k-nearest neighbor è rapido ed efficace, e fornisce un buon metodo per
sostituire i dati mancanti all’interno del file input con “scelte ragionevoli” basate su
simili punti-dato presenti nel campione. Questo approccio non richiede particolari
assunti circa la natura delle relazioni esistenti tra variabili (cioè, richiede la stima di un
“modello” per ogni variabile, da utilizzare per la previsione dei dati mancanti), ma
semplicemente utilizza i dati osservati come modello.
STATISTICA Guida di Riferimento – 99
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Unire i File Dati
La finestra Opzioni dell’Unione di STATISTICA fornisce la possibilità di unire due file
dati sia per variabili che per casi, in modo da raggruppare tutte le osservazioni in una
sola tabella. Selezionare la scheda Dati, e nel gruppo Gestisci, premere Unisci per
visualizzare la finestra Opzioni dell’Unione.
Premere il pulsante
nell’angolo in alto a destra della finestra, per accedere agli
Aiuti che descrivono le opzioni qui presenti.
Creare un Sottoinsieme
Se si dispone di un grosso spreadsheet, è possibile crearne uno nuovo contenente un
sottoinsieme specifico dello spreadsheet corrente. Ad esempio, aprire Boston2.sta.
Questo dataset contiene più di un migliaio di casi e si vuole estrarre le case con un
basso prezzo medio.
Selezionare la scheda Dati, e nel gruppo Gestisci, premere Sottoinsieme per
visualizzare la finestra Crea un Sottoinsieme.
Premere il pulsante Casi per visualizzare la finestra Condizioni di Selezione dei Casi di
Spreadsheet, che contiene le opzioni per definire le condizioni di selezione dei casi da
considerare nel campione.
100 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Spuntare il controllo Abilita Condizioni di Selezione per attivare le altre opzioni, e
quindi selezionare il pulsante Specifici, selezionati tramite nel riquadro Includi casi
per specificare quali casi includere nelle analisi. Digitare v1=‘LOW’ nella casella
Espressione.
Premere il pulsante OK per impostare le condizioni e per ritornare alla finestra Crea
un Sottoinsieme, nella quale fare clic su OK per creare il nuovo spreadsheet.
Lo spreadsheet risultante contiene 334 casi (invece dei 1,012 originali) e tutte le 15
variabili dello spreadsheet originale. Per la variabile PRICE, tutti i casi hanno il valore
LOW.
Esempio 5: Utilizzare STATISTICA ETL
(Estrarre, Trasformare e Caricare)
Il modulo STATISTICA ETL (Estrarre, Trasformare e Caricare) fornisce delle capacità
uniche per elaborare ed unire i dati, in particolare, quei dati che sono difficili da
gestire utilizzando gli strumenti standard. ETL automatizza il processo di convalida ed
allineamento di sorgenti di dati multiple in un'unica fonte, adatta per analisi ad-hoc o
automatizzate.
ETL offre due opzioni per allineare i dati: Indicizzati temporalmente, che aggrega i dati
da sorgenti multiple sulla base di una variabile di data/ora e li allinea per minuto, ora,
giorno, settimana, mese, trimestre o anno; Basati su ID, che aggrega i dati da sorgenti
multiple sulla base di una variabile identificatrice e di una variabile temporale
facoltativa, e, a scelta, allinea i dati per N intervalli uguali o definiti dall’utente.
STATISTICA Guida di Riferimento – 101
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Questo esempio illustra come il modulo ETL gestisce i dati relativi alle azioni archiviati
con intervalli temporali differenti. Le azioni vengono comprate e vendute a prezzi che
variano giornalmente. Microsoft (ticker MSFT) e Oracle (ticker ORCL) sono compagnie
di software che vengono commerciate nella borsa elettronica NASDAQ. In questo
esempio verranno confrontate le serie storiche dei prezzi delle azioni con diversa
data/ora. Il primo insieme contiene le quotazioni giornaliere di Microsoft quotate da
NASDAQ, mentre per il secondo sono disponibili le quotazioni settimanali di Oracle
quotate da un’altra fonte.
Aprire MicrosoftPrices.sta e OraclePrices.sta: nella scheda Home nel gruppo File,
premere la freccia Apri. Dal menu a cascata, selezionare Apri Esempi per visualizzare
la finestra Apri un File Dati di STATISTICA. Fare doppio clic sulla cartella Datasets,
selezionare MicrosoftPrices.sta e OraclePrices.sta, e premere il pulsante Apri.
Entrambi i file contengono le seguenti colonne (variabili): DATE – il giorno della
quotazione; OPEN – il prezzo di apertura del giorno; HIGH – il prezzo più elevato
raggiunto quel giorno; LOW – il prezzo più basso; CLOSE – il prezzo di chiusura della
giornata; e VOLUME - il numero giornaliero di azioni scambiate.
Tuttavia, i due file hanno range della data differenti: Microsoft - 10/22/200701/04/2008; Oracle - 10/18/2007-12/28/2007. Per confrontare i dati, è quindi
necessario allineare il range.
Selezionare la scheda Dati. Nel gruppo Gestisci, premere Dati Esterni, e selezionare
Dati di Processo Indicizzati Temporalmente dal sottomenu Estrai, Trasforma e
Carica(ETL). Apparirà quindi il Pannello d’Avvio di STATISTICA Estrazione,
Trasformazione e Caricamento (ETL): Indicizzato temporalmente.
102 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Premere il pulsante Aggiungi sorgente dati per visualizzare la finestra Seleziona
Sorgente di Dati.
Premere il pulsante Documenti per visualizzare la finestra Seleziona Documenti.
Spuntare il controllo Apri Documenti Spreadsheet per selezionare entrambi i file dati
(MicrosoftPrices.sta e OraclePrices.sta).
Premer il pulsante OK in entrambe le finestre. Il Pannello d’Avvio di STATISTICA
Estrazione, Trasformazione e Caricamento (ETL): Indicizzato temporalmente apparirà
come riportato di seguito:
STATISTICA Guida di Riferimento – 103
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Selezionare MicrosoftPrices.sta nell’elenco di file nella parte alta della finestra, e
premere il pulsante Variabili per visualizzare Selezionare variabili. Specificare DATE
nella lista Date/Time stamp, e CLOSE dall’elenco Variabili.
Premere OK per chiudere la finestra e ritornare al
Pannello d’Avvio di STATISTICA Estrazione, Trasformazione e Caricamento (ETL):
Indicizzato temporalmente.
Ora si ripeti l’operazione per il file OraclePrices.sta, selezionando la variabile 1
dall’elenco Date/Time stamp e la variabile 5 dalla lista Variabili.
Nel riquadro Intervallo di aggregazione per tutte le sorgenti dati, selezionare
l’opzione Settimanale, e modificare il campo inizia da a Venerdì.
104 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Per ulteriori opzioni riguardanti la data e l’ora, selezionare la scheda Opzioni.
Spuntare il controllo Filtra tutte le sorgenti di dati di input secondo Data/Ora
seguente. Per limitare i dati ritornati da entrambi i file, inserire 2/11/2007 nel campo
Data d’inizio e 28/12/2007 in Data di fine. Saranno così ritornate otto settimane.
Premere ora il pulsante Risultati per unire i dati in uno spreadsheet.
STATISTICA Guida di Riferimento – 105
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
I due file dati sono ora allineati settimanalmente per le date nell’intervallo tra
11/2/2007 e 12/28/2007. I prezzi di chiusura giornalieri di Microsoft sono aggregati
tramite la loro media, mentre i prezzi settimanali di Oracle sono rimasti invariati.
Lo spreadsheet Aggregati mostra la data/ora come nomi di caso in modo da poterle
usare per i grafici.
Selezionare la scheda Grafici. Nel gruppo Altri, premere 2D e selezionare Grafici a
Linee (Variabili) per visualizzare la finestra Grafici a Linee 2D- Variabili.
Premere il pulsante Variabili, e selezionare le variabili 2 e 3. Quindi, specificare
Multiplo come Tipo di grafico, e premere OK. L’immagine seguente mostra il grafico
dei prezzi settimanali delle azioni Microsoft e Oracle.
106 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
INSTALLAZIONI ENTERPRISE
Esempio 1: STATISTICA Enterprise Server
– Download/Offload delle Analisi dai/ai
Server
STATISTICA Enterprise STATISTICA Enterprise Server estende le funzionalità della
piattaforma STATISTICA, trasformando un insieme di singole workstation connesse tra
loro in un potente sistema aziendale collaborativo-intelligente. Una caratteristica
chiave dell’architettura Client-Server di STATISTICA Enterprise Server è la possibilità da
parte dell’utente di utilizzare le risorse disponibili sul lato server per l’esecuzione di
analisi statistiche multiple, ripetitive e computazionalmente gravose [“scaricare” i
compiti (task) al server], liberando così le risorse del sistema locale per altre attività
che richiedono un’attenzione immediata. Tutto questo si può ottenere utilizzando sia
un browser Web (client “leggero”) che una versione desktop di STATISTICA (client
“pesante”, client di STATISTICA Enterprise Server): mentre il primo consente l’accesso
a STATISTICA Enterprise Server usando solamente un browser Web, il secondo
richiede l’installazione di STATISTICA sul computer. La perfetta integrazione di
STATISTICA Enterprise Server con l’applicativo di STATISTICA fornisce un flusso di
lavoro e un’esperienza utente comune per le operazioni del lato client e server,
un’interfaccia utente in genere più dinamica e ricca di funzionalità, e tutte le
componenti e gli strumenti aggiuntivi di STATISTICA desktop.
Caricamento di un’analisi (o di uno script personalizzato) su STATISTICA
Enterprise Server. In primo luogo, assicurarsi che l’integrazione di STATISTICA
Enterprise Server sia abilitata. Selezionare la scheda Home, e, nel gruppo Strumenti,
premere Opzioni per visualizzare l’omonima finestra. Nell’albero di sinistra,
selezionare Server/Web. Spuntare il controllo Abilita Integrazione Server
WebSTATISTICA. L’unico parametro richiesto è il percorso alla rete di STATISTICA
Enterprise Server (e le configurazioni della connessione, nel caso in cui queste
differiscano da quelle predefinite). Contattare il proprio amministratore di rete per
richiedere questi valori. È possibile spuntare Abilita Login Integrato, se tale opzione è
supportata e abilitata su server; altrimenti sarà necessario inserire nome utente e
password ad ogni accesso su STATISTICA Enterprise Server.
STATISTICA Guida di Riferimento – 107
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Dopo aver specificato le opzioni di questa scheda, fare clic sul pulsante OK.
La scheda Server è stata quindi aggiunta alla barra multifunzione. Nel gruppo Utente,
premere Log In, e inserire nome utente e password se richiesti. Una volta stabilita una
connessione con successo, i comandi della scheda Server diventeranno disponibili.
I comandi Apri, Salva e Salva Come presenti nel gruppo File sono utilizzati per
caricare un file correntemente aperto su server o per effettuare il download di un file
e aprirlo localmente. Nel gruppo Trasferisci sono inoltre disponibili dei comandi
espliciti che consentono di caricare (Carica File) e scaricare i file (Scarica File) da
specifiche cartelle presenti su server o su client.
Nota: Poiché gli esempi di situazioni reali di analisi lunghe e intensive sono
solitamente basati su grandi insiemi di dati e/o comportano l’impiego di algoritmi
iterativi rappresentati da componenti di STATISTICA non incluse in tutte le
configurazioni del programma, si utilizzerà deliberatamente un esempio che non
richiederà molto tempo per il suo completamento. Si noti che anche in presenza di
analisi rapide e poco gravose, potrebbe essere necessario eseguire comunque una
lunga sequenza di operazioni piuttosto complesse, talvolta programmate per essere
eseguite ad intervalli temporali precisi. In questo caso, le strutture di programmazione
di STATISTICA Enterprise Server potrebbero essere utilizzate una volta creato e
caricato uno script personalizzato che rappresenta i compiti richiesti (ad esempio,
combinando le macro registrate durante una sessione di STATISTICA).
Ora, si registri una semplice macro d’analisi, ad esempio, completando gli step
descritti nell’Esempio 2: ANOVA (pag. 36).
108 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Dopo aver completato l’esempio, nella finestra Risultati ANOVA, si faccia un clic sul
pulsante Opzioni, e dalla lista a cascata risultante si selezioni Crea Macro. Nella
finestra Nuova Macro, si accettino tutte le impostazioni predefinite, e si prema OK. Si
testi la macro generata eseguendola (si prema F5) per verificare che riproduca i
risultati attesi. Si faccia un clic sulla finestra della macro per assicurarsi che sia
selezionata in primo piano nello spazio di lavoro di STATISTICA.
Quindi, nella scheda Server, nel gruppo Task, si selezioni Carica Task per visualizzare
la finestra di dialogo Caricare un task.
Occorrerà selezionare un’operazione (task) da caricare (uno script o un progetto di
Data Mining) e, a scelta, un dataset sul quale eseguire l’operazione (il dataset
potrebbe essere facoltativo in quanto i progetti di Data Mining possono integrare al
loro interno gli insiemi di dati).
Dato che è presente un dataset attivo (Adstudy.sta) ed è aperta una macro di
STATISTICA, le impostazioni predefinite delle opzioni disponibili nella finestra Caricare
un task suggeriranno di usare questi file per il caricamento. L’esempio dimostrerà
invece come referenziare un’operazione (task) ed un insieme di dati sul lato server.
Questa opzione è utile in quanto offre tutte le agevolazioni derivanti dalla possibilità di
archiviazione sul lato server: aspetto positivo specialmente quando si è in presenza di
grandi insiemi di dati (possibilmente aggiornati in modo dinamico) utilizzati da più
utenti.
Per fare riferimento ad un insieme di dati caricato sul lato server, all’interno del
riquadro Sorgente Dati, si selezioni Seleziona file dati memorizzato sul server per
visualizzare la finestra Deposito di STATISTICA Enterprise Server.
STATISTICA Guida di Riferimento – 109
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
La struttura ad albero delle cartelle rappresenta il Deposito di STATISTICA Enterprise
Server (eventualmente in forma abbreviata, secondo i permessi d’accesso). Si faccia
un clic sulla cartella Datasets presente nel pannello di sinistra, e si selezioni
Adstudy.sta all’interno del pannello di destra (oppure è possibile inserire il percorso
all’interno della casella disponibile nella parte bassa della finestra).
Si faccia un clic su OK nella finestra Deposito di STATISTICA Enterprise Server e in
Caricare un task. STATISTICA invierà quindi l’operazione (task) al server, caricando se
necessario i file. Adesso è possibile passare ad altre attività, monitorando
periodicamente lo stato delle operazioni caricate su server attraverso la selezione di
Stato nel gruppo Task della scheda Server. La seguente immagine illustra la finestra
Stato Task contenente le operazioni caricate su server.
L’elenco degli stati delle operazioni può essere aggiornato manualmente premendo il
pulsante Aggiorna oppure automaticamente spuntando il controllo Automatico
disponibile nel lato inferiore a destra della finestra Stato Task. Le operazioni possono
essere caratterizzate da stati di Pendente e In Esecuzione oppure Completo o Errore
Script.
110 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Se l’operazione fallisce, si faccia un doppio clic sulla voce ad essa corrispondente per
visualizzare informazioni aggiuntive riguardanti il fallimento. Una volta risolto il
problema (ad es., aggiornando uno script SVB o uno spazio di lavoro di Data Miner), si
selezioni l’operazione fallita e si prema il pulsante Reinvia.
Una volta completata con successo, sarà possibile ottenere i risultati. Dato che i
risultati sono posti sul server, saranno disponibili per ogni client di STATISTICA, e
quindi basta adoperare le medesime credenziali. Il riquadro Risultati contiene il
controllo Task e l’opzione Dati da utilizzare per recuperare anche il dataset (se
possibile). Quando l’opzione Browser è selezionata, i risultati verranno aperti
all’interno del browser del client, per facilitare l’esplorazione di risultati con
dimensioni significative; ad esempio se l’analisi genera molti dataset e/o grafici, sarà
possibile eseguire una ricerca tramite browser e selezionare solo i risultati specifici
che si desidera importare sul proprio desktop. Traccia report genera un report
diagnostico relativo all’esecuzione delle operazioni d’interesse.
Per risparmiare spazio sul server, si consiglia di eliminare i risultati dei task non più
necessari. Apparirà un messaggio ogni volta che si richiedono i risultati, che domanda
se devono essere eliminati dopo averli recuperati (a meno che sia selezionata
l’opzione Cancella task dopo recupero). Premere OK per eliminare i risultati.
Una volta completata l’operazione (o attività, o task), si recuperino i risultati e si
chiuda la finestra Stato Task. I risultati generati localmente o dal server saranno
uguali.
STATISTICA Guida di Riferimento – 111
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Esempio 2: Utilizzare STATISTICA in
Ambienti Regolati
In un ambiente regolato, le analisi condotte per applicazioni GxP (Good
Manufacturing Practices, Good Clinical Practices, Good Laboratory Practices) sono
quelle che più riguardano la sicurezza dei clienti nell’ambito delle prove cliniche, della
produzione e del controllo della qualità. Quando un’azienda conduce analisi per
un’applicazione GxP, gli enti regolamentatori raccomandano che l’azienda sia in grado
di provare che i risultati del sistema di analisi validato (ad es., STATISTICA) siano sotto
controllo. STATISTICA, attraverso le sue funzionalità di tracciabilità e di blocco degli
spreadsheet/report, offre gli strumenti necessari per soddisfare questi requisiti
normativi.
Per soddisfare i requisiti di tracciabilità delle applicazioni GxP, è necessario osservare
tre aspetti: 1) il controllo dei dati di input sottoposti all’analisi (occorre cioè sapere chi
ha fatto cosa, in quale momento, per quale ragione; i vecchi ed i nuovi valori), 2) il
controllo delle tabelle e dei grafici dei risultati (ad es., dimostrare che non siano stati
alternati in alcun modo dopo la loro creazione), e 3) la tracciabilità tra le versioni dello
spreadsheet di input e degli output dei risultati. STATISTICA fornisce queste
informazioni attraverso le funzionalità di Tracciabilità su Spreadsheet.
Per maggiori dettagli sulle versioni e sulla cronologia dei documenti, si veda la sezione
Sistema di Gestione dei Documenti STATISTICA (SDMS) disponibile nel Manuale
Elettronico.
Controllare i Dati di Input
Abilitare la Registrazione della Tracciabilità
Aprire uno spreadsheet di STATISTICA. Evidenziare la scheda Strumenti, premere
Tracciabilità e selezionare Impostazioni per visualizzare la finestra Impostazioni
Tracciabilità su Spreadsheet. Spuntare il controllo Abilita registrazione della
tracciabilità per abilitare la registrazione della tracciabilità per lo spreadsheet
corrente.
112 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si noti che quando la registrazione della tracciabilità su spreadsheet è abilitata, lo
spreadsheet sarà automaticamente impostato in modalità diretta, cioè le modifiche
apportate, saranno immediatamente scritte su disco. Così, quando la registrazione è
abilitata, tali modifiche non potranno essere annullate.
Spuntare il controllo Richiedi di specificare commenti sulle ragioni di ogni modifica
per richiedere agli utenti di spiegare perché è stata apportata la modifica allo
spreadsheet.
Il pulsante Tronca registrazione è disponibile solo se la registrazione della tracciabilità
è stata precedentemente specificata ed è presente un Visualizzatore Tracciabilità su
Spreadsheet allegato allo spreadsheet. Premendo questo pulsante sarà possibile
troncare la registrazione ed eliminare tutte le voci esistenti. All’utente verrà quindi
richiesto di confermare questa azione prima dell’eliminazione. Una volta troncata la
registrazione, l’azione stessa verrà registrata nel nuovo file di tracciabilità appena
troncato.
Si prema OK nella finestra Impostazioni Tracciabilità su Spreadsheet, per abilitare la
registrazione della tracciabilità; infatti, apparirà immediatamente la finestra Inserisci
motivo del cambiamento per consentire all’utente d’inserire un motivo relativo
all’abilitazione della funzione di registrazione. Si inserisca un commento e quindi si
prema OK.
Adesso, si faccia un clic col tasto destro del mouse sull’intestazione dell’ultima
variabile contenuta nello spreadsheet, e si selezioni Aggiungi Variabili dal menu a
scelta rapida. Nella finestra Aggiungi Variabili, accettare tutte le impostazioni
predefinite e premere OK. Apparirà la finestra Inserisci motivo del cambiamento;
l’utente dovrà inserire un commento e premere OK prima di effettuare la modifica.
Quando la registrazione della tracciabilità è abilitata, ogni modifica applicata allo
spreadsheet verrà documentata, e, quando l’opzione Richiedi di specificare commenti
sulle ragioni di ogni modifica é selezionata, i commenti degli utenti verranno
archiviati e visualizzati all’interno del Visualizzatore Tracciabilità su Spreadsheet.
Dopodiché, sulla scheda Strumenti, premere Tracciabilità e selezionare Visualizza
Registrazione per aprire il Visualizzatore Tracciabilità su Spreadsheet.
STATISTICA Guida di Riferimento – 113
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Il visualizzatore consiste di una griglia informativa contenente tutte le azioni tracciate
inclusi il numero di sequenza, data/ora di modifica, il computer utilizzato per eseguire
la modifica, le informazioni sull’utente, natura e ragione della modifica. La larghezza
delle colonne contenute nella griglia di registrazione può essere aumentata tramite le
tecniche standard di Windows. La Tracciabilità verrà quindi salvata ed integrata in
ogni rispettivo spreadsheet.
Protezione con password vs. blocco. Uno spreadsheet può essere protetto con una
password in modo da impedirne l’apertura ad utenti indesiderati, poiché solamente
coloro che la conoscono potranno accedere allo spreadsheet. Tale password può
essere modificata solamente dopo aver aperto lo spreadsheet.
In alternativa, bloccare lo spreadsheet rende di sola lettura alcune parti dello
spreadsheet, in modo da impedirne la modifica. Lo spreadsheet può essere aperto da
chiunque, ma le porzioni bloccate non potranno essere alterate.
Le opzioni di protezione con password e di blocco di spreadsheet possono essere
abilitate contemporaneamente.
Proteggere uno Spreadsheet con una Password
Aprire uno spreadsheet di STATISTICA. Premere il pulsante Start
nell’angolo in alto
a sinistra e, dal menu a cascata, selezionare Proprietà per visualizzare la finestra
Proprietà Documento. Selezionare la scheda Password.
114 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Inserire una password all’interno del campo Password del documento e fare clic sul
pulsante OK. Verrà quindi visualizzata la finestra Password, in cui immettere
nuovamente per confermarla.
Premere il pulsante OK all’interno della finestra Password e chiudere il file dati. Verrà
quindi aperta una finestra in cui verrà richiesto di salvare i cambiamenti; premere Si
per applicare la password. La prossima volta che un qualsiasi utente cercherà di aprire
questo spreadsheet, verrà visualizzata la finestra Password, nella quale sarà
necessario specificare la password corretta.
Bloccare uno Spreadsheet
Per soddisfare i requisiti di conformità, è necessario verificare l’attendibilità dei dati di
input. Usando le opzioni di blocco di spreadsheet, sarà possibile impedire le modifiche
a tutte le funzionalità di spreadsheet, dall’aspetto dei dati (cioè, modalità di
visualizzazione, specifiche di variabile) al valore reale dei dati e delle condizioni di
selezione dei casi, ecc. Ovviamente, talvolta alcune modifiche dovranno comunque
venire applicate (ad esempio in seguito alla specificazione di dati errati). Le
funzionalità di Tracciabilità su Spreadsheet disponibili in STATISTICA consentiranno, se
abilitate, di registrare ogni singola modifica applicata allo spreadsheet.
STATISTICA Guida di Riferimento – 115
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Con i prodotti di STATISTICA Enterprise, solo gli utenti con i permessi di
Amministratore di Sistema potranno modificare le impostazioni di Tracciabilità su
Spreadsheet. Per maggiori informazioni si veda la sezione STATISTICA Enterprise del
Manuale Elettronico.
Con uno spreadsheet aperto, selezionare la scheda Strumenti. Premere Blocco per
visualizzare la finestra Blocca Spreadsheet.
Qui sarà possibile specificare quali aspetti dello spreadsheet si desidera bloccare.
Quando gli utenti provano a modificare una caratteristica bloccata, verrà visualizzato
un messaggio che li informerà del blocco attivo.
Selezionare l’opzione Dati dello Spreadsheet per impedire modifiche ai dati reali
contenuti nello spreadsheet. Gli utenti saranno quindi impossibilitati a modificare i
valori dei dati così come il codice di dati mancanti. Questi non saranno inoltre in grado
di eseguire una qualsiasi operazione di gestione dei dati che abbia effetto sullo
spreadsheet (ad es., la modifica del tipo di dati o della lunghezza delle stringhe in una
variabile di testo). Se questa opzione è deselezionata, gli utenti saranno in grado di
modificare i dati (ad es., aggiornando le query e le Formule di Spreadsheet oppure
semplicemente inserendo nuovi valori).
Spuntare l’opzione Visualizzazione elementi (font, formati, ecc.) per impedire la
modifica dei font e dei formati usati nello spreadsheet. Le opzioni relative alla
modifica della dimensione, del colore, del tipo e dello stile dei font verranno quindi
disabilitate. Verranno inoltre disabilitate le opzioni disponibili per l’applicazione degli
aspetti di spreadsheet (accessibile selezionando la scheda Formato e premendo
Aspetti nel gruppo Spreadsheet).
Selezionare l’opzione Pesi e selezione dei casi per impedire che gli utenti modifichino
le condizioni di selezione dei casi ed i pesi di caso quando lo spreadsheet è bloccato.
116 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Gli utenti non saranno in grado di abilitare o disabilitare oppure di modificare le
condizioni di selezione correntemente definite. La maggior parte delle opzioni
disponibili sulla scheda Selezione disponibili nella finestra Condizioni di Selezione dei
Casi di Spreadsheet verranno disabilitate; tuttavia, le opzioni disponibili sulle altre
schede della finestra (sottocampionamento, applicazione di formati alle condizioni di
selezione) rimangono attive. Le medesime considerazioni sono valide anche per la
finestra dei Pesi di Caso.
Spuntare l’opzione Specifiche delle Variabili per impedire cambiamenti alle specifiche
delle variabili (ad es., il tipo di misurazione, il codice dei dati mancanti, il formato di
visualizzazione, i nomi lunghi di variabile). Quando si seleziona questo controllo, gli
utenti saranno ancora in grado di visualizzare la finestra di dialogo di specificazione
delle singole variabili (accessibili tramite un doppio clic sul nome di variabile), tuttavia
le opzioni disponibili nell'Editor Specifiche di Variabile saranno disabilitate.
Si selezioni l’opzione Tracciabilità per impedire modifiche alle configurazioni della
tracciabilità. Gli utenti non saranno in grado di modificare tali impostazioni.
Si inserisca una password da usare per bloccare e sbloccare lo spreadsheet, si
confermi la password, e si prema OK. Sebbene una password non sia necessaria,
questa è comunque fortemente raccomandata. Se non viene inserita e confermata
alcuna password, un qualsiasi utente potrà sbloccare le caratteristiche di spreadsheet
semplicemente deselezionando le opzioni contenute in questo riquadro. Si noti che in
caso di blocchi attivi, per sbloccare lo spreadsheet l'utente dovrà prima inserire la
password corretta.
Si reinserisca la password specificata per confermarla nel sistema. Si noti che questa
opzione è visualizzabile soltanto in caso sia stata specificata una password.
Controllare i Risultati e la Tracciabilità
Per soddisfare i requisiti di conformità, un altro step è assicurare che i risultati
riportati siano sotto controllo. STATISTICA fornisce opzioni per la creazione di report
GxP. In modalità GxP, tutti i risultati vengono inviati su una finestra di report, che a
sua volta risulterà bloccata. Tutte le opzioni disponibili per la rimozione dei risultati
(Taglia, Estrai - Originale, Elimina, ecc.) ed i risultati aggiuntivi (Incolla, Inserisci)
saranno disabilitate. STATISTICA può inoltre includere una data di creazione in tutti i
report così come di un time stamp relativo a tutti i risultati aggiunti di volta in volta.
L’aspetto ed il contenuto della stampa di ora e di data saranno completamente
STATISTICA Guida di Riferimento – 117
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
configurabili e potranno inoltre includere informazioni sugli utenti e sui computer.
Quindi, in modalità GxP, sarà possibile conoscere quando i risultati sono stati creati e
da chi. È inoltre possibile assicurarsi che i risultati non siano rimossi.
Una funzionalità aggiuntiva della modalità GxP è l’opzione di tracciabilità. Quando si
lavora in modalità GxP, STATISTICA verifica automaticamente se la tracciabilità di
spreadsheet è abilitata. In caso affermativo, STATISTICA invierà su report il nome di
spreadsheet ed il numero di versione. Talvolta i numeri di versione non potranno
essere disponibili, ad esempio, quando la tracciabilità non è abilitata o quando i
risultati vengono creati tramite una connessione Database In Loco. In questo caso,
STATISTICA fornirà una spiegazione sul perché il numero di versione non sia
disponibile.
Creare un Report GxP
Selezionare la scheda Home. Nel gruppo Strumenti, premere Opzioni per visualizzare
l’omonima finestra. Dal menu ad albero, selezionare Gestore Output, posto all’interno
di Analisi/Grafici. Dal menu a cascata Output su Report, selezionare Invia su Report
Multipli (uno per ogni Analisi/Grafico) oppure Report Singolo (comune a tutte le
Analisi/Grafici).
Spuntare il controllo Bloccato per rendere disponibili le opzioni del riquadro Blocco di
Report (Report GxP) e assicurarsi che i documenti non possano essere rimossi dal
report. Le funzionalità dei report, come Taglia, Incolla, Elimina, Estrai, ecc. saranno
disattivate.
118 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Per riportare le informazioni sulla creazione in cima al file, è possibile accettare il
formato predefinito visualizzato all’interno del campo Stampa Dettagli, oppure
inserirne uno proprio. In questa casella possono essere utilizzati codici espressi nel
seguente formato: &[Data], &[Ora], &[Utente] e &[Computer]. Qualsiasi altro testo
venga inserito, sarà mostrato così com’è.
Per riportare le informazioni sulla data/ora sopra ogni oggetto che viene inserito nel
report, è possibile accettare il formato predefinito specificato all’interno della casella
Stampa Data/Ora, o inserirne uno proprio. In questa casella possono essere utilizzati
codici espressi nel seguente formato: &[Data], &[Ora], &[Utente] e &[Computer].
Premere OK all’interno della finestra Opzioni ed eseguire una qualsiasi analisi, ad es.,
utilizzare le Statistiche di Base per creare uno spreadsheet riassuntivo delle
Statistiche Descrittive. Quando si preme il pulsante Riepilogo, i risultati saranno
inviati su un report bloccato in cui verranno riportate le informazioni relative al
creatore, alla data/ora, ecc. dell’analisi.
STATISTICA Guida di Riferimento – 119
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
120 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Esempio 3: STATISTICA Enterprise
STATISTICA Enterprise migliora le funzionalità tipiche delle applicazioni di STATISTICA
in quanto offre funzionalità aggiuntive per il lavoro di gruppo, l’amministrazione
centrale, la personalizzazione a livello di sistema, e altre funzioni indispensabili
quando si utilizzano le applicazioni di STATISTICA come parte integrante dei sistemi
informatici a livello aziendale.
STATISTICA Enterprise Manager è una componente fondamentale del sistema
STATISTICA Enterprise che consente agli utenti di configurare i diversi aspetti del
sistema Enterprise inclusi l’amministrazione degli utenti, l’organizzazione del
visualizzatore di sistema, la manutenzione delle connessioni a database, le
configurazioni dei dati e delle analisi.
In questo esempio, saranno svolti i seguenti punti:
1. Creazione di un nuovo utente
2. Creazione di un nuovo gruppo
a. Assegnazione dei permessi al gruppo
b. Aggiunta dell’utente (cfr. N. 1) al gruppo
3. Creazione di un nodo nel visualizzatore sistema
4. Creazione di una nuova connessione a database
5. Creazione di una configurazione dei dati
6. Creazione di una configurazione d’analisi
7. Esecuzione della configurazione d’analisi
Vista di Sistema vs. Vista ad Oggetti
Prima di iniziare questo esempio, si osservarvi la differenza tra la vista di sistema e la
vista ad oggetti. Dalla scheda Visualizza di STATISTICA Enterprise Manager, è possibile
selezionare Vista di Sistema oppure Vista ad Oggetti. In Vista di Sistema, gli oggetti,
come ad esempio le configurazioni dei dati e le configurazioni dell’analisi, vengono
visualizzati come nodi figli. In Vista ad Oggetti, gli oggetti vengono organizzati come
STATISTICA Guida di Riferimento – 121
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
nodi figli all’interno delle rispettive categorie. Per questo esempio si selezioni Vista di
Sistema.
1. Creare un Nuovo Utente
Avviare Enterprise Manager e accedervi come un utente facente parte del gruppo
predefinito di Amministratori. All’interno del menu ad albero (il pannello a sinistra), si
faccia un clic su a fianco del nodo Amministrazione Utenti per espanderlo e quindi si
selezioni la cartella Utenti. All’interno della pagina delle proprietà (il pannello di
destra), si faccia un clic sul pulsante Nuovo Utente per visualizzare le opzioni
disponibili per la creazione di un nuovo utente. All’interno della casella Nome, si
inserisca Utente Test 1, si definisca una password e infine la si confermi.
Quindi si faccia un clic sul pulsante Applica Modifiche , posto nella barra degli
strumenti ad Accesso Rapido, per salvare le modifiche. Apparirà un messaggio che
avvisa che l’utente non dispone dei permessi per il login. Premere il pulsante Sì per
continuare.
Sarà ora creato un gruppo, concessi i permessi di gruppo ed assegnato il nuovo utente
al gruppo per consentirgli l’accesso ad Enterprise Manager. Con questo metodo,
qualsiasi modifica ai permessi dovrà essere applicato solo al gruppo e non ad ognuno
122 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
dei singoli utenti, rendendo in questo modo più facile la manutenzione degli utenti di
STATISTICA Enterprise.
2. Creare un Nuovo Gruppo
All’interno del nodo Amministrazione Utenti, si selezioni la cartella Gruppi, e, nella
pagina delle proprietà, si faccia un clic sul pulsante Nuovo Gruppo per visualizzare le
opzioni necessarie per la creazione di un nuovo gruppo. Nel campo Nome, si inserisca
Gruppo Test 1, e nel riquadro Membri di Gruppo, si spunti il controllo adiacente ad
Utente Test 1. Questa scelta consentirà di aggiungere l’utente precedentemente
creato a questo gruppo. All’interno del riquadro Permessi di Gruppo, si selezionino le
opzioni Analysis Admin (AADM) e di Web User (WUSR). Quindi, nel menu ad albero, si
faccia un clic sul segno adiacente al nodo Gruppo Test 1 per espanderlo, e si
selezioni Moduli d’Analisi. Nella pagina delle proprietà, si prema il pulsante Seleziona
Tutto per selezionare tutti i moduli contenuti nella lista Moduli d’analisi disponibili.
Questa operazione darà agli utenti di questo gruppo i permessi necessari per accedere
sia alla versione Web che alla versione desktop di STATISTICA, e di eseguire tutte le
analisi e i report disponibili.
Si faccia clic sul pulsante Applica Modifiche
per salvare le modifiche.
STATISTICA Guida di Riferimento – 123
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Sono stati quindi creati l’utente ed il gruppo necessari per eseguire le analisi ed i
report. Quando nei passaggi successivi verranno create le configurazioni dei dati, delle
analisi e dei report, questo gruppo sarà assegnato a tali oggetti per permettere ai suoi
utenti di eseguirli.
3. Creare un Nodo nel Visualizzatore Sistema
Adesso verrà creato un nodo all’interno del Visualizzatore Sistema che contenga i dati,
le analisi e le configurazioni dei report per questo esempio. Nel menu ad albero, si
faccia un clic sul segno adiacente al nodo Visualizzatore Sistema per espanderlo. Si
faccia un clic col tasto destro del mouse sulla cartella STATISTICA Enterprise, e dal
menu a scelta rapida, si selezioni Nuova Cartella. All’interno della casella Nome
Cartella nella pagina delle proprietà, si inserisca Esempio Test 1.
Si faccia un clic sull’icona Applica Modifiche
per salvare le modifiche. Questa
cartella adesso verrà utilizzata per ospitare le configurazioni dati, analisi e dei report.
4. Creare una Nuova Connessione a Database
Si faccia un clic col tasto destro del mouse sul nodo Connessioni a Database della vista
ad albero, e dal menu a scelta rapida, si selezioni Nuova Connessione a Database per
visualizzare la finestra Proprietà di Data Link.
124 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
In questo esempio sarà utilizzato il database Northwind installato insieme a Microsoft
SQL Server. Selezionare Microsoft OLE DB Provider for SQL Server e premere Avanti
>>. Verrà quindi visualizzata la scheda Connessione.
Selezionare un server dalla lista a cascata Selezionare o specificare un nome di server.
Quindi si selezioni l’opzione di log on adatta al proprio database SQL Server
Northwind. Specificare Utilizza sicurezza integrata di Windows NT o Utilizza
password e nome utente specifici ed inserire un Nome utente e una Password nei
campi rispettivi.
Dopodiché selezionare Northwind dal menu a cascata Selezionare il database sul
server.
STATISTICA Guida di Riferimento – 125
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Premere il pulsante Verifica connessione per tentare la connessione al database
specificato. Apparirà quindi un messaggio che riporta la scritta Verifica connessione
completata. Se tale connessione fallisce, assicurarsi che le impostazioni siano corrette.
Ad esempio, errori di battitura e maiuscole o minuscole errate possono causare
questo tipo di problemi.
Si prema OK all’interno della finestra Proprietà di Data Link. Nella pagina risultante, si
inserisca Connessione Esempio Test 1 all’interno del campo Nome.
Quindi si prema il pulsante Permessi d’Accesso. Dall’elenco degli Utenti e Gruppi
Disponibili, selezionare Gruppo Test 1, e premere la freccia per spostare tale
gruppo nella lista Permessi d’Accesso.
126 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Ora, si faccia un clic sul pulsante Applica Modifiche.
Una volta creata la connessione al database Notrhwind, verrà creata una
configurazione dati tramite la quale estrarre i dati dal database.
5. Creare una Configurazione Dati
Si faccia un clic col tasto destro del mouse sulla cartella Esempio Test 1 all’interno
della vista ad albero, e dal menu a scelta rapida, si selezioni Nuova Configurazione
Dati. Nella pagina delle proprietà, si inserisca Esempio Test 1 all’interno del campo
Nome. Si faccia un clic sulla freccia contenuta nel campo Connessione, e dalla lista a
cascata risultante, si selezioni Connessione Esempio Test 1.
STATISTICA Guida di Riferimento – 127
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Premere il pulsante Passo Successivo per visualizzare le opzioni della nuova query.
128 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si prema il pulsante SQL Wizard per visualizzare la finestra Nuova Query, che verrà
aperta in STATISTICA
Si trascini la tabella Orders dal pannello di sinistra al visualizzatore editor (pannello in
alto a destra), e quindi si selezionino, nel seguente ordine, i campi OrderID, Ship Via,
ShipCountry e Freight.
Si selezioni la scheda Anteprima Dati all’interno del riquadro delle proprietà della
query (pannello in basso a destra) e si faccia un clic su Aggiorna sulla barra degli
strumenti (il punto esclamativo rosso). Con questa azione si eseguirà un test della
query per verificare che i valori d’interesse vengano importati correttamente.
STATISTICA Guida di Riferimento – 129
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si prema il pulsante Ritorna Dati a STATISTICA disponibile sulla barra degli
strumenti (freccia verde) per inviare la query nella sezione configurazione dati.
Fare clic sulla riga OrderID per evidenziarla e premere il pulsante Modifica per
visualizzare le opzioni per modificare la colonna OrderID. Fare clic sulla freccia
Aggiornamento Automatico e, dalla lista a cascata, selezionare Prima colonna
d’aggiornamento. Questa azione consente di rilevare le modifiche nella colonna
OrderID. In aggiunta, la colonna verrà ordinata.
130 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si prema il pulsante Passo Successivo per modificare la colonna ShipVia. Si prema il
pulsante Filtro per visualizzarne le opzioni, e si selezioni l’opzione Abilitato per
consentire il filtraggio della colonna ShipVia.
Si prema il pulsante Passo Successivo per tornare alle opzioni di modifica della
colonna ShipVia, e si faccia nuovamente clic sullo stesso pulsante per modificare la
colonna ShipCountry. Si faccia un clic sul pulsante Filtro per visualizzare le opzioni di
filtraggio, e si spunti il controllo Abilitato per consentire il filtraggio della colonna
ShipCountry. Si ripeta il procedimento di premere due volte il pulsante Passo
Successivo per modificare la colonna Freight. Si prema la freccia Tipo di Target e, dal
menu a cascata, si selezioni Caratteristica Variabile. Questa azione renderà
disponibile la colonna per l’esecuzione di analisi SPC (si tratta di colonne contenenti i
dati da analizzare).
STATISTICA Guida di Riferimento – 131
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Dopodiché, si prema il pulsante Passo Successivo per visualizzare le opzioni dei
Permessi d’Accesso da applicare a quest’oggetto. Dalla lista Utenti e Gruppi
Disponibili, si selezioni Gruppo Test 1, e quindi si faccia un clic sulla freccia per
spostarlo nell’elenco Permessi d’Accesso. Ora questa configurazione dati sarà
eseguibile (ma non modificabile) dagli utenti del Gruppo Test 1.
Si prema il pulsante Applica Modifiche per applicare questa nuova configurazione di
dati a STATISTICA Enterprise Manager.
6. Creare una Configurazione d’Analisi
Una volta definita la configurazione di dati per l’estrazione dei dati dal database
Northwind, è necessario creare una configurazione d’analisi per analizzare i dati.
All’interno del menu ad albero, si faccia un clic col pulsante destro del mouse sulla
cartella Esempio Test 1, e, dal menu a scelta rapida, si selezioni Nuova Configurazione
Analisi per visualizzare la finestra Seleziona una Configurazione di Dati. Si selezioni
l’oggetto Esempio Test 1 e si faccia un clic sul pulsante OK. Se viene visualizzato il
messaggio “Se selezionata, questa opzione sostituirà i permessi dell’Analisi con quelli
dei Dati”, si prema OK.
132 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si prema il pulsante Passo Successivo per continuare con la creazione della
configurazione d’analisi (adottando come nome predefinito il medesimo della
configurazione di dati). Si prema nuovamente Passo Successivo per continuare con la
modifica della configurazione d’analisi.
Nella pagina delle proprietà relative alla colonna Caratteristiche SPC – HEIGHT, si
modifichi Tipo di Carta in Singole e Range Mobili (come illustrato nell’immagine
precedente).
Non è necessario definire altre opzioni SPC, si selezioni il nodo il nodo Opzioni
Esecuzione all’interno della vista ad albero, e si selezioni l’opzione Mostra finestra con
Criteri SQL all’interno della pagina delle proprietà.
STATISTICA Guida di Riferimento – 133
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Questa opzione prevede che STATISTICA richieda per il filtraggio di quelle colonne alle
quali è stata abilitata l’opzione Filtro nella configurazione dati (se, durante la
definizione delle opzioni Filtro, è stato spuntato il controllo Richiesto nel filtraggio,
questo passo non sarà necessario poiché verrà comunque richiesto il filtraggio
durante l’esecuzione – in questo esempio non si richiede nessuna forzatura). Si prema
il pulsante Applica Modifiche per salvare questa configurazione d’analisi su
STATISTICA Enterprise.
7. Eseguire la Configurazione d’Analisi
Si chiuda Enterprise Manager, e si accede a STATISTICA come Utente Test 1 creato nel
Passo 1. Selezionare la scheda Enterprise e, nel gruppo Enterprise, premere Esegui
Analisi/Report per visualizzare la finestra Eseguire Analisi o Report (a seconda delle
configurazioni definite). Selezionare l’analisi Esempio Test 1 e premere OK; apparirà la
finestra Criteri SQL.
Si faccia un clic sulla freccia Colonna e si selezioni ShipCountry dalla lista a cascata. Si
prema il pulsante
per visualizzare la finestra Valore di ShipCountry, contenente la
lista di valori disponibili per ShipCountry. Si selezioni Brazil e si prema il pulsante OK.
134 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
Si faccia un clic sul pulsante Fine per completare il passo di filtraggio, estrarre i dati ed
eseguire un’analisi “preconfezionata” della colonna Freight.
Interfacce Utente Personalizzate
Si noti che questo semplice esempio illustra come abilitare ed eseguire una
configurazione d’analisi usando l’interfaccia utente e le componenti di output
standard di STATISTICA. Tuttavia, uno dei più importanti punti di forza di STATISTICA
Enterprise è la facilità con cui si possono creare interfacce utente personalizzate (ad
es., per categorie differenti di utenti in funzione dei ruoli in azienda, del grado di
esperienza o dei privilegi d’accesso ai dati).
È possibile creare un’interfaccia utente personalizzata di qualsiasi grado di
complessità, da quelle altamente semplificate, contenenti ad esempio solo tre
opzioni:
STATISTICA Guida di Riferimento – 135
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
a quelle particolarmente elaborate caratterizzate da un’elevata flessibilità:
Fare riferimento alla sezione del Manuale Elettronico dedicata a STATISTICA Enterprise
per maggiori dettagli ed esempi.
136 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
L’Opzione di STATISTICA Enterprise
Server
STATISTICA Enterprise Server fornisce tutte le funzionalità descritte in questo
esempio, permette di scaricare i compiti al server e consente l’accesso remoto tramite
un’interfaccia browser.
Cfr. Appendice B – STATISTICA Enterprise Server, pag. 285, per maggiori informazioni.
STATISTICA Guida di Riferimento – 137
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
138 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
3
CAPITOLO
INTERFACCIA UTENTE
Caratteristiche Generali ...................................................................... 141
Supporto per Analisi Multiple.............................................................. 142
Tre Interfacce Utente Alternative:
Interfaccia Utente Interattiva......................................................... 144
STATISTICA Visual Basic e Controllare STATISTICA
da Altre Applicazioni .................................................................. 156
Interfaccia Utente Basata su Browser Web:
STATISTICA Enterprise Server.................................................... 157
Integrazione con Microsoft Office ...................................................... 158
STATISTICA Guida di Riferimento –139
Copyright © StatSoft, 2011
Capitolo 2: Esempi Passo-Passo
140 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
3
CAPITOLO
INTERFACCIA UTENTE
CARATTERISTICHE GENERALI
Operazioni Personalizzate
Il sistema STATISTICA può essere controllato in diversi modi. La sezione che segue
riassume le quattro principali interfacce utente alternative di STATISTICA:
1. Interfaccia interattiva (cfr. pag. 144)
2. STATISTICA Visual Basic (cfr. pag. 156)
3. Interfaccia basata su browser Web (cfr. pag. 157)
4. Integrazione con Microsoft Office (cfr. pag. 158)
Tuttavia, si noti che:
• Molti aspetti di queste interfacce utente non si escludono l’una con l’altra;
quindi, in relazione alle specifiche applicazioni e alle personali preferenze, è
possibile combinarle;
• La Barra di Accesso Rapido e i menu classici possono integrare interfacce
utente alternative, ad esempio, per fornire accesso rapido alle macro
(Visual Basic) o ai file usati più frequentemente;
• Quasi tutte le caratteristiche di queste interfacce utente alternative
possono essere personalizzate (dando a STATISTICA un differente aspetto e
comportamento); è comunemente raccomandato personalizzare il proprio
sistema sfruttando appieno la potenza di STATISTICA per soddisfare le
STATISTICA Guida di Riferimento –141
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
proprie preferenze e i bisogni necessari a completare i propri lavori (cfr.
Personalizzazione dell’Interfaccia Utente a pag. 235).
Accesso Alternativo agli Stessi
Servizi - Stili di Lavoro Personalizzati
Anche senza alcuna personalizzazione, le impostazioni predefinite di STATISTICA
offrono diverse soluzioni per consentire agli utenti di ottenere gli stessi risultati.
Questo principio ad “accessi alternativi”, presente in ogni aspetto dell’interfaccia
utente, permette a STATISTICA di supportare differenti stili di lavoro. Ad esempio,
è possibile accedere alla maggior parte degli strumenti utilizzati nei seguenti modi:
• Dalla barra multifunzione o dai menu classici
• Tramite le combinazione di tasti della tastiera
• Utilizzando i campi cliccabili presenti sulla barra di stato
• Attraverso la barra di Accesso Rapido (una barra degli strumenti con pulsanti e
controlli specificati dall’utente, che può includere macro e comandi)
• Dai menu contestuali associati ad oggetti specifici (celle, icone dei registri, parti
dei grafici) visualizzabili premendo il tasto destro su di un oggetto.
Si consiglia di esplorare le varie alternative dell’interfaccia utente di STATISTICA
prima di “concentrarsi” su di uno stile piuttosto che ad un altro.
SUPPORTO PER ANALISI MULTIPLE
Come descritto in precedenza, è possibile avere diverse istanze di STATISTICA
aperte nello stesso momento. Ognuna può eseguire la stessa o differenti tipi di
analisi (tradizionalmente chiamati moduli), come Statistiche di Base, Regressione
Multipla, ANOVA, ecc. Inoltre, in un’istanza di STATISTICA, possono essere aperte
simultaneamente più analisi, dello stesso tipo o di tipologie differenti (ad es.,
cinque Regressioni Multiple e due ANOVA), e ciascuna di loro può essere eseguita
sullo stesso o su differenti file dati di input (file di dati di input multipli possono
essere aperti simultaneamente).
142 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
“Analisi” singole – unità funzionali di lavoro. Al fine di agevolare lo
sfruttamento della funzionalità “multitasking”, il lavoro con STATISTICA è
organizzato in unità funzionali chiamate “analisi” e rappresentate dai pulsanti
presenti nella barra di analisi nel lato inferiore della finestra dell’applicazione
(sopra la barra di stato, si veda l’illustrazione seguente, dove Statistiche
Descrittive, Analisi dei Gruppi e Analisi Correlazione Canonica vengono eseguiti
simultaneamente). Pulsanti consecutivi sono aggiunti quando si avviano nuove
analisi. Sono disponibili molteplici opzioni per controllare (e/o configurare in modo
permanente) questo aspetto di STATISTICA.
Di default, quando si seleziona un output specifico da una finestra dei risultati,
viene visualizzato l’output predefinito (una spreadsheet o un grafico) e la finestra
viene automaticamente minimizzata nel suo rispettivo pulsante di analisi sul fondo
dello schermo. Per visualizzare nuovamente la finestra e riprendere l’analisi si
faccia clic su questo pulsante (o si prema CTRL+R).
Una selezione delle opzioni relative alla gestione delle analisi è disponibile nel
menu di scelta rapida (disponibile facendo clic con il pulsante destro su di un
pulsante sulla barra di analisi, come illustrato nell’immagine precedente).
Un suggerimento utile per gli utenti con grandi schermi. Se si dispone di uno
schermo di grandi dimensioni, è possibile disabilitare la minimizzazione predefinita
delle finestre delle analisi, sfruttando il fatto che la maggior parte sono di piccole,
STATISTICA Guida di Riferimento – 143
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
e, quindi, possono rimanere sullo spazio di lavoro senza interferire con la
visualizzazione dei risultati dell’analisi. È possibile modificare questa opzione sia
per una particolare analisi (deselezionare il comando Minimizza Automaticamente
nel pulsante del menu di scelta rapida, mostrato nell’immagine precedente), o
globalmente per l’intero programma [utilizzando il pannello Analisi/Grafici della
finestra Opzioni (accessibile selezionando la scheda Strumenti e premendo Opzioni),
e deselezionando il controllo Riduci a icona automat. le finestre di dialogo
mostrando l’output].
Quando si eseguono analisi multiple e lo spazio di lavoro di STATISTICA comincia ad
essere ingombrante, è possibile nascondere tutte le finestre riferite alla specifica
analisi (o chiuderle tutte insieme con il comando a pulsante nel menu di scelta
rapida Chiudi Tutte le Analisi). È possibile anche aprire nuove applicazioni di
STATISTICA, le quali offrono un altro semplice modo di organizzare e gestire il
lavoro.
INTERFACCIA UTENTE INTERATTIVA
Panoramica
Componenti principali dell’interfaccia utente interattiva di STATISTICA.
Sebbene l’interfaccia utente interattiva di STATISTICA non sia l’unica disponibile
(cfr. Capitolo 7 – Personalizzare STATISTICA, pag. 233 e Capitolo 8 – STATISTICA
Visual Basic, pag. 241), nella maggior parte dei casi risulta la più facilmente e
comunemente utilizzata. Molte componenti di questa interfaccia utente possono
essere viste nella finestra delle applicazioni di STATISTICA.
In primo luogo, allo stesso modo della maggior parte dei software, nella parte alta
della finestra vengono visualizzate schede, barre dei menu e varie barre degli
strumenti. Queste sono personalizzabili e visualizzate nel modo più appropriato
per poter lavorare.
Nella parte inferiore della finestra vengono visualizzate la barra delle analisi
(contenente finestre di dialogo di analisi/grafici minimizzate) e la barra di stato.
Sono disponibili inoltre, dei menu di scelta rapida quando si preme il tasto destro
in riquadri specifici.
144 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
I file dati possono essere visualizzati in spreadsheet, registri, report, o finestre
singole. Gli spreadsheet di risultati o grafici possono essere visualizzati in registri,
report, o finestre singole. Si noti che in spreadsheet, registri, o report possono
anche essere visualizzati documenti aggiuntivi (come documenti Microsoft Word o
immagini Bitmap). In ultimo, il codice STATISTICA Visual Basic viene visualizzato in
finestre di macro.
Normalmente non si dovrebbero vedere in una volta simultaneamente tutte
queste opzioni e strumenti. È sempre possibile adattare l’interfaccia utente di
STATISTICA alle proprie necessità e richieste di livello di conforto, siano queste
semplici o complesse (cfr. pag. 233). Questi vari strumenti ed opzioni sono descritti
dettagliatamente nel Manuale Elettronico (STATISTICA Aiuti).
Moduli. STATISTICA offre un’ampia scelta di procedure statistiche e grafiche e
ciascuna procedura può essere eseguita nella stessa istanza di STATISTICA. Questo
significa che, ad esempio, è possibile calcolare statistiche sui residui usando le
opzioni nel modulo Regressione Multipla, e immediatamente usare l’output in
Analisi Fattoriale o in un altro modulo esplorativo senza prima far partire un’altra
istanza di STATISTICA. Per ulteriori informazioni sull’utilizzo dei risultati come input
di dati, si veda È possibile usare i risultati della mia analisi per eseguire un’altra
analisi? nel Manuale Elettronico.
Il Flusso dell’Analisi Interattiva
Pannello d’Avvio. Quando si seleziona una procedura statistica dalle schede
Statistiche, Data-Mining o Grafici, viene visualizzato il rispettivo Pannello d’Avvio
(come illustrato di seguito, sono state selezionate le Statistiche di Base, dalla
scheda Statistiche – gruppo Base, al fine di visualizzare il Pannello d’Avvio di
Statistiche di Base e Tabelle).
STATISTICA Guida di Riferimento – 145
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
Ciascun Pannello d’Avvio contiene una lista di tipi di analisi disponibili per quel
particolare modulo. Facendo clic in un qualsiasi posto al di fuori del pannello,
automaticamente verrà ridotto a icone della barra di analisi. Se si possiedono
schermi ad alta risoluzione, è possibile modificare queste impostazioni predefinite
e mantenere aperte sullo spazio di lavoro le diverse finestre di dialogo (in ciascuna
sequenza di analisi).
Finestre di dialogo per la definizione dell’analisi e per la selezione
dell’output (risultati). Quando si è selezionata l’analisi desiderata sul Pannello
d’Avvio, viene visualizzata la finestra di dialogo di definizione di analisi, nella quale
vengono selezionate le variabili da analizzare e altre opzioni e caratteristiche del
lavoro che deve essere eseguito. Spesso, queste finestre di dialogo hanno diverse
schede che raggruppano le opzioni, analisi, e/o risultati in categorie logiche che
facilitano l’individuazione di specifiche caratteristiche.
146 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
In alcune semplici analisi (come per le Statistiche Descrittive, riportate
nell’illustrazione sopra), la finestra di dialogo per la specificazione delle analisi
serve anche come finestra per la selezione di output dove poter richiedere il tipo e
il formato dell’output (ad es., alcuni specifici spreadsheet o grafici). La maggior
parte delle analisi, tuttavia, presentano una finestra di dialogo separata per la
specificazione dell’analisi ed una finestra dei risultati.
Funzionalità degli spreadsheet per le analisi dello scenario (what-if) e per gli
aspetti personalizzati. STATISTICA fornisce agli utenti le funzionalità necessarie
per aggiungere agli spreadsheet delle informazioni supplementari sui tipi di
misurazione delle variabili e sugli stati di caso. Questi “metadati” possono essere
utilizzati per creare una descrizione più completa del proprio insieme di dati,
facilitare certi tipi di analisi esplorative, e personalizzare l’aspetto dei casi
all’interno dei grafici.
Stati di caso e brushing. È possibile assegnare stati di caso al fine di
personalizzare l’aspetto dei punti di un grafico, e rendere più agevole
l’identificazione di punti influenti ed interessanti. Per la personalizzazione
dell’aspetto dei punti selezionati è disponibile un’ampia gamma di simboli e colori.
Non solo è possibile applicare nello spreadsheet gli stati di caso prima della
creazione di un grafico, ma è possibile eseguire tale applicazione anche in modalità
interattiva attraverso le funzionalità di Brushing (accessibile premendo il pulsante
Brushing , nel gruppo Personalizza Grafica della scheda Modifica, quando un
grafico è visualizzato). Gli stati di caso assegnati nel grafico verranno propagati su
spreadsheet. La possibilità di assegnare gli stati di caso sia negli spreadsheet che
nei grafici facilita ulteriormente le procedure di analisi esplorativa visuale dei dati.
Tipi di misurazione e pre-selezione automatica delle variabili. I tipi di
misurazione saranno identificati automaticamente nel corso delle analisi per
consentire l’utilizzo delle variabili più appropriate a seconda del caso (ad es., le
variabili di tipo categoriali saranno presenti all’interno della lista di predittori
categoriali del modulo ANOVA Fattoriale).
STATISTICA Guida di Riferimento – 147
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
In tutte le finestre di dialogo standard per la selezione delle variabili (come quella
illustrata in alto), sarà disponibile l’opzione Mostra solo variabili appropriate, che
consentirà all’utente di eseguire una pre-selezione delle variabili sulla base del
relativo Tipo di Misurazione (specificato nella finestra Variabile, accessibile
attraverso un doppio-clic sulla rispettiva intestazione negli spreadsheet); nel caso il
tipo sia Automatica, le opzioni contenute in Pre-selezione e classificazione
automatiche delle variabili (disponibili nel pannello Analisi/Grafico della finestra
delle Opzioni, accessibile premendo Opzioni nella scheda Strumenti)
determineranno le modalità in cui STATISTICA stabilisce automaticamente il Tipo di
Misurazione.
Filtro automatico (oscurare variabili e casi). Il filtro (accessibile selezionando la
scheda Dati e premendo Filtro Automatico nel gruppo Trasformazioni) è un modo
semplice e rapido per visualizzare una specifica porzione dei dati all’interno del
proprio spreadsheet senza dover ordinare i dati o creare un sottoinsieme. Quando
una variabile viene filtrata, solo i valori che soddisfano i criteri specificati saranno
visualizzati nello spreadsheet. I casi che invece non soddisfano questi criteri
verranno nascosti ma non rimossi dallo spreadsheet (ad es., nello spreadsheet
riportato sotto, saranno visualizzati solo i casi che soddisfano la condizione
GENDER = MALE).
148 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
Sebbene siano nascosti, questi casi saranno ancora disponibili per le analisi
statistiche e grafiche.
Output. Come descritto in dettaglio nel Capitolo 4 – Cinque Canali per l’Output
delle Analisi (pag. 163) e come illustrato in Esempio 1: Correlazioni (pag. 11) ed in
Esempio 2: ANOVA (pag. 36), gli spreadsheet ed i grafici di output vengono inviati
per impostazione predefinita su registro. I registri possono essere salvati e riaperti
in seguito, facilitando il ritorno a specifici risultati.
È inoltre possibile inviare tutto l’output su di un report dell’analisi (cfr. pag. 168),
poiché risulterà facilmente organizzabile (attraverso l’albero del report),
formattabile e stampabile. È inoltre possibile scegliere d’inviare tutti i risultati,
indipendentemente dall’analisi di provenienza, su un unico report. Infine, l’output
potrà essere inviato contemporaneamente su finestre singole.
Per specificare le opzioni di output per una singola analisi o sessione, si faccia un
clic sul pulsante
disponibile in ogni finestra di analisi o grafico, e si
selezioni Output per visualizzare la finestra Gestore Output di Analisi/Grafico.
Per accedere alle opzioni globali dell’output, selezionare la scheda Strumenti.
Premere Opzioni per visualizzare l’omonima finestra , e accedendo al pannello
Gestore Output. Altrimenti, selezionare la scheda Home e premere Opzioni nel
gruppo Strumenti. Per maggiori informazioni, vedere il Manuale Elettronico.
Funzionalità delle Analisi
STATISTICA fornisce l’accesso diretto a tutte le analisi tramite la scheda Statistiche:
e la scheda Data Mining:
STATISTICA Guida di Riferimento – 149
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
e fornisce accesso diretto a tutte le finestre per l’analisi grafica attraverso la
scheda Grafici:
Queste schede non sono mai disabilitate, cioè, sono sempre disponibili quando è
aperto un documento di input.
Le schede Statistiche e Data Mining forniscono la possibilità di accedere a tutti i
tipi di analisi disponibili in STATISTICA. La scheda Grafici fornisce sia accesso
diretto ai grafici più frequentemente utilizzanti (ad es., scatterplot, istogrammi,
grafici di medie/errore, ecc.) che accesso gerarchico a tutti i tipi di grafici di
STATISTICA, tra i quali Grafici 2D, Grafici 3D di Sequenze e XYZ, Grafici
Categorizzati, Grafici Definiti da Utente, Grafici di Blocchi di Dati, Grafici di Dati
di Input e Aspetti Grafici Multipli. Discussioni approfondite su tutte le varie
tipologie di statistiche e grafici offerte da STATISTICA sono disponibili nel glossario
del Manuale Elettronico. Cfr. Appendice C: Famiglia dei Prodotti di STATISTICA (pag.
297) per ulteriori informazioni su tutti le applicazioni per l’analisi dei dati
appartenenti alla famiglia di prodotti STATISTICA.
Utilizzare la barra di analisi. Per sfruttare la funzionalità “multitasking” di
STATISTICA (cfr. Supporto Analisi Multiple, pag. 142), le analisi di STATISTICA sono
organizzate come unità funzionali rappresentate con pulsanti nella barra delle
analisi nel fondo della finestra dell’applicazione (sopra la barra di stato, si veda
l’illustrazione di seguito, dove sono eseguite simultaneamente Statistiche
Descrittive, Analisi dei Gruppi e Analisi Correlazione Canonica). Vengono aggiunti
pulsanti consecutivi quando si fa partire una nuova analisi.
150 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
Ridurre a icona le finestre di dialogo (ed un suggerimento per gli utenti con
schermi grandi). A seconda delle proprie preferenze, è possibile scegliere di
minimizzare tutte le finestre di dialogo quando si seleziona un’altra finestra in
STATISTICA o un’altra applicazione. Per impostazione predefinita, il comando
Minimizza Automaticamente è selezionato; tuttavia, quando si lavora con schermi
abbastanza grandi per mantenere diverse finestre, è raccomandabile
deselezionare questa opzione. Questo permette di tenere le finestre di dialogo
delle analisi sullo schermo mentre viene creato, il rispettivo output, quindi
permette di utilizzare queste finestre di dialogo come “barre strumenti” dalle quali
può essere selezionato l’output. Cfr. pag. 143 per ottenere informazioni su come
modificare questo comando.
Continuare le analisi/i grafici. È facile proseguire con l’analisi o il grafico
corrente (cioè, rendere attiva la finestra per una particolare analisi). Selezionare la
scheda Strumenti, premere Barra di Analisi, e specificare Riprendi dal menu a
cascata; in alternativa è possibile premere CTRL+R; altrimenti fare clic sul pulsante
dell’analisi/del grafico nella barra di analisi. Quando si stanno eseguendo analisi
multiple, è possibile anche selezionare la specifica analisi dal menu Seleziona
Analisi/Grafico (come mostrato nella prossima figura).
STATISTICA Guida di Riferimento – 151
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
Nascondere le finestre. Per facilitare ulteriormente l’organizzazione delle finestre
delle varie analisi, è possibile nascondere tutte le finestre associate ad una
particolare analisi quando questa è deselezionata: selezionare la scheda Strumenti,
premere Barra di Analisi e, dal sottomenu Opzioni, specificare Nascondi su
Deselezione. Di default, questa opzione è deselezionata. Si noti che questo
comando si applica solo quando i risultati sono inviati a finestre individuali; per
ulteriori dettagli sulla gestione dell’output dalle analisi si veda la discussione sul
Gestore Output (pag. 163). È inoltre disponibile un comando per chiudere tutte le
finestre, disponibile sulla scheda Home, nel gruppo Finestre, ed uno per chiudere
tutte le analisi, premendo Barra di Analisi sulla scheda Strumenti e selezionando
Chiudi Tutte le Analisi dal menu a cascata.
Portare le finestre in primo piano. Sulla scheda Strumenti, premere Barra di
Analisi, e, dal sottomenu Opzioni, selezionare Porta in Primo Piano per attivare
tutte le finestre associate ad una particolare analisi quando tale analisi viene
selezionata, sostituendo qualunque finestra fosse in primo piano. Questo comando
facilità inoltre l’organizzazione delle singole finestre provenienti da varie analisi ed
è selezionato di default. Si noti che si applica solamente quando i risultati sono
posti in finestre singole; vedere anche la discussione sul Gestore Output (pag. 163)
per maggiori dettagli sulla gestione dell’output delle analisi.
Nascondere il riquadro informativo. Di default, nella parte superiore di alcune
finestre dei risultati (come in Risultati Regressione Multipla) è presente un
riquadro informativo contenente un riepilogo delle informazioni base dell’analisi. È
possibile nascondere tale riquadro facendo clic sul pulsante nell’angolo in basso
a destra. Si può inoltre eliminare la visualizzazione dei riquadri informativi in modo
globale selezionando Nascondi Riquadro Riassuntivo dal sottomenu Opzioni, al
quale si accede premendo Barra di Analisi sulla scheda Strumenti.
152 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
Tipologie di Documenti
STATISTICA utilizza principalmente sette tipi di documenti:
• Registri (cfr. pagg. 164 e 187)
• Spreadsheet (tabelle multimediali) (cfr. pag. 191)
• Report (cfr. pagg. 168 e 199)
• Grafici (cfr. pagg. 202 e 209)
• Macro (Programmi in STATISTICA Visual Basic) (cfr. pagg. 203 e 241)
• File di Progetti di STATISTICA (cfr. pag. 204)
• File di Progetti di Data Miner Recipes (cfr. pag. 68)
Utilizzando questi sette tipologie di documenti, è possibile gestire dati di vario
tipo, eseguire l’inserimento dei dati e le analisi, generare grafici di alta qualità,
sviluppare applicazioni personalizzate di qualsiasi complessità e creare report
formattati in modo personale.
È possibile accedere velocemente ai documenti usati più di recente premendo il
menu d’Avvio di STATISTICA (nell’angolo in basso a sinistra dello schermo) e
selezionando Documenti oppure facendo clic sulla freccia Apri della scheda Home.
Nel pannello Generale della finestra di dialogo Opzioni (alla quale si accede
premendo l’omonimo pulsante sulla scheda Strumenti), è possibile specificare
quanti documenti usati di recente visualizzare (di default, 16). Per maggiori dettagli
su ciascun tipo di documento, vedere le introduzioni di registri, spreadsheet,
report, grafici e macro a pag. 187; per ulteriori informazioni, si veda il Manuale
Elettronico.
Schede relative alle tipologie di documenti attivi. . Ciascuno dei tipi principali
delle finestre di STATISTICA (cfr. pag. 153) gestisce i dati in un modo differente, e
quindi offre opzioni differenti di personalizzazione e gestione. Queste differenze si
riflettono nelle schede che accompagnano ciascun tipo di finestra. I comandi ed i
STATISTICA Guida di Riferimento – 153
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
pulsanti dei menu per ciascuno dei tipi principali di documenti sono descritti
dettagliatamente nel Manuale Elettronico.
Le schede disponibili quando i registri sono aperti, dipendono dal tipo di
documento correntemente selezionato nel registro. Perciò, quando si sta
modificando uno spreadsheet, un grafico, un report o una macro all’interno di un
registro, sono disponibili le schede attinenti quel tipo di documento. Quando si
seleziona un “nodo vuoto” nel pannello ad albero del registro, di default viene
visualizzata la scheda Registro.
Barre degli strumenti definite dall’utente. In aggiunta alle molte barre degli
strumenti fornite dai menu classici di STATISTICA (nella barra multifunzione,
premere l’icona nell’angolo in alto a sinistra per visualizzare i menu classici), è
inoltre possibile crearne di personalizzate. Queste barre degli strumenti, definite
dall’utente, possono includere sia qualsiasi comando disponibile in STATISTICA, che
dei controlli speciali (cioè, nomi font, dimensione font, stili grafico, ecc.). Le barre
degli strumenti possono assumere qualsiasi nome e possono essere progettate per
essere disponibili in base al tipo di documento attivo. Inoltre, è possibile
personalizzare tutte le barre degli strumenti (incluse quelle esistenti) aggiungendo
comandi e controlli speciali.
Per creare una barra degli strumenti (o modificarne una esistente) utilizzare le
opzioni nella scheda Barre degli Strumenti della finestra Personalizza, alla quale si
accede selezionando Personalizza nel menu Strumenti. Per personalizzare una
barra degli strumenti è sufficiente trascinare i comandi dalla finestra alla barra,
come mostrato nell’illustrazione che segue.
154 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
L’aspetto e la posizione delle barre degli strumenti possono essere facilmente
corrette (ad es., fissandole o lasciandole libere di muoversi). Tutte queste opzioni
permettono di creare barre uniche che garantiscono la creazione di una interfaccia
utente altamente specializzata . Il Manuale Elettronico include istruzioni passopasso, su come realizzare personalizzazioni. In particolare, per ulteriori dettagli,
cfr. Creare Nuove Barre Strumenti nel Manuale Elettronico.
Anche la barra di Accesso Rapido , posta nella parte superiore della barra
multifunzione, può essere personalizzata; cfr. Personalizza Barra di Accesso Rapido
nel Manuale Elettronico.
Menu definiti dall’utente. La personalizzazione dei menu classici è ugualmente
facile e può essere eseguita utilizzando la scheda Menu della finestra Personalizza
(dettagli nel Manuale Elettronico)
STATISTICA Guida di Riferimento – 155
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
STATISTICA VISUAL BASIC
E CONTROLLARE STATISTICA
DA ALTRE APPLICAZIONI
Il linguaggio STATISTICA Visual Basic, considerato standard industriale, (integrato in
STATISTICA) fornisce un’interfaccia utente (un’alternativa) all’intera funzionalità di
STATISTICA, ed offre incomparabilmente molto più di una sola “applicazione
supplementare di linguaggio di programmazione” che può essere utilizzata per
scrivere estensioni personalizzate. STATISTICA Visual Basic sfrutta appieno il
modello di architettura ad oggetti di STATISTICA e può essere usata per accedere
tramite programmazione ad ogni aspetto e virtualmente ad ogni dettaglio delle
funzionalità di STATISTICA. Anche le analisi e i grafici più complessi possono essere
registrati in macro Visual Basic ed eseguite ripetutamente in un secondo momento
o modificate ed utilizzate come blocchi costruttivi per altre applicazioni.
STATISTICA Visual Basic aggiunge un arsenale di più di 14.000 nuove funzioni alla
sintassi standard completa di Visual Basic, comprendendo quindi uno dei più
grandi e ricchi ambienti di sviluppo disponibili. Per ulteriori informazioni su
STATISTICA Visual Basic, cfr. il Capitolo 8 (pag. 241).
Controllare STATISTICA da altre applicazioni. Una delle caratteristiche che fa di
STATISTICA Visual Basic un ambiente così potente è la capacità di integrare e
manipolare varie applicazioni e i loro ambienti in una singola macro. Ad esempio, è
possibile registrare o scrivere un programma STATISTICA Visual Basic che calcola
previsioni utilizzando il modulo STATISTICA Serie Storiche ed esegue questo
programma dall’interno di uno spreadsheet di Excel o di un documento Word. Lo
scambio di informazioni tra differenti applicazioni è compiuto esponendo quelle
applicazioni ai programmi Visual Basic come Oggetti. Così, ad esempio, è possibile
eseguire analisi statistiche nel modulo STATISTICA Statistiche di Base da un
programma Visual Basic in Excel dichiarando all’interno del programma un oggetto
di tipo Statistica.Application.
Una volta creato un oggetto, il programma Visual Basic ha accesso alle proprietà e
metodi contenuti in quel oggetto. Le proprietà possono essere fondamentalmente
pensate come funzioni, i metodi possono essere fondamentalmente pensati come
subroutine che eseguono determinate operazioni o elaborazioni all’interno del
rispettivo oggetto di applicazione. È possibile richiamare le procedure di
156 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
STATISTICA direttamente da molte altre applicazioni e linguaggi di programmazioni
(ad es., C++, Java, ed altri).
INTERFACCIA UTENTE BASATA SU
BROWSER WEB: STATISTICA
ENTERPRISE SERVER
In aggiunta ai due tipi di base di interfacce descritte nelle precedenti sezioni,
STATISTICA offre inoltre un’interfaccia utente basata su Browser, dove tutte le
interazioni con l’applicazione che implicano l’interrogazione di database, le
operazioni di gestione dei dati, l’analisi dei dati o di data mining, la generazione di
report e di lavori collaborativi, possono essere eseguite senza avere installata sul
computer locale alcuna applicazione di STATISTICA e utilizzando solo un browser.
Questa interfaccia utente alternativa richiede che sia installata una versione Client
Server della rispettiva applicazione di STATISTICA.
STATISTICA Enterprise Server è un sistema di applicazioni per l’analisi dei dati e per
l’ingresso ai database, altamente scalabile, completamente abilitata per il Web e di
livello enterprise, che si basa sulla tecnologia di elaborazione distribuita e che
supporta le configurazioni dell’architettura Client-Server a più livelli. STATISTICA
Enterprise Server espone le funzionalità analitiche, delle query, dei report e
grafiche di STATISTICA attraverso interfacce immediate, interattive e Web
standard. In alternativa, consente agli utenti della versione desktop (client
“pesante”) di scaricare le operazioni computazionalmente gravose al Server. Tale
sistema viene presentato come un’applicazione completa e pronta da installare
con un’interfaccia utente interattiva e basata su browser, che permette agli utenti
di creare dataset, eseguire analisi ed esaminare gli output interattivamente.
Tuttavia, STATISTICA Enterprise Server è stato costruito utilizzando un’architettura
aperta e complente strumenti di sviluppo compatibili con .NET (basati interamente
su convenzioni industriali della sintassi standard, come VB Script, C++/C#, HTML,
Java e XML) che permettono al personale dei dipartimenti dell’Information
Tecnology di personalizzare tutte le principali componenti del sistema o di
ampliarle, come ad esempio, aggiungendo nuove componenti e/o strutture
analitiche o di database specifiche.
STATISTICA Guida di Riferimento – 157
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
Come accennato, STATISTICA Server è dotato di un’interfaccia utente basata sul
browser Internet (nella forma di finestre facili da navigare e facili da usare)
permettendo agli utenti di specificare analisi e di esaminare i risultati. Tuttavia,
sono forniti strumenti per la personalizzazione di queste finestre e per la semplice
impostazione di nuove interfacce utente o per l’aggiunta di nuove funzioni. Ad
esempio, nel browser può essere creata una semplice finestra di dialogo
contenente solo tre pulsanti, e premendoli si potranno eseguire una serie di analisi
e generare un report dettagliato. Le applicazioni di STATISTICA Enterprise Server
aggiungono una nuova dimensione ed un array senza fine di possibilità relative
all’intera linea informatica di Analisi dei Dati, di Data Mining, e di Controllo di
Qualità/Six-Sigma di STATISTICA.
Il sistema è compatibile con tutte le principali piattaforme software basate sul
Web (come ad esempio, UNIX, Apache e Microsoft IIS), lavora sia nell’ambiente
Microsoft .net che nell’ambiente Sun/Java, e non richiede alcuna modifica al
firewall esistente e ai sistemi di sicurezza Internet/Intranet.
Per maggiori informazioni, fare riferimento all’Appendice B – STATISTICA Enterprise
Server, a pag. 285.
INTEGRAZIONE CON MICROSOFT
OFFICE
Se Microsoft Office è installato sulla stessa macchina in cui è installato STATISTICA,
gli spreadsheet di Excel potranno essere aperti direttamente dall’interno di
STATISTICA ed utilizzati come sorgente di dati per le analisi e i documenti Word
potranno essere usati come destinazione delle analisi (cfr. l’esempio a pag. 159;
vedere anche pag. 171).
Excel come sorgente di dati. È possibile aprire documenti Excel all’interno di
STATISTICA attraverso la finestra Apri. Dopo aver selezionato una cartella di Excel,
viene visualizzata una finestra di dialogo che consente all’utente d’importare il file
in uno spreadsheet standard di STATISTICA oppure di conservare il documento nel
formato di Excel: viene cioè aperta una finestra di Excel all’interno di STATISTICA.
Una volta aperto il documento Excel, sarà possibile accedere a tutti i menu e a
tutte le barre degli strumenti supportate da Excel. Quindi sarà possibile modificare
158 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
e aggiornare le formule, cambiare il formato, copiare/incollare,
trascinare/incollare – tutto ciò che solitamente un utente può fare con Excel.
Il principale punto di forza dell’integrazione con Excel è che i documenti di Excel
possono essere utilizzati come sorgenti di dati per le analisi. In questo caso sarà
sufficiente selezionare la finestra del documento Excel al momento dell’avvio di
un’analisi per trasformarla nella sorgente di dati associata. Dopodiché STATISTICA
visualizzerà una finestra di dialogo nella quale poter specificare l’intervallo di dati
del documento Excel da utilizzare come sorgente di dati e se utilizzare una
particolare riga o colonna come indicatore di nomi di variabile o di caso. Tali
definizioni vengono assegnate al documento Excel un’unica volta.
Non solo con STATISTICA è possibile utilizzare il file Excel come sorgente di dati, ma
può essere applicato anche un aggiornamento automatico. Se si crea un grafico
auto-aggiornante e si modificano i dati contenuti nel file Excel inserendone di
nuovi o ricalcolando le formule, il grafico verrà aggiornato.
Word come destinazione dei report. È inoltre possibile aprire e modificare
documenti Word direttamente all’interno dello spazio di lavoro di STATISTICA. I
documenti word possono venire aperti attraverso la finestra di dialogo Apri, così
che al momento dell’esecuzione di un’analisi o della creazione di grafici/tabelle,
l’output venga inviato su di essi. Ogni output che può essere inviato su un Report
di STATISTICA può essere inviato anche su documento Word.
Come con le finestre Excel, quando i documenti Word sono aperti, è possibile
accedere a tutte le barre degli strumenti ed i menu supportati all’interno
dell’applicazione Word. È perciò possibile eseguire qualsiasi operazione di
formattazione e di modifica supportata in Word.
Quando l’utente invia i risultati analitici (tradizionalmente contenuti in
spreadsheet) su Word, STATISTICA si avvale delle funzionalità di modifica delle
tabelle e converte lo spreadsheet in una tabella vera e propria. Per gli spreadsheet
distribuiti su più pagine, sarà possibile definire dove collocare l’interruzione di riga
e di colonna. Questi spreadsheet verranno suddivisi in colonne in modo da non
accedere mai la larghezza massima della pagina.
STATISTICA Guida di Riferimento – 159
Copyright © StatSoft, 2011
Capitolo 3: Interfaccia Utente
160 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
4
CAPITOLO
SEI CANALI PER L’OUTPUT
DELLE ANALISI
Panoramica .......................................................................................... 163
1. Registri di STATISTICA ..................................................................... 164
2. Finestre Singole ............................................................................... 167
3. Report ............................................................................................... 167
4. Microsoft Word ................................................................................ 171
5. Output sul Web ................................................................................. 173
6. SharePoint o Sistema di Gestione dei Documenti
STATISTICA (SDMS) ........................................................................ 181
STATISTICA Guida di Riferimento –161
Copyright © StatSoft, 2011
162 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
4
CAPITOLO
SEI CANALI PER L’OUTPUT
DELLE ANALISI
PANORAMICA
Quando si esegue un’analisi, STATISTICA genera output nella forma di tabelle
multimediali (spreadsheet) e grafici. Sono disponibili sei canali base sui quali poter
inviare tutto l’output:
1. Registri di STATISTICA (pag. 164)
2. Finestre Singolo (pag. 167)
3. Report (pag. 167)
4. Microsoft Word (pag. 171)
5. Il Web (pag. 173)
6. SharePoint o Sistema di Gestione dei Documenti STATISTICA (SDMS) (pag.
181)
I primi quattro canali di output elencati sopra vengono definiti e controllati
attraverso le opzioni disponibili nel Gestore Output (accessibile selezionando
Gestore Output dal menu a cascata del pulsante Avvio , posto nell’angolo in alto
a sinistra della barra multifunzione, cfr. pag. 24 per maggiori dettagli sia sul
Gestore Output globale disponibile nella finestra Opzioni che sul Gestore Output di
Analisi/Grafico). Sono presenti diverse modalità invece per indirizzare l’output su
Web, a seconda della versione di STATISTICA a disposizione. A SharePoint si accede
dall’interno di STATISTICA e SDMS è un prodotto aggiuntivo disponibile da StatSoft.
STATISTICA Guida di Riferimento –163
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Possono essere usati in molte combinazioni (ad es., un registro e un report
simultaneamente) e possono essere personalizzati in molteplici modi. Inoltre, tutti
gli oggetti di output (spreadsheet e grafici) messi in ogni canale di output possono
contenere altri oggetti e documenti incorporati e collegati, in modo tale che
l’output di STATISTICA possa essere organizzato gerarchicamente in diversi modi.
Ciascuno dei sei canali di output di STATISTICA ha i sui vantaggi unici, come
descritto nelle tre sezioni che seguono. Panoramiche più complete di ciascuno dei
tipi di documento associati ai rispettivi canali di output sono presenti nel Capitolo
5 – Documenti di STATISTICA (pag. 185).
Le funzionalità di salvataggio automatico e recupero. Tutti i documenti di
STATISTICA (cioè, gli spreadsheet di input, i registri, i report e le macro), nei quali
vengono accumulati i risultati del proprio lavoro (ad es., gli inserimenti e la
modifica dei dati, o la raccolta di output) in un certo periodo di tempo, supportano
la funzionalità di Salvataggio Automatico, configurabile sulla pannello Generale
della finestra Opzioni (accessibile selezionando la scheda Strumenti e premendo
Opzioni). Questa funzionalità salverà automaticamente i contenuti del proprio
lavoro, ad esempio ogni 10 minuti, e fornirà la possibilità di conservare i dati che
altrimenti andrebbero persi nel caso di un calo della corrente o di un errore nel
sistema.
1. REGISTRI DI STATISTICA
I registri sono la modalità predefinita di gestione dell’output (per ulteriori
informazioni, vedere pag. 187). Ciascun documento di output (ad es., uno
Spreadsheet o un Grafico di STATISTICA, così come un documento Word o Excel)
viene registrato nel registro come una scheda.
I documenti possono essere organizzati in gerarchie di cartelle o nodi di
documento (per impostazione predefinita, ne viene creata una per ciascuna nuova
analisi) usando una vista ad albero, nella quale documenti singoli, cartelle, o interi
rami dell’albero possono essere facilmente gestiti.
164 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Ad esempio, possono essere estratte selezioni di documenti (ad es., copiati o
spostati trascinandoli) verso la finestra di report o nello spazio lavoro
dell’applicazione (cioè, nell’applicazione “background” di STATISTICA dove
verranno visualizzati in finestre singole). Interi rami possono essere messi in altri
registri in una varietà di modi in modo da costruire specifiche organizzazione di
cartelle, ecc.
Da un punto di vista tecnico, i registri sono contenitori di documenti ActiveX (cfr.
pag. 261 per informazioni sulla tecnologia ActiveX, si veda anche il Manuale
Elettronico). I registri sono compatibili con diversi formati di file di altre
applicazioni (ad es., documenti di Microsoft Office) che possono essere facilmente
inseriti dentro i registri e qui modificati.
Note e commenti dell’utente nei registri. I registri offrono potenti opzioni per
gestire in modo efficiente anche estremamente grosse quantità di output, e
rappresentano sicuramente la miglior soluzione per la gestione degli output sia per
i principianti che per gli utenti avanzati. Un possibile inconveniente potrebbe
essere il non trasparente inserimento di commenti dell’utente (ad es., note) e di
eventuali informazioni supplementari nei “flussi” dei registri di output così come
possibile nei tradizionali report stile word processor, come i Report di STATISTICA
(vedere la successiva sezione). Tuttavia, si noti che:
• È possibile includere delle note a tutti i documenti di STATISTICA in modo
semplice, sia a) direttamente, inserendo del testo nei grafici, tabelle, e
report, che b) indirettamente, inserendo le note nella casella Commenti
della finestra Proprietà Documenti (a cui si accede selezionando il menu
del pulsante Avvio
posto nell’angolo in alto a sinistra della barra
multifunzione), e
STATISTICA Guida di Riferimento – 165
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
• Documenti formattati con note e commenti (nella forma di file di testo,
documenti Report di STATISTICA, documenti WordPad o word processor,
ecc.) possono essere facilmente inseriti nei registri in qualsiasi posto della
organizzazione gerarchica del output. Inoltre, tali note riassuntive o
documenti di commento possono diventare nodi per gruppi di oggetti
subordinati ai quali collegare le note per migliorare ulteriormente la loro
organizzazione.
Salvare i registri come pagine Web. I registri possono venire salvati in formato
di file *.html (Web) selezionando Salva con Nome dal menu Salva della scheda
Home nel gruppo File, e scegliendo l’opzione Pagina Web (*.htm; *.html) dalla
lista a cascata Salva come. Il salvataggio in formato di pagina Web creerà un file
*.html all’interno della directory specificata che potrà essere aperto attraverso i
più tradizionali browser internet quali ad esempio Microsoft Internet Explorer.
Quando si salva un registro come Pagina web, STATISTICA crea anche una
sottodirectory contenente tutte le immagini riferite alla pagina Web creata.
La pagina Web conterrà un controllo ad albero html che consentirà all’utente di
navigare e visualizzare le diverse immagini di registro, in una forma simile a quella
di un registro reale di STATISTICA.
166 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
2. FINESTRE SINGOLE
I documenti di output di STATISTICA possono essere indirizzati ad una coda di
finestre singole; la Lunghezza Coda può essere controllata nel pannello Gestore
Output della finestra Opzioni (accessibile selezionando la scheda Strumenti e
premendo Opzioni).
L’evidente svantaggio di questa modalità di output è la sua totale mancanza di
organizzazione e la sua naturale tendenza a creare disordine nello spazio lavoro
(alcune procedure possono generare centinaia di tabelle o grafici con un clic di un
pulsante).
Uno dei vantaggi di questo modo di gestire l’output è la facilità di adattare questi
oggetti all’interno dello spazio lavoro di STATISTICA (ad es., per creare documenti
di riferimento multipli, facilmente identificabili, che possono essere confrontati
con i nuovi output). Si noti comunque che, per realizzare questo effetto, bisogna
configurare l’output di partenza e generare un grande numero di finestre separate
(quasi sempre non desiderate) che possono creare disordine nello spazio lavoro.
Invece, oggetti specifici di output indirizzati e registrati negli altri due canali
(registri e report) possono facilmente essere trascinati fuori dalle loro rispettive
viste ad albero nelle applicazioni desiderate.
3. REPORT
Quando si esegue un’analisi, l’obiettivo principale è creare un output di alta qualità
da poter utilizzare per raggiungere una conoscenza adeguata dei dati. Per questo
STATISTICA Guida di Riferimento – 167
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
motivo la modalità in cui l’output viene prodotto è importante. STATISTICA offre
una varietà di metodi per la produzione di Report.
Report di STATISTICA
I report in STATISTICA (per ulteriori informazioni, vedere pag. 199) offrono un
modo più tradizionale di gestire l’output dove ciascun oggetto (ad es., uno
Spreadsheet o un Grafico di STATISTICA, o uno spreadsheet di Excel , o uno
spreadsheet di Excel) viene visualizzato successivamente in un documento stile
word processor.
Comunque, la tecnologia che sta dietro questo semplice editor offre funzionalità
molto ricche. Ad esempio, come i registri (vedere Registri di STATISTICA, pag. 164),
anche i Report di STATISTICA sono contenitori ActiveX (per informazioni sulla
tecnologia ActiveX, vedere pag. 261 o il Manuale Elettronico) dove ciascun degli
oggetti (non solo Spreadsheet e Grafici di STATISTICA, ma anche qualsiasi altro
documento ActiveX compatibile, ad es., spreadsheet Excel) rimane attivo,
personalizzabile, e modificabile sul posto.
Gli ovvi vantaggi del gestire l’output in questo modo (più tradizionale del registro)
stanno nell’abilità ad inserire note e commenti “tra” gli oggetti, così come nel
supporto al più tradizionale modo di scorrerli e alla possibilità di rivedere l’output
rapidamente tra di loro, al quale alcuni utenti potrebbero essersi abituati (ad es.,
l’editor supporta la velocità variabile di scorrimento). Inoltre, solo l’output su
report include e mantiene la registrazione dell’informazione supplementare, che
contiene un log dettagliato delle opzioni specificate per l’analisi (ad es., variabili
selezionate e loro etichette, nomi lunghi, ecc., in relazione al livello supplementare
di informazioni specificate nel Gestore Output, cfr. pag. 26.
168 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Tuttavia, un ovvio inconveniente di questi report tradizionali è la loro struttura
intrinsecamente piatta imposta dal loro formato stile word processor, sebbene
questa possa favorire alcuni utenti e certe applicazioni.
Report da Registri
Quando l’utente dispone di un Registro di STATISTICA contenente l’output delle
analisi, si può decidere se si desidera trasferirlo su un report.
Aprire un Registro di STATISTICA e selezionare tutti i file, evidenziando il primo e,
tenendo premuto il tasto MAIUSC della tastiera, facendo clic sull’ultimo. Quindi,
premere Aggiungi a Report sulla scheda Home nel gruppo Output. Tutti i file del
registro saranno duplicati in un Report di STATISTICA.
Report RTF (Rich Text Format)
RTF (Rich Text Format) è un formato standard di Microsoft utilizzato per codificare
testi e grafici formattati lì dove si desideri operare un trasferimento “leggero” di
contenuti tra applicazioni. Quando i report vengono salvati in Rich Text Format
(*.rtf), tutte le formattazioni di file verranno conservate in modo da poter essere
lette ed interpretate da altre applicazioni RTF-compatibili (ad es., Word).
Il formato di STATISTICA Report (.str) aderisce alle convenzioni RTF; tuttavia, il
salvataggio dei report in un formato predefinito di STATISTICA Report assicura che
i report vengano aperti in STATISTICA, fornendo un accesso completo all’albero di
report.
Per aprire un report di STATISTICA in un applicazione RTF-compatibile, si apra il
report e si selezioni la scheda Home, si prema la freccia Salva e si specifichi Salva
con Nome dal menu a cascata per visualizzare la finestra Salva con Nome. Dalla
lista Salva come, si selezioni Rich Text Files (*.rtf), si inserisca un nome all’interno
del campo Nome file, e si prema il pulsante Salva. Sarà quindi possibile aprire il file
all’interno di qualsiasi applicazione RTF-compatibile.
STATISTICA Guida di Riferimento – 169
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Report Acrobat (PDF)
PDF è l’acronimo utilizzato per Portable Document Format; è il formato
industriale-standard utilizzato per l’archiviazione di dati testuali e grafici. PDF offre
un aspetto ed una struttura graficamente ricchi che lo rendono ideale per obiettivi
di presentazione. Inoltre, i documenti in PDF possono venire visualizzati sia in
modalità d’immagine che in modalità testuale.
PDF è una piattaforma indipendente e la maggior parte dei sistemi operativi offre
applicazioni gratuite per la visualizzazione di file PDF (come ad esempio, Adobe
Acrobat su Windows oppure Ghostscript su Linux).
PDF è stato approvato come un formato accettabile per l’archiviazione dei
documenti da impiegare negli ambienti regolati secondo le normative previste in
21 CFR Part 11 dell’FDA.
Per salvare un Report di STATISTICA in formato PDF, si apra il report e si selezioni la
scheda Home e specificare Salva come PDF dal menu Salva. A questo punto verrà
visualizzata la finestra Opzioni di Output, da cui poter scegliere se inviare gli
spreadsheet in forma di Oggetti (come sono dimensionati in finestra di Report)
oppure come Spreadsheet completi (su pagine separate). Se si desidera trattare
gli spreadsheet di output sempre nella stessa maniera, si selezioni l’opzione Usa
l’impostazione corrente e non mostrare più questa finestra. Si prema il pulsante
OK per chiudere la finestra di dialogo Opzioni di Output e visualizzare Salva report
come PDF. Si usi il campo Salva in per selezionare la directory più appropriata in
cui salvare il documento, inserire un nome in Nome File, e premere il pulsante
Salva. I Report, gli Spreadsheet ed i Grafici di STATISTICA possono tutti essere
salvati in formato PDF .
Si noti che il risultato non sarà rappresentato da file PDF semplificati (bitmap
compresse delle immagini delle rispettive pagine di documento) ma file PDF
assolutamente completi che supportano operazioni anche più complesse quali la
copia selettiva d’informazioni testuali.
170 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Report HTML
Si potrebbe voler inviare un Report o un Registro di STATISTICA in Internet in modo
che diverse persone li possano visualizzare. Con STATISTICA, è possibile salvare
report e registri in formato HTML (HyperText Markup Language). In HTML vengono
utilizzati tag per identificare gli elementi del documento, quali ad esempio testi e
grafici.
Si apra un Report od un Registro di STATISTICA, e si selezioni Salva con Nome dal
menu Salva (scheda Home, gruppo File) per visualizzare la finestra Salva con
Nome. Dalla lista a cascata Salva come, si selezioni File HTML (*.html; *.htm) per
salvare il file con un’estensione *.htm.
Si noti che ogni grafico contenuto in un report o in un registro viene salvato in
formato *.png all’interno della stessa cartella del file HTML. È inoltre possibile
salvare i grafici in formato JPG. Per fare ciò, premere Opzioni (dalle schede
Strumenti o Home) per visualizzare l’omonima finestra. Si selezioni sia il pannello
Report che Registri, a seconda del tipo di documento per il file.htm, si spunti il
controllo Formato JPEG all’interno del riquadro Esporta immagini HTML in e si
faccia clic su OK.
4. MICROSOFT WORD
Con STATISTICA, è inoltre possibile inviare l’output direttamente su Word grazie
alla completa Integrazione con Office. Quando Word viene aperto direttamente
all’interno di STATISTICA, le barre degli strumenti ed i menu di Word divengono
disponibili all’utente di STATISTICA grazie alla tecnologia ad interfacce standard
Active X Document. In STATISTICA, sarà quindi possibile eseguire qualsiasi
operazione di formattazione e modifica supportata in Word.
Quando i risultati analitici in forma di spreadsheet vengono inviati su Word,
STATISTICA beneficia delle tradizionali funzionalità di modifica di Word, e converte
lo spreadsheet in tabella. Per spreadsheet su più pagine, è possibile definire dove
inserire l’interruzione di riga e di colonna. In questo modo gli spreadsheet
potranno essere suddivisi per colonna in modo da consentire il loro inserimento
STATISTICA Guida di Riferimento – 171
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
sulla pagina senza che questi superino la larghezza massima consentita. Questa
soluzione consente la presentazione degli spreadsheet in Word in modo tale
rendere la loro modifica più semplice, così come la modifica, la stampa e
l’impaginazione corrette del loro intero contenuto.
Come i report standard di STATISTICA (pag. 168), i documenti Word possono
archiviare e conservare la registrazione d’informazioni supplementari (ad es.,
variabili selezionate, nomi lunghi, ecc.).
Per inviare l’output su un documento Word, si utilizzino le opzioni contenute nel
Gestore Output (accessibile selezionando Gestore Output dal menu a cascata
posto nell’angolo in alto a sinistra della barra multifunzione, oppure
Avvio
selezionando la scheda Home, premendo Opzioni nel gruppo Strumenti e
selezionando il pannello Gestore Output). Nella lista a cascata Output su Microsoft
Word, si selezioni Documenti Word multipli (uno per ogni analisi/grafico), oppure
[Seleziona File] per selezionare un documento Word pre-esistente.
Nonostante i documenti Word non dispongano dell’albero di navigazione
implementato nei Registri e nei Report di STATISTICA, i vantaggi derivanti dall’invio
su documenti Word sono molteplici. Inviando i risultati su un documento Word, si
disporrà di tutte le caratteristiche base di un programma di video-scrittura quale
Word. Ad esempio, sarà possibile allegare template per la creazione di documenti
personalizzati, aggiungere tabelle di contenuti ed indici, monitorare le modifiche,
ecc.
Quando si inserisce un grosso spreadsheet in un documento Word, STATISTICA
rileva automaticamente il numero di variabili da poter adattare in ogni pagina
partizionando lo spreadsheet in molte tabelle Word. Se nello spreadsheet sono
presenti nomi di caso, questi verranno inseriti nella prima colonna di ogni tabella.
Altri benefici derivanti dall’invio dei risultati su un documento Word includono
funzionalità avanzate di stampa (ad es., stampa su file, duplex manuale) e la
possibilità di salvare i risultati su pagina Web.
172 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
5. OUTPUT SUL WEB
Knowledge Portal
I Report di STATISTICA Enterprise Server, o qualunque Report di STATISTICA (cfr.
Report HTML, pag. 171), possono essere distribuiti attraverso il Knowledge Portal
(Portale delle Conoscenze). Il Knowledge Portal consente all’utente di pubblicare i
documenti di STATISTICA (spreadsheet, grafici, report, o registri) su Internet.
Anche gli utenti con permessi limitati di Knowledge Portal potranno visualizzare
tali documenti. Con gli strumenti standard di STATISTICA Enterprise Server è
possibile definire gli accessi stabilendo i permessi sui singoli documenti o sulle
singole directory.
Per pubblicare i contenuti nel Knowledge Portal, per prima cosa occorre creare una
directory all’interno della repository di STATISTICA Enterprise Server presente nella
cartella Portal: occorre accedere a STATISTICA Enterprise Server come utente con
privilegi di Amministratore, e dal menu File, occorre selezionare My Directory
Operations per visualizzare la finestra My Directory; il contenuto apparirà simile a
quello rappresentato nella seguente illustrazione.
Per creare una cartella nella directory Portal in cui inviare i propri report, si
selezioni la cartella Portal, e quindi si faccia un clic sul pulsante Create per
visualizzare la finestra di dialogo Explorer User Prompt. Nel campo di modifica,
s’inserisca il nome della nuova directory (Sample Portal Folder), e si faccia un clic
su OK. A questo punto verrà visualizzata una finestra che confermerà la creazione
della nuova directory. Si prema il pulsante Show My Directory per tornare alla
STATISTICA Guida di Riferimento – 173
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
finestra di dialogo My Directory. Si selezioni l’opzione Show Empty Directories, e
quindi si prema il pulsante Refresh. Si espanda la directory premendo il segno + a
fianco di questa cartella: in questo modo verrà visualizzata la nuova cartella
Sample Portal Folder.
Si noti che è possibile stabilire chi avrà i permessi di lettura e di scrittura su questa
cartella selezionando Sample Portal Folder, premendo il pulsante Security, e
usando le opzioni per definire i permessi di utente e di gruppo più appropriati da
applicare a questa cartella.
Pubblicare i Contenuti da STATISTICA
Enterprise Server
Adesso che la cartella è stata creata, sarà possibile inserirvi i risultati analitici per
gli utenti di Portal affinché questi possano visualizzarli in STATISTICA Enterprise
Server oppure in STATISTICA.
In STATISTICA Enterprise Server, si inizi una analisi tipica. Dal menu File di
STATISTICA Enterprise Server, si selezioni Open Data Spreadsheet. All’interno della
finestra di dialogo Select Data Source, si selezioni la cartella Datasets nel pannello
di sinistra, si selezioni il file dati Adstudy.sta all’interno del pannello di destra, e si
prema OK.
174 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Si chiuda il risultante Editor di Spreadsheet (in questo esempio non è necessario),
lasciando aperta solo la finestra del browser in cui saranno visualizzate le
informazioni riassuntive per Adstudy.sta.
Dal sottomenu Statistiche – Statistiche di Base e Tabelle, si selezioni Statistiche
Descrittive per visualizzare la finestra standard per la selezione delle variabili e la
finestra delle specifiche per le Statistiche Descrittive. Nella finestra per la
selezione delle variabili, si selezioni MEASURE01 e MEASURE02 nella colonna
Continuous variables.
All’interno di Statistiche Descrittive, si selezioni Tutti i risultati all’interno del
campo Dettaglio dei risultati calcolati e riportati.
STATISTICA Guida di Riferimento – 175
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Si faccia clic su OK per visualizzare i risultati dell’analisi, consistenti in molti
spreadsheet e grafici.
Adesso, per pubblicare questa pagina in modo che gli utenti possano visualizzarla
attraverso il Knowledge Portal, si faccia un clic sul pulsante Publish. Verrà
visualizzata la finestra Publish Destination. Qui sarà possibile selezionare la Sample
Portal Folder creata. È anche possibile stabilire chi possa aver accesso a questa
particolare pagina selezionando l’opzione I want to define who can access this
output page.
176 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Si prema il pulsante Next per salvare la pagina nella destinazione selezionata.
Adesso, quando un utente avrà accesso al Knowledge Portal, questi potrà
osservare il contenuto della nuova directory Sample Portal Folder attraverso il
proprio browser di output, dal quale poter selezionare la pagina appena aggiunta.
Pubblicare i Contenuti dalle
Applicazioni di STATISTICA Desktop
Con la funzione di integrazione di STATISTICA desktop in STATISTICA Enterprise
Server, è inoltre possibile pubblicare i documenti di STATISTICA (spreadsheet,
grafici, report e registri) sul Knowledge Portal direttamente dall’interno di
STATISTICA.
Il primo passo è quello di abilitare l’integrazione di STATISTICA Enterprise Server.
Selezionare la scheda Home e, nel gruppo Strumenti, premere Opzioni per
visualizzare l’omonima finestra. Selezionare Server/Web nel menu ad albero e
spuntare Abilita Integrazione Server WebSTATISTICA. Quindi specificare l’ URL di
STATISTICA Enterprise Server ed ogni altra configurazione definita
dall’amministratore del sistema durante l’installazione di STATISTICA Enterprise
Server. Nell’immagine seguente, STATISTICA Enterprise Server è stato installato su
serverx23; tale informazione potrebbe cambiare in funzione di dove STATISTICA
Enterprise Server è stato installato.
STATISTICA Guida di Riferimento – 177
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Dopo aver premuto il pulsante OK nella finestra Opzioni, apparirà la scheda Server
a fianco della scheda Home. L’unico comando disponibile inizialmente è Log In;
premere tale pulsante. Se è stato abilitato il log in integrato (e l’account di
Windows è abilitato su STATISTICA Enterprise Server), si accederà
automaticamente. Altrimenti verranno richiesti un nome utente e una password
per STATISTICA Enterprise Server. Una volta effettuato il log in, saranno abilitate le
altre opzioni della scheda Server.
Ora, sarà creata un’analisi e saranno caricati i risultati sul Knowledge Portal. Aprire
il file Adstudy.sta: selezionare la scheda Home, premere la freccia Apri e
specificare Apri Esempi dal menu a cascata; nella finestra Apri un File Dati di
STATISTICA, doppio clic sulla cartella Datasets e selezionare il file Adstudy.sta per
aprire il relativo spreadsheet in STATISTICA.
Dopodiché, selezionare la scheda Statistiche e, nel gruppo Base, premere
Statistiche di Base per visualizzare il Pannello d’Avvio Statistiche di Base e Tabelle.
Selezionare Statistiche Descrittive.
178 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Premere OK per aprire la finestra Statistiche Descrittive.
Per assicurarsi che tutti gli output delle analisi siano inviati ad un registro, premere
il pulsante Opzioni sul lato destro della finestra e, dal menu a cascata, selezionare
Output. Nel Gestore Output di Analisi/Grafico, controllare che sia selezionata
l’opzione Registro nel riquadro Poni i risultati (Spreadsheet, Grafici) in. Quindi
premere OK per ritornare alla finestra precedente.
Fare clic sul pulsante Variabili per visualizzare la finestra di selezione delle
variabili, selezionare MEASURE01 e MEASURE02, e premere OK. Sulla scheda
Rapido, premere il pulsante Riepilogo: Statistiche per inviare i risultati in un
registro. La finestra Statistiche Descrittive sarà ridotta ad icona per permettere la
visualizzazione dei risultati; ripristinarla premendo il corrispondente pulsante sulla
Barra di Analisi nel lato inferiore delle schermo. Ora si prema il pulsante
Istogrammi per generare un istogramma per ogni variabile selezionata. Il registro
apparirà quindi come segue.
STATISTICA Guida di Riferimento – 179
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Questo registro è il documento che si desidera pubblicare sul Knowledge Portal.
Sulla scheda Server nel gruppo File, premere Salva con Nome. Apparirà la finestra
Deposito di STATISTICA Enterprise, contenente una lista delle cartelle alle quali è
possibile fare riferimento in STATISTICA Enterprise Server. Aprire la cartella Portal,
selezionare Sample Portal Folder e premere il pulsante OK, in modo da caricare il
registro nella cartella Knowledge Portal.
È possibile rivedere il documento all’interno di STATISTICA aprendo un browser in
uno spazio di lavoro. Sulla scheda Server nel gruppo Strumenti, selezionare Apri
nel Browser, ed apparirà una nuova finestra di browser, consentendo di collegarsi
a STATISTICA Enterprise Server.
Dal menu File di STATISTICA Enterprise Server, scegliere My Directory Operations;
in My Directory è possibile navigare nel Sample Portal Directory, e vedere il file
Workbook1.stw che è stato caricato. Selezionare questo file e premere il pulsante
View in modo che il registro venga aperto nel browser.
180 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
6. SHAREPOINT O SISTEMA DI GESTIONE
DEI DOCUMENTI DI STATISTICA (SDMS)
Con STATISTICA, è possibile indirizzare l’output sia tramite Microsoft SharePoint
che con il Sistema di Gestione dei Document di STATISTICA (SDMS).
SharePoint
Con l’integrazione STATISTICA SharePoint, è possibile aprire, effettuare il check out
e il check in, e caricare nuovi file di STATISTICA sul SharePoint.
Per aprire un documento, che si trova in SharePoint, in STATISTICA, selezionare la
scheda Home. Premere la freccia Apri e selezionare Apri Documento. Nella finestra
Apri, nella lista Cerca in, selezionare la Web Folder al percorso del server
SharePoint (cfr. pag. 182) e quindi cercare il documento desiderato. Sarà
necessario accedere a SharePoint.
Per salvare un documento di STATISTICA (spreadsheet, registri, macro, ecc.) su
SharePoint, selezionare la scheda Home. Premere la freccia Salva e selezionare
Save con Nome. Nella finestra Save Come, nella lista Salva in, selezionare la Web
Folder al percorso del server SharePoint e quindi specificare la posizione nella
quale salvare il documento. Sarà necessario accedere a SharePoint.
Le opzioni di SharePoint Check Out, Check In e Scarta sono poste sulla scheda
Home nel gruppo SharePoint.
STATISTICA Guida di Riferimento – 181
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Queste opzioni sono presenti anche nel menu Avvio, al quale si accede premendo
il pulsante in alto a sinistra, e diventeranno attive dopo aver aperto un documento
da SharePoint.
Prima di utilizzare queste opzioni, si deve creare una Web Folder al percorso del
server SharePoint. Per fare ciò, premere il pulsante Start nella barra degli
strumenti di Windows e fare clic su Computer. Premere il tasto destro in qualsiasi
area vuota della finestra Computer e, dal menu a contestuale, selezionare Aggiungi
percorso di rete per visualizzare Aggiunta guidata risorse di rete. Fare clic su
Avanti.
182 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
Doppio clic su Scegliere un percorso di rete personalizzato. Nel campo Indirizzo
Internet o di rete, inserire l’indirizzo Web della posizione di SharePoint:
https://sharepoint..., o premere il pulsante Sfoglia per selezionare la posizione.
Fare clic su Avanti.
Effettuare il log in a to SharePoint e premere OK. Inserire un nome per la cartella
Web Folder nel campo Immettere un nome per il percorso di rete e fare clic su
Avanti. Apparirà Completamento dell’Aggiunta guidata di risorse di rete; spuntare
il controllo Apri il percorso di rete quando si sceglie il pulsante Fine, e premere
Fine. È stata creata una Posizione di Rete della Web Folder nella sezione Percorso
di rete del Computer con l’etichetta specificata.
Sistema di Gestione dei Documenti di
STATISTICA (SDMS)
Il Sistema di Gestione dei Documenti di STATISTICA (SDMS) è un soluzione
completa per la gestione dei documenti. SDMS consente di salvare documenti di
ogni tipo rapidamente, efficientemente e in sicurezza, su di un database di
deposito e quindi di gestirli.
L’intuitiva interfaccia utente di SDMS rende facili le operazioni di gestione da
qualsiasi computer della rete, o via Internet.
STATISTICA Guida di Riferimento – 183
Copyright © StatSoft, 2011
Capitolo 4: Output delle Analisi
In SDMS, tutto è documentato e tracciabile. Ad esempio, i documenti non sono
mai eliminati. Quando si modifica un documento, viene creata una nuova versione
di tale documento, propriamente autenticato e annotato con le firme elettroniche.
Gli utenti i autorizzati possono essere tenuti a verificare esplicitamente i
documenti dal deposito e a controllare le nuove versioni con le note e la
documentazione riguardante la natura e lo scopo delle modifiche.
SDMS è specificamente progettato per garantire la conformità con i regolamenti
FDA 21 CFR Part 11, la legislazione Sarbanes-Oxley e i requisiti ISO 9000, 9001,
14001.
SDMS si integra perfettamente con tutti i prodotti di STATISTICA, dalle versioni
desktop e di rete, alle installazioni enterprise come STATISTICA Enterprise Server o
STATISTICA Enterprise/QC (per il controllo/miglioramento dell’analisi dei processi e
della qualità). SDMS può essere anche usato come sistema stand-alone.
SDMS è altamente configurabile e le sue funzionalità sono compatibili con le altre
applicazioni, in modo che il sistema possa essere personalizzato per consentire
compiti specifici e può essere integrato con il sistema esistente per la gestione dei dati
e dei documenti.
184 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
5
CAPITOLO
DOCUMENTI
DI STATISTICA
Registri ................................................................................................. 187
Spreadsheet (Tabelle Multimediali) .................................................... 192
Report ................................................................................................... 199
Grafici ................................................................................................... 202
Macro (Programmi in STATISTICA Visual Basic) ................................ 203
Progetti di STATISTICA......................................................................... 204
STATISTICA Guida di Riferimento –185
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
186 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
5
CAPITOLO
DOCUMENTI DI STATISTICA
REGISTRI
I registri sono la modalità predefinita di gestione dell’output (per ulteriori
informazioni, cfr. pag. 164 Ciascun documento di output (ad es., uno Spreadsheet
o un Grafico di STATISTICA, così come un documento Word o Excel) viene
registrato nel registro come una scheda.
Tecnicamente parlando, i Registri di STATISTICA sono contenitori ActiveX (pag.
261) ottimizzati in grado di gestire con successo grandi numeri di documenti. I
documenti possono essere organizzati in gerarchie di cartelle o nodi di documento
(per impostazione predefinita, ne viene creata una per ciascuna nuova analisi)
usando una vista ad albero, nella quale documenti singoli, cartelle, o interi rami
dell’albero possono essere facilmente gestiti.
Ad esempio, possono essere estratte selezioni di documenti (ad es., copiati o
spostati trascinandoli) verso la finestra di report o nello spazio lavoro
STATISTICA Guida di Riferimento –187
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
dell’applicazione (cioè, nell’applicazione “background” di STATISTICA dove
verranno visualizzati in finestre singole). Interi rami possono essere messi in altri
registri in una varietà di modi in modo da costruire specifiche organizzazione di
cartelle, ecc.
Ogni registro contiene due pannelli: un albero di navigazione in stile Explorer sulla
sinistra ed un visualizzatore di documenti sulla destra.
L’albero di navigazione (albero di registro) può essere suddiviso in diversi nodi da
utilizzare per organizzare i file in gruppi logici (ad es., tutti gli output di analisi
oppure tutte le macro create per un determinato progetto).
Le schede presenti nel lato inferiore del visualizzatore dei documenti vengono
utilizzate per esplorare facilmente i diversi documenti contenuti nel nodo
correntemente selezionato. È possibile spostare le schede in cima, sulla destra
oppure sulla sinistra del visualizzatore del registro premendo il tasto destro del
mouse su una delle schede e selezionando una posizione differente dal menu a
scelta rapida.
La visualizzazione delle schede può venire disabilitata per risparmiare spazio.
Diversamente da molte applicazioni per la navigazione/organizzazione in stile
Explorer che consentono alle sole cartelle di avere documenti “figli”, il registro di
STATISTICA consente a qualsiasi elemento dell’albero di avere documenti “figli”.
Ad esempio, è possibile aggiungere uno spreadsheet al proprio registro, e quindi
aggiungere tutti i grafici prodotti usando i dati contenuti nello spreadsheet in
188 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
forma di figli di spreadsheet. Per consentire una buona organizzazione dell’albero
di registro è disponibile una varietà di funzionalità copia-e-incolla e di copia sugli
Appunti.
I registri possono contenere tutti i documenti nativi di STATISTICA inclusi gli
spreadsheet, i grafici, i report e le macro. Possono inoltre contenere altri tipi di
documenti ActiveX, quali fogli di lavoro Excel, documenti Word, ecc. Se si desidera
modificare questi documenti, è possibile farlo usando il visualizzatore del registro.
Quando ad esempio all’interno del visualizzatore viene aperto un documento
Word, verranno visualizzati anche i menu e le barre degli strumenti di Word oltre a
tutte le altre funzionalità di modifica necessarie. I registri possono essere utilizzati
anche per archiviare tutto l’output associato ad una particolare analisi.
Navigare nell’Albero dei Registri
L’albero del registro consente di rappresentare l’organizzazione dei file e delle
cartelle all’interno di un registro, in un formato simile a Explorer. Gli elementi con
un segno più a fianco indicano cartelle o file con “figli” associati. Per espandere
l’albero aprendo una cartella o un file particolare, si faccia un clic sul segno più. Il
registro può supportare un numero illimitato di livelli, ed in esso è consentita la
gestione interattiva sia di singoli elementi che d’interi rami dell’albero (ad
esempio, trascinando gli elementi è possibile spostarli/copiarli tra registri o report,
ecc., oppure è possibile utilizzare il menu a scelta rapida come indicato nella
seconda immagine riportata di seguito).
STATISTICA Guida di Riferimento – 189
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Per selezionare un elemento del registro per obiettivi di revisione o di modifica,
s’individui semplicemente il file all’interno dell’albero del registro e si faccia un clic
sull’icona ad esso associato. Il documento sarà visualizzato all’interno del
visualizzatore del registro. Si noti che è inoltre possibile esplorare il contenuto dei
figli del nodo correntemente selezionato usando le schede di navigazione
disponibili (per impostazione predefinita) sulla parte bassa del visualizzatore. È
possibile spostare facilmente queste schede di navigazione in cima, sulla destra,
oppure sulla sinistra del visualizzatore del registro premendo il tasto destro del
mouse su una delle schede e selezionando una posizione differente dal menu a
scelta rapida o selezionando i comandi del menu Controllo Schede, presenti nel
gruppo Strumenti della scheda Registro. Si noti che le schede poste sul lato
superiore od inferiore del visualizzatore saranno poste in un’unica riga, se
posizionate a sinistra o destra saranno messe in più righe.
Gli elementi dell’albero sono identificati dalle icone a fianco. L’icona
rappresenta una cartella contenente una varietà di documenti e sottocartelle.
L’icona (cartella con una freccia rossa) indica che lo script attraverso il quale
sono stati generati i risultati contenuti nella cartella d’interesse è stato allegato
alla cartella stessa. Ciò consentirà di abilitare STATISTICA per una riesecuzione o un
ripristino dell’analisi (per maggiori dettagli, cfr. il Capitolo 9 – STATISTICA Visual
Basic). Sono visualizzabili anche le icone di spreadsheet , di report , di macro
, e di grafico . L’icona di Data Miner rappresenta lo spazio di lavoro di Data
Miner.
Tutti i documenti non-STATISTICA sono rappresentati dalla rispettiva icona di
documento. Ad esempio, i documenti Word sono rappresentati dall’icona ,
mentre i fogli di lavoro di Excel sono rappresentati dall’icona .
I comandi per l’inserimento, l’estrazione, la rinomina, e la rimozione degli elementi
dall’albero del registro sono disponibili dal menu a scelta rapida del registro
(accessibile tramite il tasto destro del mouse in una qualsiasi parte dell’albero).
190 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Questi comandi sono disponibili anche nella scheda Registro.
L’albero del registro può essere organizzato e modificato attraverso le funzionalità
di copia-e-incola (così come attraverso le funzionalità di copia sugli Appunti).
Utilizzare i tasti SHIFT e CTRL della tastiera per specificare se gli oggetti devono
essere inseriti un livello sotto (figli) oppure sullo stesso livelle (fratelli).
La seguente tabella illustra quattro opzioni di drag-and-drop:
Azione
Sposta Figlio
Sposta
Fratello
Copia Figlio
Copia
Fratello
Tasti
Cursore
Effetto
(none)
Sposta il primo oggetto selezionato un
livello sotto il secondo oggetto
selezionato.
SHIFT
Sposta il primo oggetto selezionato
immediatamente sotto e sullo stesso
livello del secondo oggetto selezionato.
CTRL
Copia il primo oggetto selezionato un
livello sotto il secondo oggetto
selezionato.
SHIFT + CTRL
Copia il primo oggetto selezionato
immediatamente sotto e sullo stesso
livello del secondo oggetto selezionato.
In primo luogo, selezionare l’oggetto (oggetti) che si desidera spostare o copiare.
Trascinarlo, quindi, nella nuova posizione e rilasciarlo. Per selezionare un singolo
oggetto, fare clic su di esso. Per selezionare un nodo genitore e tutti i relativi figli,
clic sulla cartella. Si noti che le barre di scorrimento verticale ed orizzontale
all’interno del registro possono essere utilizzate durante il drag-and-drop.
STATISTICA Guida di Riferimento – 191
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
SPREADSHEET
(TABELLE MULTIMEDIALI)
Gli Spreadsheet di STATISTICA sono basati sulla tecnologia, proprietaria di
StatSoft, di tabella multimediale e sono usati per gestire sia dati di input sia output
numerici o di testo (ed opzionalmente di qualsiasi altro tipo). La forma base dello
spreadsheet è di una semplice tabella a due dimensioni in grado di gestire un
numero praticamente illimitato di casi (righe) e variabili (colonne), dove ciascuna
cella può contenere un numero virtualmente illimitato di caratteri. Possono anche
essere attaccati suoni, video, grafici, animazioni, report con oggetti integrati, o
qualsiasi documento compatibile ActiveX.
Siccome gli Spreadsheet di STATISTICA possono anche contenere macro e qualsiasi
interfaccia utente personalizzata, queste tabelle multimediali possono essere
utilizzate come struttura per applicazioni personalizzate (ad es., con una lista di
caselle opzione o una serie di pulsanti posizionati nell’angolo in alto a sinistra),
presentazioni auto eseguibili, animazioni, simulazioni, ecc.
192 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Aspetto del file dati negli spreadsheet. I dati di STATISTICA sono organizzati in
casi e variabili. Se non si è familiari con questa notazione, si pensi ai casi come
l’equivalente dei record nei programmi database (o alle righe di uno spreadsheet),
e alle variabili come l’equivalente ai campi (o alle colonne di uno spreadsheet).
Ciascun caso consiste in un insieme di valori di variabili, e la prima colonna del file
può (opzionalmente) contenere i nomi dei casi.
La finestra di spreadsheet comprende alcune componenti di base.
Barra del Titolo. La barra di titolo visualizza il nome dello spreadsheet seguito
dall’estensione di spreadsheet (.sta). Se lo spreadsheet è uno spreadsheet di input,
la barra visualizza anche il numero di variabili per il numero di casi (ad es., 25v per
STATISTICA Guida di Riferimento – 193
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
50c). Nell’immagine mostrata sopra, la barra di titolo contiene il testo Dati:
Adstudy.sta (25v per 50c).
Riquadro Informativo. È possibile selezionare l’intero spreadsheet facendo clic
sull’angolo in basso a destra (il puntatore del mouse diventerà una freccia) della
casella info, il quale è posizionato nell’angolo in alto a sinistra della finestra di
spreadsheet. Per selezionare solo la casella info (per la formattazione), si faccia clic
sull’angolo in alto a sinistra della casella info (il puntatore del mouse diventerà un
segno più contornato ). Per inserire o modificare il testo nella casella info (ad
es., dettagli aggiuntivi relativi lo spreadsheet) si faccia un doppio clic sul Riquadro
Informativo. Nell’immagine mostrata sopra, la casella info contiene il testo
Risposta (Peoria, IL).
Intestazione. L’intestazione è posizionata immediatamente sopra l’intestazione
delle variabili sulla parte alta della finestra. Si faccia un doppio clic sull’intestazione
per inserire o modificare informazioni testuali. Per selezionare solo l’intestazione
(per la formattazione), si faccia clic nell’angolo in alto a sinistra (il mouse diventerà
un segno più contornato ). Si prema CTRL+ENTER o ALT+ENTER per inserire una
nuova linea (si noti che è necessario estendere l’altezza del campo per vedere le
nuove linee che si stanno aggiungendo). Nell’immagine mostrata sopra,
l’intestazione contiene il testo Advertising Effectiveness Study.
Intestazioni dei Casi. Queste celle, posizionate sulla sinistra della finestra,
contengono le informazioni di intestazione per ciascun caso. Per inserire o
modificare le informazioni testuali si faccia doppio clic in qualsiasi cella
d’intestazione caso. Per selezionare solo l’intestazione caso (per la formattazione)
si faccia clic sul lato sinistro dell’intestazione caso (il puntatore del mouse
diventerà un segno più contornato ). Per selezionare le righe di caso (per
modificarle), si faccia clic al centro o sul lato destro dell’intestazione caso (il
puntatore del mouse diventerà un segno più contornato con una freccia
). Per
selezionare un blocco dell’intestazione caso, (senza selezionare le rispettive righe),
si faccia un clic sulla parte sinistra di un’intestazione caso e si trascini il puntatore
del mouse in modo da includere tutte le intestazioni caso. Per adattare
automaticamente le intestazioni caso, si faccia un doppio clic sull’estremità del
lato destro di qualsiasi intestazione caso (il puntatore del mouse diventerà una
croce con ai lati due frecce ). Nell’immagine precedente, le celle intestazioni
caso contengono le iniziali e i cognomi dei partecipanti allo studio. Si noti che le
194 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
intestazioni caso sono opzionali ed è possibile scegliere se visualizzarli o meno
(selezionare la scheda Visualizza, nel gruppo Visualizza premere Mostra Opzioni e
disattivare il comando Nomi di Caso); se non sono visualizzati, vengono mostrati i
numeri caso.
Intestazioni delle Variabili. Queste celle, posizionate sopra ciascuna colonna,
contengono le informazioni di intestazione per ciascuna variabile. Per visualizzare i
dettagli relativi una singola variabile, si faccia un doppio clic sulla cella intestazione
variabile. Per selezionare solo l’intestazione variabile (per la formattazione) si
faccia clic sulla parte superiore dell’intestazione variabile (il puntatore del mouse
diventerà un segno più contornato ). Per selezionare la variabile colonna (per
modificarla) si faccia clic sulla parte inferiore dell’intestazione variabile (il
puntatore del mouse diventerà un segno più contornato con una freccia ). Per
adattare automaticamente la variabile colonna, si faccia un doppio clic
sull’estremità del lato destro dell’intestazione variabile (il puntatore del mouse
diventerà una croce con ai lati due frecce ). Nell’immagine precedente, le prime
due celle d’intestazione variabile contengono il testo GENDER e ADVERT. È
possibile modificare la modalità di visualizzazione delle informazioni nelle celle
d’intestazione variabile in modo che possano mostrare il numero colonna
associato con la variabile, il nome lungo di variabile, e/o una abbreviazione dei tipi
di visualizzazione per le variabili nello spreadsheet. Ciascuna di queste opzioni è
disponibile premendo Intestazioni di Variabili nella scheda Visualizza e
nell’omonimo gruppo.
Dati (e opzioni di formattazione delle celle). La parte rimanente dello
spreadsheet contiene i dati appartenenti ai casi e variabili e a qualsiasi altro
oggetto attaccato o collegato (oggetti multimediali, macro, interfaccia utente
personalizzata). Il testo nelle celle può essere di lunghezza praticamente illimitata
(nella maggior parte delle configurazioni di STATISTICA questo è limitato a 1,000
caratteri per evitare di incollare grandi quantità di dati non desiderati in una cella).
Il testo nelle celle può essere ampiamente formattato e comprende la possibilità di
avere diversi font e attributi di font.
STATISTICA Guida di Riferimento – 195
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Spreadsheet di Input e di Output
STATISTICA offre la possibilità di aprire ed utilizzare diversi spreadsheet allo stesso
tempo, permettendo di lavorare con diversi file di dati simultaneamente. In
aggiunta STATISTICA, per registrare i dati, usa spreadsheet per visualizzare l’output
numerico delle sue analisi. Siccome STATISTICA non fa distinzioni tra le
caratteristiche supportate in un spreadsheet di input (dal quale STATISTICA
recupera i dati) ed uno spreadsheet di output (dove vengono visualizzati i risultati
di un’analisi), risulterà molto semplice usare i risultati di un’analisi come dati di
input di ulteriori analisi.
Qualsiasi spreadsheet aperto da un file su disco viene automaticamente trattato
come spreadsheet di input, e allo stesso tempo può essere aperto un qualsiasi
numero di spreadsheet di input. Per evitare confusioni, comunque, uno
spreadsheet di output (contenente i risultati di un analisi) non è automaticamente
disponibile come dati di input da analizzare. Deve prima essere definito come
spreadsheet di input prima di essere utilizzato in ulteriori analisi. In aggiunta, gli
spreadsheet di input indicano il numero di variabili e casi per quello spreadsheet
nella barra di titolo. Ad esempio, Exp.sta (88v per 48c) è uno spreadsheet di input;
Exp.sta non lo è.
Per definire uno spreadsheet di output come spreadsheet di input, si selezioni lo
spreadsheet (cioè, assicurarsi che lo spreadsheet sia attivo). Quindi, nella scheda
Dati, nel gruppo Modalità, si spunti il controllo Input. Ora è possibile iniziare
un’analisi, e STATISTICA utilizzerà i dati dallo specificato spreadsheet di input per
l’analisi. Si noti che se si passa ad un altro spreadsheet che in precedenza era stato
definito come spreadsheet di input, naturalmente lo si potrà ancora utilizzare per
l’analisi.
In un registro, può essere selezionato solo uno spreadsheet da analizzare alla
volta, anche se questo contiene diversi spreadsheet di input. Questo spreadsheet
viene chiamato Spreadsheet Attivo di Input, e la sua icona (nell’albero di registro) è
incorniciata in rosso.
Di default, quando uno spreadsheet di output viene definito di input, STATISTICA
automaticamente lo seleziona come spreadsheet Attivo di Input. Per selezionare
un altro spreadsheet come input attivo, si spunti il controllo Input Attivo nella
196 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
scheda Registro, nel gruppo Elementi o si selezioni Usa come Input Attivo dal
menu di scelta rapida dell’albero di registro.
È anche possibile lasciare aperto un singolo spreadsheet e definirlo come
indisponibile per l’analisi. Per fare questo, si selezioni lo spreadsheet, e si
deselezioni il controllo Input nella scheda Dati nel gruppo Modalità. Ora STATISTICA
automaticamente andrà a definire gli spreadsheet di input più recentemente
selezionati per l’analisi, ignorando tutti gli spreadsheet che non sono stati definiti
come spreadsheet di input.
Provider OLE DB degli
Spreadsheet STATISTICA
In aggiunta all’utilizzo degli spreadsheet come fonti di dati per le analisi in
STATISTICA, essi possono anche fornire dati da altre applicazioni usando StatSoft
OLE DB Provider for STATISTICA Spreadsheets. Questo driver OLE DB è installato
con STATISTICA, e consente l’accesso in sola lettura ai dati negli Spreadsheet di
STATISTICA utilizzando il linguaggio standard SQL (Structured Query Language). È
possibile accedere al Provider OLE DB tramite una connessione a database, usando
le Proprietà standard di Microsoft Data Link.
Per utilizzare questa funzionalità, selezionare la scheda Dati. Nel gruppo Gestisci,
fare clic su Dati Esterni e dalla lista a cascata, premere su Crea Query. Nella
finestra Connessione a Database, fare clic su Nuova per visualizzare Proprietà di
Data Link, dove è possibile selezionare StatSoft OLE DB Provider for STATISTICA
Spreadsheets.
STATISTICA Guida di Riferimento – 197
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Fare clic su Avanti per visualizzare la scheda Connessione.
Nel campo Origine Dati indicare il percorso della cartella degli spreadsheet.
Durante la creazione della query, è possibile scegliere singoli spreadsheet
all’interno di tale cartella. Il seguente esempio utilizza STATISTICA Query, e
definisce una connessione a Spreadsheet OLE DB, indicando il percorso alla cartella
Examples di STATISTICA. Ogni elemento all’interno di questa cartella è una
potenziale tabella.
198 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Gli spreadsheet possono essere utilizzati nella clausola FROM , i nomi di variabile
nel campo SELECT , e i casi all’interno di WHERE . Sono supportati anche i Join tra
più spreadsheet, utilizzando la clausola standard JOIN.
Utilizzare StatSoft OLE DB Provider for STATISTICA Spreadsheets consente di
fornire agli Spreadsheet di STATISTICA dati da qualunque applicazione (compresa
STATISTICA stessa) che possono usare l’interfaccia standard OLE DB per effettuare
delle query.
REPORT
I report (brevemente introdotti a pag. 167) in STATISTICA offrono un modo più
tradizionale di gestire gli output (in confronto ai registri) in quanto ciascun oggetto
(ad es., uno Spreadsheet o Grafico di STATISTICA, o uno spreadsheet di Excel) viene
visualizzato in modo sequenziale in un documento stile word processor.
STATISTICA Guida di Riferimento – 199
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Comunque, la tecnologia che sta dietro questo semplice report offre ricche
funzionalità. Ad esempio, come i registri, ciascun Report di STATISTICA è anche un
contenitore ActiveX (cfr. pag. 261) dove ciascun dei suoi oggetti (non solo
Spreadsheet e Grafici di STATISTICA, ma anche qualsiasi altro documento
compatibile ActiveX, ad es., documenti Word) è attivo, personalizzabile, e
modificabile sul posto. I report sono registrati nel formato file STR, che è una
estensione StatSoft del formato Microsoft RTF (Rich Text Format, *.rtf). I file STR
mantengo le informazioni della formattazione RTF e in aggiunta includono le
informazioni relative la visualizzazione ad albero (che non può essere registrata nei
file RTF standard). Da questo momento, i file report saranno salvati per
impostazione predefinita, con l’estensione al nome del file *.str, ma possono
essere salvati anche come file RTF standard (nel qual caso l’informazione
dell’albero non sarà mantenuta).
Gli ovvi vantaggi del gestire gli output in questo modo (più tradizionale rispetto ai
registri) sono la facilità ad inserire note e commenti “tra” gli oggetti così come il
supporto per il modo più tradizionale di scorrere velocemente e rivedere l’output
al quale alcuni utenti potrebbero essere abituati. Inoltre, solo l’output su report
include e mantiene una registrazione delle informazioni supplementari, che
contiene un log dettagliato delle opzioni specificate nelle analisi (ad es., variabili
selezionate e le loro etichette, nomi lunghi, ecc.) in base al livello di informazioni
supplementari richieste nel Gestore Output), cfr. pag. 26.
200 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Analogamente gli ovvi inconvenienti di questi tradizionali report è la struttura
intrinsecamente piatta imposta dal loro formato stile word processor, sebbene
questa possa favorire alcuni utenti e certe applicazioni.
Navigare nell’Albero dei Report
L’albero di report visualizza l’organizzazione dei file nel report. I file sono
visualizzati in un formato stile Explorer; comunque, diversamente dai registri che
possono supportare qualsiasi numero di livelli, il report supporta solo un livello di
file.
In un report è possibile inserire qualsiasi tipo di documento di STATISTICA, inclusi
spreadsheet, grafici, e analisi. In aggiunta ai tipi di documento di STATISTICA, in un
report è possibile inserire altri tipi di oggetti ActiveX/OLE, inclusi spreadsheet
Excel, documenti Word, immagini bitmap, ed altro. Per modificare uno di questi
tipi di documento inserito, si faccia un doppio clic sul documento. Il file si aprirà nel
visualizzatore, e la barra strumenti report si unirà alla barra strumenti relativa
all’applicazione nativa del file inserito, dando accesso a tutte le opzioni di modifica
che necessitano.
Gli oggetti nell’albero sono identificati dall’icona che hanno accanto. Le icone
spreadsheet , macro , e grafico rappresentano rispettivamente documenti
Spreadsheet, Macro e Grafici di STATISTICA. L’icona Data Miner rappresenta
uno spazio di lavoro del Data Miner. Tutti i documenti non di STATISTICA sono
rappresentati dalle loro icone documento. Ad esempio, documenti Word sono
rappresentati dall’icona Word , icone spreadsheet Excel sono rappresentate
dall’icona spreadsheet di Excel.
L’albero di report può essere organizzato e modificato usando le opzioni drag-anddrop così come le procedure Appunti.
STATISTICA Guida di Riferimento – 201
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
I comandi per inserire, estrarre, rinominare, e rimuover gli oggetti dall’albero di
report sono disponibili dal menu di scelta rapida dell’albero di report (a cui si
accede con un clic sul tasto destro in qualsiasi parte dell’albero, come mostrato
sopra).
GRAFICI
I grafici rappresentano un altro tipo distinto di documenti di STATISTICA, ed
offrono ricche funzionalità sia in termini di modalità nelle quali i grafici possono
essere creati in STATISTICA e sia nella scelta degli strumenti per la loro
personalizzazione.
Similmente agli altri documenti di STATISTICA, i grafici sono contenitori ActiveX
(cfr. pag. 261), il che significa che possono contenere una varietà di documenti
compatibili (ad es., disegni Visio, illustrazioni Adobe, spreadsheet Excel, ecc.). I
Grafici di STATISTICA sono anch’essi oggetti ActiveX, e pertanto, possono essere
collegati o inseriti in altri documenti compatibili (ad es., documenti Word) dove,
con un semplice doppio clic, possono essere modificati sul posto.
I grafici sono descritti più dettagliatamente nel Capitolo 6 – Grafici.
202 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
MACRO (PROGRAMMI IN
STATISTICA VISUAL BASIC)
Il linguaggio standard industriale, STATISTICA Visual Basic (SVB, integrato in
STATISTICA) offre un’altra (alternativa) interfaccia utente alle funzionalità di
STATISTICA, ed è molto di più di un “linguaggio di programmazione
supplementare” poiché può essere utilizzato per scrivere estensioni
personalizzate.
Si noti che STATISTICA Visual Basic non è Microsoft Visual Basic 6.0, in quanto
StatSoft possiede e gestisce il codice per questa versione. SVB è compatibile con
VB.NET, VBA (Visual Basic for Applications) ed anche Visual Basic 6.0 (VB6), tutti
prodotti di Microsoft. Il linguaggio SVB è unico in termini di flessibilità e
compatibilità e fornisce l’accesso a VBA (utilizzato per gli script dei prodotti
Microsoft Office) ed a .NET Framework all’interno dello stesso file (cfr. Capitolo 10
– Programmare in STATISITCA da .NET, pag. 271). È possibile accedere anche ad
altre API e sfruttare la flessibilità di SVB, come ,ad esempio, l’API di Yahoo Stock
Quote o di Google Analytics. SVB offre una potente soluzione a 64-per
l’integrazione, l’espansione e lo sviluppo personalizzato del sistema.
STATISTICA Visual Basic sfrutta appieno il modello di architettura ad oggetti di
STATISTICA e via programmazione, può accedere ad ogni aspetto e virtualmente ad
ogni dettaglio delle funzionalità di STATISTICA. Anche le più complesse analisi e i
più complessi grafici possono essere registrati in macro Visual Basic in modo da
poterli eseguire ripetutamente in un secondo momento o modificarli ed utilizzarli
come mattoni per altre applicazioni. STATISTICA Visual Basic aggiunge un numero
superiore a 14.000 nuove funzioni alla completa sintassi standard di Visual Basic,
comprendendo quindi uno dei più grandi e richiesti ambienti di sviluppo
disponibile.
STATISTICA Guida di Riferimento – 203
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Le macro di STATISTICA possono essere salvate in diversi formati, in relazione
all’utilizzo che si intende farne (per ulteriori informazioni cfr. STATISTICA Visual
Basic Primer e il Manuale Elettronico). È anche possibile copiarle negli Appunti ed
incollarle in altri programmi o documenti.
STATISTICA Visual Basic viene discusso più dettagliatamente nel Capitolo 8 (pag.
241).
PROGETTI DI STATISTICA
Quando si eseguono analisi statistiche e si lavora con i documenti di STATISTICA, è
possibile trovarsi con molte finestra aperte e con differenti analisi lasciate in
sospeso. STATISTICA fornisce la possibilità di salvare il proprio spazio di lavoro e le
analisi lasciate in sospeso ad esse associate. È possibile chiudere STATISTICA in
qualsiasi momento nel corso di un’analisi, e quindi, nel momento in cui l’utente
riaprirà il progetto, i file precedentemente aperti verranno ripristinati così come le
analisi in corso.
204 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
Per salvare un progetto di STATISTICA, selezionare la scheda Home, premere la
freccia Salva nel gruppo Progetto e selezionare Salva Progetto con Nome per
visualizzare Salva Progetto di STATISTICA.
In questa finestra, si specifichi il percorso ed il nome del file del Progetto di STATISTICA
(la cui estensione è .spf). È inoltre possibile specificare quali elementi includere nel
progetto. Possono essere infatti selezionati tutti i documenti di STATISTICA
(Spreadsheet, Grafici, Registri, Macro, Report, progetti di Data Miner, progetti di
Database In-Loco, Analisi e Risultati delle Analisi). Per i documenti di STATISTICA già
archiviati su disco, si disporrà delle opzioni di Collegamento al file di documento
esistente, oppure di archiviazione del documento all’interno del File del Progetto di
STATISTICA (Integra il documento nel progetto).
Oltre ai documenti di STATISTICA, i file di progetti consentono di salvare anche
tutte le analisi in corso. Tali file archiviano gli script di registrazione
automaticamente creati quando l’analisi è in esecuzione. Quando il progetto viene
riaperto, gli script associati alle analisi verranno rieseguiti sulla base dei dati
originali e le finestre di analisi saranno nuovamente rese disponibili nello stesso
stato in cui erano nel momento del salvataggio.
STATISTICA Guida di Riferimento – 205
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
I file di progetti rappresentano un contenitore conveniente in cui inviare i passaggi
ed i risultati dell’analisi in corso tra gli utenti se si decide di incorporare anche i
documenti nel progetto. Un utente può eseguire una serie di analisi fino ad un
certo punto, e quindi salvare il progetto, che potrà essere utilizzato da un altro
utente, il quale potrà a sua volta aprirlo per continuare l’analisi esattamente dal
punto in cui il primo utente ha interrotto il suo lavoro.
A meno di configurazioni differenti, al momento della sua chiusura STATISTICA
visualizzerà automaticamente un messaggio in cui verrà richiesto se si desidera
salvare un file di progetto: in questo modo al momento del riavvio del programma
verrà automaticamente riaperto l’ultimo progetto salvato. In sostanza, STATISTICA
consente d’interrompere il proprio lavoro e riprenderlo senza alcuna difficoltà
esattamente nello stesso punto in cui era stato interrotto.
Si noti che un progetto rappresenta lo stato di un’istanza di STATISTICA. Quindi, i
progetti non sono come gli altri documenti, per i quali è impossibile aprire più di
un progetto in una singola istanza di STATISTICA. Un (secondo) differente progetto
può venire aperto in una seconda istanza di STATISTICA.
206 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
6
CAPITOLO
GRAFICI
Panoramica .......................................................................................... 209
Personalizzare i Grafici ........................................................................ 210
Categorie Generali di Grafici ............................................................... 219
Grafici di Dati di Input .......................................................................... 220
Grafici di Blocchi di Dati ...................................................................... 223
Grafici del Menu Grafici ....................................................................... 225
Brushing dei Grafici e Stati di Caso .................................................... 226
Altri Grafici Specializzati ..................................................................... 230
Creare Grafici tramite STATISTICA Visual Basic ................................ 231
STATISTICA Guida di Riferimento –207
Copyright © StatSoft, 2011
Capitolo 5: Documenti di STATISTICA
208 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
6
CAPITOLO
GRAFICI
PANORAMICA
La finalità più comune dei grafici è quella di presentare e comunicare informazioni
in modo efficiente (tipicamente, dati numerici). Comunque, le tecniche grafiche
forniscono anche potenti strumenti analitici per l’esplorazione dei dati e la verifica
delle ipotesi.
Un’ampia selezione di opzioni grafiche. STATISTICA include una completa
selezione di metodologie grafiche sia per l’analisi dei dati sia per la presentazione
dei risultati. Tutti i grafici in STATISTICA includono un’ampia selezione di tecniche
analitiche interattive integrate, e completi strumenti di personalizzazione che
permettono il controllo interattivo virtualmente di tutti gli aspetti del risultato
visualizzato. Inoltre, sono disponibili flessibili opzioni per la gestione di grafici
utilizzate per integrare diversi risultati grafici e per costruire collegamenti dinamici
tra applicazioni (ad es., utilizzando OLE [Object Linking and Embedding]).
Supporto completo per Visual Basic ed altri linguaggi. È possibile accedere alle
opzioni grafiche di STATISTICA anche via programmazione (utilizzando STATISTICA
Visual Basic integrato o altri linguaggi compatibili), con la potenzialità di creare
praticamente illimitate possibilità di produrre risultati grafici altamente
personalizzati. Questi grafici personalizzati possono essere aggiunti
permanentemente in un secondo momento all’interfaccia utente di STATISTICA (ad
es., assegnandoli a pulsanti nelle barre strumenti o aggiungendoli ai menu).
Categorie generali di grafici. Il sistema STATISTICA offre una varietà di metodi
nei quali i grafici possono essere richiesti o definiti. Questi metodi (ampie
STATISTICA Guida di Riferimento –209
Copyright © StatSoft, 2011
Capitolo 6: Grafici
categorie di grafici sono costituite da dati di input, blocchi di dati, e specializzati)
sono affrontati nella sezione Categorie Generali di Grafici a pag. 219; questi si
completano l’uno con l’altro, fornendo un alto livello di integrazione tra i numeri
(quali i dati grezzi, i risultati intermedi, o i risultati finali) e le visualizzazioni
grafiche. Ad esempio, possono essere richiesti grafici specializzati come parte
dell’output automatico dalle procedure statistiche, ma possono anche essere
richiesti attraverso gli strumenti integrati per visualizzare virtualmente qualsiasi
combinazione di numeri (e/o etichette) che sono visualizzati o generati da
STATISTICA.
PERSONALIZZARE
I GRAFICI
Personalizzazione grafica interattiva. Le opzioni di personalizzazione nei grafici
di STATISTICA includono centinaia di caratteristiche e strumenti che possono
essere utilizzati per modificare ogni dettaglio del risultato visualizzato e
dell’elaborazione dei dati associata. Comunque, queste opzioni sono organizzate in
modo gerarchico, in modo che quelle utilizzate più spesso risultino accessibile
direttamente con un doppio clic o un clic con il tasto destro sul rispettivo elemento
del grafico.
Impostazioni permanenti e opzioni di automazione. Le impostazioni iniziali
(predefinite) di tutte queste caratteristiche possono essere facilmente modificate
in modo che anche l’aspetto e il comportamento predefinito dei grafici di
STATISTICA risponda a specifiche necessità e/o richieda un modesto intervento. Di
seguito sono riportate alcune modalità per effettuare queste regolazioni:
1. Finestra Opzioni. Probabilmente il modo più immediato per regolare
l’aspetto predefinito dei grafici è di modificare le opzioni grafiche nella
finestra Opzioni (alla quale si accede dalla scheda Strumenti premendo
Opzioni). Le impostazioni più comuni possono essere modificate in questa
finestra (selezionare Mostra o Impostazioni, sotto Grafici), e i risultati
saranno riflessi negli stili predefiniti (cfr. il numero 2 di seguito) che verranno
utilizzati dal sistema e come tali, verranno automaticamente salvati nel file di
configurazione di STATISTICA (ad es., impostazioni differenti possono essere
210 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
usate per progetti differenti). Per maggiori dettagli, si veda la
documentazione nel Manuale Elettronico relativa al pannello Configurazioni
della finestra di dialogo Opzioni.
2. Stile grafico del sistema. Tutte le numerose caratteristiche che influenzano
l’aspetto dei grafici (da quelli elementari come il colore del font nella nota a
piè di pagina a quelli generali come le caratteristiche globali del documento
grafico) possono essere salvate come “stili” singoli. Questi stili possono avere
nomi personalizzati e possono essere riutilizzati successivamente
semplicemente usando opzioni di scelta rapida (come la pressione di una
specifica combinazione di tasti o facendo clic su di un pulsante su di una
barra strumenti personalizzata). Il sistema intelligente di STATISTICA gestisce
internamente queste migliaia di stili e le loro combinazioni ed aiuta a
realizzare gli obiettivi di personalizzazione con un minimo sforzo. Tutti gli stili
definiti dall’utente o modificati saranno automaticamente salvati nel file di
configurazione di STATISTICA (ad es., impostazioni differenti o stili di sistema
possono essere usati per progetti diversi). Per maggiori dettagli, si veda la
documentazione nel Manuale Elettronico relativa al pannello Configurazioni
della finestra di dialogo Opzioni.
3. Grafici definiti dall’utente. Possono essere definiti, in molteplici modi,
nuovi tipi di grafici e possono essere aggiunti ai menu, alle finestre di
dialogo, o alle barre strumenti. Se un grafico personalizzato che si intende
utilizzare ripetutamente non è costruito da uno “schizzo” ma è basato su uno
dei menu Grafici ed è prodotto da alcune combinazioni delle opzioni di
personalizzazioni grafiche disponibili, allora aggiungerlo al menu Grafici
come nuovo tipo di grafico è tanto semplice quanto fare clic sul pulsante
Aggiungi Come Grafico Da Utente nel Menu della scheda Opzioni 2 della
finestra di dialogo di specificazione di grafico. Tutti le specifiche dei grafici
definiti dall’utente saranno salvate automaticamente nel file di
configurazione di STATISTICA (ad es., impostazioni differenti di grafici
personalizzati possono essere utilizzate per progetti diversi). Per maggiori
dettagli, si veda la documentazione nel Manuale Elettronico relativa al
pannello Configurazioni della finestra di dialogo Opzioni.
4. STATISTICA Visual Basic. Per ultimo, si noti che non ci sono limiti alle
possibilità di personalizzazione dei grafici in STATISTICA, per il fatto che è
STATISTICA Guida di Riferimento – 211
Copyright © StatSoft, 2011
Capitolo 6: Grafici
possibile utilizzare STATISTICA Visual Basic (con tutti i suoi potenti strumenti di
disegno personalizzato così come la libreria di procedure grafiche basata su
STATISTICA) per produrre virtualmente qualsiasi output grafico o multimediale
contemporaneamente supportato dall’hardware. Questi formati di
visualizzazione grafica personalizzati o output multimediale può essere
assegnato alle barre strumenti, menu, o finestre di STATISTICA e possono
diventare parti permanenti della “vostra” applicazione STATISTICA.
Si veda il Manuale Elettronico (Aiuti di STATISTICA) per ulteriori dettagli su questi
metodi di personalizzazione grafica.
Il Manuale Elettronico contiene inoltre sezioni dedicate a specifiche categorie di
grafici, incluse panoramiche concettuali ed esempi di tipiche applicazioni, ed
illustra le principali proprietà funzionali che distinguono i rispettivi tipi di grafici.
Le impostazioni predefinite per la maggior parte dei grafici disponibili in
STATISTICA seguono le convenzioni stabilite ed esplicitamente descritte in
letteratura, oppure rappresentano gli standard comunemente accettati dalla
maggior parte delle riviste scientifiche (ad es. SCIENCE). Tuttavia, praticamente
tutte le impostazioni predefinite di STATISTICA possono essere personalizzate in
modo che queste soddisfino specifici requisiti richiesti da applicazioni inusuali (cfr.
pag. 210). Le funzionalità grafiche di STATISTICA sono state progettate per giocare
un ruolo di strumenti flessibili, in grado di produrre effetti che vadano oltre i
comportamenti ed i template prestabiliti.
Oltre ad una selezione completa di grafici statistici e tecnici standard, STATISTICA
include numerosi tipi di grafici unici e di funzionalità per personalizzarli. La finestra
Opzioni Grafiche, alla quale si accede facendo doppio clic sullo sfondo di un grafico
oppure premendo Grafico sulla scheda Modifica, gruppo Opzioni, contiene le
opzioni riguardanti tutte le caratteristiche personalizzabili. Tali opzioni sono
raggruppate in pannelli contenenti elementi logicamente correlati e ai quali si
potrebbe accedere facendo doppio clic su caratteristiche specifiche dei grafici.
212 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Nel lato inferiore dei grafici sono presenti i controlli grafici interattivi (cfr. la
prossima figura), che consentono di regolare la trasparenza delle aree e dei
marcatori del grafico e di scorrere lungo le scala orizzontale o verticale. Ulteriori
controlli sono posti nei grafici 3D per permettere la rotazione interattiva. Premere
l’icona a forma di chiave inglese adiacente alla barra di scorrimento per
visualizzare la finestra Opzioni Grafiche.
Sinistra: Grafico 2D
Sotto: Immagine ingrandita dei Controlli per il Panning
(scalatura), per Scorrere e per la Trasparenza
Scrolling Interattivo
Panning Interattivo
STATISTICA Guida di Riferimento – 213
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Sinistra: La sezione da
riscalare è cerchiata
Destra: Vista riscalata
della porzione cerchiata
Sinistra: Scatterplot con
una densa concentrazione
di dati
Destra: Il Controllo della
Trasparenza rivela trend
nascosti
Sinistra: Cerchiato il Controllo della Trasparenza
dell’Area del Grafico; rendere le aree trasparenti
consente di mostrare porzioni sovrapposte del grafico
Sinistra: Grafico 3D; cerchiato il Controllo della
Rotazione
Sotto: Immagine ingrandita dei Controlli per la
Rotazione e la Trasparenza
Nonostante gli statistici di StatSoft ne abbiano progettato la maggior parte, è
importante dire che gli utenti di STATISTICA hanno giocato un ruolo significativo
nella loro creazione. Infatti, la selezione delle opzioni grafiche incluse in
214 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
STATISTICA è il risultato dei suggerimenti forniti da migliaia di utenti. Molte
funzionalità uniche dei Grafici di STATISTICA sono state introdotte in risposta alle
idee e alle richieste provenienti dagli utenti e per questo StatSoft li desidera
ringraziare.
Come menzionato in precedenza (e discusso dettagliatamente a pag. 219), sono
presenti vari metodi per specificare i Grafici di STATISTICA. Si potrebbe dire che
questi metodi rappresentano differenti tipi di “interfacce” tra i numeri e i grafici.
Ad esempio, i numeri rappresentati in un grafico a torta possono semplicemente
raffigurare i valori di una colonna di spreadsheet (ad es., la variabile Vendite) nei
casi consecutivi dello spreadsheet (ad es., casi etichettati: Anno 2008, Anno 2009,
Anno 2010, ..., ecc.).
I numeri in un simile grafico a torta, tuttavia, possono rappresentare i risultati di
alcuni calcoli. Ad esempio, le fette della torta possono rappresentare frequenze
relative di osservazioni che appartengono a certe categorie calcolate da una delle
procedure di calcolo degli istogrammi o delle frequenze di categorizzazione (ad es.,
numeri di anni nei quali Vendite era minore di 10 milioni di dollari, tra 10 e 20
milioni e sopra 20 milioni).
STATISTICA Guida di Riferimento – 215
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Indipendentemente dal metodo che è stato usato per creare un grafico (cioè,
indipendentemente da dove sono stati ottenuti i numeri rappresentati nel grafico
o da come sono stati calcolati), tutte le personalizzazioni dei Grafici di STATISTICA e
le opzioni per la gestione di grafici multipli possono essere usate per modificare
l’aspetto del grafico o integrarlo con altri grafici o documenti.
Inoltre sono disponibili tutte le opzioni analitiche integrate che sono disponibili
dall’interno dei grafici in STATISTICA (come funzioni di adattamento, lisciamento,
rotazione, brushing, zoom analitico, ecc.) e possono essere applicate al grafico
216 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
indipendentemente dall’origine dei numeri nel grafico o dal metodo utilizzato per
crearlo.
Le opzioni per la modifica dei grafici offerte in STATISTICA non solo permettono di
creare pubblicazioni scientifiche e tecniche altamente personalizzate pronte per la
presentazione:
STATISTICA Guida di Riferimento – 217
Copyright © StatSoft, 2011
Capitolo 6: Grafici
e disegni precisi:
ma anche diagrammi, poster, tabelle di affari e altre visualizzazioni per le
presentazioni di qualità:
218 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
che sono progettate per comunicare informazioni in un modo efficace ed
attraente.
I grafici che sono salvati in file o che sono stati in un qualsiasi altro modo
temporaneamente isolati dall’applicazione STATISTICA (ad es., copiati negli
Appunti o collegati a un documento in un’altra applicazione) sono “oggetti”
completi (da un punto di vista tecnico, oggetti ActiveX, cfr. pag. 261) che non
contengono solo tutte le caratteristiche di personalizzazione ed eventuali altri
oggetti integrati, ma anche tutti i dati che sono necessari per modificare
continuamente tutti gli aspetti per la loro visualizzazione o l’analisi del loro
contenuto (adattamento, lisciamento, ecc.).
Per il fatto che i Grafici di STATISTICA sono oggetti ActiveX, questi possono
facilmente essere collegati o integrati in altri documenti compatibili (ad es.,
documenti Excel o Word), e con un doppio clic su quest’ultimi, è possibile
modificarli sul posto. I Grafici di STATISTICA sono anche contenitori ActiveX e,
pertanto, possono contenere un’ampia varietà di documenti integrati o collegati
come disegni Visio, illustrazioni Adobe, spreadsheet Excel, o documenti Word.
Inoltre, STATISTICA supporta le gerarchie degli oggetti integrati fino a quattro
livelli, il che significa che può gestire “documenti, contenenti documenti,
contenenti documenti, che a loro volta contengono documenti.”
CATEGORIE GENERALI
DEI GRAFICI
In aggiunta ai grafici statistici specializzati che sono disponibili dalle finestre di
dialogo di output in tutte le procedure statistiche (cfr. pag. 230), ci sono due
categorie generali o classi di grafici accessibili sia dalla scheda Grafici, dal menu di
scelta rapida, e dal pulsante STATISTICA Start :
• Grafici di dati di input (Grafici di Dati di Input, cfr. pag. 220) e grafici del
menu Grafici (cfr. pag. 220) e
• Grafici di Blocchi di Dati (cfr. pag. 223).
La differenza più importante tra queste due categorie generali sta nei dati che i tipi
di grafico utilizzano per generare i grafici.
STATISTICA Guida di Riferimento – 219
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Grafici di dati di input. I Grafici di Dati di Input e la loro versione estesa sulla
scheda Grafici producono sommatorie statistiche o altre rappresentazioni di dati
grezzi nello spreadsheet corrente di dati di input (tipicamente per tutte le variabili
intere, o per il sottoinsieme se utilizzate le condizioni di selezione di caso). Si noti
che se i grafici di questa categoria generale sono prodotti utilizzando un menu di
scelta rapida dall’interno di uno spreadsheet di risultati che non contiene i dati
attuali (ad es., una matrice di correlazione), STATISTICA passerà ancora ai rispettivi
dati di input (grezzi) per produrre il grafico (ad es., uno scatterplot delle variabili
identificate dalla cella selezionata nella matrice di correlazione dalla quale il menu
di scelta rapida è stato aperto).
Grafici di Blocchi di Dati. I Grafici di Blocchi di Dati, tuttavia, sono
completamente indipendenti dal concetto di “dati di input” o “file dati.” Questi
forniscono uno strumento generale per visualizzare valori numerici nel blocco
correntemente selezionato di qualsiasi spreadsheet (il quale può contenere valori
di output numerico di sottoinsiemi definiti dall’utente o sottoinsiemi di dati grezzi
arbitrariamente selezionati).
Caratteristiche comuni delle due categorie di grafici. Queste due categorie
generali di grafici offrono le stesse opzioni di personalizzazione e la stessa
selezione di tipi di grafici. Ad esempio, è possibile creare lo stesso, altamente
specializzato grafico ternario categorizzato dai dati di input (grezzi), e da un blocco
di valori definito dall’utente rappresentante i risultati di un particolare test.
Queste due categorie generali di grafici saranno brevemente discusse nelle
successive due sezioni, seguiti da una sezione sulla scheda Grafici, il quale contiene
una esaustiva selezione di tutti i grafici della prima (grafici di dati di input
categoriali; spesso riferito al menu Grafici dei grafici), così come all’accesso a
Grafici di Blocchi di Dati ed altre opzioni.
GRAFICI DI DATI DI INPUT
Il comando Grafici di Dati di Input è disponibile dal menu di scelta rapida di tutti
gli spreadsheet ed offre un rapido e semplificato accesso ai più comunemente
usati tipi di grafici basati sul corrente insieme di dati di input.
220 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Si noti che tutti questi grafici sono disponibili anche sulla scheda Grafici, dal
pulsante Start di STATISTICA sulla barra di stato, oppure facendo clic sul
pulsante Galleria dei Grafici su qualsiasi finestra di specificazione dei grafici.
Grafici di Dati di Input non offre tante opzioni quante ne offre il corrispondente
menu Grafici; tuttavia, sono i più rapidi da selezionare:
• Grafici di Dati di Input possono essere richiamati direttamente dal menu di
scelta rapida degli spreadsheet,
• Grafici di Dati di Input non richiede la selezione di variabili (la selezione di
variabile è determinata dalla posizione corrente del cursore all’interno
dello spreadsheet), e
• Grafici di Dati di Input non richiede la selezione di opzioni da finestre
intermedie (vengono prodotti i formati predefiniti dei rispettivi grafici).
Grafici di Dati di Input elabora i dati direttamente dal file dati di input corrente e
considera le variabili da utilizzare dalla posizione corrente del cursore (in qualsiasi
tipo di spreadsheet).
Ad esempio, se si seleziona con un clic con il tasto destro una correlazione singola
in uno spreadsheet di risultati e si crea uno Scatterplot per…, STATISTICA genera
uno scatterplot 2D usando i valori grezzi originali delle due variabili rappresentate
nella correlazione (cfr. l’Esempio Introduttivo a pag. 11 per un esempio più
dettagliato).
STATISTICA Guida di Riferimento – 221
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Sebbene il modo più conveniente di selezionare Grafici di Dati di Input sia via
menu di scelta rapida di spreadsheet, è possibile selezionarli anche dalla scheda
Grafici o dal menu Start di STATISTICA . Entrambi i metodi visualizzano un sotto
menu dal quale è possibile scegliere uno dei grafici statistici applicabile alla
variabile corrente (cioè, alla varabile indicata dalla posizione corrente del cursore
nello spreadsheet).
Se lo spreadsheet ha un formato a matrice o un formato dove la posizione del
cursore indica non una ma due variabili (come nell’illustrazione che mostra una
matrice di correlazione, qui sotto), allora grafici bivariati predefiniti per la coppia
specificata di variabili saranno direttamente disponibili dal sottomenu Grafici di
Dati di Input.
Quando invece la posizione corrente del cursore indica solo una variabile come in
una tabella di statistiche descrittive, (come mostrato nell’illustrazione che segue),
e si seleziona un qualsiasi grafico bivariato nel menu, STATISTICA proporrà la
selezione della seconda variabile. Ad esempio, se si seleziona Scatterplot per, sarà
visualizzata la finestra di dialogo Selezionare seconda variabile , dove specificare
per quale variabile Measure05 andrà ad essere tracciata.
222 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Se più di una variabile è indicata da una sezione evidenziata (cioè, quando è
selezionato un blocco), allora il menu Grafici di Dati di Input si applicherà alla
prima variabile selezionata.
Generando Grafici di Dati di Input, STATISTICA tiene in considerazione le
condizioni di selezione dei casi e i pesi per le variabili da tracciare. Si noti,
comunque, che le condizioni di selezione dei casi o i pesi devono essere specificati
per lo spreadsheet corrente (cioè, tramite la scheda Strumenti opzioni Condizioni
di Selezione - Modifica e Pesi) e non solo “localmente” per una analisi (cioè,
selezionando per la rispettiva analisi/grafico le finestre di dialogo di specificazione
usando i pulsanti
e
). Le ultime condizioni verranno ignorate da Grafici di
Dati di Input. Per ulteriori informazioni su tipi specifici di Grafici di Dati di Input, si
veda il Manuale Elettronico.
GRAFICI DI BLOCCHI DI DATI
Diversamente da Grafici di Dati di Input, Grafici di Blocchi di Dati utilizza il blocco
di dati (continuo) correntemente selezionato nello spreadsheet attivo per
specificare i dati di input per il grafico.
STATISTICA Guida di Riferimento – 223
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Si noti che questi grafici sono completamente indipendenti dal concetto di “dati di
input.” Essi elaborano valori (numeri) in qualsiasi parte siano correntemente
selezionati nel blocco ed ignorano il “significato” di questi numeri (ad es., i numeri
possono essere dati grezzi o valori di coefficienti di correlazione). Questi grafici
offrono effettivi strumenti di visualizzazione, esplorazione, e di riassunto efficiente
in output numerico delle analisi visualizzate in spreadsheet di risultati (ad es.,
risultati di output in istogrammi di Monte Carlo nel modulo SEPATH, o un box plot
di medie aggregate di una tabella di classificazione multivariata multipla nel
modulo ANOVA).
Sebbene il modo più conveniente per selezionare Grafici di Blocchi di Dati è via
menu di scelta rapida associato al blocco selezionato in uno spreadsheet, i Grafici
di Blocchi di Dati sono disponibili anche dalla scheda Grafici o dal menu Start di
STATISTICA . Creando Grafici di Blocchi di Dati, è possibile selezionare da grafici
predefiniti (ad es., Istogramma: Colonne Blocco o Grafico a Linee: Righe Blocco), o
è possibile creare grafici personalizzati sia per le celle selezionate nelle righe o
colonne sia tutte le celle nelle righe e colonne selezionate (cioè, andando oltre i
valori che sono selezionati nel blocco).
Grafici predefiniti. Usando dei grafici predefiniti (i primi sei comandi del
sottomenu Grafici di Blocchi di Dati, riportato nell’illustrazione sopra) è possibile
creare specificati grafici con un singolo clic. Per informazioni specifiche su ogni
grafico predefinito, si faccia riferimento al Manuale Elettronico.
Grafici personalizzati. Si selezioni uno dei quattro comandi Grafico
Personalizzato per visualizzare la finestra di dialogo Seleziona Grafico, la quale
fornisce una varietà di opzioni per creare grafici personalizzati.
224 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Per informazioni specifiche sui grafici personalizzati, si faccia riferimento al
Manuale Elettronico.
Personalizzare grafici. Come per la maggior parte delle caratteristiche di
STATISTICA, anche i Grafici di Blocchi di Dati sono completamente personalizzabili.
Si selezioni Personalizza Elenco dal menu Grafici di Blocchi di Dati per visualizzare
la finestra Personalizza Menu Grafici, la quale fornisce opzioni per rimuovere,
rinominare, o modificare i grafici correntemente elencati così come aggiungere
nuovi grafici (definiti dall’utente) al menu Grafici di Blocchi di Dati.
Ad esempio, se si vuole includere un adattamento normale agli istogrammi creati
usando Istogramma: Colonne Blocco, selezionare Istogramma: Colonne Blocco
nella finestra di dialogo Personalizza Menu Grafici, si faccia clic sul pulsante
Modifica, e si imposti il Sottotipo di Grafico a Adatt. Normale. Tutti i tracciati
Istogramma: Colonne Blocco creati conseguentemente includeranno un
adattamento normale ai dati.
GRAFICI DEL MENU GRAFICI
La scheda Grafici fornisce una completa selezione di tutti i grafici statistici
disponibili in STATISTICA. Queste opzioni non sono disponibili solo sulla scheda
Grafici, ma anche dal menu Start di STATISTICA ed offrono centinaia di tipi di
rappresentazioni grafiche e riassunti analitici dei dati.
STATISTICA Guida di Riferimento – 225
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Si noti che diversamente da Grafici di Blocchi di Dati (che sono anche inclusi in
questa scheda per offrire un completo complemento di tutte le opzioni grafiche
accessibili da un singolo controllo), tutti gli altri tipi di grafico della scheda Grafici
non sono limitati ai valori dello spreadsheet corrente di output. Invece, questi
elaborano i dati direttamente dallo spreadsheet corrente di input, nello stesso
modo dei (discusso in precedenza) Grafici di Dati di Input. Rappresentano sia
metodi standard di riassumere graficamente dati grezzi (ad es., vari scatterplot,
istogrammi, o tracciati di tendenze centrali come mediane) sia tecniche analitiche
grafiche (ad es., normal probability plot categorizzati, detrended probability plot o
grafici degli intervalli di confidenza per linee di regressione). Generando questi
grafici, STATISTICA tiene in considerazione la selezione corrente dei casi e i pesi
delle variabili selezionate che devono essere tracciate.
Il menu Grafici dei grafici include Grafici 2D, Grafici 3D di Sequenze, Grafici XYZ
3D, Grafici a Matrice, Grafici a Icone, Grafici Categorizzati e Grafici Definiti da
Utente. Si noti che nel gruppo Comune della scheda Grafici sono compresi i tipi di
grafici usati più comunemente (Istogrammi, Scatterplot, Grafici Medie con Errore,
ecc.), e nel gruppo Altri è contenuta una lista completa di tutti i tipi di grafico. Si
veda anche, Tipi di Grafici nel Menu Grafici nel Manuale Elettronico.
BRUSHING DEI GRAFICI
E STATI DI CASO
I grafici, creati dalla scheda Grafici, offrono un’interazione perfetta con lo
spreadsheet sorgente. È possibile identificare e selezionare i punti sul grafico e
specificare che questi vengano evidenziati all’interno dello spreadsheet sorgente, e
viceversa.
Oltre alla selezione di punti nei grafici e negli spreadsheet, sarà possibile
identificare le proprietà di un caso all’interno dello spreadsheet utilizzato per la
creazione del grafico. Queste proprietà includono gli stili ed i colori dei marcatori
di punto, e le informazioni circa l’opportunità di escludere o meno un punto e/o i
calcoli di adattamento dal grafico.
226 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Per eseguire il brushing all’interno di un grafico, si prema il pulsante
presente sulla scheda Modifica, nel gruppo Personalizza
Grafica, oppure fare clic col tasto destro del mouse sullo sfondo di
un grafico e selezionare Mostra Brushing dal menu a scelta rapida
per visualizzare la finestra Brushing , mostrata qui a destra.
Con il Brush di Selezione, impostato su Semplice, è possibile
tracciare un rettangolo sul grafico e selezionare i punti in esso
contenuti. La seguente illustrazione dimostra come procedere sul
file dati Adstudy.sta, per il quale è stato costruito uno scatteplot 2D
relativo a MEASURE03 per MEASURE05.
Si noti che selezionando i punti attraverso lo strumento di brushing
è possibile evidenziare i punti nel grafico così come i casi
corrispondenti presenti nello spreadsheet sulla base del quale è
stato creato il grafico.
In alternativa, invece di usare le funzionalità di Brushing, è anche possibile
selezionare casi nello spreadsheet (facendo un clic sul lato sulla sinistra del nome
di caso) per marcare i punti corrispondenti sul grafico, così come illustrato
nell’immagine seguente, dove sono stati selezionati i primi cinque casi dello
spreadsheet Adstudy.sta.
STATISTICA Guida di Riferimento – 227
Copyright © StatSoft, 2011
Capitolo 6: Grafici
È possibile specificare gli stati di caso su spreadsheet sia dallo spreadsheet stesso
che da un grafico. Nello spreadsheet di STATISTICA, si faccia un clic col tasto destro
del mouse su un nome di caso per visualizzare il menu a scelta rapida, contenente i
comandi Off, Etichetta, Punti Marcati e Stati di Caso. Simili comandi sono
disponibili dal menu a scelta rapida visualizzabile facendo un semplice clic col tasto
destro del mouse sui punti del grafico. Nel grafico tali opzioni verranno utilizzate
per definire la modalità di visualizzazione dei casi d’interesse. Ad esempio, se si
seleziona Etichetta, i punti corrispondenti verranno etichettati così come illustrato
nell’immagine seguente. Si noti che i casi di spreadsheet vengono marcati con una
particolare icona di stato di caso che indicherà l’etichettatura dei casi:
228 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Si faccia un clic col tasto destro del mouse su un nome di caso e dal menu a scelta
rapida si selezioni Stati di Caso – Modifica Stati di Caso per modificare il
marcatore e/o il colore dei marcatori di caso.
Si noti che la selezione dei punti è disponibile anche per altri tipi di grafici oltre che
per gli Scatterplot. Per gli istogrammi, il brushing sulle barre di un istogramma
consentirà di selezionare i punti contenuti in tali barre sullo spreadsheet sorgente.
La stessa cosa può esser fatta sulle scatole dei box plot.
Utilizzare gli stati di caso e il brushing è particolarmente utile con le opzioni
Nascosti ed Esclusi. In primo luogo, per attivare queste opzioni, aprire la finestra
Opzioni (selezionare la scheda Strumenti e premere Opzioni) e, nel menu ad
albero, selezionare Navigazione/Predefiniti (posto sotto Spreadsheet).
Deselezionare il controllo Imposta Stati di Caso Esclusi e Nascosti in stato Off e
premere il pulsante OK.
Quindi si selezioni la scheda Dati e, nel gruppo Casi, premere Casi. Dal sottomenu
Stati di Caso, specificare Nascosti per marcarli come nascosti, cioè, i casi non
saranno visibili nei grafici, ma saranno utilizzati nelle analisi. È inoltre possibile fare
clic col tasto destro su di un caso e, dal menu contestuale, selezionare Stati di Caso
– Modifica Stati di Caso per visualizzare la finestra Stati di Caso, dove si può
spuntare il controllo Nascosti.
STATISTICA Guida di Riferimento – 229
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Selezionare Esclusi per marcare i casi come esclusi, cioè, i casi non saranno
utilizzati nei calcoli; tuttavia, saranno visualizzati nella maggior parte dei tipi di
grafici. Lo stato Escluso funziona insieme alle condizioni di selezione degli
spreadsheet, poiché se un caso è marcato come Escluso sarà trattato come se non
facesse parte delle condizioni di selezione. Pertanto, utilizzare il brushing e gli stati
di caso è strumento conveniente per eliminare gli outlier e per rieseguire le analisi
senza i dati rimossi.
Quando il controllo Imposta Stati di Caso Esclusi e Nascosti in stato Off è spuntato
nella finestra Opzioni, pannello Navigazione/Predefiniti, le opzioni Nascosti ed
Esclusi saranno sostituite da Off. Selezionare Off per marcare un caso come
Nascosto ed Escluso; tale punto sarà escluso sia dai calcoli che dai grafici.
ALTRI GRAFICI SPECIALIZZATI
Oltre alla selezione standard dei grafici attraverso i Grafici dei Dati di Input, Grafici
di Blocchi di Dati e dal menu Grafici, altri grafici statistici specializzati per tipi
particolari d’analisi (si pensi ad esempio ai risultati di un’analisi dei gruppi) saranno
accessibili direttamente dalle finestre dei risultati.
230 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 6: Grafici
I grafici specializzati sono descritti nella documentazione associata alle specifiche
analisi d’interesse; per informazioni dettagliate si faccia riferimento al Manuale
Elettronico.
CREARE GRAFICI TRAMITE
STATISTICA VISUAL BASIC
Si può avere accesso alle opzioni grafiche di STATISTICA anche attraverso script
realizzabili con STATISTICA Visual Basic (SVB) o altri linguaggi compatibili. Pertanto,
non vi sono limiti a come “personalizzare in profondità” i propri grafici di
STATISTICA in quanto SVB (con tutti i suoi strumenti di personalizzazione grafica e
con quelli già disponibili nelle librerie di sistema standard) può essere utilizzato per
produrre virtualmente qualsiasi tipologia di grafico o visualizzazione multimediale
dell’output supportata dal computer.
Qualsiasi applicazione scritta in STATISTICA Visual Basic può operare sui grafici in
tre modi:
• Creare un nuovo grafico e quindi modificarlo, stamparlo o salvarlo;
• Accedere ad un grafico esistente e quindi modificarlo;
• Aprire un file grafico esistente e quindi modificarlo, stamparlo o salvarlo.
Ogni grafico disponibile in STATISTICA può essere prodotto attraverso STATISTICA
Visual Basic e quindi personalizzato usando le procedure generali offerte da questo
linguaggio tradizionalmente molto completo.
Come con tutte le altre funzioni disponibili in STATISTICA Visual Basic, le funzioni di
accesso alle librerie grafiche di STATISTICA possono venire facilmente incorporate
in qualsiasi programma in STATISTICA Visual Basic attraverso un Visualizzatore
Funzioni gerarchicamente organizzato. Esso contiene brevi descrizioni su tutte le
funzioni e le opzioni che possono essere inserite direttamente dentro il codice
sorgente del proprio programma (cioè, dentro l’Editor di STATISTICA Visual Basic,
cfr. pag. 247).
STATISTICA Guida di Riferimento – 231
Copyright © StatSoft, 2011
Capitolo 6: Grafici
Per maggiori informazioni sull’accesso alle librerie grafiche di STATISTICA
attraverso il linguaggio di programmazione di STATISTICA Visual Basic, si faccia
riferimento al Manuale Elettronico.
232 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
7
CAPITOLO
PERSONALIZZARE
STATISTICA
Personalizzare l’Interfaccia Utente Interattiva .................................. 235
Personalizzare i Documenti ................................................................. 236
Personalizzazioni Locali e Permanenti ............................................... 237
Impostazioni Predefinite Generali ...................................................... 238
Personalizzare i Grafici ........................................................................ 239
Mantenere Configurazioni Differenti di STATISTICA.......................... 240
Configurazioni Personalizzate per Singoli Utenti di una Rete .......... 240
STATISTICA Guida di Riferimento –233
Copyright © StatSoft, 2011
234 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
7
CAPITOLO
PERSONALIZZARE
STATISTICA
STATISTICA presenta la grande flessibilità di un’interfaccia utente completamente
personalizzabile e supporta l’aggiustamento necessario dell’interfaccia utente
standard per meglio soddisfare i propri bisogni. Infatti, STATISTICA “anticipa” le
necessità dell’utente in quanto memorizza le scelte fatte. Ad esempio, se si avvia
un’analisi dalla scheda Avanzate di una finestra di dialogo di analisi, la scheda
Avanzate verrà selezionata (al posto della scheda Rapido) la prossima volta che
verrà visualizzata quella finestra.
Praticamente tutti gli aspetti dell’interfaccia utente possono essere personalizzati,
a cominciare da quei controlli semplici quali i menu classi, la barra di Accesso
Rapido e la tastiera. Il procedimento da seguire per la personalizzazione di questi
componenti è semplice e rapido (come esempio, si veda l’illustrazione relativa alla
personalizzazione della barra degli strumenti a pag. 154). È possibile impostare sia
personalizzazioni globali che locali per grafici, spreadsheet, registri, report, ecc. e
mantenere configurazioni differenti di STATISTICA (per un singolo utente così come
per utenti di rete). Si possono quindi definire in maniera completa nuove
interfacce utenti (cfr. pagg. 154 e 156).
PERSONALIZZARE L’INTERFACCIA
UTENTE INTERATTIVA
Come spiegato in precedenza, STATISTICA contiene funzionalità per definire
interamente nuove interfacce utente (cfr. pag. 154), incluse le interfacce basate su
STATISTICA Guida di Riferimento –235
Copyright © StatSoft, 2011
Capitolo 7: Personalizzare STATISTICA
browser Internet (cfr. pag. 157). Praticamente ogni aspetto dell’interfaccia utente
interattiva può essere modificato facilmente in vari modi. Ad esempio, si possono
aggiungere opzioni predefinite, semplificarle, o modificarle a seconda delle
esigenze. A seconda delle esigenze delle operazioni da eseguire e delle proprie
preferenze personali per particolari “modi” operativi (e scelte estetiche), si
possono tenere nascoste tutte le icone, le barre strumenti, le barre di stato, menu
lunghi, le funzionalità del registro le funzioni drag-and-drop collegamenti dinamici
(automatici) tra grafici e dati, effetti 3D in tabelle ed effetti 3D nelle finestre di
dialogo; si può richiedere output “essenziale” in forma sequenziale con grafici
monocromatici e spreadsheet semplici; si può impostare il sistema a mantenere
automaticamente non più di un semplice report alla volta.
Alternativamente, si possono definire barre degli strumenti elaborate sia a livello
globale che locale; avvantaggiarsi pienamente di tutti i controlli e strumenti
speciali, icone, barre degli strumenti, macro (ad es., assegnare una particolare
operazione ad una nuova specifica opzione dei menu classici, alla barra di Accesso
Rapito o ad una combinazione di tasti), elaborate tabelle multimediali, funzionalità
del registro e funzioni drag-and-drop; stabilire collegamenti dinamici (automatici)
multipli tra grafici e dati, collegamenti interni tra oggetti grafici; personalizzare le
finestre di output con colori, caratteri speciali e segni di evidenziatore; modificare
lo stile dei grafici predefiniti e la loro modalità di visualizzazione; spedire i risultati
al registro separati gerarchicamente per creare un elaborato ambiente “multistrato” di analisi dei dati che facilita l’esplorazione di file di dati complessi e
consente di confrontare aspetti differenti dell’output.
PERSONALIZZARE
I DOCUMENTI
Esistono diversi strumenti completi e specializzati per personalizzare l’aspetto dei
documenti di STATISTICA (cfr. Capitolo 5 – Documenti di STATISTICA, pag. 185). Ad
esempio, STATISTICA include un sistema completo per la gestione delle impostazioni
predefinite di qualunque aspetto dei grafici e per la combinazione delle
personalizzazioni in stili organizzati gerarchicamente. Allo stesso modo, si possono
creare layout e formati personalizzati per spreadsheet (tabelle multimediali) ed
236 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 7: Personalizzare STATISTICA
eventi personalizzati (ad es., cosa succede quando si fa doppio clic su una tabella). Si
veda nel Manuale Elettronico per ulteriori dettagli.
PERSONALIZZAZIONI
LOCALI E PERMANENTI
Possono essere modificati molti aspetti relativi al modo di apparire di STATISTICA
sia nella scheda Visualizza che nella scheda Strumenti. Ognuno di questi due
metodi, comunque, offre una funzione differente.
Scheda Visualizza. I cambiamenti specificati nella scheda Visualizza sono relativi
all’aspetto corrente di STATISTICA (ad es., nascondere la barra di stato) o la
finestra di documento corrente (ad es., cambiare le linee della griglia dello
spreadsheet).
Finestra Opzioni. Le opzioni disponibili nella finestra Opzioni (selezionare la
scheda Strumenti e premere Opzioni) sono usate per aggiustare le opzioni
predefinite del programma in modo permanente (discusse in dettaglio nella
prossima sezione). Si noti, tuttavia, che le opzioni globali applicabili a documenti di
un particolare tipo (ad es., un grafico o uno spreadsheet) non cambieranno il
documento corrente: questi saranno memorizzati come impostazioni predefinite
del programma che interesseranno la creazione del prossimo (ovvero, nuovo)
documento del rispettivo tipo.
Ad esempio, se si cambia l’Aspetto Predefinito dello Spreadsheet nel pannello
Navigazione/Predefiniti della finestra Opzioni, si vedrà che il nuovo Aspetto dello
Spreadsheet verrà applicato solamente quando verrà creato un nuovo
spreadsheet. Queste opzioni predefinite, tuttavia, non interesseranno alcun file
precedentemente salvato poiché quegli spreadsheet verranno visualizzati con
l’aspetto specifico con cui erano stati salvati (si utilizzino le opzioni della scheda
Visualizza per personalizzare gli oggetti esistenti).
STATISTICA Guida di Riferimento – 237
Copyright © StatSoft, 2011
Capitolo 7: Personalizzare STATISTICA
IMPOSTAZIONI PREDEFINITE
GENERALI
Personalizzare le impostazioni predefinite generali di sistema. Le
impostazioni predefinite generali di STATISTICA possono essere modificate usando
le opzioni presenti nella finestra Opzioni (selezionare la scheda Strumenti e
premere Opzioni). Esse controllano:
• Gli aspetti generali del comportamento di STATISTICA (quali avviare
STATISTICA a schermo pieno, funzionalità relative a registri e ai report,
posizioni dei file o liste personalizzate, ecc.),
• Il modo in cui è prodotto l’output (ad es., in registri, in report, ecc.),
• L’aspetto generale della finestra dell’applicazione (icone, barre degli
strumenti, ecc.), e
• L’aspetto delle finestre dei documenti.
Il pannello Generale della finestra Opzioni è mostrato nella seguente illustrazione.
Tutte queste e altre impostazioni generali sono accessibili indipendentemente dal
tipo di finestra di documento correntemente attiva (ad es., uno spreadsheet o un
grafico). Per maggiori informazioni relative ad un specifico pannello, si veda il
238 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 7: Personalizzare STATISTICA
Manuale Elettronico (cioè, si prema F1 per vedere gli Aiuti di STATISTICA che
descrivono le opzioni attualmente visualizzate).
Scegliere tra impostazioni predefinite alternative (configurazioni). Le opzioni
fornite nel pannello Configurazioni della finestra Opzioni permettono di
conservare “librerie” di impostazioni e cambiare tra esse per progetti (o utenti)
differenti. Per maggiori dettagli, cfr. Conservare Configurazioni Differenti di
STATISTICA a pag. 240 e il Manuale Elettronico.
PERSONALIZZARE I GRAFICI
Personalizzare i grafici interattivi. Le opzioni di personalizzazione nei grafici di
STATISTICA includono migliaia di caratteristiche e strumenti che possono essere
usati per modificare ogni dettaglio associato ad elaborazioni dati. Queste opzioni
sono ordinate gerarchicamente, in modo tale che le opzioni usate più
frequentemente possano essere accessibili direttamente tramite scorciatoie con
doppio clic o col pulsante destro del mouse su uno specifico elemento del grafico.
Impostazioni permanenti e opzioni di automazione. Le impostazioni iniziali
(predefinite) delle caratteristiche grafiche possono essere facilmente modificate in
modo che anche l’aspetto predefinito e il comportamento dei Grafici di STATISTICA
risponda a specifiche esigenze e/o richieda interventi molto piccoli. Vari aspetti dei
Grafici di STATISTICA possono essere modificati in modo permanente usando:
1. la finestra Opzioni (selezionare la scheda Strumenti e premere Opzioni),
2. il completo sistema degli stili dei grafici,
3. i grafici definiti dall’utente, e
4. STATISTICA Visual Basic.
Queste funzionalità sono brevemente trattati nel Capitolo 6 – Grafici (pag. 210).
Per ulteriori informazioni, si faccia riferimento al Manuale Elettronico.
Non ci sono limiti a come possono essere “profondamente personalizzati” i grafici
di STATISTICA, per il fatto che può essere usato STATISTICA Visual Basic (con tutti i
suoi potenti strumenti per la personalizzazione dei disegni così come la libreria di
base di procedure grafiche di STATISTICA) per produrre virtualmente qualsiasi
STATISTICA Guida di Riferimento – 239
Copyright © StatSoft, 2011
Capitolo 7: Personalizzare STATISTICA
grafico o output multimediale contemporaneamente supportato dall’hardware.
Questi risultati grafici o output multimediale sviluppati e personalizzati possono
essere assegnati a barre strumenti di STATISTICA, menu, o finestre di dialogo e
possono diventare parti permanenti della propria applicazione STATISTICA.
MANTENERE CONFIGURAZIONI
DIFFERENTI DI STATISTICA
STATISTICA registra tutte le impostazioni del programma quando si esce da esso, e
le ripristina la volta successiva che si avvia l’applicazione. È possibile creare
differenti configurazioni di queste impostazioni usando le opzioni nel pannello
Configurazioni della finestra Opzioni (selezionare la scheda Strumenti e premere
Opzioni). Con il gestore della configurazione, è possibile salvare lo stato corrente
del programma in una nuova o esistente configurazione, o è possibile riavviare
STATISTICA usando una differente configurazione. Altre opzioni includono la
possibilità di importare o esportare la configurazioni in un file separato in modo da
poterlo condividere tra installazioni di STATISTICA.
CONFIGURAZIONI PERSONALIZZATE
PER SINGOLI UTENTI IN UNA RETE
Lo stesso principio descritto nel paragrafo precedente viene applicato alle
installazioni di rete di STATISTICA. In una rete, nonostante STATISTICA sia installato
in un unico luogo (su server), ogni utente può comunque configurare STATISTICA in
quanto le informazioni di configurazione sono archiviate localmente. Si noti che
per installare appropriatamente il programma in un disco non-locale (server di
rete) è necessario selezionare Installazione di Rete nell’Installazione di
STATISTICA. Si noti che per assicurare un funzionamento accettabile quando il
programma viene utilizzato contemporaneamente da più di un utente e non è
installato in un’unica macchina sarà necessario disporre di una versione di rete di
STATISTICA.
240 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
8
CAPITOLO
STATISTICA
VISUAL BASIC
Registrare Macro (Programmi) in STATISTICA Visual Basic (SVB) ... 246
Esempio: Registrare un’Analisi ........................................................... 252
Oggetti e Documenti ActiveX (Una Nota Tecnica) ............................. 261
STATISTICA Guida di Riferimento –241
Copyright © StatSoft, 2011
242 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
8
CAPITOLO
STATISTICA
VISUAL BASIC
Il linguaggio STATISTICA Visual Basic (integrato in STATISTICA) è compatibile con gli
standard industriali e offre un’altra interfaccia utente (alternativa) alle funzionalità
di STATISTICA, ed offre decisamente molto di più di un “linguaggio di
programmazione supplementare” da utilizzarsi per scrivere estensioni
personalizzate.
Si noti che STATISTICA Visual Basic non è Microsoft Visual Basic 6.0, in quanto
StatSoft possiede e gestisce il codice per questa versione. SVB è compatibile con
VB.NET, VBA (Visual Basic for Applications) ed anche Visual Basic 6.0 (VB6), tutti
prodotti di Microsoft. Il linguaggio SVB è unico in termini di flessibilità e
compatibilità e fornisce l’accesso a VBA (utilizzato per gli script dei prodotti
Microsoft Office) ed a .NET Framework all’interno dello stesso file (cfr. Capitolo 10
– Programmare in STATISITCA da .NET, pag. 271). È possibile accedere anche ad
altre API e sfruttare la flessibilità di SVB, come ,ad esempio, l’API di Yahoo Stock
Quote o di Google Analytics. SVB offre una potente soluzione a 64-per
l’integrazione, l’espansione e lo sviluppo personalizzato del sistema.
STATISTICA Visual Basic sfrutta appieno il modello di architettura ad oggetti di
STATISTICA ed è usato per accedere via programmazione ad ogni aspetto e
virtualmente ad ogni dettaglio delle funzionalità di STATISTICA. Anche le analisi e i
grafici più complessi possono essere registrati in macro Visual Basic per essere
eseguite ripetutamente in un secondo momento o modificate ed usate come
mattoni per altre applicazioni. STATISTICA Visual Basic aggiunge un numero
superiore a 14,000 nuove funzioni alla completa sintassi standard di Visual Basic,
STATISTICA Guida di Riferimento –243
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
comprendendo quindi uno dei più grandi e richiesti ambienti di sviluppo
disponibile.
Applicazioni per programmi STATISTICA Visual Basic. I programmi STATISTICA
Visual Basic possono essere usati per una ampia varietà di applicazioni, dalle
semplici macro registrate per automatizzare una specifica (usata ripetutamente)
sequenza di lavori, ad elaborati sistemi analitici personalizzati che combinano la
potenza delle procedure ottimizzate di STATISTICA con estensioni personalizzate
sviluppate che generano una propria interfaccia utente. Quanto propriamente
autorizzati, script per analisi sviluppati in questo modo possono essere integrati
nei più grandi ambienti di calcolo, eseguiti dall’interno di sistemi software
proprietari, o in portali Internet o intranet.
I programmi SVB possono essere allegati praticamente a tutti i più importanti
“eventi” disponibili in un’analisi di STATISTICA quali l’apertura o la chiusura di file,
il clic sulle celle di uno spreadsheet, ecc.; in questa maniera, l’interfaccia utente
base di STATISTICA potrà venire altamente personalizzata per specifiche
applicazioni (ad es., per operazioni d’inserimento di dati, ecc.).
Diversi linguaggi per creare script sono inclusi in STATISTICA. È possibile scegliere
tra SVB, SVB Avanzato, STATISTICA Visual Basic.NET o R.
STATISTICA Visual Basic Avanzato è un soprainsieme di STATISTICA Visual Basic
poiché include funzionalità aggiuntive. Le caratteristiche di STATISTICA Visual
Basic.NET consentono un accesso diretto a.NET Assemblies, cioè, non tramite COM
Interop come sarebbe richiesto da SVB standard.
R è un linguaggio di programmazione e un ambiente per il calcolo statistico.
L’ambiente R, ed il suo codice di origine, è disponibile liberamente sotto la licenza
GNU GPL. La comunità R mantiene diversi depositi centralizzati per condividere
centinaia di pacchetti per tutti gli utenti su internet. Gli script originari in R
possono essere eseguiti direttamente all’interno di STATISTICA, STATISTICA
Enterprise e STATISTICA Enterprise Server.
244 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
L’output di R può essere recuperato in Spreadsheet e Grafici di STATISTICA e
gestito tramite i flessibili Registri di STATISTICA.
Per utilizzare il linguaggio R è necessario averlo installato sia sul computer che
esegue STATISTICA che sul computer accessibile da STATISTICA Enterprise Server
per utilizzare le sue routine e capacità specializzate di:
• Aggiungere nuovi “moduli” basati su R
• Sfruttare la grafica superiore, i flessibili spreadsheet e i convenienti registri
di STATISTICA per gestire l’output di R in vari tipi di documenti
• Integrare R in STATISTICA Enterprise per rendere disponibili le funzionalità
specializzate di R per gli utenti che non hanno familiarità con tale
linguaggio, in un sicuro sistema di analisi basata su ruoli
• Aggiungere i nodi analitici basati su R di STATISTICA Data Miner, in modo da
sfruttare tutte le capacità di R all’interno degli spazi di lavoro di STATISTICA
e del Data Miner
• Costruire server scalabili su R usando STATISTICA Enterprise Server per
gestire la sicurezza e il bilanciamento del carico, e per sfruttare i server con
più processori per eseguire R per richiedere e/o validare le applicazioni
enterprise
Vedere il Manuale Elettronico per maggiori dettagli su questo linguaggio.
STATISTICA Guida di Riferimento – 245
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
REGISTRARE MACRO
(PROGRAMMI) IN STATISTICA
VISUAL BASIC (SVB)
Macro delle Analisi, Master (Log) Macro
e Macro da Tastiera
STATISTICA fornisce una selezione completa di funzionalità per la registrazione di
macro, cioè, di programmi in STATISTICA Visual Basic (SVB), da utilizzare per
automatizzare il lavoro ripetitivo o come base per la generazione automatica di
programmi da modificare in seguito. I programmi macro registrati attraverso
queste funzionalità possono essere salvati per essere eseguiti “così come sono”,
oppure per essere utilizzati come “blocchi” da integrare in applicativi in Visual
Basic più complessi e altamente personalizzati. Le Macro d’Analisi e le Master
Macro si basano sulla medesima sintassi e possono essere modificate
successivamente, ma considerate le diverse maniere in cui ognuna di queste viene
creata, presentano vantaggi e svantaggi specifici a seconda delle applicazioni.
Macro delle analisi. Le semplici Macro delle Analisi registrano automaticamente
impostazioni, selezioni ed opzioni scelte per una specifica analisi. Si noti che il
termine “analisi” in STATISTICA denota una qualsiasi operazione selezionata dalle
schede Statistiche, Data Mining o Grafici, che può essere molto piccola o semplice
(ad es., uno scatterplot richiesto dalla scheda Grafici), oppure molto elaborata (ad
es., una complessa analisi con modellazione di equazioni strutturali selezionata
scegliendo una particolare opzione dalla scheda Statistiche, e che coinvolge
centinaia di documenti di output). Dopo aver selezionato una qualsiasi opzione
dalle schede Statistiche, Data Mining o Grafici, tutte le azioni quali la selezione di
variabili, la modifica d’impostazioni, ecc., verranno registrate “dietro le quinte”; in
qualsiasi momento sarà possibile trasferire questa registrazione (cioè, il codice
Visual Basic relativo a questa macro) sulla finestra del Visual Basic Editor. Il
comando Crea Macro sarà disponibile in ogni finestra delle analisi tramite il menu
a cascata visualizzabile premendo il pulsante Opzioni o dal menu a scelta rapida
(accessibile con un clic col tasto destro del mouse sul pulsante d’analisi)ad analisi
minimizzata.
246 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Master macro (Log di Analisi Multiple). È possibile registrare una Master Macro
o un Master Log di un’intera sessione, che può consistere di una o molte analisi.
Questa registrazione “connetterà” le analisi eseguite attraverso diverse opzioni
delle schede Statistiche, Data Mining e/o Grafici. Tuttavia, diversamente da una
semplice Macro d’Analisi, sarà possibile sia interrompere che riprendere la
registrazione delle Master Macro. La registrazione di una Master Macro inizierà
con l’avvio della registrazione [selezionare la scheda Strumenti, premere Macro e
specificare Avvia Registrazione Log delle Analisi (Macro Master)], e terminerà
quando la registrazione verrà interrotta (premere Macro e selezionare Interrompi
Registrazione). Tra queste due azioni, risulteranno registrate tutte le operazioni di
selezione dei file e di gestione dei dati, così come le analisi e le selezioni di
procedure, nella medesima sequenza in cui queste sono state scelte.
Macro da tastiera. Questo tipo di registrazione di macro consente di archiviare
sequenze di input da tastiera. Quando si seleziona la scheda Strumenti, si preme
Macro e si specifica Avvia Registrazione Macro da Tastiera, STATISTICA registrerà le
battiture reali inserite con la tastiera. Quando si preme Interrompi Registrazione,
verrà aperta una finestra dell’editor di STATISTICA Visual Basic contenente un
semplice programma contenente un semplice comando SendKeys con i simboli che
rappresenteranno tutte le differenti battiture eseguite durante la sessione di
registrazione.
Editor di STATISTICA Visual Basic e Debug. I programmi possono essere riscritti
da capo usando l’ambiente di sviluppo professionale di STATISTICA Visual Basic,
che rappresenta un editor dotato di un potente strumento di debug (con punti
d’interruzione, ecc.) e molte funzionalità studiate per facilitare una costruzione
efficace del codice. Queste funzionalità vengono descritte in dettaglio nel Manuale
Elettronico di STATISTICA.
Quando si modificano i programmi macro digitando comandi in Visual Basic o
comandi specifici in SVB, l’editor visualizzerà degli aiuti anticipatori che
suggeriranno all’utente la sintassi appropriata. In linea verranno forniti aiuti su
membri e funzioni per ogni classe (oggetto) utilizzabile all’interno dei programmi.
STATISTICA Guida di Riferimento – 247
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Quando si esegue un programma, è possibile definire punti d’interruzione,
eseguire l’applicazione di linea in linea, ed osservare/modificare i valori delle
variabili del programma macro mano a mano che questo viene eseguito.
È disponibile inoltre una semplice interfaccia interattiva attraverso la quale
l’utente può costruire finestre interattive.
248 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Per riassumere, STATISTICA Visual Basic non è solo un potente linguaggio di
programmazione, ma rappresenta anche un ambiente di programmazione
professionale per lo sviluppo di semplici macro così come di complesse
applicazioni personalizzate.
Visual Basic da altre applicazioni. I programmi in SVB possono venire sviluppati
anche perfezionando i programmi in Visual Basic sviluppati in altre applicazioni (ad
es., Excel) richiamando semplicemente le funzioni e le procedure di STATISTICA.
Eseguire dei Programmi di
STATISTICA Visual Basic
I programmi di STATISTICA Visual Basic possono essere eseguiti dall’interno di
STATISTICA, ma poiché STATISTICA Visual Basic rispetta lo standard di
compatibilità, si possono anche eseguire da altri ambienti compatibili con Visual
Basic (ad es., Excel, Word o Visual Basic). Nella pratica, è possibile chiamare le
funzioni di STATISTICA da Visual Basic in un’altra applicazione. Si noti tuttavia, che
quando si esegue un programma di STATISTICA Visual Basic o si tenta di chiamare
le funzioni di STATISTICA da un’altra applicazione, tutte le chiamate alle specifiche
funzioni di STATISTICA (in contrapposizione alle funzioni generiche di Visual Basic)
saranno eseguite solamente nel caso le rispettive librerie di STATISTICA siano
correttamente installate nel computer dove si esegue il programma. Ovvero,
l’utente del programma creato deve possedere una regolare licenza relativa alle
librerie contenenti le relative procedure di STATISTICA. Si noti che questa enorme
libreria contenente le funzioni di STATISTICA (oltre 14.000 procedure) è accessibile
in maniera trasparente non solo da Visual Basic (sia quello integrato che quello
originale Microsoft), ma anche da qualunque altro linguaggio o ambiente di
programmazione compatibile, quali C/C++, Java o Delphi.
STATISTICA Guida di Riferimento – 249
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Livelli di prestazione dei programmi di STATISTICA Visual Basic. Mentre gli
ovvi vantaggi di Visual Basic (comparato ad altri linguaggi) sono la sua facilità d’uso
e la sua familiarità ad un grande numero di utenti di computer, il possibile
svantaggio dei programmi sviluppati in Visual Basic è che non hanno prestazioni
eccellenti sul piano della velocità di esecuzione come i programmi scritti con
linguaggi di programmazione di più basso livello (come C). Tuttavia, quel tipo di
potenziale problema non si registra nelle applicazioni di STATISTICA Visual Basic,
specialmente in quelle che si occupano principalmente di eseguire chiamate a
procedure analitiche, grafiche e di gestione dati di STATISTICA. Queste procedure
infatti sfruttano le tecnologie di ottimizzazione della velocità di STATISTICA e
possono essere eseguite a velocità comparabili con le stesse procedure chiamate
direttamente da STATISTICA.
Struttura di STATISTICA Visual Basic. STATISTICA Visual Basic consiste di due
componenti principali: 1) L’ambiente generale di programmazione di Visual Basic
contenente funzionalità ed estensioni per la progettazione d’interfacce utente
(finestre di dialogo) e la gestione dei file, e 2) le librerie di STATISTICA contenenti
centinaia di funzioni che consentono l’accesso a praticamente tutte le funzionalità
di STATISTICA.
L’ambiente di programmazione di Visual Basic segue le convenzioni di sintassi
industriale standard del Linguaggio di Microsoft Visual Basic; sono presenti solo
poche differenze che riguardano principalmente la maniera in cui le finestre
vengono create (si vedano le sezioni Finestre di Dialogo Personalizzate ed
Interfacce Utente Personalizzate disponibili nel Manuale Elettronico di STATISTICA)
e progettate per offrire ai programmatori/sviluppatori una maggiore flessibilità nel
modo in cui le interfacce vengono gestite in programmi complessi. Nell’ambiente
di programmazione di SVB, le finestre di dialogo possono essere interamente
gestite dall’interno di sottorountine separate, che possono venire flessibilmente
combinate in più grandi programmi a finestre multiple; MS Visual Basic è basato su
forme, dove le forme o finestre di dialogo, e tutti gli eventi che in esse si
verificano, vengono gestiti in unità separate di programma.
250 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Allegare le Macro alle Barre degli
Strumenti ed ai Menu
Un programma in STATISTICA Visual Basic può venire salvato e quindi allegato ad
un menu classico/barra degli strumenti oppure alla barra di Accesso Rapido nella
barra degli strumenti. Questa possibilità consentirà all’utente di personalizzare ed
estendere facilmente l’operatività e l’aspetto di STATISTICA attraverso le proprie
macro personalizzate. Per sfruttare queste funzionalità, si salvi la macro
selezionando Salva Come Macro Globale dal menu File. Quindi, per personalizzare
i menu/ole barre degli strumenti, si selezioni Personalizza dal menu Strumenti per
visualizzare la finestra di dialogo Personalizza. Per aggiungere la macro al menu o
alla barra degli strumenti, si scelga la scheda Comandi/Macro, e si selezioni Macro
dalla lista Categorie. Tutte le proprie macro globali saranno elencate all’interno del
riquadro Comandi presente in questa scheda.
È quindi possibile selezionare e trascinare l’elemento specifico dalla lista dei
Comandi all’interno di un qualsiasi menu o barra degli strumenti. Si noti che nel
momento in cui il puntatore del mouse passerà sopra un menu, il menu verrà
espanso, consentendo in questo modo all’utente d’inserire l’elemento in un
qualsiasi sottomenu. Una volta posizionata la macro nel menu o all’interno della
barra degli strumenti, quando ancora la finestra Personalizza è aperta, sarà
possibile fare un clic col tasto destro del mouse su di essa per modificarne
l’aspetto ed il testo.
STATISTICA Guida di Riferimento – 251
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Eseguire Macro da una riga di comando. Con STATISTICA, è possibile eseguire
programmi SVB attraverso una riga di commando usando il parametro
/RunMacro=. La sintassi è la seguente:
statist.exe /RunMacro=macroname
in cui “macroname” è il nome del file della macro. Se non viene specificato un
percorso completo, STATISTICA tenterà di eseguire la macro dalla directory
contenente l’applicazione d’interesse.
Se la macro non rende visibile l’applicazione o qualsiasi altro documento
(attraverso Application.Visible = True, o altre simili proprietà di documento),
l’istanza di STATISTICA verrà automaticamente spenta una volta completata. Se
l’applicazione è resa visibile, l’applicazione rimarrà visibile dopo il completamento
della macro, e quindi sarà necessario spegnere il programma.
ESEMPIO: REGISTRARE
UN’ANALISI
Questo esempio illustra come inviare la registrazione di un’analisi in uno script da
poter eseguire per riprodurre l’analisi. Successivamente lo script verrà modificato
e combinato con un altro script allo scopo di creare uno script personalizzato in
grado di eseguire le analisi richieste. Inoltre, questo esempio illustrerà come
utilizzare gli script allegati per aggiornare automaticamente e ri-eseguire le analisi
a partire da registri dei risultati.
Si inizi aprendo il dataset d’esempio Adstudy. Si selezioni la scheda Home, si prema
la freccia Apri e si specifichi Apri Esempi per visualizzare la finestra di dialogo Apri
un File Dati di STATISTICA. Si faccia un doppio clic sulla directory Datasets, e
quindi si apra il dataset di STATISTICA Adstudy.sta.
Quindi, si selezioni la scheda Statistiche. All’interno del gruppo Base, si prema
Statistiche di Base per visualizzare il Pannello d’Avvio Statistiche di Base e Tabelle.
Infine si selezioni Statistiche descrittive.
252 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Si prema il pulsante OK per visualizzare la finestra Statistiche Descrittive.
Si prema il pulsante Variabili per visualizzare la finestra Selezionare le variabili per
le analisi. Si selezioni da MEASURE01 a MEASURE23 e quindi si faccia un clic su OK.
All’interno della finestra Statistiche Descrittive, si selezioni la scheda Avanzate e si
osservino le numerose opzioni disponibili.
STATISTICA Guida di Riferimento – 253
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
In questo esempio saranno usate le impostazioni di default. Si prema il pulsante
Riepilogo per visualizzare le statistiche descrittive relative alle variabili selezionate.
Una volta prodotto il registro dei risultati, la finestra Statistiche Descrittive viene
automaticamente minimizzata in modo da consentire la visualizzazione dei
risultati. Per archiviare la finestra, si faccia un clic sul pulsante Statistiche
Descrittive sulla Barra delle Analisi presente nel lato inferiore sinistro.
Mentre si esegue questa analisi, STATISTICA registra automaticamente dietro alle
quinte tutti i passaggi compiuti. Adesso sarà infatti possibile produrre una macro in
STATISTICA Visual Basic (SVB) da utilizzare per ri-creare questa analisi. Nella
finestra di dialogo Statistiche Descrittive, si faccia clic sul pulsante
, e si
selezioni Crea Macro dal menu a scelta rapida. A questo punto verrà visualizzata la
finestra di dialogo Nuova Macro, in cui poter specificare il nome della macro ed
inserire una descrizione. Si adottino tutte le impostazioni predefinite e si prema
254 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
OK. Verrà visualizzata una finestra contenente una macro SVB relativa alla sessione
di Statistiche Descrittive registrata.
Per eseguire questa macro, si selezioni la scheda Debug e, nel gruppo Esegui,
premere Esegui (oppure si prema F5 sulla tastiera). I risultati esatti delle Statistiche
Descrittive generati nella fase iniziale dell’analisi verranno quindi riprodotti.
Si osservi la macro SVB per un momento. Sulla parte alta sarà presente la riga:
Set newanalysis = Analysis (scBasicStatistics, ActiveInputDataSet)
Questo comando dice che la macro eseguirà un’analisi di Statistiche di Base, e che
verrà utilizzato il file dati attivo, ovvero sia lo spreadsheet correntemente
selezionato al momento dell’esecuzione della macro.
Alcune righe sotto sarà presente una sezione che inizia con:
Dim oAD2 As STABasicStatistics.BasDescriptiveStatistics
e a seguire proprietà come:
.PairwiseDeletionOfMD = True
STATISTICA Guida di Riferimento – 255
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Queste proprietà corrispondono a tutte le opzioni originariamente disponibili sulle
differenti schede della finestra di dialogo Statistiche Descrittive. Ogni opzione
presente in questa finestra sarà rappresentata da una proprietà, che ricondurrà a
tutte le impostazioni correnti registrate. Se si decide d’includere una Mediana e/o
una Somma per ognuna delle variabili, è semplice abilitare la macro SVB perché
questi statistiche vengano incluse nell’analisi riprodotta; occorre solo trovare le
righe giuste:
.Median = False
e
.Sum = False
e modificarle nel seguente modo:
.Median = True
e
.Sum = True
Adesso, si esegua la macro ancora una volta premendo F5. A questo punto al
registro verrà aggiunto un nuovo spreadsheet dei risultati, questa volta
contenente due nuove colonne (Mediana e Somma):
Si lasci aperta la finestra della macro e si lanci una nuova analisi sullo stesso
insieme di dati. Si selezioni lo spreadsheet Adstudy per riportarlo in cima a tutte le
altre finestre. Si selezioni la scheda Grafici e, nel gruppo Altri, premere su 2D. Si
specifichi Normal Probability Plot per visualizzare l’omonima finestra.
256 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Si prema il pulsante Variabili, e nella finestra Selezionare Variabili per Probability
Plot, si selezionino le variabili da MEASURE01 a MEASURE03. Si prema OK per
chiudere questa finestra di dialogo, e si faccia un clic su OK all’interno della
finestra Normal Probability Plot. A questo punto all’interno del registro dei
risultati saranno inseriti i grafici Probability Plot, uno per ognuna delle tre variabili
selezionate.
I passaggi dell’analisi Probability Plot saranno registrati così come per l’analisi
Statistiche Descrittive. Per creare una nuova macro relativa a tali passaggi, si
richiami in primo piano la finestra di dialogo Normal Probability Plot, e si prema il
pulsante
, selezionando poi Crea Macro dal menu a cascata. Nella
finestra di dialogo Nuova Macro, si faccia clic su OK. In questo modo verrà
prodotta una nuova finestra di SVB Macro contenente lo script registrato per il
Probability Plot.
STATISTICA Guida di Riferimento – 257
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Come con l’analisi di Statistiche Descrittive, tutte le opzioni selezionate nella
finestra di dialogo Probability Plot vengono specificate come proprietà della
macro. Ad esempio, per passare da un Normal Probability Plot ad un Half Normal
Probability Plot, occorre individuare la riga seguente:
.GraphType = scProbNormal
e modificarla in:
.GraphType = scProbHalfNormal
Inoltre, si supponga che si desideri includere anche la variabile MEASURE04. Per
fare ciò, si trovi la seguente riga:
.Variables = "3-5"
Questa riga corrisponde alle variabili selezionate per i grafici. Dato che sono state
selezionate da MEASURE01 a MEASURE03, questa stringa è stata registrata come
da 3 a 5 (i corrispondenti numeri di variabile). Per aggiungere la variabile
MESURE04 (variabile numero 6), si modifichi la riga nel seguente modo:
.Variables = 3-6
Adesso si esegua la macro premendo il pulsante F5. Quattro nuovi grafici verranno
prodotti in forma di Half Normal Probability Plots relativi alle variabili da
MEASURE01 a MEASURE04.
258 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
In questo esempio sono state illustrate le modalità di esecuzione di una qualsiasi
analisi, nonché di creazione della relativa macro da modificare e rieseguire. Inoltre,
in questo esempio si è dimostrato come queste macro possano essere combinate
per sviluppare macro ancora più complesse.
Rieseguire le Analisi dai
Registri dei Risultati
Nell’esempio precedente, si è appreso come per tutte le analisi eseguite in
STATISTICA vengono registrati tutti i passaggi usati per produrle, e come queste
possano venire caricate in una macro da poter modificare ed eseguire
successivamente. Quando un’analisi produce risultati raccolti in un registro,
STATISTICA associa automaticamente i passaggi registrati alla particolare cartella di
registro contenente i risultati. Ciò consentirà all’utente di poter rieseguire o
ripristinare un’analisi.
In precedenza, sono state prodotte istanze multiple di Statistiche Descrittive e di
Probability Plots. Il registro dei risultati apparirà simile a quello riportato nella
seguente illustrazione.
Si noti la presenza di una freccia rossa in corrispondenza di ogni cartella del
registro. Questo è un indicatore del fatto che lo script sulla base del quale sono
stati prodotti i risultati inviati nella cartella è stato allegato alla cartella stessa. Ciò
abiliterà STATISTICA alla riesecuzione ed al ripristino dell’analisi.
Per rieseguire un’analisi, si faccia un clic sul tasto destro del mouse in
corrispondenza di una delle cartelle etichettate con Finestra dialogo Statistiche
STATISTICA Guida di Riferimento – 259
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Descrittive, e dal menu a scelta rapida, si selezioni Ri-esegui Analisi. A questo
punto verrà visualizzata la finestra Ri-esegui Analisi.
Da qui sarà possibile scegliere Usa sorgente di dati originale oppure Usa nuova
sorgente di dati. Quest’ultima opzione da la possibilità di creare “template” da
poter poi applicare a nuove sorgenti di dati. Oltre alla possibilità di specificare la
sorgente di dati, sarà possibile scegliere Sostituisci contenuti correnti di cartella
oppure Output in nuova cartella. In questo esempio, si adottino le impostazioni
predefinite, e quindi si faccia clic su OK. Sarà possibile verificare come i contenuti
della cartella vengano brevemente eliminati per poi essere aggiunti di nuovo una
volta rieseguita l’analisi.
Uno degli obiettivi che giustifica l’implementazione di tale funzionalità è la
possibilità di aggiornare/rieseguire i risultati prodotti da analisi complesse nel caso
in cui nello spreadsheet siano stati inseriti nuovi dati. Ad esempio, se i dati
contenuti in Adstudy.sta vengono soggetti a modifiche e l’analisi viene rieseguita, i
nuovi risultati saranno ricalcolati sulla base dei nuovi dati.
La funzionalità di ripristino dell’analisi consente all’utente di richiamare l’analisi al
punto immediatamente precedente alla generazione dei risultati, consentendo in
questo modo di selezionare differenti opzioni o di proseguire un’analisi in corso. Si
faccia un clic col tasto destro del mouse sulla stessa cartella Finestra dialogo
Statistiche Descrittive, e dal menu a scelta rapida, si selezioni Ripristina Analisi. A
questo punto verrà visualizzata la finestra di dialogo Ripristina Analisi. Questa
finestra conterrà le opzioni per la specificazione della sorgente di dati di input
(originale o nuova). Le opzioni di Output relative ai nuovi risultati sono Output su
cartella corrente (se si desidera avere un’estensione dell’analisi precedente)
oppure Output in nuova cartella (se si desidera iniziare una nuova analisi).
260 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Si adottino le impostazioni predefinite così come sono, e quindi si faccia clic su OK.
Verrà visualizzata la finestra di dialogo Statistiche Descrittive, contenente tutte le
opzioni definite immediatamente prima di produrre l’output selezionato. Dato che
le impostazioni predefinite prevedono d’inviare l’Output su cartella corrente,
premendo il pulsante Riepilogo sarà possibile generare il nuovo output all’interno
della stessa cartella.
OGGETTI E
DOCUMENTI ACTIVEX
(UNA NOTA TECNICA)
Il termine ActiveX è usato in contesti differenti e le sue definizioni sottolineano
aspetti differenti di quel concetto. Il suo uso in STATISTICA, tuttavia, può essere
raggruppato in due categorie generali: oggetti ActiveX e documenti ActiveX.
Oggetti ActiveX. Un oggetto ActiveX è quello che una volta veniva riferito come
un oggetto OLE (Object Linking and Embedding). Il cuore di questi oggetti è la
tecnologia Microsoft COM (Component Object Model) che consente loro di essere
accessibili in maniera uniforme. Attraverso l’uso dei protocolli standard, oggetti
creati in un’applicazione possono essere caricati e modificati da un’applicazione
differente. Per supportare questa funzionalità, l’oggetto contenitore deve essere
un oggetto ActiveX client mentre l’applicazione che ha creato inizialmente
l’oggetto deve essere un oggetto ActiveX server. STATISTICA svolge entrambe le
funzioni. Come oggetto ActiveX client, STATISTICA consente di incorporare nei suoi
spreadsheet, grafici e report oggetti creati da altre applicazioni. Come oggetto
ActiveX server, consente di inserire e collegare spreadsheet e grafici in altre
applicazioni.
STATISTICA Guida di Riferimento – 261
Copyright © StatSoft, 2011
Capitolo 8: STATISTICA Visual Basic
Documenti ActiveX. I documenti ActiveX portano i controlli ActiveX un passo in
avanti, consentendo a documenti interi di essere incorporati in altre applicazioni.
Un documento ActiveX contenitore permette a documenti di altre applicazioni di
essere usati al proprio interno, mentre un documento ActiveX server permette che
i propri documenti vengano usati in altri documenti ActiveX contenitori. Ancora
una volta, STATISTICA svolge entrambe le funzioni. I registri di STATISTICA sono
documenti ActiveX contenitori e consentono ad altri documenti ActiveX server di
essere visualizzati al proprio interno. Esempi di questo sono Word ed Excel; questi
documenti possono essere usati direttamente da un registro di STATISTICA. Allo
stesso modo, gli spreadsheet, i grafici e i report di STATISTICA sono documenti
ActiveX server e possono essere piazzati in altri documenti ActiveX contenitori
come Microsoft Internet Explorer e Microsoft Binder.
Integrazione con Office e documenti ActiveX. La tecnologia alla base dei
documenti ActiveX ha applicazioni speciali se utilizzata con i documenti Word ed
Excel. L’utente di STATISTICA potrà aprire questi particolari documenti nel loro
particolare formato direttamente all’interno dello spazio di lavoro di STATISTICA.
Questa “integrazione con Office” consente di utilizzare i documenti Excel come
sorgenti di dati, ed i documenti Word come report delle analisi. Quando i
documenti vengono aperti in una finestra di STATISTICA, diverranno disponibili i
menu e le barre degli strumenti appropriati di Word/Excel.
262 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
9
CAPITOLO
STATISTICA
QUERY
Panoramica .......................................................................................... 265
Istruzioni Rapide, Passo-Passo ........................................................... 266
Elaborazione In-Loco di Dati su Server Remoti
(L’Opzione Tecnologica IDP) ......................................................... 267
Cubi OLAP ............................................................................................. 268
File di Database di Grandi Dimensioni ............................................... 269
STATISTICA Guida di Riferimento –263
Copyright © StatSoft, 2011
264 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
9
CAPITOLO
STATISTICA
QUERY
Nota: Per una spiegazione di tutti i termini tecnici che verranno usati in questa
panoramica (ad es., ODBC, SQL, OLAP, ecc.), si faccia riferimento al glossario del
Manuale Elettronico di STATISTICA, accessibile premendo Aiuti sull’omonima
scheda, nel gruppo Aiuti.
Questo capitolo comprende una breve introduzione a STATISTICA Query, uno
strumento flessibile per accedere a dati da database esterni. Include inoltre delle
informazioni sul recupero dei dati da provider Cubo OLAP quali MS OLE DB
Provider for Analysis Services or SAP Business Warehouse MDX.
PANORAMICA
STATISTICA Query è utilizzato per accedere facilmente a dati da diverse tipologie di
database (inclusi sistemi complessi di database quali Oracle, MS SQL Server,
Sybase, ecc.) usando le convenzioni OLE DB di Microsoft. OLE DB è una potente
tecnologia per l’accesso ai dati che consente l’integrazione universale dei dati
contenuti in un sistema di rete d’impresa, anche da mainframe a computer da
scrivania, indipendentemente dal tipo di dati. OLE DB offre una strategia di accesso
ai dati più generalizzata ed efficiente rispetto alle più vecchie convenzioni ODBC
poiché consente l’accesso a più tipi di dati ed è basato sulle tecniche COM
(Component Object Model).
STATISTICA Query supporta tabelle di database multiple; possono essere
selezionate registrazioni specifiche (righe di tabelle) inserendo comandi SQL, che
STATISTICA Query costruisce automaticamente permettendo all’utente di
STATISTICA Guida di Riferimento –265
Copyright © StatSoft, 2011
Capitolo 9: STATISTICA Query
selezionare i componenti della query attraverso un’interfaccia grafica semplice e/o
menu di opzioni e finestre di dialogo intuitive. Perciò, non è necessaria una
conoscenza dettagliata di SQL per creare query sofisticate in modo semplice e
rapido. Possono anche essere generate query multiple basate su uno o più
database differenti per ritornare dati ad un unico spreadsheet ed è possibile
mantenere simultaneamente connessioni a database esterni multipli.
STATISTICA QUERY: ISTRUZIONI
RAPIDE, PASSO-PASSO
I passi necessari per recuperare dati esterni tramite STATISTICA Query sono
riportati di seguito:
1. Selezionare la scheda Home. Nel gruppo File, fare clic sulla freccia Apri.
Specificare Carica Dati Esterni - Crea Query per visualizzare la finestra
Connessione a Database. (È possibile accedervi anche tramite la scheda
Dati. Nel gruppo Gestisci, fare clic su Dati Esterni e selezionare Crea Query
per visualizzare la finestra Connessione a Database.) In questa finestra, si
selezioni una connessione ad un database predefinito (il provider, la
posizione della sorgente dati e le impostazioni avanzate del server o della
cartella in cui risiede il database).
Si noti che se non è già stata creata la connessione a database, è necessario
ciccare sul pulsante Nuova della finestra Connessione a Database. Apparirà
quindi Proprietà di Data Link che guiderà l’utente nella creazione di una
connessione ad un database. Per una documentazione specifica, quando è
attiva la finestra Proprietà di Data Link, si prema il tasto F1 della tastiera per
visualizzare il Microsoft Data Link Help®.
2. Dopo aver selezionato una connessione ad un database e dopo aver fatto
clic sul pulsante OK della finestra Proprietà di Data Link, si accederà a
STATISTICA Query in cui si potranno creare i comandi SQL specificando le
tabelle desiderate, i campi, i join (“relazioni”), i criteri, ecc. (tramite i menu
Tabella, Join e Criteri) da includere nella query.
266 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 9: STATISTICA Query
3. Una volta specificata una query, si selezioni Ritorna Dati a STATISTICA dal
menu File. Verrà visualizzata la finestra Restituzione di Dati Esterni in uno
Spreadsheet in cui si potrà specificare il nome della query, dove si vuole che
vengano messi i dati recuperati da STATISTICA Query e opzioni aggiuntive.
Si veda il Manuale Elettronico per ulteriori dettagli.
ELABORAZIONE IN-LOCO DI DATI
SU SERVER REMOTI
(L’OPZIONE TECNOLOGICA IDP)
Le opzioni relative alla creazioni di query (descritte nella sezione precedente),
quando offerte come parte della versioni enterprise di STATISTICA (cfr. Sistemi di
SISTEMI DI STATISTICA Enterprise, pag. 302), sono ulteriormente migliorate da
opzioni che permettono di operare con i dati di server remoti “in loco,” ovvero,
senza dover importare i dati e creare un file di dati locale. Questa tecnologia
Elaborazione Database In Loco (IDP)è particolarmente utile per elaborare file di
STATISTICA Guida di Riferimento – 267
Copyright © StatSoft, 2011
Capitolo 9: STATISTICA Query
dati estremamente grandi poiché migliora le prestazioni in modo significativo e
permette agli utenti di STATISTICA di elaborare i file dati che eccedono la capacità
di memoria fisica disponibile in locale o anche di STATISTICA Enterprise Server.
Nota tecnica. La tecnologia ITD è basata su un’architettura di elaborazione
distribuita, dove le query vengono eseguite sul lato server (usando le risorse CPU
del server) ed i rispettivi record inviati al computer in cui è installato STATISTICA
dove questi sono eseguiti (asincronicamente) simultaneamente mano a mano che
sono disponibili.
CUBI OLAP
OLAP (On-Line Analytic Processing) è un termine generico per indicare un sistema
che fornisce un accesso efficiente a dati riassuntivi di database molto grandi. A
differenza dei normali database relazionali, che organizzano i dati in tabelle a due
dimensioni ben definite, un data warehouse OLAP rappresenta i dati in insiemi
multi-dimensionali a più livelli di dettaglio, meglio noti come “cubi”. Quando un
utente STATISTICA desidera eseguire un’analisi sui dati provenienti da un Cubo
OLAP, tali dati devono essere ridotti alla forma bidimensionale – casi e variabili –
per poter essere rappresentati in uno spreadsheet di STATISTICA. STATISTICA
Query fornisce un’interfaccia grafica basata sul drag-and-drop per specificare le
dimensioni e i livelli di dettaglio che saranno estratti dal cubo per alimentare la
query. La modalità “MDX” (Multi-Dimensional eXpressions) viene attivata
automaticamente quando è selezionata una sorgente di dati OLAP.
I clienti che richiedono l’integrazione OLAP dispongono solitamente di database
sofisticati e, di conseguenza, di un supporto tecnico interno per l’assistenza
durante la progettazione di queste query. Dato che le impostazioni delle
dimensioni di un cubo OLAP sono determinate dagli amministratori dei database
stessi, StatSoft può fornire assistenza limitata in questo settore.
268 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 9: STATISTICA Query
FILE DI DATABASE DI GRANDI
DIMENSIONI
I prodotti di STATISTICA sono stati progettati per le analisi su vasta scala; di
conseguenza, si integrano bene con i sistemi di database creati per gestire grandi
quantità di dati, quali Teradata, ecc. Ad esempio, STATISTICA può sia estrarre da
Teradata i dati per le analisi, che ottenere i risultati direttamente all’interno di
Teradata, tramite il codice di deployment creato da STATISTICA Data Miner e
applicato a Teradata stesso con una funzione definita dall’utente. In quest ultimo
caso l’elaborazione di grandi quantità di dati viene accelerata significativamente.
STATISTICA Guida di Riferimento – 269
Copyright © StatSoft, 2011
Capitolo 9: STATISTICA Query
270 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
10
CAPITOLO
PROGRAMMARE
STATISTICA
DA .NET
Aggiungere la Libreria degli Oggetti di STATISTICA nel Proprio
Progetto di .NET.............................................................................. 273
Creare Manualmente la Libreria COM Interop ................................... 275
Sostenere Più Versioni di STATISTICA ................................................ 275
Istanziare STATISTICA.......................................................................... 276
La Versione delle Libreria di STATISTICA............................................ 276
STATISTICA Guida di Riferimento –271
Copyright © StatSoft, 2011
272 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
10
CAPITOLO
PROGRAMMARE
STATISTICA DA .NET
Pressoché ogni aspetto di STATISTICA è esposto come insieme d’interfacce COM
registrate su una macchina al momento dell’installazione di STATISTICA. Dato che i
linguaggi basati su .NET non possono comunicare direttamente con COM, una
classe wrapper chiamata COM Interop potrà essere utilizzata per integrare le
librerie di STATISTICA nel proprio progetto .NET. Lo strato COM Interop viene
creato automaticamente da Visual Studio .NET IDE quando l’utente importa
un’interfaccia COM. Lo strato COM Interop gestisce tutti i dettagli relativi
all’interazione con le librerie COM disponibili in .NET. Con lo strato COM Interop in
loco, le interfaccia STATISTICA COM si comportano come qualsiasi altro oggetto
.NET.
Aggiungere la Libreria
degli Oggetti di STATISTICA
nel Proprio Progetto di .NET
Lo strato .NET Interop viene creato automaticamente tramite l’aggiunta delle
interfacce COM di STATISTICA desiderate nel proprio progetto .NET. Per
aggiungere la Libreria ad Oggetti di STATISTICA in un progetto .NET, occorre prima
selezionare il progetto .NET all’interno del Solution Explorer, e quindi selezionare
Add References dal menu a scelta rapida (accessibile premendo il tasto destro del
mouse sul progetto .NET d’interesse).
STATISTICA Guida di Riferimento –273
Copyright © StatSoft, 2011
Capitolo 10: Programmare da .NET
Apparirà quindi la finestra Add Reference. Al suo interno si selezioni la scheda
COM. Nella lista Component Name, si evidenzi STATISTICA Object Library, e si
prema OK.
A questo punto, la libreria COM Interop verrà creata automaticamente. Sotto il
nodo di progetto References, si potrà osservare la voce STATISTICA.
Il file Interop.STATISTICA.dll sarà quindi aggiunto nella directory di output del
progetto. La libreria STATISTICA COM Interop verrà quindi archiviata in questo file.
Per visualizzare la libreria ad oggetti di STATISTICA dal proprio progetto .NET, si
faccia un clic sul riferimento STATISTICA, e dal menu a scelta rapida, si selezioni
View in Object Browser.
274 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 10: Programmare da .NET
Creare Manualmente la
Libreria COM Interop
È inoltre possibile creare la libreria COM Interop manualmente ed imporla nel
proprio progetto .NET. Ciò darà la possibilità di specificare un nome differente per
Interop DLL così come di definire uno namespace personalizzato. Il programma che
consente all’utente di creare un Interop è TLBIMP.EXE. Dal prompt dei comandi di
Visual Studio, si esegua TLBIMP con un parametro iniziale relativo al particolare
type library source. Nell’esempio riportato sotto, sono specificati inoltre il nome ed
il namespace della DLL di output.
In questo esempio, è stato referenziato il file STATIST.EXE dato che l’eseguibile
contiene la libreria di tipo STATISTICA Object Library. Una volta generata la DLL
Interop, sarà possibile aggiungerla nel proprio progetto .NET selezionando Add
Reference dal Solution Explorer come prima, ma questa volta si prema il pulsante
Browse per selezionare la DLL Interop appena creata.
Sostenere Più Versioni
di STATISTICA
Per sostenere più versioni di STATISTICA, è necessario conservare le DLL Interop di
STATISTICA Object Library per ogni versione di STATISTICA che si desidera
STATISTICA Guida di Riferimento – 275
Copyright © StatSoft, 2011
Capitolo 10: Programmare da .NET
supportare. È possibile usare il comando TLBIMP per generare le DLL Interop
rispetto a specifiche versioni di STATIST.EXE ed altre DLL. Se l’applicazione deve
essere distribuita, assicurarsi circa la correttezza della versione della DLL Interop di
STATISTICA sviluppata con la propria applicazione .NET.
Istanziare STATISTICA
Data la sua architettura COM, STATISTICA potrà essere incorporato in diversi
ambienti di sviluppo. Quando si usa STATISTICA da un ambiente di sviluppo
esterno, è necessario disporre di un oggetto di alto livello che richiami l’oggetto
applicazione. L’oggetto applicazione è l’applicazione stessa e conterrà altri oggetti
(quali ad esempio, spreadsheet e grafici). L’accesso a questi altri oggetti sarà
tuttavia limitato nel caso in cui l’oggetto applicazione non sia in esecuzione.
Assumendo che si stia utilizzando lo spazio dei nomi predefinito di STATISTICA,
l’interfaccia dovrà dichiarare la variabile così come è presente in
STATISTICA.Application. Per creare un’istanza di STATISTICA, s’imposti la variabile
pari a new STATISTICA.ApplicationClass().
STATISTICA.Application pApp = (STATISTICA.Application)
new STATISTICA.ApplicationClass();
pApp.Visible = true;
Quando viene creata un’istanze di STATISTICA.ApplicationClass, verrà lanciato un
processo di tipo STATIST.EXE. Ciò è equivalente a lanciare STATISTICA dal menu
Start. L’istanza di STATISTICA viene inizialmente nascosta ma potrà essere resa
visibile. Dato che si tratta di un processo separato, tutte le chiamate a tale istanze
saranno eseguire fuori dal processo.
La Versione della Libreria
di STATISTICA
Oltre all’oggetto STATISTICA.Application, vi è anche una versione più leggera e
performante dell’oggetto chiamato STATISTICA.Library. La versione della Library
viene licenziata separatamente e quindi potrebbe non essere disponibile con la
propria installazione. Essa contiene interfacce identiche a quelle della libreria
276 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Capitolo 10: Programmare da .NET
STATISTICA.Application. Qualsiasi codice esistente in cui venga utilizzato l’oggetto
Application può essere sostituito con l’oggetto Library.
La principale restrizione è che le funzionalità dell’interfaccia utente di STATISTICA
non saranno disponibili dalla versione Library. Quindi, nell’esempio precedente, se
l’oggetto Application è stato insaziato come nuova STATISTICA.LibraryClass, potrà
non essere possibile rendere visibile l’oggetto (e mostrare l’interfaccia di
STATISTICA).
La versione della Library di STATISTICA viene caricata in-processo, il che significa
che l’accesso alle relative interfacce COM sarà più conveniente che usare la
versione di Application dell’oggetto (che è caricato fuori-processo). Dato che
questa versione viene caricata in-processo, versioni multiple della libreria non
potranno essere istanziate. Normalmente, si vorrà istanziare solo l’oggetto Library
od un oggetto Application del proprio programma.
STATISTICA Guida di Riferimento – 277
Copyright © StatSoft, 2011
Capitolo 10: Programmare da .NET
278 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
A
APPENDICE
OTTENERE
PIÙ AIUTI
Manuale Elettronico – Più di 100 Megabyte di
Riferimenti, Illustrazioni ed Esempi ................................................ 281
Ulteriori Risorse e Servizi di Assistenza Tecnica ............................... 282
STATISTICA Guida di Riferimento –279
Copyright © StatSoft, 2011
CHAPTER 10: PROGRAMMING FROM .NET
280 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
A
APPENDICE
OTTENERE PIÙ AIUTI
Manuale Elettronico
Lo strumento migliore per ottenere assistenza
e per accedere ad una grande quantità di
informazioni su STATISTICA, è il Manuale
Elettronico (Aiuti), che contiene più di 100
Megabyte di riferimenti, illustrazioni, ed
esempi.
Per accedere agli Aiuti di STATISTICA,
selezionare la scheda Aiuti. Nel gruppo Aiuti,
premere Aiuti. È possibile inoltre fare clic sul
pulsante posto nell’angolo in alto a destra
di ogni finestra, per accedere alle descrizioni
delle opzioni presenti.
Questo documento ipertestuale offre molto
più di una semplice spiegazione relativa alle
opzioni di STATISTICA. Include numerosi
esempi, panoramiche ed illustrazioni con
migliaia di suggerimenti su come ottimizzare il
lavoro.
STATISTICA Guida di Riferimento –281
Copyright © StatSoft, 2011
Appendice A: Ottenere Più Aiuti
Ulteriori Risorse e
Servizi di Assistenza
Tecnica
Il Manuale Elettronico di STATISTICA è
estremamente completo, in quanto offre un
Suggeritore Statistico (un consulente
statistico, cfr. pag. 35) affiancato dalle
complete guide di StatSoft contenute
nell’Electronic Statistics Textbook (nel sito
web) e nel Glossario.
L’Electronic Statistics Textbook di StatSoft,
situato nel sito Web della compagnia
(StatSoft.com), è stato raccomandato
dall’Encyclopedia Britannica per la sua
“Qualità, Accuratezza, Presentazione e Facilità
d’Uso.”
Questo manuale unico è stato usato per molti
anni nelle attività educative e di ricerca nelle
università e nelle organizzazioni mondiali di
ricerca.
Risorse del sito web. Il sito
web di StatSoft, uno degli
indirizzi Internet più visitati in
relazione all’analisi dei dati,
non offre solamente la
possibilità di accedere a molte
risorse utili nell’analisi statistica
in generale, ma include anche:
• Una sezione Frequently Asked
Questions (domande frequenti)
periodicamente aggiornata, e
• Un’area download dove gli
utenti delle versioni correnti
dei prodotti STATISTICA
possono scaricare
aggiornamenti del loro
software. StatSoft lavora costantemente per
migliorare la compatibilità di STATISTICA con
altre applicazioni che violano le convenzioni
standard. Perciò, in molte circostanze,
scaricare un aggiornamento può essere d’aiuto
quando il problema rilevato è causato da
configurazioni particolari del sistema o da
conflitti con altre applicazioni.
Assistenza tecnica via email. Se le
problematiche non sono state risolte
consultando il sito Web, è possibile inviare una
email a StatSoft. Si ricordi di includere sempre
il numero di serie del prodotto (in STATISTICA,
selezionare la scheda Aiuti e, nel gruppo Info,
premere STATISTICA per visualizzare il numero
di serie ) e tutte le informazioni relative al
proprio hardware [il tipo di processore (CPU) e
la quantità di memoria (RAM) e lo spazio sul
disco fisso] e la versione del sistema operativo
in uso.
282 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Appendice A: Ottenere Più Aiuti
Inviate le vostre richieste di assistenza a
[email protected].
Assistenza tecnica telefonica. È possibile
inoltre contattare telefonicamente l’ufficio
StatSoft al numero 0498934654 (l’orario di
apertura va dalle 9:00 alle 18:00, da Lunedì a
Venerdì).
È possibile visualizzare le informazioni relative
a tutti gli uffici StatSoft nel mondo, facendo
clic su STATISTICA sulla scheda Aiuti nel
gruppo Info. Selezionare la scheda Uffici
Internazionali nella finestra Info su
STATISTICA.
Anche per il supporto tecnico telefonico si
richiede che gli utenti forniscano il numero di
serie del prodotto (in STATISTICA, selezionare
la scheda Aiuti e, nel gruppo Info, premere
STATISTICA per visualizzare il numero di serie )
e tutte le informazioni relative al proprio
hardware [il tipo di processore (CPU), la
quantità di memoria (RAM) e lo spazio sul
disco fisso] e la versione del sistema operativo
in uso.
STATISTICA Guda di Riferimento – 283
Copyright © StatSoft, 2011
Appendice A: Ottenere Più Aiuti
284 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
B
APPENDICE
STATISTICA ENTERPRISE
SERVER
Panoramica Generale .......................................................................... 287
Un’Ampia Scelta di Configurazioni e Funzionalità Analitiche........... 288
Funzionalità e Applicazioni: I Vantaggi di
STATISTICA Enterprise Server ......................................................... 288
Vantaggi della Tecnologia Multithreading ......................................... 289
Interfaccia Utente di STATISTICA Enterprise Server.......................... 290
Compatibilità con gli Standard Industriali ......................................... 293
Architettura del Sistema (Una Nota Tecnica)..................................... 294
Vantaggi Competitivi ........................................................................... 295
Knowledge Portal ................................................................................. 295
Filmato Dimostrativo di STATISTICA Enterprise Server ..................... 295
STATISTICA Guida di Riferimento – 285
Copyright © StatSoft, 2011
Appendice A: Ottenere Più Aiuti
286 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
B
APPENDICE
STATISTICA ENTERPRISE
SERVER
STATISTICA Enterprise Server è un sistema
altamente scalabile, a livello enterprise, di
analisi basate sul Web e di interfacciamento a
database, costruito sulla tecnologia di
elaborazione distribuita e che supporta
efficacemente configurazioni con architetture
Client-Server a più livelli. STATISTICA Enterprise
Server espone le funzionalità analitiche,
d’interrogazione, di reportistica e grafiche di
STATISTICA in interfacce Web standard facili da
usare ed interattive. In alternativa, consente agli
utenti della versione desktop di scaricare le
operazioni computazionalmente gravose di
database e analitche al Server. È offerto come
un’applicazione completa e pronta ad essere
installata con un’interfaccia utente basata sul
browser Internet (“punta-e-clicca”) e
interattiva, che consente agli utenti di creare
insiemi di dati; eseguire analisi ed esaminare
l’output interattivamente. Tuttavia, STATISTICA
Enterprise Server è costruito utilizzando un
achitettura aperta e include un kit di strumenti
di sviluppo compatibili con .NET (basati
interamente su convenzioni standard della
sintassi come VB Script, C++, HTML, XML) che
consentono ai dipartimenti IT di personalizzare
tutte le principali componenti del sistema
oppure di espanderle per ,ad esempio,
aggiungere specifiche funzionalità analitiche.
Come già menzionato, STATISTICA Enterprise
Server è fornito di un’interfaccia utente basata
su browser Internet (nella forma di finestre facili
da navigare e da utilizzare) che permettono agli
utenti di specificare le analisi ed esaminare i
risultati. Sono comunque forniti strumenti per la
personalizzazione di queste finestre e per la
semplice impostazione di nuove, personalizzate
interfacce utenti o per l’aggiunta di nuove
funzioni. Ad esempio, nel browser può apparire
una semplice finestra di dialogo contenente
solo tre pulsanti, dove premendo ogni pulsante
verrà eseguita una serie di analisi e generato un
report dettagliato. Le applicazioni di STATISTICA
Enterprise Server aggiungono una nuova
dimensione ed una serie infinita di possibilità
per l’intera linea del software di STATISTICA per
l’Analisi dei Dati, il Data Mining e il Controllo di
Qualità/Six-Sigma.
Il sistema è compatibile con tutte le principali
piattaforme software basate sul Web (ad es.,
UNIX, Apache e Microsoft IIS), lavora sia
nell’ambiente Microsoft .NET che nell’ambiente
Sun/Java, e non richiede alcuna modifica al
firewall esistente e ai sistemi di sicurezza
Internet/Intranet.
STATISTICA Guida di Riferimento – 287
Copyright © StatSoft, 2011
Appendice B: STATISTICA Enterprise Server
Un’Ampia Scelta di Configurazioni
e Funzionalità Analitiche
Il sistema STATISTICA Enterprise Server è offerto
come una soluzione completa che include le
funzionalità analitiche di qualsiasi prodotto di
STATISTICA o di qualsiasi combinazione di
prodotti, da STATISTICA Base a Data Miner.
L’installazione minima del software STATISTICA
Enterprise Server include le funzionalità
analitiche di STATISTICA Base ed una licenza per
(minimo) 5 utenti simultanei.
I clienti possono ordinare una specifica versione
di STATISTICA Enterprise Server che include le
funzionalità analitiche da loro richieste (ad es.,
STATISTICA Base per 10 utenti), oppure possono
aggiungere la funzionalità Enterprise Server
(come descritta in questa sezione) ad alcuni o a
tutti gli utenti del prodotto di STATISTICA
correntemente licenziato (ad es., aggiungere la
funzionalità Enterprise Server a 20 delle 50
licenze esistenti di STATISTICA Enterprise).
Funzionalità e Applicazioni: I
Vantaggi di STATISTICA Enterprise
Server
Un potente sistema di condivisione delle
informazioni di tutta l’azienda. Un altro
importante modo di sfruttare le funzionalità di
STATISTICA Enterprise Server è di utilizzarlo
come nucleo ed estensione naturale di uno dei
sistemi di STATISTICA enterprise (STATISTICA
Enteprise, o Data Miner).
In particolare, STATISTICA Enterprise Server può
agire come nucleo di una rete aziendale, che
consente agli utenti di lavorare in
collaborazione e di condividere velocemente i
risultati (report), così come gli script delle analisi
o le query. I permessi degli utenti e dei gruppi
(cfr. la Nota Tecnica a pag. 294) possono essere
usati dagli amministratori per gestire l’accesso
ai dati o ai report. L’accessibilità dei suoi
strumenti rende STATISTICA Enterprise Server
un sistema perfetto per facilitare progetti
collaborativi degli impiegati che sono in
telecomunicazione o in viaggio.
Vantaggi dell’elaborazione distribuita e delle
architetture Client-Server a più livelli. Gli
utenti beneficeranno non solo di strumenti per
un lavoro collaborativo, ma anche delle opzioni
per scaricare compiti computazionalmente
gravosi a server. In particolare, dato che le CPU
multiprocessore più potenti (e/o i gruppi di
computer) sono solitamente usate come server,
gli utenti possono sia scaricare i compiti più
gravosi che, ad esempio, far eseguire “in
background” query che esploreranno terabyte
di dati a server remoti, e compiere lunghe
sequenze di analisi o di report, mentre i
computer degli utenti rimangono liberi di
eseguire altri task. Data la sua architettura di
elaborazione distribuita, STATSTICA Enterprise
Server sfrutta le CPU multi-processore e/o i
computer multipli e, per questo motivo, gli
utenti possono trarre pieno vantaggio
dall’architettura Client-Server a più livelli, dove:
• Il livello 1è l’interfaccia utente nel computer
client (un semplice browser o client leggero
di STATISTICA, cfr. Client di STATISTICA, pag.
289),
• Il livello 2 è il software STATISTICA Enterprise
Server e l’implementazione delle
“informazioni aziendali” che può contenere
(query, script di analisi
personalizzate/proprietarie, ecc.), e
• Il livello 3 sono i database di STATISTICA (ad
es., STATISTICA Data Warehouse) oppure gli
altri archivi di dati aziendali.
Nella versione desktop di STATISTICA, tutti i
calcoli vengono eseguiti sul computer locale, e
le risorse degli altri computer sono impiegate
solo quando viene stabilita l’interfaccia per
l’Esecuzione In-Loco (IDP), cfr. pag. 267, di
288 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2008
Appendice B: STATISTICA Enterprise Server
database esterni. L’IDP è una tecnologia che
legge i dati in modo asincronicamente diretto
dai server di database remoti (usando
elaborazioni distribuite se supportate dal
server), e bypassa la necessità di “importare” i
dati e di creare una copia locale dell’insieme di
dati. I record dei dati vengono conservati ed
inviati asincronicamente al computer in cui è
installato STATISTICA dalla CPU del server di
database, mentre STATISTICA li elabora
simultaneamente attraverso il CPU del
computer locale.
Quando si utilizza una versione Client-Server di
STATISTICA, il computer locale gestisce solo
l’interfaccia utente di STATISTICA, mentre tutti i
calcoli vengono eseguiti sul server. Questa
architettura offre ovvi vantaggi quando si lavora
con progetti di grandi dimensioni (ad es.,
gravosi computazionalmente, oppure relativi
all’elaborazione di data set estremamente
grandi) e, quindi, quando essi vengono scaricati
sui server, liberano il computer locale
consentendo l’esecuzione di altri lavori.
Client di STATISTICA. Sul lato client non
sarebbe necessaria alcuna componente del
sistema STATISTICA (basta solo un browser), ma
averne installata una copia aggiunge nuove
possibilità. Qualcuno potrebbe domandarsi:
“Perché dovrei voler usare STATISTICA
Enterprise Server se dispongo sul mio laptop di
una copia di STATISTICA?”. La risposta è che
possedere una copia installata di STATISTICA sul
client permette di trarre un ulteriore vantaggio
sfruttando l’architettura Client-Server a più
livelli (cfr. pag. 288). Infatti è possibile lavorare
interattivamente con STATISTICA installato
localmente mentre si scaricano i compiti gravosi
ai server e scambiare dati e output tra tutti i tre
livelli, in modo da consentire una maggiore
flessibilità ed interazione tra i due ambienti.
Molte opzioni per la condivisione dei compiti tra
computer desktop e server sono disponibili.
Inoltre, quando si esamina l’output di
STATISTICA Enterprise Server nel browser, si
dispone di opzioni per trasferire uno o più
elementi dell’output sul computer locale per
utilizzarli in ulteriori elaborazioni. Ad esempio,
fare clic su un piccolo pulsante posto (a seconda
della configurazione impostata dall’utente)
vicino ad ogni elemento di output inviato al
proprio browser dal sistema STATISTICA
Enterprise Server, offrirà l’opzione di scaricare
quel dato oggetto (una tabella o un grafico di
STATISTICA) sul client nel suo formato nativo di
STATISTICA (nel formato file .sta oppure .stg) in
modo da poterlo utilizzare offline con gli
strumenti di STATISTICA installati localmente.
Vantaggi della Tecnologia
Multithreading
La piattaforma STATISTICA Enterprise Server è
costruita con una avanzata tecnologia di
elaborazione distribuita e multithreading per
sostenere una gestione ottimale delle
operazioni computazionalmente importanti.
Tale tecnologia permette rapide elaborazioni di
progetti anche molto grandi e gravosi,
sfruttando le CPU multiple presenti sul server,
oppure pià server che lavorano in parallelo.
La figura riporta un progetto eseguito su un
server a quadruplo processore, assieme al
monitor di prestazione di server che mostra la
piena utilizzazione delle risorse di tutte e
quattro le CPU che eseguono in modalità
multithreading un unico progetto di STATISTICA
Data Miner computazionalmente gravoso.
In aggiunta, l’architettura di STATISTICA
Enterprise Server presenta una piattaforma
indipendente, l’interfaccia utente basata su
browser Web, e fornisce un’ultima funzionalità
STATISTICA Guida di Riferimento – 289
Copyright © StatSoft, 2008
Appendice B: STATISTICA Enterprise Server
a livello enterprise per la gestione di progetti o
di gruppi di utenti.
Scalabilità (tecnologia di elaborazione
parallela). Una delle caratteristiche uniche
della tecnologia di elaborazione distribuita di
STATISTICA è che può essere scalata
flessibilmente non solo per trarre vantaggio da
tutte le CPU presenti sul server corrente (per
supportare sia utenti/lavori multipli che anche
singoli progetti computazionalmente gravosi),
ma anche su server multipli (gruppi). Questa
caratteristica unica è importante, dato che
permette di guadagnare significativamente in
termini prestazionali. STATISTICA ricorre alla
tecnologia di elaborazione parallela attraverso
unità hardware separate (come fanno alcuni
supercomputer) e, quindi, se si dispone, ad
esempio, di tre server con quattro processori
ognuno, STATISTICA può eseguire un singolo
progetto su tutti e 12 i processori (soltanto se la
scala del progetto garantisce tale modalità di
elaborazione).
Interfaccia Utente di STATISTICA
Enterprise Server
Con l’implementazione STATISTICA Enterprise
Server di STATISTICA, gli utenti possono
eseguire interattivamente il programma dal
client tramite un
browser Web in
maniera simile
all’installazione
desktop.
Pertanto, il lato
client
dell’applicazione
(il “front-end”)
può essere
eseguito su un
qualsiasi
computer
utilizzando
solamente un
browser.
Tuttavia, tutte le
operazioni
eseguite sui dati
resteranno sul server (remoto) insieme ai
processori solitamente più potenti e alle risorse
di memorizzazione (e saranno gestiti usando
l’architettura di elaborazione ottimizzata,
multithreading e distribuita del sistema per una
prestazione massima).
In definitiva, gli aspetti dell’interfaccia utente di
STATISTICA possono essere eseguiti da uno o
più utenti, mentre il server esegue tutti i calcoli
e le operazioni sui dati, facendo rispettare gli
opportuni parametri di sicurezza ed i privilegi di
accesso applicabili ai rispettivi progetti e alle
classi di utenti, in quanto progettato
dall’amministratore della rete.
STATISTICA Enterprise Server offre un’interfaccia
utente estremamente diretta che supporta la
selezione completa delle operazioni di analisi
290 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2008
Appendice B: STATISTICA Enterprise Server
dei dati, di data mining, di controllo della
qualità, di gestione dei database, di
interrogazione dei database e di
personalizzazione dei grafici.
Dopo l’accesso al sistema STATISTICA Enterprise
Server,
selezionare l’analisi da eseguire usando il
sistema di menu standard (o contestuali nel Mio
Menu definito dall’utente),
è possibile selezionare una sorgente dati (un
dataset o una connessione a database in corso),
specificare le variabili e i parametri facoltativi
dell’analisi,
rivedere e modificare i dati nell’Editor di
Spreadsheet interattivo,
STATISTICA Guida di Riferimento – 291
Copyright © StatSoft, 2008
Appendice B: STATISTICA Enterprise Server
Sono disponibili una vasta gamma di
funzionalità interattive per eseguire operazioni
su database speciali, di controllo della qualità o
di data mining, ed è accessibile dal browser
standard.
ed esaminare interattivamente l’ output.
292 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2008
Appendice B: STATISTICA Enterprise Server
In aggiunta alle funzionalità dell’interfaccia
utente integrate ed estremamente dirette,
STATISTICA Enterprise Server include anche un
kit di strumenti che permette agli utenti di
personalizzare tale interfaccia e di sviluppare
applicazioni specifiche, confezionate in base alle
necessità delle applicazioni.
Compatibilità con gli
Standard Industriali
L’insuperabile compatibilità con gli standard
industriali è un altro aspetto da inserire nella
lunga lista dei vantaggi unici di STATISTICA
Enterprise Server, in quanto può essere
implementato su una qualsiasi delle piattaforme
server Web più popolari (ad es., un Apache o IIS
basato su UNIX), e si conforma ai protoccoli di
sicurezza locale (firewall) vigenti.
STATISTICA Enterprise Server ricorre alla
tecnologia avanzata sviluppata da StatSoft per
assicurare l’alta prestazione e scalabilità ( ad es.,
consentire l’impiego di computer STATISTICA
Enterprise Server a multiprocessore che
lavorano in un ambiente di elaborazione
distribuita). Questa tecnologia si basa su anni di
esperienza StatSoft nella fornitura di sistemi
enterprise altamente performanti e scalabili alle
principali aziende Statunitensi e mondiali.
Tuttavia, STATISTICA Enterprise Server è ancora
oggi basato su protocolli di comunicazione
industriale standard (come ad esempio XML) al
STATISTICA Guida di Riferimento – 293
Copyright © StatSoft, 2008
Appendice B: STATISTICA Enterprise Server
fine di assicurare a) l’indipendenza della sua
piattaforma, b) una graduale transizione verso
le tecnologie del futuro, e c) la garanzia di poter
effettuare personalizzazioni da parte del client.
Si noti che il ricorso alla personalizzazione è
ulteriormente facilitata dal fatto che soltanto le
convenzioni sintattiche industriali standard
(quali VB script, C++, HTML e XML) sono
utilizzate per personalizzare, configurare, e
definire tutte le specifiche operazioni analitiche
e tutti gli output in STATISTICA Enterprise
Server.
Architettura del Sistema
(Una Nota Tecnica)
Sebbene il piano generale richieda l’utilizzo di
due “macchine” in una configurazione tipica, il
Web server (ad es., un sistema Apache basato
su UNIX) ed almeno un STATISTICA Enterprise
Server (scalabile a scelta in più STATISTICA
Enterprise Server),
in molti casi, STATISTICA Enterprise Server
potrebbe essere installato sulla stessa macchina
(quando IIS viene usato come host Web):
Il piano consente una flessibile
implementazione Web server generica usando
un linguaggio script standard sul Web server.
L’obiettivo del Web server è confezionare le
richieste dell’utente (ricevute da un browser),
inviarle a STATISTICA Enterprise Server, e quindi
produrre risposte in STATISTICA Enterprise
Server da visualizzare all’utente (sul suo
browser).
La comunicazione tra il server Web e
STATISTICA Enterprise Server è possibile data la
tecnologia basata sulle convezioni industriali
XML standard. Il sistema è totalmente
personalizzabile, e per i clienti che desiderano
sviluppare le proprie modifiche o estensioni
dell’ambiente (pronte da implementare),
fornisce un kit di strumenti che permettono la
modifica di tutti gli aspetti sia degli script da far
eseguire a STATISTICA (sul lato STATISTICA
Enterprise Server) che l’aspetto dell’interfaccia
utente esposta agli utenti finali sul lato client
(basato sul
browser). Per
personalizzare o
espandere il
sistema sono
usati solo gli
strumenti
standard più
comunemente
noti (quali VB o
XML/HTML).
Le reali definizioni delle pagine Web e gli script
di STATISTICA da
eseguire sono
immagazzinati in
una Funzionalità
di Repository
presente in
STATISTICA
Enterprise Server,
e vengono gestiti
294 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2008
Appendice B: STATISTICA Enterprise Server
in coda. Il sistema include anche un Gestore di
Elaborazione Distribuita che permette di
amministrare l’elaborazione in entrata e la
distribuisce ottimamente su fili multipli di
STATISTICA e computer multipli di STATISTICA
Enterprise Server.
Il sistema STATISTICA Enterprise Server include
anche le Estensioni Web di STATISTICA Visual
Basic. Tali estensioni del linguaggio SVB
permettono di scrivere script per visualizzare i
grafici e gli spreadsheet risultanti sulle pagine
Web (output) generate automaticamente, o di
personalizzare l’aspetto delle pagine di output
generate aggiungendo direttive HTML.
La sicurezza e l’autenticazione sono
caratteristiche chiave nel sistema applicativo
STATISTICA Enterprise Server. All’inizio della
sessione, gli utenti “accedono” al sistema con i
propri user name e password. Gli
amministratori del sistema sono in grado di
controllare l’accesso alle sorgenti di dati e agli
script sia in base ai permessi utente che a quelli
di gruppo. Il livello più alto di privilegio
d’accesso consente agli utenti avanzati (o agli
amministratori) di eseguire script virtualmente
arbitrari (ad es., eseguire operazioni di
amministrazione o di manutenzione). Questo
livello richiede il più alto privilegio d’accesso
dato che, sulla base della natura generale e
della potenza del linguaggio STATISTICA Visual
Basic, fornisce l’accesso (agli utenti autorizzati)
a tutte le risorse della rete.
Si noti che questo sistema può essere integrato
nella rete “tradizionale” (cioè, non basata sul
Web) di STATISTICA o in uno schema di
autenticazione di tipo STATISTICA enterprise.
Vantaggi Competitivi
I vantaggi concorrenziali delle applicazioni di
STATISTICA Enterprise Server partono dalla lista
completa delle caratteristiche uniche di
STATISTICA in sé. In più, diversamente dai
prodotti concorrenti, StatSoft offre
un’applicazione (“soluzione”) completa con
un’interfaccia utente basata sul Web e non un
semplice “kit di sviluppo”.(sebbene siano
disponibili anche le funzionalità di sviluppo per
l’estensione o la personalizzazione del sistema).
Inoltre, non è richiesto che per prima cosa
venga installato uno specifico software Web
server (che potrebbe o no soddisfare gli
standard di sicurezza del client). Infine, il
sistema è controllato dagli script industriali
standard VB, C++, HTML e XML che possono
essere facilmente modificati dagli utenti o dagli
amministratori del sistema. Inoltre, la
tecnologia di elaborazione distribuita e
multithreading consente alti livelli prestazionali
e di risposta non raggiungibili dai prodotti
concorrenti.
Knowledge Portal
Facoltativamente è disponibile un’applicazione
Knowledge Portal che consente agli utenti di
distribuire effettivamente ed in modo sicuro
insiemi organizzati di documenti di output sul
Web. Esso offre un supporto ai gruppi di lavoro
ed agli utenti (ognuno con differenti privilegi
d’accesso, e quindi accesso a differenti parti del
database contenente i documenti di output),
un’intuitiva organizzazione visuale ad albero dei
materiali disponibili, e opzioni per divulgare i
documenti aggiornati sul Web server in tempo
reale.
Filmato Dimostrativo di
STATISTICA Enterprise Server
Come funziona STATISTICA Enterprise Server? Si
visiti il sito Web di StatSoft, www.StatSoft.it,
per assistere ad una presentazione informativa
delle caratteristiche uniche di STATISTICA
descritte in questa appendice. Il filmato include
anche un esempio passo per passo.
STATISTICA Guida di Riferimento – 295
Copyright © StatSoft, 2008
Appendice B: STATISTICA Enterprise Server
296 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2008
C
APPENDICE
LA FAMIGLIA DEI
PRODOTTI DI STATISTICA
Obiettivo Generale/Prodotti Desktop ................................................. 299
STATISTICA Base ............................................................................. 299
STATISTICA Modelli Lineari/Non Lineari Avanzati ........................ 299
STATISTICA Tecniche Esplorative Multivariate ............................. 300
STATISTICA Stima di Varianza e Precisione .................................. 300
STATISTICA Reti Neurali Automatizzate (SANN) ........................... 300
STATISTICA Analisi della Potenza .................................................. 300
Soluzioni Industriali, Strumenti Six Sigma ......................................... 301
STATISTICA Carte di Controllo della Qualità ................................. 301
STATISTICA Analisi dei Processi..................................................... 301
STATISTICA Pianificazione degli Esperimenti................................ 301
STATISTICA Controllo di Processo Multivariato (MSPC) ............... 301
continua Sistemi di STATISTICA Enterprise ....................................................... 302
STATISTICA Data Miner .................................................................. 302
STATISTICA Ottimizzazione dei Processi ....................................... 302
STATISTICA Text Miner ................................................................... 303
STATISTICA Analisi di Sequenze, Associazioni
e Collegamenti (SAL) ....................................................................... 303
STATISTICA Enterprise .................................................................... 304
STATISTICA Enterprise/QC ............................................................. 304
STATISTICA Monitoring and Alerting Server (MAS) ...................... 304
STATISTICA ETL (Estrazione, Trasformazione e Caricamento) ..... 304
STATISTICA MultiStream ................................................................ 305
STATISTICA Enterprise Server ........................................................ 305
Soluzioni per il Credit Scoring............................................................. 306
STATISTICA Live Score .................................................................... 306
STATISTICA Credit Scoring ............................................................. 306
STATISTICA Scorecard .................................................................... 307
Gestione dei Dati e dei Documenti ..................................................... 307
Sistema di Gestione dei Documenti di STATISTICA (SDMS) ......... 307
STATISTICA PI Connector ............................................................... 307
STATISTICA Data Warehouse ......................................................... 307
Vertical Market Applications .............................................................. 311
PROCEED ......................................................................................... 311
STATISTICA PowerSolutions ........................................................... 312
C
APPENDICE
LA FAMIGLIA DEI
PRDOTTI DI STATISTICA
Caratteristiche comuni del sistema. Oltre
alla completezza, alle procedure di ultima
generazione, i prodotti di STATISTICA offrono
una selezione d’interfacce utente
completamente personalizzabili (con template
a scelta rapida semplificati rivolti agli utenti
meno esperti), una gestione dell’output in
qualità di presentazione (che include una
varietà di formati di report, quali il .pdf, Word,
.rtf, .html, e l’output su Web), un supporto
OLE/ActiveX completo, ed un’abilitazione al
Web.
Inoltre tutti i prodotti includono funzionalità di
gestione dei dati ottimizzate per il trattamento
di grandi insiemi di dati, strumenti
d’interrogazione interattiva di database, ed
un’ampia gamma di funzionalità
d’importazione/esportazione dei dati. I
prodotti di STATISTICA possono gestire insiemi
di dati di dimensione praticamente illimitata
ed offrono calcoli a precisione “quadrupla”;
supportano file di input multipli, istanze
multiple, e multitasking. In ogni prodotto è
integrata un’ampia selezione di strumenti
interattivi di visualizzazione e di
rappresentazione grafica di alta qualità, ed
ognuno include un insieme completo di
opzioni di automazione ed un ambiente di
sviluppo Visual Basic e .NET-compatibile con la
possibilità di accedere a più di 14.000 funzioni
esterne.
OBIETTIVO GENERALE
PRODOTTI DESKTOP
STATISTICA Base. Offre un insieme
completo di tecniche statistiche
essenziali in un’interfaccia utente intuitiva, e
tutte le prestazioni, la potenza e la facilità
d’uso della tecnologia STATISTICA.
• Tutti gli strumenti grafici di STATISTICA
• Statistiche di Base, Segmentazioni e Tabelle
• Adattamento di Distribuzioni
• Regressione Lineare Multipla
• Analisi della Varianza
• Statistiche Non Parametriche ed altro
STATISTICA Modelli Lineari/Non
Lineari Avanzati. Offre un gran
numero di strumenti avanzati per la
modellazione e la previsione, incluse opzioni
per la selezione automatica dei modelli e
strumenti avanzati per la visualizzazione
interattiva.
• Modelli Lineari Generali
• Modelli Lineari/Non Lineari Generalizzati
STATISTICA Guida di Riferimento – 299
Copyright © StatSoft, 2011
Appendice C: Famiglia dei Prodotti
•
•
•
•
•
•
•
•
•
Modelli di Regressione Generali
Modelli ai Minimi Quadrati Parziali Generali
Algoritmo NIPALS (PCA/PLS)
Componenti della Varianza
Analisi di Sopravvivenza
Modelli a Rischi Proporzionali di Cox
Stima Non Lineare
Regressione Non Lineare Fissa
Analisi Log-Lineare delle Tabelle di
Frequenza
• Serie Storiche/Previsioni
• Modelli di Equazioni Strutturali ed altro
STATISTICA Tecniche Esplorative
Multivariate. Offre un gran numero di
tecniche esplorative per vari tipi di dati, con
strumenti avanzati per la visualizzazione
interattiva.
• Analisi dei Gruppi
• Analisi dei Fattori
• Analisi delle Componenti Principali e di
Classificazione
• Analisi Canonica
• Analisi Discriminante
• Modelli di Analisi Discriminante Generale
• Analisi dell’Attendibilità/degli Item
• Alberi di Classificazione
• Analisi delle Corrispondenze
• Scaling Multidimensionale ed altro
STATISTICA Stima di Varianza e
Precisione. Un insieme completo di
tecniche per l’analisi dei dati relativi ad
esperimenti che includono sia effetti fissi che
random attraverso REML (Stima di Massima
Verosimiglianza Vincolata). Con STATISTICA
Stima di Varinza e Precisione è possibile
ottenere stime delle componenti di varianza
ed usarle per ottenere considerazioni sulla
precisione e allo stesso tempo per confrontare
gli effetti fissi in presenza di sorgenti di
variazione multiple.
• Grafici di Variabilità
• Aspetti grafici multipli per consentire il
confronto diretto di più variabili dipendenti
• Quadrati medi attesi e componenti di
varianza con intervalli di confidenza
• Gestione flessibile di variabili dipendenti
multiple: analizzare più variabili alla volta
nello stesso piano o in piani differenti
• Display grafici delle componenti di varianza
STATISTICA Reti Neurali
Automatizzate (SANN). Contiene la più
completa selezione di algoritmi e metodi di
addestramento delle reti neurali.
• Ricerca automatica della miglior soluzione e
architettura di rete
• Percettroni Multistrato
• Reti di Funzioni a Base Radiale
• Mappe di Caratteristiche Auto-Organizzanti
• Reti Neurali di Serie Storiche per problemi di
Regressione e Classificazione
• Diversi algoritmi per l’addestramento rapido
ed efficiente di Modelli a Reti Neurali tra i
quali Gradient Descent, Conjugate Gradient
e BFGS
• Numerosi grafici analitici che aiutano per
generare i risultati e trarre conclusioni
• Campionamento dei dati in sottoinsiemi per
ottimizzare le prestazioni delle reti e per
migliorare le capacità di generalizzazione
• Analisi della Sensibilità, Lift Chart e Curve
ROC
• Creazione di Ensemble di reti singole già
esistenti
• Generatori di Codice C/C++/C#, PMML
(Predictive Model Markup Language), Java,
STATISTICA Enterprise e SAS per il
deployment delle Reti Neurali
STATISTICA Analisi della Potenza.
Uno strumento semplice da usare ed
estremamente preciso per l’analisi di tutti gli
300 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Appendice C: Famiglia dei Prodotti
aspetti per il calcolo della potenza statistica e
della dimensione campionaria.
• Calcolo della Dimensione Campionaria
• Stima Intervallare
• Calcolatori di Distribuzioni Statistiche ed
altro
SOLUZIONI INDUSTRIALI,
STRUMENTI SIX SIGMA
STATISTICA Carte di Controllo della
Qualità. Offre una personalizzazione
completa (ad es., chiamabile da altri ambienti),
facile e rapido da usare, carte versatili con
molte opzioni per l’automazione e scorciatoie
per semplificare il lavoro di routine (uno
strumento completo per i metodi Six Sigma).
• Report e Visualizzazione di Carte Multiple (in
Stile Six Sigma)
• Carte X-bar e R; Carte X-bar e S; Carte Np, P,
U, C
• Carte di Pareto
• Indici di Capacità e Performance dei Processi
• Carte di Medie/Range Mobili; Carte EWMA
• Carte Short Run (incluse le Carte Nominali e
Target)
• Carte CuSum (a Somma Cumulata)
• Test delle Sequenze
• Interattive
• Cause e azioni, allarmi personalizzabili,
brushing analitico ed altro
STATISTICA Analisi dei Processi. Un
pacchetto completo per la Capacità dei
Processi, R&R delle Misurazioni ed altre
applicazioni per il controllo/miglioramento
della qualità (uno strumento completo per i
metodi Six Sigma).
• Carte di Analisi dei Processi/Capacità
• Diagrammi di Ishikawa (Causa ed Effetto)
• Ripetibilità e Riproducibilità delle
Misurazioni
• Componenti di Varianza per Effetti Random
• Analisi di Weibull
• Piani Campionari ed altro
STATISTICA Pianificazione degli
Esperimenti. Una grande selezione di
piani degli esperimenti (DOE) e delle relative
tecniche di visualizzazione tra le quali i profili
di preferenza interattivi (uno strumento
completo per i metodi Six Sigma).
• Piani Fattoriali Frazionali
• Piani Mistura
• Quadrati Latini
(k-p)
• Ricerca di Piani 2 Ottimali
• Analisi dei Residui e Trasformazioni
• Ottimizzazione di Variabili di Risposta
Singole/Multiple
• Piani Centrali Compositi
• Piani Taguchi
• Aberrazione Minima e Massimo Non
Confondimento
(k-p)
• Piani Fattoriali Frazionati 2 con Blocchi
• Superfici Vincolate
• Piani D- ed A- Ottimali
• Profili di Preferenza ed altro
STATISTICA Controllo Statistico di
Processo Multivariato (MSPC). Una
soluzione completa per il controllo statistico di
processo multivariato, sviluppata all’interno di
una piattaforma analitica sicura e scalabile.
• Metodi statistici univariati e multivariati per
il controllo della qualità, la modellazione
predittiva e la riduzione dei dati
• Funzioni per la determinazione del processo
più critico, delle materie prime, dei fattori
ambientali e delle loro impostazioni ottimali
per la realizzazione di prodotti di alta qualità
• Monitoraggio interattivo o automatico delle
caratteristiche del processo durante le
diverse fasi produttive
STATISTICA Guida di Riferimento – 301
Copyright © StatSoft, 2008
Appendice C: Famiglia dei Prodotti
• Costruzione, valutazione e deployment di
modelli predittivi basati sui risultati noti
ottenuti da dati storici
• Analisi storica, esplorazione dei dati,
visualizzaizone dei dati, costruzione e
valutazione di modelli predittivi,
deployment dei modelli sul server di
monitoraggio
• Monitoraggio interattivo con visualizzazioni
riassuntive e risultati aggiornabili
automaticamente
• Monitoraggio automatizzato con regole,
eventi d’allarme e azioni configurabili
• Tecniche multivariate compresi i Minimi
Quadrati Parziali, le Componenti Principali,
le Reti Neurali, i Metodi (Alberi) a
Partizionamento Ricorsivo, Support Vector
Machine, l’Analisi delle Componenti
Indipendenti, l’Analisi dei Gruppi ed altro
SISTEMI DI STATISTICA
ENTERPRISE
In aggiunta alle caratteristiche comuni, i
Sistemi Enterprise di STATISTICA offrono, a
scelta, una vasta selezione di strumenti per il
lavoro di gruppo, interfacce utente basate su
browser Web (tramite STATISTICA Enterprise
Server), database specializzati e un’interfaccia
altamente ottimizzata per il trattamento dei
dati dell’impresa, incluse le opzioni per
l’elaborazione rapida “in loco” di dataset
molto grandi da server remoti, senza crearne
copie locali. Sono disponibili anche servizi di
deployment e di addestramento su-sito.
STATISTICA Data Miner. La soluzione
data mining più completa presente sul
mercato, estremamente facile da usare (a
scelta basata su browser Web tramite se si
utilizza STATISTICA Enterprise Server, cfr. pag.
305) ed un motore di sviluppo. È caratterizzata
da una selezione di sistemi e soluzioni di data
mining specifiche completamente integrate ed
automatizzate, pronte per essere usate “come
sono” (ma anche facilmente personalizzabili)
per un’ampia classe di applicazioni di tipo
commerciale e aziendale. E’ disponibile anche
una versione SPC (QC Data Miner) progettata
per effettuare un mining/analisi di grandi flussi
di dati QC. Le soluzioni di data mining sono
gestite per mezzo di potenti procedure
appartenenti a cinque moduli:
• Generatore di Ipercubi/Stratificazioni
Generale (a scelta con OLAP)
• Classificatore Generale
• Modellatore Generale/Esploratore
Multivariato
• Previsioni Generali
• Esploratore Generale di Reti Neurali ed altro
STATISTICA Ottimizzazine dei
Processi. Aggiunto al Data Miner,
STATISTICA Ottimizzazione dei processi è una
potente soluzione software progettata per
monitorare i processi e per individuare ed
anticipare problemi collegati al controllo della
qualità ed al miglioramento, tramite una
sensibilità ed efficacia impareggiabile.
Ottimizzazione dei Processi integra tutte le
Carte di Controllo della Qualità, le analisi della
Capacità dei Processi, le procedure di
Pianificazione degli Esperimenti e i metodi Six
Sigma con una libreria completa di tecniche
“cutting-edge” per il data mining esplorativo e
predittivo.
• Prevedere problemi di CQ con metodi di
data mining “cutting-edge”
• Scoprire le root causes del problema
• Monitorare e migliorare il ROI (Return On
Investment)
• Generare suggerimenti per ottenere
miglioramenti
• Monitorare processi in tempo reale su Web
302 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Appendice C: Famiglia dei Prodotti
• Creare e sviluppare soluzioni QC/SPC sul
Web
• Usare elaborazioni multithreading e
distribuite per elaborare rapidamente flussi
di dati estremamente grandi
STATISTICA Text Miner. Una potente
soluzione software per il text mining, il
recupero di documenti ed il mining di dati non
strutturati. Un add-on a opzionale per
STATISTICA Data Miner, progettato e
ottimizzato per l’accesso e l’analisi dei
documenti (informazioni non strutturate) in
diversi formati: .txt (testo), pdf (Adobe), .ps
TM
(PostScript ), .html, .xml (formati Web) e la
maggior parte dei formati di Microsoft Office
(ad es., .doc, .rtf); è anche fornito un accesso
ottimizzato alle pagine Web (indirizzi URL).
• Indicizza efficientemente raccolte molto
grandi di documenti di testo; identifica
termini chiave e similitudini tra documenti e
termini, ed estrae l’informazione rilevante
per la propria missione e i propri obiettivi
• Applica liste troncate (parole da ignorare) e
algoritmi di trattamento degli specifici
linguaggi (sono supportati vari linguaggi)
• Include numerose opzioni per convertire i
documenti in informazioni numeriche per
ulteriori elaborazioni (ad es., mapping,
raggruppamento, data mining predittivo,
classificazione dei documenti, ecc.)
• Pieno supporto per le operazioni
multithreading su installazioni server multiprocessore per un’indicizzazione
estremamente veloce e per la ricerca di
grandi repository di documenti
• Il programma può anche essere usato per
indicizzare, analizzare ed effettuare un
mining di altro input non strutturato, come
file sonori o d’immagine (dopo aver
applicato una pre-elaborazione specifica di
dominio)
• Completamente integrato nei sistemi
STATISTICA e STATISTICA Enterprise Server;
per questa ragione, il grande numero di
metodi disponibili per l’apprendimento
supervisionato e non supervisionato
(raggruppamento), per la mappatura, per la
visualizzazione dei dati, ecc., sono disponibili
direttamente ed immediatamente; molti
degli algoritmi disponibili in STATISTICA
Data Miner, come gli algoritmi di
apprendimento della macchina (k-nearest
neighbor, classificatori Bayesiani, macchine
di supporto vettoriale e classificatori kernel),
sono particolarmente adatti al text mining o
ad all’analisi di altre informazioni non
strutturate.
STATISTICA Analisi di Sequenze,
Associazioni e Collegamente (SAL).
Progettato per soddisfare i bisogni degli utenti
operanti nei settori bancario, assicurativo, di
retailing, ecc., che implementano algoritmi
rapidi e altamente scalabili con la possibilità di
gestire regole di Associazione e di Sequenze in
un’unica analisi. Il programma rappresenta un
modulo stand-alone da poter usare sia per la
costruzione che per il deployment dei modelli.
Tutti gli strumenti disponibili in STATISTICA
Data Miner possono essere rapidamente ed
agevolmente arricchiti da strumenti di analisi
con “drill-down” disponibili in STATISTICA SAL.
• Utilizza una tecnica di costruzione ad alberi
per l’estrazione dai dati di regole Associative
e Sequenziali
• Utilizza una tecnologia a database
relazionali attraverso la quale poter
archiviare modello Associativi e Sequenziali
• Gestione di risposte multiple, risposte
dicotomiche multiple, e di variabili continue
in un’unica analisi
• Esegue Analisi delle Sequenze con mining
contemporaneo delle regole di Associazione
in una singola analisi
STATISTICA Guida di Riferimento – 303
Copyright © StatSoft, 2008
Appendice C: Famiglia dei Prodotti
• Estrazione simultanea di regole Associative
e Sequenziali per più di una dimensione
• Data la possibilità di eseguire mining
multidimensionale di Associazioni e di
Sequenze e la possibilità di estrarre solo
regole per specifici item, il programma può
essere utilizzato anche per operazioni di
Data Mining Predittivo
• Esegue un’Analisi Gerarchica dei Gruppi a
Singolo Collegamento, attraverso il quale è
possibile rilevare i gruppi di item che si
presentano con maggiore probabilità.
Questa possibilità è di estrema utilità nelle
applicazioni pratiche reali.
STATISTICA Enterprise. Sistema multiutente integrato progettato per l’analisi
dei dati orientata ad obiettivi generali di
business intelligence e applicazioni di ricerca.
STATISTICA Enterprise può offrire, a scelta, le
funzionalità statistiche disponibili in qualsiasi
prodotto di STATISTICA.
• Integrazione con i data warehouses
• Strumenti intuitivi d’interrogazione e
filtraggio dei dati
• Strumenti di amministrazione facili-da-usare
• Distribuzione automatica dei report
• Notifica degli allarmi, ed altro
STATISTICA Enterprise/QC.
Progettato per applicazioni Six Sigma e
di controllo e miglioramento della qualità a
livello aziendale. STATISTICA Enterprise/QC
offre un database altamente prestazionale (o
un’interfaccia ottimizzata a database
esistenti), un monitoraggio ed una notifica
degli allarmi in tempo reale su banco di lavoro,
un insieme completo di strumenti analitici per
gli ingegneri, funzionalità sofisticate di
reportistica per la gestione delle opzioni Six
Sigma, e molto altro ancora.
• Interfaccia utente abilitata al web e
strumenti di reportistica; strumenti
d’interrogazione interattivi
• Interfaccia utente specifica per operatori,
tecnici, ecc.
• Funzionalità di gruppo per condivisione
delle query, di speciali applicazioni, ecc.
• Notifica aperta degli allarmi inclusi
avvertimenti/richiesta di causa/azione
• Scalabile, personalizzabile, e possibilità di
essere integrato in sistemi esistenti di
database/ERP, ed altro ancora
STATISTICA Monitoring and Alerting
Server (MAS). Un sistema che
consente agli utenti di automatizzare il
monitoraggio continuato di centinaia o migliaia
di parametri critici di processo e di prodotto. Il
monitoraggio in corso è un metodo
automatizzato ed efficace per:
• Monitorare contemporaneamente molti
parametric critici
• Fornire “fotografie” dello stato sulla base
dei risultati di tali attività di monitoraggio
differenziate per responsabilità personali
• Dashboard associati ad Utenti/Gruppi
STATISTICA ETL (Estrazione,
Trasformazione e Caricamento).
Fornisce opzioni per semplicare e facilitare
l’accesso, l’aggregazione e l’allineamento dei dati
provenienti da più database, quando alcuni
contengono dati di processo (tramite PI
Connector) mentre altri possiedono dati
“statici” (ad es., da Oracle o MS SQL Server).
Prevede l’esecuzione di query ad-hoc e
l’allineamento dei dati per analisi successive,
come la creazione di carte ad-hoc, ecc., di dati
che descrivono un determinato intervallo
temporale.
• STATISTICA ETL Indicizzato Temporalmente
aggrega dati provenienti da più fonti basate
su di una variabile di data/ora. I dati
304 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Appendice C: Famiglia dei Prodotti
possono essere allineati per minuto, ora,
giorno, settimana, mese, trimestre o anno.
• STATISTICA ETL Basato su ID aggrega dati
provenienti da più fonti basata su di una
variabile identificatrice (sia numerica che
testuale) e, facoltativamente, su di una
variabile temporale. Se è definita una
variabile temporale, i dati potrebbero essere
allineati per N intervalli uguali o N intervalli
definiti da utente.
STATISTICA MultiStream. Soluzione
per individuare ed implementare
strategie efficaci per il controllo ed il
monitoraggio di processi multivariati avanzati.
STATISTICA MultiStream è stato progettato per
essere impiegato nell’analisi dei principali
processi industriali, tuttavia è particolarmente
adatto per le applicazioni di produzione
elettrica lì dove occorre elaborare grandi
quantità di dati (raccolti in database esistenti
di processo).
STATISTICA MultiStream è un sistema
aziendale completamente costruito sulla base
di una robusta, e avanzata architettura clientserver (abilitata al Web), e offre
un’amministrazione e una gestione centrali per
il deployment dei modelli, così come funzioni
di root-cause analysis e di data mining
predittivo, e i suoi pacchetti analitici sono
integrati con un sistema implementato di
gestione dei documenti.
• Root cause analysis (non lineare)
automatizzata e selezione dei predittori per
migliaia di parametri per l’identificazione
chiara di quali siano quelli maggiormente
responsabili dei problemi del processo
• Analisi automatizzata ed interattiva delle
comunalità per l’identificazione dei
parametri e dei processi che si discostano
maggiormente dalle operazioni normali nel
corso di particolari intervalli di tempo
• Modelli lineari e non lineari avanzati (ad es.,
SVM, Partizionamento Ricorsivo, Reti
Neurali) per la creazione di schemi di
controllo multivariato e di flussi di lavoro
per individuare scostamenti e deviazioni
prima che si verifichino problemi
• Algoritmi avanzati di data mining per la
previsione e l’ottimizzazione degli indicatori
chiave di prestazione e di qualità
• Tracciare simultaneamente centinaia di
flussi di dati
• Produzione di semplici riepiloghi rilevanti
per i parametri critici di processo
visualizzabili attraverso dashboard e flussi di
lavoro con drill-down
• Consente flussi di lavoro analitici standard e
personalizzati per il root cause analysis,
l’analisi avanzata dei dati ed il data mining
• Segnala problemi (previsti) e guasti alla
strumentazione prima che questi si
verifichino (allarme predittivo), evitando
all’utente spegnimenti costosi e costi di
manutenzione non previsti
• Osserva “tutto” ciò che può avere un impatto
sulla prestazione dei processi in tempo reale
STATISTICA Enterprise Server. Il
sistema enterprise finale che offre una
completa abilitazione al Web, compresa la
possibilità di eseguire STATISTICA
interattivamente o in modalità batch da un
browser Web di un qualsiasi computer (incluso
Linux, UNIX) e di scaricare sui server operazioni
gravose (tramite l’elaborazione distribuita).
Utilizza un’architettura Client-Server a più
livelli, grazie al supporto dell’elaborazione
multithreading e distribuita/parallela che può
essere divisa su più server.
STATISTICA Guida di Riferimento – 305
Copyright © StatSoft, 2008
Appendice C: Famiglia dei Prodotti
SOLUZIONI PER IL CREDIT
SCORING
STATISTICA Live Score. Programma
di STATISTICA Enterprise Server
all’interno della piattaforma STATISTICA Analisi
dei Dati e Data Mining. I dati sono aggregati e
puliti, ed i modelli sono stimati e convalidati
utilizzando STATISTICA Data Miner. Dopo la
loro convalida, i modelli vengono utilizzati per
il deployment sul server di STATISTICA Live
Score. STATISTICA Live Score fronisce uno
scoring multi-threaded, efficiente e
indipendente dalla piattaforma, di dati che
provengono da applicazioni line-of-business.
Alcuni esempi di utilizzo di STATISTICA Live
Score:
• Fornisce credit scorecards per applicazioni di
customer service (ad es., sistemi di call
center e applicazioni basate sul Web)
• Consente la segmentazione dei clienti, upsell/cross-sell e l’individuazione di clienti che
desiderano abbandonare, per il customer
service ed l’ufficio marketing
• Fornisce avvisi proattivi per il rilevamento
delle frodi.
STATISTICA Credit Scoring. La
soluzione, per ogni azienda, per
costruire dei modelli per i propri prodotti di
credito e per il processo decisionale.
STATISTICA Credit Scoring copre tutti gli aspetti
del credit scoring necessari all’azienda.
• Costruzione dei modelli. La soluzione
software STATISTICA Credit Scoring
consente lo sviluppo e la valutazione di
modelli predittivi per valutare ed assegnare
un rischio alle domande di credito, sia per la
richiesta di un nuovo conto che per le
modifiche richieste alle condizioni di un
conto di credito già esistente.
• Applicazioni di Scoring. STATISTICA Live
Score consente alle aziende di dare un
punteggio alle richieste di credito; può
essere facilmente integrato con gli esistenti
sistemi di customer service, siti Web selfservice per i clienti, ecc.
• Valutare le prestazioni. STATISTICA Credit
Scoring offre funzionalità di monitoraggio e
di valutazione delle prestazioni dei modelli
in atto, per consentire di giudicare i risultati
e le metriche chiave, e per prendere
decisioni su quando aggiornare i modelli.
Cosa rende STATISTICA Credit Scoring una
soluzione unica?
• L’Approccio. STATISTICA Credit Scoring
include sia metodi tradizionali per lo
sviluppo di modelli di credit scoring (come
scorecard basate sulla regressione logistica)
che metodi avanzati per la modellazione
predittiva, che spesso offrono una maggiore
precisione, che si traduce in diminuzione
del rischio, aumento del tasso di
approvazione e profitti maggiori. STATISTICA
Credit Scoring comprende STATISTICA
Scorecard, una soluzione dedicata per lo
sviluppo, la valutazione e il monitoraggio di
scorecard, compresi i passi per la Selezione
dei Predittori, la Costruzione degli Attributi
e delle Scorecard, la Selezione del Punto di
Cutoff, l’Inferenza sui Rifiuti e la Stabilità
della Popolazione.
• Scoring in Tempo Reale. STATISTICA Credit
Scoring comprende STATISTICA Live Score, la
soluzione per poter prendere decisioni sullo
scoring direttamente dalle richieste dei
clienti, tramite gli Agenti del Customer
Service Agents, i Siti Web e le altre linee dei
sistemi aziendali.
• Sorgenti dei Dati. A differenza di scorecard
generici, STATISTICA Credit Scoring può
essere personalizzato per soddisfare
esigenze specifiche. Ad esempio, fornische
la flessibilità necessaria per includere varie
fonti di dati, come, ad esempio, il
306 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Appendice C: Famiglia dei Prodotti
comportamente del cliente, del quale si
utilizza il record delle transazioni del conto
per comunicare consigli per aumenti della
linea di credito, incentivi, cross-sell o up-sell,
od altri cambiamenti nei termini.
•Flessibilità e Funzionalità. STATISTICA
Credit Scoring è specifico per la costruzione
di modelli di credit scoring, ma gli stessi
approcci e le stesse tecniche possono essere
applicate anche alla modellazione degli
abbandoni dei clienti, aumentando le
capacità di rilevare frodi, alla modellazione
per le risposte alle campagne di marketing e
altre applicazioni all’interno dell’azienda.
STATISTICA Scorecard. STATISTICA
Scorecard è una soluzione dedicata per
lo sviluppo, la valutazione e il monitoraggio di
scorecard, compresi i passi per la Selezione dei
Predittori, la Costruzione degli Attributi e delle
Scorecard, la Selezione del Punto di Cutoff,
l’Inferenza sui Rifiuti e la Stabilità della
Popolazione.
GESTIONE DEI DATI E DEI
DOCUMENTI
Sistema di Gestione dei Documenti
di STATISTICA (SDMS). Soluzione
completa, altamente scalabile, di database per
la gestione di documenti elettronici. Con
STATISTICA Document Management System, è
possible gestire rapidamente, efficacemente,
ed in maniera sicura documenti di qualsiasi
tipo [ad es., per trovarli, accedere ad essi,
eseguire ricerche nei loro contenuti, rivederli,
organizzarli, modificarli (con funzionalità di
tracciabilità e di versionamento), approvarli,
ecc.].
• Estremamente trasparente e facile da usare
• Interfaccia utente flessibile, personalizzabile
(a scelta abilitata al web)
• Firme elettroniche
•
•
•
•
•
•
Tracciabilità e approvazioni complete
Ricerche ottimizzate
Strumenti per il confronto dei documenti
Sicurezza
Soddisfa i requisiti FDA 21 CFR Part 11
Soddisfa i requisiti di documentazione ISO
9000 (9001, 14001)
• Scalabilità illimitata (da desktop o da
versioni di rete Client-Server, su sistemi di
grandi dimensioni, basati sul Web)
• Architettura aperta e compatibilità con i
principali standard industriali
STATISTICA PI Connector. Consente
l’integrazione diretta con dati archiviati
nello storico dei dati PI. STATISTICA PI
Connector utilizza il modello di controllo
dell’accesso utenti PI, consente la navigazione
interattiva dei tag, e beneficia delle
funzionalità dedicate PI per l’interpolazione dei
dati. STATISTICA integrato con il sistema PI
viene utilizzato per l’analisi di flussi di lavoro e
automatizzata in applicazioni quali Process
Analytical Technology (PAT) nei settori regolati
dall’FDA, nei sistemi di Controllo Avanzato di
Processo (APC) nei settori Chimici e
Petrolchimici, e nei sistemi di advisory per
l’ottimizzazione e la conformità dei processi
nel settore della Produzione Energetica.
STATISTICA Data Warehouse. Una
soluzione di data warehouse completa,
potente, scalabile e personalizzabile, in grado
di offrire inoltre le più complete funzionalità
analitiche disponibili sul mercato,
completamente integrate nel sistema.
STATISTICA Data Warehouse è costituito da
una suite di applicazioni pontenti e flessibili,
tra cui:
• STATISTICA Data Warehouse Server
Database
STATISTICA Guida di Riferimento – 307
Copyright © StatSoft, 2008
Appendice C: Famiglia dei Prodotti
• STATISTICA Data Warehouse Query (con
STATISTICA Enterprise Server Query)
• STATISTICA Data Warehouse Analyzer (con
STATISTICA Enterprise Server Data Miner,
STATISTICA Enterprise Server Text Miner,
STATISTICA Enterprise Server Process
Optimization, o l’insieme completo di
pacchetti analitici di STATISTICA Enterprise
Server)
• STATISTICA Data Warehouse Reporter (con
STATISTICA Knowledge Portal e/o
Knowledge Portal Interattivo di STATISTICA
Enterprise Server)
• STATISTICA Data Warehouse Document
Repository (con il Sistema di Gestione dei
Documenti di STATISTICA Enterprise Server)
• STATISTICA Data Warehouse Scheduler
• STATISTICA Data Warehouse Real Time
Monitor and Reporter (con STATISTICA
Enterprise Server o STATISTICA
Enterprise/QC Server)
Se non si ha esperienza con i sistemi di data
warehousing, i consulenti StatSoft guideranno
l’utente passo- -passo attraverso l’intero
processo di progettazione dell’architettura
ottimale del data warehouse – a partire da
un’analisi completa del deposito delle
informazioni e dei bisogni di estrazione/analisi,
alla formazione finale dei dipendenti e al
supporto alle operazioni operative quotidiane.
Benefici e Caratteristiche Cruciali. I benefici
e le caratteristiche di STATISTICA Data
Warehouse includono:
• Applicazioni complete di data warehousing
studiate per le proprie applicazioni di
business
• Architettura indipendente dalla piattaforma
per un’integrazione senza pari con la propria
infrastruttura esistente
• Funzionalità per l’integrazione dei dati
provenienti da una grande varietà di
sorgenti e
• Scalabilità virtualmente illimitata
• Opzioni per aggiornare/sincronizzare i dati
da sorgenti multiple attraverso scheduler
automatici e on-demand
• Architettura completamente abilitata al
Web in grado di fornire funzionalità
aziendali di ultima generazione da poter
utilizzare in ogni luogo al mondo
dell’azienda (ad esempio, tramite l’accesso
con Web browser da qualsiasi computer
connesso ad internet)
• Sistema avanzato di messa in sicurezza e
autenticazione degli utenti
• Opzioni complete per la gestione ottimizzata
di qualsiasi tipo di documento e per la
conformità con i requisiti regolamentari (ad
es., FDA 21 CFR Part 11, ISO 9000)
• Componenti analitici avanzati per la
pulitura/verifica dei dati e per l’integrazione
del data mining automatizzato, processi
d’intelligenza artificiale, ed il monitoraggio
di processi in tempo reale
• Opzioni per l’esecuzione automatica e l’invio
su Knowledge Portal di report altamente
personalizzati, inclusi report interattivi e di
risultati di analisi avanzate
• Opzioni di backup e di archiviazione
• Piattaforma programmabile,
personalizzabile, ed espandibile per
adattarsi a specifici profili di missione
(architettura aperta, esposta ad estensioni
attraverso i più comuni linguaggi industriali
standard, come VB, C++, Java, HTML)
• Realizzata sulla base di una tecnologia
robusta, ben testate, altamente scalabile,
che consentirà una buona integrazione con
gli altri investimenti in IT [si pensi alla
tecnologia altamente ottimizzata per
l’elaborazione di database in loco (IDP), al
308 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Appendice C: Famiglia dei Prodotti
multithreading reale, all’elaborazione
distribuita/parallela, ed al supporto per
sfruttare le risorse delle CPU di server
multipli al fine di ottenere prestazioni da
super-computer]
ecc.) attraverso sicuri portali d’accesso in
formato Web; per la distribuzione
d’informazioni chiave d’intelligence e
decisionali per il supporto di tutti i
dipartimenti dislocati nel mondo
STATISTICA Data Warehouse è una soluzione
completa per l’archiviazione dei dati e la
distribuzione/consegna delle informazioni per
consentire di personalizzare il flusso
d’informazioni attraverso la propria azienda, e
fornisce a tutti i membri autorizzati un accesso
flessibile, sicuro e rapido alle informazioni
critiche e alla reportistica intelligente.
Architettura e connettività. STATISTICA Data
Warehouse si connette a qualsiasi piattaforma,
database o sorgente di dati, potrà essere
scalato su applicazioni di business di qualsiasi
dimensione. Il programma viene è costruito su
uno schema di database personalizzato
secondo le proprie particolari esigenze di
business. La soluzione può essere installata sia
su motori di database ad alta prestazione (SQL
Server) così come su schemi di database
compatibili con la maggior parte dei database
industriali standard; quindi potrà essere
integrato in modo efficace in qualsiasi sistema
esistente di database.
Il sistema si basa su di una piattaforma
virtualmente indipendente e si adatterà a
qualsiasi architettura di database ed ambiente
hardware esistenti. Combinerà efficacemente
informazioni provenienti da database e sorgenti
in più formati (da form per l’inserimento
manuale dei dati a grandi batterie di periferiche
per la raccolta automatica dei dati). Il sistema
può essere ulteriormente migliorato attraverso
l’integrazione con altre componenti
completamente compatibili della linea di
applicazioni e soluzioni di STATISTICA; per
citarne alcune:
• STATISTICA Data Miner per soluzioni
avanzate di data mining e di intelligenza
artificiale (ad es., reti neurali) per il supporto
decisionale in metodi avanzati per
l’estrazione e la previsione di conoscenze
• Quality Control Miner ed Enterprise/QC per
l’integrazione completa con le attività di
controllo della qualità, di controllo dei
processi, e della gestione dei prodotti
• STATISTICA Text Miner per l’elaborazione
automatica d’informazioni non strutturate
nei documenti, database, o directory Web
(Web-crawling di URL)
• STATISTICA Knowledge Portal per la
presentazione di item agli utenti finali
(amministrazione, forze vendita, tecnici,
Dato che STATISTICA Data Warehouse non
dipende dal particolare fornitore di database o
dalla particolare piattaforma hardware, è esso
stesso interamente indipendente dal tipo di
piattaforma in uso. Il sofware di Data
Warehouse si connetterà a qualsiasi formato di
database e, quindi, potrà combinare e
raccogliere efficacemente l’informazione
proveniente da più sorgenti.
L’applicazione software di STATISTICA Data
Warehouse verrà eseguita su server con
processori multipli o su batterie di server a
processori multipli al fine di replicare
prestazioni da super-computer. Il sistema
potrà essere scalato senza sforzo ed
economicamente anche in presenza di
problemi che richiedono l’analisi di grandi
insiemi di dati.
Abilitazione al Web. STATISTICA Data
Warehouse estrae informazioni da fonti
collocate ovunque nel mondo e mette a
STATISTICA Guida di Riferimento – 309
Copyright © StatSoft, 2008
Appendice C: Famiglia dei Prodotti
disposizione informazioni a tutti i dipartimenti
e settori aziendali nel mondo.
La componente Web del sistema è stata
sviluppata sulla base della tecnologia testata
ed approvata di STATISTICA Enterprise Server,
e fornisce un accesso sicuro via Web browser.
Diversamente dalle altre soluzioni basate su
web, STATISTICA Data Warehouse non richiede
l’installazione di alcuna componente
aggiuntiva sui client.
Autenticazione e sicurezza avanzata.
STATISTICA Data Warehouse implementa un
sistema di sicurezza dettagliato e sofisticato
per garantire che le informazioni e le
conoscenze proprietarie siano non accessibili
ad utenti non autorizzati. Il sistema diventerà
probabilmente il più importante deposito delle
informazioni e delle risorse del supporto
decisionale della propria azienda. Pertanto, la
sicurezza del sistema è un priorità cruciale per
impedire accessi alle informazioni non
autorizzati.
STATISTICA Data Warehouse implementa il più
alto livello di sicurezza grazie alla possibilità di
definire gruppi di utenti ad ognuno dei quali
vengono assegnati differenti livelli di
autorizzazione (riguardo all’informazione
accessibile e alle operazioni da poter eseguire),
la richiesta regolarmente aggiornata di
password, ecc. Attualmente sono allo studio
metodi per difendere il sistema contro
l’attacco sistematico d’intrusioni elettroniche
(“hacking”).
Controllo dei documenti. STATISTICA Data
Warehouse consente una gestione completa
dei documenti, conforme con gli standard
governativi e industriali.
STATISTICA Document Management System
può essere integrato senza alcun problema
nella propria integrazione di STATISTICA Data
Warehouse al fine di ottimizzare il flusso
informativo presente nella propria azienda e
quindi di migliorare la produttività. Questo
sistema può anche essere configurato per
soddisfare tutti i requisiti richiesti dalle polizze
(aziendali) sulla gestione documentale o dalle
normative regolamentative per la messa in
sicurezza dei documenti, la tracciabilità, la
firma/autenticazione elettronica (come, ad
esempio, stipulato in FDA 21 CFR Part 11:
Electronic Records; Electronic Signatures; or ISO
9001 4.5: Document and data control).
Analisi avanzate. STATISTICA Data
Warehouse può incorporare le analisi dei dati
più avanzati così come i metodi più moderni
per l’estrazione delle conoscenze disponibili; è
possibile andare oltre ad OLAP per
semplificare ed estrarre le informazioni
relative anche alle tendenze più complesse –
ed inaccessibili da altri strumenti – presenti nei
dati.
Dato che STATISTICA Data Warehouse si basa
sulle medesime componenti altamente
prestazionali caratteristiche dell’intera linea di
prodotti software di STATISTICA, tali soluzioni
analitiche possono essere integrate senza
alcuna difficoltà nel proprio Data Warehouse.
STATISTICA offre l’insieme più completo di
strumenti per il data mining, il text mining,
l’analisi dei dati, la produzione dei grafici e la
visualizzazione, il controllo della qualità e dei
processi (incluso Six Sigma), ecc., disponibile sul
mercato. Tali risorse e tecnologie possono
essere connesse alle sorgenti di dati definite in
STATISTICA Data Warehouse per sfruttare le
tecnologie e gli algoritmi più avanzati disponibili
per l’analisi e l’estrazione d’informazioni chiave
da tutte le risorse disponibili. Ad esempio, è
possibile applicare centinaia di architetture di
reti neurali, classificatori ad albero altamente
prestazionali (ad es., alberi boosted a gradiente
stocastico), root cause analysis stocastica,
metodi per la produzione di carte di controllo,
310 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Appendice C: Famiglia dei Prodotti
potenti metodi di previsione, o sofisticati
strumenti di rappresentazione grafica delle
analisi per la conversione dei dati grezzi presenti
nel Data Warehouse in informazioni
d’intelligence utili e azionabili con chiare
implicazioni per la determinazione decisionale
nel proprio business.
Programmabilità e personalizzazione.
STATISTICA Data Warehouse è un sistema ad
architettura aperta che non vincolerà l’utente
in una relazione a lungo termine con un
singolo fornitore o con una singola soluzione; è
possibile rispondere velocemente a nuove
richieste e domande che necessitano di essere
incorporate nel Data Warehouse.
Come per tutte le applicazioni e soluzioni della
famiglia di prodotti di STATISTICA, STATISTICA
Data Warehouse è totalmente programmabile
e personalizzabile, attraverso l’uso degli
struenti di programmazione industriali
standard quali Visual Basic, C++, Java, or
HTML. Questa caratteristica è d’importanza
chiave quando il proprio business dipende
dalla propria capacità di adattarsi rapidamente
alle nuove informazioni e realtà di business.
Dato che è possibile personalizzare il sistema
senza essere costretti ad affidarsi a
programmatori di una singola azienda oppure
ad utilizzare convenzioni idiosincratiche di
scripting (richieste dalla maggior parte dei
fornitori di soluzioni concorrenti), sarà
possibile avere la libertà di sviluppare le
proprie estensioni proprietarie al Data
Warehouse e aggiungere non solo propri
report ma anche trasformazioni analitiche
personalizzate, procedure di pulitura dei dati
attraverso l’uso di risorse e strumenti
ampiamente disponibili (ad es., strumenti e
programmatori VB, C++, Java, od HTML).
Naturalmente StatSoft può sempre offrire un
servizio completo di consulenza,
d’integrazione con sistemi e servizi di
programmazione sviluppati da uno staff ricco
d’esperienza.
VERTICAL MARKET APPLICATIONS
PROCEED. Una soluzione software che
estrae relazioni casuali fondamentali
tra i prodotti e processi produttivi, utilizzando i
dati già raccolti. PROCEED implementa
l’approccio in attesa di brevetto, sviluppato e
collaudato da Caterpillar Inc. e alimentato
dalla Piattaforma Analitica di STATISTICA
Enterprise.
Al giorno d’oggi, le imprese manifatturiere
hightech raccolgono grandi quantità di dati,
relativi ai:
• processi produttivi,
• test sulle materie prime, sui semilavorati e
sui materiali in lavorazione.
• fattori critici della qualità dei prodotti finiti.
La raccolta e l’immagazzinamento dei dati
sono alimentati dall’incremento continuo
dell’automazione, delle tecnologie di
archiviazione e deposito dei dati e dei sensori e
delle altre tecniche di misurazione. Oggi le
imprese sarebbero sedute su di una miniera
d’oro di informazioni, se solo fossero in grado
di tradurle in dati fruibili.
La raccolta dei dati non è sufficiente per
effettuare un cambiamento aziendale. Per
perseguire questo obiettivo, è necessario
tradurre questi dati in conoscenza, e quindi
comunicarla in un formato che consenta alle
persone autorizzate di sfruttarne il contenuto.
Se si desidera avere un Ritorno degli
Investimenti dai dati collezionati, si deve
utilzzare PROCEED.
PROCEED combina metodi di estrazione delle
conoscenze tradizionali e innovativi, per:
STATISTICA Guida di Riferimento – 311
Copyright © StatSoft, 2008
Appendice C: Famiglia dei Prodotti
• Derivare e convalidare relazioni casuali
semplici e complesse tra i processi
produttivi e i risultati qualitativi dei prodotti
• Distribuire le informazioni per consentire ai
gestori dei processi ed ai lavoratori di
confrontare diversi scenari what-if e per
ottimizzare simultaneamente più risultati
concorrenziali.
STATISTICA PowerSolutions. Un
pacchetto di soluzioni studiato per
essere utilizzato nel settore della produzione
energetica e per l’ottimizzazione della
prestazioni degli impianti energetici, l’aumento
dell’efficienza, e la riduzione delle emissioni.
Questo prodotto offre un’alternativa
estremamente economica agli investimenti
miliardari in nuove strumentazioni (hardware).
Basato su più di 20 anni di esperienza
nell’applicazione di tecnologie di data
mining/ottimizzazione predittivo, STATISTICA
PowerSolutions consente agli impianti di
produzione energetica di sfruttrare al meglio la
strumentazione ed i sistemi di controllo
esistenti applicati ai dati raccolti in tutti gli
stabilimenti allo scopo d’identificare le
opportunità di miglioramento.
312 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Guida di Riferimento: Indice
INDICE
.
.NET; 273
A
abilitazione al web; 7
ActiveX; 187; 200; 219; 261
documenti; 262
oggetti; 261
aggiungi informazioni
supplementari; 147
aggregazione; 101
AIAG manuale MSA; 61
Aiuti; 27; 35; 39; 281
albero, report; 201
algoritmo BFGS; 300
algoritmo conjugate gradient;
300
algoritmo gradient descent;
300
Algoritmo NIPALS; 300
ambienti regolati; 112
analisi
automatiche; 44
auto-minimizza; 144
chiudi tutte; 144
misurazioni di attributo; 61
produzione; 61
pulsanti, barra di analisi;
143; 150
rapida vs. avanzate; 18
registrazione; 252
ri-esegui; 259
riprendi; 41; 260
analisi canonica; 300
analisi dei dati, interattiva; 43
analisi dei fattori; 300
analisi dei gruppi; 300
analisi dei processi; 301
analisi dell’attendibilità/degli
item; 300
analisi della potenza; 300
analisi delle componenti
principali / di
classificazione; 300
analisi delle corrispondenze;
300
analisi delle misurazioni di
attributo; 61
analisi di Capacità. Cfr. analisi
di capacità di processo
analisi di capacità di processo;
57
analisi di sequenze
associazioni e collegamenti;
303
analisi di sopravvivenza; 300
analisi di Weibull; 301
analisi discriminante; 300
analisi esplorativa dei dati;
48; 55
analisi interattiva dei dati; 43;
48
analisi log-lineare delle
tabelle di frequenza; 300
analisi per-gruppo; 52
esempio; 47
analisi per-gruppo ad-hoc; 55
ANOVA
piani a misure ripetute; 37
piani ad una via; 37
aprire un file dati; 12
attributo di
accettazione/rifiuto; 61
B
barra degli strumenti Accesso
Rapido; 11
barra di Accesso Rapido; 155
barra di analisi; 143; 144; 150
barra di stato; 144
barra multifunzione; 11; 13
barre degli strumenti
definite da utente; 154
personalizzare; 154
barre degli strumenti definite
da utente; 154
blocco di spreadsheet; 115
blocco, deseleziona; 17
browser web, usando
STATISTICA; 107
brushing; 147; 226
C
C/C++; 6
carta EWMA; 301
carta somma cumulata; 301
carte di analisi dei
processi/capacità; 301
carte di controllo della
qualità; 301
carte di medie/range mobili;
301
carte di Pareto; 301
carte X-bar e R; 301
casi
filtrare i duplicati; 92
chiudi tutte le analisi; 144
classification trees; 300
clausola from, STATISTICA
Query; 199
clausola join, STATISTICA
Query; 199
clausola select, STATISTICA
Query; 199
clausola where, STATISTICA
Query; 199
codici; 39; 119
dati mancanti; 98
componenti della varianza; 300
componenti di varianza per
effetti random; 301
componenti principali; 302
STATISTICA Guida di Riferimento – 313
Copyright © StatSoft, 2008
Guida di Riferimento: Indice
configurazione analisi,
STATISTICA Enterprise; 132
configurazione dati,
STATISTICA Enterprise; 127
configurazioni, differenti; 240
configurazioni, rete; 240
controllo statistico di
processo multivariato; 301
copia; 24
copia con intestazioni; 24
copia e incolla; 201
correlazioni significative; 22
correlazioni, significattive; 22
credit scorecards; 306
credit scoring; 70
Credit Scoring; 306
D
Data Miner; 302
Data Miner Recipes; 65; 69
deployment; 77
file di progetto; 68
file di registro; 69
nodi (passi); 70
preparazione dei dati; 71
ridondanza dei dati; 73
riepilogo; 78
data warehouse; 307
database remoti; 267
database, accesso ai dati
direttamente da; 87
dataset di esempio; 49
dati
accesso direttamente da
database; 87
basata su ID; 305
basati su ID; 101
carica esterni; 266
filtra casi duplicati; 92
filtra sparsi; 95
formule di trasformazione;
79; 82; 83
gestione; 79
indicizzati temporalmente;
304
indicizzati-temporalmente;
101
mancanti; 97
produzione; 50
pulitura e filtraggio; 92
registrazione; 92; 94
ricodifica; 92; 98
su server remoti; 267
trasformazione; 311
dati basati su ID; 101; 305
dati indicizzati
temporalmente; 101; 304
dati mancanti; 66; 68; 86; 95;
97; 98; 99
definisci valore di; 97; 98
sostituzione di; 98
debugger, STATISTICA Visual
Basic; 247
deployment; 68; 77
deployment dei modelli; 302
diagrammi causa-ed-effetto;
301
diagrammi di Ishikawa; 301
DIN 55319; 57
distribuzione del modello,
dipendente dal tempo; 60
document management
system; 181
E
editor di formule; 79
Editor Specifiche di Variabile;
14
elaborazione parallela; 290
Electronic Statistics Textbook;
28; 282
enterprise/QC networks; 304
esempi
accesso ai dati
direttamente da
database; 87
analisi per-gruppo; 47
analitici; 11
ANOVA; 36
caricare dati esterni tramite
STATISTICA Query; 266
correlazioni; 11
dati di input direttamente
da Excel; 84
formule di spreadsheet,
formule batch; 79
gruppi di variabili; 44
pannelli di riepilogo dei
risultati; 56
preparazione dei dati –
pulitura e filtraggio; 92
registrare un’analisi; 252
registrare una macro; 252
STATISTICA Data Miner
Recipes; 65
STATISTICA Enterprise; 121
STATISTICA Enterprise
Server; 107
STATISTICA Visual Basic;
252
utilizzare STATISTICA
Estrarre, Trasformare e
Caricare; 101
utilizzare STATISTICA in
ambienti regolati; 112
esempi analitici; 11
esempio di correlazioni; 11
esempio di gruppi di variabili;
44
esempio di query; 266
Esempio su ANOVA; 36
esportazione dell’output; 7
estrazione, trasformazione e
caricamento; 304
etichette dei casi; 228
etichette, casi; 228
314 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Guida di Riferimento: Indice
Excel; 84; 157; 164; 168; 187;
199; 201; 219; 262
apri in STATISTICA; 158
dati di input direttamente
da; 84
F
fattori, organizzazione; 42
file dati
apertura; 12
sottoinsieme; 100
unione; 100
File PDF
salvare su; 170
filtrare dati sparsi; 95
filtrare dei dati. Cfr. pulitura e
filtraggio dei dati
filtrare i casi duplicati; 92
filtro automatico; 148
filtro di variabili; 148
finestra
Benvenuti in STATISTICA;
12
finestra Apri un File Dati di
STATISTICA; 12
finestra Benvenuti in
STATISTICA; 12
finestra Brushing; 227
finestra Connessione a
Database; 87
finestra di Gestione Output di
Analisi/Grafico; 24
finestra di selezione delle
variabili; 148
finestra Gestore Output di
Analisi/Grafico; 26
finestra Interfaccia Utente; 11
finestra Opzioni; 15; 26; 149;
237
Grafici; 210
finestra Personalizza; 154
finestra specifiche di
variabile; 13
finestra Visualizzatore
Funzioni; 80
finestre
Apri un File Dati di
STATISTICA; 12
auto-minimizza; 151
auto-propositiva; 19
Brushing; 227
Connessione a Database;
87
definizione analisi; 146
Editor Specifiche di
Variabile; 14
Gestore Gruppi di Variabile;
44
Gestore Output di
Analisi/Grafico; 26
Gestore Output di
Analisi/Grafico; 24
Interfaccia Utente; 11
Opzioni; 15; 26; 149; 237
Panello d’Avvio; 12
Personalizza; 154
risultati; 147
selezione delle variabili;
148
selezione output(risultati);
147
specifiche di variabile; 13
Visualizzatore Funzioni; 80
finestre di definizione
dell’analisi; 146
finestre singole; 167
lunghezza coda; 167
formato STR; 200
formattazione delle celle,
spreadsheet; 195
formule; 14; 79
risultati; 80
spreadsheet; 13
formule batch; 79; 82
formule di spreadsheet; 13
funzionalità analitiche; 3
funzionalità di recupero; 164
funzionalità multitasking; 143
funzione
richiamabile esternamente;
249; 250; 299
usata internamente; 79; 80
utilizzata internamente;
113; 216; 249
funzione richiamabile
esternamente; 4
funzione ritardo; 79
funzioni
usate internamente; 12
G
gestione dell’output; 163
gestione output; 149
Gestore Output; 24; 26; 149;
163
globale; 24
opzioni; 15
grafici; 202; 209
a torta; 215
aggiornamento automatico;
158
blocchi di dati; 220; 223
brushing; 226
categorie; 219
creazione tramite
STATISTICA Visual Basic;
231
dati di input; 220
definiti dall’utente; 211
menu contestuali; 31
personalizzati; 224
personalizzazione; 31; 210;
225; 239
predefiniti; 224; 239
prodotti dagli spreadsheet;
30
STATISTICA Guida di Riferimento – 315
Copyright © StatSoft, 2008
Guida di Riferimento: Indice
riassuntivi; 22
riepilogo; 56
specializzati; 230
stati di caso; 226
stili; 211
strumenti di disegno; 31
grafici a torta; 215
grafici del menu grafici; 225
grafici di blocchi di dati; 220;
223
grafici di dati di input; 220
grafici di variabilità; 50
grafici personalizzati; 224
grafici predefiniti; 224
grafici riassuntivi; 22; 56
grafici specializzati; 230
graphs
STATISTICA Visual Basic;
211
gruppi, variabile; 44
GxP
applicazioni; 112
report; 118
H
HTML; 303; 311
integrazione con Microsoft
Word; 158
integrazione con Office; 157
integrazione con Office; 262
integrazione server; 107
interfaccia utente
analisi interattive; 145
funzioni generali; 141
interattiva; 144
personalizzazione; 141; 235
STATISTICA Enterprise
Server; 290
interfaccia utente
personalizzata, STATISTICA
Enterprise; 135
intestazione di variabili; 195
intestazioni di caso; 194
ISO 21747; 57
J
Java; 6
K
k-nearest neighbor; 98
knowledge portal; 173; 177
L
I
IDP (tecnologia database inloco); 267
importa dati; 289
importazione dati; 6
importazione dei dati; 158
importazione di dati; 267
impostazioni predefinite; 238
informazioni supplementari,
aggiungere; 147
installazioni Enterprise; 107
integrazione con Microsoft
Office; 157; 262
libreria COM Interop; 275
libreria degli oggetti; 273
limiti di specificazione del
processo; 59
limiti, specificare
superiore/inferiore; 59
linguaggio R; 245
linguaggio R; 4
Live Score; 306
login integrato; 107
M
macro; 44; 203
allega a barre degli
strumenti/menu; 251
analisi; 246
esegui da riga di comando;
252
globali; 251
master; 247
modifica; 258
record; 44
registrazione; 4; 55; 203;
243; 246; 247
tastiera; 247
macro da tastiera; 247
macro delle analisi; 246
macro globali; 251
Manuale Elettronico; 27; 39;
281
Manuale Elettronico; 35
mappe di caratteristiche autoorganizzanti; 300
master macro; 247
matrice di correlazione; 16
menu
contestuali di spreadsheet;
14
definiti dall’utente; 155
menu classici; 13
menu classici; 11
menu contestuali; 14
grafici; 31
menu definiti dall’utente; 155
menu Start; 17
menu start di STATISTICA; 222
minimi quadrati parziali; 302
modelli a rischi proporzionali di
Cox; 300
modelli ai minimi quadrati
parziali generali; 300
modelli di analisi
discriminante generale; 300
modelli di equazioni
strutturali; 300
316 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Guida di Riferimento: Indice
modelli di regressione generali;
300
modelli lineari generali; 39;
299
modelli lineari/non lineari
avanzati; 299
modelli lineari/non lineari
generalizzati; 299
modello con distribuzione
dipendente dal tempo; 60
moduli; 145
moduli di STATISTICA; 145
monitoring and alerting
server; 304
multithreading; 289
N
nascondi finestre; 152
nascondi il riquadro
informativo; 152
note, nei registri; 165
O
oggetti
collegati; 16
integrati; 16
Oggetti OLE; 201
oggetto applicazione; 276
OLAP; 265; 268
OLE DB; 87; 197; 265
online statistics textbook
statistico online; 282
operazioni di gestione dei
dati; 14
oppioni
nascondere riquadro
informativo; 152
optioni
auto minimizza; 151
opzioni
nascondi su selezione; 152
porta in primo piano; 152
riprendi analisi; 151
salvataggio automatico;
164
opzioni statistiche descrittive;
53
Oracle; 265
organizzazione dei fattori; 42
ottimizzazione dei processi;
302
outlier; 66; 230
ricodifica; 96
outliers; 30
output; 15; 22
finestre singole; 167
grafici; 202
HTML; 171
Microsoft Word; 171
PDF; 170
registri; 164; 187
report; 167; 199
spreadsheet; 192
web; 173
output HTML; 171
output sul web; 173
output web; 16
output, gestione; 163
P
Panello d’Avvio; 12
pannelli di riepilogo dei
risultati; 56
Pannello d’Avvio; 145
pannello delle opzioni; 15
panoramica generale
caratteristiche uniche; 4
tecnologia software; 6
panoramica generale
funzionalità analitiche; 3
panoramica generale
abilitazione al web; 7
percettroni multistrato; 300
PerGruppo pulsante; 48
permessi del gruppo,
STATISTICA Enterprise; 123
personalizzazione; 12; 251
accesso alternativo ai
servizi; 142
altre applicazioni; 155
aspetto di STATISTICA; 235
barre degli strumenti; 154
differenti configurazioni di
STATISTICA; 240
documenti; 236
grafici; 31; 210; 239
impostazioni predefinite
generali; 238
interfaccia utente; 141; 235
locale vs. permanente; 237
operazioni di STATISTICA;
235
rete; 240
STATISTICA Visual Basic;
155; 243
personalizzazione dei
documenti; 236
PI connector; 307
piani ANOVA a misure
ripetute; 37
piani ANOVA ad una via; 37
piani campionari; 301
piani centrali compositi; 301
piani fattoriali frazionali; 301
piani mistura; 301
piani Taguchi; 301
pianificazione degli
esperimenti; 301
predefiniti
insiemi alternativi; 239
problemi nell’analisi di grandi
insiemi di dati; 55
PROCEED; 311
processi industriali; 305
produzione
analisi; 61
STATISTICA Guida di Riferimento – 317
Copyright © StatSoft, 2008
Guida di Riferimento: Indice
dati; 50
processo; 58
produzione energetica, ottima
le prestazioni; 312
progetti. Cfr. Progetti di
STATISTICA
progetti di STATISTICA; 204
salvataggio; 205
programmare STATISTICA da
.NET; 273
pulitura dei dati; 92
pulsante
Opzioni; 24
pulsante Apri..; 12
pulsante Espandi; 20
pulsante Funzioni; 80
pulsante Opzioni; 24; 26; 149
Crea Macro; 254
pulsante Tutte le Specifiche;
14
pulsante Zoom; 20
pulsanti
Apri Dati; 12
Espandi; 20
Funzioni; 80
Opzioni; 26; 149
PerGruppo; 48
Tutte le Specifiche; 14
Zoom; 20
Q
quadrati Latini; 301
qualità sixpack; 56
query; 265
R
recipe. Cfr. Data Miner
Recipes
registrare analisi; 252
registrazione della
tracciabilità; 112
registri; 23; 164; 187
albero; 189
copia e incolla; 191
freccia rossa; 259
icone; 190
note e commenti; 165
panoramica; 187
ri-esecuzione delle analisi;
259
salva come pqgina web;
166
schede; 153; 188
registri delle analisi; 23
registri di STATISTICA; 164
regressione non lineare fissa;
300
report; 25; 167; 199
albero; 201
aprire uno salvato; 26
da registri; 169
GxP; 118
HTML; 171
Microsoft Word; 171
multipli; 26
PDF; 170
rich text format; 169
report Acrobat; 170
report di riepilogo; 58
report di riepilogo in
documento singolo; 58
report Microsoft Word; 171
report PDF; 170
reporti
singolo; 26
requisiti di tracciabilità; 112
reti di funzioni a base radiale;
300
reti enterprise; 304
reti neurali; 300; 302
reti neurali automatizzate; 300
reti neurali di serie storiche;
300
richiedere agli utenti di
inserire dei commenti; 113
ricodifica
outlier; 96
ricodifica dei dati; 79
riepilogo delle analisi; 60
rilevamento delle frodi; 306
ripetibilità / riproducibilità
delle misurazioni; 301
riprendere l’analisi; 41
riprendi analisi; 151
ripristino analisi; 260
riquadro informativo; 152
riquadro informativo,
spreadsheet; 194
risultati capacità di processo;
61
RTF
formato; 200
report; 169
S
salvataggio automatico; 164
SAP; 265
scaling multidimensionale;
300
scaricare i compiti; 107
scheda Avanzate; 19
scheda Data Mining; 149
scheda Dati; 13; 23
scheda Grafici; 150
scheda Modifica; 31
scheda rapido; 5
scheda Rapido; 18
scheda Rapido; 19
scheda Rapido; 235
scheda Statistiche; 149
scheda visualizza; 237
schede
Avanzate; 19
Data Mining; 149
Dati; 13; 23
318 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Guida di Riferimento: Indice
Grafici; 150
Modifica; 31
Rapido; 18
Statistiche; 149
visualizza; 237
schede, registri; 153
Scorecard; 307
scorrimento separato negli
spreadsheet; 32
serie storiche/previsioni; 300
server - remoti, elaborazione
in-loco di dati; 267
server remoti; 267
server remoti, elaborazione inloco; 267
SharePoint; 181
sistema di gestione dei
documenti; 307
Sistema di Gestione dei
Documenti di STATISTICA;
181; 307
Sistemi di STATISTICA
Enterprise; 302
sistemi enterprise; 302
sito web di StatSoft; 282
sito web, StatSoft; 282
six sigma; 56
strumenti; 301
soddisfare i requisiti di
conformità; 115
sottoinsieme, creazione; 100
specificare limiti
superiore/inferiore; 59
spreadsheet; 12; 192
aggiungere casi; 23
aggiungere variabili; 23
aspetto predefinito; 237
barra dei titoli; 193
blocco; 115
copia; 24; 33
deseleziona; 17
inserisci; 34
riempimento automatico;
34
sposta; 33
copia-e-incolla; 33
copiare un blocco; 33
definizione di password;
114
formattazione delle celle;
195
formule; 79; 81
formule batch; 82
input; 196
input e output; 196
inserire un blocco; 34
intestazione; 194
intestazioni di caso; 194
intestazioni di variabili; 195
menu contestuali; 23
output; 196
protezione con password
vs. blocco; 114
riempimento automatico
del blocco; 34
riquadro informativo; 194
risultati; 22
scorrimento separato; 32
sola lettura; 114
specifica come input; 23
spostare un blocco; 33
stampa; 25
tracciabilità; 115
spreadsheet con definizione
di password; 114
spreadsheet dei risultati; 22
spreadsheet di dati; 12
spreadsheet di input; 196
spreadsheet di input e di
output; 196
spreadsheet di output; 196
spreadsheet di sola lettura;
114
SQL; 87; 91; 265; 309
standard industriali,
compatibilità; 293
stati di caso; 147; 226
escluso; 229
nascosto; 229
statist.exe; 275
STATISTICA
tecnologia software; 6
STATISTICA
caratteristiche uniche; 4
panoramica generale; 3
STATISTICA
Aiuti; 13
STATISTICA
menu Start; 17
STATISTICA
Aiuti; 27
STATISTICA
controllo da altre
applicazioni; 155
STATISTICA
personalizza aspetto; 235
STATISTICA
programmare da .NET; 273
STATISTICA
libreria degli oggetti; 273
STATISTICA
sostenere più versioni; 275
STATISTICA
versione della Libreria; 276
STATISTICA
supporto tecnico; 282
STATISTICA
numero di serie; 282
STATISTICA
numero di serie; 283
STATISTICA
caratteristiche del sistema;
299
STATISTICA Analisi dei
Processi; 301
STATISTICA Analisi della
Potenza; 300
STATISTICA Guida di Riferimento – 319
Copyright © StatSoft, 2008
Guida di Riferimento: Indice
STATISTICA Analisi di
Sequenze Associazioni e
Collegamenti; 303
STATISTICA Base; 299
STATISTICA Carte di Controllo
della Qualità; 301
STATISTICA Controllo
Statistico di Processo
Multivariato; 301
STATISTICA Credit Scoring; 306
STATISTICA Data Miner; 302
STATISTICA Data Miner
Recipes; 65; 69
deployment; 77
file di progetto; 68
file di registro; 69
nodi (passi); 70
preparazione dei dati; 71
ridondanza dei dati; 73
riepilogo; 78
STATISTICA Data Warehouse;
307
STATISTICA Enterprise; 121;
304
crea configurazione analisi;
132
crea configurazione dati;
127
crea connessione a
database; 124
crea nodo visualizzatore
sistema; 124
crea nuovo utente; 122
esegui configurazione
analisi; 134
esempio; 121
interfaccia utente
personalizzata; 135
vista ad oggetti; 121
vista di sistema; 121
STATISTICA Enterprise
Manager; 121
STATISTICA Enterprise Server;
107; 173; 177; 305
demo; 295
deposito del server; 110
knowledge portal; 173
risparmia spazio server; 111
scheduling facilities; 108
STATISTICA Enterprise/QC;
304
STATISTICA Estrarre,
Trasformare e Caricare; 101
STATISTICA Estrazione,
Trasformazione e
Caricamento; 304
STATISTICA Live Score; 306
STATISTICA Modelli
Lineari/Non Lineari
Avanzati; 299
STATISTICA Monitoring and
Alerting Server; 304
STATISTICA MultiStream; 305
STATISTICA Ottimizzazione
dei Processi; 302
STATISTICA PI Connector; 307
STATISTICA Pianificazione
degli Esperimenti; 301
STATISTICA PowerSolutions;
312
STATISTICA Query; 87; 198;
265
anteprima dati; 90
carica dati esterni; 266
clausola from; 199
clausola join; 199
clausola select; 199
clausola where; 199
STATISTICA Reti Neurali
Automatizzate; 300
STATISTICA Scorecard; 307
STATISTICA Sistemi di Data
Mining Aziendali; 302
STATISTICA Stima di Varianza
e Precisione; 300
STATISTICA Tecniche
Esplorative Multivariate;
300
STATISTICA Text Miner; 303
STATISTICA Visual Basic; 44;
155; 203; 211; 243
creazione grafici; 231
editor e debugger; 247
esecuzione dei programmi;
249
esempio; 252
macro da tastiera; 247
macro delle analisi; 246
master macro; 247
metodi; 156
proprietà; 156
struttura; 250
STATISTICA Visual Basic.NET;
244
statistiche descrittive
semplici; 55
statistiche per gruppi; 53
statistics textbook, online; 282
stima di varianza e precisione;
300
stima non lineare; 300
strumenti per la produzione di
energia; 305
suggerimento, statistico; 35
Suggeritore Statistico; 35; 282
support vector machines; 302
supporto; 282
supporto per analisi multiple;
142
supporto tecnico; 282
SVB; 203; 243
SVB Avanzato; 244
T
tabella di tutti gli effetti; 42
tabelle di frequenza; 55
tabelle multidimensionali; 12
320 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011
Guida di Riferimento: Indice
tabelle multimediali; 192
tasto F1; 13
tecniche esplorative
multivariate; 300
tecnologia database in-loco
(IDP); 267
Teradata; 269
test delle sequenze; 301
text miner; 303
timbro dell’ora; 119
timbro di creazione; 119
tipi di documenti; 152
tracciabilità; 118
tracciabilità, spreadsheet; 115
trattare dati mancanti; 97
trattare variabili invarianti; 96
U
selezioni ripetute; 44
tipi di misurazione; 147
VEPAC; 300
vista ad albero; 15
Visual Basic; 243
metodi; 156
proprietà; 156
W
WebSTATISTICA
pubblicazione dei
contenuti; 174
Word; 155; 158; 164; 171;
187; 201; 219; 262
X
XML; 303
unire i file dati; 100
V
variabile
blocco; 17
cambia formato; 13
cambia nome; 13
convenzioni di selezione; 20
formula; 14
selezione; 20
specificazioni; 13
tratta invarianti; 96
Variabile finestra Gestore
Gruppi; 44
variabili
filtro; 148
gruppi; 44
Suggerimenti; 47
organizzare grandi insiemi;
44
pre-selezione automatica;
147
riordinare; 51
STATISTICA Guida di Riferimento – 321
Copyright © StatSoft, 2008
Quick Reference
322 – STATISTICA Guida di Riferimento
Copyright © StatSoft, 2011