Disegno degli esperimenti

Corso Metodi quantitativi per la gestione aziendale
Direzione prof. Silvia Biffignandi
Corso Fondo Sociale Europeo 1997
Dipartimento di Matematica, Statistica, Informatica e Applicazioni
Sede: Università di Bergamo
Materiale didattico
IL DESIGNO DEGLI ESPERIMENTI
Esempi introduttivi
a cura di
Sergio Bonzani
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
IL DESIGNO DEGLI ESPERIMENTI
1. INTRODUZIONE
L’insieme di tecniche statistiche atte ad indagare gli effetti di determinate condizioni
o fattori sui risultati di un esperimento scientifico prende il nome di disegno degli
esperimenti (DOE). Nella teoria e pratica statistica il DOE è materia piuttosto vasta
che utilizza come strumento fondamentale di ricerca l’analisi della varianza (ANOVA).
Questa breve trattazione si propone di delineare i tratti distintivi del DOE rispetto ad
altri campi della statistica (ad esempio rispetto al controllo di qualità ed alle indagini
osservazionali) e di fornire alcune definizione di base che permettano anche ad un non
esperto di comprendere le linee guida di un esperimento statistico. Non è invece nei
nostri obiettivi discutere di quell’insieme di tecniche che va sotto il nome di ANOVA;
rimandiamo il lettore interessato ad una delle molte pubblicazioni in materia (vedi
bibliografia).
2. DISEGNO DEGLI ESPERIMENTI E CONTROLLO DI QUALITA’
Nella dispensa dedicata al controllo di qualità abbiamo presentato e discusso un
insieme di idee e tecniche, sia formali che grafiche, utili ad una gestione d’azienda
1
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
fondata sul principio della qualità e sul suo perseguimento. Molti degli strumenti
presentati aiutano a comprendere un processo, a tenerlo sotto sorveglianza ed a
descriverne le caratteristiche.
Tuttavia il controllo statistico di qualità rappresenta uno strumento d’intervento di tipo
passivo, dal momento che ogni azione correttiva intrapresa dall’operatore viene
generata da segnali inviati dal processo stesso. Si pensi, ad esempio, ad una carta di
controllo che segnali la necessità di intervenire sul processo alla ricerca di una causa
speciale di variazione, senza per questo porre dei dubbi sull’efficienza di fondo del
processo stesso, la cui natura non viene comunque modificata dall’intervento
dell’operatore. Al contrario il DOE rappresenta uno strumento attivo di ricerca,
approccio scientifico-formale alla valutazione delle potenzialità di un processo, basato
su interventi pianificati volti al suo costante miglioramento.
In altri termini il DOE è strumento di ricerca maggiormente destinato a fornire
informazioni per il supporto gestionale e ad individuare l’esigenza di interventi che
possono essere anche radicali. Le tecniche di disegno degli esperimenti divengono
fondamentali quando il processo è caratterizzato da una non ottimalità di fondo,
piuttosto che da una causa speciale di variazione come nel caso del controllo di qualità.
Intervenendo attivamente sul processo e studiando l’effetto di vari fattori sui
risultati, diviene possibile specificare le condizioni sotto le quali il processo in
questione possa essere ottimizzato.
3. DESIGNO DEGLI ESPERIMENTI E STUDI OSSERVAZIONALI
2
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
Si definisce esperimento una ricerca condotta sotto condizioni controllate il cui
obiettivo sia quello di valutare l’effetto di tali condizioni (o fattori) sui risultati
osservabili dell’esperimento stesso. Il ricercatore decide sotto quali condizioni
operare.
In questa semplice definizione sta molta della peculiarità del DOE. Il disegno degli
esperimenti contrasta, in questo senso, con le ricerche di tipo osservazionale (si pensi
ad esempio ad un’indagine campionaria), dove nessuna delle condizioni è fissata dal
ricercatore ed in cui i dati vengono semplicemente raccolti ex-post e non influenzati a
priori dal ricercatore stesso.
L’organizzazione e la messa in opera di uno studio osservazionale è generalmente più
semplice di quanto non sia la pianificazione di un esperimento. Non esiste virtualmente
alcun ambito scientifico nel quale non sia possibile organizzare uno studio
osservazionale e nella stragrande maggioranza dei casi esso costa meno di quanto non
possa costare un esperimento ben articolato, dal momento che l’attività di controllo dei
fattori comporta un notevole dispendio di tempo e risorse. Inoltre, in alcune discipline
la via dello studio osservazionale è obbligata (in particolare si pensi a tutte le
discipline a carattere socio-economico) dal momento che in tali ambiti non è
concettualmente possibile porre in essere un esperimento.
Il DOE
si presta particolarmente ad applicazioni nel settore produttivo e di
laboratorio; applicazioni più frequenti e interessanti si trovano nell’industria (chimica,
meccanica,
tessile
ecc.),
nell’agricoltura
farmacologica.
3
e
nella
sperimentazione
medica
e
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
Sebbene in tali campi la via dello studio osservazionale sia comunque praticabile, un
esperimento fornisce risposte a domande a cui uno studio osservazionale non è in
grado di rispondere. Si considerino ad esempio le seguenti due situazioni.
A) ESPERIMENTO: Si è condotto un esperimento allo scopo di studiare gli effetti
della nicotina su alcune cavie da laboratorio. Ad un gruppo di cavie (definito gruppo
trattato) venne applicata sul dorso una soluzione contenente nicotina. Ad un secondo
gruppo (definito gruppo di controllo) fu applicata una soluzione simile, ma senza il
contenuto di nicotina. Al fine di studiare l’impatto del fattore sperimentale, entrambi
i gruppi di cavie furono osservate dopo qualche tempo. Ne risultò che le cavie sul
cui dorso era stata applicata la soluzione contenente nicotina presentavano una
forma di cancro alla pelle, le altre no.
B) STUDIO OSSERVAZIONALE: Un indagine campionaria sul consumo di sigarette tra
la popolazione bergamasca riscontrò una relazione molto stretta tra cancro ai
polmoni e numero medio di sigarette fumate al giorno.
La principale differenza tra le due ricerche sopra descritte consiste nel fatto che,
mentre
l’esperimento
A
dimostra
l’esistenza
di
una
relazione
causa-effetto
(monodirezionale) tra nicotina e cancro, l’indagine B in realta non ci assicura in alcun
modo che la nicotina causi il cancro. Tale indagine coglie semplicemente un’associazione
tra i due fenomeni. La relazione causa effetto potrebbe addirittura avere segno
opposto o potrebbero essere altre variabili non osservate ad aver causato la malattia.
La capacità del DOE di cogliere le relazioni causa-effetto fa di questa metodologia uno
strumento principe dell’analisi scientifica.
4
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
Un breve cenno merita anche il tipo di modellistica statistica legata al DOE soprattutto
al fine di comprendere come tale insieme di tecniche si relazioni alle tecniche di
regressione lineare, così popolari nella ricerca socio-economica.
Ciò che ci preme mettere in luce è come i modelli tipici del DOE, generalmente
caratterizzati da variabili esplicative (fattori) che assumono un numero di valori
(livelli) tipicamente limitato (spesso ad esempio i fattori assumono due soli livelli,
convenzionalmente definiti livello basso e livello alto) non siano altro che classici
modelli di regressione caratterizzati da sole variabili dummies (categoriche).
Una tale visione unitaria semplifica di molto l’approccio al DOE da parte di chi è più
abituato a far riferimento a modelli di regressione lineare. A conferma dell’unitarietà
della materia sta il fatto che sia i modelli di regressione lineare che il DOE utilizzino
l’ANOVA come strumento di verifica statistica . Tavola 1 riassume quanto appena detto
in tema di modellistica.
Tavola 1: regressione lineare e modelli DOE
Variabile Y
Nome
Variabile/i X
Nome
Tipo
Tipo
Regressione Lineare
Variabile
Dipendente
Continua
Variabile/i
indipendente
o esplicativa/e
Continua/e
Disegno degli Esperimenti
(regressione
con
sole
dummies)
Risposta o
Responso
Continua
Fattori,
trattamenti
Categorica
(k livelli)
variabili
5
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
4. DEFINIZIONI
Dopo aver definito in sez.3 cosa si intende per esperimento, ci apprestiamo ad
esporre alcune altre definizioni utili alla comprensione della terminologia tipica del
DOE.
Si definisce fattore sperimentale una delle condizioni sotto le quali si svolge
l’esperimento, cioè l’entità che nella terminologia dell’analisi di regressione lineare
viene definita variabile dipendente. In particolare il ricercatore fissa sia i fattori da
includere nell’esperimento che i livelli di tali fattori.
I livelli di un fattore sperimentale sono i valori che tale fattore può assumere e
vengono fissati a priori dal ricercatore.
Un insieme di fattori, con i relativi livelli, determina un trattamento, cioè l’insieme di
condizioni sperimentali sotto le quali avviene una prova. Vi sono tanti trattamenti quante
sono le possibili combinazioni dei livelli dei fattori sperimentali.
Definiamo risposta (o responso) il valore numerico assunto dalla variabile su cui si
concentra l’analisi, cioè l’entità che nel linguaggio della regressione lineare va sotto il
nome di variabile dipendente.
L’unità sperimentale è il soggetto (o l’entità) sottoposta all’esperimento.
5. L’ERRORE SPERIMENTALE
6
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
Il concetto di errore sperimentale assume importanza fondamentale nel design degli
esperimenti. L’errore sperimentale esprime la variazione di risposta tra unità
sperimentali simili trattate indipendentemente ed in modo identico e misura la
differenza tra risposta ideale e ciò che viene effettivamente osservato. Le fonti
primarie d’errore sono:
• variabilità naturale a livello di unità sperimentali;
• variabilità e imprecisione nelle misurazioni;
• variabilità all’interno di trattamenti identici;
• interazione tra trattamenti e unità sperimentali;
• altri fattori esterni che non è possibile controllare.
La minimizzazione dell’errore sperimentale è premessa necessaria alla pianificazione e
conduzione di un esperimento scientifico e viene perseguita:
• utilizzando tecniche di misurazione ben tarate;
• utilizzando unità sperimentali uniformi;
• assegnando in modo casuale i trattamenti alle unità sperimentali.
L’assegnazione, ad ogni trattamento, di più di una unità sperimentale, consente di
disporre di una misura della variabilità sperimentale, cioè dell’errore. Inoltre questa
operazione assicura contro la presenza di outliers e ci convince che le cose siano
riproducibili e quindi sostanzialmente corrette.
7
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
6. ALCUNI ESEMPI
I seguenti due esempi, ESPERIMENTO A ed ESPERIMENTO B, vengono utilizzati per
meglio chiarire la terminologia tipica del design degli esperimenti.
ESPERIMENTO A
Un azienda produttrice di forni industriali intende testare la durata dei propri forni e
la loro resistenza a temperature abnormi. A tal scopo conduce un esperimento su 24
forni scelti casualmente tra quelli prodotti nell’ultimo mese.
Quattro temperature vengono fissate per l’esperimento: 1520°, cioè la temperatura
standard su cui i forni sono stati tarati, 1620°, 1660° e 1780° gradi. I 24 forni
vengono suddivisi casualmente in quattro gruppi ed ad ognuno di tali gruppi viene
assegnata una delle quattro temperature. I forni vengono scaldati.
Per ognuno dei 24 forni, riscaldato alla temperatura assegnata, viene misurato il
tempo, in numero di ore, che intercorre tra l’inizio della fase di riscaldamento e la
rottura del forno stesso.
Le definizioni di sez.5 acquistano i seguenti contenuti:
Unità sperimentale
⇒
forno (n = 24)
Fattore sperimentale
⇒
temperatura
Livelli
⇒
1520°, 1620°, 1660°, 1780°
Trattamenti
⇒
quattro, coincidenti con i 4 livelli
8
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
di temperatura (t = 4)
Repliche
⇒
sei, pari al numero di forni per
singolo trattamento (r = 6)
Gruppo di controllo
⇒
i sei forni sottoposti alla
temperatura standard di 1520°
Risposta
numero di ore intercorrenti tra
l’accensione del forno e la rottura
⇒
Un esperimento di questo tipo è definito esperimento casuale semplice (completely
randomized design) e viene analizzato attraverso un’ANOVA ad un solo fattore.
ESPERIMENTO B
Un agronomo intende verificare l’effetto combinato di un erbicida e di un insetticida
sulla crescita di una cultura di piante di cotone. I due additivi sono mischiati alla terra
che è poi utilizzata per riempire i vasi in cui viene piantato il cotone. In ogni vaso è poi
seminato un numero identico di piante di cotone.
Due diverse concentrazioni di erbicida (0 e 50 grammi per metro cubo di terra) e tre
diverse concentrazioni di insetticida (0, 500 e 1000 grammi per metro cubo di terra)
sono testate. Vengono preparati cinque vasi per ognuna delle sei combinazioni
erbicida/insetticida.
Dopo tre settimane dall’inizio dell’esperimento, l’agronomo estirpa le piante nel
frattempo cresciute e ne pesa le radici, in modo da misurarne la crescita.
9
Anno Accademico 1997-1998, Dispense di Statistica Aziendale
Le definizioni di sez.5 acquistano i seguenti contenuti:
Unità sperimentale
⇒
vaso (n = 30)
Fattori sperimentali
⇒
erbicida ed insetticida
Livelli
⇒
due (0, 50 gr/m3) per l’erbicida,
tre (0, 500, 1000 gr/m3) per l’insetticida
Trattamenti
⇒
sei, coincidenti con le possibili combinazioni
tra livelli di erbicida ed insetticida (t = 6)
Repliche
⇒
cinque, pari al numero di vasi per
singolo trattamento (r = 5)
i cinque vasi sottoposti al trattamento (0 gr/m3, 0
Gruppo di controllo
gr/m3)
⇒
Risposta
peso delle radici delle piante
⇒
Un design di questo tipo è definito esperimento fattoriale e può essere studiato
tramite un modello a due fattori ed interazione.
BIBLIOGRAFIA
[1]
G.Cicchitelli (1992), “Probabilità e Statistica”, Maggioli Editore, Rimini.
[2]
R.O.Kuehl (1994), “Statistical Principles of Research Design and Analysis”, ITP, Duxbury
Press, Belmont, California.
[3]
D.M.Levine, P.P.Ramsey, M.L.Berenson (1995), “Business Statistics for Quality and
Productivity”, Prentice-Hall, Ney Jersey. (Rosate - J 239 LEV)
10