Corso Metodi quantitativi per la gestione aziendale Direzione prof. Silvia Biffignandi Corso Fondo Sociale Europeo 1997 Dipartimento di Matematica, Statistica, Informatica e Applicazioni Sede: Università di Bergamo Materiale didattico IL DESIGNO DEGLI ESPERIMENTI Esempi introduttivi a cura di Sergio Bonzani Anno Accademico 1997-1998, Dispense di Statistica Aziendale IL DESIGNO DEGLI ESPERIMENTI 1. INTRODUZIONE L’insieme di tecniche statistiche atte ad indagare gli effetti di determinate condizioni o fattori sui risultati di un esperimento scientifico prende il nome di disegno degli esperimenti (DOE). Nella teoria e pratica statistica il DOE è materia piuttosto vasta che utilizza come strumento fondamentale di ricerca l’analisi della varianza (ANOVA). Questa breve trattazione si propone di delineare i tratti distintivi del DOE rispetto ad altri campi della statistica (ad esempio rispetto al controllo di qualità ed alle indagini osservazionali) e di fornire alcune definizione di base che permettano anche ad un non esperto di comprendere le linee guida di un esperimento statistico. Non è invece nei nostri obiettivi discutere di quell’insieme di tecniche che va sotto il nome di ANOVA; rimandiamo il lettore interessato ad una delle molte pubblicazioni in materia (vedi bibliografia). 2. DISEGNO DEGLI ESPERIMENTI E CONTROLLO DI QUALITA’ Nella dispensa dedicata al controllo di qualità abbiamo presentato e discusso un insieme di idee e tecniche, sia formali che grafiche, utili ad una gestione d’azienda 1 Anno Accademico 1997-1998, Dispense di Statistica Aziendale fondata sul principio della qualità e sul suo perseguimento. Molti degli strumenti presentati aiutano a comprendere un processo, a tenerlo sotto sorveglianza ed a descriverne le caratteristiche. Tuttavia il controllo statistico di qualità rappresenta uno strumento d’intervento di tipo passivo, dal momento che ogni azione correttiva intrapresa dall’operatore viene generata da segnali inviati dal processo stesso. Si pensi, ad esempio, ad una carta di controllo che segnali la necessità di intervenire sul processo alla ricerca di una causa speciale di variazione, senza per questo porre dei dubbi sull’efficienza di fondo del processo stesso, la cui natura non viene comunque modificata dall’intervento dell’operatore. Al contrario il DOE rappresenta uno strumento attivo di ricerca, approccio scientifico-formale alla valutazione delle potenzialità di un processo, basato su interventi pianificati volti al suo costante miglioramento. In altri termini il DOE è strumento di ricerca maggiormente destinato a fornire informazioni per il supporto gestionale e ad individuare l’esigenza di interventi che possono essere anche radicali. Le tecniche di disegno degli esperimenti divengono fondamentali quando il processo è caratterizzato da una non ottimalità di fondo, piuttosto che da una causa speciale di variazione come nel caso del controllo di qualità. Intervenendo attivamente sul processo e studiando l’effetto di vari fattori sui risultati, diviene possibile specificare le condizioni sotto le quali il processo in questione possa essere ottimizzato. 3. DESIGNO DEGLI ESPERIMENTI E STUDI OSSERVAZIONALI 2 Anno Accademico 1997-1998, Dispense di Statistica Aziendale Si definisce esperimento una ricerca condotta sotto condizioni controllate il cui obiettivo sia quello di valutare l’effetto di tali condizioni (o fattori) sui risultati osservabili dell’esperimento stesso. Il ricercatore decide sotto quali condizioni operare. In questa semplice definizione sta molta della peculiarità del DOE. Il disegno degli esperimenti contrasta, in questo senso, con le ricerche di tipo osservazionale (si pensi ad esempio ad un’indagine campionaria), dove nessuna delle condizioni è fissata dal ricercatore ed in cui i dati vengono semplicemente raccolti ex-post e non influenzati a priori dal ricercatore stesso. L’organizzazione e la messa in opera di uno studio osservazionale è generalmente più semplice di quanto non sia la pianificazione di un esperimento. Non esiste virtualmente alcun ambito scientifico nel quale non sia possibile organizzare uno studio osservazionale e nella stragrande maggioranza dei casi esso costa meno di quanto non possa costare un esperimento ben articolato, dal momento che l’attività di controllo dei fattori comporta un notevole dispendio di tempo e risorse. Inoltre, in alcune discipline la via dello studio osservazionale è obbligata (in particolare si pensi a tutte le discipline a carattere socio-economico) dal momento che in tali ambiti non è concettualmente possibile porre in essere un esperimento. Il DOE si presta particolarmente ad applicazioni nel settore produttivo e di laboratorio; applicazioni più frequenti e interessanti si trovano nell’industria (chimica, meccanica, tessile ecc.), nell’agricoltura farmacologica. 3 e nella sperimentazione medica e Anno Accademico 1997-1998, Dispense di Statistica Aziendale Sebbene in tali campi la via dello studio osservazionale sia comunque praticabile, un esperimento fornisce risposte a domande a cui uno studio osservazionale non è in grado di rispondere. Si considerino ad esempio le seguenti due situazioni. A) ESPERIMENTO: Si è condotto un esperimento allo scopo di studiare gli effetti della nicotina su alcune cavie da laboratorio. Ad un gruppo di cavie (definito gruppo trattato) venne applicata sul dorso una soluzione contenente nicotina. Ad un secondo gruppo (definito gruppo di controllo) fu applicata una soluzione simile, ma senza il contenuto di nicotina. Al fine di studiare l’impatto del fattore sperimentale, entrambi i gruppi di cavie furono osservate dopo qualche tempo. Ne risultò che le cavie sul cui dorso era stata applicata la soluzione contenente nicotina presentavano una forma di cancro alla pelle, le altre no. B) STUDIO OSSERVAZIONALE: Un indagine campionaria sul consumo di sigarette tra la popolazione bergamasca riscontrò una relazione molto stretta tra cancro ai polmoni e numero medio di sigarette fumate al giorno. La principale differenza tra le due ricerche sopra descritte consiste nel fatto che, mentre l’esperimento A dimostra l’esistenza di una relazione causa-effetto (monodirezionale) tra nicotina e cancro, l’indagine B in realta non ci assicura in alcun modo che la nicotina causi il cancro. Tale indagine coglie semplicemente un’associazione tra i due fenomeni. La relazione causa effetto potrebbe addirittura avere segno opposto o potrebbero essere altre variabili non osservate ad aver causato la malattia. La capacità del DOE di cogliere le relazioni causa-effetto fa di questa metodologia uno strumento principe dell’analisi scientifica. 4 Anno Accademico 1997-1998, Dispense di Statistica Aziendale Un breve cenno merita anche il tipo di modellistica statistica legata al DOE soprattutto al fine di comprendere come tale insieme di tecniche si relazioni alle tecniche di regressione lineare, così popolari nella ricerca socio-economica. Ciò che ci preme mettere in luce è come i modelli tipici del DOE, generalmente caratterizzati da variabili esplicative (fattori) che assumono un numero di valori (livelli) tipicamente limitato (spesso ad esempio i fattori assumono due soli livelli, convenzionalmente definiti livello basso e livello alto) non siano altro che classici modelli di regressione caratterizzati da sole variabili dummies (categoriche). Una tale visione unitaria semplifica di molto l’approccio al DOE da parte di chi è più abituato a far riferimento a modelli di regressione lineare. A conferma dell’unitarietà della materia sta il fatto che sia i modelli di regressione lineare che il DOE utilizzino l’ANOVA come strumento di verifica statistica . Tavola 1 riassume quanto appena detto in tema di modellistica. Tavola 1: regressione lineare e modelli DOE Variabile Y Nome Variabile/i X Nome Tipo Tipo Regressione Lineare Variabile Dipendente Continua Variabile/i indipendente o esplicativa/e Continua/e Disegno degli Esperimenti (regressione con sole dummies) Risposta o Responso Continua Fattori, trattamenti Categorica (k livelli) variabili 5 Anno Accademico 1997-1998, Dispense di Statistica Aziendale 4. DEFINIZIONI Dopo aver definito in sez.3 cosa si intende per esperimento, ci apprestiamo ad esporre alcune altre definizioni utili alla comprensione della terminologia tipica del DOE. Si definisce fattore sperimentale una delle condizioni sotto le quali si svolge l’esperimento, cioè l’entità che nella terminologia dell’analisi di regressione lineare viene definita variabile dipendente. In particolare il ricercatore fissa sia i fattori da includere nell’esperimento che i livelli di tali fattori. I livelli di un fattore sperimentale sono i valori che tale fattore può assumere e vengono fissati a priori dal ricercatore. Un insieme di fattori, con i relativi livelli, determina un trattamento, cioè l’insieme di condizioni sperimentali sotto le quali avviene una prova. Vi sono tanti trattamenti quante sono le possibili combinazioni dei livelli dei fattori sperimentali. Definiamo risposta (o responso) il valore numerico assunto dalla variabile su cui si concentra l’analisi, cioè l’entità che nel linguaggio della regressione lineare va sotto il nome di variabile dipendente. L’unità sperimentale è il soggetto (o l’entità) sottoposta all’esperimento. 5. L’ERRORE SPERIMENTALE 6 Anno Accademico 1997-1998, Dispense di Statistica Aziendale Il concetto di errore sperimentale assume importanza fondamentale nel design degli esperimenti. L’errore sperimentale esprime la variazione di risposta tra unità sperimentali simili trattate indipendentemente ed in modo identico e misura la differenza tra risposta ideale e ciò che viene effettivamente osservato. Le fonti primarie d’errore sono: • variabilità naturale a livello di unità sperimentali; • variabilità e imprecisione nelle misurazioni; • variabilità all’interno di trattamenti identici; • interazione tra trattamenti e unità sperimentali; • altri fattori esterni che non è possibile controllare. La minimizzazione dell’errore sperimentale è premessa necessaria alla pianificazione e conduzione di un esperimento scientifico e viene perseguita: • utilizzando tecniche di misurazione ben tarate; • utilizzando unità sperimentali uniformi; • assegnando in modo casuale i trattamenti alle unità sperimentali. L’assegnazione, ad ogni trattamento, di più di una unità sperimentale, consente di disporre di una misura della variabilità sperimentale, cioè dell’errore. Inoltre questa operazione assicura contro la presenza di outliers e ci convince che le cose siano riproducibili e quindi sostanzialmente corrette. 7 Anno Accademico 1997-1998, Dispense di Statistica Aziendale 6. ALCUNI ESEMPI I seguenti due esempi, ESPERIMENTO A ed ESPERIMENTO B, vengono utilizzati per meglio chiarire la terminologia tipica del design degli esperimenti. ESPERIMENTO A Un azienda produttrice di forni industriali intende testare la durata dei propri forni e la loro resistenza a temperature abnormi. A tal scopo conduce un esperimento su 24 forni scelti casualmente tra quelli prodotti nell’ultimo mese. Quattro temperature vengono fissate per l’esperimento: 1520°, cioè la temperatura standard su cui i forni sono stati tarati, 1620°, 1660° e 1780° gradi. I 24 forni vengono suddivisi casualmente in quattro gruppi ed ad ognuno di tali gruppi viene assegnata una delle quattro temperature. I forni vengono scaldati. Per ognuno dei 24 forni, riscaldato alla temperatura assegnata, viene misurato il tempo, in numero di ore, che intercorre tra l’inizio della fase di riscaldamento e la rottura del forno stesso. Le definizioni di sez.5 acquistano i seguenti contenuti: Unità sperimentale ⇒ forno (n = 24) Fattore sperimentale ⇒ temperatura Livelli ⇒ 1520°, 1620°, 1660°, 1780° Trattamenti ⇒ quattro, coincidenti con i 4 livelli 8 Anno Accademico 1997-1998, Dispense di Statistica Aziendale di temperatura (t = 4) Repliche ⇒ sei, pari al numero di forni per singolo trattamento (r = 6) Gruppo di controllo ⇒ i sei forni sottoposti alla temperatura standard di 1520° Risposta numero di ore intercorrenti tra l’accensione del forno e la rottura ⇒ Un esperimento di questo tipo è definito esperimento casuale semplice (completely randomized design) e viene analizzato attraverso un’ANOVA ad un solo fattore. ESPERIMENTO B Un agronomo intende verificare l’effetto combinato di un erbicida e di un insetticida sulla crescita di una cultura di piante di cotone. I due additivi sono mischiati alla terra che è poi utilizzata per riempire i vasi in cui viene piantato il cotone. In ogni vaso è poi seminato un numero identico di piante di cotone. Due diverse concentrazioni di erbicida (0 e 50 grammi per metro cubo di terra) e tre diverse concentrazioni di insetticida (0, 500 e 1000 grammi per metro cubo di terra) sono testate. Vengono preparati cinque vasi per ognuna delle sei combinazioni erbicida/insetticida. Dopo tre settimane dall’inizio dell’esperimento, l’agronomo estirpa le piante nel frattempo cresciute e ne pesa le radici, in modo da misurarne la crescita. 9 Anno Accademico 1997-1998, Dispense di Statistica Aziendale Le definizioni di sez.5 acquistano i seguenti contenuti: Unità sperimentale ⇒ vaso (n = 30) Fattori sperimentali ⇒ erbicida ed insetticida Livelli ⇒ due (0, 50 gr/m3) per l’erbicida, tre (0, 500, 1000 gr/m3) per l’insetticida Trattamenti ⇒ sei, coincidenti con le possibili combinazioni tra livelli di erbicida ed insetticida (t = 6) Repliche ⇒ cinque, pari al numero di vasi per singolo trattamento (r = 5) i cinque vasi sottoposti al trattamento (0 gr/m3, 0 Gruppo di controllo gr/m3) ⇒ Risposta peso delle radici delle piante ⇒ Un design di questo tipo è definito esperimento fattoriale e può essere studiato tramite un modello a due fattori ed interazione. BIBLIOGRAFIA [1] G.Cicchitelli (1992), “Probabilità e Statistica”, Maggioli Editore, Rimini. [2] R.O.Kuehl (1994), “Statistical Principles of Research Design and Analysis”, ITP, Duxbury Press, Belmont, California. [3] D.M.Levine, P.P.Ramsey, M.L.Berenson (1995), “Business Statistics for Quality and Productivity”, Prentice-Hall, Ney Jersey. (Rosate - J 239 LEV) 10