INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1) 151 Introduzione Un esperimento è una prova o una serie di prove. Gli esperimenti sono largamente utilizzati nel campo dell’ingegneria. Tra le varie applicazioni; Progettazione e sviluppo del prodotto; Caratterizzazione e ottimizzazione dei processi; Valutazione delle proprietà dei materiali. Tutti gli esperimenti richiedono una pianificazione. Alcuni sono progettati, alcuni in modo preciso, altri invece sono pianificati poco e male. Esiste un modo per “ottimizzare” gli esperimenti ? Progettazione e Sviluppo Prodotto 152 1 Gli esperimenti nell’ingegneria Gli esperimenti sono utilizzati per per studiare le prestazioni di processi e di sistemi (es.: prodotti). Fattori controllabili x1 Input x2 x3 xn Processo / sistema z1 z2 z3 Output y zn Fattori non controllabili Progettazione e Sviluppo Prodotto 153 Quali sono gli obiettivi degli esperimenti ? Gli obiettivi degli esperimenti possono essere, tra i vari possibili, i seguenti: Determinare le variabili che hanno maggiore influenza sulla risposta y; Determinare quali valori assegnare alle variabili controllabili x in modo che la risposta y sia sempre prossima al valore desiderato; Determinare quali valori assegnare alle variabili controllabili x in modo che la variabilità della risposta y sia minima; Progettazione e Sviluppo Prodotto 154 2 Principi base del Design of Experiments Casualizzazione (o randomizzazione): Eseguire le prove di un esperimento in maniera tale da distribuire aleatoriamente i fattori di disturbo (es.: eseguire le prove di un esperimento in ordine casuale) Replicazione: Consiste nel ripetere le misure, idealmente in condizioni diverse Controllo locale: Insieme delle operazioni intraprese dallo sperimentatore per ridurre l’errore sperimentale (es.: utilizzo di unità sperimentali omogenee, utilizzo dei blocchi) Progettazione e Sviluppo Prodotto 155 Alcune definizioni Variabile di risposta: la risposta del sistema oggetto dell’esperimento Fattore: variabile controllabile (variabile indipendente). Può essere: quantitativo (espresso da un reale o un intero); qualitativo (espresso attraverso un attributo categorico); Livello di un fattore: valore assunto dal rispettivo fattore; Esperimento monofattoriale: esperimento in cui c’è solo un fattore in gioco; Esperimento multifattoriale: esperimento in cui c’è più di un fattore in gioco; Trattamento: insieme dei livelli imposti ad un’unità sperimentale Progettazione e Sviluppo Prodotto 156 3 Strategie di sperimentazione Esempio: che esperimenti posso svolgere per trovare la combinazione delle variabili che massimizza le prestazioni del prodotto ? Approccio a tentativi (best guess) Molto utilizzato Ha più successo di quanto si pensi, ma anche svantaggi (es.: scarsa comprensione del sistema) Variazione di un fattore alla volta (OFAT One Factor At-a Time) Abbastanza usato in campo ingegneristico Poco efficiente Utilizzo di piani fattoriali Analisi sistematica della superficie di risposta del sistema Progettazione e Sviluppo Prodotto 157 Piani fattoriali In un esperimento fattoriale vengono testate tutte (piano fattoriale completo) o parte (piano fattoriale frazionario) delle combinazioni derivanti dai possibili livelli dei fattori. Esempio: esperimento del golf. Possibili fattori: Tipo di mazza Tipo di pallina Tipo di bibita Camminare / vetturetta Condizioni atm. Mattina / pomeriggio … Esempio di piano completo a 2 fattori Progettazione e Sviluppo Prodotto 158 4 Esempio: piano fattoriale con 2 fattori Nell’esperimento del golf consideriamo solo gli effetti del tipo di mazza e del tipo di palla. L’esperimento può essere rappresentato in uno spazio bidimensionale: Effetto del tipo di mazza Effetto del tipo di palla Interazione mazza/palla Progettazione e Sviluppo Prodotto 159 Esempio: piano fattoriale con 3 fattori Decidiamo di studiare, oltre agli effetti del tipo di mazza e del tipo di palla, l’effetto della bibita utilizzata dal golfista. L’esperimento può essere rappresentato in uno spazio tridimensionale: Progettazione e Sviluppo Prodotto 160 5 Esempio: piano fattoriale con 4 fattori Oltre ai fattori già visti aggiungiamo lo studio dell’effetto del mezzo di spostamento utilizzato. L’esperimento può essere rappresentato in uno spazio a quattro dimensioni: Progettazione e Sviluppo Prodotto 161 Piani completi e piani frazionari In un esperimento fattoriale completo si considerano tutte le possibili combinazioni combinazioni fattori / livelli. In un esperimento fattoriale frazionario si considera una parte di tutte le possibili combinazioni fattori / livelli. Esempio di piano fattoriale frazionario Progettazione e Sviluppo Prodotto 162 6 Procedura generale per la pianificazione degli esperimenti 1. 2. 3. 4. 5. 6. 7. Identificazione e formulazione del problema; Scelta dei fattori, del numero dei livelli e dell’ampiezza degli intervalli; Scelta della variabile di risposta; Individuazione del corretto piano sperimentale; Esecuzione dell’esperimento; Analisi statistica dei risultati; Conclusioni Progettazione e Sviluppo Prodotto 163 Esperimenti con un solo fattore. Consideriamo il seguente esempio: una ditta produttrice di calcestruzzo vuole verificare se l’aggiunta di un componente al calcestruzzo (emulsione di polimero) ne modifica la resistenza. Osserviamo che: Vi è un solo fattore in gioco (composizione del calcestruzzo); Il fattore è di tipo qualitativo; Il fattore ha due livelli (polimero assente / polimero presente) Progettazione e Sviluppo Prodotto 164 7 Raccolta dei dati. Supponiamo che lo sperimentatore abbia avuto a disposizione 10 provini di calcestruzzo normale e 10 di calcestruzzo modificato; Le prove sperimentali hanno fornito i seguenti risultati: Progettazione e Sviluppo Prodotto 165 Visualizzazione dei dati: diagramma a punti Visualizziamo i dati dell’esperimento in un diagramma a punti. Ciascun punto rappresenta un dato sperimentale. Il trattino rosso orizzontale rappresenta la media campionaria. Progettazione e Sviluppo Prodotto 166 8 Visualizzazione dei dati: box plot Il digramma a scatola riporta il minimo, il massimo ed i percentili 25 %, 50 % (mediana) e 75 %. Progettazione e Sviluppo Prodotto 167 Interpretazione dei dati A questo punto ci poniamo la seguente domanda: l’aggiunta del polimero modifica la resistenza del calcestruzzo ? Ovvero: la presenza del polimero è un fattore significativo ? Intuitivamente possiamo dire che l’affidabilità dell’esperimento e delle conclusioni dipenderanno dai seguenti fattori: Numerosità del campione; Distribuzione dei dati sperimentali I risultati dell’esperimento sembrano indicare che l’aggiunta del polimero influisce sulla resistenza del calcestruzzo. Tuttavia siamo sicuri che le conclusioni dell’esperimento non siano dovute a fattori casuali ? Progettazione e Sviluppo Prodotto 168 9 Verifica di ipotesi statistiche Formuliamo il problema in maniera matematica. L’interpretazione dei dati sperimentali dà origine a due ipotesi statistiche (o meglio ad una ipotesi ed alla negazione della stessa): Ipotesi nulla (H0): la resistenza media del calcestruzzo modificato è uguale a quella del calcestruzzo non modificato: µ1 = µ2. Ipotesi alternativa (H1): la resistenza media del calcestruzzo modificato è diversa da quella del calcestruzzo non modificato: µ1 ≠ µ2. Nota: nelle ipotesi di cui sopra si fa riferimento alla media della popolazione (non alla media del campione). Problema: verificare o rigettare l’ipotesi nulla a partire dai dati campionari Progettazione e Sviluppo Prodotto 169 Il test t di Student Esistono numerosi test per la verifica di ipotesi statistiche (test di significatività). Uno dei più utilizzati è il test t di Student. Vale sotto l’ipotesi di popolazioni distribuite normalmente; uguali varianze dei due gruppi, ancorchè ignote t = µ1 − µ 2 2 n +n 2 σ 1 n1n 2 g1σ 1 + g 2 σ 2 g1 + g 2 2 σ = 2 Dove: µ1 , µ 2 rappresentano le medie campionarie dei due gruppi; σ 1 , σ 2 Le varianze campionarie dei due gruppi; n1 , n 2 le numerosità dei due gruppi; g 1 , g 2 i gradi di libertà dei due gruppi Progettazione e Sviluppo Prodotto 170 10 Significato del parametro t È un parametro di significatività: Valori di t che sono prossimi allo zero sono conformi all’ipotesi nulla; Valori di t lontani dallo zero sono conformi all’ipotesi alternativa; È una misura di quanto sono lontane le medie in unità di deviazione standard; Può essere interpretato come rapporto segnale/rumore. Osserviamo che: La significatività aumenta all’aumentare della numerosità del campione; La significatività aumenta all’aumentare della differenza tra le medie campionarie; La significatività diminuisce all’aumentare della varianza campionaria (maggiore dispersione dei dati) Progettazione e Sviluppo Prodotto 171 Scelta del parametro t (1/2) Come fissare un valore di t che serva da criterio di accettazione / rifiuto dell’ipotesi nulla ? Consideriamo la funzione densità di probabilità t di Student (a 18 g.d.l.): Distribuzione t di Student a 18 gradi di libertà 0.4 0.35 0.3 0.25 p(t) 0.2 0.15 0.1 0.05 0 -5 -4 -3 -2 -1 0 t 1 2 3 4 5 Progettazione e Sviluppo Prodotto 172 11 Scelta del parametro t (2/2) L’uguaglianza delle medie della popolazione è tanto più improbabile quanto t si allontana dallo zero. Si, ma quanto ? Fissiamo, per esempio, due valori di t che intercettano due zone del grafico: la zona interna costituita dal 95 % di probabilità complessiva, e le due code (a dx e sx) di probabilità complessiva 5 %. Distribuzione t di Student a 18 gradi di libertà 0.4 0.35 0.3 p(t) 0.25 0.2 0.15 0.1 0.05 0 -5 -4 -3 -2 -1 0 t 1 2 3 4 5 Progettazione e Sviluppo Prodotto 173 Test di significatività Questi punti corrispondono a valori di t = -1.734 e 1.734. Se dunque il nostro valore di t è esterno a quest’intervallo accettiamo l’ipotesi alternativa (è anche possibile che le medie siano uguali, ma la probabilità è inferiore al 5 %) Si dice anche che l’ipotesi alternativa è accettata con un livello di significatività del 95 %. Il livello del 95 % è molto usato in pratica. Tuttavia potremmo voler essere ancora più restrittivi. Imponendo un valore del 99 % otteniamo per t i valori –2.552 e 2.552. Se il valore di t è interno all’intervallo concludiamo che non vi è evidenza statistica di differenza tra le medie delle due popolazioni. Come interpretiamo questo risultato ? 1) non vi è, in effetti, differenza tra le medie 2) la numerosità del campione non è sufficiente Progettazione e Sviluppo Prodotto 174 12 Riferimenti bibliografici 1. 2. 3. D.C. Montgomery; Progettazione ed analisi degli esperimenti, McGraw-Hill, 2005; W. G. Cochran, G. M. Cox; Experimental Designs, John Wiley & Sons, 1957; G. Landenna, D. Marasini, A. Ferrari; La verifica di ipotesi statistiche, Il Mulino, 1998 Progettazione e Sviluppo Prodotto 175 13