Douglas C. Montgomery Progettazione e analisi degli esperimenti © 2006 McGraw-Hill CAPITOLO 2 Semplici esperimenti comparativi Metodi statistici e probabilistici per l’ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain Dati di resistenza per l’esperimento del calcestruzzo (Tabella 2.1, pp. 26) Osservazione (sample), j Calcestruzzo Modificato (Formulation 1) y1 j Calcestruzzo non Modificato (Formulation 2) y2 j 1 16.85 17.50 2 16.40 17.63 3 17.21 18.25 4 16.35 18.00 5 16.52 17.86 6 17.04 17.75 7 16.96 18.22 8 17.15 17.90 9 16.59 17.96 10 16.57 18.15 1 Rappresentazione Grafica dei Dati Diagramma a punti (dotplot) Dotplots of Form 1 and Form 2 (means are indicated by lines) 18.3 17.3 16.3 Form 1 Form 2 Diagramma a scatola (boxplot) Boxplots of Form 1 and Form 2 (means are indicated by solid circles) 18.5 17.5 16.5 Form 1 Form 2 2 La struttura dell’ipotesi statistica • L’ipotesi statistica è un utile strumento per molte situazioni sperimentali • Le origini del metodo risalgono agli inizi del 1900 • Useremo una procedura nota come t-test per due campioni La struttura dell’ipotesi statistica • Campionamento da una distribuzione normale • Ipotesi statistiche: H :µ = µ 0 1 2 H1 : µ1 ≠ µ 2 3 Stima dei parametri 1 n y = ∑ yi stima la media della popalazione µ n i =1 1 n ( yi − y ) 2 stima la varianza σ 2 S = ∑ n − 1 i =1 2 Sommario Statistico Formulazione 1 Formulzione 2 “Nuova Ricetta ” “Ricetta Originale” y1 = 16.76 y2 = 17.92 S12 = 0.100 S 22 = 0.061 S1 = 0.316 n1 = 10 S 2 = 0.247 n2 = 10 4 Come funziona il t-Test a due campioni Utilizza le medie campionarie per fare inferenza sulle medie delle popolazioni y1 − y2 = 16.76 − 17.92 = −1.16 Differenza tra le medie campionarie Deviazione Standard della differenza tra le medie campionarie σ y2 = σ2 n Questo suggerisce la statistica: y1 − y2 Z0 = σ 12 n1 + σ 22 n2 Come funziona il t-Test a due campioni Utilizza S12 e S 22 per stimare σ 12 e σ 22 Il precedente rapporto diventa y1 − y2 S12 S 22 + n1 n2 Tuttavia, siamo nel caso σ 12 = σ 22 = σ 2 Pool delle varianze individuali campionarie: (n1 − 1) S12 + (n2 − 1) S22 S = n1 + n2 − 2 2 p 5 Come funziona il t-Test a due campioni La statistica test è t0 = y1 − y2 1 1 Sp + n1 n2 • Valori di t0 che sono prossimi allo zero sono conformi all’ipotesi nulla • Valori di t0 a che sono molto lontani da zero sono conformi all’ipotesi alternativa • t0 è una “distanza”di quanto lontano distano le medie campionarie in unità di deviazione standard • Notare l’interpretazione di t0 come rapporto signal-tonoise Il t-Test a due campioni ( Pooled) S p2 = (n1 − 1) S12 + (n2 − 1) S 22 9(0.100) + 9(0.061) = = 0.081 n1 + n2 − 2 10 + 10 − 2 S p = 0.284 t0 = y1 − y2 16.76 − 17.92 = = −9.13 1 1 1 1 0.284 + + Sp 10 10 n1 n2 Le due medie campionarie sono lontane circa 9 deviazioni standard Si tratta di una "grande" differenza? 6 Il t-Test a due campioni (Pooled) • Tempo fa non si poteva fare alcuna statistica • Era necessaria una base oggettiva per decidere quanto ampio doveva essere il test statistico t0 • Nel 1908, W. S. Gosset derivò la distribuzione di riferimento per t0 … chiamata la distribuzione t di Student • Tavole della distribuzione t Il t-Test a due campioni ( Pooled) • Un valore di t0 tra 2.101 and 2.101 porta ad accettare l’ipotesi di uguaglianza delle medie • E’ possibile che le medie siano uguali e t0 ecceda sia 2.101 che –2.101, ma sarebbe un “evento raro” … si può concludere che le medie sono differenti • Si può anche usare l’approccio del P-value 7 Il t-Test a due campioni ( Pooled) • Il P-value è il rischio di rifiutare erroneamente l’ipotesi nulla di uguaglianza delle medie (misura la rarità dell’evento) • Il P-value nel nostro problema è P = 3.68E-8 Minitab :Risultati del t-test a due campioni Two-Sample T-Test and CI: Form 1, Form 2 Two-sample T for Form 1 vs Form 2 N Mean StDev SE Mean Form 1 10 16.764 0.316 0.10 Form 2 10 17.922 0.248 0.078 Difference = mu Form 1 - mu Form 2 Estimate for difference: -1.158 95% CI for difference: (-1.425, -0.891) T-Test of difference = 0 (vs not =): T-Value = -9.11 P-Value = 0.000 DF = 18 Both use Pooled StDev = 0.284 8 Assunzioni di controllo – Grafico della probabilità normale Tension Bond Strength Data ML Estimates Form 1 99 Form 2 Goodness of Fit 95 AD* 90 1.209 1.387 Percent 80 70 60 50 40 30 20 10 5 1 16.5 17.5 18.5 Data Importanza del t-Test • Fornisce una oggettiva struttura per semplici esperimenti comparativi • Potrebbe essere usato per testare tutte le ipotesi rilevanti in un piano a due livelli, perché tutte quelle ipotesi coinvolgono la media attesa da un lato del “cubo” Vs la media attesa dall’altro lato del “cubo” 9 Gli Intervalli di confidenza • Il test dà un’oggettiva espressione che riguarda la differenza tra le medie, ma non specifica quanto differenti siano • Forma generale di un intervallo di confidenza L ≤ θ ≤ U dove P ( L ≤ θ ≤ U ) = 1 − α • L’intervallo di confidenza al 100(1-α)% per la differenza tra due medie è: y1 − y2 − tα / 2,n1 + n2 − 2 S p (1/ n1 ) + (1/ n2 ) ≤ µ1 − µ 2 ≤ y1 − y2 + tα / 2,n1 + n2 − 2 S p (1/ n1 ) + (1/ n2 ) E se ci sono più di due livelli del Fattore? • Il t-test non viene applicato direttamente • Ci sono tante situazioni pratiche dove ci sono sia più di due livelli di interesse, o ci sono più fattori di simultaneo interesse. • L’ analisi della varianza (ANOVA) è l’appropriata analisi cardine per questo tipo di esperimenti – Capitolo 3, testo • L’ANOVA è stata sviluppata da Fisher agli inizi degli anni 1920, e inizialmente applicata agli esperimenti agricoli • Oggi è usata soprattutto per esperimenti industriali 10