CAPITOLO 2 Semplici esperimenti comparativi

Douglas C. Montgomery
Progettazione e analisi degli esperimenti
© 2006 McGraw-Hill
CAPITOLO 2
Semplici esperimenti comparativi
Metodi statistici e probabilistici per l’ingegneria
Corso di Laurea in Ingegneria Civile
A.A. 2009-10
Facoltà di Ingegneria, Università di Padova
Docente: Dott. L. Corain
Dati di resistenza
per l’esperimento del calcestruzzo
(Tabella 2.1, pp. 26)
Osservazione
(sample), j
Calcestruzzo Modificato
(Formulation 1) y1 j
Calcestruzzo non Modificato
(Formulation 2) y2 j
1
16.85
17.50
2
16.40
17.63
3
17.21
18.25
4
16.35
18.00
5
16.52
17.86
6
17.04
17.75
7
16.96
18.22
8
17.15
17.90
9
16.59
17.96
10
16.57
18.15
1
Rappresentazione Grafica dei Dati
Diagramma a punti (dotplot)
Dotplots of Form 1 and Form 2
(means are indicated by lines)
18.3
17.3
16.3
Form 1
Form 2
Diagramma a scatola (boxplot)
Boxplots of Form 1 and Form 2
(means are indicated by solid circles)
18.5
17.5
16.5
Form 1
Form 2
2
La struttura dell’ipotesi statistica
• L’ipotesi statistica è un utile strumento per
molte situazioni sperimentali
• Le origini del metodo risalgono agli inizi
del 1900
• Useremo una procedura nota come
t-test per due campioni
La struttura dell’ipotesi statistica
• Campionamento da una distribuzione normale
• Ipotesi statistiche:
H :µ = µ
0
1
2
H1 : µ1 ≠ µ 2
3
Stima dei parametri
1 n
y = ∑ yi stima la media della popalazione µ
n i =1
1 n
( yi − y ) 2 stima la varianza σ 2
S =
∑
n − 1 i =1
2
Sommario Statistico
Formulazione 1
Formulzione 2
“Nuova Ricetta ”
“Ricetta Originale”
y1 = 16.76
y2 = 17.92
S12 = 0.100
S 22 = 0.061
S1 = 0.316
n1 = 10
S 2 = 0.247
n2 = 10
4
Come funziona il t-Test a due campioni
Utilizza le medie campionarie per fare inferenza
sulle medie delle popolazioni
y1 − y2 = 16.76 − 17.92 = −1.16
Differenza tra le medie campionarie
Deviazione Standard della differenza tra le medie campionarie
σ y2 =
σ2
n
Questo suggerisce la statistica:
y1 − y2
Z0 =
σ 12
n1
+
σ 22
n2
Come funziona il t-Test a due campioni
Utilizza S12 e S 22 per stimare σ 12 e σ 22
Il precedente rapporto diventa
y1 − y2
S12 S 22
+
n1 n2
Tuttavia, siamo nel caso σ 12 = σ 22 = σ 2
Pool delle varianze individuali campionarie:
(n1 − 1) S12 + (n2 − 1) S22
S =
n1 + n2 − 2
2
p
5
Come funziona il t-Test a due campioni
La statistica test è
t0 =
y1 − y2
1 1
Sp
+
n1 n2
• Valori di t0 che sono prossimi allo zero sono
conformi all’ipotesi nulla
• Valori di t0 a che sono molto lontani da zero sono
conformi all’ipotesi alternativa
• t0 è una “distanza”di quanto lontano distano le medie
campionarie in unità di deviazione standard
• Notare l’interpretazione di t0 come rapporto signal-tonoise
Il t-Test a due campioni ( Pooled)
S p2 =
(n1 − 1) S12 + (n2 − 1) S 22 9(0.100) + 9(0.061)
=
= 0.081
n1 + n2 − 2
10 + 10 − 2
S p = 0.284
t0 =
y1 − y2
16.76 − 17.92
=
= −9.13
1 1
1 1
0.284
+
+
Sp
10 10
n1 n2
Le due medie campionarie sono lontane circa 9 deviazioni standard
Si tratta di una "grande" differenza?
6
Il t-Test a due campioni (Pooled)
• Tempo fa non si poteva
fare alcuna statistica
• Era necessaria una base
oggettiva per decidere
quanto ampio doveva
essere il test statistico t0
• Nel 1908, W. S. Gosset
derivò la distribuzione
di riferimento per t0 …
chiamata la
distribuzione t di
Student
• Tavole della
distribuzione t
Il t-Test a due campioni ( Pooled)
• Un valore di t0 tra 2.101 and 2.101 porta
ad accettare l’ipotesi
di uguaglianza delle
medie
• E’ possibile che le
medie siano uguali e
t0 ecceda sia 2.101
che –2.101, ma
sarebbe un “evento
raro” … si può
concludere che le
medie sono differenti
• Si può anche usare
l’approccio del
P-value
7
Il t-Test a due campioni ( Pooled)
• Il P-value è il rischio di rifiutare erroneamente l’ipotesi
nulla di uguaglianza delle medie (misura la rarità dell’evento)
• Il P-value nel nostro problema è P = 3.68E-8
Minitab :Risultati del t-test a due
campioni
Two-Sample T-Test and CI: Form 1, Form 2
Two-sample T for Form 1 vs Form 2
N
Mean
StDev
SE Mean
Form 1
10
16.764
0.316
0.10
Form 2
10
17.922
0.248
0.078
Difference = mu Form 1 - mu Form 2
Estimate for difference:
-1.158
95% CI for difference: (-1.425, -0.891)
T-Test of difference = 0 (vs not =): T-Value = -9.11
P-Value = 0.000 DF = 18
Both use Pooled StDev = 0.284
8
Assunzioni di controllo –
Grafico della probabilità normale
Tension Bond Strength Data
ML Estimates
Form 1
99
Form 2
Goodness of Fit
95
AD*
90
1.209
1.387
Percent
80
70
60
50
40
30
20
10
5
1
16.5
17.5
18.5
Data
Importanza del t-Test
• Fornisce una oggettiva struttura per
semplici esperimenti comparativi
• Potrebbe essere usato per testare tutte le
ipotesi rilevanti in un piano a due livelli,
perché tutte quelle ipotesi coinvolgono la
media attesa da un lato del “cubo” Vs la
media attesa dall’altro lato del “cubo”
9
Gli Intervalli di confidenza
• Il test dà un’oggettiva espressione che riguarda la
differenza tra le medie, ma non specifica quanto
differenti siano
• Forma generale di un intervallo di confidenza
L ≤ θ ≤ U dove P ( L ≤ θ ≤ U ) = 1 − α
• L’intervallo di confidenza al 100(1-α)% per la
differenza tra due medie è:
y1 − y2 − tα / 2,n1 + n2 − 2 S p (1/ n1 ) + (1/ n2 ) ≤ µ1 − µ 2 ≤
y1 − y2 + tα / 2,n1 + n2 − 2 S p (1/ n1 ) + (1/ n2 )
E se ci sono più di due livelli del Fattore?
• Il t-test non viene applicato direttamente
• Ci sono tante situazioni pratiche dove ci sono sia
più di due livelli di interesse, o ci sono più fattori
di simultaneo interesse.
• L’ analisi della varianza (ANOVA) è
l’appropriata analisi cardine per questo tipo di
esperimenti – Capitolo 3, testo
• L’ANOVA è stata sviluppata da Fisher agli inizi
degli anni 1920, e inizialmente applicata agli
esperimenti agricoli
• Oggi è usata soprattutto per esperimenti industriali
10