Unità 7
Test parametrici
☐ Test t di Student
☐ Analisi della varianza ad una via
☐ Confronti multipli
1
TEST t DI STUDENT
In medicina capita spesso di volere confrontare i valori di una
variabile casuale continua misurati su due campioni non
molto numerosi.
Esempio:
 si vogliono confrontare i valori di colesterolo su un gruppo
di individui prima e dopo una particolare dieta;
 si vogliono confrontare due terapie diverse a partire da
due campioni.
In questi casi viene spesso impiegato (anche erroneamente)
il test t di Student.
Esso è di fatto è il più classico (ed abusato) test di tipo
parametrico.
2
Il test t di Student si può impiegare per confrontare
le medie di due campioni, quando si può in primo
luogo supporre che la variabile casuale che si
vorrà analizzare sia distribuita in maniera
gaussiana.
In particolare il test segue procedimenti di calcolo
differenti a seconda che si analizzino due campioni di
dati appaiati (ad esempio rilevazioni ante-post) o due
campioni di dati indipendenti e quindi anche di
diversa numerosità.
3
Test t di Student per dati appaiati
Si ipotizzi che x1, x2, …., xn siano le osservazioni del gruppo 1
e che y1, y2, …., yn siano le corrispondenti osservazioni nel
gruppo 2, di modo che ciascuna osservazione xi sia appaiata
alla corrispondente osservazione yi. (Esempio stesso
campione prima e dopo la terapia).
Si calcolino le differenze di = xi – yi con i = 1,2, ….,n.
PREMESSE:
1. I valori di sono distribuiti in modo gaussiano (non è
indispensabile che i valori originali seguano la distribuzione
normale);
2.
le varie di sono indipendenti l’una dall’altra.
4
CALCOLO:
 si calcoli la media m e la deviazione standard s delle
differenze di;
si calcoli l’errore standard della media ES  s / n ;
m
m
t


n ;
 il valore t è calcolato come
ES s
 scelto il livello di significatività α, l’ipotesi nulla potrà
essere rifiutata con p<α (differenza significativa) se il t
calcolato con l’equazione precedente supererà in valore
assoluto quello indicato nella tabella del t di Student in
corrispondenza a n–1 gradi di libertà.

La seguente Tabella 1 riporta i valori critici del t di Student
per test monodirezionale e bidirezionale.
5
Tabella 1 – Valori critici della
distribuzione t di Student per un
test bilaterale (area nelle due code)
o monolaterale (area in una coda).
N.B. Si noti che, quando il numero
dei gradi di libertà (e quindi la
numerosità delle osservazioni)
aumenta, i valori critici di t
tendono a quelli corrispondenti
della
curva
di
Gauss
standardizzata.
6
ESERCIZIO 1:
La tabella sotto riporta i valori di temperatura corporea in °C
misurati su 6 pazienti al momento della somministrazione di
un presunto antitermico e tre ore dopo. Valutare gli effetti del
farmaco utilizzando il test t di Student bidirezionale.
m = 0,92 °C
s = 0,393 °C
t
0,92
6  5,74
0,393
7
Dalla Tabella 1 con 5 gradi di libertà il valore critico tabellare
con α = 0,01 è (per il test bidirezionale) t0,01= 4,032.
Quindi, essendo il t calcolato uguale a 5,74, le differenze fra
prima e dopo la somministrazione del farmaco sono
significative con p<0,01.
8
ESERCIZIO 2:
La tabella sotto riporta i valori di VEMS (volume espiratorio
massimo nel primo secondo) in litri misurata su un gruppo di
5 asmatici prima e dopo un broncodilatatore. Valutare gli
effetti del farmaco usando il test t di Student bidirezionale.
m = – 0,8 / 5= – 0,16 litri
s = 0,114 litri
t
 0,16
5  3,14
0,114
Dalla Tabella 1 con 4 gradi di
libertà i valori critici tabellari
sono (per il test bidirezionale)
t0,05=2,776 e t0,02=3,747 e
quindi 0,02 < p < 0,05.
9
Esercizio 2 risolto usando il software GraphPad
10
11
12
Test t di Student per campioni indipendenti
Si voglia verificare l’ipotesi nulla che le medie di due
popolazioni, stimate mediante due campioni indipendenti di
numerosità n1 e n2, siano uguali.
PREMESSE:
1. I dati seguono in modo accettabile una distribuzione
normale;
2.
i dati sono indipendenti;
3. le deviazioni standard per le due popolazioni sono
uguali (in generale diciamo che il rapporto tra la deviazione
standard maggiore e quella minore non è maggiore di 2).
13
CALCOLO:

si calcolino le medie m1 e m2 dei due campioni;
 si calcolino le deviazioni standard s1 e s2 dei due
campioni;

il valore t è calcolato come:
t 
m1  m 2
(n1  1) s12  (n 2  1) s 22
n1  n 2  2
n1 n 2
n1  n 2
 scelto il livello di significatività α, l’ipotesi nulla potrà
essere rifiutata con p<α (differenza significativa) se il t
calcolato con l’equazione precedente supererà in valore
assoluto quello indicato nella tabella del t di Student (ancora
Tabella 1) in corrispondenza a n1+n2–2 gradi di libertà.
14
ESERCIZIO 1:
La tabella a lato riporta i valori
di pressione arteriosa sistolica
in un campione di 7 individui
ipertesi trattati con un farmaco
antipertensivo e quelli misurati
in un gruppo di controllo.
Valutare gli effetti del farmaco
utilizzando il test t di Student
bidirezionale.
t
152,1  177,5
6  9,5122  5  9,354 2
762
76
  4,83
76
15
Dalla Tabella 1 con 11 gradi di libertà il valore critico tabellare
con α = 0,001 è (per il test bidirezionale) t0,001= 4,437.
Quindi, essendo il t calcolato uguale a – 4,83, si può rifiutare
l’ipotesi nulla (uguaglianza delle medie) con p<0,001.
16
Esercizio risolto con GraphPad
17
18
ANALISI DELLA VARIANZA
Il concetto di fonti di variabilità
Il valore misurato di una grandezza può variare per diverse cause.
Esempi di queste cause possono essere:
 gli individui in cui la grandezza viene misurata (variabilità
individuale);
 i tempi in cui viene effettuata la misura (variabilità temporale);
 le sollecitazioni a cui la grandezza è sottoposta (ad esempio un
farmaco);
 gli strumenti con cui viene effettuata la misura.
Nell’analisi della varianza vengono prese in considerazione una o più
fonti di variabilità principale da testare contro quella che, di volta in
volta, viene considerata la fonte di variabilità residua.
Si calcola la varianza delle fonti di variabilità principale e la si divide
per la varianza della fonte residua. Questo rapporto si chiama F.
19
ANALISI DELLA VARIANZA A UNA VIA
Un caso particolare dell’analisi della varianza è l’analisi della
varianza a una via.
In questo caso si considera una sola fonte di variabilità
principale, mentre tutte le altre fonti di variabilità sono
considerate come fonti residue.
Un classico esempio si ha quando si vogliono
confrontare più trattamenti: i campioni A, B, C e D sono
stati sottoposti a trattamenti diversi e si vuole verificare
se i risultati ottenuti con i diversi trattamenti non
differiscono fra loro (ipotesi nulla) o almeno uno dei
trattamenti differisce dagli altri (ipotesi alternativa).
20
L’analisi della varianza a una via può essere vista quindi
come una generalizzazione del test t di Student per
campioni indipendenti a più di due gruppi.
Essa parte quindi da premesse analoghe a quelle fatte per il
test t di Student per campioni indipendenti.
L'ipotesi alla base dell'analisi della varianza è che dati l gruppi,
sia possibile scomporre la varianza in due componenti:


varianza interna ai gruppi (anche detta “within”);
varianza tra i gruppi (“between”).
La ragione che spinge a compiere tale distinzione è la
convinzione, da parte del ricercatore, che determinati fenomeni
trovino spiegazione in caratteristiche proprie del gruppo di
appartenenza.
21
CALCOLO:
Indicati con l il numero dei campioni presi in esame (ad
esempio gruppi a diverso trattamento), con mi e ni
rispettivamente la media e il numero di osservazioni del
campione i-esimo e con m e n la media generale ed il numero
complessivo di osservazioni, il procedimento relativo all’analisi
della varianza ad un via può essere riassunto nei seguenti
passi:
1. si calcola la devianza fra gruppi definita come
B

l
1
n i (mi  m) 2
2. si calcola quindi la varianza fra i gruppi data da
B
V 
l 1
22
3. indicati con xi gli elementi del campione i-esimo, si
calcola la devianza di del gruppo i-esimo come
d i  1 i ( x i  mi ) 2
n
4. si calcola la devianza entro i gruppi
W  1 d i
l
(D = B + W sarà la devianza totale)
5. si calcola la varianza entro i gruppi
 
W
nl
23
6.
il rapporto F è dato da
F
V

7. F si distribuisce seguendo la distribuzione F con l – 1 gradi
di libertà per il numeratore e n – l per il denominatore. I valori
critici di questa distribuzione corrispondenti al 95° e ad 99°
percentile sono riportati rispettivamente in Tabella 2 e Tabella 3.
Se il valore di F calcolato supera il valore tabulare di F
corrispondente al 95° percentile si può rifiutare l’ipotesi nulla con
probabilità di errore inferiore al 5% (e quindi almeno uno dei
trattamenti ha fornito un risultato diverso dagli altri con p<0,05).
Se il valore calcolato di F supera anche il valore tabulare
corrispondente al 99° percentile, la probabilità di errore connessa
al rigetto dell’ipotesi nulla sarà inferiore all’1%.
24
Distribuzione F (Fisher-Snedecor)
25
Tabella 2 - Rapporto F: 95° percentile.
26
Tabella 3 - Rapporto F: 99° percentile.
27
ESERCIZIO 1:
In un esperimento sull’inibizione della crescita dei tumori nel
topo mediante trattamenti con due preparati (A e B) si sono
ottenuti i pesi di tumori dopo una settimana dal trapianto in tre
gruppi di 7, 4, 5 topini tenuti rispettivamente come controllo,
sotto trattamento A e sotto trattamento B.
Sulla base dei
risultati
ottenuti,
mostrati in tabella,
si valuti l’efficacia
dei
trattamenti
utilizzando l’analisi
della varianza ad
una via.
28
Soluzione
Gruppo di controllo:
media = 34,71 cg
Gruppo trattato con A: media = 24,0 cg
Gruppo trattato con B: media = 35,60 cg
dev. std. = 9,759 cg
dev. std. = 6,272 cg
dev. std. = 6,189 cg
Devianza fra gruppi = 370,8 cg2
gradi di libertà = 2
Varianza tra gruppi = 185,4 cg2
Devianza entro gruppi = 842,6 cg2
gradi di libertà = 13
Varianza entro gruppi = 64,82 cg2
Devianza totale = 1213 cg2
F = 185,4 / 64,82 = 2,86
a cui corrisponde
p = 0,09346
29
30
N.B. Anche utilizzando la Tabella 2
si giunge alla conclusione che le
differenze non sono significative e
che, con i dati a disposizione, non si
può affermare che l’uno o l’altro dei
due preparati anticancerosi sia
efficace.
Infatti il rapporto F ottenuto (2,86)
è minore di quello in Tabella 2 con
2 e 13 gradi di libertà al livello del
5% (3,81).
31
ESERCIZIO 2:
Le ciambelle assorbono quantità variabili di grassi a seconda
della modalità di cottura. È stato condotto un esperimento che
prevede l’utilizzo di tre tipi di grassi: olio di semi di arachide, olio
di mais e strutto. I dati relativi alla statistica descrittiva sono
riportati in tabella sotto.
L’olio di semi di arachide e l’olio di mais sono grassi insaturi,
mentre lo strutto è un grasso saturo. Si determini se la quantità
di grassi assorbita dipende dal tipo di grasso utilizzato.
32
Soluzione
Devianza tra gruppi  6  (72  73)2  6  (85  73)2  6  (62  73)2  1596 g 2
Devianza entro gruppi  5  (13,34)2  5  (7,77)2  5  (8,22)2  1529 g 2
33
CONFRONTI MULTIPLI
Avendo impiegato l’analisi della varianza ad una via dopo
avere fissato α = 0,05, un valore calcolato del rapporto F
superiore al 95° percentile indica che almeno un gruppo si
differenzia dagli altri con p < 0,05.
Se si vuole sapere quanti e quali siano diversi si possono
fare test t multipli fra le varie coppie di campioni.
Per tenere conto del fatto che si stanno facendo
confronti multipli, si applicheranno opportune
correzioni al livello di significatività.
Un semplice metodo, ad hoc, consiste nell’applicare la
correzione di Bonferroni.
34
N.B. Tale correzione viene, in generale, utilizzata quando è
necessario eseguire molti test di ipotesi con lo stesso
database.
Infatti, eseguendo un gran numero di test,
ciascuno con α = 0,05, alcuni test forniranno un risultato
positivo anche in assenza di qualunque effetto reale.
IMPORTANTE L’uso della correzione di Bonferroni porta a
test più conservativi rispetto a quelli che tengono sotto
controllo l’errore relativo ad ogni singolo controllo (ossia si
possono non evidenziare differenze significative anche se
le differenze sono presenti).
Esistono altri test meno conservativi, basati su altro tipo di
considerazioni, per effettuare confronti multipli dopo avere
eseguito un’analisi della varianza ad un via (per esempio, il
metodo di Tukey, di Duncan, di Student-Newmann-Keuls).
35
L’idea alla base della correzione di Bonferroni è che, se si esegue
un numero di test di significatività pari a c, per ottenere un
livello complessivo di errore di Tipo I pari ad α , si deve
semplicemente dichiarare che ciascun test sarà significativo se il
valore ottenuto di p sarà minore di α / c.
Esempio. Avendo prefissato α = 0,05, se si vogliono verificare 5
ipotesi in un solo esperimento (diciamo 5 diversi trattamenti contro
un controllo), non si accetterà un risultato come significativo se il
valore di p nei vari test non è minore di 0,01.
Questo modo di procedere non è esente da critiche, trattandosi di
un aggiustamento molto grossolano.
Anche se la correzione di Bonferroni porta ad un test molto
conservativo, essa può essere un utile invito alla cautela e a
smorzare gli entusiasmi, quando si esegue un gran numero
di test!
36
Osservazione
La correzione di Bonferroni è un’approssimazione della
correzione di Sidak. Con la correzione di Sidak la formula da
impiegare effettuando c confronti è la seguente:
t
1
 1  (1   ) c
dove αt è il valore da utilizzare in ogni test di confronto se si vuole
avere un livello complessivo di errore di Tipo I pari a α.
Se α « 1 si può ritenere valida la seguente approssimazione del
primo ordine ( ≈ )
  1  (1   t )c  1  (1  c   t  ....)  c   t
da cui si ottiene la correzione di Bonferroni
t 

c
37
Esempio 1: calcolo diretto (da α a αt )
Esempio 2: calcolo inverso (da αt a α)
Nelle seguenti diapositive sono riportati alcuni esempi di
calcolo della probabilità (valutata secondo Sidak) che
uno o più test forniscano un valore di p < 0,05 quando si
eseguono confronti multipli.
Il calcolo è fatto utilizzando il software “GraphPad”.
38
39
40
41