Dipartimento di Fisica
SMID
a.a. 2004/2005
Esercizi di statistica inferenziale
Prof. Maria Antonietta Penco
tel. 0103536404
[email protected]
26/1/2005
Esercizio1
E’ noto che un grande numero di pazienti con un determinato
tipo di cancro, in una certa sede e in una certa fase clinica, ha
un tempo medio di sopravvivenza di µ=38.3 mesi con una
deviazione standard di σ =33.5 mesi (distribuzione non
gaussiana). 100 pazienti affetti dalla malattia vengono trattati
con una nuova tecnica.
Ci si può chiedere prima dell’esperimento:
a)Ad un livello di significatività del 5% la nuova tecnica
risulta migliore o peggiore di quella standard?
b) Ad un livello di significatività del 5% la nuova tecnica è
più efficace di quella standard?
CASO a)
Non si ha nessuna informazione sulla nuova tecnica e
quindi si ritiene che i valori medi campionari possano
risultare sopra o sotto la media.
Il test è bidirezionale:
H0: µ = 38.3
H1: µ ≠ 38.3
CASO b)
Si ritiene (per prove già effettuate, informazioni
aggiuntive…) che la sopravvivenza del campione sarà
più alta della media e quindi si esegue un test
monodirezionale:
H0: µ = 38.3
H1: µ > 38.3
Dopo la nuova cura il tempo medio di sopravvivenza del
campione risulta di 44.5 mesi.
CASO a) Test bidirezionale
Poiché il campione è numeroso , per il teorema del limite
centrale, la distribuzione campionaria delle medie è:
33 . 5
N (µ = 38.3, σ ( x ) =
).
100
In base all’ipotesi nulla si ha una probabilità del 68%
di ottenere una media campionaria compresa tra
µ±σ, cioè tra [35.0, 41.7] e una probabilità del 95% di
ottenere una media campionaria compresa tra µ±2σ,
cioè tra [31.6, 45.0].
La media campionaria dista dalla media della popolazione di 1.85
deviazioni standard:
x − µ 44.5 − 38.3
zs =
=
= 1.85 .
3.35
σ (x)
Poiché il valore critico corrispondente al livello di
significatività α=0.05 (zc= ±1.96) è maggiore del valore
sperimentale del campione non si può rifiutare l'ipotesi
nulla. La nuova tecnica equivale a quella standard.
CASO b) Test monodirezionale
Nel test monodirezionale il valore critico corrispondente
al livello di significatività α=0.05 (zc= ±1.64) è minore del
valore critico del test bidirezionale in quanto ci si riferisce
solo ai valori superiori alla media. Pertanto la zona di
rifiuto è maggiore, si è più propensi a rifiutare l’ipotesi
nulla. Possiamo quindi osservare che:
il test monodirezionale è meno conservativo del test
bidirezionale.
In questo caso, poiché zc<zs, si rifiuta l'ipotesi nulla. La
nuova tecnica è migliore di quella standard.
Esercizio 2
Un esperimento clinico confronta due analgesici A e B
per stabilire se il farmaco A è più efficace del farmaco B.
100 pazienti hanno ricevuto A per una settimana e B per
un'altra, in un ordine di somministrazione stabilito a
caso. Alla fine ogni paziente ha espresso la propria
preferenza per uno dei due farmaci. 65 soggetti hanno
preferito A e 35 B.
Il farmaco A ha caratteristiche tali da farlo preferire al
farmaco B?
Test monodirezionale Ho:nP=50 e H1:nP>50
In base all’ipotesi di uguale efficacia dei due farmaci, la
distribuzione campionaria delle frequenze nA è una
normale:
N(µ = 50 ;σ = 100 ⋅ 0.5 ⋅ 0.5 )
.
.
Se l’ipotesi nulla è corretta, si ha una probabilità del 68%
di ottenere una frequenza di favorevoli al farmaco A
compresa tra 50±5, cioè 45<nA<55 e una probabilità del
95% di ottenere una frequenza di favorevoli al farmaco A
compresa entro due deviazioni standard, (50±10), cioè
40<nA<60.
La frequenza campionaria è 65 e dista dalla media di
tre deviazioni standard:
Il valore critico al 5% è zc=1.64, all’1% è zc=2.33.
zs >2.33, i dati sono altamente significativi, il farmaco
A ha caratteristiche migliori del farmaco B ad un
livello di significatività dell' 1%. Si rifiuta l’ipotesi di
uguale efficacia dei due analgesici.
Altra soluzione :
L’ipotesi nulla è sempre la stessa, cioè uguale efficacia
dei due farmaci:
La probabilità di avere risposte favorevoli al farmaco A
o al farmaco B è la stessa.
H0 : P(A)=P(B)=P=0.5
A
B
no
65
35
100
nt
50
50
100
no sono le frequenze sperimentali
n1 sono le frequenze medie in base all’ipotesi nulla
(65-50)2 (35-50)2
=
9
+
χ2 =
50
50
Si può osservare che z2= χ2= 9 infatti come è noto :
Poiché χ2 s> χ2c = 6.63 (α=1% e 1 gdl), si rifiuta
l’ipotesi che i due analgesici siano ugualmente
efficaci. Il farmaco A è migliore del farmaco B.
Esercizio 3
Il tasso medio di glicemia in un campione di 12 pazienti
trattati con il farmaco A è 105 mg/dl con una deviazione
standard campionaria 7.2 mg/dl, mentre in un campione
di 10 pazienti trattati con il farmaco B il tasso medio di
glicemia è 112 mg/dl con una deviazione standard
campionaria 8.7 mg/dl.
a)Le varianze delle popolazioni ( che si suppone abbiano
una distribuzione gaussiana), da cui sono stati estratti i
campioni si possono ritenere uguali?
b)Ad un livello di significatività del 5%, il farmaco A è da
ritenersi più efficace del farmaco B?
a) Confronto tra varianze campionarie.
H0: σA2= σB2 H1: σA2≠ σB2
Il rapporto tra la varianza campionaria maggiore e la
minore :
2
χ ( n −1) (nA − 1)
s
= B
2
s
(nB − 1) χ ( n −1)
2
B
2
A
A
è distribuito secondo la variabile F:
Il valore sperimentale di F risulta essere:
2
B
2
A
2
8.7
s
= 1.46
Fs = =
2
7.2
s
Mentre il valore critico F9,11=2.90 corrispondente al
livello di significatività richiesto risulta maggiore.
L’ipotesi nulla è compatibile con i risultati sperimentali: si
può assumere che le due popolazioni abbiano la stessa
varianza.
b) Test monodirezionale sinistro:
H0: µA=µB
H1: µA<µB
da cui:
H0: µA-µB=0
H1: µA-µB<0
Poichè si suppone che le varianze delle popolazioni da cui
sono stati estratti i campioni siano uguali e inoltre la
numerosità dei campioni è piccola, dobbiamo stimare la
varianza della popolazione facendo una media pesata delle
varianze campionarie:
2
2
(
1
)
(
1
)
n
s
n
s
−
+
−
A
B
B
= 62.6
S2 = A
(nA − 1) + (nB − 1)
Per l’ipotesi nulla la distribuzione campionaria delle
differenze delle medie ha valor medio zero, ma varianza
stimata dai dati campionari, di conseguenza il rapporto :
( x A − xB ) − ( µ A − µ B )
1 1
s
+
n A nB
è una variabile t di Student con (nA+nB-2)=20 gradi di
libertà.
Il valore sperimentale risulta ts=-2.07.
La regione di rifiuto dell'ipotesi nulla è costituita dai
valori di t minori o uguali al valore di t= - 1.725, cioè la
coda sinistra della distribuzione di Student con 20
gradi di libertà, corrispondente ad un livello di
significatività α=5%. Questo valore critico è tc=-1.725.
Il valore sperimentale è più piccolo del valore critico
ts<tc e cade quindi nella zona di rifiuto dell’ipotesi di
uguale efficacia. Possiamo concludere che il farmaco A
è da ritenersi più efficace del farmaco B.
Esercizio 4
Si è somministrato un presunto antipiretico a sei pazienti e si è
misurata la temperatura al momento della somministrazione e tre
ore dopo. Ci si chiede se la riduzione è significativa.
Paziente
1
2
3
4
5
6
Somma
media
Temperatura
Prima
Dopo tre ore
38.3
37.2
39.1
38.4
40.2
38.6
37.6
36.7
38.9
38.2
38.7
38.2
232.8
227.3
38.8
37.88
Differenza
+1.1
+0.7
+1.6
+0.9
+0.7
+0.5
+5.5
0.92
Test d'ipotesi sulla differenza tra medie per prove
ripetute.
I risultati delle due serie di misure sono correlati, le prove
sono ripetute a distanza di tempo sullo stesso soggetto, non
è possibile utilizzare il test delle differenze valido per
campioni indipendenti.
In questo caso la distribuzione campionaria della
differenza tra medie ha ancora come media la
differenza tra le medie delle popolazioni da cui i
campioni sono stati estratti, ma la varianza è data
dalla somma delle varianze delle singole distribuzioni
campionarie diminuita di un fattore dovuto alla
correlazione.
Poiché il coefficiente di correlazione in generale non è
noto, si ricorre allora ad un metodo che consiste nel
fare riferimento direttamente alle differenze tra i valori
di ognuna delle n coppie. In questo modo si passa ad
un unico campione di n differenze di tra i punteggi
conseguiti da ciascun elemento della coppia e si pone
come ipotesi nulla che l’antipiretico non sia efficace.
H0: µd=0 ;
H1: µd<0
Sotto questa ipotesi si calcola quanto la media del
campione si discosta dallo zero.
La distribuzione campionaria delle medie ha media nulla
per ipotesi:
µd=0
cioè non c’è nessuna differenza prima e dopo l’assunzione del
farmaco : il farmaco non è efficace.
La varianza è stimata dai dati campionari:
s (d ) 2 =
∑ (di − d )
i
n −1
2
∑d
2
i
2
n
d
= i
−
= 0.154
n −1 n −1
2
s (d )
0.154
s(d ) =
=
= 0.16
n
6
E allora :
d − µ d 0.92
ts =
=
= 5.75
s(d )
0.16
tc = 2.57 α=5% 5 gdl. L'ipotesi nulla è
rifiutata. L’antipiretico è efficace.