Dipartimento di Fisica SMID a.a. 2004/2005 Esercizi di statistica inferenziale Prof. Maria Antonietta Penco tel. 0103536404 [email protected] 26/1/2005 Esercizio1 E’ noto che un grande numero di pazienti con un determinato tipo di cancro, in una certa sede e in una certa fase clinica, ha un tempo medio di sopravvivenza di µ=38.3 mesi con una deviazione standard di σ =33.5 mesi (distribuzione non gaussiana). 100 pazienti affetti dalla malattia vengono trattati con una nuova tecnica. Ci si può chiedere prima dell’esperimento: a)Ad un livello di significatività del 5% la nuova tecnica risulta migliore o peggiore di quella standard? b) Ad un livello di significatività del 5% la nuova tecnica è più efficace di quella standard? CASO a) Non si ha nessuna informazione sulla nuova tecnica e quindi si ritiene che i valori medi campionari possano risultare sopra o sotto la media. Il test è bidirezionale: H0: µ = 38.3 H1: µ ≠ 38.3 CASO b) Si ritiene (per prove già effettuate, informazioni aggiuntive…) che la sopravvivenza del campione sarà più alta della media e quindi si esegue un test monodirezionale: H0: µ = 38.3 H1: µ > 38.3 Dopo la nuova cura il tempo medio di sopravvivenza del campione risulta di 44.5 mesi. CASO a) Test bidirezionale Poiché il campione è numeroso , per il teorema del limite centrale, la distribuzione campionaria delle medie è: 33 . 5 N (µ = 38.3, σ ( x ) = ). 100 In base all’ipotesi nulla si ha una probabilità del 68% di ottenere una media campionaria compresa tra µ±σ, cioè tra [35.0, 41.7] e una probabilità del 95% di ottenere una media campionaria compresa tra µ±2σ, cioè tra [31.6, 45.0]. La media campionaria dista dalla media della popolazione di 1.85 deviazioni standard: x − µ 44.5 − 38.3 zs = = = 1.85 . 3.35 σ (x) Poiché il valore critico corrispondente al livello di significatività α=0.05 (zc= ±1.96) è maggiore del valore sperimentale del campione non si può rifiutare l'ipotesi nulla. La nuova tecnica equivale a quella standard. CASO b) Test monodirezionale Nel test monodirezionale il valore critico corrispondente al livello di significatività α=0.05 (zc= ±1.64) è minore del valore critico del test bidirezionale in quanto ci si riferisce solo ai valori superiori alla media. Pertanto la zona di rifiuto è maggiore, si è più propensi a rifiutare l’ipotesi nulla. Possiamo quindi osservare che: il test monodirezionale è meno conservativo del test bidirezionale. In questo caso, poiché zc<zs, si rifiuta l'ipotesi nulla. La nuova tecnica è migliore di quella standard. Esercizio 2 Un esperimento clinico confronta due analgesici A e B per stabilire se il farmaco A è più efficace del farmaco B. 100 pazienti hanno ricevuto A per una settimana e B per un'altra, in un ordine di somministrazione stabilito a caso. Alla fine ogni paziente ha espresso la propria preferenza per uno dei due farmaci. 65 soggetti hanno preferito A e 35 B. Il farmaco A ha caratteristiche tali da farlo preferire al farmaco B? Test monodirezionale Ho:nP=50 e H1:nP>50 In base all’ipotesi di uguale efficacia dei due farmaci, la distribuzione campionaria delle frequenze nA è una normale: N(µ = 50 ;σ = 100 ⋅ 0.5 ⋅ 0.5 ) . . Se l’ipotesi nulla è corretta, si ha una probabilità del 68% di ottenere una frequenza di favorevoli al farmaco A compresa tra 50±5, cioè 45<nA<55 e una probabilità del 95% di ottenere una frequenza di favorevoli al farmaco A compresa entro due deviazioni standard, (50±10), cioè 40<nA<60. La frequenza campionaria è 65 e dista dalla media di tre deviazioni standard: Il valore critico al 5% è zc=1.64, all’1% è zc=2.33. zs >2.33, i dati sono altamente significativi, il farmaco A ha caratteristiche migliori del farmaco B ad un livello di significatività dell' 1%. Si rifiuta l’ipotesi di uguale efficacia dei due analgesici. Altra soluzione : L’ipotesi nulla è sempre la stessa, cioè uguale efficacia dei due farmaci: La probabilità di avere risposte favorevoli al farmaco A o al farmaco B è la stessa. H0 : P(A)=P(B)=P=0.5 A B no 65 35 100 nt 50 50 100 no sono le frequenze sperimentali n1 sono le frequenze medie in base all’ipotesi nulla (65-50)2 (35-50)2 = 9 + χ2 = 50 50 Si può osservare che z2= χ2= 9 infatti come è noto : Poiché χ2 s> χ2c = 6.63 (α=1% e 1 gdl), si rifiuta l’ipotesi che i due analgesici siano ugualmente efficaci. Il farmaco A è migliore del farmaco B. Esercizio 3 Il tasso medio di glicemia in un campione di 12 pazienti trattati con il farmaco A è 105 mg/dl con una deviazione standard campionaria 7.2 mg/dl, mentre in un campione di 10 pazienti trattati con il farmaco B il tasso medio di glicemia è 112 mg/dl con una deviazione standard campionaria 8.7 mg/dl. a)Le varianze delle popolazioni ( che si suppone abbiano una distribuzione gaussiana), da cui sono stati estratti i campioni si possono ritenere uguali? b)Ad un livello di significatività del 5%, il farmaco A è da ritenersi più efficace del farmaco B? a) Confronto tra varianze campionarie. H0: σA2= σB2 H1: σA2≠ σB2 Il rapporto tra la varianza campionaria maggiore e la minore : 2 χ ( n −1) (nA − 1) s = B 2 s (nB − 1) χ ( n −1) 2 B 2 A A è distribuito secondo la variabile F: Il valore sperimentale di F risulta essere: 2 B 2 A 2 8.7 s = 1.46 Fs = = 2 7.2 s Mentre il valore critico F9,11=2.90 corrispondente al livello di significatività richiesto risulta maggiore. L’ipotesi nulla è compatibile con i risultati sperimentali: si può assumere che le due popolazioni abbiano la stessa varianza. b) Test monodirezionale sinistro: H0: µA=µB H1: µA<µB da cui: H0: µA-µB=0 H1: µA-µB<0 Poichè si suppone che le varianze delle popolazioni da cui sono stati estratti i campioni siano uguali e inoltre la numerosità dei campioni è piccola, dobbiamo stimare la varianza della popolazione facendo una media pesata delle varianze campionarie: 2 2 ( 1 ) ( 1 ) n s n s − + − A B B = 62.6 S2 = A (nA − 1) + (nB − 1) Per l’ipotesi nulla la distribuzione campionaria delle differenze delle medie ha valor medio zero, ma varianza stimata dai dati campionari, di conseguenza il rapporto : ( x A − xB ) − ( µ A − µ B ) 1 1 s + n A nB è una variabile t di Student con (nA+nB-2)=20 gradi di libertà. Il valore sperimentale risulta ts=-2.07. La regione di rifiuto dell'ipotesi nulla è costituita dai valori di t minori o uguali al valore di t= - 1.725, cioè la coda sinistra della distribuzione di Student con 20 gradi di libertà, corrispondente ad un livello di significatività α=5%. Questo valore critico è tc=-1.725. Il valore sperimentale è più piccolo del valore critico ts<tc e cade quindi nella zona di rifiuto dell’ipotesi di uguale efficacia. Possiamo concludere che il farmaco A è da ritenersi più efficace del farmaco B. Esercizio 4 Si è somministrato un presunto antipiretico a sei pazienti e si è misurata la temperatura al momento della somministrazione e tre ore dopo. Ci si chiede se la riduzione è significativa. Paziente 1 2 3 4 5 6 Somma media Temperatura Prima Dopo tre ore 38.3 37.2 39.1 38.4 40.2 38.6 37.6 36.7 38.9 38.2 38.7 38.2 232.8 227.3 38.8 37.88 Differenza +1.1 +0.7 +1.6 +0.9 +0.7 +0.5 +5.5 0.92 Test d'ipotesi sulla differenza tra medie per prove ripetute. I risultati delle due serie di misure sono correlati, le prove sono ripetute a distanza di tempo sullo stesso soggetto, non è possibile utilizzare il test delle differenze valido per campioni indipendenti. In questo caso la distribuzione campionaria della differenza tra medie ha ancora come media la differenza tra le medie delle popolazioni da cui i campioni sono stati estratti, ma la varianza è data dalla somma delle varianze delle singole distribuzioni campionarie diminuita di un fattore dovuto alla correlazione. Poiché il coefficiente di correlazione in generale non è noto, si ricorre allora ad un metodo che consiste nel fare riferimento direttamente alle differenze tra i valori di ognuna delle n coppie. In questo modo si passa ad un unico campione di n differenze di tra i punteggi conseguiti da ciascun elemento della coppia e si pone come ipotesi nulla che l’antipiretico non sia efficace. H0: µd=0 ; H1: µd<0 Sotto questa ipotesi si calcola quanto la media del campione si discosta dallo zero. La distribuzione campionaria delle medie ha media nulla per ipotesi: µd=0 cioè non c’è nessuna differenza prima e dopo l’assunzione del farmaco : il farmaco non è efficace. La varianza è stimata dai dati campionari: s (d ) 2 = ∑ (di − d ) i n −1 2 ∑d 2 i 2 n d = i − = 0.154 n −1 n −1 2 s (d ) 0.154 s(d ) = = = 0.16 n 6 E allora : d − µ d 0.92 ts = = = 5.75 s(d ) 0.16 tc = 2.57 α=5% 5 gdl. L'ipotesi nulla è rifiutata. L’antipiretico è efficace.