Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Test di ipotesi Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 1 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 2 Inferenza statistica : ‘…indurre o inferire proprietà di un universo [parametri] sulla base dei dati conosciuti relativi ad un campione [statistiche].’ (H.M.Blalock). Solo eccezionalmente conosciamo direttamente le caratteristiche della popolazione, di solito dobbiamo stimarle in base alle caratteristiche dei campioni che sono stati estratti dalla popolazione. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 3 Possiamo trarre conclusioni sul valore del parametro nella popolazione a partire dai dati campionari seguendo due percorsi: 1. Il calcolo dell'intervallo di confidenza 2. Il test dell'ipotesi Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 4 Il test dell'ipotesi verifica se il campione è compatibile con un’ipotesi relativa alle caratteristiche della popolazione. Il campione non interessa di per sé ma solo in quanto consente di stimare le caratteristiche della popolazione. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 5 La verifica (o test) dell’ipotesi è un procedimento logico. Il procedimento prevede dapprima la formulazione dell’ipotesi e quindi la valutazione della probabilità di ottenere il campione dato se l’ipotesi è vera. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 6 Che cos'è un’ipotesi? ‘Un ipotesi è un’affermazione relativa ad un evento futuro, o comunque ad un evento il cui risultato è sconosciuto al momento in cui l’affermazione viene fatta, costruita in modo da poter risultare non vera e pertanto da respinta.’ (H.M.Blalock). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 7 Dal punto di vista filosofico il concetto essenziale è quello della provvisorietà dei risultati scientifici: una affermazione relativa ad un fenomeno scientifico è un’ipotesi di lavoro, che resta provvisoriamente valida fino a quando si osservano risultati sperimentali incompatibili con essa. A quel punto l’ipotesi di lavoro viene lasciata cadere perchè inadeguata e sarà necessario sviluppare ipotesi diverse o più complesse per spiegare il fenomeno. Tali ipotesi saranno altrettanto provvisorie e sottoposte a verifica sperimentale, ripetendo ciclicamente lo stesso percorso. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 8 Intuitivamente si vorrebbe formulare le ipotesi in modo da confermarle. “Se la mia ipotesi è vera potrò ripetere molte volte gli stessi esperimenti ed i loro risultati ripetuti la confermeranno”. Se così fosse, la ripetizione di un esperimento consentirebbe di confermare l'ipotesi. Sarebbe quindi utile condurre ripetuti esperimenti al solo scopo di confermare un'ipotesi che si ritiene valida. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 9 Alcuni filosofi, in particolare Karl Popper hanno invece evidenziato come la semplice reiterazione di un risultato non sia di per sé conferma di una teoria. Una teoria non può essere confermata ma soltanto rifiutata. Si giunge al rifiuto quando le conclusioni basate sulla toria non sono più compatibili con risultati sperimentali. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 10 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 11 Pertanto secondo Popper, il ricercatore deve formulare una teoria compatibile con tutte le conoscenze già disponibili e condurre esperimenti per “metterla in crisi”. - La funzione dell'esperimento è solo di mettere in crisi una teoria, portando fatti nuovi in contraddizione con essa. - Ripetere esperimenti relativi ad una teoria già confutata è inutile. - Cercare di confermare una teoria ripetendo esperimenti che sono la replica di esperimenti precedenti è altrettanto inutile. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 12 Come può il ricercatore che lavora dopo questa rivoluzione epistemologica sostenere una teoria? Attraverso il procedimento di verifica dell'ipotesi. L'ipotesi che corrisponde alla teoria è detta ipotesi di lavoro. Abbiamo visto che la semplice ripetizione di esperimenti non basta a confermare una teoria e la corrispondente ipotesi di lavoro. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 13 L'unica soluzione che rimane è quindi formulare un'ipotesi contrastante con essa e cercare di negarla con evidenze sperimentali. Questa ipotesi costruita ad arte è detta ipotesi nulla. L’esperimento non ha la funzione di ‘sostenere’ l’ipotesi di lavoro ma, all’opposto ha la funzione di cercare di negare un’ipotesi simmetrica ed opposta ad essa, costruita appositamente e detta ipotesi nulla. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 14 Il procedimento prevede un percorso analogo a quello delle dimostrazioni per assurdo usate spesso in matematica ed in geometria. Se l’esperimento nega l’ipotesi nulla, la teoria (ipotesi di lavoro) resta corroborata (attenzione: non “provata”!). La teoria resta provvisoriamente valida fino a quando un diverso esperimento entrerà in contraddizione con essa. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 15 Se invece l’esperimento non nega l’ipotesi nulla, sarà l’ipotesi di lavoro (quindi la teoria da cui deriva) a dover essere rivista. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 16 La realtà non è perfetta ed esistono errori 'giudiziari'. Realtà Verdetto Colpevole Innocente Colpevole Corretto Non corretto Innocente Non corretto Corretto In statistica questi errori accadono in conseguenza della variabilità casuale. Lo statistico indica il rischio che considera accettabile di fornire una conclusione diversa dalla realtà (ignota). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 17 Nel procedimento di verifica delle ipotesi applichiamo metodi probabilistici e quindi possiamo trovarci a rifiutare l’ipotesi nulla quando essa è vera. Si parla in questo caso di Errore di 1° tipo o Errore α. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 18 Ipotesi nulla Statistico Rifiuta Non rifiuta falsa vera Corretto Non corretto Non corretto Corretto Ipotesi nulla Statistico falsa vera Rifiuta Corretto Errore α Non rifiuta Errore β Corretto Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 19 Di solito l’errore di primo tipo è fissato al 5% (α = 0.05). Questo significa che ripetendo molte volte un esperimento, nella situazione in cui H0 è vera, ci troveremo a rifiutarla nel 5% degli esperimenti. Come può accadere? Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 20 Basta che il nostro campione sia uno di questi! Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 21 Le fasi del procedimento di verifica dell’ipotesi: 1. Il ricercatore formula un’ipotesi di lavoro, che costituisce la spiegazione di un fenomeno o indica il valore di un parametro. 2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore intende sottoporre a verifica, costruita in modo simmetrico all’ipotesi di lavoro e formulata in modo tale da poter essere negata dall’esperimento programmato. 3. Viene valutato dal ricercatore quanto è grande il rischio per lui accettabile di fornire una conclusione diversa dalla realtà (a lui ignota). 4. Viene disegnato l’esperimento e viene definita la dimensione del campione. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 22 5. Vengono delineati tutti i possibili risultati dell’esperimento e viene calcolata la probabilità associata a ciascun risultato, data l’ipotesi nulla. 6. Viene scelto il test statistico appropriato. 7. Viene condotto l’esperimento. 8. Il risultato dell’esperimento viene letto e confrontato con la distribuzione di probabilità precedentemente calcolata. Se la probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è inferiore alla soglia definita al punto 3 precedente, si conclude per il rifiuto dell’ipotesi nulla. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 23 Il percorso logico del test dell'ipotesi è comune a tutti i test statistici. Ricostruiamolo con il seguente esempio per il confronto della media. 1.Ipotizzo in base all’osservazione clinica sui miei pazienti che il fumo di tabacco modifica i valori pressori nei forti fumatori (H1: i forti fumatori hanno pressione media diversa rispetto alla popolazione non fumatrice). 2. H0: 'i forti fumatori hanno la stessa pressione media della popolazione'. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 24 Il valore medio nella popolazione è 145, conosciuto da studi precedenti. ll valore della deviazione standard nella popolazione, conosciuto da studi precedenti, è 8,5. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 25 3. fisso l'errore α al 5%; sono interessato ad eventuali scostamenti in entrambe le direzioni (test di ipotesi bilaterale o 'a 2 code'). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 26 4. Programmo uno studio in cui viene misurata la pressione arteriosa sistolica a 23 soggetti. 5. La variabile 'pressione arteriosa' nella popolazione ha distribuzione gaussiana. Pertanto la distribuzione di probabilità delle medie campionarie è data dalla distribuzione gaussiana anche se il campione è piccolo. 6. Il test statistico è il test z. (Il test mi indicherà la probabilità che i soggetti studiati siano un campione casuale estratto da una popolazione con i valori dati di media e deviazione standard). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 27 7. Conduco lo studio ed ottengo i seguenti risultati. Media = 148,5 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 28 8a Calcolo del test . Media campione = 148,5 media popolazione = 145 Deviazione standard popolazione = 8,5 n = 23 8b Interpreto il risultato ottenuto con l’uso delle tavole della distribuzione normale standard. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 29 8a Calcolo del test . z = (Media campione – media popolazione) / Errore standard = (148,5 – 145) / (8,5 / radq(23)) = 3,5 / 1,772 = 1,97 8b Interpreto il risultato ottenuto con l’uso delle tavole della distribuzione normale standard. La probabilità che il campione sia stato estratto da una popolazione con media pari a 145 mmHg è < 0,05. Rifiuto l’ipotesi nulla che il campione sia stato estratto da una popolazione con tale media. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 30 ESEMPIO 2. Il caso della distribuzione binomiale Esaminiamo i diversi punti sviluppando la semplice situazione della verifica di un’ipotesi relativa al bilanciamento di una moneta. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 1. Il 31 ricercatore formula un’ipotesi di lavoro, che costituisce la spiegazione di un fenomeno o il valore di un parametro. Il processo che porta alla formulazione della teoria e quindi dell’ipotesi di lavoro non è statistico ma entrano in gioco molteplici elementi, tra cui: - studio delle precedenti teorie (la ricerca di letteratura); - conoscenze su altri fenomeni collegati a quello che si vuole indagare (es. studi di laboratorio, informazioni su meccanismi di azione); - osservazioni empiriche (es. osservazioni cliniche ripetute). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 32 Questo percorso non è codificato: un aspetto importante è costituito da inventiva e capacità del ricercatore e dalla capacità di riconoscere aspetti che non corrispondono alle previsioni basate sulle ipotesi di lavoro correnti. E’ importante la rivalutazione sotto nuove prospettive delle conoscenze già acquisite. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 33 Esempio. Descrizione delle conoscenze e del contesto che ha generato l’ipotesi. Al tavolo da gioco (lancio di una moneta) si osserva un giocatore particolarmente fortunato la cui moneta viene frequentemente lanciata in modo a lui favorevole. L’ipotesi di lavoro che viene formulata è che la moneta sia alterata e quindi uno dei possibili risultati (testa) compaia con frequenza diversa da quanto sarebbe atteso da una moneta bilanciata. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 34 I controlli di laboratorio che abbiamo potuto effettuare non sono stati indicativi sulla simmetria e sul bilanciamento della moneta. Non possono essere escluse altre ipotesi, quali l’abilità del giocatore o il caso. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 35 2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore intende sottoporre a verifica La formulazione è simmetrica a quella dell’ipotesi di lavoro. Ipotesi di lavoro (anche detta Ipotesi alternativa). H1: ‘la moneta è alterata in modo tale che un risultato si verifichi con frequenza diversa rispetto all'altro’. Ipotesi nulla. H0: ‘la moneta è bilanciata. L'attesa è che i due risultati si verifichino con eguale frequenza’. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 36 H0 è formulata in modo tale da poter essere negata dall’esperimento programmato. Le conseguenze dell’affermazione dell’ipotesi nulla sono quantificabili (se la moneta è bilanciata si applica la distribuzione binomiale con π=0.5), pertanto l’ipotesi nulla è formulata in modo tale da poter essere negata. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 37 3. Lo statistico indica il rischio accettabile di fornire una conclusione diversa dalla realtà (a lui ignota). a. Nel procedimento di verifica delle ipotesi applichiamo metodi probabilistici e quindi possiamo trovarci a rifiutare l’ipotesi nulla quando essa è vera. Si parla in questo caso di Errore di 1° tipo o Errore α. Di solito l’errore di primo tipo è fissato al 5% (α = 0.05). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 38 Ipotesi nulla Statistico Rifiuta Non rifiuta falsa vera Corretto Non corretto Non corretto Corretto Ipotesi nulla Statistico falsa vera Rifiuta Corretto Errore α Non rifiuta Errore β Corretto Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 39 Calcoliamo le combinazioni di teste e croci che corrispondono al rifiuto dell’ipotesi nulla, con errore di primo tipo inferiore al 5% Croci Teste 0 10 1 9 2 8 3 7 4 6 5 5 6 4 7 3 8 2 9 1 10 0 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi p 40 P(r successi su N prove) = ( NR ) (π) (1-π) r (N-r) ( NR ) = N! / [r! (N-r)!] Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 41 Se fissiamo l'errore α a 0,05, rifiuteremo l'ipotesi nulla solo se l'esperimento di 10 lanci ha dato uno tra i seguenti risultati: 0 teste 1 testa 9 teste 10 teste Se l'ipotesi nulla è vera, questi sono i valori (simmetrici nelle due code) la cui probabilità sommata è < 0,05. Sono evenienze remote, sempre che l'ipotesi nulla sia vera. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 42 Distribuzione binomiale N=10 0,300 0,250 probabilità 0,200 0,150 0,100 0,050 0,000 0,500 0 1 2 3 4 5 6 7 8 9 10 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 43 Nel caso si voglia essere maggiormente ‘conservativi’ nella difesa dell’ipotesi nulla si sceglie α = 0.01 Nel caso si voglia essere maggiormente ‘favorevoli’ all’ipotesi di lavoro si sceglie α = 0.10 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 44 b. Lo statistico misura anche il rischio di non rifiutare l’ipotesi nulla quando essa è falsa. Si parla in questo caso di Errore di 2° tipo o Errore β. Complementare all'errore β abbiamo la potenza dello studio: Potenza = 1 – (Errore β) 45 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi Ipotesi nulla Statistico Rifiuta Non rifiuta falsa vera Corretto Non corretto Non corretto Corretto Ipotesi nulla Statistico falsa vera Rifiuta Corretto Errore α Non rifiuta Errore β Corretto Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 46 Di solito si disegna l'esperimento in modo che la potenza sia tra 80% e 90% (rispettivamente: β = 0.20 o β = 0.10). In alternativa possiamo misurare l'errore β corrispondente ad una data numerosità campionaria. 47 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi Supponiamo che la realtà sia di una monetina sbilanciata, con π=0.75 e (1-π)=0.25. Questa è la distribuzione di probabilità. distribuzione binomiale n=10 0,300 0,250 probabilità 0,200 0,150 0,100 0,050 0,000 0,750 0 1 2 3 4 5 6 7 8 9 10 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056 numero successi Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 48 Possiamo quantificare l'errore β misurando la probabilità di estrarre uno dei valori per cui non rifiuteremmo l'ipotesi nulla. 49 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10, π=0,75). Si noti l’ampia sovrapposizione. Diversi risultati sono compatibili con entrambe le distribuzioni Distribuzione binomiale N=10 0,300 0,250 probabilità 0,200 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 8 9 10 0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056 numero di successi Risultati che portano al rifiuto dell'ipotesi nulla Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 50 In questo caso l'errore β è molto alto: 0,282+0,250+0,146+0,058+0,016+0,003 = 0,755 Conclusione: l'esperimento è mal disegnato. Lo studio è inadeguato a mettere in evidenza una differenza elevata (0,75 vs. 0,5) nella probabilità di ottenere testa al lancio della moneta. 51 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi Come possiamo procedere? Solo aumentando le dimensioni del campione possiamo ridurre sia l’errore α sia l’errore β (l’argomento sarà ripreso in seguito). Se le dimensioni del campione non cambiano: diminuendo α aumenta β e viceversa. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 52 Senza anticipare la lezione sulla potenza dello studio, consideriamo nei prossimi lucidi la sovrapposizione tra due distribuzioni di probabilità binomiali con il variare di N. 53 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10, π=0,75). Si noti l’ampia sovrapposizione. Diversi risultati dell'esperimento sono compatibili con entrambe le distribuzioni Distribuzione binomiale N=10 0,300 0,250 probabilità 0,200 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 8 9 10 0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056 numero di successi Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 54 L’istogramma presenta la distribuzione di probabilità binomiale per (N=50, π=0,5) e (N=50, π=0,75). Si noti che la sovrapposizione è inferiore a quanto osservato nella figura precedente. distribuzione binomiale n=50 0,14 0,12 0,500 0,750 probabilità 0,1 0,08 0,06 0,04 0,02 0 0 2 4 6 8 1 0 1 2 1 4 1 6 1 8 2 0 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 2 2 2 4 2 6 n. successi 2 8 3 0 3 2 3 4 3 6 3 8 4 0 4 2 4 4 4 6 4 8 5 0 55 In questo caso l'errore β è: 0,01482+0,00765+0,00365+0,00160+0,00065+0,00024+ 0,00001= 0,02862 = 2,862 % Conclusione: l'esperimento è ben disegnato. Lo studio ha una potenza elevata per mettere in evidenza la differenza (0,75 vs. 0,5) nella probabilità di ottenere testa al lancio della moneta. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 56 Attenzione quando parliamo di errori di 1° e 2° tipo ci riferiamo solo agli errori campionari, cioè agli effetti della variabilità casuale, che porta a differenze tra i diversi campioni. Non esistono metodi statistici per ovviare agli errori sistematici. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 57 4. Viene disegnato l’esperimento e viene definita la dimensione del campione. Si ricorda qui che il termine ‘esperimento’ non si riferisce ai soli esperimenti di laboratorio ma include anche gli studi epidemiologici (osservazionali). La dimensione del campione dipenderà dal risultato atteso dello studio e dagli errori di primo e di secondo tipo. Il calcolo della dimensione del campione sarà affrontato nelle successive lezioni. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 58 5. Vengono delineati tutti i possibili risultati dell’esperimento e viene calcolata la probabilità associata a ciascun risultato, data l’ipotesi nulla. Si tratta qui di enumerare tutti i possibili risultati e quindi di calcolare la probabilità associata a ciascun risultato, data H0. Nell’esempio considerato, la funzioni di probabilità è la funzione binomiale. 59 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi P(r successi su N prove) = ( NR ) (π) (1-π) r (N-r) ( NR ) = N! / [r! (N-r)!] Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 60 Distribuzione binomiale N=10, p=0.5 0,300 0,250 0,200 0,150 0,100 0,050 0,000 0,500 0 1 2 3 4 5 6 7 8 9 10 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 61 ‘Qual è la probabilità di avere almeno un certo numero di successi (r) dato un certo numero di prove (N)’? In questo caso: 1 Calcolo la probabilità per tutti i numeri interi compresi tra r ed N (inclusi) 2 Sommo la probabilità per ciascuno degli interi compresi tra r ed N P(r’>=r in N prove) = p(r) + p(r+1) + …+ p(N-1) + p(N) Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 62 7. Viene scelto il test statistico appropriato. Il test statistico serve a calcolare la probabilità associata al risultato osservato dall’esperimento Nell’esempio dato il test appropriato è il calcolo della distribuzione di probabilità binomiale, che fornisce direttamente un valore di probabilità. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 63 A quale delle due situazioni seguenti siamo interessati? - valore di probabilità cumulativo del singolo risultato e di tutti i risultati che si allontanano maggiormente dall’ipotesi nulla, considerando soltanto una direzione (test di ipotesi monolaterali). - valore di probabilità cumulativo del singolo risultato e di tutti i risultati che si allontanano maggiormente dall’ipotesi nulla, considerando entrambe le direzioni (test di ipotesi bilaterali). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 64 Il grafico illustra la coda di sinistra (probabilità cumulativa <=0.05) della distribuzione di probabilità binomiale con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori considerati è non è esattamente uguale a 0.05 ma è lievemente inferiore. 65 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 0,12 0,500 Serie1 0,1 0,08 0,06 0,04 0,02 0 0 1 2 3 4 5 6 7 8 9 1 1 0 1 1 1 2 3 1 1 4 5 1 1 6 7 1 1 8 9 2 2 0 1 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 2 2 2 3 2 2 2 4 5 6 2 2 7 8 2 3 9 0 3 3 1 2 3 3 3 4 3 3 5 6 3 3 7 8 66 3 4 9 0 4 4 1 2 4 4 3 4 4 4 5 6 4 4 7 8 4 5 9 0 Il grafico illustra la coda di destra (probabilità cumulativa => 0.95) della distribuzione di probabilità binomiale con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori considerati è lievemente inferiore a 0.05. 67 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 0,12 0,500 Serie1 0,1 0,08 0,06 0,04 0,02 0 0 1 2 3 4 5 6 7 8 9 1 1 0 1 1 1 2 3 1 1 4 5 1 1 6 7 1 1 8 9 2 2 0 1 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 2 2 2 3 2 2 2 4 5 6 2 2 7 8 2 3 9 0 3 3 1 2 3 3 3 4 3 3 5 6 3 3 7 8 68 3 4 9 0 4 4 1 2 4 4 3 4 4 4 5 6 4 4 7 8 4 5 9 0 Il grafico illustra le due code (probabilità cumulativa <=0.05, equamente ripartita) della distribuzione di probabilità binomiale con π = 0.5 ed n=50. Si noti che, trattandosi di una variabile discreta la probabilità cumulativa per i valori considerati è lievemente inferiore a 0.05 . 69 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 0,12 0,500 Serie1 0,1 0,08 0,06 0,04 0,02 0 0 1 2 3 4 5 6 7 8 9 1 1 0 1 1 1 2 3 1 1 4 5 1 1 6 7 1 1 8 9 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 2 2 0 1 2 2 2 3 2 2 2 4 5 6 2 2 7 8 2 3 9 0 3 3 1 2 3 3 3 4 3 3 5 6 70 3 3 7 8 3 4 9 0 4 4 1 2 4 4 3 4 4 4 5 6 4 4 7 8 4 5 9 0 8. Viene condotto l’esperimento. Nell’esempio l’esperimento consiste semplicemente nel lancio della moneta in oggetto per N volte (n=dimensione del campione). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 71 Il risultato dell’esperimento viene letto e confrontato con la distribuzione di probabilità precedentemente calcolata. Se la probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è inferiore alla soglia definita al punto precedente, si conclude per il rifiuto dell’ipotesi nulla. Altrimenti si conclude per il 'non rifiuto' dell'ipotesi nulla. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 72 Il risultato dell’esperimento condotto con n=10 ha indicato 3 teste e 7 croci. Il test a due code fornisce per tale risultato un valore di probabilità cumulativa pari a 0,172 * 2 = 0,344. La soglia era fissata a 0,05 L’ipotesi nulla non viene negata. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 73 Esercizio 1 A quale conclusione saremmo giunti con 15 teste e 35 croci in un esperimento con 50 lanci? Esercizio 2 A quale conclusione saremmo giunti con 8 teste in un esperimento con 20 lanci? Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 74 Esempio 3 Il caso in cui è necessario usare la distribuzione t di Student Il percorso logico del test dell'ipotesi è comune a tutti i tests statistici. Ricostruiamolo con il seguente esempio per il confronto della media. 1.Ipotizzo in base a dati di laboratorio che il fumo di tabacco aumenti i valori pressori nei forti fumatori (H1). 2. H0: 'i forti fumatori hanno la stessa pressione media della popolazione'. 3. fisso l'errore α al 5%; sono interessato ad eventuali scostamenti in entrambe le direzioni (test di ipotesi bilaterale o 'a 2 code') 4. Programmo uno studio in cui viene misurata la pressione arteriosa sistolica a 23 soggetti. 75 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 5. La variabile 'pressione arteriosa' nella popolazione ha distribuzione gaussiana. Pertanto la distribuzione di probabilità delle medie campionarie è data dalla distribuzione gaussiana anche se il campione è piccolo. I valore medio nella popolazione è 145. Non conosco il valore della deviazione standard nella popolazione. 6. Il test statistico è il test t di student. (Il test mi indicherà la probabilità che i soggetti studiati siano un campione casuale estratto da una popolazione con media della pressione arteriosa sistolica pari a 145). Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 76 7. Conduco lo studio ed ottengo i seguenti risultati. Media campionaria = 148,5 Deviazione standard campionaria = 8,5 L’errore standard sarà quindi = 1,772 8a Calcolo del test . t = (Media campione – media popolazione) / Errore standard = (148,5 – 145) / 1,772 = 1,974 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 77 8b Interpreto il risultato ottenuto con l’uso delle tavole della distribuzione t di student con 22 g.l. La probabilità che il campione sia stato estratto da una popolazione con media pari a 145 mmHg è > 0,05. Non escludo pertanto l’ipotesi nulla che il campione sia stato estratto da una popolazione con tale media. Discussione: Perchè il risultato discorda rispetto a quello ottenuto dal precedente esempio 1? Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 78 Applichiamo le stesse tecniche in 3 situazioni distinte: - campionamento casuale da popolazione definita - campionamento da popolazione non enumerabile o non definita - campionamento ‘immaginario’ avendo considerato tutti i soggetti con caratteristiche idonee ma sapendo che essi sono solo parte di una ‘popolazione teorica’. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 79 Test dell'ipotesi ed intervallo di confidenza sono strettamente associati: Ripetendo un campionamento dalla stessa popolazione, se vale l’ipotesi nulla la proporzione di campioni il cui intervallo di confidenza non comprende l’ ipotesi nulla è pari al valore dell’errore di 1° tipo. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 80 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 81 Cerchiamo di ricostruire il percorso dell’inferenza statistica in un articolo pubblicato. Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 82 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 83 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 84 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 85 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 86 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 87 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 88 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 89 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 90 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 91 Esercizi sul testo p 194 es. 1 p 194 es. 2 p 194 es. 3 p 194 es. 4 p 194 es. 6 p 194 es. 9 + calcolo dell'intervallo di confidenza al 95% ed al 99% p 195 es. 11 p 195 es. 12 Corso di laurea in biotecnologia – Lezioni di statistica medica – Test di ipotesi 92