Università del Piemonte Orientale Corso di Laurea in Igiene Dentale Corso di Statistica per la ricerca sperimentale e tecnologica Test d'ipotesi Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 1 Solo eccezionalmente conosciamo direttamente le caratteristiche della popolazione, di solito dobbiamo stimarle in base alle caratteristiche dei campioni estratti dalla popolazione. Inferenza statistica: ‘…indurre o inferire proprietà di un universo [parametri] sulla base dei dati conosciuti relativi ad un campione [statistiche].’ (H.M.Blalock). Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 2 Possiamo trarre conclusioni sul valore del parametro nella popolazione a partire dai dati campionari seguendo due percorsi: 1. Il calcolo dell'intervallo di confidenza 2. Il test dell'ipotesi Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 3 Test dell'ipotesi: Verifica se il campione è compatibile con un’ipotesi relativa alle caratteristiche della popolazione. Il procedimento prevede dapprima la formulazione dell’ipotesi e quindi la valutazione della probabilità di ottenere il campione dato se l’ipotesi è vera. Se questa probabilità è bassa concluderemo che il campione verosimilmente proviene da una popolazione con diverse caratteristiche Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 4 Cos'è un’ipotesi? ‘Un’ ipotesi è un’affermazione relativa ad un evento futuro, o comunque ad un evento il cui risultato è sconosciuto al momento in cui avviene l’affermazione ed è costruita in modo da poter risultare non vera e pertanto respinta.’ (H.M.Blalock). Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 5 Intuitivamente si vorrebbe procedere cercando di confermare le ipotesi. 'Se la mia ipotesi è vera potrò ripetere molti esperimenti ed i loro risultati ripetuti la confermeranno'. In tal modo la funzione dell'esperimento sarebbe quella di confermare l'ipotesi. Sarebbe quindi utile condurre ripetuti esperimenti al solo scopo di confermare un'ipotesi che si ritiene valida. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 6 Purtroppo alcuni filosofi, in particolare Karl Popper, hanno evidenziato come la semplice reiterazione di un risultato non sia di per sé conferma di una teoria. Una teoria non può essere confermata ma soltanto rifiutata quando le sue conclusioni non sono più compatibili con risultati sperimentali. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 7 Come può il ricercatore che lavora dopo questa 'rivoluzione epistemologica' sostenere una teoria? Attraverso il procedimento di verifica dell'ipotesi. L'ipotesi che corrisponde alla teoria è detta ipotesi di lavoro. Abbiamo visto che la semplice ripetizione di esperimenti non basta a confermarla. L'unica soluzione che rimane è quindi formulare un'ipotesi simmetrica ed opposta ad essa e cercare di negarla con evidenze sperimentali. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 8 Questa ipotesi 'costruita ad arte' è detta ipotesi nulla. L’esperimento non ha la funzione di ‘sostenere’ l’ipotesi di lavoro che il ricercatore ha sviluppato ma, all’opposto ha la funzione di cercare di negare l’ipotesi nulla. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 9 Il procedimento prevede un percorso analogo a quello delle dimostrazioni ‘per assurdo’ usate spesso in matematica ed in geometria. Se l’esperimento nega l’ipotesi nulla, la teoria resta corroborata (attenzione: non “provata”!). La teoria resta provvisoriamente valida fino a quando un diverso esperimento entrerà in contraddizione con essa. Se invece l’esperimento non nega l’ipotesi nulla, sarà l’ipotesi di lavoro (quindi la teoria da cui deriva) a dover essere rivista. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 10 La realtà non è perfetta ed esistono errori 'giudiziari'. Realtà Verdetto Colpevole Innocente Colpevole Corretto Non corretto Innocente Non corretto Corretto In statistica questi errori accadono in conseguenza della variabilità casuale. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 11 Nel procedimento di verifica delle ipotesi applichiamo metodi probabilistici e quindi possiamo trovarci: - a rifiutare l’ipotesi nulla quando essa è vera Errore di 1°tipo o Errore α; - a non rifiutare l’ipotesi nulla quando essa è falsa Errore di II tipo o Errore β. Lo statistico indica il rischio che considera accettabile di fornire una conclusione diversa dalla realtà (ignota). Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 12 Ipotesi nulla Statistico Rifiuta Non rifiuta falsa vera Corretto Non corretto Non corretto Corretto Ipotesi nulla Statistico falsa vera Rifiuta Corretto Errore α Non rifiuta Errore β Corretto Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 13 Le fasi del procedimento di verifica dell’ipotesi: 1. Il ricercatore formula un’ipotesi di lavoro, che costituisce la spiegazione di un fenomeno o indica il valore di un parametro. 2. Viene formulata l’ipotesi nulla, cioè l’affermazione che il ricercatore intende sottoporre a verifica, costruita in modo simmetrico all’ipotesi di lavoro e formulata in modo tale da poter essere negata dall’esperimento programmato. 3. Viene valutato dal ricercatore quanto è grande il rischio per lui accettabile di fornire una conclusione diversa dalla realtà (a lui ignota). 4. Viene disegnato l’esperimento e viene definita la dimensione del campione. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 14 5. Vengono delineati tutti i possibili risultati dell’esperimento e viene calcolata la probabilità associata a ciascun risultato, data l’ipotesi nulla. 6. Viene scelto il test statistico appropriato. 7. Viene condotto l’esperimento. 8. Il risultato dell’esperimento viene letto e confrontato con la distribuzione di probabilità precedentemente calcolata. Se la probabilità di ottenere il risultato osservato (data l’ipotesi nulla) è inferiore alla soglia definita al punto 3 precedente, si conclude per il rifiuto dell’ipotesi nulla. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 15 Ricostruiamo il percorso logico del test dell'ipotesi con il seguente esempio per il confronto della media. 1. Ipotizzo in base all’osservazione clinica sui miei pazienti che il fumo di tabacco modifica i valori pressori nei forti fumatori (H1: i forti fumatori hanno pressione media diversa rispetto alla popolazione non fumatrice). 2. H0: 'i forti fumatori hanno la stessa pressione media della popolazione'. Il valore medio nella popolazione è 145, conosciuto da studi precedenti. ll valore della deviazione standard nella popolazione, conosciuto da studi precedenti, è 8,5. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 16 3. fisso l'errore α al 5%; sono interessato ad eventuali scostamenti in entrambe le direzioni (test di ipotesi bilaterale o 'a 2 code'). 4. Programmo uno studio in cui viene misurata la pressione arteriosa sistolica a 23 soggetti. 5. La variabile 'pressione arteriosa' nella popolazione ha distribuzione gaussiana. Pertanto la distribuzione di probabilità delle medie campionarie è data dalla distribuzione gaussiana anche se il campione è piccolo. 6. Il test statistico è il test z. (Il test mi indicherà la probabilità che i soggetti studiati siano un campione casuale estratto da una popolazione con i valori dati di media e deviazione standard). Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 17 7. Conduco lo studio ed ottengo i seguenti risultati. Media = 148,5 8a. Calcolo del test . z = (Media campione – media popolazione) / Errore standard =(148,5 – 145) / (8,5 / radq(23)) = 3,5 / 1,772 = 1,97 8b. Interpreto il risultato ottenuto con l’uso delle tavole della distribuzione normale standard. La probabilità che il campione sia stato estratto da una popolazione con media pari a 145 mmHg è < 0,05. Rifiuto l’ipotesi nulla che il campione sia stato estratto da una popolazione con tale media. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 18 Errore di II tipo o Errore β. Complementare all'errore β abbiamo la potenza dello studio: Potenza = 1 – (Errore β) Di solito si disegna l'esperimento in modo che la potenza sia tra 80% e 90% (rispettivamente: β = 0.20 o β = 0.10). In alternativa possiamo misurare l'errore β corrispondente ad una data numerosità campionaria. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 19 Supponiamo che si abbia una monetina sbilanciata, con π=0.75 e (1-π)=0.25. Distribuzione di probabilità: distribuzione binomiale n=10 0,300 0,250 probabilità 0,200 0,150 0,100 0,050 0,000 0,750 0 1 2 3 4 5 6 7 8 9 10 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056 numero successi Possiamo quantificare l'errore β misurando la probabilità di estrarre uno dei valori per cui non rifiuteremmo l'ipotesi nulla. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 20 L’istogramma presenta la distribuzione di probabilità binomiale per (N=10, π=0,5) e (N=10, π=0,75). Si noti l’ampia sovrapposizione. Diversi risultati sono compatibili con entrambe le distribuzioni Distribuzione binomiale N=10 0,300 0,250 probabilità 0,200 0,150 0,100 0,050 0,000 0 1 2 3 4 5 6 7 8 9 10 0,500 0,001 0,010 0,044 0,117 0,205 0,246 0,205 0,117 0,044 0,010 0,001 0,750 0,000 0,000 0,000 0,003 0,016 0,058 0,146 0,250 0,282 0,188 0,056 numero di successi Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 21 In questo caso l'errore β è molto alto: 0,282+0,250+0,146+0,058+0,016+0,003 = 0,755 La potenza è ridotta: 1-0,755= 0,245=24.5% Conclusione: l'esperimento è mal disegnato. Lo studio è inadeguato a mettere in evidenza una differenza elevata (0,75 vs. 0,5) nella probabilità di ottenere testa al lancio della moneta. Come possiamo procedere? Solo aumentando le dimensioni del campione possiamo ridurre sia l’errore α sia l’errore β (l’argomento sarà ripreso in seguito). Se le dimensioni del campione non cambiano: diminuendo α aumenta β e viceversa. Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 22 Distribuzione di probabilità binomiale per (N=50, π=0,5) e (N=50, π=0,75). La sovrapposizione è inferiore a quanto osservato nella figura precedente. distribuzione binomiale n=50 0,14 0,12 0,500 0,750 probabilità 0,1 0,08 0,06 0,04 0,02 0 0 2 4 6 8 1 0 1 2 1 4 1 6 1 8 2 0 2 2 2 4 2 6 2 8 3 0 3 2 3 4 3 6 3 8 4 0 4 2 4 4 4 6 4 8 5 0 n. successi In questo caso l'errore β è: 0,01482+0,00765+0,00365+0,00160+ 0,00065+0,00024+0,00001= 0,02862 =2,862 % Potenza= 1-0,02862= 0,97138 =97,138% Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 23 Esercizi consigliati da: Fowler et al, ed Edises. • • • • Cap 11 (p 229) es 1 Cap 11 (p 229) es 2 Cap 11 (p 229) es 3 Cap 11 (p 229) es 7 Corso di laurea triennale di Igiene Dentale - Corso di Statistica - Test di ipotesi 24