UNIVERSITÀ DI BOLOGNA FACOLTÀ DI MEDICINA VETERINARIA LAUREA IN SANITA’ E QUALITA’ DEI PRODOTTI DI ORIGINE ANIMALE Introduzione ai test statistici Un esempio introduttivo Controllo della rispondenza del contenuto di principio attivo nella produzione di un farmaco veterinario XY da parte dell'azienda farmaceutica WZ alla formula brevettata e depositata presso il Ministero della Sanità Farmaco XY per il trattamento di infezioni batteriche a carico dell'apparato digerente, respiratorio e genito-urinario nei bovini Principio attivo: amoxicillina/cloxacillina (in ugual proporzione) Variabile oggetto di analisi: X = titolo del principio attivo (rapporto, espresso in %, tra la quantità del principio attivo nella produzione e la quantità dichiarata e brevettata) > 100 titolo = 100 < 100 ⇒ la quantità reale è maggiore di quella brevettata ⇒ perfetta rispondenza della produzione alla formula ⇒ la quantità reale è minore di quella brevettata La produzione viene realizzata nel rispetto della formula? Lezioni di Statistica – Prof. Gabriele Soffritti 1 UNIVERSITÀ DI BOLOGNA FACOLTÀ DI MEDICINA VETERINARIA LAUREA IN SANITA’ E QUALITA’ DEI PRODOTTI DI ORIGINE ANIMALE Fase 1: la formulazione dell'ipotesi nulla (H0)... nell'esempio: in media la produzione del farmaco rispetta la formula oggetto dell'ipotesi: la media aritmetica di X nella popolazione = µ (µ = parametro incognito che caratterizza la distribuzione di X) H0: µ = µ0 con µ0 pari ad un numero fissato a priori (nell'esempio µ0 = 100) ...e dell'ipotesi alternativa nell'esempio: in media la produzione non rispetta la formula (ipotesi bidirezionale: µ > µ0 ⇒ effetti collaterali µ < µ0 ⇒ inefficacia del farmaco) Fase 2: estrazione di un campione casuale ed analisi dei dati raccolti (calcolo di indicatori sintetici, studio della distribuzione di X nel campione) n = 25 flaconi scelti casualmente tra quelli prodotti dall'azienda {99 102,1 98,9 100,5 104,1 97,7 98,4 101,2 100,9 98,3 99,3 100,2 97,8 99,4 103,6 99,9 100,9 102,2 101,1 101,2 103,4 96,6 102,8 101,2 100,6} media aritmetica campionaria x = 100,45 varianza campionaria corretta s2 = 3,805 deviazione standard corretta s = 1,951 Lezioni di Statistica – Prof. Gabriele Soffritti 2 Lezioni di Statistica – Prof. Gabriele Soffritti 3 Fase 3: calcolo di una funzione dei dati campionari (statistica-test) adeguata per saggiare l'ipotesi nulla formulata nell'esempio: X ∼ N(µ , σ2) distribuzione di X nella popolazione 2 X ∼ N(µ , σ /n) distribuzione di X nell'universo dei campioni ⇒ Z= X− µ ∼ N(0, 1) σ/ n Se l'ipotesi nulla è vera Z= X− µ0 ∼ N(0, 1) σ/ n t1 = x− µ0 s/ n = T1 = X− µ0 ∼ t(df=n-1) s/ n 100,45 − 100 = 1,159 1,951/ 25 Fase 4: determinazione della probabilità che, ipotizzando vera H0, si presenti un valore della statistica-test maggiore o uguale a quello ottenuto a partire da un campione casuale, preso in valore assoluto (p-value) p-value associato a t1 = P(T1≥|t1|, H0 vera) nell'esempio: 1) mediante l'uso delle tavole della distribuzione t di Student Lezioni di Statistica – Prof. Gabriele Soffritti 4 Per df = 24 a t = 1,058 corrisponde p = 0,3 a t = 1,318 corrisponde p = 0,2 a t = 1,159 corrisponde un p-value compreso tra 0,2 e 0,3 Lezioni di Statistica – Prof. Gabriele Soffritti 5 2) mediante l'uso della funzione Excel /Open Office Calc DISTRIB.T DISTRIB.T(Valore; Gradi libertà; Modo) Valore è il valore della variabile casuale T calcolato nel campione (t) Gradi libertà indica il numero di gradi di libertà della distribuzione (df) MODO = 1 CALCOLA IL TEST A UNA CODA, MODO = 2 CALCOLA IL TEST A DUE CODE Nell'esempio: =DISTRIB.T(1,159;24;2) restituisce il valore 0,2579 Fase 5: valutazione del p-value e decisione riguardante l'ipotesi nulla il p-value permette di stabilire se i dati campionari sono conformi all'ipotesi nulla, ovvero se ciò che abbiamo osservato nel campione rientra nei limiti di ciò che ci aspetteremmo se l'ipotesi nulla fosse vera Due possibili situazioni: 1) p-value piccolo ⇒ è poco probabile che, se H0 è vera, si verifichi ciò che abbiamo osservato nel campione ⇒ bassa conformità dei dati campionari all'ipotesi ⇒ decisione sulla sorte dell'ipotesi nulla: H0 è confutata dai dati (rifiutata) (il test è statisticamente significativo) 2) p-value grande ⇒ è molto probabile che, se H0 è vera, si verifichi ciò che abbiamo osservato nel campione ⇒ alta conformità dei dati campionari all'ipotesi ⇒ decisione sulle sorti dell'ipotesi: H0 è supportata dai dati (NON rifiutata) (il test è statisticamente NON significativo) Lezioni di Statistica – Prof. Gabriele Soffritti 6 N.B.: NON RIFIUTARE ≠ ACCETTARE!!! non c'è sufficiente evidenza empirica contro H0 ≠ vi è sufficiente evidenza empirica a favore di H0 (assenza di evidenza non equivale ad evidenza di assenza) Equivalenza tra l'ipotesi nulla e la presunzione di innocenza in un processo sufficiente evidenza empirica contro l'imputato ⇒ l'imputato è dichiarato colpevole insufficiente evidenza empirica contro l'imputato ⇒ l'imputato è dichiarato NON colpevole (non vi è la certezza che sia innocente, si è appurato solo che non si hanno abbastanza prove per dimostrarne la colpevolezza) Problema: quanto piccolo (grande) deve essere il p-value? Soglie convenzionali abitualmente utilizzate (α = livello di significatività del test): 0,001 (1‰) p-value < 0,001 ⇒ il test è very highly significant (significativo all'1‰) 0,01 (1%) p-value < 0,01 ⇒ il test è highly significant (significativo all'1%) 0,05 (5%) p-value < 0,05 ⇒ il test è significant (significativo al 5%) Il livello di significatività di un test misura la probabilità di rifiutare l'ipotesi nulla quando essa è vera. Lezioni di Statistica – Prof. Gabriele Soffritti 7 Osservazioni sulla scelta del livello di significatività di un test statistico deve essere effettuata prima della fase 2 (estrazione del campione) può dipendere dalla natura dei dati e dal fenomeno oggetto di studio Esempio 1: valutazione dell'efficacia di un nuovo antibiotico (più costoso di quelli esistenti attualmente in commercio). H0: il nuovo farmaco NON HA un'efficacia maggiore di quelli in uso Rifiutare H0 = preferire il nuovo farmaco. Rifiutare H0 quando è vera = preferire il nuovo farmaco pur non essendo più efficace di quelli esistenti (e ad un costo più alto) ⇒ livello di significatività = 0,001. Esempio 2: valutazione dell'efficacia di un nuovo vaccino contro una malattia infettiva attualmente non curabile. H0: il nuovo vaccino NON è efficace Rifiutare H0 = considerare efficace il nuovo vaccino Rifiutare H0 quando è vera = considerare efficace il nuovo vaccino pur non essendolo ⇒ livello di significatività = 0,1. spesso si utilizza α = 0,05 Nell'esempio: 0,2579 > 0,05 (e > anche degli altri valori soglia) ⇒ il test non è significativo (per qualunque livello) ⇒ H0 non viene rifiutata (la produzione è “sotto controllo“) Lezioni di Statistica – Prof. Gabriele Soffritti 8 Fase 6: calcolo dell'intervallo di confidenza per il parametro oggetto di ipotesi ( X − t0,05 s s ; X + t0,05 ) intervallo di confidenza al 95% per µ n n Nell'esempio: t0,05 s 1,951 = 2,064× = 0,81 25 n (99,64; 101,26) intervallo di confidenza al 95% per µ il valore 100 attribuito a µ nell'ipotesi nulla appartiene all'intervallo di confidenza ⇒ essendo un valore compatibile con i dati del campione non viene rifiutato (vi è equivalenza tra intervallo di confidenza per un parametro e controllo di ipotesi sul parametro stesso) Il procedimento descritto: (in generale) prende il nome di test a due code (nell'esempio) prende il nome di test t di Student (a due code) per il controllo di un'ipotesi sulla media aritmetica (caso di un campione) Decisione Realtà H0 è rifiutata H0 non è rifiutata H0 è vera Errore di I° tipo Decisione corretta H0 è falsa Decisione corretta Errore di II° tipo α = probabilità di commettere un errore di I° tipo β = probabilità di commettere un errore di II° tipo 1 ‒ β= potenza del test = P(rifiutare H0 quando H0 è falsa) Lezioni di Statistica – Prof. Gabriele Soffritti 9 Alcune osservazioni generali sul controllo di ipotesi statistiche 1. Spesso si ricorre ad un test statistico per valutare una nuova teoria o ipotesi scientifica (ipotesi di lavoro) Esempio 1 di ipotesi scientifica: tutte le capre in Turchia sono del Bezoar Per dimostrare che tale ipotesi è vera dovremmo verificare che tutte le capre in Turchia sono del Bezoar. Per smentirla basta trovare una capra che non sia del Bezoar. Esempio 2 di ipotesi scientifica: mangiare erba nuova in primavera provoca ipomagnesemia nel bestiame Procedimento per la verifica dell'ipotesi scientifica mediante un test statistico: popolazione 1: bestiame lasciato nella stalla (gruppo di controllo) popolazione 2: bestiame portato al pascolo (gruppo “trattato”) X = magnesio nel plasma Ipotesi scientifica: il livello medio di magnesio nella popolazione 2 è diverso (inferiore?) da quello della popolazione 1 Ipotesi nulla: il livello medio nelle due popolazioni è uguale ⇒ in generale l'ipotesi nulla è l'opposto dell'ipotesi scientifica ⇒ rifiutare l'ipotesi nulla equivale quindi a corroborare l'ipotesi scientifica ⇒ la potenza di un test statistico è l'abilità del test di individuare un trattamento il cui effetto è reale. E' direttamente proporzionale alla numerosità del campione ⇒ al crescere di n cresce la probabilità di riconoscere come reale l'effetto di un trattamento Lezioni di Statistica – Prof. Gabriele Soffritti 10 2. Il test statistico è “sempre” a due code... ...a meno che non vi sia l'assoluta certezza a priori (e NON una semplice aspettativa o un'idea ragionevole) che l'effetto del “trattamento” (nell'esempio: mangiare erba nuova in primavera) si possa manifestare solo in una direzione (diminuzione del livello medio di magnesio) 3. L'ipotesi nulla e l'ipotesi alternativa devono essere indipendenti dai dati osservati ⇒ vanno formulate prima dell'osservazione dei dati campionari 4. Il livello di significatività scelto per il test deve essere indipendente dai dati osservati ⇒ va fissato prima dell'osservazione dei dati campionari 5. Molti test statistici ipotizzano la validità di alcune condizioni sui dati analizzati (assunzioni) nell'esempio iniziale: X = titolo del principio attivo ∼ N(µ , σ2) ⇒ per poterli applicare in maniera rigorosa occorre una verifica (preliminare alla loro applicazione) del soddisfacimento delle assunzioni rispetto ai dati campionari da analizzare Se le condizioni ipotizzate non sono soddisfatte il test statistico non deve essere utilizzato sui dati esaminati Lezioni di Statistica – Prof. Gabriele Soffritti 11 6. Significatività statistica ≠ significatività biologica Esempio 1: variazioni nella pressione sanguigna degli animali sottoposti a trattamento chirurgico indotte dai farmaci anestetici (fenomeno biologicamente non importante che può risultare significativo dal punto di vista statistico) Esempio 2: aumento della fertilità di 1% associato ad una certa diluizione di liquido seminale (fenomeno che può risultare non significativo dal punto di vista statistico che può essere invece biologicamente importante) Riepilogo delle fasi del controllo di un'ipotesi su µ basato sul test t di Student Fase 1. Formulazione dell'ipotesi nulla H0: µ = µ 0 con µ 0 pari ad un numero fissato a priori e dell'ipotesi alternativa, e scelta del livello di significatività α Fase 2. Estrazione di un campione casuale, analisi dei dati raccolti (calcolo di indicatori sintetici , studio della distribuzione di X nel campione) In particolare: media aritmetica campionaria x , varianza campionaria corretta s2, deviazione standard corretta s. Fase 3: calcolo della statistica-test t1 = x− µ0 ∼ t(df=n-1) s/ n Lezioni di Statistica – Prof. Gabriele Soffritti 12 Fase 4: determinazione del p-value associato al valore t1 Fase 5: confronto tra il p-value ed α e decisione riguardante l'ipotesi nulla Fase 6: calcolo dell'intervallo di confidenza per µ Alcune osservazioni specifiche sul controllo dell'ipotesi su una media basato sul test t di Student 1. Alla base del test descritto vi è l'assunzione che X ∼ N(µ , σ2) 2. Se l'assunzione non vale per i dati da analizzare ma n è sufficientemente elevato si può utilizzare ugualmente il test t di Student (teorema del limite centrale) 3. Se n è piccolo il test descritto NON E' ADEGUATO ⇒ trasformare i valori di X (mediante il logaritmo) in modo da ottenere dati trasformati la cui distribuzione sia normale ⇒ ricorrere ad un test statistico NON PARAMETRICO che non assuma per X la normalità distributiva (esempi: test dei segni, test di Wilcoxon). Lezioni di Statistica – Prof. Gabriele Soffritti 13