Master in “Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale” Gestione ed Analisi Statistica dei dati Daniela Fortuna 12 giugno 2014 ALMA MATER STUDIORUM – Università di Bologna TEST di ipotesi Finora abbiamo visto come l’uso degli intervalli di confidenza permettono di estendere i risultati di un campione alla popolazione di riferimento. Il passo successivo nell’analisi statistica è mettere a confronto due o più gruppi, oppure mettere a confronto un risultato ottenuto dal campione e un valore atteso. ALMA MATER STUDIORUM – Università di Bologna TEST di IPOTESI: Significatività Statistica Si mettono a confronto due misure, allo scopo di verificare se la loro differenza è probabilmente dovuta al caso oppure no. Se la differenza NON è CASUALE cioè non è dovuta al caso, si dice che è «statisticamente significativa». La metodologia utilizzata è quella del Test di ipotesi ALMA MATER STUDIORUM – Università di Bologna TEST di ipotesi TEST significa prova, verifica, accertamento Tutti i Test (test di gravidanza, test elettorale, test di ammissione, test statistico, ecc.) si basano sulla verifica di una certa condizione ipotizzata. La verifica non avviene mai in modo diretto ma attraverso la valutazione di fenomeni strettamente correlati. ALMA MATER STUDIORUM – Università di Bologna TEST di ipotesi Quindi l'esito del test Statistico non da certezza, ma solo una fiducia valutabile in termini di In statistica la verifica si effettua mediante dati campionari e poiché manca l’evidenza diretta, non avremo certezza ma solo una fiducia più o meno grande nel fatto che la condizione esista. probabilità. ALMA MATER STUDIORUM – Università di Bologna EPIDEMIOLOGIA: il TEST diagnostico Risultato di un test Positivo Negativo Condizione Clinica ignota Sano falso positivo Malato vero positivo falso negativo vero negativo sensibilità del test la frequenza di risultati veri-positivi specificità del test la frequenza di veri-negativi α la frequenza di falsi-positivi (errore del 1° tipo) β la frequenza di falsi-negativi (errore del 2° tipo) ALMA MATER STUDIORUM – Università di Bologna EPIDEMIOLOGIA: il TEST diagnostico Sensibilità e β sono complementari cioè veri-positivi e falsi-negativi sono complementari. Infatti se un test è sempre giustamente positivo (100% di veri-positivi) non segnalerà mai negatività per errore (0% di falsi negativi). Specificità e α sono complementari cioè veri-negativi e falsi-positivi sono complementari. Infatti se un test è specifico con il 100% di veri-negativi non segnalerà mai positività per errore (0% di falsi-positivi). Quindi dire che un test è specifico è come dire che ha una bassa probabilità di falsi positivi, cioè che α è piccolo ALMA MATER STUDIORUM – Università di Bologna EPIDEMIOLOGIA: il TEST diagnostico In sintesi Risultato del test Positivo Negativo Condizione Clinica reale ignota H0: Sano H1: Malato falsi positivi errore α (di 1° tipo) veri negativi Specificità veri positivi falsi negativi errore β (di 2° tipo) Sensibilità Un test per essere affidabile deve possedere sia un'alta specificità che un'alta sensibilità. ALMA MATER STUDIORUM – Università di Bologna STATISTICA: il TEST d’ipotesi Lo schema del test statistico è simile a quello del test diagnostico ma ha la peculiarità di privilegiare l’evidenza dei falsi-positivi rispetto ai falsi-negativi L’ipotesi di partenza è l’ ipotesi nulla H0 (cioè l’ipotesi dello scettico) quella che nega il risultato, attribuendo le differenze osservate alla naturale variabilità dei fenomeni o al campionamento. ALMA MATER STUDIORUM – Università di Bologna STATISTICA: il TEST d’ipotesi Ipotesi nulla H0: le differenze osservate sono dovute al caso l'ipotesi nulla viene mantenuta fino a che le prove o i dati in nostro possesso non siano tali da costringerci a rifiutarla Concediamo quindi fiducia all‘ ipotesi nulla, rifiutandola solo quando l'evidenza dei risultati sia macroscopica, cioè quando la probabilità di falsi-positivi α sia minore del 5%. ALMA MATER STUDIORUM – Università di Bologna Risultato del TEST statistico Il risultato di un test statistico è α ovvero il p-value Risultato del test statistico se α<5% H0 rifiutata se α>=5% H0 accettata Dato significativo Dato non significativo H0 falsi positivi errore di 1° tipo valutato con α veri negativi nessun errore H1 veri positivi nessun errore falsi negativi errore di 2° tipo valutato con β Ipotesi nulla Condizione reale ignota Ipotesi alternativa ALMA MATER STUDIORUM – Università di Bologna TEST di ipotesi Ad esempio : • Da un indagine campionaria su 50 soggetti, si è rilevato un tasso di colesterolemia medio pari a 270 mg/dl e deviazione standard =79 , sapendo che il tasso medio in soggetti normali è 210 mg/dl vogliamo verificare se questa differenza è dovuta al caso oppure no ALMA MATER STUDIORUM – Università di Bologna IPOTESI NULLA H0 Per verificare se la colesterolemia media rilevata nel campione, 270 mg/dl sia significativamente diversa dal valore normale 210 mg/dl , si parte dall’ipotesi che i due valori medi siano uguali e che la loro differenza è semplicemente dovuta al caso, cioè all’ errore casuale. Questa ipotesi di partenza viene chiamata IPOTESI NULLA e viene indicata come H0 quindi: IPOTESI NULLA H0 I due valori sono uguali e la loro differenza è dovuta al caso ALMA MATER STUDIORUM – Università di Bologna Il test d’ipotesi quindi consiste nel dimostrare se H0 è vera Si considera una distribuzione teorica di probabilità e si verifica se la media campionaria è all’interno dell’intervallo a cui corrisponde il 95% di probabilità oppure è fuori da questo intervallo Regione di rifiuto di H0 Regione di rifiuto di H0 Regione di accettazione di H0 Regione di accettazione di H0 210 Media normale Regione di rifiuto di H0 Regione di rifiuto di H0 ? 270 270 Media campionaria ALMA MATER STUDIORUM – Università di Bologna La logica del TEST di IPOTESI IPOTESI NULLA H0 Non c’è nessuna differenza, ovvero la differenza osservata è dovuta al caso Accetto o rifiuto l’ipotesi nulla? Per rispondere effettuo un TEST DI IPOTESI ALMA MATER STUDIORUM – Università di Bologna Errore di 1° tipo: livello di significatività di un test statistico • Il livello di significatività di un test statistico è α la probabilità di commettere un errore di 1° tipo ovvero è la probabilità di rifiutare l’ipotesi nulla, quando questa è vera Livello di significatività α = P(errore di 1° tipo ) = P(rifiutare H0 quando H0 è vera) ALMA MATER STUDIORUM – Università di Bologna Errore di 1° tipo: livello di significatività di un test statistico Il livello di significatività 5% viene adottato molto frequentemente in quanto si ritiene che il rapporto 1/20 (cioè 0.05) sia sufficientemente piccolo da poter concludere che sia piuttosto improbabile che la differenza osservata sia dovuta al semplice caso Ovviamente, se si vuole escludere con maggiore probabilità l'effetto del caso, si adotterà un livello di significatività inferiore (es. 1% ) ALMA MATER STUDIORUM – Università di Bologna Test d’ipotesi tra 2 medie Per effettuare il test utilizzo una formula chiamata Statistica Test. • Nel caso del confronto tra 2 medie la statistica test è la t di Student definita come: t= m 1 – m2 ES Dove m1 ed m2 sono le due medie a confronto ES è l’Errore Standard calcolato come deviazione standard divisa la radice della numerosità campionaria: DS/√ n ALMA MATER STUDIORUM – Università di Bologna TEST di IPOTESI tra 2 medie: test t di Student confronto tra una media campionaria e una media attesa Esempio • Da un indagine campionaria su 50 soggetti, si è rilevato un tasso di colesterolemia medio pari a 270 mg/dl e deviazione standard =79 , sapendo che il tasso medio in soggetti normali è 210mg/dl vogliamo verificare se questa differenza è dovuta al caso oppure no m1 – m2 t= = ES (270-210) 79/√50 60 = 7,1 = 8,45 Gradi di libertà: n-1=50-1=49 Significatività Valore critico t di student per 49 gradi di liberà 90% 1.299 95% 1.676 97.5% 2.009 99% 2.403 99.5% 2.678 99.75% 2.937 99.9% 3.261 99.95% 3.496 Rifiuto l’ipotesi nulla H0: La differenza è statisticamente significatica -1.7 1.7 8,45 ALMA MATER STUDIORUM – Università di Bologna In sintesi • il risultato del Test di ipotesi va confrontato con un VALORE CRITICO tabulato in apposite tabelle già definite, che riportano i valori della distribuzione di probabilità per diversi livelli di significatività α e gradi di libertà • Se il risultato del test di ipotesi SUPERA il valore critico, allora la differenza fra i gruppi viene dichiarata statisticamente significativa e, quindi, • l'IPOTESI NULLA viene RESPINTA. Se il risultato del test di ipotesi È INFERIORE al valore critico, allora la differenza fra i gruppi viene dichiarata statisticamente NON significativa e, quindi, l'IPOTESI NULLA viene ACCETTATA. ALMA MATER STUDIORUM – Università di Bologna Ma cosa sono i gradi di libertà? i gradi di libertà rappresentano il numero di possibilità che i dati che compongono un campione hanno di variare liberamente. In generale si calcolano togliendo dal numero delle unità del campione il numero delle condizioni cui essi sono vincolati. Nel nostro esempio abbiamo 50 valori di colesterolemia, ciascuno dei quali può assumere un valore qualsiasi ed un vincolo, la media deve essere 270, io posso assegnare un valore qualsiasi ai primi 50-1 =49 numeri, ma l'ultimo sarà vincolato dal fatto che la media deve essere 270, quindi in questo caso, i gradi di libertà sono 50-1=49. ALMA MATER STUDIORUM – Università di Bologna La t di Student e i gradi di libertà La distribuzione della t di Student cambia al variare dei gradi di libertà: all’aumentare dei gradi di libertà la curva diventa più stretta e più alta!. Per questo motivo quando applichiamo il test t di Student, per trovare il valore critico con cui confrontare il valore della statica test abbiamo bisogno di calcolare i gradi di libertà. Esistono quindi tanti valori critici a seconda dei gradi di libertà ALMA MATER STUDIORUM – Università di Bologna TEST di IPOTESI :test t di Student confronto tra 2 medie campionarie Es. Sono stati rilevati i tempi di ventilazione meccanica, espressi in ore, in due Terapie Intensive post-chirurgiche e si vuole valutare se differiscono in modo significativo. TI a: 5 7 9 7 5 15 6 8 4 7 4 TI b: 11 10 8 0 17 4 0 22 6 24 0 ma =6,7 e mb=9,3 Applicando questa formula na=13 e nb=11 5 5 s=5,76 Gradi di libertà:(na -1 )+ (nb-1)=22 Risulta: t=1,09 e confrontando questo valore con quello critico della t di Student corrispondente a 22 gradi di libertà che è 2,07 possiamo dire che la differenza NON è statisticamente significativa con p=0.14 ALMA MATER STUDIORUM – Università di Bologna TEST di IPOTESI :test t di Student confronto tra 2 medie campionarie Il valore della statistica test t di Student è inferiore al valore critico quindi: L’ipotesi nulla viene accettata. Questo significa che la differenza nei tempi medi di ventilazione meccanica rilevati nelle due Terapie Intensive è dovuta al caso Risulta: t=1,09 e confrontando questo valore con quello critico della t di Student corrispondente a 22 gradi di libertà che è 2,07 possiamo dire che la differenza NON è statisticamente significativa con p=0.14 - 2,07 1,09 2,07 ALMA MATER STUDIORUM – Università di Bologna Sintesi TEST di IPOTESI IPOTESI NULLA H0 La differenza è dovuta al caso Accetto o rifiuto l’ipotesi nulla? Per rispondere effettuo un TEST DI IPOTESI Confronto il valore ottenuto dal TEST con dei valori critici già calcolati su apposite tabelle Ipotesi nulla RIFIUTATA differenza significativa Valore del test maggiore Valore critico Valore del test minore Valore critico Ipotesi nulla ACCETTATA differenza NON significativa ALMA MATER STUDIORUM – Università di Bologna Test t di student con SPSS SPSS Click Analizza Confronta medie Test t campioni indipendenti ALMA MATER STUDIORUM – Università di Bologna TEST di IPOTESI :test Chi-quadrato Esempio: Si vuole verificare l’efficacia di due diversi farmaci: le differenze sono statisticamente significative, ad un livello di significatività α del 5%? farmaco 1 farmaco2 totali guariti non guariti totali 52 10 62 40 92 21 31 61 123 guariti (farmaco1)=52/62=84% guariti (farmaco2)= 40/61=66% Totale guariti=92/123=74,8% IPOTESI NULLA H0 : la differenza delle % di guariti è dovuta al CASO, I due farmaci sono ugualmente efficaci Ipotesi Nulla Dati attesi percentuale di guariti del 74,8% per entrambi i farmaci farmaco 1 farmaco2 totali guariti non guariti totali 46 16 62 46 15 61 92 31 123 ALMA MATER STUDIORUM – Università di Bologna TEST di IPOTESI :test Chi-quadrato Esempio: Si vuole verificare l’efficacia di due diversi farmaci: le differenze sono statisticamente significative, ad un livello di significatività α del 5%? Dati campionari rilevati guariti non guariti totali farmaco 1 52 10 62 farmaco2 totali 40 92 21 31 61 123 Dati attesi sotto l’ipotesi nulla farmaco 1 farmaco2 totali guariti non guariti totali 46 16 62 46 15 61 92 31 123 Per ciascuna combinazione farmaco guariti si calcola ALMA MATER STUDIORUM – Università di Bologna TEST di IPOTESI :test Chi-quadrato Ora, confrontando il nostro valore (5.46) con quelli tabulati, notiamo che esso è >3.841 e <6.635. Ciò consente di ritenere che la differenza fra i due gruppi sia significativa al livello di significatività α 5% ma non al livello di significatività 1%. Nel nostro caso, il valore ottenuto è un chiquadrato con «1 grado di libertà»; infatti, per tabelle come quella che stiamo studiando, il grado di libertà è uguale a (numero di righe-1)x(numero di colonne-1). ALMA MATER STUDIORUM – Università di Bologna Osservazioni Nell’esempio precedente è stato scelto un livello di significatività α del 5%, cioè si è scelto che il rischio massimo accettabile, di commettere l’errore rifiutando l’ipotesi nulla, quando questa è vera, è il 5%. la probabilità corrispondente al valore del chi-quadrato 5.46, in corrispondenza di 1 grado di libertà è 0.019 e questo valore prende il nome di p-value. Quindi il p-value della differenza di efficacia dei nostri due farmaci messi a confronto è: p=0.019 che è minore di α=0.05 In sintesi: il p-value p=0.019 minore di 0.05 (del 5%) significa che la probabilità che la differenza riscontrata sia dovuta al caso è minore del 5% ovvero la probabilità che la differenza sia statisticamente significativa è del 95%. Se avessimo scelto un livello di significatività inferiore, ad esempio dell’1% non avremmo riscontrato alcuna differenza significativa nell’efficacia dei due farmaci messi a confronto. ALMA MATER STUDIORUM – Università di Bologna IL CHI_QUADRATO e i GRADI DI LIBERTA’ Anche il chi-quadrato come la t di Student varia al variare dei gradi di libertà. All’aumentare dei gradi di libertà la curva diventa più bassa e più larga! ALMA MATER STUDIORUM – Università di Bologna Test CHI-QUADRATO con SPSS SPSS Click Analizza Statistiche descrittive Tavole di contingenza Statistiche click Chi-quadrato ALMA MATER STUDIORUM – Università di Bologna Studio di efficacia: ODDS RATIO Negli studi di efficacia di un trattamento spesso è necessario mettere a confronto gli esiti del gruppo di trattamento con quelli del gruppo di controllo espressi come ODDS Ratio. In questo caso il test di ipotesi deve verificare se l’ODDS RATIO è significativamente diverso da 1 Esempio: studio di efficacia di un nuovo trattamento per la prevenzione delle lesioni da pressione Trattati LDP Sì No 19 121 Controlli 17 115 Odds Ratio OR=(19/121)/(17/115)=0,157/0,148=1,06 ALMA MATER STUDIORUM – Università di Bologna TEST per verificare la significatività degli ODDS RATIO Il test d’ipotesi utilizzato per verificare se un odds ratio è significativamente diverso da 1 e con quale probabilità (p-value) è il test di Cochran MantelHeanszel, che è una variante del test chi-quadrato SPSS Click Analizza Statistiche descrittive Tavole di contingenza Statistiche click Chi-quadrato click Statistiche di Cochran e Mantel-Heanszel ALMA MATER STUDIORUM – Università di Bologna TEST per verificare la significatività degli ODDS RATIO OUTPUT di SPSS Stima di Mantel-Haenszel del rapporto odds comune Stima 1,062 ln(stima) ,060 Errore standard di ln(stima) ,358 Significatività asintotica (2 sensi) ,866 Intervallo di confidenza al 95% asintotico Rapporto odds comune ln(rapporto odds comune) Limite inferiore ,526 Limite superiore 2,144 Limite inferiore -,642 Limite superiore ,763 La stima di Mantel-Haenszel del rapporto odds comune viene distribuita in modo asintotico e normale in base al rapporto odds comune dell'assunzione 1,000, in modo analogo al log naturale della stima. ODDS RATIO p-value Intervallo di confidenza Poichè il pvalue=0,866 ed è superiore a 0,05 l’odds ratio non è significativamente diverso da 1 Il rischio di LDP è lo stesso nei due trattamenti ALMA MATER STUDIORUM – Università di Bologna In sintesi per il confronto tra 2 MEDIE Test t di Student per il confronto tra 2 PROPORZIONI o percentuali per la Significatività degli ODDS RATIO Test Chi-quadrato Test di Cochran Mantel Heanszel ALMA MATER STUDIORUM – Università di Bologna Il confronto delle medie tra più di 2 gruppi Esempio: su 272 pazienti sottoposti ad intervento chirurgico si vuole valutare se la degenza media e significativamente diversa tra le classi di età Età N° Degenza media Std Dev Minimum Maximum 18-30 anni 14 6.6 5.7 2 18 30-40 anni 28 6.4 4.2 2 24 40-50 anni 55 7.9 3.9 3 18 50-60 anni 54 10.9 10.4 2 53 60-70 anni 71 10.5 7.0 3 41 70-80 anni 41 11.8 8.3 2 42 80-90anni 9 15.9 8.5 4 31 Il Test t di Student può essere utilizzato solo per il confronto tra 2 medie ALMA MATER STUDIORUM – Università di Bologna Il confronto delle medie tra più di 2 gruppi: Analisi della Varianza (ANOVA) L’analisi della varianza (in inglese: Analysis of Variance, abbreviata con l’acronimo ANOVA) è utilizzata per testare la significatività statistica delle differenze tra medie campionarie sulla base delle rispettive varianze. ALMA MATER STUDIORUM – Università di Bologna Analisi della Varianza (ANOVA) Il principio alla base di questo test è quello di stabilire se due o più medie campionarie possono derivare da popolazioni che hanno la stessa media. Quando le medie sono solamente due è indifferente usare l’ANOVA o il test t di Student, mentre dobbiamo necessariamente utilizzare l’ANOVA quando le medie sono più di due. ALMA MATER STUDIORUM – Università di Bologna La logica dell’ANOVA L'ipotesi alla base dell'analisi della varianza è che : dati n gruppi, la varianza totale può essere suddivisa in due componenti: Varianza interna ai gruppi (anche detta Within) e Varianza tra i gruppi (Between). Varianza totale = Varianza within + Varianza between Ipotesi nulla H0 Varianza between < Varianza within e quindi la differenza tra i gruppi è dovuta alla sola variabilità interna ALMA MATER STUDIORUM – Università di Bologna Analisi della Varianza (ANOVA) Quindi l’analisi della varianza si basa sul rapporto Varianza tra i gruppi (Between) Varianza interna ai gruppi (Within) e la significatività è verificata mediante il test F di Fisher ALMA MATER STUDIORUM – Università di Bologna ANOVA in SPSS SPSS Click Analizza Confronta medie ANOVA univariata Il risultato SPSS per l’ANOVA sulle degenze medie per gruppi di età ANOVA durata della degenza (in giorni) Fra gruppi Entro gruppi Totale Somma dei quadrati 1275.054 14192.226 15467.279 df 6 265 271 Media dei quadrati 212.509 53.556 F 3.968 Sig. .001 le degenze medie sono significativamente diverse tra le classi di età considerate ALMA MATER STUDIORUM – Università di Bologna ALMA MATER STUDIORUM – Università di Bologna