METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica EPIDEMIOLOGIA Ha come oggetto lo studio della distribuzione delle malattie in un popolazione e dei fattori che la influenzano e fornisce i dati che sono di guida al procedimento clinico STATISTICA E’ il mezzo oggettivo per la pianificazione delle indagini e l’interpretazione dei risultati …forniscimi i risultati! …per piacere!!! STUDIO EPIDEMIOLOGICO Assegnazione Controllata Non controllata SPERIMENTALE OSSERVAZIONALE Campionamento Non randomizzato STUDI SU COMUNITA’ Randomizzato SPERIMENTAZIONI CLINICHE Malattia o Effetto TRASVERSALE O RETROSPETTIVO Esposizione o caratteristica al momento dello studio (TRASVERSALE) Esposizione o Causa PROSPETTICO studi relativi ad un periodo di tempo Storia dell’esposizione o caratteristica precedenti al momento dello studio (RETROSPETTIVO) FONTI DI DATI EPIDEMIOLOGICI E STATISTICI Le fonti di dati correnti si basano su un sistema misto con finalità generali, di carattere socio- demografiche, economiche e sanitarie La raccolta dei dati avviene a livello locale, regionale e nazionale con modalità e frequenza di rilevazione specifiche in base alle quali si possono distinguere: • fonti universali e continue (mortalità e sue cause, infortuni sul lavoro …) •fonti universali e sporadiche (censimenti) •fonti campionarie e continue (registri di patologia, SDO, ….) •fonti campionarie e sporadiche (indagini osservazionali, sperimentali) Descrittiva Si occupa della presentazione e sintesi dei dati Inferenziale Permette di trasferire le informazioni ottenute su un campione all’intera popolazione La variabile è ciò che viene osservato o misurato e può assumere uno tra una serie definita di possibili valori Quanto ciò che rileviamo su un campione rispecchia ciò che avviene nella popolazione? Oppure: Con che probabilità le misure rilevate sul campione (stime) sono i veri valori della popolazione ( parametri) CAMPIONE Stime Media Varianza Conteggi Percentuali … Estrazione del campione POPOLAZIONE Parametri Leggi della probabilità Statistica inferenziale SPECULARE UNIVERSO PARAMETRI P R O G R Campionamento A M Disegno M Sperimentale A R E CAMPIONE Stima di intervallo Test di ipotesi DESCRIVERE STATISTICHE D E C I D E R E Negli studi clinici i ricercatori dovrebbero generalmente essere interessati a determinare la grandezza di una differenza dell’esito misurato fra gruppi di soggetti, piuttosto che ottenere una semplice indicazione della significatività o meno di tale differenza Di quanto la malattia ha modificato le concentrazioni ematiche medie? Di quanto il nuovo trattamento ha modificato la prognosi? Non solo la significatività statistica Non bisogna equiparare la significatività statistica con l’importanza clinica o la rilevanza biologica. piccole differenze, che pur rivestono uno scarso interesse, possono risultare statisticamente significative solo perché il campione studiato era di ampie dimensioni effetti importanti dal punto di vista clinico possono risultare non significativi solo perché il numero di soggetti studiati era piccolo E’ possibile stimare, al momento della pianificazione di uno studio la dimensione del campione più adeguata STIME E LORO AFFIDABILITA’ L’idea chiave su cui si basa l’analisi statistica è che si possono eseguire osservazioni su un campione di soggetti e che da questo si possono compiere inferenze sulla popolazione rappresentata da tutti i soggetti con caratteristiche analoghe a quelle del campione Anche se ben pianificato uno studio può dare solo una idea della risposta cercata, a causa essenzialmente della variabilità casuale del campione stesso strettamente collegata, tra l’altro, al numero di soggetti inclusi in uno studio Le quantità statistiche ottenute (medie, proporzioni, odds, coefficienti di regressione, etc.) sono stime imprecise dei veri valori nella popolazione generale STIMA Una misura descrittiva calcolata dai dati di una popolazione è detta parametro. Una misura descrittiva calcolata dai dati di un campione è detta stima del parametro. L’insieme dei metodi che ci consentono di estendere i risultati ottenuti dal campione a tutta la popolazione oggetto dello studio costituiscono la inferenza statistica. Stima dei parametri Verifica delle ipotesi La stima è il calcolo, dai dati di un campione, di una qualche statistica, ed è una approssimazione del corrispondente parametro della popolazione da cui il campione è stato estratto. Stima puntuale: si calcola un singolo valore numerico per stimare il corrispondente parametro. Es. una media, una proporzione, una deviazione standard. Stima di intervallo: si calcola un intervallo di valori che, con un certo grado di probabilità, conterrà il parametro da stimare. Popolazione Campione (parametro) (stima) Media Varianza m 2 S2 INTERVALLI DI CONFIDENZA Le stime di intervallo forniscono informazioni sia sul valore numerico del parametro incognito che sul grado di attendibilità della stima. La procedura di calcolo degli intervalli, detti di confidenza, si basa sulla determinazione di due limiti entro i quali, con una probabilità 1- , è contenuto il parametro, a partire dalle informazioni campionarie. 1- = P(L1 L2) con 0 1 L1 e L2 dipendenti dalla dimensione del campione 1- grado di attendibilità della stima ed è detto livello di confidenza stima (fattore di correzione errore della stima) Lo scopo principale degli intervalli di confidenza è quello di indicare la Imprecisione delle stime campionarie come rappresentazione dei valori della popolazione L’imprecisione della stima campionaria è indicata dall’ampiezza degli intervalli: Più ampi sono gli intervalli Minore è la precisione L’ampiezza dipende essenzialmente da tre fattori: • dal numero di soggetti studiati (campioni poco numerosi, conclusioni inattendibili) • dalla variabilità dei soggetti in studio (minore variabilità, stima più precisa) • dal livello di confidenza (maggiore è il livello di confidenza, tanto più ampi sono gli intervalli) mmHg Ipertensione no Ipertensione si 250 230 210 190 170 150 130 110 90 70 50 Stato ipertensivo non noto Stato ipertensivo noto All’aumentare della numerosità campionaria l’ampiezza dell’intervallo si restringe mmHg 180 N=900 N=100 170 160 150 140 130 120 110 100 90 Cardiopatia ipertensiva assente Cardiopatia ipertensiva presente All’aumentare del livello di confidenza l’ampiezza dell’intervallo aumenta mmHg 155 150 145 140 135 130 125 120 Livello di confidenza: 90% Livello di confidenza: 95% Livello di confidenza: 99% All’aumentare del livello di confidenza l’ampiezza dell’intervallo aumenta mmHg 22 20 18 16 14 12 10 8 6 4 2 Livello di confidenza: 90% Livello di confidenza: 95% Livello di confidenza: 99% SIGNIFICATIVITA’ STATISTICA Confronto tra il farmaco A e il farmaco B 1. Il farmaco A potrebbe essere effettivamente superiore al farmaco B 2. Qualche fattore che non è stato assolutamente controllato, per esempio l’età dei pazienti, può essere responsabile della differenza (in questo caso si avrebbe un confronto viziato) 3. La differenza potrebbe essere dovuta alla variazione casuale Soltanto dopo aver escluso che sussistono i motivi 2 e 3, potremo concludere che A è superiore a B IL VALORE P Molte volte il ricercatore indica il più basso livello di significatività al quale l’ipotesi di ricerca (ipotesi nulla) può essere respinta. Questo livello è chiamato “valore p” ed esprime la probabilità che una differenza come quella osservata sia causata dal solo caso. L’affermazione “p<0.01” significa che è piccolissima la probabilità che la variazione casuale sia da sola responsabile della differenza, cosicché intendiamo in realtà affermare che il risultato è statisticamente significativo. Inversamente l’affermazione “p>0.10” implica che soltanto il caso può realmente spiegare la differenza osservata, la quale dovrà perciò essere catalogata come statisticamente non significativa. Dimensione del campione e interpretazione dell’assenza di significatività Una differenza statisticamente significativa è tale in quanto non può essere giustificata dal solo caso. Al contrario una differenza statisticamente non significativa non deve essere necessariamente attribuibile soltanto al caso. Di fronte ad una differenza non significativa l’entità del campione è molto importante: con un campione piccolo è infatti probabile che l’errore di campionamento sia elevato, il che conduce spesso ad una non significatività, anche quando la differenza osservata è tutt’altro che casuale. E’ per questa ragione che un risultato statisticamente non significativo dovrebbe essere considerato quasi sempre come non conclusivo, piuttosto che come segno dell’assenza di una vera differenza tra i gruppi confrontati. Significatività clinica e significatività statistica E’ importante tenere sempre presente che un’etichetta di significatività statistica non significa necessariamente che la differenza sia significativa dal punto di vista clinico. Con campioni di cospicua entità, piccolissime differenze, che possiedono poca o nessuna importanza clinica, possono rivelarsi statisticamente significative. Le implicazioni pratiche di qualsiasi risultato devono essere valutate su basi diverse da quelle esclusivamente statistiche. La caratteristica essenziale di uno studio clinico è di usare i risultati ottenuti su un Campione di pazienti, per fare inferenza circa gli effetti del trattamento su una Popolazione di individui con caratteristiche patologiche tali da richiedere quel tipo di trattamento IL DISEGNO DELLA RICERCA CLINICA Prima di iniziare una ricerca è indispensabile effettuare una progettazione accurata e un disegno adeguato, definendo in dettaglio le domande a cui la ricerca deve dare una risposta DEFINIRE LO SCOPO DELLO STUDIO SPECIFICARE GLI OBIETTIVI E LE IPOTESI DI LAVORO DISEGNARE LO STUDIO SCRIVERE IL PROTOCOLLO CONDURRE LO STUDIO DEFINIRE UNA BUONA ORGANIZZAZIONE ANALIZZARE I DATI UTILIZZO DELLA STATISTICA DESCRITTIVA E DEI TESTS DI VERIFICA DELLE IPOTESI TRARRE LE CONCLUSIONI PUBBLICARE I RISULTATI PER IMPOSTARE UNA SPERIMENTAZIONE BISOGNA POTER RISPONDERE ALLE SEGUENTI DOMANDE: 1. Qual è l’obiettivo primario della ricerca 2. Esiste un protocollo scritto che indichi le procedure e i dati con cui raggiungere l’obiettivo 3. L’obiettivo primario è rilevante sotto il profilo scientifico, affronta problemi ancora irrisolti, aggiunge qualcosa al sapere scientifico attuale 4. Quali sono gli obiettivi secondari 5. Sono rispettate le normative che guidano la ricerca sperimentale (good laboratory practice o GLP), è garantita la protezione dei soggetti e la confidenzialità dei loro dati in ottemperanza alla dichiarazione di helsinki e alla good clinical practice GCP QUANTI PAZIENTI DEVONO ESSERE RECLUTATI PER UNA SPECIFICA SPERIMENTAZIONE CLINICA 1. Dipende dalla dimensione degli effetti che Verranno osservati 2. Dipende dalle caratteristiche degli errori di I tipo e di II tipo utili per la definizione della dimensione e della potenza del test 3. Dipende dalla particolare misura che si vuole effettuare (risposta in termini di successo o fallimento, risposta in termini di tempo intercorso fra due eventi critici) VERIFICA DELLE IPOTESI Obiettivo: guidare il clinico, il ricercatore o l’amministratore a prendere una decisione riguardo ad un parametro della popolazione esaminando un campione di quella popolazione. L’osservazione dei fenomeni porta alla formulazione di teorie che richiedono un conferma basata su una metodologia scientifica. IPOTESI di RICERCA IPOTESI STATISTICA Le ipotesi statistiche sono una formulazione delle ipotesi di ricerca in modo tale da poter essere valutate con opportune tecniche statistiche. VERIFICA DELLE IPOTESI Analisi dei dati Assunzioni sul modello probabilistico , sui parametri, sul campione Formulazione dell’ipotesi : nulla H0 e alternativa H1 Costruzione della statistica test e della sua distribuzione Definizione della Regola di Decisione e valutazione degli errori: rifiutare l’ipotesi nulla vera accettare l’ipotesi nulla falsa Decisione statistica e decisione clinica ERRORE ALFA O ERRORE DI I TIPO L’espressione ‘p<’ indica la probabilita’ di una conclusione falsamente positiva (Un trattamento risulta migliore dell’altro quando in realtà non lo è) tanto più piccolo è il valore di ‘p’ tanto meno probabile è che i trattamenti posti a confronto abbiano un effetto simile ERRORE BETA O ERRORE DI II TIPO Commettendo l’errore beta si afferma che i trattamenti sono uguali quando in realtà essi sono differenti (falso negativo) l’errore beta si verifica solitamente in caso di campioni di piccole dimensioni non si evidenzia un effetto favorevole quando questo è presente 0,05 H0 Sani 0,045 H1 Malati 0,04 Potenza del test: Probabilità di rifiutare l’ipotesi nulla falsa 0,035 0,03 0,025 1- 1- 0,02 0,015 0,01 0,005 0 0 10 20 30 Falsi negativi Errore di secondo tipo: rischio di non rifiutare l’ipotesi nulla falsa 40 50 60 70 80 ETA’ 90 Falsi positivi Errore di primo tipo: rischio di rifiutare l’ipotesi nulla vera RISCHIO DI ERRORI Ipotesi accolta dopo il test Ipotesi vera Ipotesi nulla H0 Ipotesi alternativa H1 Ipotesi nulla H0 Esatta (1- ) Errore II specie Ipotesi alternativa H1 Errore I specie Esatta (1- ) Rischio di prima specie o tipo: Respingere l’ipotesi H0 quando essa è vera = livello di significatività Rischio di seconda specie o tipo: Accettare l’ipotesi H0 quando è vera H1 Potenza del test : 1Respingere l’ipotesi H0 quando è vera l’ipotesi alternativa H1 POTENZA DI UNO STUDIO CLINICO La potenza di uno studio clinico è la sua capacità di fare emergere un effetto se questo esiste realmente Uno studio clinico con una bassa potenza è privo di ogni utilità in quanto avrà una probabilità molto scarsa di raggiungere l’obiettivo che lo sperimentatore si prefigge Quando si parla di potenza di uno studio clinico ci si riferisce alla potenza statistica 1-ß che rappresenta la probabilità che la differenza attesa possa essere scoperta ad un predefinito livello di significativita’ Più alta è la potenza maggiore è la possibilità che la differenza minima attesa tra i gruppi in trattamento possa essere dimostrata LA POTENZA DI UN TEST HA UN IMPATTO DIRETTO SULLA DIMENSIONE DEL CAMPIONE PIU’ GRANDE E’ LA POTENZA è ragionevole che non sia inferiore a 0.80 PIU’ GRANDE E’ LA DIMENSIONE DEL CAMPIONE Generalmente un test ad una coda è più potente del corrispondente test a due code. Il test ad una coda va utilizzato solo se si è del tutto sicuri che una particolare disuguaglianza (direzione) è sempre dovuta al caso e perciò valutata come non significativa, per quanto ampia essa sia Raramente, comunque, ciò si verifica nella pratica VERIFICA DELLE IPOTESI METODI PARAMETRICI METODI NON PARAMETRICI Esistenza di distribuzioni TESTS t-student Analisi della varianza Confronto proporzioni Correlazione Coefficiente di Pearson Non esistenza di distribuzioni CONFRONTO TRA GRUPPI TESTS sui RANGHI (Wilcoxon) Analisi della varianza non parametrica LEGAMI TRA VARIABILI Correlazione Coefficiente di Spearman Tabelle di contingenza Regressione Verifica di ipotesi su medie Due gruppi Indipendenti Distribuzione di Gauss Distribuzione non di Gauss Distribuzione di Gauss Distribuzione non di Gauss Test parametrici Test non parametrici Test parametrici Test non parametrici Wilcoxon Somma dei Ranghi t - Student Wilcoxon Ranghi con segno t - Student (varianze omogenee) t ( x1 x2 ) ( S 2 p n1 Non indipendenti 1 S t - Student (varianze non omogenee) 2 ) t 2 p n2 t ( x1 x2 ) ( S12 n1 1 S 22 n2 2 ) d Sd d n Verifica di ipotesi su medie più di due gruppi Indipendenti Non indipendenti Distribuzione di Gauss Distribuzione non di Gauss Distribuzione di Gauss Distribuzione non di Gauss Test parametrico Test non parametrici Test parametrici Test non parametrici Analisi della Varianza test F-Fisher Analisi della Varianza non parametrica Kruskal - Wallis Analisi della Varianza per misure ripetute Analisi della Varianza per misure ripetute test di Friedman VERIFICA DI IPOTESI SULLE PROPORZIONI Confronto tra due proporzioni Campioni indipendenti Distribuzione binomiale approssimabile ad una Gauss Campioni non indipendenti Campione di piccole dimensioni SI NO Frequenza bassa nelle celle Test z Test chi-quadro Test esatto di Fisher Test di McNemar RELAZIONI TRA VARIABILI Variabili Qualitativa Quantitativa Tabelle di contingenza Test del chi-quadro Una variabile dipendente Vs Una o più variabili indipendenti Con relazione “causa-effetto” Nessuna variabile dipendente Relazione del tipo “interdipendenza” Regressione Correlazione