Università degli Studi di Padova Scuola di Medicina e Chirurgia Corso di Laurea in Medicina e Chirurgia - A.A. 2015-16 Corso: Statistica e Metodologia Epidemiologica 1 Docenti: prof.ssa Anna Chiara Frigo coordinatore corsi MED1 e MED2 prof.ssa Egle Perissinotto coordinatore corsi MED3 e MED4 1 Il corso di Statistica e Metodologia Epidemiologica 1 (4 CFU) viene svolto al secondo semestre del primo anno ed è articolato in una parte teorica ed una teorico-pratica. Metodi didattici Parte teorica (aula A Vallisneri) Per questa parte, le 32 ore disponibili, sono suddivise in 16 lezioni frontali durante le quali sono affrontati gli argomenti articolati in 9 moduli. Parte teorico-pratica (aula C via Loredan 18) Per questa parte, le 16 ore disponibili, sono suddivise in 8 laboratori didattici svolti su cinque turni separatamente per i corsi MED1/MED2 e MED3/MED4. Durante queste lezioni saranno proposti e svolti collegialmente test ed esercizi relativi ai 9 moduli didattici. 2 Corso Disciplina Med1 Statistica e Metodologia Med2 Epidemiologica 1 Med3 Statistica e Metodologia Med4 Epidemiologica 1 Corsi Ore Docenti Teorico 32 Frigo Anna Chiara Teorico-pratico 16 Perissinotto Egle Teorico 32 Perissinotto Egle Teorico-pratico 16 Frigo Anna Chiara 3 Modalità di conduzione delle verifiche di apprendimento – A.A. 2015/16 In itinere Le verifiche di apprendimento in itinere consisteranno in interventi differenti: • durante le lezioni teoriche, somministrazione agli studenti di test ed esercizi con correzione generale; • durante le lezioni teorico-pratiche, somministrazione agli studenti di test ed esercizi con correzione generale; • al termine delle lezioni teoriche e teorico-pratiche, prima degli appelli d’esame, agli studenti viene proposta una simulazione d’esame per l’autoverifica del grado di apprendimento. 4 Finale (esame) La verifica di apprendimento finale (esame) consisterà in una prova finale al termine del corso al I anno. La prova d’esame sarà scritta, composta da quesiti a risposta multipla. Durante la prova d’esame sarà consentita agli studenti la consultazione del materiale didattico. L’iscrizione all’esame è obbligatoria tramite Uniweb. 5 APPELLI D’ESAME del Corso di SME1 Sessione estiva 14/06 dalle 8:30 in più turni 12/07 dalle 8:30 in più turni Sessione autunnale 31/08 dalle 8:30 alle 10:00 12/09 dalle 8:30 alle 10:00 6 Modalità di verifica delle presenze – A.A. 2015/16 Le presenze saranno rilevate: • in ciascun corso teorico mediante il badge; • in ciascun corso teorico-pratico mediante raccolta firme durante le lezioni. 7 Obiettivi formativi Mettere in grado il futuro laureato di: • tradurre un problema medico in un modello logico-statistico, classificando per tipo e ruolo le variabili cliniche; • individuare modelli di indagine epidemiologica idonei a stimare specifiche misure di diffusione di malattia e a valutare l’entità di potenziali fattori di rischio; • riconoscere i concetti fondamentali del calcolo delle probabilità, per poter valutare potenzialità e limiti della teoria delle probabilità nella metodologia diagnostica e di screening epidemiologico; • conoscere potenzialità e limiti del campionamento in medicina; • capire le basi dell'inferenza statistica; • affrontare l’analisi di studi clinici mediante tecniche statistiche da utilizzare per il confronto di due gruppi; • analizzare l’associazione tra variabili. Prerequisiti Adeguata conoscenza del calcolo algebrico e, in particolare, una buona familiarità con i seguenti argomenti: notazione in potenze di dieci, esponenziali e logaritmi, equazioni di primo e secondo grado e loro rappresentazione geometrica, disequazioni. 8 DOCENTI DEL CORSO prof.ssa Frigo Anna Chiara prof.ssa Perissinotto Egle tel. 049/8275412 e-mail: [email protected] tel. 049/8275405 e-mail: [email protected] Unità di Biostatistica, Epidemiologia e Sanità Pubblica (UBESP) Dipartimento di Scienze Cardiologiche, Toraciche, Vascolari Scuola di Medicina e Chirurgia via Loredan, 18 35131 Padova 9 Sito dove reperire copia dei moduli presentati a lezione http://147.162.76.190/didattica/SME1 10 Programma 1) Professione medica e statistica Il processo di produzione dei dati statistici - Unità statistica, popolazione, caratteri statistici Tipi di variabili Descrizione dei dati: distribuzioni di frequenza, tabelle e grafici 2) Misure di posizione, tendenza centrale e variabilità - Moda Media aritmetica Mediana, quartili e percentili Campo di variazione, differenza interquartile, deviazione standard, coefficiente di variazione 6) Distribuzioni di probabilità ed elementi di statistica inferenziale - 7) Stima - 3) Misure di diffusione di malattia - Rapporti, proporzioni e tassi Prevalenza e incidenza Tassi grezzi, tassi specifici, tassi standardizzati - Studi longitudinali o di coorte Studi caso-controllo Studi trasversali Studi sperimentali Rischio relativo e odds ratio Stima puntuale e intervallare Stima della media di una popolazione mediante intervallo di fiducia Stima della proporzione di una popolazione mediante intervallo di fiducia Calcolo della dimensione del campione per la stima di una media Calcolo della dimensione del campione per la stima di una proporzione 8) La logica del test di ipotesi - 4) I principali modelli di indagine epidemiologica Le più comuni variabili casuali: Binomiale, Poisson, Normale Teorema centrale della Statistica Popolazione e campione La distribuzione delle medie campionarie Ipotesi nulla e ipotesi alternativa Livello di significatività e potenza di un test L'inferenza con un singolo campione per dati quantitativi e qualitativi. La dimensione del campione Test t di Student per campioni dipendenti e per campioni indipendenti. La dimensione del campione 9) Associazione tra variabili categoriali - Test chi quadrato per campioni indipendenti Calcolo della dimensione del campione nel caso di due proporzioni Test di McNemar per osservazioni appaiate Intervallo di fiducia per l'Odds Ratio Intervallo di fiducia per il Rischio Relativo Intervallo di fiducia per la differenza di due proporzioni 5) Probabilità e test diagnostici/di screening - Principi di calcolo delle probabilità Applicazione delle probabilità ai test diagnostici: sensibilità e specificità Il teorema di Bayes Prevalenza, probabilità a priori, valore predittivo positivo e negativo 11 Testi consigliati: M. Pagano, K. Gauvreau (2003) “Biostatistica - II edizione” II Edizione italiana a cura di I.F. Angelillo, M. Pavia, P. Villari, G. Di Natale. Ed. Idelson-Gnocchi. Per consultazione: M. Bland (2009) “Statistica Medica”. Milano: APOGEO. P. Armitage e G. Berry (1996) “Statistica Medica - Metodi statistici per la ricerca in Medicina”. Milano: McGraw-Hill Libri Italia srl. 12 Calendario delle lezioni di Statistica e Metodologia Epidemiologica 1 – A.A. 2015-16 SETTIMANA 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª Med 1+2 (prof.ssa Anna Chiara FRIGO) Lunedì 14:15-15:45 Giovedì 8:15-9:45 aula A Vallisneri aula A Vallisneri 03/03/16 07/03/16 10/03/16 14/03/16 17/03/16 21/03/16 31/03/16 04/04/16 07/04/16 11/04/16 (12:15-13:45) 14/04/16 18/04/16 21/04/16 02/05/16 28/04/16 05/05/16 mercoledì 08/06/16 06/06/16 (14:15-15:45 eventuale (eventuale recupero) recupero) 13 Calendario delle lezioni di Statistica e Metodologia Epidemiologica 1 – A.A. 2015-16 Med 3+4 (prof.ssa Egle PERISSINOTTO) SETTIMANA 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª Martedì 14:15-15:45 aula A Vallisneri 01/03/16 08/03/16 15/03/16 22/03/16 05/04/16 12/04/16 (12:15-13:45) 19/04/16 26/04/16 lunedì 06/06/16 (12:15-13:45 eventuale recupero) Mercoledì 8:15-9:45 aula A Vallisneri 02/03/16 09/03/16 16/03/16 23/03/16 30/03/16 06/04/16 13/04/16 20/04/16 08/06/16 (12:15-13:45 eventuale recupero) 14 Calendario dei laboratori didattici SME1 – A.A. 2015-16 aula C via Loredan, 18 Laboratori MED1 e MED2 (prof.ssa Perissinotto) aula C Laboratori MED3 e MED4 (prof.ssa Frigo) aula C M1_2_1 M1_2_2 M1_2_3 M1_2_4 M1_2_5 M3_4_1 M3_4_2 M3_4_3 M3_4_4 M3_4_5 1° 06/04/16 10:15-11:45 06/04/16 12:15-13:45 06/04/16 16:15-17:45 07/04/16 14:15-15:45 07/04/16 16:15-17:45 05/04/16 8:15-9:45 05/04/16 10:15-11:45 05/04/16 16:15-17:45 06/04/16 14:15-15:45 08/04/16 8:15-9:45 2° 13/04/16 10:15-11:45 13/04/16 12:15-13:45 13/04/16 16:15-17:45 14/04/16 14:15-15:45 14/04/16 16:15-17:45 12/04/16 8:15-9:45 12/04/16 10:15-11:45 12/04/16 16:15-17:45 13/04/16 14:15-15:45 15/04/16 8:15-9:45 3° 20/04/16 10:15-11:45 20/04/16 12:15-13:45 20/04/16 16:15-17:45 21/04/16 14:15-15:45 21/04/16 16:15-17:45 19/04/16 8:15-9:45 19/04/16 10:15-11:45 19/04/16 16:15-17:45 20/04/16 14:15-15:45 22/04/16 8:15-9:45 4° 27/04/16 8:15-9:45 27/04/16 10:15-11:45 27/04/16 16:15-17:45 28/04/16 14:15-15:45 28/04/16 16:15-17:45 26/04/16 8:15-9:45 26/04/16 10:15-11:45 26/04/16 16:15-17:45 27/04/16 14:15-15:45 29/04/16 8:15-9:45 5° 04/05/16 8:15-9:45 04/05/16 10:15-11:45 04/05/16 16:15-17:45 05/05/16 14:15-15:45 05/05/16 16:15-17:45 02/05/16 8:15-9:45 02/05/16 10:15-11:45 02/05/16 16:15-17:45 03/05/16 14:15-15:45 06/05/16 8:15-9:45 6° 11/05/16 8:15-9:45 11/05/16 10:15-11:45 11/05/16 16:15-17:45 11/05/16 14:15-15:45 12/05/16 16:15-17:45 10/05/16 8:15-9:45 10/05/16 10:15-11:45 10/05/16 16:15-17:45 11/05/16 14:15-15:45 13/05/16 8:15-9:45 7° 18/05/16 8:15-9:45 23/05/16 14:15-15:45 18/05/16 16:15-17:45 19/05/16 14:15-15:45 19/05/16 16:15-17:45 17/05/16 8:15-9:45 17/05/16 10:15-11:45 17/05/16 16:15-17:45 18/05/16 14:15-15:45 20/05/16 8:15-9:45 8° 25/05/16 8:15-9:45 25/05/16 10:15-11:45 25/05/16 16:15-17:45 26/05/16 14:15-15:45 26/05/16 16:15-17:45 24/05/16 8:15-9:45 24/05/16 12:15-13:45 24/05/16 16:15-17:45 25/05/16 14:15-15:45 27/05/16 8:15-9:45 GRUPPO COGNOMI LABORATORIO Docenti Laboratori: dott. Egle PERISSINOTTO (Med1+2) e dott. Anna Chiara FRIGO (Med3+4). Sede: AULA C, via Loredan, 18. 15 Modulo 1: Il processo di produzione dei dati statistici (Capitolo 2: 2.1-2.2, 2.3, 2.3.1-2.3.3, 2.3.6-2.3.7, 2.4 fino all’ultimo punto della colonna di destra di pagina 24) • Unità statistica, popolazione, caratteri statistici • Tipi di variabili • Descrizione dei dati: distribuzioni di frequenza, tabelle e grafici 16 Spesso la STATISTICA è interpretata come mero insieme di tecniche che forniscono soluzioni operative a quesiti di tipo conoscitivo e gestionale, facilmente accessibili grazie al recente fiorire di supporti informatici. La STATISTICA è invece una disciplina metodologica trasversale, in grado di contribuire sia al processo di ricerca scientifica sia a processi decisionali propri della professione. Per produrre e utilizzare informazione sulle dimensioni quantitative dei fenomeni osservati (sanitari o di altro genere) è necessario conoscere i principi generali dell’indagine statistica. 17 La STATISTICA è la disciplina che insegna a raccogliere, organizzare, sintetizzare ed analizzare i dati osservati su singole unità e affetti da variabilità casuale. 18 La STATISTICA: • trova la sua motivazione nella VARIABILITÀ, • mira ad individuare elementi di REGOLARITÀ nel verificarsi degli eventi. A tal fine si avvale del calcolo delle probabilità. Esempio: la statura dei soggetti di una popolazione è variabile, ma si osserva una sua tendenza ad aumentare negli ultimi decenni. Questa osservazione dipende da un reale aumento oppure è l’effetto di una variabilità casuale? 19 EPIDEMIOLOGIA: branca della scienza medica che studia la diffusione delle malattie e dei fattori che ne condizionano l’insorgenza e la diffusione. L’ambito applicativo dell’EPIDEMIOLOGIA rientra nella sanità pubblica, nella medicina sociale e di comunità. 20 L’EPIDEMIOLOGIA utilizza informazioni provenienti da: – statistiche ufficiali correnti (statistiche demografiche e sanitarie dell’ISTAT), Fig. 1 - Nati vivi e morti dal 1990 al 2009 nel Veneto (fonte: Regione Veneto). 51.000 49.000 48.615 47.682 47.633 47.000 47.097 47.055 46.264 Numero 45.000 44.778 43.434 43.177 43.051 43.299 43.000 42.032 41.000 41.015 40.916 40.999 41.251 39.000 39.072 42.496 42.334 42.044 42.204 40.855 44.382 43.501 42.931 41.757 42.118 40.972 39.612 39.350 37.960 41.450 41.720 41.698 41.547 43.911 43.787 38.284 Nati vivi 38.246 37.690 37.000 Morti 35.000 Anno – sistemi istituzionali di raccolta dati (quali registri di specifiche malattie, schede cliniche, schede di dimissione ospedaliera), – indagini statistiche svolte ad hoc. 21 L’EPIDEMIOLOGIA si interessa alle caratteristiche di gruppi di individui piuttosto che di singoli soggetti. La STATISTICA fornisce la base metodologica e la soluzione tecnica ai problemi propri della ricerca EPIDEMIOLOGICA, al pari di altre tematiche di ricerca: • CLINICA, • sui SERVIZI SANITARI, • sugli interventi DI PREVENZIONE. 22 DESCRITTIVA STATISTICA INFERENZIALE 23 STATISTICA DESCRITTIVA: • Organizza e sintetizza le osservazioni, consentendo una visione d’insieme delle caratteristiche generali di una serie di dati e delle loro relazioni, • A questo fine, utilizza tabelle, grafici e misure di sintesi numerica. 24 STATISTICA INFERENZIALE Permette di estendere i risultati ottenuti dai dati raccolti in un campione alla popolazione da cui esso è stato estratto. 25 FASI ESSENZIALI DEL PROCESSO DI PRODUZIONE DI DATI STATISTICI • Produzione di micro-dati (dati elementari raccolti sulla singola unità statistica) • Produzione di macro-dati (informatore relativo ad un gruppo di unità statistiche) 26 Fasi nella produzione di micro-dati: - astrazione, - piano d’indagine, - rilevazione, - verifica della qualità dei dati, - organizzazione dei micro-dati. 27 ASTRAZIONE Momento definitorio e di concettualizzazione del processo di produzione del micro-dato. Comprende la definizione di: • unità statistica (unità elementare di indagine), • collettivo di unità statistiche (o aggregato o popolazione o universo), • caratteri statistici (variabili operative della ricerca). 28 UNITÀ STATISTICA Elemento semplice o composto, ente animato o inanimato, supporto elementare delle informazioni che interessano all’indagine. Esempi: - neonato, - soggetto in età pediatrica, - anziano, - famiglia, - reparto, - ospedale. 29 COLLETTIVO Insieme di unità statistiche oggetto di indagine a cui devono essere riferite le conoscenze prodotte dall’indagine. Il collettivo non è sempre facilmente identificabile. Popolazione obiettivo Popolazione raggiungibile Popolazione osservata Reale e finito Collettivo Potenziale e infinito o virtuale 30 CARATTERE STATISTICO (VARIABILE) Aspetto o caratteristica osservabile sulle unità statistiche, che può presentarsi in due o più modi alternativi. 31 VARIABILI QUALITATIVE NOMINALI ORDINALI QUANTITATIVE DISCRETE CONTINUE 32 ESEMPI NATURA CARATTERE VARIABILE MODALITÀ/INTENSITÀ Qualitativo nominale Stato civile - nubile/celibe coniugato/convivente vedova/o separato/divorziato/a Qualitativo ordinale Disabilità - nessuna lieve moderata totale Quantitativo discreto Numero di farmaci 0, 1, 2, 3, …… Quantitativo continuo Temperatura corporea (°C) Qualsiasi numero compreso tra un minimo ed un massimo compatibili per le unità statistiche considerate Peso (kg) Qualsiasi numero compreso tra un minimo ed un massimo compatibili per le unità statistiche considerate 33 CARATTERI direttamente e oggettivamente osservabili sono frequenti nell’ambito di fenomeni di natura fisica, tipici dell’area sanitaria. Questi sono pertanto facilmente rilevabili come variabili quantitative. Nell’ambito di problematiche di tipo psico-sociale (capacità cognitive, interessi, atteggiamenti, abilità psicomotorie) sono maggiormente utilizzate variabili di tipo qualitativo su scala ordinale ovvero scale quantitative (punteggi). 34 PIANO D’INDAGINE Insieme delle osservazioni scelte da strategiche effettuare sulle concernenti unità di le una popolazione o di un suo campione, in rapporto alle finalità conoscitive da perseguire e alla natura delle variabili. 35 Le scelte mirano a tenere sotto controllo le fonti di variabilità estranea a quella intrinseca alle caratteristiche oggetto di studio Tali fonti possono riguardare: Errore campionario Errore non campionario Derivante dall’errore casuale associato al campionamento delle unità su cui effettuare la rilevazione Non sistematico ma casuale e simmetrico (es. errori di misura) Sistematico e asimmetrico (errore di tipo concettuale, mancata copertura della base campionaria, mancata collaborazione di parte del campione) Confondimento (variabili spurie legate al contesto della ricerca che interferiscono con le variabili oggetto di studio) 36 Principali modelli d’indagine TRASVERSALE • OSSERVAZIONALE CASO-CONTROLLO DI COORTE • SPERIMENTALE 37 Esempi di indagine • Indagine sull’opinione dell’utenza relativamente al servizio erogato, • Studio sulla funzionalità respiratoria del pazienti affetti da broncopneumopatia cronico ostruttiva (BPCO), • Studio dei tempi di assistenza infermieristica in un reparto di lungo-degenza, • Studio sull’effetto dell’introduzione di un nuovo protocollo per la sostituzione del catetere confrontato con il protocollo precedente. 38 ORGANIZZAZIONE DEL MICRO-DATO Fase durante la quale i micro-dati sono sottoposti ad alcune operazioni atte a renderli maggiormente adatti all’elaborazione, sia essa manuale che automatica: • Elenco delle variabili e relative modalità, • Predisposizione di un piano di codifica, • Codifica, • Registrazione. 39 Dati Dati relativi a n = 60 pazienti ricoverati per sospetto infarto. Sono state rilevate l’età (anni compiuti), la statura (cm) e il peso (Kg). Per determinare la presenza di possibili fattori di rischio per l’infarto è stato calcolato il BMI (indice di massa corporea calcolato come peso (kg)/statura(m)², utilizzato come indicatore dello stato di peso forma), e sono stati rilevati la pressione arteriosa sistolica (mmHg), se il paziente conduceva regolarmente attività fisica, il numero medio di caffè al giorno, se fumava e quante sigarette in media al giorno. È stato inoltre registrato il livello sierico della Creatin Fosfochinasi (CPK) (UI/L), un test utilizzato per identificare un paziente con infarto al miocardio. 40 Dati 41 Variabili qualitative: • Nominali: sesso (M/F), infarto (Yes/No), attività fisica (Yes/No), Fumo (Yes/No); • Ordinali: classe di BMI. Variabili quantitative: • Discrete: numero di sigarette, numero di caffè. • Continue: statura, peso, età, pressione arteriosa, CPK. 42 PRODUZIONE DI MACRO-DATI Il macro-dato è un informatore relativo ad un insieme di unità statistiche. ESEMPIO: una frequenza di unità statistiche corrispondente ad una modalità/intensità di un carattere o della combinazione di due o più caratteri. L’insieme delle frequenze corrispondente a ciascuna modalità/intensità di un carattere prende il nome di distribuzione di frequenze. 43 Distribuzione semplice o univariata di una variabile qualitativa con k modalità 44 ESEMPIO Distribuzione della classe di BMI nei 60 pazienti ricoverati 45 46 47 ESEMPIO Distribuzione del numero medio di caffè bevuti quotidianamente nei 60 pazienti ricoverati 48 Distribuzione del numero di caffè bevuti in media al giorno nei 60 pazienti ricoverati Frequenze assolute 25 20 15 10 5 0 0 1 2 3 Numero di caffè 4 5 6 49 Distribuzione dell’età (anni) nei 60 pazienti ricoverati Frequenza Valore Frequenza Frequenza Intervallo di cumulata centrale assoluta relativa età della (ni) (fi) assoluta relativa (anni) classe (Ni) (Fi) 0 |- 40 20 0 0 0 0 40 |- 45 42 1 0,02 1 0,02 45 |- 50 47 2 0,03 3 0,05 50 |- 55 52 7 0,12 10 0,17 55 |- 60 57 6 0,10 16 0,27 60 |- 65 62 14 0,23 30 0,50 65 |- 70 67 12 0,20 42 0,70 70 |- 75 72 9 0,15 51 0,85 75 |- 80 77 4 0,07 55 0,92 80 |- 85 82 2 0,03 57 0,95 85 |- 90 87 3 0,05 60 1,00 Totale 60 1,00 50 51 Come calcolare il numero ideale di classi della stessa ampiezza • Numero di classi k n o • Numero di classi k 1 + 3,322log10n • L’ampiezza delle classi può essere ottenuta come: a (massimo-minimo)/k 52 n Numerosità 53 1050 1000 950 900 850 800 750 700 650 600 550 500 450 400 350 300 250 200 150 100 50 1 + 3,322log10n 0 Numero classi 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Distribuzione dell’età (anni) nei 60 pazienti ricoverati 16 Numero di pazienti 14 12 10 8 6 4 2 0 20 42 47 52 57 62 67 72 77 Età (valori centrali delle classi) in anni 82 87 54 55 Frequenze relative % Distribuzione doppia o bivariata Distribuzione della classe di BMI e sesso in 60 pazienti ricoverati (frequenze assolute) Frequenze condizionate Frequenze congiunte Totale SESSO pazienti per CLASSE BMI classe di Maschi Femmine BMI 9 7 Obesità gravissima 16 7 5 Obesità grave 12 10 3 Obesità moderata 13 5 7 Sovrappeso 12 6 1 Normale 7 Totale pazienti per sesso 37 23 60 Frequenze marginali 56 RAPPRESENTAZIONE GRAFICA ERRATA 57 Distribuzione doppia o bivariata Distribuzione del sesso per classe di BMI dei 60 pazienti ricoverati (frequenze relative per riga condizionatamente alla classe di BMI) 58 Distribuzione doppia o bivariata Distribuzione della classe di BMI per sesso dei 60 pazienti ricoverati (frequenze relative per colonna condizionatamente al sesso) 59 Normale Obesità grave Obesità gravissima Obesità modera Sovrappeso Normale Obesità grave Obesità gravissima Obesità modera Sovrappeso 60 61 Esempio Dopo aver suddiviso opportunamente i valori in classi, costruire la distribuzione di frequenza e l’istogramma. 62