Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 11 - 5/11/2015 a.a. 2015/16 Prof. Maria Francesca Romano [email protected] Argomenti trattati • Popolazione e campionamento • Variabilità campionaria • “Solidità” o fallibilità di una stima campionaria • Numerosità del campione Popolazione e campionamento • Lo scopo principale della valutazione delle proprietà di un test diagnostico consiste nella possibilità di poter generalizzare i risultati da un campione di individui alla popolazione di interesse Popolazione e campionamento • Popolazione = comunità particolare (utenti di un ospedale o di un ambulatorio) • Popolazione = insieme caratterizzato dal fatto di condividere una particolare esperienza (utenti di un servizio, ecc.) Popolazione e campionamento • Il metodo per la selezione di individui da reclutare nello studio è determinante ai fini di disporre di risultati validi e generalizzabili Popolazione e campionamento • Il requisito fondamentale di uno studio generalizzabile è quello di essere basato su di un campione rappresentativo della popolazione di interesse (bersaglio o target) • La popolazione campionata deve essere molto simile alla popolazione obiettivo o bersaglio (target population) Disegni di campionamento • • • • • CCS: campionamento casuale semplice CSI: campionamento casuale sistematico CST: campionamento casuale stratificato CGR: campionamento a grappoli CDS: campionamento a due o più stadi Campionamento casuale • Campionamento casuale semplice • Campionamento sistematico • Campionamento casuale stratificato • Campionamento a grappoli popolazione di selezione popolazione bersaglio Campionamento casuale semplice • Semplice: tutti i possibili campioni che possono essere estratti, elencabili a priori hanno la stessa probabilità di essere estratti simple random sampling (SRS) Esempio: CCS di studenti • 6 studenti di Statistica (popolazione) • in quanti modi possiamo scegliere un CCS di 2 studenti (senza ripetizione)? Esempio: CCS di studenti • popolazione: A, B, C, D, E, F • campioni possibili: AB AC AD AE AF BC BD BE BF CD CE CF DE DF EF Esempio: CCS di studenti Il caso ci potrà fare scegliere 1 dei 15 possibili campioni: ogni CCS : probabilità 1/15 ogni studente: probabilità di essere campionato 5/15=1/3 si estraggono “a caso” 2 studenti su 6 Esempio: CCS di studenti con Excel Esempio: CCS di studenti con Excel Esempio: CCS di studenti con Excel Esempio: CCS di studenti con Excel Campionamento casuale sistematico • scelta sistematica di n soggetti: ingredienti: lista di N soggetti (sampling frame) passo di campionamento a=N/n systematic sampling (SYS) Campionamento casuale sistematico • scelta sistematica di n soggetti: operazioni: scelta a caso di una unità tra le prime a le altre n-1 unità sono quelle che distano a numeri l’una dall’altra, a partire dalla prima Esempio: CSI di pazienti • Lista di 100 soggetti da cui estrarre 10 soggetti, ad ogni soggetto corrisponde un’etichetta, un codice numerico da 1 a 100 a=100/10=10 Esempio: CSI di pazienti • scelgo a caso un numero da 1 a 10 (supponiamo il 5) ed inserisco il soggetto corrispondente nel campione • i 9 soggetti rimanenti sono quelli con codice 15, 25, 35, 45, 55, 65, 75, 85, 95 Esempio: CSI di pazienti Il caso ci potrà fare scegliere 1 dei 10 possibili campioni: 10 campioni possibili : ogni studente: probabilità 1/10 probabilità 1/10 Esempio: CSI di studenti con Excel Esempio: CSI di studenti con Excel Esempio: CSI di studenti con Excel Campionamento casuale stratificato • stratificazione: divisione delle unità (soggetti) in gruppi di unità omogenee, esempio: maschi e femmine, classi sociali, classi di età Campionamento casuale stratificato • selezione: individuazione della frazione di campionamento in ogni strato selezione CCS o CSI in ogni strato Stratified random sampling Campionamento a grappoli • grappolo (cluster): ordinamento gerarchico delle unità della popolazione: esse sono raggruppate in “contenitori” (grappoli) esempio: famiglia=grappolo membri=unità Campionamento a grappoli • selezione: lista di grappoli selezione CCS o CSI dei grappoli e delle unità in essi contenute cluster sampling (CLU) Campionamento a due stadi • STADIO 1: campione di grappoli (famiglie) • STADIO 2: in ciascun grappolo selezionato campione di unità (membri) Esempio: Campionamento doppio • fase 1: campione casuale di n soggetti test di screening positivi al test+negativi al test=n Esempio: Campionamento doppio • fase 2: campione casuale di p soggetti positivi campione casuale di q soggetti negativi esame medico approfondito su p+q<n soggetti ? • Perché abbiamo dedicato tempo ai vari disegni di campionamento? ? • Molte procedure statistiche assumono che i dati provengano da un CCS, nella realtà solo raramente questo si verifica. ? • L’analisi statistica deve tener conto esplicitamente dei grappoli (CGR) e degli strati (CST), • generalmente CSI assimilabile a CCS Protocollo • ogni studio che prevede analisi statistica dei dati deve essere chiaro sulle modalità di campionamento seguite Quesiti • Definizione popolazione campionata? • Pop. campionata vs pop. Bersaglio? • Procedura di campionamento? • Campionamento CCS? • Se no, perché? • Quale disegno di campionamento? • I metodi statistici tengono conto del particolare disegno? Protocollo • la statistica è un buon aiutante, ma un pessimo padrone! Esempio: qualità del vitto percepita dai ricoverati Reclutamento pazienti: 50 ricoverati presso un reparto in corsia in un certo momento Obiettivo finale: fornire risultati utili per la gestione del reparto Esempio: qualità del vitto percepita dai ricoverati • I risultati sono generalizzabili? La popolazione è appropriata? • Ci sono fattori di selezione e/o di distorsione nello studio? Esempio: qualità del vitto percepita dai ricoverati Fattori di selezione: 1. non tutti i pazienti sono in corsia 2. i pazienti in unità sono i più compromessi o quelli con maggiori complicanze Esempio: qualità del vitto percepita dai ricoverati Applicare le conclusioni dello studio a tutti i pazienti che si rivolgono ad un reparto o ad un ambulatorio potrebbe essere fuorviante Popolazione e campionamento • Se la popolazione campionata è molto simile alla popolazione bersaglio, è appropriata. • Con quali modalità sono stati selezionati i soggetti per lo studio? Popolazione e campionamento • Le modalità di selezione devono essere oggettive e non distorte • Campioni opportunistici, fortuiti, selezionati sulla base della facilità di reperimento raramente sono rappresentativi della popolazione bersaglio Esempio: qualità del vitto percepita dai ricoverati • Nella valutazione della soddisfazione non selezionare soggetti in base ai sintomi presentati o alle loro caratteristiche Esempio: qualità del vitto percepita dai ricoverati non valida la contrapposizione di due gruppi: coloro che quasi certamente sono in reparto versus coloro che quasi certamente non ci sono …mancano le situazioni intermedie!