Statistica dei consumi alimentari e delle tendenze nutrizionali
Lezione 11 - 5/11/2015
a.a. 2015/16
Prof. Maria Francesca Romano
[email protected]
Argomenti trattati
• Popolazione e campionamento
• Variabilità campionaria
• “Solidità” o fallibilità di una stima
campionaria
• Numerosità del campione
Popolazione e campionamento
• Lo scopo principale della valutazione delle
proprietà di un test diagnostico consiste
nella possibilità di poter generalizzare i
risultati da un campione di individui alla
popolazione di interesse
Popolazione e campionamento
• Popolazione = comunità particolare (utenti
di un ospedale o di un ambulatorio)
• Popolazione = insieme caratterizzato dal
fatto di condividere una particolare
esperienza (utenti di un servizio, ecc.)
Popolazione e campionamento
• Il metodo per la selezione di individui da
reclutare nello studio è determinante ai fini
di disporre di
risultati validi e generalizzabili
Popolazione e campionamento
• Il requisito fondamentale di uno studio
generalizzabile è quello di essere basato su
di un campione rappresentativo della
popolazione di interesse (bersaglio o target)
• La popolazione campionata deve essere
molto simile alla popolazione obiettivo o
bersaglio (target population)
Disegni di campionamento
•
•
•
•
•
CCS: campionamento casuale semplice
CSI: campionamento casuale sistematico
CST: campionamento casuale stratificato
CGR: campionamento a grappoli
CDS: campionamento a due o più stadi
Campionamento casuale
• Campionamento
casuale semplice
• Campionamento
sistematico
• Campionamento
casuale stratificato
• Campionamento a
grappoli
 popolazione di
selezione
 popolazione bersaglio
Campionamento casuale
semplice
• Semplice:
tutti i possibili campioni che possono essere
estratti, elencabili a priori hanno la stessa
probabilità di essere estratti
simple random sampling (SRS)
Esempio: CCS di studenti
• 6 studenti di Statistica (popolazione)
• in quanti modi possiamo scegliere un CCS
di 2 studenti (senza ripetizione)?
Esempio: CCS di studenti
• popolazione: A, B, C, D, E, F
• campioni possibili:
AB AC AD AE AF
BC BD BE BF CD
CE CF DE DF EF
Esempio:
CCS di studenti
Il caso ci potrà fare scegliere 1 dei 15
possibili campioni:
ogni CCS :
probabilità 1/15
ogni studente:
probabilità di essere
campionato 5/15=1/3
si estraggono “a caso” 2 studenti su 6
Esempio: CCS di studenti con Excel
Esempio: CCS di studenti con Excel
Esempio: CCS di studenti con Excel
Esempio: CCS di studenti con Excel
Campionamento casuale
sistematico
• scelta sistematica di n soggetti:
ingredienti:
lista di N soggetti (sampling frame)
passo di campionamento a=N/n
systematic sampling (SYS)
Campionamento casuale
sistematico
• scelta sistematica di n soggetti:
operazioni:
scelta a caso di una unità tra le prime a
le altre n-1 unità sono quelle che distano
a numeri l’una dall’altra, a partire dalla
prima
Esempio: CSI di pazienti
• Lista di 100 soggetti da cui estrarre 10
soggetti,
ad ogni soggetto corrisponde un’etichetta,
un codice numerico da 1 a 100
a=100/10=10
Esempio: CSI di pazienti
• scelgo a caso un numero da 1 a 10
(supponiamo il 5) ed inserisco il soggetto
corrispondente nel campione
• i 9 soggetti rimanenti sono quelli con codice
15, 25, 35, 45, 55, 65, 75, 85, 95
Esempio: CSI di pazienti
Il caso ci potrà fare scegliere 1 dei 10
possibili campioni:
10 campioni possibili :
ogni studente:
probabilità 1/10
probabilità 1/10
Esempio: CSI di studenti con Excel
Esempio: CSI di studenti con Excel
Esempio: CSI di studenti con Excel
Campionamento casuale
stratificato
• stratificazione:
divisione delle unità (soggetti) in gruppi di
unità omogenee, esempio: maschi e
femmine, classi sociali, classi di età
Campionamento casuale
stratificato
• selezione:
individuazione della frazione di
campionamento in ogni strato
selezione CCS o CSI in ogni strato
Stratified random sampling
Campionamento a grappoli
• grappolo (cluster):
ordinamento gerarchico delle unità della
popolazione: esse sono raggruppate in
“contenitori” (grappoli)
esempio: famiglia=grappolo
membri=unità
Campionamento a grappoli
• selezione:
lista di grappoli
selezione CCS o CSI dei grappoli e delle
unità in essi contenute
cluster sampling (CLU)
Campionamento a due stadi
• STADIO 1: campione di grappoli (famiglie)
• STADIO 2: in ciascun grappolo selezionato
campione di unità (membri)
Esempio: Campionamento doppio
• fase 1:
campione casuale di n soggetti
test di screening
positivi al test+negativi al test=n
Esempio: Campionamento doppio
• fase 2:
campione casuale di p soggetti positivi
campione casuale di q soggetti negativi
esame medico approfondito
su p+q<n soggetti
?
• Perché abbiamo dedicato tempo ai vari
disegni di campionamento?
?
• Molte procedure statistiche assumono che i
dati provengano da un CCS, nella realtà
solo raramente questo si verifica.
?
• L’analisi statistica deve tener conto
esplicitamente dei grappoli (CGR) e degli
strati (CST),
• generalmente CSI assimilabile a CCS
Protocollo
• ogni studio che prevede analisi statistica dei
dati deve essere chiaro sulle modalità di
campionamento seguite
Quesiti
• Definizione
popolazione
campionata?
• Pop. campionata vs
pop. Bersaglio?
• Procedura di
campionamento?
• Campionamento CCS?
• Se no, perché?
• Quale disegno di
campionamento?
• I metodi statistici
tengono conto del
particolare disegno?
Protocollo
• la statistica è un buon aiutante, ma un
pessimo padrone!
Esempio: qualità del vitto percepita dai ricoverati
Reclutamento pazienti: 50 ricoverati presso un
reparto in corsia in un certo momento
Obiettivo finale:
fornire risultati utili per la gestione del
reparto
Esempio: qualità del vitto percepita dai
ricoverati
• I risultati sono generalizzabili? La
popolazione è appropriata?
• Ci sono fattori di selezione e/o di
distorsione nello studio?
Esempio: qualità del vitto percepita dai
ricoverati
Fattori di selezione:
1. non tutti i pazienti sono in corsia
2. i pazienti in unità sono i più compromessi o
quelli con maggiori complicanze
Esempio: qualità del vitto percepita dai
ricoverati
Applicare le conclusioni dello studio a tutti i
pazienti che si rivolgono ad un reparto o ad
un ambulatorio potrebbe essere fuorviante
Popolazione e campionamento
• Se la popolazione campionata è molto
simile alla popolazione bersaglio, è
appropriata.
• Con quali modalità sono stati selezionati i
soggetti per lo studio?
Popolazione e campionamento
• Le modalità di selezione devono essere
oggettive e non distorte
• Campioni opportunistici, fortuiti, selezionati
sulla base della facilità di reperimento
raramente sono rappresentativi della
popolazione bersaglio
Esempio: qualità del vitto percepita dai
ricoverati
• Nella valutazione della soddisfazione non
selezionare soggetti in base ai sintomi
presentati o alle loro caratteristiche
Esempio: qualità del vitto percepita dai
ricoverati
non valida la contrapposizione di due gruppi:
coloro che quasi certamente sono in reparto
versus
coloro che quasi certamente non ci sono
…mancano le situazioni intermedie!