La chiusura del dataset 2008 - EpiCentro

La chiusura del dataset 2008:
scadenze e procedure
Gianluigi Ferrante - Valentina Minardi
6 Febbraio 2009
Istituto Superiore di Sanità
Chiusura del dataset
• Si stabilisce in modo definitivo quante e
quali interviste costituiscono il database
di riferimento per le analisi del 2008
• Sino a quando il database non è chiuso,
non è possibile calcolare i pesi per le
analisi complesse, né produrre i risultati
nazionali di pool, necessari per i
confronti
Cosa si deve fare?
• Caricare sul server tutte le interviste del
2008 (le interviste programmate per
Dicembre 2008 ed effettuate entro il 28
Febbraio 2009, devono essere caricate
sul server)
• Fare le verifiche di routine sulla qualità
dei dati
• Correggere eventuali errori riscontrati
durante le verifiche, attraverso la
correzione on-line
Chi deve fare i controlli di
qualità e le modifiche
• Il Coordinatore Aziendale (CA) è responsabile,
con la supervisione del Coordinatore Regionale
(CR), del controllo e della correzione del
dataset aziendale
• Nell’impossibilità del CA di svolgere questa
funzione è possibile delegare ad un operatore
del gruppo aziendale PASSI, al CR o al
Referente Regionale
Qual è il termine stabilito per la
chiusura del dataset 2008?
15 Marzo 2009
Controllo di qualità dei dati
• Come evidenziare eventuali anomalie nel
dataset ed identificare i record con valori
erronei o mancanti?
a) Consultare i dati di monitoraggio relativi alla
propria ASL/Regione (es. numero di interviste per
ASL/intervistatore/mese/anno, ecc.)
b) Analizzare i database dei diari dell’intervistatore,
usando l’apposito PGM di EpiInfo
c) Utilizzare altre fonti di informazione (es.
segnalazioni degli intervistatori)
Dati di monitoraggio al
5 Febbraio 2009
• Regioni: tutte tranne la Calabria
• Interviste 2008:
– Totale interviste inviate al server: 32.993
Numero di interviste
inviate al server per regione
Percentuali di interviste caricate
sulle attese del 2008
50%
75%
Analisi dei diari
dell’intervistatore
• Consentono di evidenziare ulteriori
problemi nel dataset, individuando
i singoli record con valori mancanti
o erronei
• Nella directory “C:\Passi”
creare la cartella
“PASSI_diari” e traferirci
il file che ha come nome
il codice della regione
(80.mdb)
• Rinominare il suddetto
file “diario_regione”
• Creare nella cartella
“PASSI_diari” una
sottocartella chiamata
“Routeout”
• Scaricare il PGM per
l’analisi dei diari
dalla sezione
Documenti del sito
passidati.it
• Far correre il
programma con
EpiInfo
• EpiInfo si arresta e
compare una finestra
di dialogo che
richiede di inserire il
numero della ASL da
analizzare
• Se si vuole eseguire
l’analisi sull’intera
regione basta
inserire zero (0)
• Durante l’esecuzione
del PGM, può
apparire il
messaggio “No
records match
selection criteria”
• Significa che non ci
sono record
suscettibili di
correzione
• Cliccare su OK per
riavviare il
programma (anche
più volte) fino al
completamento
• Per leggere i risultati
dell’analisi dei diari
dell’intervistatore
aprire il file HTML
“controllo del diario
per ASL”
• Percorso
“C:\Passi\PASSI_diar
i\ROUTEOUT”
Cosa si può valutare
dall’analisi dei diari?
• Verifica numero diari caricati
• Informazioni mancanti
• Informazioni errate
• Doppioni
Esempio
• Verifica del numero
di interviste caricate
• In 7 interviste
manca il nome
dell’intervistatore
• In 15 sostituiti
manca il nome
dell’intervistatore
Esempio
• Dettagli sulle 7
interviste in cui
manca il nome
dell’intervistatore
14201_04/2008_2496
Regione/ASL
Anno/Mese Cod.Estrazione
Esempio
• In 21 interviste
è assente
l’anno di
rilevazione
• La stringa è
incompleta, ma
è comunque
possibile risalire
all’intervista
Esempio
• In 5 interviste non c’è l’età dell’intervistato
Esempio
• Ci sono 134 motivi di sostituzione mancanti
• È possibile identificare le interviste da correggere
Esempio
Dettaglio per
intervistatore
Correzione on-line
• Dopo aver evidenziato le anomalie
nel dataset ed identificato i record
con valori erronei o mancanti si
procede con la correzione on-line
La correzione del database
Sempre sul sito
www.passidati.it
Leggere
attentamente la
guida!
Accesso
Elenco di tutte le interviste di competenza del
coordinatore aziendale
Cliccando sul numero di estrazione si
accede alla pagina di modifica della
singola intervista
Elenco ordinabile per ognuno dei
campi (cliccando sulla parola attiva)
E’ possibile fare una ricerca per singola parola
o più parole (come su Google).
Ad es. nome intervistatore, mese, anno,
numero di estrazione.
Si mette il numero di estrazione del diario con errore che
viene visualizzato automaticamente
Si fanno le modifiche e si salvano
La funzione di eliminare l’intervista è per ora riservata al GT
centrale  in caso di interviste doppie contattare Valentina
Minardi
Per concludere…
• In alcune Aziende/Regioni ci si è accorti che per alcuni
strati (es. giovani, residenti in grandi città) si ha una
minor risposta alle interviste
• Alcune categorie di persone sono difficilmente reperibili
e a volte il numero di sostituti del titolare (di solito tre)
non è sufficiente per effettuare l’intervista
• Fino ad ora un rimedio è stato aumentare il numero di
interviste per le categorie meno reperibili nei mesi
successivi
• Questa soluzione non garantisce però che gli strati siano
equamente rappresentati nei confronti tra due periodi
diversi (es. confronto Marzo 2008-Marzo 2009)
Soluzione
• Aumentare il numero di sostituti per quegli
strati in cui c’è una minor risposta oppure
creare una lista di campionamento di riserva
da cui selezionare altri sostituti con le stesse
caratteristiche di strato
• Continuare la ricerca dell’intervistando fino ai
due mesi successivi al mese di assegnazione
dell’intervista (attualmente si interrompe la
ricerca alla fine del mese successivo a quello
di assegnazione dell’intervista)
Richiesta
• Chiedere ai Coordinatori Aziendali
il numero aggiornato di interviste
mensili programmate
• Necessità di aggiornare il
denominatore per il calcolo della
percentuale di interviste caricate
sul server rispetto alle interviste
attese
Grazie per l’attenzione