La chiusura del dataset 2008: scadenze e procedure Gianluigi Ferrante - Valentina Minardi 6 Febbraio 2009 Istituto Superiore di Sanità Chiusura del dataset • Si stabilisce in modo definitivo quante e quali interviste costituiscono il database di riferimento per le analisi del 2008 • Sino a quando il database non è chiuso, non è possibile calcolare i pesi per le analisi complesse, né produrre i risultati nazionali di pool, necessari per i confronti Cosa si deve fare? • Caricare sul server tutte le interviste del 2008 (le interviste programmate per Dicembre 2008 ed effettuate entro il 28 Febbraio 2009, devono essere caricate sul server) • Fare le verifiche di routine sulla qualità dei dati • Correggere eventuali errori riscontrati durante le verifiche, attraverso la correzione on-line Chi deve fare i controlli di qualità e le modifiche • Il Coordinatore Aziendale (CA) è responsabile, con la supervisione del Coordinatore Regionale (CR), del controllo e della correzione del dataset aziendale • Nell’impossibilità del CA di svolgere questa funzione è possibile delegare ad un operatore del gruppo aziendale PASSI, al CR o al Referente Regionale Qual è il termine stabilito per la chiusura del dataset 2008? 15 Marzo 2009 Controllo di qualità dei dati • Come evidenziare eventuali anomalie nel dataset ed identificare i record con valori erronei o mancanti? a) Consultare i dati di monitoraggio relativi alla propria ASL/Regione (es. numero di interviste per ASL/intervistatore/mese/anno, ecc.) b) Analizzare i database dei diari dell’intervistatore, usando l’apposito PGM di EpiInfo c) Utilizzare altre fonti di informazione (es. segnalazioni degli intervistatori) Dati di monitoraggio al 5 Febbraio 2009 • Regioni: tutte tranne la Calabria • Interviste 2008: – Totale interviste inviate al server: 32.993 Numero di interviste inviate al server per regione Percentuali di interviste caricate sulle attese del 2008 50% 75% Analisi dei diari dell’intervistatore • Consentono di evidenziare ulteriori problemi nel dataset, individuando i singoli record con valori mancanti o erronei • Nella directory “C:\Passi” creare la cartella “PASSI_diari” e traferirci il file che ha come nome il codice della regione (80.mdb) • Rinominare il suddetto file “diario_regione” • Creare nella cartella “PASSI_diari” una sottocartella chiamata “Routeout” • Scaricare il PGM per l’analisi dei diari dalla sezione Documenti del sito passidati.it • Far correre il programma con EpiInfo • EpiInfo si arresta e compare una finestra di dialogo che richiede di inserire il numero della ASL da analizzare • Se si vuole eseguire l’analisi sull’intera regione basta inserire zero (0) • Durante l’esecuzione del PGM, può apparire il messaggio “No records match selection criteria” • Significa che non ci sono record suscettibili di correzione • Cliccare su OK per riavviare il programma (anche più volte) fino al completamento • Per leggere i risultati dell’analisi dei diari dell’intervistatore aprire il file HTML “controllo del diario per ASL” • Percorso “C:\Passi\PASSI_diar i\ROUTEOUT” Cosa si può valutare dall’analisi dei diari? • Verifica numero diari caricati • Informazioni mancanti • Informazioni errate • Doppioni Esempio • Verifica del numero di interviste caricate • In 7 interviste manca il nome dell’intervistatore • In 15 sostituiti manca il nome dell’intervistatore Esempio • Dettagli sulle 7 interviste in cui manca il nome dell’intervistatore 14201_04/2008_2496 Regione/ASL Anno/Mese Cod.Estrazione Esempio • In 21 interviste è assente l’anno di rilevazione • La stringa è incompleta, ma è comunque possibile risalire all’intervista Esempio • In 5 interviste non c’è l’età dell’intervistato Esempio • Ci sono 134 motivi di sostituzione mancanti • È possibile identificare le interviste da correggere Esempio Dettaglio per intervistatore Correzione on-line • Dopo aver evidenziato le anomalie nel dataset ed identificato i record con valori erronei o mancanti si procede con la correzione on-line La correzione del database Sempre sul sito www.passidati.it Leggere attentamente la guida! Accesso Elenco di tutte le interviste di competenza del coordinatore aziendale Cliccando sul numero di estrazione si accede alla pagina di modifica della singola intervista Elenco ordinabile per ognuno dei campi (cliccando sulla parola attiva) E’ possibile fare una ricerca per singola parola o più parole (come su Google). Ad es. nome intervistatore, mese, anno, numero di estrazione. Si mette il numero di estrazione del diario con errore che viene visualizzato automaticamente Si fanno le modifiche e si salvano La funzione di eliminare l’intervista è per ora riservata al GT centrale in caso di interviste doppie contattare Valentina Minardi Per concludere… • In alcune Aziende/Regioni ci si è accorti che per alcuni strati (es. giovani, residenti in grandi città) si ha una minor risposta alle interviste • Alcune categorie di persone sono difficilmente reperibili e a volte il numero di sostituti del titolare (di solito tre) non è sufficiente per effettuare l’intervista • Fino ad ora un rimedio è stato aumentare il numero di interviste per le categorie meno reperibili nei mesi successivi • Questa soluzione non garantisce però che gli strati siano equamente rappresentati nei confronti tra due periodi diversi (es. confronto Marzo 2008-Marzo 2009) Soluzione • Aumentare il numero di sostituti per quegli strati in cui c’è una minor risposta oppure creare una lista di campionamento di riserva da cui selezionare altri sostituti con le stesse caratteristiche di strato • Continuare la ricerca dell’intervistando fino ai due mesi successivi al mese di assegnazione dell’intervista (attualmente si interrompe la ricerca alla fine del mese successivo a quello di assegnazione dell’intervista) Richiesta • Chiedere ai Coordinatori Aziendali il numero aggiornato di interviste mensili programmate • Necessità di aggiornare il denominatore per il calcolo della percentuale di interviste caricate sul server rispetto alle interviste attese Grazie per l’attenzione