CONTROLLO DEI DATI I dati raccolti, indipendentemente dalla forma di presentazione (tabelle cartacee o archivio di computer), costituiscono nel loro insieme i dati grezzi, il cui unico ordine precostituito è in genere rappresentato dalla cronologia del rilevamento. Un controllo dei dati grezzi è necessario per limitare o eliminare errori ripetuti, i quali, anche se di lieve entità, possono incidere sulla stima del fenomeno; questa regola deve essere considerata durante tutte le fasi della ricerca, in quanto la ripetitività di un errore (seppur minimo) può generare grossolane distorsioni in sede di valutazione finale. La sperimentazione ha evidenziato che l’errore sistematico inficia la validità delle osservazioni sul fenomeno in maniera inversamente proporzionale al momento di introduzione. L’errore commesso nelle prime fasi della ricerca influisce sulla differenza tra modello proposto e realtà più di quanto non influiscano gli errori in fase di elaborazione. Il controllo dei dati grezzi, evidentemente, non può entrare nel merito della loro correttezza, la cui verifica deve essere già stata effettuata all’atto del rilevamento, ma può evidenziare misure poco plausibili sfuggite al rilevatore o introdotte con la trascrizione dei dati, nonché incongruenze, dati mancanti e valori fuori norma. I dati mancanti possono essere recuperati, se disponibili, mentre negli altri casi viene effettuato un confronto con i dati originali. Taluni ritengono lecito eliminare i dati anomali considerandoli aprioristicamente errati. La tendenza a operare in questo modo viene giustificata dal fatto che tali dati possono influenzare notevolmente i risultati delle elaborazioni statistiche. Questa prassi non è corretta; se non è stato accertato un errore, non è ammesso eliminare dati solo perché colpevoli di non essere in sintonia con gli altri: potrebbero essere segnali di particolari variabilità che verrebbero perdute con la loro eliminazione. Sarà compito dello statistico orientarsi su opportune tecniche per evitare ripercussioni su calcoli e risultati. La possibilità di essere in presenza di dati mancanti e dati non misurabili in modo quantitativo, perché al di sotto o al di sopra della sensibilità dello strumento o della logica dell’indagine, va prevista nella programmazione e deve indirizzare a tecniche statistiche specifiche. Una semplice osservazione dei dati può anche far emergere l’eventuale esigenza di una loro trasformazione per una migliore elaborazione statistica. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l.