UNIVERSITA’ DEGLI STUDI DI ROMA “LA SAPIENZA” Polo didattico di Rieti Prof SORICE Master STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Dott.ssa Vitaliana De Sanctis “Una delle funzioni del metodo statistico è sottolineare che non si possono trarre conclusioni precise da dati inadeguati” “ E’ deprimente vedere quanto buon lavoro fatto nel campo delle scienze biologiche rischi di andare sprecato per l’incompetenza nell’analisi dei risultati numerici” CENNI STORICI 1600 “aritmetica politica”: semplici indagini negli archivi parrocchiali che si potrebbero considerare i primi esempi di statistica demografica 1650 primi lavori significativi con osservazioni già di un certo interesse ( numerosità della popolazione di Londra, rapporto maschi/femmine nelle nascite,ecc.) successivamente l’attenzione si è spostata verso gli aspetti più disparati della vita, dalla stima di mortalità alla descrizione delle cose dello stato (da cui anche il termine statistica) CENNI STORICI alla descrizione dei dati comincia ad essere associata una valutazione probabilistica al cui sviluppo ha contribuito la divulgazione nell’ottocento dei concetti di “variabilità biologica” e di uomo medio nella prima metà del XX secolo si assiste ad un fiorire di teorie e tecniche fondamentali per l’analisi e il confronto tra gruppi di dati, in associazione a criteri di generalizzazione dei risultati l’introduzione dei computer, essenziali per l’elaborazione di grandi masse di dati, ha contribuito in modo determinante allo sviluppo della statistica attuale, con la formulazione di tecniche avanzate di analisi applicabili anche in campo biomedico La statistica moderna è chiamata in causa nei campi più svariati, dalla politica alla religione, dall’economia alla metereologia, dallo sport ai problemi ambientali in campo medico-sanitario, la statistica contribuisce alle ricerche mirate all’approfondimento delle conoscenze che riguardano sia le patologie (diffusione, diagnosi), sia gli aspetti collegati al decorso e alla terapia della malattia (prognosi, trattamento, assistenza) Statistica applicata alla ricerca scientifica Statistica applicata alla conoscenza delle distribuzioni territoriali e dell’andamento temporale delle patologie (epidemiologia) Statistica applicata ai servizi sociali e alla programmazione sanitaria (statistica sanitaria) PROGRAMMAZIONE DI UNA RICERCA Scopo di una indagine è l’approfondimento delle conoscenze di un fenomeno in tempi e a costi contenuti. allo scopo di approfondire le conoscenze, in una ricerca si seguono due vie logiche teoria (o ipotesi) deduzione (programmazione della ricerca) Induzione (inferenza statistica) dati sperimentali deduzione: si formula una teoria, quindi si cerca di verificarla con i dati induzione:partendo dai dati, si cerca di giungere alla formulazione di una legge o di una regola PROGRAMMAZIONE DI UNA RICERCA logica deduttiva: permette di predisporre un procedimento per la programmazione e la produzione di dati sui quali verificare la validità delle ipotesi formulate logica induttiva: è l’espressione di un tipico approccio statistico il cui scopo è quello di: •confermare sulla base dei dati sperimentali, ipotesi iniziali trasformandole, in caso di riscontro positivo, in leggi o regole •stimare, sulla base delle osservazioni, un valore incognito di qualche variabile •estrapolare eventuali informazioni utili per formulare nuove ipotesi UNA RICERCA COMPLETA E’ LA RISULTANTE DI UNA ALTERNANZA TRA I DUE MOMENTI DI PROCEDURA LOGICA PROGRAMMAZIONE DI UNA RICERCA i metodi statistici impiegati variano a seconda delle finalità da perseguire il livello descrittivo presenta le osservazioni compiute su tutta una popolazione oppure su una parte di essa il livello comparativo propone confronti tra i valori osservati in gruppi o situazioni diverse il livello speculativo, partendo dalle informazioni dei precedenti livelli, approfondisce lo studio dei fenomeni PROGRAMMAZIONE DI UNA RICERCA il livello descrittivo presenta le osservazioni compiute su tutta una popolazione oppure su una parte di essa Le indicazioni ricavate sono del tipo: •numerosità delle osservazioni •tendenza centrale dei dati •variabilità dei dati forniscono un’idea del fenomeno collettivo osservato, e la semplice descrizione del fenomeno costituisce l’obiettivo della ricerca non sempre il livello descrittivo è sufficiente per fornire informazioni utili a perseguirne lo scopo ESEMPI DI QUESITI CON RISPOSTA DI TIPO DESCRITTIVO • • • di interesse epidemiologico quante persone si ammalano mediamente in un anno? quanti sono i morti a causa della patologia degenerativa in esame? di interesse medico-diagnostico quali sono i sintomi che permettono una tempestiva diagnosi per una data patologia? qual’è la capacità di un test diagnostico di identificare correttamente i soggetti patologici? di interesse assistenziale qual’è la durata media dei ricoveri in un reparto ospedaliero? che percentuale di pazienti sviluppa un’infezione dopo un intervento operatorio? PROGRAMMAZIONE DI UNA RICERCA il livello comparativo propone confronti tra i valori osservati in gruppi o situazioni diverse Questo tipo di indagine permette di rispondere a domande più articolate in cui viene introdotto il confronto tra i valori o tra le modalità che la variabile studiata assume in diversi gruppi di Soggetti o in situazioni diverse ESEMPI DI QUESITI CON RISPOSTA DI TIPO COMPARATIVO • quale tra i farmaci A e B risulta più efficace per un dato tipo di malattia? • in quale stagione dell’anno si registra il più elevato numero di casi di infarto? • in un dato ospedale, è più soggetto a incidenti il personale tecnico o il personale paramedico? PROGRAMMAZIONE DI UNA RICERCA il livello speculativo, partendo dalle informazioni dei precedenti livelli, approfondisce lo studio dei fenomeni al fine di individuare nell’andamento, nei confronti, nell’integrazione di tutte le informazioni, sia quantitative che qualitative, eventuali RAPPORTI di dipendenza, indipendenza, causa-effetto, incidenza, delle variabili considerate. Indagini più sofisticate prendono in considerazione anche contemporaneamente più variabili (analisi multivariate) ESEMPI DI QUESITI CON RISPOSTA DI TIPO SPECULATIVO • una data patologia colpisce prevalentemente una certa fascia di età o un determinato sesso? • la periodicità dei controlli della pressione arteriosa dipende dal grado di istruzione del soggetto? • esiste una relazione tra inquinamento ambientale, fumo e tumore ai polmoni? PROGRAMMAZIONE DI UNA RICERCA In base alla sua finalità una ricerca si potrebbe anche distinguere studi osservazionali: mirati a definire una situazione ed eventualmente giustificarla. La statistica descrittiva e la maggior parte delle ricerche epidemiologiche appartengono a questo tipo di studi studi sperimentali: indirizzati a verificare gli effetti di un “trattamento” su una o più variabili. la “statistica inferenziale” si basa fondamentalmente su questo tipo di indagini. METODOLOGIA STATISTICA APPLICATA ALLA RICERCA La statistica fornisce all’operatore sanitario e al paziente una alternativa di notevole interesse nella valutazione di parametri e di fenomeni medico-sanitari, affidata altrimenti soltanto all’esperienza soggettiva del medico alla memoria di manifestazioni patologiche nella popolazione all’autoconoscenza del paziente l’insieme delle fasi operative e delle tecniche statistiche impiegate in un progetto di ricerca costituisce il metodo statistico obsoleta la concezione della statistica intesa come una semplice applicazione di formule matematiche METODOLOGIA STATISTICA APPLICATA ALLA RICERCA • metodo statistico comprende un complesso di interventi per i quali, in considerazione della rapida evoluzione delle conoscenze scientifiche e delle crescenti esigenze, occorrono sovente delle soluzioni originali la cui parte matematica rappresenta solo uno degli aspetti risolutivi • le conclusioni a cui si perviene attraverso l’elaborazione dei dati non sempre autorizzano a dare risposte SICURE a domande specifiche • mettono tuttavia in condizione di chiarire determinati problemi, di sollevare nuovi quesiti ed eventualmente di verificare in modo probabilistico ipotesi o regole in grado di rappresentare i fenomeni studiati, con l’obiettivo di ottenere risultati soddisfacenti, riducendo il più possibile il rischio di valutazioni e interpretazioni erronee METODOLOGIA STATISTICA APPLICATA ALLA RICERCA • possibilità di organizzare la raccolta dei dati e predisporre un insieme di tecniche idonee a evidenziare l’influenza di singoli fattori sulla variabilità osservata e sue eventuali interazioni indirette (programmazione degli esperimenti) • possibilità di raccogliere informazioni sull’intera popolazione partendo da un numero limitato di informazioni (teoria del campionamento) • possibilità di decidere l’appartenenza di un campione a una data popolazione di partenza quando può teoricamente provenire da più popolazioni (teoria delle decisioni) METODOLOGIA STATISTICA APPLICATA ALLA RICERCA • la metodologia statistica inizia con la pianificazione della ricerca – identificazione delle variabili di interesse e della popolazione statistica di riferimento – numero e selezione delle unità statistiche • procede con la valutazione del modo migliore di rilevare, raccogliere, controllare, organizzare ed elaborare i dati in base agli scopi prefissati • si occupa infine della descrizione sintetica del fenomeno studiato e contribuisce alla interpretazione e alla presentazione dei risultati FASI DI UNA RICERCA pianificazione definito il fenomeno da indagare e i quesiti a cui dare risposta, occorre individuare la popolazione statistica a cui fare riferimento ( per semplicità , spesso si ricorre a un campione della popolazione) e le unità statistiche su cui rilevare i dati rilevazione e controllo dei dati le tecniche di rilevamento (misure, dati di laboratorio, schede, questionari) devono risultare omogenee e i dati il più possibile chiari ed esaurienti. E’ fondamentale un controllo dei dati (un errore commesso in queste prime fasi viene ingigantito nelle fasi successive) FASI DI UNA RICERCA organizzazione dei dati E’ consigliabile l’aggregazione dei dati grezzi originali, in base alle modalità o ai valori osservati, per organizzare tabelle che evidenzino la frequenza con cui ciascuna modalità o valore si è manifestato. le tabelle possono essere più o meno complesse a seconda del numero delle variabili considerate le frequenze possono essere presentate come assolute, relative e percentuali organizzazione dei dati quando la variabile è quantitativa, si possono organizzare distribuzioni in classi: si suddivide l’intervallo di variazione in intervalli più piccoli, o classi di frequenza che comprendono al loro interno (intervalli di classi) valori raggruppati ogni classe si considera rappresentata dal valore centrale, mentre il minimo e il massimo valore da inserire nella classe sono i confini della classe.Con i medesimi dati si possono ottenere distribuzioni diverse variando i criteri utilizzati nell’organizzazione l’insieme dei dati raggruppati in tabelle costituisce una serie statistica (se i dati sono qualitativi) o una seriazione statistica (se sono dati quantitativi). tali serie possono essere temporali, cicliche o spaziali. FASI DI UNA RICERCA elaborazione dei dati Consiste nell’applicazione delle tecniche di calcolo corrette per ottenere dai dati le informazioni utili per raggiungere gli scopi della ricerca sintesi e rappresentazione dei dati E’ il complesso delle tecniche che permette di rappresentare una mole di dati in modo sintetico e mediante grafici esplicativi Interpretazione e presentazione dei risultati Verifica la plausibilità dell’ipotesi iniziale, cerca giustificazione per quanto riscontrato e procede a una loro divulgazione