UNIVERSITA’ DEGLI STUDI DI ROMA “LA SAPIENZA”
Polo didattico di Rieti
Prof SORICE
Master
STATISTICA PER LA RICERCA
SPERIMENTALE E TECNOLOGICA
Dott.ssa Vitaliana De Sanctis
“Una delle funzioni del metodo statistico è
sottolineare
che non si possono trarre
conclusioni precise da dati inadeguati”
“ E’ deprimente vedere quanto buon lavoro fatto
nel campo delle scienze biologiche rischi di andare
sprecato per
l’incompetenza nell’analisi
dei risultati numerici”
CENNI STORICI
1600
“aritmetica politica”: semplici indagini negli archivi
parrocchiali che si potrebbero considerare i primi
esempi di statistica demografica
1650
primi lavori significativi con osservazioni
già di un certo interesse ( numerosità della
popolazione di Londra, rapporto maschi/femmine
nelle nascite,ecc.)
successivamente l’attenzione si è spostata verso gli aspetti
più disparati della vita, dalla stima di mortalità alla
descrizione delle cose dello stato (da cui anche il termine statistica)
CENNI STORICI
alla descrizione dei dati comincia ad essere associata una
valutazione probabilistica al cui sviluppo ha contribuito la
divulgazione nell’ottocento dei concetti di “variabilità biologica”
e di uomo medio
nella prima metà del XX secolo si assiste ad un fiorire di teorie
e tecniche fondamentali per l’analisi e il confronto tra gruppi
di dati, in associazione a criteri di generalizzazione dei risultati
l’introduzione dei computer, essenziali per l’elaborazione di grandi
masse di dati, ha contribuito in modo determinante allo sviluppo
della statistica attuale, con la formulazione di tecniche avanzate
di analisi applicabili anche in campo biomedico
La statistica moderna è chiamata in causa nei campi più svariati,
dalla politica alla religione, dall’economia alla metereologia, dallo
sport ai problemi ambientali
in campo medico-sanitario, la statistica contribuisce alle ricerche
mirate all’approfondimento delle conoscenze che riguardano sia le
patologie (diffusione, diagnosi), sia gli aspetti collegati al decorso
e alla terapia della malattia (prognosi, trattamento, assistenza)
Statistica applicata alla ricerca scientifica
Statistica applicata alla conoscenza delle distribuzioni territoriali
e dell’andamento temporale delle patologie (epidemiologia)
Statistica applicata ai servizi sociali e alla programmazione
sanitaria (statistica sanitaria)
PROGRAMMAZIONE DI UNA RICERCA
Scopo di una indagine è l’approfondimento delle conoscenze
di un fenomeno in tempi e a costi contenuti.
allo scopo di approfondire le conoscenze, in una ricerca si seguono
due vie logiche
teoria (o ipotesi)
deduzione
(programmazione
della ricerca)
Induzione
(inferenza
statistica)
dati sperimentali
deduzione: si formula una teoria, quindi si cerca di verificarla
con i dati
induzione:partendo dai dati, si cerca di giungere alla formulazione
di una legge o di una regola
PROGRAMMAZIONE DI UNA RICERCA
logica deduttiva: permette di predisporre un procedimento per la
programmazione e la produzione di dati sui quali verificare la
validità delle ipotesi formulate
logica induttiva: è l’espressione di un tipico approccio statistico
il cui scopo è quello di:
•confermare sulla base dei dati sperimentali, ipotesi iniziali
trasformandole, in caso di riscontro positivo, in leggi o regole
•stimare, sulla base delle osservazioni, un valore incognito di
qualche variabile
•estrapolare eventuali informazioni utili per formulare nuove ipotesi
UNA RICERCA COMPLETA E’ LA RISULTANTE DI UNA
ALTERNANZA TRA I DUE MOMENTI DI PROCEDURA LOGICA
PROGRAMMAZIONE DI UNA RICERCA
i metodi statistici impiegati variano a seconda
delle finalità da perseguire
il livello descrittivo presenta le osservazioni compiute su tutta una
popolazione oppure su una parte di essa
il livello comparativo propone confronti tra i valori osservati in
gruppi o situazioni diverse
il livello speculativo, partendo dalle informazioni dei precedenti
livelli, approfondisce lo studio dei fenomeni
PROGRAMMAZIONE DI UNA RICERCA
il livello descrittivo presenta le osservazioni compiute su tutta una
popolazione oppure su una parte di essa
Le indicazioni ricavate sono del tipo:
•numerosità delle osservazioni
•tendenza centrale dei dati
•variabilità dei dati
forniscono un’idea del fenomeno collettivo osservato, e la semplice
descrizione del fenomeno costituisce l’obiettivo della ricerca
non sempre il livello descrittivo è sufficiente per fornire informazioni
utili a perseguirne lo scopo
ESEMPI DI QUESITI CON RISPOSTA DI
TIPO DESCRITTIVO
•
•
•
di interesse epidemiologico
quante persone si ammalano mediamente in un anno?
quanti sono i morti a causa della patologia degenerativa
in esame?
di interesse medico-diagnostico
quali sono i sintomi che permettono una tempestiva
diagnosi per una data patologia?
qual’è la capacità di un test diagnostico di identificare
correttamente i soggetti patologici?
di interesse assistenziale
qual’è la durata media dei ricoveri in un reparto
ospedaliero?
che percentuale di pazienti sviluppa un’infezione dopo un
intervento operatorio?
PROGRAMMAZIONE DI UNA RICERCA
il livello comparativo propone confronti tra i valori osservati in
gruppi o situazioni diverse
Questo tipo di indagine permette di rispondere a domande più
articolate in cui viene introdotto il confronto tra i valori o tra le
modalità che la variabile studiata assume in diversi gruppi di
Soggetti o in situazioni diverse
ESEMPI DI QUESITI CON RISPOSTA DI
TIPO COMPARATIVO
• quale tra i farmaci A e B risulta più
efficace per un dato tipo di malattia?
• in quale stagione dell’anno si registra il
più elevato numero di casi di infarto?
• in un dato ospedale, è più soggetto a
incidenti il personale tecnico o il
personale paramedico?
PROGRAMMAZIONE DI UNA RICERCA
il livello speculativo, partendo dalle informazioni dei precedenti
livelli, approfondisce lo studio dei fenomeni
al fine di individuare nell’andamento, nei confronti, nell’integrazione
di tutte le informazioni, sia quantitative che qualitative, eventuali
RAPPORTI di dipendenza, indipendenza, causa-effetto, incidenza,
delle variabili considerate.
Indagini più sofisticate prendono in considerazione anche
contemporaneamente più variabili (analisi multivariate)
ESEMPI DI QUESITI CON RISPOSTA DI
TIPO SPECULATIVO
• una data patologia colpisce
prevalentemente una certa fascia di età o
un determinato sesso?
• la periodicità dei controlli della pressione
arteriosa dipende dal grado di istruzione
del soggetto?
• esiste una relazione tra inquinamento
ambientale, fumo e tumore ai polmoni?
PROGRAMMAZIONE DI UNA RICERCA
In base alla sua finalità una ricerca si potrebbe anche distinguere
studi osservazionali: mirati a definire una situazione ed
eventualmente giustificarla.
La statistica descrittiva e la maggior parte delle ricerche
epidemiologiche appartengono a questo tipo di studi
studi sperimentali: indirizzati a verificare gli effetti di un
“trattamento” su una o più variabili.
la “statistica inferenziale” si basa fondamentalmente su
questo tipo di indagini.
METODOLOGIA STATISTICA APPLICATA
ALLA RICERCA
La statistica fornisce all’operatore sanitario e al paziente una
alternativa di notevole interesse nella valutazione di parametri
e di fenomeni medico-sanitari, affidata altrimenti soltanto
all’esperienza soggettiva del medico
alla memoria di manifestazioni patologiche nella popolazione
all’autoconoscenza del paziente
l’insieme delle fasi operative e delle tecniche statistiche impiegate
in un progetto di ricerca costituisce il metodo statistico
obsoleta la concezione della statistica intesa come una semplice
applicazione di formule matematiche
METODOLOGIA STATISTICA APPLICATA
ALLA RICERCA
• metodo statistico comprende un complesso di interventi
per i quali, in considerazione della rapida evoluzione
delle conoscenze scientifiche e delle crescenti esigenze,
occorrono sovente delle soluzioni originali la cui parte
matematica rappresenta solo uno degli aspetti risolutivi
• le conclusioni a cui si perviene attraverso
l’elaborazione dei dati non sempre autorizzano a dare
risposte SICURE a domande specifiche
• mettono tuttavia in condizione di chiarire determinati
problemi, di sollevare nuovi quesiti ed eventualmente di
verificare in modo probabilistico ipotesi o regole in
grado di rappresentare i fenomeni studiati, con
l’obiettivo di ottenere risultati soddisfacenti, riducendo
il più possibile il rischio di valutazioni e interpretazioni
erronee
METODOLOGIA STATISTICA APPLICATA
ALLA RICERCA
• possibilità di organizzare la raccolta dei dati e
predisporre un insieme di tecniche idonee a evidenziare
l’influenza di singoli fattori sulla variabilità osservata e
sue eventuali interazioni indirette (programmazione
degli esperimenti)
• possibilità di raccogliere informazioni sull’intera
popolazione partendo da un numero limitato di
informazioni (teoria del campionamento)
• possibilità di decidere l’appartenenza di un campione a
una data popolazione di partenza quando può
teoricamente provenire da più popolazioni (teoria delle
decisioni)
METODOLOGIA STATISTICA APPLICATA
ALLA RICERCA
• la metodologia statistica inizia con la
pianificazione della ricerca
– identificazione delle variabili di interesse e della
popolazione statistica di riferimento
– numero e selezione delle unità statistiche
• procede con la valutazione del modo migliore di
rilevare, raccogliere, controllare, organizzare
ed elaborare i dati in base agli scopi prefissati
• si occupa infine della descrizione sintetica del
fenomeno studiato e contribuisce alla
interpretazione e alla presentazione dei risultati
FASI DI UNA RICERCA
pianificazione
definito il fenomeno da indagare e i quesiti a cui dare risposta,
occorre individuare la popolazione statistica a cui fare riferimento
( per semplicità , spesso si ricorre a un campione della popolazione)
e le unità statistiche su cui rilevare i dati
rilevazione e controllo dei dati
le tecniche di rilevamento (misure, dati di laboratorio, schede,
questionari) devono risultare omogenee e i dati il più possibile
chiari ed esaurienti. E’ fondamentale un controllo dei dati (un errore
commesso in queste prime fasi viene ingigantito nelle fasi successive)
FASI DI UNA RICERCA
organizzazione dei dati
E’ consigliabile l’aggregazione dei dati grezzi originali, in base
alle modalità o ai valori osservati, per organizzare tabelle che
evidenzino la frequenza con cui ciascuna modalità o valore si
è manifestato.
le tabelle possono essere più o meno complesse a seconda del numero
delle variabili considerate
le frequenze possono essere presentate come assolute, relative
e percentuali
organizzazione dei dati
quando la variabile è quantitativa, si possono organizzare
distribuzioni in classi: si suddivide l’intervallo di variazione
in intervalli più piccoli, o classi di frequenza che comprendono al
loro interno (intervalli di classi) valori raggruppati
ogni classe si considera rappresentata dal valore centrale, mentre
il minimo e il massimo valore da inserire nella classe sono i confini
della classe.Con i medesimi dati si possono ottenere distribuzioni
diverse variando i criteri utilizzati nell’organizzazione
l’insieme dei dati raggruppati in tabelle costituisce una serie statistica
(se i dati sono qualitativi) o una seriazione statistica (se sono dati
quantitativi). tali serie possono essere temporali, cicliche o spaziali.
FASI DI UNA RICERCA
elaborazione dei dati
Consiste nell’applicazione delle tecniche di calcolo corrette per
ottenere dai dati le informazioni utili per raggiungere gli scopi
della ricerca
sintesi e rappresentazione dei dati
E’ il complesso delle tecniche che permette di rappresentare
una mole di dati in modo sintetico e mediante grafici esplicativi
Interpretazione e presentazione dei risultati
Verifica la plausibilità dell’ipotesi iniziale, cerca giustificazione per
quanto riscontrato e procede a una loro divulgazione