Università degli Studi di Palermo Insegnamento di “Statistica Medica” per la Facoltà di Medicina e Chirurgia a.a. 2011/2012 (3 cfu) Docente Dott.ssa Filippa Bono 1 Etimologia della parola “Statistica” Deriva dal vocabolo Italiano STATO Ghislini (1589): “la Statistica è la descrizione delle qualità che caratterizzano e degli elementi che compongono uno Stato 2 Le due anime della Statistica Risposta a un’esigenza conoscitiva Raccolta, Organizzazione e diffusione di dati statistici Constatazione che la realtà è variabile ma vi sono risultati che meritano più fiducia di altri perché si ripetono con maggiore regolarità Studio dell’incertezza come fattore immanente nella scienza, nella tecnica, nelle attività umane 3 Definizioni La Statistica ha come scopo la conoscenza quantitativa dei fenomeni collettivi. “La statistica è la disciplina che elabora i principi e le metodologie che presiedono alla rilevazione e alla raccolta dei dati, alla rappresentazione sintetica e all’interpretazione dei dati stessi e, laddove ve ne siano le condizioni, alla generalizzazione delle evidenze osservate” (Cicchitelli) E’ una scienza probabilistica. L’analisi statistica dei dati conduce a risultati che non sono certi ma sono molto vicini alla realtà, con un’approssimazione che si può calcolare. 4 Statistica Statistica metodologica Statistica economica Statistica sociale Statistica medica 5 Obiettivi del corso Introdurre le basi della metodologia statistica, indirizzando la conoscenza delle tecniche utilizzate ai problemi che si incontrano più frequentemente in ambito medico-sanitario Sarà illustrata la metodologia statistica descrittiva per il trattamento e l’elaborazione statistica dei dati, per giungere a svolgere autonomamente analisi statistiche descrittive e saper interpretare i risultati ottenuti. Saranno introdotti la teoria della probabilità, il campionamento statistico e gli aspetti relativi alla statistica inferenziale con applicazioni all’ambito medico-sanitario. 6 Di che cosa si occupa la statistica medica? 1. Misurare l’efficacia di nuovi test, procedure e terapie 2. Individuare categorie di pazienti che possono trarre il maggior giovamento da una terapia, evitando di sottoporre i pazienti non idonei a potenti farmaci e a pesanti effetti collaterali 3. Valutazione di efficienza ed efficacia dei servizi sanitari: Efficacia attesa: Capacità potenziale di un intervento di modificare in modo favorevole le condizioni di salute dei pazienti cui è rivolto quando viene applicato in modo ottimale Efficacia osservata: Risultati ottenuti dall’applicazione di routine dell’intervento Efficienza: Capacità di raggiungere risultati in termini di salute con il minimo impiego di risorse 4. Fornire gli strumenti necessari per l’uso della letteratura scientifica nella medicina clinica (Evidencebased medicine) 7 A cosa servono i metodi della biostatistica - Prima che un nuovo farmaco possa essere commercializzato la casa farmaceutica richiede che venga sottoposta a un clinical trial: uno studio sperimentale condotto sull’uomo L’obiettivo è quello di verificare l’efficacia del farmaco e gli effetti collaterali - Le decisioni del governo degli Stati Uniti sono in parte basate sulle previsioni relative alla longevità della popolazione -Dove investire le risorse pubbliche per ridurre la mortalità infantile? -Quali fattori aumentano in un soggetto la probabilità di sviluppare malattie coronariche? 8 Libri di testo Biostatistica di M. Pagano, K. Gauvreau, II Ed. italiana a cura di I.F. Angelillo, M. Pavia, P. Villari, Ed. IDELSON-GNOCCHI oppure Biostatistica di Wayne W. Daniel, Edises edizione 2010 9 Statistica descrittiva e inferenza La statistica descrittiva fornisce gli strumenti per sintetizzare ed esplicitare in forma corretta il modo in cui il fenomeno si è manifestato nel collettivo osservato Mediante l’inferenza statistica è possibile misurare e controllare l’attendibilità delle informazioni provenienti da un campione estrazione del campione 10/1 Carattere statistico Carattere statistico: è la caratteristica con cui si presenta un’unità nel collettivo di riferimento. Es. unità statistica=paziente: età, sesso, colesterolo sierico, tipo di terapia. In genere, su un determinato collettivo si osservano più caratteri che possono essere studiati singolarmente o in modo congiunto (studio delle relazioni) 11 Modalità di un carattere Ciascun carattere statistico si articola in “modalità” qualitative e quantitative, che sono i modi in cui un carattere si presenta nelle unità del collettivo. La modalità qualitativa è espressa in termini nominali, categorie, attributi. La modalità quantitativa è espressa da numeri. Es. sesso: maschio, femmina titolo studio: senza titolo, scuola elementare, scuola media inferiore,… Gruppo sanguigno: A, B, 0 Spesa sanitaria Colesterolo sierico, glicemia, statura, diametro della lesione in mm 12 Un esempio di dati osservati Nome Età Sesso Titolo di Attività studio Peso (kg) Punteggio esercizi Rossi M. 32 M laurea occupato 72 65 Bianchi G. 39 F laurea occupato 55 55 Nicoletti C. 46 M diploma disoccupato 79 53 Marcelli F. 28 M diploma studente 63 78 Petrone A. 51 F diploma casalinga 64 21 13 CLASSIFICAZIONE DEI CARATTERI STATISTICI Caratteri qualitativi o sconnessi Caratteri semiquantitativi Caratteri quantitativi Dicotomici Ordinali rettilinei Discreti Policotomici Ordinali ciclici Continui 14 Rilevazioni: Sperimentali/osservazionali Sperimentali (Medicina, Fisica, Chimica) 1. Ipotesi di lavoro 2. Possibilità di controllo Osservazionali (Indagini di mercato, sondaggi) Non si ha la possibilità di controllc Controllo Diretto dei Fattori Sperimentali e dei Fattori di Stratificazione Indiretto: Randomizzazione Indagine Statistica 15 Indagine statistica Indagine Totale Indagine Campionaria Fasi dell’indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione della popolazione e della lista delle unità statistiche definizione del piano di campionamento raccolta dei dati scelta della tecnica di rilevazione formulazione del questionario e pretest rilevazione sul campo registrazione dei dati registrazione su supporto magnetico 16 controllo e correzione elaborazione e analisi dei dati La rilevazione dei dati La raccolta delle informazioni può essere completa oppure parziale. È completa quando si esa-minano tutte le unità statistiche che compongono la popolazione oggetto di studio. È parziale quando ci si limita a studiare un sottoinsieme, detto “campione” dell’insieme di riferimento. Pregi: Accuratezza delle stime anche a livelli territoriali molto spinti Ricchezza delle informazioni raccolte Esaustività Pregi: Continuità della rilevazione Economicità Indagini più mirate e approfondite Difetti: Costo elevato Tempi di elaborazione dei dati molto lunghi Qualità dei dati non elevata 17/1 Difetti: Riferimento territoriale non spinto Variabilità campionaria CARATTERE QUANTITATIVO O VARIABILE Continuo: è un carattere le cui modalità possono assumere, in linea di principio, qualsiasi valore contenuto in un intervallo reale. Discreto: è un carattere le cui modalità possono essere poste in corrispondenza con l’insieme dei numeri naturali {1, 2,3,..} o un suo sottinsieme proprio. Per i caratteri quantitativi possono prendersi come modalità delle classi 18 DIVISIONE IN CLASSI DI UN CARATTERE CONTINUO 1. Si individuano il minimo e il massimo dei nostri dati 2. Si sceglie un adeguato numero di classi (si può usare la formula di Sturges k=1+3.322*log10 (n), dove n è la numerosità del data-set) 3. Si calcola il range= massimo-minimo 4. Si determina l’ampiezza della classe a=Range/k. 5. La prima classe avrà estremi [minimo;minimo+a] 19 Esercizio: Determinare la distribuzione di frequenza in 5 classi di uguale ampiezza e costruire il grafico score 0.30 0.45 0.25 0.60 0.20 0.10 0.05 0.70 0.20 0.10 0.05 0.55 0.20 0.80 range= a= inferiore superiore frequenze 0.05 0.2 7 0.2 0.35 2 0.35 0.5 1 0.5 0.65 2 0.65 0.8 2 14 classi frequenze ≤0.2 7 0.2-|0.35 2 0.35-|0.5 1 0.5-|0.65 2 0.65-|0.80 2 0.75 0.150 20 MISURAZIONE DEI CARATTERI STATISTICI Carattere Esempi Qualitativo sconnesso sesso, guarigione (SI/NO), causa di morte Qualitativo Ordinato rettilineo Anno di nascita, anno di corso, sintomatologia, qualità di un’immagine Qualitativo Ordinato ciclico Giorno della settimana, mese dell’anno Quantitativo discreto Numero di figli, numero di carie, numero di aborti, numero di noduli di una lesione cancerosa Quantitativo continuo Peso, statura, colesterolo, glicemia 21 Classificazione dei caratteri rispetto al livello di misurazione 1) Nominale o classificatoria 2) ordinale o per ranghi 3) ad intervalli Aumentano le proprietà di misura sulla scala 4) di rapporti 22 Scala nominale Scala nominale: quei caratteri qualitativi le cui modalità non presentano un ordine di successione e senza nessuna relazione quantitativa. TIPO DI DIETA Ipoproteica Iposodica Ipolipidica Ipoglucidica Ipocalorica Esiste solo una sola relazione: l’identità Operazione ammessa il conteggio (es.: numero di pazienti che guariscono) 23 Scala ordinale Scala ordinale: quei caratteri qualitativi le cui modalità presentano un ordine di successione ma non una grandezza. Lettura di un'ecografia da parte di un osservatore Assolutamente benigno Benigno Normale Maligno Assolutamente maligno Classificazione BI-RADS 24 Ordinale o per ranghi Non solo uguaglianza o diversità ma anche... gradazione tra le classi o tra individui di classi differenti Relazione d’ordine è asimmetrica e transitiva limite In una scala ordinale, non è possibile quantificare le differenze di intensità tra le osservazioni. 25 Scala a intervalli Scala a intervalli: rappresentata da caratteri quantitativi le cui modalità sono espresse da numeri e consentono dunque di misurare la distanza tra esse. Non hanno uno zero assoluto, naturale e non arbitrario. QI (quoziente intelligenza) A 25 B 50 B-A 25 B è più intelligente di A, ma non posso fare il rapporto e dire che B è il doppio intelligente di A (50:25=2) Il rapporto tra le distanze su una scala è uguale al 26 rapporto tra le distanze su un’altra scala (es. Scala Celsius o Fahrenheit) Scala di rapporti Scala di rapporti: rappresentata da caratteri quantitativi le cui modalità sono metriche, consentendo il calcolo di rapporti tra le unità rispetto ai valori del carattere Esiste uno zero assoluto, naturale e non arbitrario Età Classi di spesa sanitaria Meno di 5 Meno di 4 (mila euro) 6-10 4|-10 11-20 10|-25 21-40 41-70 Oltre 70 25|-50 50|-100 100 e oltre La scala Kelvin è scala di rapporti! Il rapporto tra le misurazioni su una scala è uguale al 27 rapporto tra le misurazioni su un’altra scala (es. Scala Kilogrammi e Libbre Scalogramma di Guttmann Identità Ordinamento Differenze Rapporti Nominale Ordinale Intervallo Rapporti + + + + + + + + + + 28 Rappresentare le variabili in un foglio excel ID studente Sesso Anno di nascita Anno di immatricolazione Esami completati Voto medio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Variabile discreta Scala nominale Scala ordinale Scala ordinale Variabile continua 29