Università degli Studi di Palermo Insegnamento di “Statistica Medica” per la Facoltà di Medicina e Chirurgia a.a. 2011/2012 (3 cfu) Docente Dott.ssa Domenica Matranga Etimologia della parola “Statistica” Deriva dal vocabolo Italiano STATO Ghislini (1589): “la Statistica è la descrizione delle qualità che caratterizzano e degli elementi che compongono uno Stato Le due anime della Statistica Risposta a un’esigenza conoscitiva Raccolta, Organizzazione e diffusione di dati statistici Constatazione che la realtà è variabile ma vi sono risultati che meritano più fiducia di altri perché si ripetono con maggiore regolarità Studio dell’incertezza come fattore immanente nella scienza, nella tecnica, nelle attività umane Definizioni La Statistica è la disciplina che studia i fenomeni collettivi con metodi quantitativi. “La statistica è la disciplina che elabora i principi e le metodologie che presiedono alla rilevazione e alla raccolta dei dati, alla rappresentazione sintetica e all’interpretazione dei dati stessi e, laddove ve ne siano le condizioni, alla generalizzazione delle evidenze osservate” (Cicchitelli) E’ una scienza probabilistica. L’analisi statistica dei dati conduce a risultati che non sono certi ma sono molto vicini alla realtà, con un’approssimazione che si può calcolare. Statistica Statistica metodologica Statistica economica Statistica sociale Statistica medica Obiettivi del corso Introdurre le basi della metodologia statistica, indirizzando la conoscenza delle tecniche utilizzate ai problemi che si incontrano più frequentemente in ambito medico-sanitario Sarà illustrata la metodologia statistica descrittiva per il trattamento e l’elaborazione statistica dei dati, per giungere a svolgere autonomamente analisi statistiche descrittive e saper interpretare i risultati ottenuti. Saranno introdotti la teoria della probabilità, il campionamento statistico e gli aspetti relativi alla statistica inferenziale con applicazioni all’ambito medico-sanitario. Di che cosa si occupa la statistica medica? 1. Misurare l’efficacia di nuovi test, procedure e terapie 2. Individuare categorie di pazienti che possono trarre il maggior giovamento da una terapia, evitando di sottoporre i pazienti non idonei a potenti farmaci e a pesanti effetti collaterali 3. Valutazione di efficienza ed efficacia dei servizi sanitari: Efficacia attesa: Capacità potenziale di un intervento di modificare in modo favorevole le condizioni di salute dei pazienti cui è rivolto quando viene applicato in modo ottimale Efficacia osservata: Risultati ottenuti dall’applicazione di routine dell’intervento Efficienza: Capacità di raggiungere risultati in termine di salute con il minimo impiego di risorse 4. Fornire gli strumenti necessari per l’uso della letteratura scientifica nella medicina clinica (Evidencebased medicine) Statistica Descrittiva Inferenziale La rilevazione dei dati È completa quando si esa-minano tutte le unità statistiche che compongono la popolazione oggetto di studio. Pregi: Accuratezza delle stime anche a livelli territoriali molto spinti Ricchezza delle informazioni raccolte Esaustività Difetti: Costo elevato Tempi di elaborazione dei dati molto lunghi Qualità dei dati non elevata È parziale quando ci si limita a studiare un sottoinsieme, detto “campione” dell’insieme di riferimento. Pregi: Continuità della rilevazione Economicità Indagini più mirate e approfondite Difetti: Riferimento territoriale non spinto Variabilità campionaria Contenuti del corso ¾ Introduzione: concetti, definizioni. Unità statistiche e collettivi; ¾ Statistica descrittiva: − scale di misura − distribuzioni di frequenza − rappresentazioni grafiche − valori medi − misure di variabilità ¾ Statistica inferenziale: − Probabilità − Distribuzioni notevoli − Stima statistica − Verifica delle ipotesi statistiche − Cenni sulla relazione tra variabili qualitative Libri di testo Biostatistica di M. Pagano, K. Gauvreau, II Ed. italiana a cura di I.F. Angelillo, M. Pavia, P. Villari, Ed. IDELSON-GNOCCHI oppure Biostatistica di Wayne W. Daniel, Edises Concetti elementari Collettivo statistico o popolazione: un insieme di unità statistiche sulle quali si rilevano uno o più caratteri. Es. Popolazione residente in un comune Tutti i pazienti di un reparto Unità statistica: è l’elemento della popolazione Es. ciascun individuo di una popolazione, ciascun nato, ciascuna azienda ospedaliera Popolazione finita: è costituita da un numero finito di unità statistiche Popolazione infinita: è costituita da un numero illimitato di unità statistiche (es.numero di pezzi prodotti in una fabbrica a ciclo continuo, lanci di una moneta in un problema di prove ripetute) Carattere statistico Carattere statistico: è la caratteristica con cui si presenta un’unità nel collettivo di riferimento. Es. unità statistica= paziente carattere statistico= età, sesso, colesterolo sierico, tipo di terapia. In genere, su un determinato collettivo si osservano più caratteri che possono essere studiati singolarmente o in modo congiunto (studio delle relazioni) Modalità di un carattere Ciascun carattere statistico si articola in “modalità” qualitative e quantitative, che sono i modi in cui un carattere si presenta nelle unità del collettivo. La modalità qualitativa è espressa in termini nominali, categorie, attributi. La modalità quantitativa è espressa da numeri. Es. sesso: maschio, femmina titolo studio: senza titolo, scuola elementare, scuola media inferiore,… Gruppo sanguigno: A, B, 0 Spesa sanitaria Colesterolo sierico, glicemia, statura, diametro della lesione in mm CLASSIFICAZIONE DEI CARATTERI STATISTICI Caratteri qualitativi o sconnessi Caratteri semiquantitativi Caratteri quantitativi Dicotomici Ordinali rettilinei Discreti Policotomici Ordinali ciclici Continui CARATTERE QUALITATIVO O MUTABILE Misurare un carattere qualitativo consiste nell’osservare e nel registrare le modalità che esso presenta nelle unità statistiche. Per determinare le modalità di un carattere qualitativo occorre costruire una scala di riferimento, composta da nomi o espressioni lessicali. CARATTERE QUALITATIVO O MUTABILE Sconnesso Ordinato Le modalità non hanno nessun legame, si possono confrontare soltanto per vedere se sono uguali o diverse. Rettilineo: ha una “prima” e un’”ultima” modalità (es. Grado della gerarchia militare, ceto sociale,anno di corso) Ciclico: le modalità del carattere sono frutto di una convenzione (es. giorno della settimana) CARATTERE QUANTITATIVO O VARIABILE Continuo: è un carattere le cui modalità possono assumere, in linea di principio, qualsiasi valore contenuto in un intervallo reale. Discreto: è un carattere le cui modalità possono essere poste in corrispondenza con l’insieme dei numeri naturali {1, 2,3,..} o un suo sottinsieme proprio. Per i caratteri quantitativi possono prendersi come modalità delle classi DIVISIONE IN CLASSI DI UN CARATTERE CONTINUO n. di classi adeguato al problema classi disgiunte no classi vuote includere tutte le modalità del carattere intervalli aperti a destra o a sinistra quale ampiezza delle classi? DIVISIONE IN CLASSI DI UN CARATTERE CONTINUO 1. Si individuano il minimo e il massimo dei nostri dati 2. Si sceglie un adeguato numero di classi (si può usare la formula di Sturges k=1+3.322*log10 (n), dove n è la numerosità del data-set) 3. Si calcola il range= massimo-minimo 4. Si determina l’ampiezza della classe a=Range/k. 5. La prima classe avrà estremi [minimo;minimo+a] Esercizio: Determinare la distribuzione di frequenza in 5 classi di uguale ampiezza e costruire il grafico inferiore superiore frequenze 0.05 0.2 7 0.2 0.35 2 0.35 0.5 1 0.5 0.65 2 0.65 0.8 2 14 score 0.30 0.45 0.25 0.60 0.20 0.10 0.05 0.70 0.20 0.10 0.05 0.55 0.20 0.80 range= a= 0.75 0.150 classi frequenze ≤0.2 7 0.2-|0.35 2 0.35-|0.5 1 0.5-|0.65 2 0.65-|0.80 2 RICAPITOLANDO: MISURAZIONE DEI CARATTERI STATISTICI Carattere Esempi Qualitativo sconnesso sesso, guarigione (SI/NO), causa di morte Qualitativo Ordinato rettilineo Anno di nascita, anno di corso, sintomatologia, qualità di un’immagine Qualitativo Ordinato ciclico Giorno della settimana, mese dell’anno Quantitativo discreto Numero di figli, numero di carie, numero di aborti, numero di noduli di una lesione cancerosa Quantitativo continuo Peso, statura, colesterolo, glicemia Classificazione dei caratteri rispetto al livello di misurazione 1) Nominale o classificatoria 2) ordinale o per ranghi 3) ad intervalli 4) di rapporti Aumentano le proprietà di misura sulla scala Scala nominale Scala nominale: quei caratteri qualitativi le cui modalità non presentano un ordine di successione e senza nessuna relazione quantitativa. TIPO DI DIETA Ipoproteica Iposodica Ipolipidica Ipoglucidica Ipocalorica Esiste solo una sola relazione: l’identità Operazione ammessa il conteggio (es.: numero di pazienti che guariscono) Scala ordinale Scala ordinale: quei caratteri qualitativi le cui modalità presentano un ordine di successione ma non una grandezza. Lettura di un'ecografia da parte di un osservatore Assolutamente benigno Benigno Normale Maligno Assolutamente maligno Classificazione BI-RADS Ordinale o per ranghi Non solo uguaglianza o diversità ma anche... gradazione tra le classi o tra individui di classi differenti Relazione d’ordine è asimmetrica e transitiva limite In una scala ordinale, non è possibile quantificare le differenze di intensità tra le osservazioni. Scala a intervalli Scala a intervalli: rappresentata da caratteri quantitativi le cui modalità sono espresse da numeri e consentono dunque di misurare la distanza tra esse. Non hanno uno zero assoluto, naturale e non arbitrario. QI (quoziente intelligenza) A 25 B 50 B-A 25 B è più intelligente di A, ma non posso fare il rapporto e dire che B è il doppio intelligente di A (50:25=2) Il rapporto tra le distanze su una scala è uguale al rapporto tra le distanze su un’altra scala (es. Scala Celsius o Fahrenheit) Scala di rapporti Scala di rapporti: rappresentata da caratteri quantitativi le cui modalità sono metriche, consentendo il calcolo di rapporti tra le unità rispetto ai valori del carattere Esiste uno zero assoluto, naturale e non arbitrario Età Classi di spesa sanitaria Meno di 5 Meno di 4 (mila euro) 6-10 4|-10 11-20 10|-25 21-40 41-70 Oltre 70 25|-50 50|-100 100 e oltre La scala Kelvin è scala di rapporti! Il rapporto tra le misurazioni su una scala è uguale al rapporto tra le misurazioni su un’altra scala (es. Scala Kilogrammi e Libbre Scalogramma di Guttmann Identità Ordinamento Differenze Rapporti Nominale Ordinale Intervallo Rapporti + + + + + + + + + + Rappresentare le variabili in un foglio excel Codice studenSesso Anno di 1M 2F 3F 4F 5M 6F 7F 8F 9M 10 F 11 M 12 F 13 M 14 F 15 M 16 F 17 M 18 M 19 M 20 M Scala nominale nascitAnno di 1973 1974 1978 1976 1975 1972 1970 1975 1970 1976 1970 1971 1970 1974 1972 1973 1977 1972 1970 1970 Scala ordinale imma N° Esami 1999 1999 1995 1998 1997 1997 1994 1996 1994 1998 1994 1995 1995 1995 1994 1995 1998 1997 1995 1994 18 20 25 23 27 18 21 21 25 19 22 26 17 19 28 17 17 26 25 18 Voto medio 26.0 25.3 28.1 22.2 25.4 23.6 22.6 29.5 21.3 18.9 28.3 27.0 21.0 22.8 23.4 22.4 24.3 25.2 23.6 22.3 Variabile discreta Scala ordinale Variabile continua