Master in Neuropsicologia Clinica Elementi di Statistica I Repetita iuvant La statistica studia i fenomeni, le loro caratteristiche, se e come essi variano nel tempo e nello spazio; in alcuni casi può generalizzare il fenomeno osservato su un “ridotto gruppo di elementi” in alcuni casi può fare previsioni Costante Caratteristica che non cambia nelle diverse Osservazioni Variabile Manifestazione, misurabile su una scala predefinita, del fenomeno oggetto di studio o del concetto oggetto di studio Unità Statistica Elemento portatore della/e variabile/i in esame 05 aprile 2008 1/26 Master in Neuropsicologia Clinica Elementi di Statistica I Modalità insieme di stati significativamente distinti tra loro assumibili della variabile in oggetto (esaustivi non sovrapposti) Osservazione Determinazione numerica, o stato, della variabile effettivamente rilevata sulle unità statistiche. Universo (popolazione) Insieme di unità statistiche in studio cui si vogliono riferire i risultati dell’analisi Campione Sottoinsieme di unità statistiche (dette unità campionarie) estratte dalla popolazione. 05 aprile 2008 2/26 Master in Neuropsicologia Clinica Elementi di Statistica I Misurazione stabilire e applicare regole di assegnazione di numeri o etichette a proprietà di oggetti o eventi in modo tale da poter attribuire alcune delle caratteristiche dei numeri alle proprietà stesse (scaling) Classificazione delle variabili 1. Qualitative – le cui modalità sono etichette, categorie… 2. Quantitative – le cui modalità sono espresse da valori o classi di valori numerici 3. Stevens 05 aprile 2008 3/26 Master in Neuropsicologia Clinica Elementi di Statistica I Scala di misura Nominale Tipo di variabile Ordinale Qualitativa Intervalli Rapporti Quantitativa Proprietà Classificazione Ordinamento Esiste unità di misura Relazione tra le distanze/ differenze Zero assoluto Rapporto tra modalità Operazioni =≠ =≠ =≠ (X-Y)/(Z-L) =≠ (X-Y)/(Z-L) X/Y Esempio Genere Grado di Neoplasia Temperatura Pressione °C arteriosa Direzione cumulativa delle proprietà 05 aprile 2008 4/26 Master in Neuropsicologia Clinica Elementi di Statistica I Esempio: Corsa campestre Numero di maglia (basato su assegnazione casuale) 1 3 2 5 4 Numero di maglia: scala nominale 1≠2≠3≠4≠5 05 aprile 2008 5/26 Master in Neuropsicologia Clinica Elementi di Statistica I Ordine di arrivo primo II III IV ultimo 3 1 5 4 2 Ordine di arrivo: scala ordinale 3 1 5 4 2 Orario di arrivo 13:30 13:32 13:38 13:41 3 1 5 4 Orario di arrivo: scala intervalli 05 aprile 2008 13:50 2 t t 2 1 t5 t3 12 6 2 6/26 Master in Neuropsicologia Clinica Elementi di Statistica I Tempo di percorrenza 00:00 00:22 00:20 3 1 00:28 00:31 5 4 00:40 2 Tempo di percorrenza: scala rapporti t2 40 2 t1 20 05 aprile 2008 7/26 Master in Neuropsicologia Clinica Elementi di Statistica I Analisi Univariata Sintesi statistica di una variabile qualitativa nominale 1. organizzazione dei dati a. matrice dei dati Unità Genere Età Tumore SNC Neoplasia Anno prima diagnosi … 1 M 34 Meningioma Grado I 2 M 49 Craniofaringioma Grado II 2003 3 F 52 Medulloblastoma Grado II 1999 … … … … … … 180 F 64 Tum. pineale Grado I 2001 05 aprile 2008 2000 8/26 Master in Neuropsicologia Clinica Elementi di Statistica I Unità statistica: individuo Variabile oggetto di studio: tipologia del tumore SNC Modalità: Medulloblastoma (A) Meningioma (B) Schwannoma (C) Craniofaringioma (D) Tumore delle cellule germinali (E) Tumore della regione pineale (F) Gruppo di osservazione: 05 aprile 2008 180 unità 9/26 Master in Neuropsicologia Clinica Elementi di Statistica I Tabella della distribuzione di frequenze Tumore SNC A IIII B II C IIII D IIII I E 0 F III Totale 180 05 aprile 2008 ni fi 141 9 9 14 0 7 180 0,78 0,05 0,05 0,08 0,00 0,04 1,00 frequenze assolute frequenze relative: ni/n 10/26 Master in Neuropsicologia Clinica Elementi di Statistica I Sintesi numerica? Tendenza centrale Moda = Modalità i tale che ni o fi sia max …la modalità che viene rilevata più volte… Tumore SNC 05 aprile 2008 ni fi A 141 0,78 B 9 0,05 C 9 0,05 D 14 0,07 E 0 0,00 F 7 0,04 Totale 180 1,00 11/26 Master in Neuropsicologia Clinica Elementi di Statistica I Variabilità: (“capacità” delle osservazioni di assumere valori diversi) ? Minima variabilità: tutte le unità sono caratterizzate dalla stessa modalità (omogeneità) Tumore SNC 05 aprile 2008 ni fi A 0 0,00 B 180 1,00 C 0 0,00 D 0 0,00 E 0 0,00 F 0 0,00 Totale 180 1,00 12/26 Master in Neuropsicologia Clinica Elementi di Statistica I Variabilità: ? Massima variabilità: tutte le unità si distribuiscono ‘equamente’ fra le modalità Tumore SNC 05 aprile 2008 ni fi A 30 0,17 B 30 0,17 C 30 0,17 D 30 0,17 E 30 0,17 F 30 0,17 Totale 180 1,02 13/26 Master in Neuropsicologia Clinica Elementi di Statistica I Indice di eterogeneità di Gini Tumore SNC m G 1 fi 2 ni fi A 0 30 0,00 0,17 B 180 30 1,00 0,17 C 0 30 0,00 0,17 m = numero di modalità D 0 30 0,00 0,17 min G 1 1 0 E 0 30 0,00 0,17 F 0 30 0,00 0,17 Totale 180 1,00 1,02 i 1 1 1 m 1 max G 1 2 1 m m i 1 m m 05 aprile 2008 14/26 Master in Neuropsicologia Clinica Elementi di Statistica I Tumore SNC ni fi fi 2 A 141 0,78 0,608 B 9 0,05 0,003 C 9 0,05 0,003 D 14 0,07 0,006 E 0 0,00 0,000 F 7 0,04 0,002 Totale 180 1,00 0,622 6 G 1 fi 1 0, 622 0,378 2 i 1 max (G) = (6-1) / 6 = 0,833 05 aprile 2008 15/26 Master in Neuropsicologia Clinica Elementi di Statistica I Genere ni fi fi 2 M 148 0,82 0,672 F 32 0,18 0,032 Totale 180 1,00 0,704 2 G 1 fi 1 0, 704 0, 296 2 i 1 05 aprile 2008 16/26 Master in Neuropsicologia Clinica Elementi di Statistica I Quale variabile presenta maggiore variabilità? Tumore: GTum 0,378 Genere: G Gen 0, 296 m G f m 1 fi 2 Confronti? i 1 Indice di eterogeneità relativa G m 2 G 1 fi max G m 1 i 1 m 05 aprile 2008 17/26 Master in Neuropsicologia Clinica Elementi di Statistica I max (GTum) = (6-1) / 6 = 0,833 max (GGen) = (2-1) / 2 = 0,500 GTum GTum 0,378 0, 454 max GTum 0,833 GGen GGen 0, 296 0,592 max GGen 0,500 05 aprile 2008 18/26 Master in Neuropsicologia Clinica Elementi di Statistica I Sintesi statistica di una variabile qualitativa ordinale Sintesi numerica? Tendenza centrale: oltre alla MODA, è possibile calcolare un indicatore di tendenza centrale che sfrutta l’informazione contenuta nell’ordinamento… Mediana 05 aprile 2008 19/26 Master in Neuropsicologia Clinica Elementi di Statistica I Mediana Quel valore di una distribuzione ordinata che divide la distribuzione in due parti uguali, tali che il numero di osservazioni uguale o maggiore della mediana coincide con il numero di osservazioni uguale o minore della mediana Esempio 1: 5 unità statistiche – var: grado di neoplasia – modalità: grado I, grado II, grado III, grado IV 05 aprile 2008 20/26 Master in Neuropsicologia Clinica Elementi di Statistica I Mediana (individuazione) 1. si ordinano le unità statistiche (in senso crescente) 2. si individua l’unità centrale, ovvero quella che nella sequenza ordinata delle u.s. ha tante u.s. caratterizzate da modalità uguali o inferiori alla propria quante da modalità maggiori (o uguali) alla propria 3. la mediana sarà la modalità che caratterizza l’u.s. centrale 05 aprile 2008 21/26 Master in Neuropsicologia Clinica Elementi di Statistica I Esempio 1: 5 unità statistiche – var: grado di neoplasia – modalità: grado I, grado II, grado III, grado IV Dati: unità: 1 neopl.: II 2 I 3 III Distrib. ordinata: posizione: modalità: unità: 4 II 5 III (1) I 2 (2) II 1 (3) II 4 (4) III 3 (5) III 5 La mediana è Grado II 05 aprile 2008 22/26 Master in Neuropsicologia Clinica Elementi di Statistica I In pratica: • Si ordina la sequenza • Se n è dispari: l’unità centrale è quella che occupa la POSIZIONE (n+1)/2 nella sequenza ordinata • Se n è pari: le unità centrali sono due e occupano le POSIZIONI n/2 e n/2+1 nella sequenza ordinata • La mediana sarà la modalità che caratterizza l’unità (o le unità) centrale(/i) 05 aprile 2008 23/26 Master in Neuropsicologia Clinica Elementi di Statistica I Esempio 2 Gruppo di 180 soggetti affetti da tumore sui quali è stata valutato il grado di neoplasia. Variabile: grado di neoplasia Modalità: Grado I Grado II Grado III Grado IV Scala di misura: Ordinale u.s. 11 53 61 … modalità I I I … (posizione) (1) (2) (3) … 05 aprile 2008 … 9 27 80 88 … … 8 … III III III III … … IV …(89)(90)(91)(92) … 98 IV 108 IV … (178) (179) (180) 24/26 Master in Neuropsicologia Clinica Elementi di Statistica I Frequenze assolute cumulate Frequenze relative cumulate Esempio 3 Grado I 56 unità Neoplasia ni fi Ni Fi Grado I 56 0,31 56 0,31 Grado II 28 0,16 84 0,47 Grado III 76 0,42 160 0,89 Grado IV 20 0,11 180 1,00 Totale 180 1,00 ?? ?? Grado II 28 unità Grado III 76 unità Grado I Grado II Grado III 31% unità 42% Grado II e III I, II, III e IVunità Grado Grado I e16% II I,unità 84 unità160 unità 180 unità Ni = Ni-1 + ni Fi = Fi-1 + fi Grado IV 20 unità Grado IV 11% unità II e III I, II, III E IV Grado Grado I e II I, Grado 89% unità100% unità 47% unità 05 aprile 2008 25/26 Master in Neuropsicologia Clinica Elementi di Statistica I Esempio 3 Neoplasia ni fi Ni Fi Grado I 56 0,31 56 0,31 Grado II 28 0,16 84 0,47 Grado III 76 0,42 160 0,89 Grado IV 20 0,11 180 1,00 Totale 180 1,00 n = 180 → pari → due u.s. (n/2) = (90) (n/2 + 1) = (91) Cerco u.s. ordinate (90) e (91) → x(90) = III x(91) = III Oppure: Modalità i tale che min(Ni) ≥ 90 Modalità i tale che min(Fi) ≥ 0,50 05 aprile 2008 La mediana è Grado III 26/26