Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità di informazioni ad un’unica misura numerica; Sintetizzano l’intera distribuzione in un singolo valore, consentendo così confronti nel tempo, nello spazio o tra circostanze differenti; In alcuni casi, consentono di verificare se le conseguenze di una determinata azione abbiano prodotto il risultato desiderato, in quale direzione e con quale intensità. Indici Sintetici di Posizione: la media aritmetica La Media artimetica, di seguito indicata con µ, è quel valore che, sostituito a tutte le osservazioni, lascia invariata la loro somma. Se i dati sono organizzati in forma di serie, x1 , x2 , ..., xn essa si ottiene sommando tutti i valori osservati e dividendo per il numero di osservazioni: Pn µ= µ= i=1 xi n 19.4+14.0+16.8+...+17.7 305.9 = 20 =15.3 mmHG 20 Esempio: Pressione Oculare Osservazione 1 Osservazione 2 Osservazione 3 Osservazione 4 Osservazione 5 Osservazione 6 Osservazione 7 ... Osservazione 19 Osservazione 20 19.4 14.0 16.8 14.5 12.0 12.0 13.7 ... 19.7 17.7 Indici Sintetici di Posizione: la media aritmetica La Media artimetica, di seguito indicata con µ, è quel valore che, sostituito a tutte le osservazioni, lascia invariata la loro somma. Se i dati sono organizzati in forma di distribuzione Esempio: Età di frequenza, (x1 , n1 ), (x2 , n2 ), ..., (xk , nk ) essa si Età Frequenza ottiene moltiplicando ciascun valore per la 20 21 22 23 24 25 4 3 3 3 3 4 Totale 20 corrispondente frequenza, sommando tutti questi prodotti e dividendo quindi per la somma delle frequenze: Pk µ= j=1 xj × Pk j=1 nj nj Indici Sintetici di Posizione: la media aritmetica La Media artimetica, di seguito indicata con µ, è quel valore che, sostituito a tutte le osservazioni, lascia invariata la loro somma. Se i dati sono organizzati in forma di distribuzione Esempio: Età di frequenza, (x1 , n1 ), (x2 , n2 ), ..., (xk , nk ) essa si Età Frequenza ottiene moltiplicando ciascun valore per la 20 21 22 23 24 25 4 3 3 3 3 4 Totale 20 corrispondente frequenza, sommando tutti questi prodotti e dividendo quindi per la somma delle frequenze: Pk µ= µ= j=1 xj × Pk j=1 nj (20×4)+(21×3)+...+(25×4) (4+3+...+4) = nj 450 =22.5 20 anni Indici Sintetici di Posizione: la media aritmetica Proprietà della Media aritmetica La media aritmetica è sempre compresa tra il minimo e il massimo della distribuzione osservata; La media aritmetica è espressa nella stessa unità di misura dei dati originali; La somma algebrica degli scarti di ciascuna osservazione dalla media aritmetica è nulla; La media aritmetica è una sintesi di tutti i valori ed è quindi influenzata da outliers; è cioè un indicatore poco robusto; La media aritmetica può essere calcolata solo per variabili quantitative. Indici Sintetici di Posizione: la mediana La Mediana, di seguito indicata con Me, è il valore assunto dall’unità statistica che occupa la posizione centrale della distribuzione ordinata in modo non decrescente; quel valore cioè che lascia alla sua sinistra il 50% delle osservazioni più piccole e alla sua destra il 50% delle osservazioni più grandi Calcolo della mediana 1 Si ordina la distribuzione in modo non decrescente; 2 Si determina la posizione mediana Se il numero di osservazioni n è dispari allora PosMe = n+1 ¯ ˘ 2 Se il numero di osservazioni n è pari allora PosMe = n2 , n2 + 1 3 Si osserva il valore che occupa la posizione mediana N.B. Nel caso in cui n è pari e quindi esistono due posizioni mediane, se si è in presenza di variabili quantitative la mediana è ottenuta come semi-somma dei due valori corrispondenti; se la variabile è qualitativa ordinale allora si dice che la distribuzione è caratterizzata da due valori mediani. Indici Sintetici di Posizione: la mediana Un esempio: n dispari Valore 19 22 25 26 27 Posizione 1 2 3 4 5 Indici Sintetici di Posizione: la mediana Un esempio: n dispari Valore 19 22 25 26 27 Posizione 1 2 3 4 5 PMe = n+1 2 = 5+1 2 =3 Indici Sintetici di Posizione: la mediana Un esempio: n dispari Valore 19 22 25 26 27 Posizione 1 2 3 4 5 PMe = n+1 2 Me = 25 = 5+1 2 =3 Indici Sintetici di Posizione: la mediana Un esempio: n dispari Valore 19 22 25 26 27 Posizione 1 2 3 4 5 Un esempio: n pari Valore 19 22 25 26 27 41 Posizione 1 2 3 4 5 6 PMe = n+1 2 Me = 25 = 5+1 2 =3 Indici Sintetici di Posizione: la mediana Un esempio: n dispari Valore 19 22 25 26 27 Posizione 1 2 3 4 5 PMe = n+1 2 = 5+1 2 =3 Me = 25 Un esempio: n pari Valore 19 22 25 26 27 41 Posizione 1 2 3 4 5 6 PMe = n 2 = 3, n2 + 1 = 4 Indici Sintetici di Posizione: la mediana Un esempio: n dispari Valore 19 22 25 26 27 Posizione 1 2 3 4 5 PMe = n+1 2 = 5+1 2 =3 Me = 25 Un esempio: n pari Valore 19 22 25 26 27 41 Posizione 1 2 3 4 5 6 PMe = Me = n 2 = 3, n2 + 1 = 4 25+26 2 = 25.5 Indici Sintetici di Posizione: la mediana La VAS è una rappresentazione grafica della gravità del dolore che un paziente crede di avvertire. È costituita da una linea orizzontale di 100 millimetri con barre verticali alle due estremità che rappresentano l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il paziente indica il punto che ritiene identifichi il suo stato algico. La distanza di questo dal punto di assenza di dolore, misurata in millimetri corrisponde al punteggio dolorifico Assenza di dolore 0 Dolore Insostenibile 100 Indici Sintetici di Posizione: la mediana La VAS è una rappresentazione grafica della gravità del dolore che un paziente crede di avvertire. È costituita da una linea orizzontale di 100 millimetri con barre verticali alle due estremità che rappresentano l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il paziente indica il punto che ritiene identifichi il suo stato algico. La distanza di questo dal punto di assenza di dolore, misurata in millimetri corrisponde al punteggio dolorifico Assenza di dolore 0 Dolore Insostenibile 100 Indici Sintetici di Posizione: la mediana La VAS è una rappresentazione grafica della gravità del dolore che un paziente crede di avvertire. È costituita da una linea orizzontale di 100 millimetri con barre verticali alle due estremità che rappresentano l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il paziente indica il punto che ritiene identifichi il suo stato algico. La distanza di questo dal punto di assenza di dolore, misurata in millimetri corrisponde al punteggio dolorifico Assenza di dolore 0 Dolore Insostenibile 22 100 Indici Sintetici di Posizione: la mediana Prima Dopo Diff. 61 26 56 30 63 68 56 31 10 44 69 50 51 78 50 76 47 52 37 32 29 56 35 28 10 21 37 49 30 14 46 51 34 54 18 34 31 18 29 -3 0 -5 35 58 35 -6 -39 14 55 4 0 44 -4 58 13 21 19 Indici Sintetici di Posizione: la mediana Prima Dopo Diff. Diff. Pos. 61 26 56 30 63 68 56 31 10 44 69 50 51 78 50 76 47 52 37 32 29 56 35 28 10 21 37 49 30 14 46 51 34 54 18 34 31 18 29 -3 0 -5 35 58 35 -6 -39 14 55 4 0 44 -4 58 13 21 19 -39 -6 -5 -4 -3 0 0 4 13 14 19 21 29 35 35 44 55 58 58 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Ordinamento Indici Sintetici di Posizione: la mediana Prima Dopo Diff. Diff. Pos. 61 26 56 30 63 68 56 31 10 44 69 50 51 78 50 76 47 52 37 32 29 56 35 28 10 21 37 49 30 14 46 51 34 54 18 34 31 18 29 -3 0 -5 35 58 35 -6 -39 14 55 4 0 44 -4 58 13 21 19 -39 -6 -5 -4 -3 0 0 4 13 14 19 21 29 35 35 44 55 58 58 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Ordinamento n = 19 PMe = n+1 2 = 10 Indici Sintetici di Posizione: la mediana Prima Dopo Diff. Diff. Pos. 61 26 56 30 63 68 56 31 10 44 69 50 51 78 50 76 47 52 37 32 29 56 35 28 10 21 37 49 30 14 46 51 34 54 18 34 31 18 29 -3 0 -5 35 58 35 -6 -39 14 55 4 0 44 -4 58 13 21 19 -39 -6 -5 -4 -3 0 0 4 13 14 19 21 29 35 35 44 55 58 58 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Ordinamento n = 19 PMe = n+1 2 Me = 14 = 10 Indici Sintetici di Posizione: la mediana Proprietà della Mediana La mediana è sempre compresa tra il minimo e il massimo della distribuzione osservata; La mediana è espressa nella stessa unità di misura dei dati originali; La mediana può essere calcolata sia per variabili quantitative che per variabili qualitative ordinali (Attenzione però al caso in cui n è pari!) La mediana non risente della presenza di eventuali outliers perché si disinteressa di ciò che accade nelle code della distribuzione dei dati; Indici Sintetici di Posizione: I quartili I quartili sono indicatori di posizione che, al pari della mediana, si calcolano rilevando il valore assunto dalle unità statistiche che occupano posizioni cruciali nella serie ordinata (in senso non decrescente) dei dati Il primo quartile (di seguito indicato con Q1 ) è quel valore che lascia alla sua sinistra il 25 % delle osservazioni più piccole e alla sua destra il 75 % delle osservazioni più grandi Il secondo quartile è quel valore che lascia alla sua sinistra il 50 % delle osservazioni più piccole e alla sua destra il 50 % delle osservazioni più grandi. Esso quindi coincide con la Mediana Il terzo quartile (di seguito indicato con Q3 è quel valore che lascia alla sua sinistra il 75 % delle osservazioni più piccole e alla sua destra il 25 % delle osservazioni più grandi Indici Sintetici di Variabilità La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità. Un indice di variabilità è una misura di tale attitudine, e dovrebbe possedere le seguenti caratteristiche: 1 2 3 Deve essere non negativo Deve essere nullo se e solo se tutte le unità presentano la stessa modalità del carattere; Deve aumentare all’aumentare della diversità tra le unità. La variabilità può essere calcolata rispetto ad un centro (misure di dispersione) o valutando le differenze tra tutte le possibili coppie di unità osservate (misure di diseguaglianza) Indici Sintetici di Variabilità: Varianza La Varianza (di seguito indicata con σ 2 ) è una delle misure di dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento. X µ Indici Sintetici di Variabilità: Varianza La Varianza (di seguito indicata con σ 2 ) è una delle misure di dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento. X µ X µ Indici Sintetici di Variabilità: Varianza La Varianza (di seguito indicata con σ 2 ) è una delle misure di dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento. Razionale della Varianza n X i=1 (xi − µ) Indici Sintetici di Variabilità: Varianza La Varianza (di seguito indicata con σ 2 ) è una delle misure di dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento. Razionale della Varianza n X i=1 (xi − µ) Il risultato è sempre uguale a 0 Indici Sintetici di Variabilità: Varianza La Varianza (di seguito indicata con σ 2 ) è una delle misure di dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento. Razionale della Varianza n X (xi − µ) Il risultato è sempre uguale a 0 i=1 n X i=1 (xi − µ)2 Indici Sintetici di Variabilità: Varianza La Varianza (di seguito indicata con σ 2 ) è una delle misure di dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento. Razionale della Varianza n X (xi − µ) Il risultato è sempre uguale a 0 i=1 n X i=1 (xi − µ)2 Dipende dal numero di osservazioni Indici Sintetici di Variabilità: Varianza La Varianza (di seguito indicata con σ 2 ) è una delle misure di dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento. Razionale della Varianza n X (xi − µ) Il risultato è sempre uguale a 0 i=1 n X (xi − µ)2 Dipende dal numero di osservazioni i=1 Pn i=1 (xi n − µ)2 = σ 2 Media di scarti al quadrato Indici Sintetici di Variabilità: Varianza Prima Dopo 61 26 56 30 63 68 56 31 10 44 69 50 51 78 50 76 47 52 37 32 29 56 35 28 10 21 37 49 30 14 46 51 34 54 18 34 31 18 Indici Sintetici di Variabilità: Varianza Prima Dopo 61 26 56 30 63 68 56 31 10 44 69 50 51 78 50 76 47 52 37 32 29 56 35 28 10 21 37 49 30 14 46 51 34 54 18 34 31 18 µprima = 61 + 26 + ... + 37 = 50.3 19 µdopo = 32 + 29 + ... + 56 = 33.0 19 Indici Sintetici di Variabilità: Varianza Prima Dopo 61 26 56 30 63 68 56 31 10 44 69 50 51 78 50 76 47 52 37 32 29 56 35 28 10 21 37 49 30 14 46 51 34 54 18 34 31 18 µprima = 61 + 26 + ... + 37 = 50.3 19 µdopo = 32 + 29 + ... + 56 = 33.0 19 2 σprima = (61 − 50.3)2 + (26 − 50.3)2 + ... + (37 − 50.3)2 = 298 19 2 σdopo = (31 − 33)2 + (29 − 33)2 + ... + (56 − 33)2 = 173 19 Indici Sintetici di Variabilità: Varianza Prima Dopo 61 26 56 30 63 68 56 31 10 44 69 50 51 78 50 76 47 52 37 32 29 56 35 28 10 21 37 49 30 14 46 51 34 54 18 34 31 18 µprima = 61 + 26 + ... + 37 = 50.3 19 µdopo = 32 + 29 + ... + 56 = 33.0 19 2 σprima = (61 − 50.3)2 + (26 − 50.3)2 + ... + (37 − 50.3)2 = 298 19 2 σdopo = (31 − 33)2 + (29 − 33)2 + ... + (56 − 33)2 = 173 19 Conclusioni Prima del trattamento, il grado di dolore percepito dai pazienti risulta in media maggiore (il trattamento ha cioè prodotto benefici nel collettivo esaminato). Si è inoltre determinata una riduzione della dispersione che è passata da 298 a 173; ciò indica che a seguito del trattamento, i valori di dolore risultano concentrati in misura maggiore attorno al punteggio medio. Vi è in altre parole un effetto stabilizzante. Cosa si sarebbe potuto concludere se invece la dispersione dei dati fosse aumentata a seguito del trattamento??? Indici Sintetici di Variabilità: Varianza Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora... Dati in forma di serie Pn i=1 xi µ= n σ2 = Pn i=1 (xi n − µ)2 Indici Sintetici di Variabilità: Varianza Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora... Dati in forma di serie Pn i=1 xi µ= n σ2 = Pn i=1 (xi n − µ)2 Indici Sintetici di Variabilità: Varianza Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora... Dati in forma di serie Pn i=1 xi µ= n σ2 = Pn i=1 (xi n − µ)2 Dati in forma di distribuzione Pk j=1 xj × nj µ = Pk j=1 nj Indici Sintetici di Variabilità: Varianza Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora... Dati in forma di serie Pn i=1 xi µ= n σ2 = Pn i=1 (xi n − µ)2 Dati in forma di distribuzione Pk j=1 xj × nj µ = Pk j=1 nj Indici Sintetici di Variabilità: Varianza Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora... Dati in forma di serie Pn i=1 xi µ= n σ2 = Pn i=1 (xi n Dati in forma di distribuzione Pk j=1 xj × nj µ = Pk j=1 nj − µ)2 Pk σ2 = − µ)2 × nj Pk j=1 nj j=1 (xj Indici Sintetici di Variabilità: Varianza Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora... Dati in forma di serie Pn i=1 xi µ= n σ2 = Pn i=1 (xi n Dati in forma di distribuzione Pk j=1 xj × nj µ = Pk j=1 nj − µ)2 Pk σ2 = − µ)2 × nj Pk j=1 nj j=1 (xj Indici Sintetici di Variabilità: Varianza Distribuzione di frequenza dell’età al primo parto per un collettivo di 40 donne italiane. Età Frequenza 26 27 28 29 30 5 3 7 11 14 Totale 40 σ2 = µ= (26 × 5) + (27 × 3) + ... + (30 × 14) = 28.6 anni 40 (26 − 28.6)2 × 5 + (27 − 28.6)2 × 3 + ... + (30 − 28.6)2 × 14 = 1.83 anni2 40 Indici Sintetici di Variabilità: Varianza Proprietà della Varianza La varianza non può assumere valori negativi; E’ nulla se e solo se tutte le osservazioni sono uguali tra di loro (e quindi la media coincide con esse); Attribuisce lo stesso peso ad osservazioni distanti dalla media in una direzione piuttosto che nell’altra; E’ espressa in una unità di misura che è il quadrato di quella dei dati originali. Indici Sintetici di Variabilità: Scarto quadratico medio Al fine di riportare la misura di variabilità all’unità di misura originale si estrae la radice quadrata della Varianza ottenendo un indice noto come Scarto quadratico medio (abbreviato con s.q.m) o Deviazione standard e di seguito indicato con σ √ σ= rP σ2 = n i=1 (xi − µ)2 n Lo s.q.m possiede le stesse caratteristiche della varianza ed ha in più il vantaggio di misurare la variabilità di un fenomeno utilizzando la stessa lingua dei dati Esercizio Distribuzione di frequenza del tempo (in secondi) impiegato per il completamento di un test di lettura in un colletivo di 20 soggetti dislessici prima e dopo lo svolgimento di una terapia logopedica. Durata Prima Dopo 60 70 80 90 6 4 4 6 14 3 3 0 Totale 20 20 Utilizzando gli opportuni indici di posizione e di variabilità confrontare le due distribuzioni e commentare i risultati ottenuti.