Outline Statistica Sociale - modulo A e-mail: [email protected] Prof.ssa D.F. Iezzi Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline i quartili ESEMPIO: i quartili IL TERZO QUARTILE ESEMPIO: i quartili per un carattere diviso in classi La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI ESEMPIO: il boxplot Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI I QUARTILI I quartili sono tre indici che dividono la distribuzione ordinata in 4 parti uguali. Il primo quartile (Q1 ) e’ il valore che lascia alla propria sinistra il 25% dei termini e il 75% alla destra. Il secondo quartile (Q2 ) e’ il valore spacca in due parti uguali la distribuzione (il secondo quartile coincide con la mediana). Il terzo quartile (Q3 ) e’ il valore che lascia alla propria sinistra il 75% dei termini e il 25% alla destra. Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI ESEMPIO Data la seguente distribuzione: 5, 6,2,2,1,5,10,12,3,2,5,6. Individuare i quartili. ORDINO LA DISTRIBUZIONE: 1 2 2 2 3 5 5 5 6 6 10 12 Il primo quartile (Q1 ) si trova nella seguente posizione: Q1 = 0, 25 ∗ 12 = (1/4)12 = 3 Il primo quartile si trova in terza posizione e il valore e’ Q1 = 2 Il secondo quartile (Q2 ) si trova nella seguente posizione: n=pari 12 n 5+5 n 2 = 2 = 6 e 2 + 1 = 7 Q2 = 2 = 5 Il terzo quartile (Q3 ) si trova nella seguente posizione: Q3 = 0, 75 ∗ 12 = (3/4)12 = 9 LaQ3 si trova in posizione 9 e il valore e’ Q3 = 6 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI IL PRIMO QUARTILE Q1 ' IQ1 + 0.25 − FQ1−1 aQ1 FQ1 − FQ1−1 IQ1 e’ l’estremo inferiore della classe dove cade Q1 FQ1−1 e’ la frequenza relativa cumulata fino alla classe precedente a quella dove cade Q1 ; FQ1 e’ la frequenza relativa cumulata della classe dove cade Q1 aQ1 e’ l’ampiezza della classe dove cade Q1 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI IL SECONDO QUARTILE E’ LA MEDIANA IL TERZO QUARTILE Q3 ' IQ3 + 0.75 − FQ3−1 aQ3 FQ3 − FQ3−1 IQ3 e’ l’estremo inferiore della classe dove cade Q3 FQ3−1 e’ la frequenza relativa cumulata fino alla classe precedente a quella dove cade Q1 FQ3 e’ la frequenza relativa cumulata della classe dove cade Q3 aQ3 e’ l’ampiezza della classe dove cade Q3 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI Data la distribuzione di frequenza per classi di addetti dell’AREA X, calcolare i quartili. Q1 = 0 + ( 0,25−0 0,35−0 )5 = 0, 71x5 = 3, 57 0,15 Q2 = 6 + ( 0,50−0,35 0,53−0,35 )4 = 6 + ( 0,18 )4 = 9, 33 0,75−0,53 Q3 = 11 + ( 0,76−0,53 )19 = 11 + ( 0,22 0,23 )19 = 29, 17 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI Nella descrizione di un fenomeno, un indice di posizione fornisce informazioni riassuntive sulla distribuzione. La sintesi mediante una media e’ rappresentativa soltanto se le unita’ statistiche presentano modalita’ prossime a questa. Molto spesso, distribuzioni caratterizzate dall’uguaglianza nei valori degli indici di posizione, possono riflettere situazioni molto diverse tra di loro. ESEMPIO Si consideri il peso (in Kg) di due gruppi di studenti (A e B). A = 60, 55, 70, 40, 90, 70, 76, 72, 56, 61 B = 65, 65, 65, 65, 65, 65, 65, 65, 65, 65 Pn P10 xi 650 i=1 xi xA = = i=1 = 65 n = 10 Pn P10 xi xi 650 x B = i=1 = i=1 = 65 n = 10 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI La variabilita’ esprime la tendenza delle unita’ di un collettivo ad assumere diverse modalita’ del carattere. Un indice di variabilita’ (V(x)) presenta i seguenti requisiti: 1. V(X)= 0, se tutte le unita’ presentano la medesima modalita’ del carattere (distribuzione degenere); 2. V (X ) > 0 risulta crescente al crescere della diversita’ tra le modalita’ assunte dalle diverse unita’; 3. V (X + c) = V (x) + c: aggiungendo una costante c ai valori di X, la variabilita’ non cambia; 4. Se V (X ) ≥ V (Y ) allora il vettore X e’ piu’ variabile di Y. Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI E possibile distinguere tre categorie di indici di variabilita’: 1. Indici di dispersione rispetto ad una media; 2. Indici di disuguaglianza a coppie (Mutua variabilita’ ); 3. Indici di mutabilita’, che misurano lomegenita’/eterogenieta’ tra le modalita’ di una distribuzione di frequenza. Nelle tre categorie sopraccitate, e’ possibile operare una ulteriore distinzione tra gli indici: a) Assoluti: utilizzano la stessa unita’ di misura della modalita’ della distribuzione, ma non consentono di fare confronti fra distribuzioni statistiche espresse in unita’ di misura diverse; b) Relativi: depurano la distribuzione dall’unita’ di misura, per questo motivo sono particolarmente adatti per operare confronti fra distribuzioni. Si ottengono rapportando un indice assoluto al suo massimo o ad una media. Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI P σ 2 = n1 ni=1 (xi − x)2 ESEMPIO Si consideri il peso (in Kg) di due gruppi di studenti (A e B). A = 60, 55, 70, 40, 90, 70, 76, 72, 56, 61 B = 65, 65, 65, 65, 65, 65, 65, 65, 65, 65 = 169, 2 σ 2 = 1692 q10 P 1 σ = n ni=1 (xi − x)2 = σ = 13 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline xi 60 55 70 40 90 70 76 72 56 61 tot (xi − x) -5 -10 5 -25 25 5 11 7 -9 -4 - Prof.ssa D.F. Iezzi ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI (xi − x)2 25 100 25 625 625 25 121 49 81 16 1692 Statistica Sociale - modulo A e-mail: [email protected] ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI Outline xj 0 1 2 3 Totale nj 5 20 11 26 62 xj nj 0 20 22 78 120 (xi − x) -2 -1 0 1 x= (xi − x)2 4 1 0 1 (xi − x)2 nj 20 20 0 26 66 120 =2 62 σ 2 = 66 62 = 1, 064 σ = 1, 031 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI SCOSTAMENTO SEMPLICE MEDIO DALLA MEDIA P ARITMETICA Sx = n1 ni=1 |xi − x| SCOSTAMENTO SEMPLICE MEDIO DALLA MEDIANA 1 Pn Sx = n i=1 |xi − Me| COEFFICIENTE DI VARIAZIONE CV = ( σx )100 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI La descrizione di un carattere mediante un indice di posizione andrebbe sempre accompagnata da un indice di variabilita’. Il grafico a scatola (o box-plot) un particolare tipo di diagramma che permette di rappresentare graficamente sia una media che la variabilita’ di una distribuzione. Gli elementi che lo caratterizzano sono: 1. una linea orizzontale interna alla scatola, che individua il valore dell’indice di posizione (media o piu’ frequentemente mediana); 2. un rettangolo (box) la cui altezza misura la differenza contiene il 50% centrale della distribuzione, dal 1al 3quartile; 3. due segmenti (i baffi) che individuano gli intervalli in cui sono posizionati i valori rispettivamente minori di Q1 e maggiori di Q3 Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI E’ possibile, inoltre, rappresentare con valori esterni ai baffi i valori anomali. Questi valori forniscono informazioni ulteriori sulla dispersione e sulla forma della distribuzione. Si possono individuare eventuali valori anomali, mediante le seguenti formule: - limite inferiore (baffo inferiore) = Q1 − αDI - limite superiore (baffo superiore) = Q3 + αDI dove DI = Q3 − Q1 differenza interquartilica. Con α costante positiva. I software di frequente fissano un valore di α pari a 1,5. Quando i valori adiacenti, superiore e inferiore, coincidono con gli estremi della distribuzione non comparir alcun valore fuori limite. Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected] Outline ESEMPIO: i quartili La variabilita’ Proprieta’ di un indice di variabilita’ Indici di variabilita’ La varianza altri indici di variabilita’ IL BOX PLOT I VALORI ANOMALI 2 4 6 8 10 12 ESEMPIO: Data la seguente distribuzione: 5, 6,2,2,1,5,10,12,3,2,5,6. Disegnare il boxplot. DI=6-2=4 - limite inferiore (baffo inferiore) = 2 − 1, 5x4 = 2 − 6 = −4 - limite superiore (baffo superiore) = 6 + 1, 5x4 = 6 + 6 = 12 non ci sono valori anomali Prof.ssa D.F. Iezzi Statistica Sociale - modulo A e-mail: [email protected]