INDICI DI POSIZIONE CENTRALE Una volta definito il collettivo statistico d’indagine vengono rilevati i caratteri oggetto di studio e alla fine della rilevazione ci si trova con decine o centinaia di dati che , come si è visto, possono essere disposti efficacemente in una tabella di frequenza. Frequentemente risulta necessario sintetizzare la massa dei dati in modo tale da eseguire facili e veloci raffronti con altri collettivi oppure raffrontando gli stessi collettivi temporalmente o territorialmente . Per sintetizzare una grande quantità di dati vengono utilizzati gli indici di posizione o valori medi. Essi si distinguono in : - medie di calcolo, (media aritmetica, media geometrica, media armonica, media quadratica) prendendo in considerazione tutti gli elementi del collettivo; - medie lasche, ( valore centrale, mediana, quartili e moda ) prendendo in considerazione solo alcuni degli elementi del collettivo. MEDIE DI CALCOLO MEDIA ARITMETICA La media aritmetica, o semplicemente media, è quel valore che sostituito a tutti i termini della distribuzione ne lascia invariata la somma. Considerati gli N valori di una distribuzione statistica Totale valori N valori media x1 x2 _ _ x x xi … _ … x … … xn x1 + x2 + ... xi + ... xn = ∑ xi i =1 _ _ _ _ _ x + x + ... x = N ⋅ x x N _ N _ Dalla definizione dovrà essere N ⋅ x = ∑ xi , isolando la media x si ottiene x = ∑x i =1 i =1 i N MEDIA ARITMETICA distribuzione semplice collettivo poco numeroso e i valori rilevati non si ripetono indicato con x1 , x2 ,..., xi ,... xn , gli elementi e con N il numero totale degli elementi la media aritmetica è data dalla formula: N xi x1 + x2 + x3 + ... xi + ... xn ∑ i =1 x= = N N FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 1 di 10 Esempio : dati i valori 6 distribuzione di frequenza collettivo numeroso e i valori rilevati si ripetono ∑x 1 + 3 + 5 + 7 + 15 + 17 48 = =8 6 6 6 indicato con xi i valori e con ni le rispettive frequenze , con N = 6, 1;3;5;7;15;17 x= i i =1 = N = n1 + n2 + ...nn il numero totale delle frequenze, si costruisce la colonna dei prodotti xi ⋅ ni e si calcola la somma; questa poi viene divisa per N: n x= n ∑ xi ni i =1 x= oppure N ∑x n i i i =1 n ∑n i =1 i Ritornando all’esempio delle altezze di cui alla tabella 6 si predispone la nuova tabella per il calcolo della media aggiungendo il prodotto xi ⋅ ni : Studenti distinti per statura in cm Altezza Frequenza assoluta prodotti xi ni xi ⋅ ni 165 2 330 168 3 504 169 2 338 170 2 340 172 2 344 173 2 346 176 1 176 177 1 177 180 2 360 181 2 362 182 1 182 totale 20 3459 valori per classi si ipotizza che tutti i valori siano uguali al valore centrale della classe La media delle altezze è pertanto n x= i totale delle frequenze, si costruisce la colonna dei prodotti xi' ⋅ ni e si calcola la somma; questa poi viene divisa per N: n Valore centrale della classe Frequenza assoluta prodotti x ⋅ ni x ni 165-170 167,50 7 1172,5 170-175 172,50 6 1035 175-180 177,50 2 355 180-185 ∑n 3.459 = 172,95 cm 20 = Indicato con xi' il valore centrale di ogni classe ( semisomma degli estremi della classe) e con ni le rispettive frequenze , con N il numero xi − xi +1 totale i i i =1 n i =1 x= Classi di altezza ∑x n ' i 182,50 5 20 ' i 912,5 3475 ∑x n ' i i i =1 N Il totale dei prodotti è 3.475 rispetto al reale 3.459; la media delle altezze sarà n x= ∑x n ' i i i =1 N = 3.475 = 173,75 cm 20 all’aumentare del collettivo la media così ottenuta tenderà ad avvicinarsi sempre più al valore reale. FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 2 di 10 Osservazioni sull’utilizzo della media aritmetica: la media aritmetica non è indicata se all’interno della distribuzione figurano dei valori anomali che si discostino di molto dagli altri termini e assumono un peso preponderante nel risultato sintetico. Immaginiamo di calcolare il valore medio delle retribuzioni annue del personale di una impresa considerando i salari degli operai, gli stipendi degli impiegati e gli emolumenti del personale dirigente; in un rapporto , ormai usuale, di 1 a 500 tra salario e indennità dirigenziale la media aritmetica fornirebbe un valore di gran lunga superiore al salario unitario; è più opportuno calcolare la media dei salari e confrontarli con i salari di altre imprese o per contesti territoriali o temporali diversi e lo stesso dicasi degli emolumenti dirigenziali. Esempio: personale operai impiegati manager totale Importo in euro 12.000 15.000 600.000 frequenze 22 8 2 32 prodotti 264.000 120.000 1.200.000 1.584.000 La media di tutto il personale è pari a 1.584.000 valore = 49.500 32 decisamente non rappresentativo. La media del solo personale operai e impiegati è pari a 384.000 = 12.800 valore in linea con i 30 dati tabellari. PROPRIETÀ DELLA MEDIA ARITMETICA xi − x Indicato con a) e la media, i − x) = 0 i − x ) ⋅ ni = 0 nella distribuzione semplice nella distribuzione di frequenza; la somma dei quadrati degli scarti dalla media rispetto ad un qualunque altro valore è un minimo: ∑ (x ∑ (x c) i − esimo la somma degli scarti è uguale a zero : ∑ (x ∑ (x b) lo scarto, differenza tra valore i i − x) 2 = minimo nella distribuzione semplice − x) 2 ⋅ ni = minimo nella distribuzione di frequenza indicate con le lettere a e b delle costanti , con la lettera considerino le seguenti espressioni : • a + X somma di una costante e di una variabile • a⋅ X X la variabile statistica e con la lettera M la media aritmetica si prodotto di una costante per una variabile a ⋅ X + b somma del prodotto di una costante per una variabile e di una costante, • valgono le seguenti proprietà: M ( a ) = a : la media di una costante è uguale alla costante stessa ; 2) M ( a + X ) = a + M ( X ) : la media della somma di una costante e una variabile è uguale alla somma della costante e la media 1) della variabile; 3) M ( a ⋅ X ) = a ⋅ M ( X ) ; la media del prodotto di una costante per una variabile è uguale al prodotto della costante per la media della variabile; 4) M ( a ⋅ X + b) = a ⋅ M ( X ) + b esempio: a = 3; b = 5 x 1° valore 2° valore totale media : questa proprietà deriva dalle precedenti. 2 4 6 3 a+x 5 7 12 6 a⋅ x 6 12 18 9 a⋅ x +b 11 17 28 14 Applicando le proprietà si ottengono gli stessi risultati : M (a + X ) = a + M ( X ) = 3 + 3 = 6 M (a ⋅ X ) = a ⋅ M ( X ) = 3 ⋅ 3 = 9 M ( a ⋅ X + b) = a ⋅ M ( X ) + b = 3 ⋅ 3 + 5 = 14 FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 3 di 10 MEDIA GEOMETRICA La media geometrica è quel valore tale che sostituito a tutti i termini della distribuzione ne lascia invariato il prodotto. Considerati gli N valori di una distribuzione statistica prodotto valori N valori media x1 x2 _ _ xG xG xi … x1 ⋅ x2 ⋅ ... xi ⋅ ... xn = ∏ xi xn … i =1 _ … xG N _ xG ⋅ xG ⋅ ... xG = xG _ _ … xG _ _ N N Dalla definizione dovrà essere x_ = , estraendo la radice ennesima e isolando la G ∏ xi media x G si ottiene x G = i =1 N − _ N ∏ xi , la media geometrica è uguale alla radice ennesima del i =1 prodotto dei fattori. MEDIA GEOMETRICA indicato con x1 , x2 ,..., xi ,... xn , gli elementi e con N il numero totale degli elementi la distribuzione media geometrica è data dalla formula: semplice − xG = N N ∏ xi i =1 Esempio : dati i valori 2;2;16 N = 3, − xG = N N ∏ xi = 3 2 ⋅ 2 ⋅ 16 = 3 64 = 4 i =1 indicato con xi i valori e con ni le rispettive frequenze , con N distribuzione di frequenza = n1 + n2 + ...nn il numero totale delle frequenze, la media geometrica sarà uguale a : − xG = N n ∏ xi ni i =1 Calcolo della media geometrica Il calcolo della media geometrica risulta gravoso se le frequenze sono elevate. Si ricorre al foglio di calcolo oppure ai logaritmi mediante la formula n − log x G = Utilizzo della media geometrica ∑ n log x i i i =1 N La media geometrica viene utilizzata quando si è interessati a conoscere il tasso medio di incremento di una variabile nel tempo, esempio il tasso di variazione dei prezzi, tasso di rendimento dei capitali, tasso di incremento della popolazione. La media geometrica non viene utilizzata in presenza di valori nulli o negativi. FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 4 di 10 MEDIA QUADRATICA La media quadratica è quel valore tale che il suo quadrato sostituito a tutti i termini della distribuzione lascia invariata la somma dei quadrati dei termini. Considerati gli N valori di una distribuzione statistica Totale valori N valori Valori quadratici x1 x2 2 x2 x1 Quadrato della media 2 −2 −2 xq xq xi … … xi 2 … −2 … −2 xn i =1 N x1 + x2 + ... xi + ... xn = ∑ xi 2 2 2 2 2 2 i =1 −2 … xq x1 + x2 + ... xi + ... xn = ∑ xi xn … −2 −2 _2 −2 x q + x q + ... x q = N ⋅ x q xq −2 N Dalla definizione dovrà essere N ⋅ x q = ∑ xi2 , isolando il quadrato della media x q e i =1 N ∑x − calcolando la radice quadrata si ottiene x q = i =1 2 i N MEDIA QUADRATICA indicato con x1 , x2 ,..., xi ,... xn , gli elementi e con N il numero totale degli elementi la distribuzione media quadratica è data dalla formula: N semplice xq = ∑x Esempio : dati i valori xi i valori e con ni frequenze, si calcolano i quadrati 2 2 i =1 xi i =1 N 3 4 + 16 + 36 56 = = 4,32... 3 3 = le rispettive frequenze , con 2 2 i 2 i xq = N = 3, indicato con distribuzione di 2 3 2;4;6 ∑x x + x2 + x3 + ...xi + ... xn = N 2 2 1 N = n1 + n2 + ...nn il numero totale delle , si costruisce la colonna dei prodotti xi ⋅ ni 2 questa poi viene divisa per N, sotto radice quadrata: n frequenza xq = ∑x i 2 ni i =1 n oppure N xq = ∑x i =1 n Indicato con xi' 2 i ni ∑n i =1 i il valore centrale di ogni classe ( semisomma degli estremi della classe) e con rispettive frequenze , con N il numero totale delle frequenze, si calcolano i quadrati valori per classi '2 xi ni le , si costruisce la 2 colonna dei prodotti xi' ⋅ ni e si calcola la somma; questa poi viene divisa per N, sotto radice quadrata: n xq = Utilizzo della media quadratica e si calcola la somma; ∑x i =1 '2 i ni N Essa è utilizzata per calcolare la media delle differenze tra i valori e un valore prefissato e non risente di valori negativi o di differenze negative. La media quadratica risente dei valori anomali in maniera maggiore rispetto alla media aritmetica. FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 5 di 10 MEDIA ARMONICA La media armonica è quel valore che sostituito a tutti i termini della distribuzione ne lascia invariata la somma dei reciproci. ( I termini non devono essere nulli ) Considerati gli N valori di una distribuzione statistica Totale valori valori x1 x2 … xi … xn reciproci 1 x1 1 x2 … 1 xi … 1 xn _ _ xa xa media _ … 1 xa 1 1 N 1 1 + ... _ + ... _ = ∑ _ = N ⋅ _ xa xa x a i =1 x a xa _ … xa N 1 1 1 1 1 + + ... + ... = ∑ x1 x2 xi xn i =1 xi _ _ _ 1 Dalla definizione dovrà essere N ⋅ _ = ∑ , isolando la media x a si ottiene x a = x a i =1 xi N 1 N N 1 ∑x i =1 i MEDIA ARMONICA indicato con x1 , x2 ,..., xi ,... xn , gli elementi e con N il numero totale degli elementi la distribuzione media armonica è data dalla formula: _ xa = semplice N N i =1 Esempio : dati i valori N = 3, 2;5;6 _ xa = 3 3 1 ∑ i =1 xi = 1 ∑x i 3 3 3 90 = = = = 3,46... 1 1 1 15 + 6 + 5 26 26 + + 2 5 6 30 30 xi i valori e con ni le rispettive frequenze , con N = n1 + n2 + ...nn il 1 numero totale delle frequenze, si costruisce la colonna dei prodotti ⋅ ni e si calcola xi indicato con distribuzione di frequenza la somma; N viene diviso per tale somma: _ xa = Utilizzo della media armonica N 1 ni ∑ i =1 xi n Si ricorre alla media armonica quando è necessario fare riferimento ai reciproci dei valori; in generale quando tra due quantità esiste una relazione inversa come potere di acquisto medio di una moneta e prezzo, consumo e durata di una merce. FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 6 di 10 MEDIE LASCHE Le medie lasche sono valori medi che vengono calcolati solo su alcuni valori della distribuzione . I principali tipi di medie lasche sono: 1. valore centrale; 2. mediana; 3. quartili; 4. moda. Ordinati i valori rilevati in ordine crescente, il valore centrale si calcola x1 + x n . 2 VALORE CENTRALE come semisomma dei valori estremi MEDIANA Ordinati i valori rilevati in ordine crescente, la mediana è quell’indice che bipartisce la distribuzione , cioè lascia un uguale numero di termini da una parte e dall’altra. vc = 1° CASO, DISTRIBUZIONE SEMPLICE : indicato con N il numero degli elementi disposti in ordine crescente, N +1 a) se N è dispari la mediana è la modalità che occupa la posizione ; 2 b) se N è pari la mediana è la modalità data dalla semisomma dei due termini che N N ) + ( + 1) 2 occupano la posizione centrale 2 . 2 ( Esempi distribuzione semplice : A) 2; 5; 6; 7; 18 N=5 , dispari B) 2; 5; 6; 8; 9;11 N=6, pari Me = 5+1 = 3° , M e = 6 2 6 6 + + 1 3° + 4° 6 + 8 Me = 2 2 = = =7 2 2 2 2° CASO, DISTRIBUZIONE DI FREQUENZA indicato con N il numero degli elementi disposti in ordine crescente , si costruisce la colonna delle frequenze cumulate, se N è dispari la mediana è la modalità che occupa la posizione N +1 ; 2 se N è pari la mediana è la modalità data dalla semisomma dei due termini che occupano N N ) + ( + 1) 2 la posizione centrale 2 2 ( FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 7 di 10 Esempi distribuzione di frequenza: a) CASO N DISPARI Modalità N dispari, Me = Frequenze semplici Frequenze cumulate xi ni Ni 1 3 4 TOTALE 10 8 7 25 10 18 25 N + 1 25 + 1 = = 13° la mediana occupa il 13° posto e pertanto sarà par i alla modalità 2 2 x2 = 3 b) CASO N Modalità Frequenze semplici Frequenze cumulate xi ni Ni 1 3 4 TOTALE 10 15 25 50 10 25 50 PARI 50 50 N N + + 1 ) + ( + 1) 2 2 = 25° + 26° = 3 + 4 = 7 = 3,5 2 2 N pari, M e = = 2 2 2 2 2 la mediana si calcola come semisomma dei due valori centrali che occupano la posizione ( 25-esima e 26-esima . 3° CASO, DISTRIBUZIONE DI FREQUENZA PER CLASSI si segue la stessa procedura della distribuzione di frequenza; una volta individuata la classe mediana bisognerà procedere all’interpolazione lineare mediante il teorema dei triangoli simili. Classe di consumo kWh Frequenze semplici assolute ni Frequenze cumulate assolute N i 6 12 71 71 12 23 50 121 23 32 48 169 32 37 73 242 37 38 29 271 38 43 28 299 Totale N=299, dispari; la mediana M e = 299 N + 1 299 + 1 = = 150° occupa il 150° posto e pertanto è 2 2 pari alla classe mediana 23-32. Individuata la classe mediana si procede con FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 8 di 10 l’interpolazione lineare mediante il teorema dei triangoli simili. La classe 23-32 ha come frequenze cumulate 121-169; la mediana, come si evince anche dal grafico, posta al 150° posto avrà un valore compreso tra 23 e 32. L’ascissa della mediana ( M ) si ottiene mediante l’interpolazione della retta AB ( punti noti ) impostando la seguente proporzione: xM e − xA yM e − y A = 32 − 23 x M e − 23 9 9 xB − x A x M e − 23 = = = = = xM e = ⋅ 29 + 23 = 28,4375 y B − y A 150 − 121 169 − 121 29 48 48 PA QA = PM QB P Q In generale si può impostare la seguente tabella: estremi della classe estremi classe frequenze cumulate xi −1 Fi −1 Me FM e xi Fi e ricavare la mediana mediante la formula dell’interpolazione lineare: M e = xi −1 + proprietà della mediana ( xi − xi −1 ⋅ FM e − Fi −1 Fi − Fi −1 ) la somma dei valori assoluti degli scarti dalla mediana è un minimo n ∑x i =1 i − M e = minimo FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 9 di 10 Si chiama primo quartile Q1 di una distribuzione quel valore al di sotto del quale stanno il 25% dei valori della variabile X e al di sopra del quale stanno il 75% dei valori della variabile X; il secondo quartile Q2 coincide con la mediana; il terzo quartile Q3 è quel valore al di sotto del quale stanno il 75% dei valori della variabile X e al di sopra del quale stanno il 25% dei valori della variabile X. Per il calcolo dei quartili si segue il procedimento per il calcolo della mediana: a. si dispongono i valori rilevati in ordine crescente; b. si costruisce la tabella con le frequenze cumulate; c. si verifica se il rapporto N/4 è intero : 1. se N/4 è intero Q1 sarà uguale alla semisomma dei valori che occuperanno le posizioni QUARTILI N N e +1 4 4 Q3 sarà uguale alla semisomma dei valori che occuperanno le posizioni 2. 3N 3 N e +1 4 4 se N/4 non è intero N 4 + 1 3N Q3 sarà uguale al valore che occuperà la posizione 4 + 1 N 3N indica la parte intera della frazione dove il simbolo o 4 4 Q1 sarà uguale al valore che occuperà la posizione DIFFERENZA INTERQUARTILICA MODA M o distribuzione di frequenza valori per classi La differenza Q3 − Q1 è chiamata DIFFERENZA INTERQUARTILICA all’interno della quale si trovano il 50% dei valori della distribuzione. è il valore della distribuzione che si presenta con la maggiore frequenza. ( disco più venduto, giocatore che ha segnato più goal ) indicato con ni le frequenze assolute dei valori xi , la moda è costituita da quel valore x che si ripete più volte, cioè che assume la maggiore frequenza n . • se le classi hanno la stessa ampiezza la classe modale sarà quella con maggiore frequenza; • se le classi hanno diversa ampiezza, 1) si calcolano le ampiezze per ogni classe ai , differenza tra estremo superiore ed estremo inferiore; 2) si calcolano i rapporti ni ; ai 3) la classe modale sarà quella corrispondente al rapporto più grande. Bibliografia : Leti, Statistica descrittiva; Girone-Salvemini , Lezioni di Statistica; Maffè, Statistica; Probabilità e statistica descrittiva Bergamini,Trifone,Barozzi, Zanichelli; La Matematica nell’economia e nella finanza 2 Coeli, Falamischia, Minerva. FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 10 di 10