Statistica Economica Capitolo 2 Prof. Alessandra Michelangeli a.a. 2013-2014 Argomenti della seconda settimana di lezioni Distribuzione di un carattere e sua rappresentazione grafica Distribuzioni unitarie e distribuzioni di frequenza Frequenze assolute, relative, percentuali, cumulate Rappresentazione grafica delle distribuzioni statistiche Grafici a barre o a nastri; istogrammi Grafici a torta; radar Cartogrammi; diagrammi cartesiani Statistica economica a.a. 2013-2014 Le Distribuzioni statistiche Le distribuzioni statistiche descrivono il modo in cui uno o più caratteri si manifestano (distribuiscono) in una data popolazione. Un singolo carattere distribuzioni semplici Due caratteri distribuzioni doppie Più di due caratteri distribuzioni multiple L’elenco delle modalità osservate, unità per unità, si chiama distribuzione unitaria. Statistica economica a.a. 2013-2014 Esempio di distribuzione unitaria semplice. Il carattere statistico è il numero di agenti inquinanti nell’aria per città. Fonte: Istat (2009) Statistica economica a.a. 2013-2014 Esempio di distribuzione doppia semplice I due caratteri statistici studiati sono il tasso di inattività e il tasso di disoccupazione per regione. Tasso di inattività e di disoccupazione della popolazione in età 15-64 anni per regione Regione (unità statistica) Piemonte Valle D'Aosta Lombardia Liguria Trentino-Alto Adige Veneto Friuli-Venezia Giulia Emilia Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Statistica economica Sardegna a.a. 2013-2014 anno 2010: fonte: ISTAT Esempio di distribuzione multipla Di ogni capoluogo di provincia si osserva la modalità di 15 caratteri statistici Statistica economica a.a. 2013-2014 Tasso di inattività (carattere statistico X ) Tasso di disoccupazione (carattere statistico Y ) 31,2 29,5 31 32,5 29 31,6 32,5 28,4 32 32,7 32,4 34,7 39,1 44,1 53,6 48,6 45,8 52,1 49,9 40,5 7,6 4,4 6,5 5,6 3,5 5,8 5,7 5,7 6,1 6,6 5,7 9,3 8,8 8,4 14 13,5 13 11,9 14,7 14,1 Distribuzione di Frequenze assolute • Frequenza assoluta nj • Numero di volte che la modalità di un carattere viene osservata nella popolazione (n) • Distribuzione di frequenze assolute • Associa alle modalità che può assumere un carattere X le corrispondenti frequenze assolute Statistica economica a.a. 2013-2014 La distribuzione di frequenze assolute del carattere X con K modalità osservate su n individui Statistica economica a.a. 2013-2014 X Fr.a. x1 n1 x2 n2 … … xj nj … … xK nK Tot. n Esempio di Distribuzione di frequenze assolute Statistica economica a.a. 2013-2014 L’esempio sui Deputati alla Camera suddivisi per titolo di studio visto la scorsa settimana rappresenta una distribuzione di frequenze assolute. Ogni frequenza assoluta è associata alla modalità di definita su scala ordinale del carattere qualitativo “Titolo di studio”. Statistica economica a.a. 2013-2014 Frequenza relativa e percentuale • La frequenza relativa fi è la frazione della popolazione che presenta la modalità j-esima, fj = nj n • La frequenza percentuale pj è uguale alla frequenza relativa moltiplicata per 100. • E’ possibile ottenere distribuzioni di frequenze relative e percentuali Statistica economica a.a. 2013-2014 Distribuzione di frequenze assolute, relative e percentuali nj n nj n i10 0 Statistica economica a.a. 2013-2014 Distribuzione di frequenze assolute, relative e percentuali Statistica economica a.a. 2013-2014 Esempio di Distribuzione di frequenze assolute, relative e percentuali: residenti stranieri a Milano nel 1991 Fonte: Anagrafe di Milano Statistica economica a.a. 2013-2014 Distribuzione di frequenze assolute, relative e percentuali: residenti stranieri a Milano nel 2001. Fonte: Anagrafe di Milano Statistica economica a.a. 2013-2014 Esempio di Distribuzione di frequenze assolute, relative e percentuali: residenti stranieri a Milano nel 2007. Fonte: Anagrafe di Milano Statistica economica a.a. 2013-2014 Distribuzioni di frequenze relative e percentuali Il passaggio dalla distribuzione semplice assoluta a quella relativa o percentuale diventa significativo quando si vogliono confrontare due o più collettivi rispetto a un carattere. Statistica economica a.a. 2013-2014 Distribuzione unitaria: numero di abitanti per città Statistica economica a.a. 2013-2014 Distribuzione di frequenze assolute, relative e percentuali: numero di abitanti per città Le 4 classi in cui sono raggruppate le modalità del carattere statistico rappresentano, rispettivamente, le città piccole, medio-piccole, medie e grandi. Statistica economica a.a. 2013-2014 Numero e ampiezza delle classi Il numero delle classi e la loro ampiezza dipendono dal particolare oggetto dell’indagine statistica. L’estremo inferiore della prima classe e superiore dell’ultima classe possono non essere specificati. Se occorre, devono essere opportunamente imputati. Statistica economica a.a. 2013-2014 Densità di frequenza La densità di frequenza è ottenuta dividendo la frequenza (assoluta/relativa/percentuale) per l’ampiezza della classe. dj = nj aj fj dj = aj pj dj = aj Statistica economica a.a. 2013-2014 Ipotesi implicita nella costruzione degli istogrammi La frequenza si distribuisce uniformemente all’interno di ogni classe. Data questa ipotesi, se una classe viene divisa in più sottoclassi, la rappresentazione grafica rimane identica. Statistica economica a.a. 2013-2014 Istogramma: numero di abitanti per città dj 0,7961 0,3689 0,0898 0,0023 50 100 Statistica economica a.a. 2013-2014 Istogramma: numero di abitanti per città (programma econometrico statistico STATA) Statistica economica a.a. 2013-2014 500 3000 Numero di abitanti (migliaia) Poligonale di frequenze Unisce i punti centrali delle basi superiori dei rettangoli dell’istogramma. Facilita il distribuzioni. confronto di due o più Esempio con la popolazione dei contribuenti in Italia e la popolazione dei contribuenti proprietari dell’abitazione in cui risiedono. Statistica economica a.a. 2013-2014 Costruiamo le poligonali di frequenze per questo caso (I) Statistica economica a.a. 2013-2014 Costruiamo le poligonali di frequenze per questo caso (II) Statistica economica a.a. 2013-2014 Poligonali di frequenze: le due distribuzioni a confronto dj 3,40 2,91 2,85 2,56 0,78 0,58 0,13 0,11 0,009 0,008 10 26 Statistica economica a.a. 2013-2014 55 75 100 Reddito (migliaia di euro) Poligonali di frequenze: le due distribuzioni a confronto dj 3,40 Contribuenti 2,91 2,85 2,56 Contribuenti proprietari di case 0,78 0,58 0,13 0,11 0,009 0,008 10 26 75 55 100 Reddito (migliaia di euro) Statistica economica a.a. 2013-2014 Frequenza cumulata La frequenza cumulata di una classe è data dalla somma della frequenza della delle classi precedenti. classe Frequenza assoluta cumulata j N j = ∑ ni i =1 Frequenza relativa cumulata j Fj = ∑ fi i =1 Frequenza percentuale cumulata j Fj = ∑ p i Statistica economica a.a. 2013-2014 i=1 con quella Costruiamo la funzione di ripartizione (I) Statistica economica a.a. 2013-2014 Costruiamo la funzione di ripartizione (II) Statistica economica a.a. 2013-2014 Alcune rappresentazioni grafiche • Grafici a nastri • Grafici a barre per caratteri qualitativi non ordinati per caratteri qualitativi ordinati, caratteri quantitativi discreti • Istogrammi • Grafici a torta per caratteri qualitativi non ordinati o ordinati ciclici • Grafici radar per caratteri ciclici • • Cartogrammi per serie territoriali Diagrammi cartesiani per serie storiche per caratteri quantitativi suddivisi in classi Statistica economica a.a. 2013-2014 Esempio di grafico a nastri Tasso di inattività (%) Tasso di inattiv ità in e tà 15-64 anni pe r re gione , anno 2010 fonte Istat Sardegna Sicilia Calabria Basilicata Puglia Campania Molise Abruzzo Lazio Marche Umbria Toscana Emilia Romagna Friuli-Venezia Giulia Veneto Trentino-Alto Adige Liguria Lombardia Valle D'Aosta Piemonte 40,5 49,9 52,1 45,8 48,6 53,6 44,1 39,1 34,7 32,4 32,7 32 28,4 32,5 31,6 29 32,5 31 29,5 31,2 0 10 20 30 Re gione Statistica economica a.a. 2013-2014 40 50 60 Esempio di grafico a nastri multipli Tasso di inattività (%) Tasso di inattività e di disoccupazione in età 15-64 anni per regione, anno 2010 fonte Istat 14,1 14,7 11,9 13 13,5 14 Sardegna Sicilia Calabria Basilicata Puglia Campania Molise Abruzzo Lazio Marche Umbria Toscana Emilia Romagna Friuli-Venezia Giulia Veneto Trentino-Alto Adige Liguria Lombardia Valle D'Aosta Piemonte 40,5 49,9 52,1 45,8 48,6 53,6 8,4 8,8 9,3 44,1 39,1 34,7 32,4 32,7 32 5,7 6,6 6,1 5,7 5,7 5,8 28,4 32,5 31,6 3,5 29 5,6 6,5 32,5 31 29,5 31,2 4,4 7,6 0 10 20 30 40 50 60 Regione Tasso di inattività Tasso di disoccupazione Statistica economica a.a. 2013-2014 Istogramma L’istogramma è un grafico costituito da barre non distanziate, dove ogni barra possiede un’area proporzionale alla frequenza della classe. 8 7 6 5 4 3 2 1 0 10 Statistica economica a.a. 2013-2014 30 50 70 90 Esempio di grafico a torta Statistica economica a.a. 2013-2014 Esempio di grafico radar BE Inc o me α=‐0.5 0,4 UK 0,3 DK 0,2 0,1 ES 1994 DE 0,0 PT IE IT Da Croci Angelini Michelangeli (2012) Statistica economica a.a. 2013-2014 2001 Esempio di cartogramma Statistica economica a.a. 2013-2014 Da Colombo, Michelangeli, Stanca (2012) Esempio di diagramma cartesiano Statistica economica a.a. 2012-2013 Da Michelangeli e Zanardi (2009) Riferimenti bibliografici • Capitolo 2 del Borra, Di Ciaccio. • Svolgere esercizi 2.4, 2.8, 2.10 a pagina 49 e 50 del Borra Di Ciaccio. Statistica economica a.a. 2013-2014