Modulo STATISTICA DESCRITTIVA 1 Unità Didattiche: 1 – La Statistica 2 – Le elaborazioni statistiche OBIETTIVI DIDATTICI 2 SAPERE: illustrare le fasi di una indagine statistica; definire e riconoscere le medie statistiche; definire e riconoscere la moda e la mediana; illustrare il concetto di variabilità; definire e riconoscere i rapporti statistici; SAPER FARE: la rappresentazione di dati statistici attraverso tabelle e grafici; la lettura e l’interpretazione di tabelle e grafici di dati statistici; il calcolo delle medie statistiche, della moda e della mediana; il calcolo della variabilità; il calcolo dei rapporti statistici. 1 – LA STATISTICA 3 LA STATISTICA 4 La Statistica è l’applicazione del metodo scientifico allo studio dei fenomeni collettivi Statistica Metodologica (S. Descrittiva) raccogliere ed elaborare i dati allo scopo di descrivere i fenomeni collettivi; Statistica Matematica (S. Induttiva) studiare i fenomeni collettivi allo scopo di trarre previsioni relative al comportamento futuro. I FENOMENI COLLETTIVI 5 Insieme di fenomeni singoli, tutti dello stesso tipo: p. es. i fenomeni naturali, sociali, economici, demografici, sanitari, scolastici, … TIPICI fenomeni naturali (caduta di un grave, disintegrazione dell’atomo, reazioni chimiche, …) ATIPICI fenomeni sociali, economici, demografici, sanitari, scolastici, … (frequenza scolastica, tipo di abbigliamento, …) L’INDAGINE STATISTICA 6 POPOLAZIONE insieme omogeneo di elementi (non necessariamente di persone) INDIVIDUO unità statistica, cioè il singolo elemento della popolazione; semplice (se corrisponde ad un singolo elemento, p.es. una persona) - composto (se corrisponde ad un gruppo di elementi, p.es. un nucleo familiare) CARATTERI STATISTICI aspetti della popolazione che devono essere analizzati; qualitativi (titolo di studio, età, sesso, …) o quantitativi (n° di figli, n° di impiegati, quantità prodotte, …); si manifestano in modalità DATI STATISTICI i valori che si ricavano CARATTERI STATISTICI 7 C. QUALITATIVI espressi in forma verbale, possono avere varie manifestazioni. Esempi: Colore degli occhi: celesti, grigi, neri, … Titolo di studio: l. elementare, l. media, diploma, laurea C. QUANTITATIVI espressi da un numero, che ne rappresenta il valore, in modo discreto oppure continuo. Esempi: Numero di figli in una famiglia Temperature di una località MUTABILE STATISTICA carattere statistico qualitativo VARIABILE STATISTICA carattere statistico quantitativo FREQUENZA n° di volte in cui si è manifestata la modalità INTENSITA’ misura della modalità LE FASI DELL’INDAGINE STATISTICA 8 1) Analisi del fenomeno 2) Rilevazione (raccolta e spoglio) dei dati 3) Rappresentazione (tabulare e grafica) dei dati 4) Elaborazione (matematica) dei dati 5) Interpretazione dei dati LE TABELLE E I GRAFICI 9 T. a semplice entrata si rappresenta un solo carattere c. quantitativo, si parla di seriazione statistica c. qualitativo, si parla di serie statistica s. s. s. s. s. storica (temporale) geografica (territoriale) rettilinea ciclica sconnessa T. a doppia entrata si rappresentano due o più caratteri t. di contingenza, se i caratteri sono entrambi qualitativi, t. di correlazione, se i caratteri sono entrambi quantitativi, t. miste, se uno è qualitativo e l’altro è quantitativo Grafici diagrammi in coordinate cartesiane o polari, istogrammi, ortogrammi, areogrammi, cartogrammi, ideogrammi ESEMPIO 1 – serie statistica 10 Distribuzione degli studenti italiani secondo il tipo di scuole (A.s. 1984/85, ISTAT, Annuario Statistico Italiano, 1985, pag. 137) Tipi di scuole Materne Elementari Medie Superiori TOTALE N 1 2 3 4 N° alunni iscritti 1.639.377 3.909.365 2.797.766 2.546.772 10.893.280 Esprime le frequenze del fenomeno “Iscrizioni scolastiche” secondo le modalità del carattere qualitativo “Tipi di scuole" DIAGRAMMA CARTESIANO AREOGRAMMA (N° alunni iscritti per tipo di scuola) 15% 23% Elementari Medie Superiori N° alunni iscritti Materne 4.000.000 3.500.000 3.000.000 2.500.000 2.000.000 1.500.000 36% 26% 1 2 3 Tipi di scuole 4 ESEMPIO 1- bis 11 N° alunni iscritti ORTOGRAMMA 4.000.000 3.500.000 3.000.000 2.500.000 2.000.000 1.500.000 1.000.000 500.000 0 ORTOGRAMMA Ogni rettangolo ha per base un segmento generico e l’altezza proporzionale alla frequenza Materne Elementari Medie Superiori Tipi di scuole ISTOGRAMMA 4.000.000 3.500.000 3.000.000 Materne 2.500.000 ISTOGRAMMA Ogni rettangolo ha per base un segmento proporzionale alla modalità e la sua area è proporzionale alla frequenza. Elementari 2.000.000 Medie 1.500.000 Superiori 1.000.000 500.000 0 N° alunni iscritti Se le basi sono tutte uguali, le altezze sono proporzionali alle frequenze, come nell’ORTOGRAMMA. ESEMPIO 2 – serie storica 12 Depositi a risparmio delle aziende di credito (valori assoluti in milioni di lire) (ISTAT, Annuario Statistico Italiano, 1985, pag. 506) Anni 1979 1980 1981 1982 1983 Esprime le intensità del fenomeno "Risparmio in depositi bancari" secondo le modalità del carattere qualitativo "Tempo-Anni" DIAGRAMMA CARTESIANO 180.000 AREOGRAMMA Depositi a risparmio (in miliardi di lire) 15% 26% 17% 23% 170.000 160.000 150.000 140.000 130.000 120.000 110.000 100.000 19% 1979 Depositi a risparmio (in miliaridi di lire) Depositi a risparmio (miliardi di lire) 101.630 112.939 124.817 148.403 169.554 1980 1981 1982 1979 1983 1980 1981 Anni 1982 1983 ESEMPIO 3 – serie ciclica 13 Temperatura media nella città di VERONA nel 1990 Temperatura C° 5 8 10 14 16 21 25 21 18 15 10 6 Esprime le intensità del fenomeno "Temperatura media di una località in C°" secondo le modalità del carattere qualitativo "Tempo-Mesi" DIAGRAMMA CARTESIANO 30 Temperature in C° Mesi Gennaio Febbraio Marzo Aprile Maggio Giugno Luglio Agosto Settembre Ottobre Novembre Dicembre 25 20 15 10 5 0 1 2 3 4 5 6 Mesi 7 8 9 10 11 12 ESEMPIO 5 – serie storica 14 Distribuzione mensile dei matrimoni celebrati in un determinato Comune Anni 1989 e 1990 N° matrimoni (migliaia) 1989 1990 32 28 25 30 16 21 42 39 30 35 34 38 25 21 38 33 45 51 42 43 23 27 34 31 386 397 Mesi Gennaio Febbraio Marzo Aprile Maggio Giugno Luglio Agosto Settembre Ottobre Novembre Dicembre TOTALI DIAGRAMMA POLARE (radar) Distribuzione dei matrimoni Gennaio 60 Dicembre Febbraio 50 40 Novembre Marzo 30 20 1989 ISTOGRAMMA Ottobre 50 0 Aprile 40 30 Settembre 20 Maggio 10 Agosto Mesi Dicembre Novembre Ottobre Settembre Agosto Luglio Giugno Maggio Aprile Marzo Febbraio 0 Gennaio N° matrimoni (in migliaia) 10 1990 60 Giugno Luglio 1989 1990 ESEMPI 11 e 12 – tabelle a doppia entrata 15 Distribuzione della popolazione del Piemonte secondo il sesso e le province di residenza (ISTAT, 1985, pag. 21) Province Torino Vercelli Novara Cuneo Asti Alessandria TOTALI Sesso Maschi Femmine 1.129.899 1.194.474 187.804 206.838 243.151 262.200 269.790 275.717 103.741 110.314 222.719 240.715 2.157.104 2.290.258 TOTALI 2.324.373 394.642 505.351 545.507 214.055 463.434 4.447.362 Tabella di contingenza Caratteri entrambi qualitativi (mutabile statistica doppia) Distribuzione di 100 abitazioni secondo il numero di vani ed i componenti della famiglia N° vani 1 2 3 4 5 TOTALI 1 10 6 3 1 0 20 Componenti famiglia 2 3 4 5 4 1 0 0 10 5 2 0 10 12 8 2 3 8 4 2 1 2 1 1 28 28 15 5 6 0 0 1 2 1 4 TOTALI 15 23 36 20 6 100 Tabella di correlazione Caratteri entrambi quantitativi (variabile statistica doppia) 2 – LE ELABORAZIONI STATISTICHE 16 TIPI DI ELABORAZIONI STATISTISCHE Le medie (indici di posizione) Medie di calcolo (m. ferme): aritmetica, geometrica, quadratica, armonica Medie di posizione (m. lasche): mediana, moda La variabilità (indici di variabilità) Campo di variazione (o di escursione), Scarto semplice medio, Scarto quadratico medio, Coefficiente di variazione (di variabilità), Concentrazione I rapporti statistici R. di composizione, di derivazione, di frequenza, di durata Numeri indici 17 MEDIA ARITMETICA 18 N xi yi 1 x1 y1 2 x2 y2 . . . Semplice: n x1 + x2 + ... + xn Ms = = n ∑x i =1 i n Ponderata: . n . n xn yn ∑ ∑ x1 ⋅ y1 + x2 ⋅ y2 + ... + xn ⋅ yn Mp = = y1 + y2 + ... + yn ∑x ⋅y i i =1 n ∑y i =1 i i MEDIA GEOMETRICA 19 N xi yi 1 x1 y1 2 x2 y2 Semplice: Gs = n x1 ⋅ x2 ⋅ ... ⋅ xn = n n ∏x i i =1 . . . Ponderata: . G p = x1 ⋅ x2 ⋅ ... ⋅ xn N . n xn yn ∏ ∑ y1 y2 yn = n N ∏x i =1 n N = ∑ y1 + y2 + ... + yn i =1 yn n MEDIA ARMONICA 20 N xi yi 1 x1 y1 2 x2 y2 . . . Semplice: As = n 1 1 1 + + ... + x1 x2 xn = n n 1 ∑ i =1 xi Ponderata: . n . n xn yn ∑ y1 + y2 + ... + yn Ap = = yn y1 y2 + + ... + x1 x2 xn ∑y i =1 n i yi ∑ i =1 xi MEDIA QUADRATICA 21 N xi yi 1 x1 y1 2 x2 y2 . Semplice: n Qs = x12 + x22 + ... + xn2 = n 2 x ∑ i i =1 n . . Ponderata: . . n xn yn ∑ Qp = x12 ⋅ y1 + x22 ⋅ y2 + ... + xn2 ⋅ yn = y1 + y2 + ... + yn n 2 x ∑ i ⋅ yi i =1 n ∑y i =1 i OSSERVAZIONI 22 M. Aritmetica è la più utilizzata perché rappresenta il valore di equidistribuzione del fenomeno M. Geometrica si utilizza: • se i dati statistici sono tutti positivi • quando ha senso moltiplicare fra di loro i dati statistici M. Quadratica si utilizza: • per eliminare l’effetto del segno • se i valori sono o molto piccoli oppure molto grandi M. Armonica si utilizza se ha senso calcolare gli inversi A<G<M<Q ESEMPI DI MEDIA ARITMETICA 23 Confronto dei due gruppi frequenza frequenza valore A B centrale classi 1,20 - 1,40 1,40 - 1,60 1,60 - 1,80 1,80 - 2,00 2,00 - 2,20 2 6 8 5 1 22 1 3 8 3 1 16 1,30 1,50 1,70 1,90 2,10 xy A xy B 2,60 9,00 13,60 9,50 2,10 36,80 1,30 4,50 13,60 5,70 2,10 27,20 Mp(A) = 1,67 Mp(B) = 1,70 9 8 7 Frequenze Gruppo A Gruppo B misura misura N° ordine del salto N° ordine del salto (m) (m) 1 1,36 1 1,95 2 1,46 2 2,16 3 1,62 3 1,95 4 1,54 4 1,84 5 1,94 5 1,62 6 1,85 6 1,74 7 1,75 7 1,78 8 1,88 8 1,64 9 1,61 9 1,30 10 1,90 10 1,62 11 1,65 11 1,72 12 1,53 12 1,58 13 1,36 13 1,75 14 1,67 14 1,45 15 1,46 15 1,73 16 1,60 16 1,48 17 1,50 27,31 18 1,67 19 1,65 Ms(A) = 1,67 20 1,78 Ms(B) = 1,71 21 2,12 22 1,86 36,76 6 5 4 3 2 1 0 1,20 - 1,40 1,40 - 1,60 1,60 - 1,80 1,80 - 2,00 Classi frequenza A frequenza B 2,00 - 2,20 ESEMPI DI MEDIA GEOMETRICA SEMPLICE 24 Anno Prezzo (Euro) 1990 1991 1992 1993 1994 5,8 6,4 6,6 6,2 6,8 Variazione rispetto all'anno precedente 1,1034 1,0313 0,9394 1,0968 Gs = 1,0406 Tasso medio di variazione dei prezzi = 4,06% Anno Produzione (tonnellate) 1992 1993 1994 1995 1996 1997 98,0 125,0 145,5 143,0 165,0 213,0 Variazione rispetto all'anno precedente 1,2755 1,1640 0,9828 1,1538 1,2909 Gs = 1,1680 Tasso medio di variazione della produzione = 16,80% ESEMPI DI MEDIA ARMONICA SEMPLICE 25 Tempo Prezzo al litro della benzina (Euro) I II III IV 0,96 1,02 1,05 1,08 1/x 1,04 0,98 0,95 0,93 3,90 As = 1,03 Costo medio di 1 litro di benzina = Giorno della settimana Tempo (min) impiegato per percorrere 14 km Velocità media (km/h) 30 20 24 21 35 28 42 35 40 24 Lunedì Martedì Mercoledì Giovedì Venerdì As = 32,31 Velocità media = km/h 32,31 € 1,03 1/x Città Prezzo unitario (Euro) 0,04 0,02 0,03 0,03 0,04 0,15 Milano Francoforte Marsiglia Bruxelles 0,85 0,70 1,10 0,95 As = 0,88 Potere d'acquisto = 1/x 1,18 1,43 0,91 1,05 4,57 1,14 ESEMPI DI MEDIA QUADRATICA 26 1) 2) La seguente tabella riporta le variazioni Siano dati 7 quadrati: uno di lato 3 m, uno di della temperatura relative ad alcuni giorni lato 4 m, due di lato 7 m e tre di lato 10 m. di una settimana rispetto alla temperatura Volendo sostituirli con sette quadrati uguali media stagionale. Calcolare il valore della aventi complessivamente la stessa area, variazione media della temperatura. calcolare la misura comune del lato. Giorni Variazioni di temperatura (°C) Lunedì Martedì Mercoledì Giovedì Venerdì -2,5 1,5 0,8 -1,5 -2,4 2 x 6,25 2,25 0,64 2,25 5,76 17,15 lato quadrati x N. quadrati y 3 4 7 10 1 1 2 3 7 Qp = Qs = 1,85 7,77 x2 x2y 9 16 49 100 9 16 98 300 423 MODA, MEDIANA E FRATTILI 27 La MODA (o valore normale) di una distribuzione statistica ordinata in senso crescente è il dato al quale corrisponde la massima frequenza. La MEDIANA (o valore mediano) di una distribuzione statistica ordinata in senso crescente è il dato che bipartisce la distribuzione. • Se i dati sono in n° dispari la mediana è il dato che occupa la posizione centrale; • Se i dati sono in n° pari la mediana è la media aritmetica dei due dati che occupano la posizione centrale; • Se i dati hanno le frequenze, anche se suddivise in classi, si devono calcolare le frequenze cumulate. I FRATTILI di una distribuzione statistica ordinata in senso crescente sono i dati che dividono in parti uguali la distribuzione: • Quartili, dividono in 4 parti: Q1, Q2, Q3 (Q2 è la mediana) • Decili, dividono in 10 parti; D1, D2, … D9 • Percentili, dividono in 100 parti; P1, P2, … P99 ESEMPI DI MODA 28 6 10 9 5 8 Valori con frequenze 1 2 5 1 2 1 1 1 1 1 Massima frequenza = 5 Moda = 3 Frequenza N. alunni 4 5 6 7 8 2 9 3 9 2 N°alunni 1 2 3 4 5 7 8 10 12 15 Voto Frequenze Valori Frequenze discreti 7 4 3 2 4 2 1 1 0 0 2 3 4 9 5 7 8 10 12 Valori Tempo Frequenza impiegato N. alunni (min) Tempo impiegato (min) 73 240 190 121 32 5 Frequenza max. = Classe Modale = 00 - 10 10 - 15 15 - 20 20 - 25 25 - 35 35 - 45 45 - 60 240 10 - 20 15 4 5 6 7 8 Voti Classi di ampiezza uguale 00 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 5 3 1 Frequenza max. = Moda = 5 e 7 6 Classi di ampiezze diverse Rapporto tra Frequenza Ampiezza Frequenza ed N. alunni classe Ampiezza classe 73 10 7,3 106 5 21,2 134 5 26,8 143 5 28,6 158 10 15,8 35 10 3,5 12 15 0,8 Massimo rapporto Frequenza/Ampiezza classe = Classe Modale = 20 - 25 29 ESEMPI DI MEDIANA 29 Valori singoli Valori ordinati in senso crescente 4 7 8 9 10 12 55 1 2 3 4 5 6 7 Mediana = 9 Valori 36 22 41 8 33 46 38 44 Valori ordinati in senso crescente 8 22 33 36 38 41 44 46 Mediana = 37 1 2 3 4 5 6 7 8 Valori con frequenze Classi di frequenze N° fratelli Frequenza N° allievi Frequenze cumulate 0 1 2 3 4 5 6 3 8 7 4 1 1 1 3 11 18 22 23 24 25 F.C. dispari Mediana = 13 2 Tempo Frequenza Frequenze impiegato N. alunni cumulate (min) 00 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 73 240 190 121 32 5 F.C. dispari Mediana = 331 20,9 73 313 503 624 656 661 ESEMPIO DI MEDIE SEMPLICI 30 Paesi della C.E.E. (anno 1987) Francia Germania Federale Italia Belgio-Lussemburgo Paesi Bassi Danimarca Irlanda Regno Unito Media Aritmetica M = Media Geometrica G = Media Quadratica Q = Media Armonica A = Moda = Mediana = Consumo annuo di 2 alimenti surgelati x x pro-capite (in kg) 5,4 5,4 29,16 6,0 6,0 36,00 2,2 2,2 4,84 6,3 6,3 39,69 9,7 9,7 94,09 13,7 13,7 187,69 3,7 3,7 13,69 13,1 13,1 171,61 SOMME 60,1 576,77 PRODOTTI 2.892.501,3 7,5 6,4 8,5 5,4 Danimarca Paesi Bassi 1/x 0,19 0,17 0,45 0,16 0,10 0,07 0,27 0,08 1,49 Paesi della C.E.E. (anno 1987) Italia Irlanda Francia Germania Federale Belgio-Lussemburgo Paesi Bassi Regno Unito Danimarca Consumo annuo di alimenti surgelati pro-capite (in kg) 2,2 3,7 5,4 6,0 6,3 9,7 13,1 13,7 13,7 è la massima frequenza 30,55 è il caso in cui la frequenza cumulata è dispari Frequenze cumulate 2,2 5,9 11,3 17,3 23,6 33,3 46,4 60,1 ESEMPIO DI MEDIE PONDERATE 31 classi x 5 - 15 15 - 25 25 - 35 35 - 45 45 - 55 55 - 65 frequenza valore y centrale x 2 5 10 12 7 8 44 Media Aritmetica M = Media Geometrica G = Media Quadratica Q = Media Armonica A = Classe modale = Mediana = 10 20 30 40 50 60 210 39,3 36,3 41,8 32,4 35 - 45 39,2 xy x y x 2 xy 2 1/x y/x 20 100 300 480 350 480 1730 1,0000E+02 3,2000E+06 5,9049E+14 1,6777E+19 7,8125E+11 1,6796E+14 4,1599E+68 100 400 900 1600 2500 3600 200 2000 9000 19200 17500 28800 76700 0,10 0,05 0,03 0,03 0,02 0,02 0,20 0,25 0,33 0,30 0,14 0,13 1,36 Classi di uguale ampiezza già ordinate Frequenza massima = 12 Frequenza Cumulata pari, quindi: 44/2 = 22 INTERPOLAZIONE LINEARE 35 17 35+x 22 45 29 (45 - 35) (29 -17) (35+x - 35) (22 -17) 10 12 x 5 x = 10 * 5 / 12 Frequenze cumulate 2 7 17 29 36 44 LA VARIABILITA’ 32 xmax − xmin Campo di variazione (o di escursione): n Scarto semplice medio: SM = n ∑ x −M i =1 i SM = n ∑ x −M ⋅y i =1 i n ∑y i =1 ∑ (x n Scarto quadratico medio: σ = Varianza: σ 2 i =1 i −M n ) ∑ (x σ= Coefficiente di variazione (o di variabilità): i =1 i ) n 2 i 2 − M ⋅ yi i n ∑y i =1 CV = σ M i ESEMPIO DI STUDIO DELLA VARIABILITA’ 33 Da una analisi condotta in un campione di 1000 famiglie del Nord Italia e 1000 famiglie del Sud Italia per rilevare il numero dei locali delle case di abitazione, si sono rilevati i seguenti dati; studiare la variabilità del fenomeno. N. locali 1 2 3 4 5 6 7 Famiglie Famiglie del Nord del Sud 83 113 117 235 325 288 213 215 176 112 68 28 18 9 VARIABILITA’ FAMIGLIE DEL NORD 34 N. locali 1 2 3 4 5 6 7 28 Famiglie del Nord 83 117 325 213 176 68 18 1000 xy x-M |x-M| (x-M)2 |x-M|y (x-M)2y 83 234 975 852 880 408 126 3558 -2 -1 0 1 2 3 4 2 1 0 1 2 3 4 13 4 1 0 1 4 9 16 35 166 117 0 213 352 204 72 1124 332 117 0 213 704 612 288 2266 3 6 1,124 1,505 0,5018 50,18% Media aritmentica M = Campo di variazione = Scostamento semplice medio SM = Scostamento quadratico medio σ = Coefficiente di variazione CV = VARIABILITA’ FAMIGLIE DEL SUD 35 N. locali 1 2 3 4 5 6 7 28 Famiglie del Sud 113 235 288 215 112 28 9 1000 xy x-M |x-M| (x-M)2 |x-M|y (x-M)2y 113 470 864 860 560 168 63 3098 -2 -1 0 1 2 3 4 2 1 0 1 2 3 4 13 4 1 0 1 4 9 16 35 226 235 0 215 224 84 36 1020 452 235 0 215 448 252 144 1746 3 6 1,020 1,321 0,4405 44,05% Media aritmentica M = Campo di variazione = Scostamento semplice medio SM = Scostamento quadratico medio σ = Coefficiente di variazione CV = CONCLUSIONE 36 N. locali 1 2 3 4 5 6 7 N. locali 1 2 3 4 5 6 7 Famiglie del Nord 83 117 325 213 176 68 18 Famiglie del Sud 113 235 288 215 112 28 9 Media aritmentica M = Campo di variazione = Scostamento semplice medio SM = Scostamento quadratico medio σ = Coefficiente di variazione CV = 3 6 1,124 1,505 0,5018 50,18% Media aritmentica M = Campo di variazione = Scostamento semplice medio SM = Scostamento quadratico medio σ = Coefficiente di variazione CV = 3 6 1,020 1,321 0,4405 44,05% Le due distribuzioni hanno lo stesso valore medio, ma quella relativa alle famiglie del Sud presenta una variabilità minore rispetto a quella delle famiglie del Nord, perché ha gli scostamenti medi, semplice e quadratico, e il coefficiente di variazione inferiori. LA CONCENTRAZIONE – METODO DI LORENZ 37 Valori xi Frequenze yi x1 y1 … … ∑ Intensità xy Frequenze ass. cum. Intensità ass.cum. Frequenze rel. cum. Intensità rel.cum. ∑ Intensità rel. cum. D Rapporto di concentrazione area di concentrazione RC = -------------------------------------- = area di concentrazione massima C area triangolo OD’D – somma aree trapezi = -----------------------------------------------area triangolo OD’D B A O A’ Frequenze rel. cum. B’ C’ D’ 0 ≤ RC ≤ 1 IL RAPPORTO DI CONCENTRAZIONE 38 Intensità rel. cum. Intensità rel. cum. B RC = 1 B massima concentrazione spezzata di concentrazione O RC = 0 Frequenze A rel. cum. O Intensità rel. cum. D equidistribuzione C 0 < RC < 1 B concentrazione variabile A O A’ B’ C’ D’ Frequenze rel. cum. FrequenzeA rel. cum. ESEMPIO DI STUDIO DELLA CONCENTRAZIONE 39 Studiare la concentrazione del reddito di 200 persone. Classi di reddito (milioni di €) 0-4 4-8 N° di persone 40 50 Classi 0 0 4 8 12 16 0 4 8 12 16 20 Valori Frequenze Frequenze centrale Intensità xy y ass. cum. x 0 0 0 0 2 40 80 40 6 50 300 90 10 80 800 170 14 20 280 190 18 10 180 200 200 8 - 12 80 12 - 16 20 16 - 20 10 Intensità ass. cum. Frequenze rel. cum. Intensità rel. cum. 0 80 380 1180 1460 1640 0,00 0,20 0,45 0,85 0,95 1,00 0,00 0,05 0,23 0,72 0,89 1,00 Area triangolo = Area triangolo T1 = Area trapezio T2 = Area trapezio T3 = Area trapezio T4 = Area trapezio T5 = RC = 0,5 0,005 0,035 0,190 0,080 0,047 0,2841 Il reddito è poco concentrato. Intensità rel. cum. Grafico di Lorenz 28,41% 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 Frequenze rel. cum . Curva di concentrazione Retta di equidistribuzione 1,00 I RAPPORTI STATISTICI 40 Un rapporto statistico è il rapporto tra due dati statistici, generalmente espresso in percentuale. Rapporto di composizione Rapporto di coesistenza Rapporto di derivazione Rapporto di durata Rapporto di ripetizione Rapporto di densità I numeri indici sono rapporti statistici ottenuti assumendo un dato della distribuzione come base di riferimento; sono generalmente espressi in percentuale. Numeri indici a base fissa Numeri indici a base mobile ESEMPI DI RAPPORTI STATISTICI 41 R. di composizione Distribzione della spesa (in milioni di €) per tipologia di spettacolo in Italia nel 2000. Rapporti di Spesa (in Tipo di spettacolo composizione milioni €) (in %) Teatro e concerti 212.118 11,65 Cinema 303.787 16,68 Trattenimento vari 914.230 50,21 Manifestazioni sportive 390.652 21,46 1.820.787 100,00 R. di derivazione In un Comune si sono rilevati i seguenti dati. Anno N° nati N° morti N° matrimoni 1993 1994 1995 1996 1997 1998 1999 2000 980 794 776 746 731 777 683 597 714 735 705 678 653 593 583 531 53 99 61 53 54 53 47 40 R. di densità Popolazione dell'Italia Settentrionale. Regioni Emilia-Romagna Friuli-Venezia Giulia Liguria Lombardia Piemonte Toscana Trentino-Alto Adige Veneto Val d'Aosta Abitanti (in Superficie Densità migliaia) (in km2) (ab./km2) 3.946 1.244 1.864 8.866 4.542 3.578 869 4.300 114 Quoziente di Quoziente di Quoziente di Popolazione natalità (per mortalità (per nuzialità (per 1000 abitanti) 1000 abitanti) 1000 abitanti) 76.414 12,82 9,34 0,69 76.735 10,35 9,58 1,29 78.018 9,95 9,04 0,78 78.018 9,56 8,69 0,68 78.158 9,35 8,35 0,69 78.707 9,87 7,53 0,67 78.720 8,68 7,41 0,60 78.850 7,57 6,73 0,51 22.122 7.845 5.414 23.851 25.399 22.992 13.613 18.315 3.262 178 159 344 372 179 156 64 235 35 ESEMPIO DI NUMERI INDICI 42 Serie storica della produzione di energia elettrica e di benzina, nel periodo 1984-1988. Numeri indici Numeri indici a Produzione semplici (base: 1984 base mobile = 100) Anni Energia Energia Energia Benzina Benzina Benzina elettrica elettrica elettrica (migliaia (migliaia (migliaia (milioni di (milioni di (milioni di t) di t) di t) kwh) kwh) di kwh) 1984 182.669 16.521 100 100 1985 185.740 17.344 102 105 102 105 1986 192.330 18.125 105 110 104 105 1987 201.372 17.629 110 107 105 97 1988 203.561 17.776 111 108 101 101 Numeri indici semplici (base: 1984=100) Produzione 115 110 105 100 1984 1985 1986 1987 1988 Anni Energia elettrica (milioni di kwh) Benzina (migliaia di t)