Marilena Pillati - Seminari di Statistica (SVIC) "Le distribuzioni doppie" La distribuzione statistica doppia (o bivariata) Se in un insieme di n unità statistiche si osservano gli stati di grandezza assunti da due caratteri X e Y si ottiene una n-pla statistica bivariata La n-pla bivariata può essere sintetizzata in una distribuzione statistica doppia, dove ogni coppia di modalità è accompagnata dal numero delle unità in cui si sono osservate simultaneamente tali modalità E’ lo strumento più semplice per lo studio simultaneo di due caratteri X e Y La distribuzione statistica doppia x1 x2 . . xh . . . xv y1 n11 n12 . . . n1v n10 y2 n21 n22 . . n1h . . n2h .. . . n2v n20 : : : : : : yi ni1 ni2 . . . : : : : . nih . : yu nu1 nu2 . . . nuv nu0 n01 n02 . . nuh . . n0h . . . n0v n : : niv : : ni0 : 1 Marilena Pillati - Seminari di Statistica (SVIC) "Le distribuzioni doppie" Distribuzioni marginali e distribuzioni condizionate Distribuzioni marginali La distribuzione della X, indipendentemente dalle modalità della Y (ultima riga), si dice distribuzione marginale di X La distribuzione della Y, indipendentemente dalle modalità della X (ultima colonna) si dice distribuzione marginale di Y Distribuzioni condizionate Le distribuzioni della X, in corrispondenza di ciascuna modalità della Y, si dicono distribuzioni condizionate di X Le distribuzioni della Y, in corrispondenza di ciascuna modalità della X si dicono distribuzioni condizionate di Y Distribuzioni delle frequenze relative { Rapportando le frequenze di una distribuzione doppia al numero n delle unità si ottiene la distribuzione congiunta delle frequenze relative { Rapportando le frequenze di ciascuna colonna ai totali di colonna n0i si ottengono le distribuzioni delle frequenze relative condizionate della Y { Rapportando le frequenze di ciascuna riga ai totali di riga ni 0 si ottengono le distribuzioni delle frequenze relative condizionate della X { Rapportando le frequenze marginali di riga o di colonna al numero n delle unità si ottengono le distribuzioni delle frequenze relative marginali 2 Marilena Pillati - Seminari di Statistica (SVIC) "Le distribuzioni doppie" Residenti nella provincia di Bologna per classi di età e nazionalità Classi di età Italiani Stranieri Totale 0-14 anni 100474 10843 111317 15-39 anni 252921 31074 283995 40-64 anni 312832 13071 325903 65 anni e oltre 222228 836 223064 888455 55824 944279 Totale Residenti nella provincia di Bologna per classi di età e nazionalità (distribuzioni percentuali condizionate) Italiani Stranieri 0-14 anni Età 11,31% 19,42% 15-39 anni 28,47% 55,66% 40-64 anni 35,21% 23,41% 65 anni e oltre 25,01% 1,50% 100% 100% Stranieri Totale Età Italiani 0-14 anni 90,26% 9,74% 100% 15-39 anni 89,06% 10,94% 100% 40-64 anni 95,99% 4,01% 100% 65 anni e oltre 99,63% 0,37% 100% 3 Marilena Pillati - Seminari di Statistica (SVIC) "Le distribuzioni doppie" Popolazione residente nel Comune di Bologna per grandi classi di età e sesso al 31 dicembre 2004 Maschi Femmine 19.350 18.358 24.595 23.187 45.473 44.890 46.494 51.950 38.943 61.185 174.855 199.570 Età 0-14 15-29 30-44 45-64 65 e oltre Totale Totale 37.708 47.782 90.363 98.444 100.128 374.425 Distribuzione di frequenze relative marginali Età 0-14 15-29 30-44 45-64 65 e oltre Totale Maschi Femmine 0,51 0,49 0,51 0,49 0,50 0,50 0,47 0,53 0,39 0,61 0,47 0,53 Totale 1,00 1,00 1,00 1,00 1,00 1,00 Età 0-14 15-29 30-44 45-64 65 e oltre Totale Maschi Femmine 0,11 0,09 0,14 0,12 0,26 0,22 0,27 0,26 0,22 0,31 1,00 1,00 Totale 0,10 0,13 0,24 0,26 0,27 1,00 Grafico a barre dei residenti nella provincia di Bologna per classi di età e nazionalità 65 e oltre 60-64 anni 55-59 anni 50-54 anni 45-49 anni 40-44 anni 35-39 anni 30-34 anni 25-29 anni 20-24 anni 15-19 anni 10-14 anni 5-9 anni ITALIANI 0-4 anni STRANIERI 0 20000 40000 60000 80000 100000 120000 140000 160000 180000 200000 4 Marilena Pillati - Seminari di Statistica (SVIC) "Le distribuzioni doppie" Residenti nella provincia di Bologna per classi di età e nazionalità (distribuzioni cumulate) Classi di eta' lavorativa e non Frequenze assolute Frequenze cumulate ITALIANI STRANIERI ITALIANI STRANIERI 0-14 anni 100.474 10.843 100.474 10.843 15-39 anni 252.921 31.074 353.395 41.917 40-64 anni 312.832 13.071 666.227 54.988 888.455 55.824 65 anni e oltre 222.228 836 TOTALE 888.455 55.824 Classi di eta' lavorativa e non Frequenze relative Frequenze relative cumulate ITALIANI STRANIERI ITALIANI STRANIERI 0-14 anni 11.3% 19.4% 11.3% 19.4% 15-39 anni 28.5% 55.7% 39.8% 75.1% 40-64 anni 35.2% 23.4% 75.0% 98.5% 65 anni e oltre 25.0% 1.5% 100.0% 100.0% 100.0% 100.0% TOTALE Esempio L’ATTIVITÀ CONGRESSUALE ITALIANA NEL PRIMO SEMESTRE 2000 DISTRIBUZIONE DEI CONGRESSI PER PROMOTORE E STRUTTURA OSPITANTE PROMOTORI Imprese Enti Pubblici Sindacati Ass. scientifiche Ass. religiose Ass. culturali Ass. sportive Totale Alberghi 19789 54,56% 3411 9,40% 4234 11,67% 3975 10,96% 788 2,17% 2531 6,98% 1545 4,26% 36273 100,00% Centri congressi 8080 36,63% 4259 19,31% 4863 22,05% 2344 10,63% 631 2,86% 1389 6,30% 491 2,23% 22057 100,00% 27869 7670 9097 6319 1419 3920 2036 58330 Totale 47,78% 13,15% 15,60% 10,83% 2,43% 6,72% 3,49% 100,00% 5 Marilena Pillati - Seminari di Statistica (SVIC) "Le distribuzioni doppie" Distribuzione di 330 investitori rispetto alla professione e al tipo di investimento finanziario preferito Tipo di investimento preferito Professione fondi azionari fondi obbligazionari azioni titoli di stato totale Medico 30 25 15 0 70 Avvocato 29 34 12 6 81 Commercialista 50 35 29 15 129 Altro 21 14 10 5 50 130 108 66 26 330 Totale Distribuzione di frequenze relative congiunta e marginali Tipo di investimento preferito Professione fondi azionari fondi obbligazionari azioni titoli di stato totale Medico 0.091 0.076 0.045 0.000 0.212 Avvocato 0.088 0.103 0.036 0.018 0.245 Commercialista 0.152 0.106 0.088 0.045 0.391 Altro 0.064 0.042 0.030 0.015 0.152 Totale 0.394 0.327 0.200 0.079 1.000 6 Marilena Pillati - Seminari di Statistica (SVIC) "Le distribuzioni doppie" Distribuzioni condizionate Tipo di investimento preferito fondi azionari fondi obbligazionari azioni titoli di stato totale Medico 0.231 0.231 0.227 0.000 0.212 Avvocato 0.223 0.315 0.182 0.231 0.245 Commercialista 0.385 0.324 0.439 0.577 0.391 Altro 0.162 0.130 0.152 0.192 0.152 1 1 1 1 1 Professione Totale Tipo di investimento preferito fondi azionari fondi obbligazionari azioni titoli di stato totale Medico 0.429 0.357 0.214 0.000 1 Avvocato 0.358 0.420 0.148 0.074 1 Commercialista 0.388 0.271 0.225 0.116 1 Altro 0.420 0.280 0.200 0.100 1 Totale 0.394 0.327 0.200 0.079 1 Professione Medie e misure di variabilità in una distribuzione statistica doppia { { In una distribuzione doppia per caratteri quantitativi possono essere determinate oltre alle medie e alle varianze marginali, le medie e le varianze condizionate Per esse valgono tutte le considerazioni fatte per la media aritmetica e la varianza 7 Marilena Pillati - Seminari di Statistica (SVIC) "Le distribuzioni doppie" Media aritmetica condizionata Media aritmetica di X condizionata H 1 M a (X | Y = y i ) = ni 0 ∑x n j ij j =1 Media aritmetica di Y condizionata K 1 M a (Y | X = x h ) = noh ∑y n j jh j =1 Varianza condizionata Varianza di X condizionata 1 V (X | Y = y i ) = ni 0 2 H ∑ (x j ) − Ma (X | Y = y i ) nij j =1 Varianza di Y condizionata 1 V (Y | X = x h ) = n0h 2 K ∑ (y j ) − M a (Y | X = x h ) n jh j =1 8