27 marzo 2014 Variabili statistiche bivariate. Distribuzioni doppie e condizionate. Dott.ssa Rita Allais Dipartimento di scienze economico-sociali e matematico-statistiche Dipartimento di Management Università degli Studi di Torino PER USO DIDATTICO INTERNO Mutabile e variabile statistica bivariata L’applicazione che associa a ciascuna unità ωα del collettivo Ω uno ed un solo elemento dell’insieme M1x M2 viene detta: – mutabile statistica bivariata (doppia), e indicata con (A,B), se gli elementi di M1 e M2 sono attributi; – variabile statistica mista, e indicata con (A, Y ), se gli elementi di M1 sono attributi e M2 è costituito da elementi di R; – variabile statistica bivariata (doppia), e indicata con (X, Y ), se gli insiemi M1 e M2 sono costituiti da elementi di R. 28/03/2014 Distribuzioni bivariate. Distribuzioni condizionate. 2 Mutabile e variabile statistica bivariata Ω Ω R Altezza in cm R 185 180 170 170 155 Anno imm. 2007 R2 2003 2000 M F Genere Rilevazione di una variabile statistica mista 28/03/2014 2000 4000 Rilevazione di una variabile statistica bivariata Distribuzioni bivariate. Distribuzioni condizionate. 9000 Prezzo dell’usato 3 Distribuzione di frequenze congiunte: tabella a doppia entrata Y y1 … yj … yc a1 n11 … n1j … n1c M M ai ni1 M M ar nr1 … nrj … nrc n r. n.1 … n.j … n.c n A Frequenze congiunte assolute M … nij n1. M … nic M Frequenze marginali di riga n i. c ni • = ∑ nik M k =1 r Frequenze marginali di colonna 28/03/2014 n • j = ∑ n k =1 Distribuzioni bivariate. Distribuzioni condizionate. k j 4 Frequenze condizionate Y A a1 y1 … yj … yc n11 … n1j … n1c n1. ai ni1 … nij … nic n i. ar nr1 … nrj … nrc n r. n.1 … n.j … n.c n Frequenze relative condizionate di Y|ai 28/03/2014 y1 Y a i ≡ n i1 n i• L L yj n ij L L ni • Distribuzioni bivariate. Distribuzioni condizionate. Frequenze relative condizionate di A|yj a1 L ai L ar nij nrj A y j ≡ n1 j L L n• j n• j n• j yc n ic n i • 5 Variabile statistica condizionata. Data una variabile statistica mista (A , Y) definita da Ω a M1 x M2 e scelta una qualunque modalità ai di A, si definisce variabile statistica Y condizionata alla modalità ai di A, Y|ai , l’applicazione che associa a ciascuna unità statistica ωα per cui A ( ωα ) = ai uno ed un solo elemento dell’insieme delle modalità M2. La distribuzione di frequenze relative condizionate sarà dunque y1 Y a i ≡ n i1 n i• 28/03/2014 L L yj n ij ni • Distribuzioni bivariate. Distribuzioni condizionate. L L yc n ic n i • 6 Media e varianza condizionate Nel caso di una variabile mista (A,Y) è possibile calcolare per la componente Y tutti gli indici visti per le v.s. univariate. Si avranno, ad esempio, media e varianza di Y: 1 c E [Y ] = µ Y = y j n• j ∑ n j =1 V [Y ]= σ 2 Y ∑ (y c 1 = n j =1 j ) − µY 2 n• j Inoltre, ciascuna delle r variabili condizionate Y|ai è dotata di una propria media (media condizionata) e varianza (varianza condizionata): c E Y a i = µ V Y a i = σ Y ai 1 n i• = 2 Y ai V Y a i = E Y 28/03/2014 = 1 n i• 2 ∑ y ni j j j=1 c ∑ j=1 y j − µ a i − E Y a i Distribuzioni bivariate. Distribuzioni condizionate. Y ai 2 ni j 2 7 Esempio Rilevazione effettuata sulle abitazioni di un piccolo comune Piemontese riguardante numero di occupanti e numero di stanze delle abitazioni X Y Numero stanze N°occupanti 1 2 3 4 ni. 1 30 139 268 314 751 2 11 87 255 410 763 3 5 43 163 330 541 4 3 25 110 257 395 n.j 49 294 796 1311 2450 [ ] = 1 ⋅ 751 E X [ ]= E Y 28/03/2014 + 2 ⋅ 763 + 3 ⋅ 541 + 4 ⋅ 395 2450 1 ⋅ 49 + 2 ⋅ 294 + 3 ⋅ 796 + 4 ⋅ 1311 = 2 ,2 = 3,4 2450 Distribuzioni bivariate. Distribuzioni condizionate. 8 Distribuzione del numero di stanze per gli alloggi occupati da una sola persona X Y Numero stanze N°occupanti 1 2 3 4 ni. 1 30 139 268 314 751 2 11 87 255 410 763 3 5 43 163 330 541 4 3 25 110 257 395 n.j 49 294 796 1311 2450 1 ⋅ 30 + 2 ⋅ 139 + 3 ⋅ 268 + 4 ⋅ 314 E Y X = 1 = = 3 ,15 751 V Y X = 1 = E Y = 2 X = 1 − E 2 Y X = 1 = 1 2 ⋅ 30 + 2 2 ⋅ 139 + 3 2 ⋅ 268 + 4 2 ⋅ 314 − 3 ,15 2 = 751 = 0 , 7575 28/03/2014 Distribuzioni bivariate. Distribuzioni condizionate. 9 Distribuzione delle persone occupanti abitazioni composte da due camere X Y Numero stanze N°occupanti 1 2 3 4 ni. 1 30 139 268 314 751 2 11 87 255 410 763 3 5 43 163 330 541 4 3 25 110 257 395 n.j 49 294 796 1311 2450 E X Y 1 ⋅ 139 = 2 = V X Y = 2 = E X = 1 2 + 2 ⋅ 87 + 3 ⋅ 43 + 4 ⋅ 25 = 1 ,8 294 2 ⋅ 139 Y = 2 − E + 2 2 ⋅ 87 2 X Y + 3 2 ⋅ 43 = 2 = + 4 2 ⋅ 25 − 1 ,8 2 = 294 = 1 , 09 28/03/2014 Distribuzioni bivariate. Distribuzioni condizionate. 10