3 aprile 2014 Lezione 12: Dipendenza in media Dott.ssa Rita Allais PhD Dipartimento di scienze economico-sociali e matematico-statistiche Università degli Studi di Torino PER USO DIDATTICO INTERNO Relazioni fra mutabile e variabile Ω = {alberghi della provincia di Torino}, Y = numero camere N = 1089 Media Y = 29,27 Dev. Std. Y = 33,003 V[Y] = 1089,198 3/04/2014 Dipendenza in media 2 Relazione fra mutabile e variabile Ω = {alberghi della provincia di Torino} Y = numero camere, A= categoria dell’albergo Ricodifica: 1= 1 o 2 stelle 2 = 3 stelle 3 =4 stelle 3/04/2014 Dipendenza in media 3 Relazioni fra variabile e mutabile 3/04/2014 Dipendenza in media 4 Dipendenza in media Esiste dipendenza in media fra la variabile Y = numero di camere e la mutabile A = categoria dell’albergo 3/04/2014 Dipendenza in media 5 Indipendenza in media Definizione valida per una variabile statistica mista o doppia Y è indipendente in media da A se le r medie delle variabili condizionate Y |ai sono tutte uguali tra loro, cioè se E[Y |a1] = . . . = E[Y |ai] = . . . = E[Y |ar]= E[Y] 3/04/2014 Indipendenza statistica Indipendenza in media Indipendenza in media Indipendenza statistica Dipendenza in media 6 Indipendenza in media ma non globale Y|a1 11 12 13 14 15 16 17 18 19 20 21 Y|a2 11 12 13 14 15 16 17 18 19 20 21 11 12 13 14 15 16 17 18 19 20 21 E[Y|a1] = 15.5 E[Y|a2 ]= 15.5 Y|a3 3/04/2014 Dipendenza in media E[Y|a3]= 15.5 7 Misura della dipendenza in media Come indice della dipendenza in media prendiamo una appropriata misura di diversità delle medie condizionate. Considerando che la media della distribuzione marginale di Y è la media ponderata delle r medie condizionate E[Y|ai] i= 1, … , r, ovvero r 1 E [Y ] = n ∑ E [Y a ] n i i =1 i• la varianza delle medie condizionate, misura della loro variabilità, è: [ ] V EY A 1 = n ∑ (E [Y a ] − E [Y ]) r i =1 i Dipendenza in media ni • [ ]= 0 Se Y è indipendente in media da A V E Y 3/04/2014 2 A 8 Scomposizione della varianza Data la variabile statistica mista (A, Y), la varianza della sua componente Y è data dalla somma del valor medio delle varianze condizionate più la varianza delle medie condizionate, in simboli vale cioè l’uguaglianza: V [Y ] = E[VY|A] + V [EY|A] Varianza interna ai gruppi o varianza residua non spiegata dove 3/04/2014 Varianza tra i gruppi o varianza spiegata [ ] E VY A 1 = n Dipendenza in media ∑ V [Y r i =1 a i ]n i • 9 Rapporto di correlazione Eta quadro Per misurare l’intensità del legame di dipendenza in media è possibile giungere ad un indice normalizzato, sfruttando la proprietà della scissione della varianza. η 2 Y A = [ ]= varianza tra i gruppi V EY A V [Y ] varianza t otale = 0 INDIPENDENZA IN MEDIA 0 ≤ηY2 A ≤ 1 = 1 MASSIMA DIPENDENZA IN MEDIA 3/04/2014 Dipendenza in media 10 Indipendenza in media: η 2 Y A = ⇔ EY Y [ V EY A ]= 0 ⇔ V [Y ] costante A ⇔ [ 2 η V EY A =0 ]= 0 ⇔ medie condizionate tutte uguali Valori misurati sulle singole unità statistiche E[Y|a1] E[Y] E[Y|ar] E[Y|a2] a1 3/04/2014 a2 Dipendenza in media ar A 11 Massima dipendenza in media: η Y2 A = [ V EY V [Y A ] [ ]= 0 ⇔ E VY A ]= 1 ⇔ ⇔ VY E[Y|ar] E[Y|a2] E[Y] E[Y|a1] 3/04/2014 =1 V E Y A =1 ⇔ V E + E V Y A Y A ⇔ la variabilità è tutta spiegata A = 0 Y a1 2 η a2 Dipendenza in media ar Non esiste variabilità interna ai gruppi: in ogni gruppo i valori misurati sulle singole unità statistiche sono tutti uguali A 12 Nell’esempio… [] V [Y ] = 1089,198 E Y = E E Y V E Y ηY2 A = 15,36 ⋅ 412 + 30,27 ⋅ 546 + 68,85⋅131 A = = 29,27 1089 2 2 2 15 , 36 ⋅ 412 + 30 , 27 ⋅ 546 + 68 , 85 ⋅131 A = − 29,272 = 262,156 1089 262,156 = 0,241 1089,198 3/04/2014 Dipendenza in media 13 Bibliografia Newbold P. , Carlson W., Thorne B. Statistica , Pearson-Prentice Hall Cicchitelli G. Statistica – Principi e Metodi , Pearson –Education R. Corradetti, A. Durio, E. D. Isaia Elementi di Statistica Descrittiva 3/04/2014 Dipendenza in media 14