Analisi dei Dati - Prof. Marozzi DIPENDENZA O CONNESSIONE Due caratteri X e Y congiuntamente considerati si dicono tra loro connessi quando le modalità di un carattere influenzano il manifestarsi delle modalità dell’altro. Ovvero quando la conoscenza della modalità di X presente su un’unità è informativa della presenza della modalità di Y. Es. Scommessa su quale tra due persone nascoste è un maschio sapendo che la prima è alta 200cm e la seconda 150cm. Altro es. Consideriamo la seguente tabella: X Y y1 y2 y3 y4 totale x1 56 2 3 12 73 x2 7 34 3 9 53 x3 7 4 54 9 74 totale 70 40 60 30 200 Domanda: cosa possiamo dire del legame esistente tra X e Y? Analisi dei Dati - Prof. Marozzi E’ necessaria l’ispezione delle distribuzioni condizionate (frequenze relative). Condizionate di X X y1 y2 y3 y4 Marg. x1 0,8 0,05 0,05 0,4 0,37 x2 0,1 0,85 0,05 0,3 0,27 x3 0,1 0,1 0,9 0,3 0,37 1 1 1 1 1 Sapendo che Y=y3, quale tra x1, x2 e x3 siamo portati a scommettere sia presente in una unità? Condizionate di Y Y y1 y2 y3 y4 x1 0,77 0,03 0,04 0,16 1 x2 0,13 0,64 0,06 0,17 1 x3 0,09 0,05 0,73 0,12 1 Marg. 0,35 0,20 0,30 0,15 1 Sapendo che X=x3, quale tra y1, y2, e y4 siamo portati a scommettere sia presente in una unità? Analisi dei Dati - Prof. Marozzi TRE TIPI DI DIPENDENZA DIPENDENZA DOVUTA A RAPPORTO DI CAUSA-EFFETTO, È UNA DIPENDENZA “DIRETTA”. (reddito – consumo) DIPENDENZA “INDIRETTA” QUANDO DUE CARATTERI DIPENDONO TRA LORO A CAUSA DI UNA TERZA VARIABILE NON OSSERVATA (DETTA PER QUESTO LATENTE) (colore occhi – colore capelli) (voto matematica – voto statistica) DIPENDENZA SPURIA: QUANDO È DEL TUTTO CASUALE, OPPURE QUANDO È DIRETTA O INDIRETTA MA CIÒ NON È ANCORA STATO COMPRESO (numero gatti – numero zitelle) (cicogne – case con neonati) (parenti a Natale – panettone) Analisi dei Dati - Prof. Marozzi INDIPENDENZA Due caratteri si dicono indipendenti quando essi non si influenzano vicendevolmente: sapendo che una unità statistica presenta la modalità xi, non siamo in grado di dire alcunché su quale modalità di Y è presente. Es. Consideriamo la seguente tabella: X Y y1 y2 y3 y4 totale x1 12 4 16 8 40 x2 15 5 20 10 50 x3 9 3 12 6 30 totale 36 12 48 24 120 Domanda: cosa possiamo dire del legame esistente tra X e Y? Analisi dei Dati - Prof. Marozzi E’ necessaria l’ispezione delle distribuzioni condizionate (frequenze relative). Condizionate di X X y1 y2 y3 y4 Marg. x1 0,33 0,33 0,33 0,33 0,33 x2 0,42 0,42 0,42 0,42 0,42 x3 0,25 0,25 0,25 0,25 0,25 1 1 1 1 1 Sapendo che Y=y3, quale tra x1, x2 e x3 siamo portati a scommettere sia presente in una unità? Condizionate di Y Y y1 y2 y3 y4 x1 0,3 0,1 0,4 0,2 1 x2 0,3 0,1 0,4 0,2 1 x3 0,3 0,1 0,4 0,2 1 Marg. 0,3 0,1 0,4 0,2 1 Sapendo che X=x3, quale tra y1, y2, e y4 siamo portati a scommettere sia presente in una unità? Analisi dei Dati - Prof. Marozzi RIEPILOGO PER VALUTARE LA PRESENZA DI DIPENDENZA (O CONNESSIONE) TRA DUE CARATTERI CONGIUNTAMENTE CONSIDERATI È NECESSARIO ISPEZIONARE LE DISTRIBUZIONI CONDIZIONATE. DIPENDENZA PERFETTA: LE DISTRIBUZIONI CONDIZIONATE SONO DEGENERI, OVVERO UNA SOLA MODALITÀ SI PRESENTA CON FREQUENZA RELATIVA PARI A 1. INDIPENDENZA IN DISTRIBUZIONE: LE DISTRIBUZIONI CONDIZIONATE SONO SIMILI A COPPIE OVVERO OGNUNA DI ESSE È SIMILE ALLA MARGINALE. MENTRE L’INDIPENZA È SEMPRE RECIPROCA, LA PERFETTA DIPENDENZA NON LO È.