DIPENDENZA O CONNESSIONE Due caratteri X e Y

annuncio pubblicitario
Analisi dei Dati - Prof. Marozzi
DIPENDENZA O CONNESSIONE
Due caratteri X e Y congiuntamente considerati
si dicono tra loro connessi quando le modalità
di un carattere influenzano il manifestarsi delle
modalità dell’altro.
Ovvero quando la conoscenza della modalità di
X presente su un’unità è informativa della
presenza della modalità di Y.
Es. Scommessa su quale tra due persone
nascoste è un maschio sapendo che la prima è
alta 200cm e la seconda 150cm.
Altro es. Consideriamo la seguente tabella:
X
Y
y1
y2
y3
y4
totale
x1
56
2
3
12
73
x2
7
34
3
9
53
x3
7
4
54
9
74
totale
70
40
60
30
200
Domanda: cosa possiamo dire del legame
esistente tra X e Y?
Analisi dei Dati - Prof. Marozzi
E’ necessaria l’ispezione delle distribuzioni
condizionate (frequenze relative).
Condizionate di X
X
y1
y2
y3
y4
Marg.
x1
0,8
0,05
0,05
0,4
0,37
x2
0,1
0,85
0,05
0,3
0,27
x3
0,1
0,1
0,9
0,3
0,37
1
1
1
1
1
Sapendo che Y=y3, quale tra x1, x2 e x3 siamo
portati a scommettere sia presente in una unità?
Condizionate di Y
Y
y1
y2
y3
y4
x1
0,77
0,03
0,04
0,16
1
x2
0,13
0,64
0,06
0,17
1
x3
0,09
0,05
0,73
0,12
1
Marg. 0,35
0,20
0,30
0,15
1
Sapendo che X=x3, quale tra y1, y2, e y4 siamo
portati a scommettere sia presente in una unità?
Analisi dei Dati - Prof. Marozzi
TRE TIPI DI DIPENDENZA
DIPENDENZA DOVUTA A RAPPORTO DI
CAUSA-EFFETTO, È UNA DIPENDENZA
“DIRETTA”.
(reddito – consumo)
DIPENDENZA “INDIRETTA” QUANDO DUE
CARATTERI DIPENDONO TRA LORO A
CAUSA DI UNA TERZA VARIABILE NON
OSSERVATA
(DETTA
PER
QUESTO
LATENTE)
(colore occhi – colore capelli)
(voto matematica – voto statistica)
DIPENDENZA SPURIA: QUANDO È DEL
TUTTO CASUALE, OPPURE QUANDO È
DIRETTA O INDIRETTA MA CIÒ NON È
ANCORA STATO COMPRESO
(numero gatti – numero zitelle)
(cicogne – case con neonati)
(parenti a Natale – panettone)
Analisi dei Dati - Prof. Marozzi
INDIPENDENZA
Due caratteri si dicono indipendenti quando essi
non si influenzano vicendevolmente: sapendo
che una unità statistica presenta la modalità xi,
non siamo in grado di dire alcunché su quale
modalità di Y è presente.
Es. Consideriamo la seguente tabella:
X
Y
y1
y2
y3
y4
totale
x1
12
4
16
8
40
x2
15
5
20
10
50
x3
9
3
12
6
30
totale
36
12
48
24
120
Domanda: cosa possiamo dire del legame
esistente tra X e Y?
Analisi dei Dati - Prof. Marozzi
E’ necessaria l’ispezione delle distribuzioni
condizionate (frequenze relative).
Condizionate di X
X
y1
y2
y3
y4
Marg.
x1
0,33
0,33
0,33
0,33
0,33
x2
0,42
0,42
0,42
0,42
0,42
x3
0,25
0,25
0,25
0,25
0,25
1
1
1
1
1
Sapendo che Y=y3, quale tra x1, x2 e x3 siamo
portati a scommettere sia presente in una unità?
Condizionate di Y
Y
y1
y2
y3
y4
x1
0,3
0,1
0,4
0,2
1
x2
0,3
0,1
0,4
0,2
1
x3
0,3
0,1
0,4
0,2
1
Marg.
0,3
0,1
0,4
0,2
1
Sapendo che X=x3, quale tra y1, y2, e y4 siamo
portati a scommettere sia presente in una unità?
Analisi dei Dati - Prof. Marozzi
RIEPILOGO
PER VALUTARE LA PRESENZA DI
DIPENDENZA (O CONNESSIONE) TRA DUE
CARATTERI CONGIUNTAMENTE CONSIDERATI È NECESSARIO ISPEZIONARE LE
DISTRIBUZIONI CONDIZIONATE.
DIPENDENZA
PERFETTA:
LE
DISTRIBUZIONI CONDIZIONATE SONO DEGENERI, OVVERO UNA SOLA MODALITÀ
SI PRESENTA CON FREQUENZA RELATIVA PARI A 1.
INDIPENDENZA IN DISTRIBUZIONE: LE
DISTRIBUZIONI CONDIZIONATE SONO
SIMILI A COPPIE OVVERO OGNUNA DI
ESSE È SIMILE ALLA MARGINALE.
MENTRE L’INDIPENZA È SEMPRE RECIPROCA, LA PERFETTA DIPENDENZA
NON LO È.
Scarica