La dipendenza e
indipendenza statistica
Prof. Daniela Bertozzi
Itis Fauser - Novara
Gli appunti sono stati tratti dal testo
L. Sasso – Matematica a colori Vol. 4 – Petrini
Lo studio di due caratteri X e Y,
rilevati congiuntamente su una data popolazione,
si pone tra i vari obiettivi
anche quello di stabilire se sussiste qualche relazione di
dipendenza tra X e Y
Facciamo un esempio:
Tabella osservata
Tabella teorica di indipendenza
Poiché le due tabelle NON coincidono, concludiamo che i due caratteri X e Y
non sono indipendenti
Attenzione:
È importante notare che, mentre le frequenze congiunte osservate sono numeri interi,
le frequenze teoriche in generale NON lo sono.
La situazione di perfetta indipendenza statistica può quindi realizzarsi solo nel caso in cui
tutte le frequenze teoriche siano valori interi e coincidano con la tabella osservata.
Si può quindi concludere che questo succeda molto raramente.
La misura del grado di dipendenza
Per misurare il grado di dipendenza di due caratteri X e Y dobbiamo quindi confrontare
le due tabelle, quella osservata e quella teorica.
Il il grado di dipendenza sarà tanto più elevato quanto più la tabella delle frequenze
osservate è lontana dalla tabella delle frequenze teoriche.
Esiste un indice che ci permette di determinare questa dipendenza.
L’indice più noto è quello di Karl Pearson e viene indicato
con la lettera greca  ( chi ) elevata al quadrato (si legge chi quadro).
Riprendiamo l’esempio precedente
Tabella osservata
Si pone ora il problema di interpretare questo valore. Il numero trovato indica un legame
forte o debole tra X e Y?
Per rispondere a questa domanda bisogna normalizzare l’indice,
cioè
trasformarlo in un numero compreso tra 0 e 1.
n = numero totale elementi dell’indagine
k e h sono il numero di modalità di X e Y
In riferimento all’esempio svolto
La connessione tra i caratteri X e Y è di circa il 5,6% della massima possibile.
Possiamo quindi concludere che il grado di connessione è molto basso.
Fine
Prof. Daniela Bertozzi
Itis Fauser - Novara