Master in Neuropsicologia Clinica
Elementi di Statistica I
Analisi bivariata
Per ogni unità statistica si considerano congiuntamente
due variabili:
u.s. 1
Età 25
Sesso M
2
32
M
3
41
F
4
28
M
5
51
M
…
…
…
6
29
M
Classi di età
ni
fi
Sesso
ni
fi
18-29
32
0,16
F
48
0,24
30-41
52
0,26
M
152
0,76
42-53
60
0,30
Totale
200
1,00
54-65
26
0,13
66-77
20
0,10
78-89
8
0,04
90-101
2
0,01
Totale
200
1,00
17 maggio 2008
1 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Perché?
1. Rappresentazione sintetica delle distribuzioni di due
variabili / quantificazione di un fenomeno
2. Valutazione dell’andamento congiunto delle due variabili
3. Valutazione della relazione causa-effetto tra le due
variabili
17 maggio 2008
2 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Sesso
Classi di età
F
M
Totale
18-29
8
24
32
30-41
15
37
52
42-53
11
49
60
54-65
7
19
26
66-77
3
17
20
78-89
3
5
8
90-101
1
1
2
Totale
48
152
17 maggio 2008
200
Sesso
Classi di età
F
M
Totale
18-29
0,040
0,120
0,160
30-41
0,075
0,185
0,260
42-53
0,055
0,245
0,300
54-65
0,035
0,095
0,130
66-77
0,015
0,085
0,100
78-89
0,015
0,025
0,040
90-101
0,005
0,005
0,010
Totale
0,240
0,760
1,000
3 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Tabella a 2 vie k x h
k
n. j   nij
i 1
h
ni.   nij
j 1
k
h
k
h
i 1
j 1
n   nij   ni.   n. j
i 1 j 1
Distribuzione congiunta
Distribuzione marginale
17 maggio 2008
4 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Sesso
Sesso
F
M
18-29
0,167
0,158
0,160
52
30-41
0,313
0,243
0,260
49
60
42-53
0,229
0,322
0,300
7
19
26
54-65
0,146
0,125
0,130
66-77
3
17
20
66-77
0,062
0,112
0,100
78-89
3
5
8
78-89
0,062
0,033
0,040
90-101
1
1
2
90-101
0,021
0,007
0,010
Totale
48
152
200
Totale
1,000
1,000
1,000
Classi di età
F
M
18-29
8
24
32
30-41
15
37
42-53
11
54-65
Classi di età
Totale
Totale
Sesso
Classi di età
17 maggio 2008
F
M
Totale
18-29
0,250
0,750
1,000
30-41
0,288
0,712
1,000
42-53
0,183
0,817
1,000
54-65
0,269
0,731
1,000
66-77
0,150
0,850
1,000
78-89
0,375
0,625
1,000
90-101
0,500
0,500
1,000
Totale
0,240
0,760
1,000
5 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Distribuzione condizionata di X a y1
Distribuzione condizionata di Y a x2
17 maggio 2008
6 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Relazione tra variabili
• Forma:
simmetrica X←→Y
asimmetrica X→Y (causa-effetto / indipendente-dipendente)
• Segno:
variazione concorde
variazione discorde
X↑↓
X↑↓
Y ↑↓
Y ↓↑
+
-
(var. almeno ordinali…)
• Forza:
Sovrappeso
Sì
No
Totale
Pressione
Totale
bassa
media
alta
280
10
10
300
5
290
5
285
300
15
Pressione
Totale
bassa
media
alta
Sì
180
60
60
300
300
No
50
200
50
300
600
Totale
230
260
110
600
Sovrappeso
17 maggio 2008
Sovrappeso
Pressione
Totale
bassa
media
alta
Sì
102
99
99
300
No
98
103
99
300
Totale
200
202
198
600
7 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Rappresentazioni grafiche
50
60
40
50
30
40
20
F
30
M
20
10
10
0
18-29
30-41
M
42-53
54-65
66-77
F
78-89
0
18-29
30-41
42-53
54-65
66-77
78-89
90-101
90-101
60
50
18-29
30-41
40
42-53
30
54-65
66-77
20
78-89
90-101
10
0
F
17 maggio 2008
M
8 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
70
60
50
40
M
30
F
20
10
0
18-29
30-41
42-53
54-65
66-77
78-89
90-101
100%
90%
80%
70%
60%
M
50%
F
40%
30%
20%
10%
0%
18-29
17 maggio 2008
30-41
42-53
54-65
66-77
78-89
90-101
9 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Cenni di Calcolo delle Probabilità
Definizione di probabilità
Intuitiva:
17 maggio 2008
p.e.
lancio una moneta, qual è la
probabilità che esce testa?
lancio un dado, qual è la probabilità
che esce 5?
e che esce un numero pari?
e che esce 7?
e che esce un numero compreso tra 1
e 6?
10 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Terminologia
Evento: manifestazione oggetto di attenzione
Evento casuale:
il risultato dell’esperimento casuale,
ovvero di una situazione in cui si è
operata una scelta o si è manifestato
un evento senza una precisa regola, in
modo casuale.
certo – evento che si manifesta sicuramente
impossibile – evento che non si manifesta
sicuramente
possibile – evento che si può manifestare
incompatibili – due (o più) eventi che non si possono
verificare contemporaneamente
complementare – evento o insieme di eventi che si
verifica in contrasto ad un altro
Spazio campionario Ω: l’insieme di tutti i possibili risultati
17 maggio 2008
11 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
• Definizione classica: (Pascal e Fermat, XVII sec.) La probabilità di
un evento è il rapporto tra il numero dei casi favorevoli e il numero
dei casi possibili, purché questi ultimi siano ugualmente possibili
Se su n casi nA sono quelli relativi al verificarsi dell’evento A, la
probabilità che si verifichi A è:
pA  P  A 
nA
n
• Qual è la probabilità di estrarre una pallina bianca da un’urna che
contiene 3 palline bianche, 2 nere e 3 gialle?
n=8
A=pallina bianca
nA=3
pA=3/8=0,375
17 maggio 2008
12 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
• Definizione frequentista: Se si ripete un processo un gran numero di
volte n e se un certo evento con caratteristica A si verifica nA volte,
la frequenza relativa di successo di A è nA/n e sarà
approssimativamente uguale alla probabilità di A.
pA  P  A 
nA
n
Se su 1235 osservazioni rilevo per 371 volte la caratteristica ‘pressione
bassa’, allora la probabilità di osservare un soggetto con ‘pressione
bassa’ verosimilmente sarà
371/1235=0,300
17 maggio 2008
13 / 23
Master in Neuropsicologia Clinica
•
Elementi di Statistica I
Definizione assiomatica:
1. Dato un processo che genera n risultati (eventi) mutuamente
esclusivi, A1, A2, …, An, la probabilità di un dato evento Ai è
data da un numero non negativo, ovvero: P(Ai) ≥ 0
2. La somma delle probabilità di tutti gli eventi mutuamente
esclusivi è uguale a 1:
n
 P A  1
i 1
i
3. Dati due eventi mutuamente esclusivi, Ai e Aj, la probabilità che
si verifichi o Ai o Aj è uguale alla somma delle singole
probabilità:
P(Ai o Aj) = P(Ai) + P(Aj)
17 maggio 2008
14 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Relazione con la tabella a 2 vie
Sesso
Classi di età
F
M
Totale
18-29
8
24
32
30-41
15
37
52
42-53
11
49
60
54-65
7
19
26
66-77
3
17
20
78-89
3
5
8
90-101
1
1
2
Totale
48
152
200
1. Le modalità sono mutuamente esclusive
2. Supp. uguale probabilità per ogni u.s.
1. P(F) = 0,24
2. P(54-65) = 0,13
3. P(42-53|M) = 0,322
4. P(30-41 ∩ F) = 0,075
1. e 2. → probabilità marginale
3. → probabilità condizionata
4. → probabilità congiunta
17 maggio 2008
Simbologia:
| → condizionamento
∩ → intersezione → contemporaneità
(A e B ovvero B e A)
U → unione → alternatività e contemp.
(A, B, oppure A e B)
15 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Sesso
Classi di età
F
M
18-29
8
24
32
30-41
15
37
52
42-53
11
49
60
54-65
7
19
26
66-77
3
17
20
78-89
3
5
8
90-101
1
1
2
Totale
48
152
0,035 =
Totale
P(F) = 0,24
P(54-65) = 0,13
P(54-65|F) = 0,146
P(F|54-65) = 0,269
P(54-65 ∩ F) = 0,035
200
0,24 x 0,146
P(54-65 ∩ F) = P(F) x P(54-65|F)
Legge del prodotto: P(A∩B) = P(B) x P(A|B)
17 maggio 2008
se P(B)≠0
16 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Legge del prodotto: P(A∩B) = P(B) x P(A|B)
P(A∩B)
P(A|B) = ----------P(B)
se P(B)≠0
P(M o F) = P (M U F) = P(M) + P(F) = 0,76 + 0,24 = 1
Se non sono mutuamente esclusivi?? Es. M e 18-29…
Legge della somma: P(A U B) = P(A) + P(B) – P(A ∩ B)
Es. P(M U 18-24) = P(M) + P(18-29) – P(M ∩ 18-29) =
= 0,76 + 0,160 – 0,120
= 0,80
(152)
(32)
(24)
17 maggio 2008
se P(B)≠0
Sesso
Classi di età
F
M
Totale
18-29
8
24
32
30-41
15
37
52
42-53
11
49
60
54-65
7
19
26
66-77
3
17
20
78-89
3
5
8
90-101
1
1
2
Totale
48
152
200
17 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Eventi indipendenti
Es. A = essere M
B = avere le ali
P(B) non ha effetto su P(A) e viceversa → P(A|B) = P(A)
P(B|A) = P(B)
P(A ∩ B) = P(B) x P(A|B) = P(B) x P(A)
Eventi complementari
Es. A = essere M
il complementare è = essere F…
P  A   1  P  A
17 maggio 2008
18 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Variabile casuale: variabile i cui valori non possono essere
esattamente predetti.
discreta: salti o interruzioni nei valori (conteggio…)
continua: non ha salti o interruzioni (altezza…)
(limite strumento di misura)
Distribuzione di probabilità di V.C. discreta:
Specificazione di tutti i valori possibili con le rispettive
probabilità…
Num. infarti ni
pi
pi
0
782
782/1464
0,534
pi ≡ fi
1
389
389/1464
0,266
1. pi ≥ 0
2
218
218/1464
0,149
3
75
75/1464
0,051
Totale
1464
17 maggio 2008
1,000
per ogni i
2. ∑pi = 1
3. P(Ai o Aj) = pi + pj per ogni i e j
19 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
graficamente…
Prob. Cumulata:
pi 1,000
0,900
0,800
0,700
0,600
0,500
0,400
0,300
0,200
0,100
0,000
F(x) = P(X≤ x)
-1
0
1
2
3
4
Num. Infarti
pi 1,000
0,900
0,800
0,700
0,600
0,500
0,400
0,300
0,200
0,100
0,000
-1
0
1
2
3
4
Num. Infarti
17 maggio 2008
20 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
graficamente…
Prob. Cumulata:
pi 1,000
0,900
0,800
0,700
0,600
0,500
0,400
0,300
0,200
0,100
0,000
F(x) = P(X≤ x)
-1
0
1
2
Num. Infarti
3
4
1,2
1
Num. infarti ni
pi
F(x)
0
782
0,534
0,534
1
389
0,266
0,800
2
218
0,149
0,949
3
75
0,051
1,00
Totale
1464
1,000
0,8
0,6
0,4
0,2
0
0
17 maggio 2008
1
2
3
4
5
21 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
Distribuzione di probabilità continue
20
20
18
18
n→∞
d→0
16
16
14
14
ni
12
12
10
10
88
66
44
22
Area = 1
00
26
26
28
28
30
30
3232
3434
3636
38 38
40 40
Età
Età
17 maggio 2008
22 / 23
Master in Neuropsicologia Clinica
Elementi di Statistica I
fa-b
funzione di densità per X v.c. continua:
1. f(x) ≥ 0
2. Area = 1
3. Area (a-b) = P(a ≤ X ≤ b)
17 maggio 2008
23 / 23