Variabili aleatorie, casuali o random
Premessa
Una variabile si dice aleatoria, casuale o random quando il valore che questa
assume è incerto e non prevedibile
Le variabili random possono essere discrete o continue
Non potendo stabilire a priori il valore che assumeranno, si affronta il problema
stimando il grado di fiducia, cioè la probabilità, che si può associare al fatto che la
variabile assuma uno specifico valore o un valore superiore (o inferiore) ad uno
prefissato
La funzione massa di probabilità (pmf)
La funzione massa di probabilità si definisce per le variabili random di tipo discreto
La funzione massa di probabilità di una variabile random X è una funzione
matematica p(X) che fornisce il valore della probabilità puntuale associata a
ciascun valore X che essa possa assumere ( p(X) = Pr [X=x] )
Per p(X) valgono quindi gli assiomi già definiti per la probabilità
0 ≤ p(X) ≤ 1
per tutti i valori possibili di X
p(X) = 0
per tutti i valori impossibili di X
Σ p(X) = 1
calcolata per tutti i valori possibili di X
n° di incidenti in un anno
n° di accadimenti
massa di probabilità
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0
1
1
3
5
6
5
9
12
18
25
33
31
42
46
35
31
22
11
8
9
4
2
1
0
1
2
0
0
1
0
0.0000
0.0027
0.0027
0.0082
0.0137
0.0165
0.0137
0.0247
0.0330
0.0495
0.0687
0.0907
0.0852
0.1154
0.1264
0.0962
0.0852
0.0604
0.0302
0.0220
0.0247
0.0110
0.0055
0.0027
0.0000
0.0027
0.0055
0.0000
0.0000
0.0027
0.0000
totale accadimenti
364
ESEMPIO 3.1_1
Sulla funzione massa di probabilità
Si voglia rappresentare la funzione
massa di probabilità con riferimento al
numero di incidenti che si sono
verificati in 5 anni in corrispondenza di
una intersezione stradale urbana.
I dati rilevati sono riportati in tabella per
un totale di 364 eventi verificatisi
nell’arco temporale di riferimento,
secondo la distribuzione riportata per
numero di accadimenti in 5 anni.
La funzione massa di probabilità è
calcolata nella terza colonna.
ESEMPIO 3.1_2
Sulla funzione massa di probabilità
La rappresentazione della funzione di massa di probabilità è riportata a
seguire dove in ascissa è indicato il numero di accadimenti all’anno
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
La funzione di distribuzione cumulata (cdf)
La funzione di distribuzione cumulata si definisce per le variabili random di tipo
discreto e di tipo continuo
La funzione di distribuzione cumulata di una variabile random X rappresenta la
funzione matematica che esprime la probabilità di non superamento
Fx (x) = Pr [X ≤ x]
E’ una funzione monotona crescente e per ogni valore possibile di x vale:
0 ≤ Fx (x) ≤ 1
per tutti i valori possibili di x
n° di incidenti in un anno
n° di accadimenti
massa di probabilità
funzione di distribuzione cumulata
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0
1
1
3
5
6
5
9
12
18
25
33
31
42
46
35
31
22
11
8
9
4
2
1
0
1
2
0
0
1
0
0.0000
0.0027
0.0027
0.0082
0.0137
0.0165
0.0137
0.0247
0.0330
0.0495
0.0687
0.0907
0.0852
0.1154
0.1264
0.0962
0.0852
0.0604
0.0302
0.0220
0.0247
0.0110
0.0055
0.0027
0.0000
0.0027
0.0055
0.0000
0.0000
0.0027
0.0000
0.0000
0.0027
0.0055
0.0137
0.0275
0.0440
0.0577
0.0824
0.1154
0.1648
0.2335
0.3242
0.4093
0.5247
0.6511
0.7473
0.8324
0.8929
0.9231
0.9451
0.9698
0.9808
0.9863
0.9890
0.9890
0.9918
0.9973
0.9973
0.9973
1.0000
1.0000
totale accadimenti
364
ESEMPIO 3.2_1
Sulla funzione di distribuzione
cumulata
Con riferimento all’esempio
3.1 si calcola la funzione di
distribuzione cumulata.
La funzione di distribuzione
cumulata è riportata in quarta
colonna.
ESEMPIO 3.2_2
Sulla funzione di distribuzione cumulata
Nel grafico è rappresentata la funzione di distribuzione cumulata, in analogia
all’esempio 3.1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
20
25
30
n°. di incidenti al km
n° di accadimenti
massa di probabilità
funzione di distribuzione cumulata
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
11
27
32
31
25
21
18
19
16
12
7
8
5
3
4
5
2
3
1
0
0
0
0
0
0
0
0
0
0
0
0
0.0440
0.1080
0.1280
0.1240
0.1000
0.0840
0.0720
0.0760
0.0640
0.0480
0.0280
0.0320
0.0200
0.0120
0.0160
0.0200
0.0080
0.0120
0.0040
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0440
0.1520
0.2800
0.4040
0.5040
0.5880
0.6600
0.7360
0.8000
0.8480
0.8760
0.9080
0.9280
0.9400
0.9560
0.9760
0.9840
0.9960
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
ESEMPIO 3.3_1
Sulla funzione massa di probabilità
Si voglia rappresentare la funzione
massa di probabilità con riferimento al
numero di incidenti al km su una
infrastruttura stradale primaria estesa
per 250 km.
ESEMPIO 3.3_2
Sulla funzione massa di probabilità
La rappresentazione della funzione di massa di probabilità è riportata a
seguire dove in ascissa è indicato il numero di incidenti al km
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
ESEMPIO 3.3_3
Sulla funzione di distribuzione cumulata
Nel grafico è rappresentata la funzione di distribuzione cumulata
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
20
25
n° di falsi allarmi al km
n° di accadimenti
massa di probabilità
funzione di distribuzione cumulata
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
3
4
2
3
6
5
9
15
21
25
26
23
12
13
8
7
7
8
5
3
4
2
1
0
1
2
0
0
1
0
0.0046
0.0138
0.0184
0.0092
0.0138
0.0276
0.0230
0.0415
0.0691
0.0968
0.1152
0.1198
0.1060
0.0553
0.0599
0.0369
0.0323
0.0323
0.0369
0.0230
0.0138
0.0184
0.0092
0.0046
0.0000
0.0046
0.0092
0.0000
0.0000
0.0046
0.0000
0.0046
0.0184
0.0369
0.0461
0.0599
0.0876
0.1106
0.1521
0.2212
0.3180
0.4332
0.5530
0.6590
0.7143
0.7742
0.8111
0.8433
0.8756
0.9124
0.9355
0.9493
0.9677
0.9770
0.9816
0.9816
0.9862
0.9954
0.9954
0.9954
1.0000
1.0000
totale accadimenti
217
ESEMPIO 3.4_1
Sulla funzione di distribuzione
cumulata
Si voglia valutare la probabilità
di errore nella diagnosi di
degrado con Georadar.
In tabella sono riportati i dati
relativi ad un rilievo esteso ad
una tratta, in cui vengono
rilevati i falsi allarmi al km.
ESEMPIO 3.4_2
Sulla funzione massa di probabilità
La rappresentazione della funzione di massa di probabilità è riportata a
seguire dove in ascissa è indicato il numero di falsi allarmi al km
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
ESEMPIO 3.4_3
Sulla funzione di distribuzione cumulata
Nel grafico è rappresentata la funzione di distribuzione cumulata
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
20
25
30
La funzione densità di probabilità (pdf)
La funzione densità di probabilità si definisce per le variabili random di tipo
continuo
La funzione densità di probabilità di una variabile random X è una funzione
matematica sempre positiva, non è adimensionale e rappresenta una “intensità”
della probabilità della variabile X
Per cui vale la seguente relazione
x2
Pr [x1 ≤ X ≤ x2] =
∫f
X
(x )dx
x1
Estendendo l’integrale a tutti i valori possibili di X si ha:
+∞
∫f
−∞
X
(x )dx = 1
ESEMPIO 3.5
Sulla funzione densità di probabilità
Nota la funzione di distribuzione di probabilità degli accadimenti di eventi
incidentali in un anno lungo un tratto di strada omogenea, si voglia calcolare la
probabilità che il numero di accadimenti sia superiore a 25.
La funzione densità di probabilità sia
(con λ = 0.1)
f X ( x ) = λe − λx
25
P [X > 25] = 1 −
∫f
0
X
(x )dx = 1 − (1 − e
− λx
)0
25
= 1 − [(0.918) − (0 )] = 0.082
ESEMPIO 3.6_1
Sulla funzione densità di probabilità e probabilità cumulata
Nell’ambito di una sperimentazione su strada finalizzata all’analisi dell’impegno di
aderenza in curva vengono registrati 200 valori di accelerazione trasversale al
passaggio di 200 veicoli in corrispondenza del centro della curva geometrica
Si voglia valutare l’85 percentile del valore assunto dall’accelerazione, ovvero il
valore che viene superato con probabilità pari a 0.85
Nella seguente slide è riportata in figura la “plot position” degli esiti della misura di
campo
ESEMPIO 3.6_2
In ascissa è riportato il numero d’ordine della misura, in ordinata il valore in m/s2
della misura effettuata di accelerazione trasversale
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0
20
40
60
80
100
120
140
160
180
200
ESEMPIO 3.6_3
Si riporta l’andamento della funzione di probabilità cumulata derivata dal campione
delle misure e si pone a confronto con la funzione di probabilità cumulata di tipo
uniforme. Il valore di accelerazione corrispondente all’85 percentile risulta pari a 1.67
m/s2 con riferimento al campione e 1.70 m/s2 con riferimento alla distribuzione teorica
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.5
1
1.5
2
I descrittori numerici delle variabili random
Al fine di caratterizzare sinteticamente l’andamento delle probabilità di una
variabile random si utilizzano dei descrittori numerici derivati direttamente dalle
funzioni di distribuzione descritte
Tali descrittori danno informazioni in merito ai valori maggiormente probabili, alla
dispersione dei valori che la variabile può assumere e più in generale alla forma
della distribuzione in termini per esempio di simmetria
Media o valore atteso
La media o valore atteso corrisponde alla media aritmetica dei valori osservati assunti
da una variabile aleatoria ovvero al baricentro della pdf
µX = E [X] = Σ xi px (xi)
La precedente relazione estesa a tutti i valori che può assumere la variabile discreta X
costituisce la definizione di media o valore atteso
Analogamente per una variabile aleatoria continua si ha
µ X = E [X ] =
+∞
∫x⋅ f
−∞
X
(x )dx
ESEMPIO 3.7
Sulla media o valore atteso
Con riferimento all’esempio 3.5 si voglia calcolare il valore atteso del numero di
accadimenti, avendo assunta la funzione di distribuzione sotto richiamata
f X ( x ) = λe − λx
integrando la precedente si ha
+∞
µX =
∫
x ⋅ f X (x )dx =
0
da cui il valore atteso
µX =
1
1
=
= 10
λ 0.1
+∞
∫
0
[
x ⋅ λe − λx dx = − xe − λx
]
+∞
0
+∞
+
∫
0
e − λx dx = 0 +
1 1
=
λ λ
Attesa matematica di una funzione della variabile aleatoria X
La media di una funzione g(x) della variabile aleatoria x si può calcolare per le variabili
discrete e continue rispettivamente come segue
E [g (x )] =
∑ g (x ) p
i
X
(xi )
i =1, N
E [g (x )] =
+∞
∫ g (x) f (x) dx
−∞
ESEMPIO 3.8
Sull’attesa matematica di una funzione di variabile aleatoria
Con riferimento all’esempio 3.5, si voglia calcolare l’attesa matematica della
funzione costo degli incidenti stradali
Si supponga che il costo sia funzione degli incidenti secondo la seguente relazione
g ( x ) = e γx
si ha
E [g (x )] =
+∞
∫
+∞
g (x ) f X (x )dx =
0
in cui
λ* = λ − γ
+∞
+∞
(
e γx )⋅ λe −λx dx = λe (γ −λ )x dx = λe −λ*x dx =[− xe −λ*x ]
∫
∫
∫
0
0
0
0
+∞
+∞
+
∫
0
e −λ*x dx =
1
λ*
Momenti di una distribuzione di probabilità della variabile aleatoria X
I momenti di una funzione di distribuzione sono parametri numerici particolarmente
significativi per identificare la forma e le caratteristiche di forma della distribuzione
stessa
Il generico momento di ordine r attorno al punto a di una variabile discreta si calcola
come segue
[
] ∑ (x − a ) p
µ*r = E ( X − a )r =
i
r
X
( xi )
i =1, N
I momenti di ordine r attorno all’origine e attorno alla media si valutano rispettivamente
con le relazioni che seguono
[ ] ∑ (x ) p
µ X = E ( X )r =
i
i =1, N
r
X ( xi )
[
] ∑ (x − µ
µ r = E ( X − µ X )r =
i
i =1, N
r
)
p X ( xi )
X
ESEMPIO 3.9
Sui momenti di una distribuzione di probabilità
Con riferimento agli esempi 1.6 e 2.6 si valutino i momenti sino al 4° ordine della
distribuzione delle velocità dei veicoli rilevate in corrispondenza della sezione
stradale di riferimento
velocità
2.5
7.5
12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5
52.5
57.5
62.5
67.5
72.5
77.5
82.5
87.5
92.5
97.5
classi
0-5
5-10
10-15
15-20
20-25
25-30
30-35
35-40
40-45
45-50
50-55
55-60
60-65
65-70
70-75
75-80
80-85
85-90
90-95
95-100
frequenze
0
0
0
0
0
4
2
2
2
6
2
10
4
22
20
12
8
2
4
0
100
probabilità
0.00
0.00
0.00
0.00
0.00
0.04
0.02
0.02
0.02
0.06
0.02
0.10
0.04
0.22
0.20
0.12
0.08
0.02
0.04
0.00
x*p
0.00
0.00
0.00
0.00
0.00
1.10
0.65
0.75
0.85
2.85
1.05
5.75
2.50
14.85
14.50
9.30
6.60
1.75
3.70
0.00
Momenti
66.2
momenti rispetto all'origine
x2*p
x3*p
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
30.25
831.88
21.13
686.56
28.13
1054.69
36.13
1535.31
135.38
6430.31
55.13
2894.06
330.63
19010.94
156.25
9765.63
1002.38
67660.31
1051.25
76215.63
720.75
55858.13
544.50
44921.25
153.13
13398.44
342.25
31658.13
0.00
0.00
4607.25
x4*p
0.00
0.00
0.00
0.00
0.00
22876.56
22313.28
39550.78
65250.78
305439.84
151938.28
1093128.91
610351.56
4567071.09
5525632.81
4329004.69
3706003.13
1172363.28
2928376.56
0.00
331921.25 24539301.56
momenti rispetto alla media
x2*p
x3*p
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
59.91
-2318.42
22.71
-765.46
16.47
-472.80
11.23
-266.24
20.98
-392.35
3.75
-51.43
7.57
-65.85
0.55
-2.03
0.37
0.48
7.94
50.01
15.32
173.15
21.26
346.46
9.07
193.27
27.67
727.66
0.00
0.00
224.81
-2843.544
x4*p
0.00
0.00
0.00
0.00
0.00
89723.01
25795.84
13569.30
6309.91
7336.99
704.55
572.90
7.50
0.63
315.06
1956.57
5647.29
4116.69
19137.40
0.00
175193.6417
La varianza, la deviazione standard e il coefficiente di variazione della variabile
aleatoria X
La varianza è pari al momento del secondo ordine di una distribuzione rispetto alla media
[
] [
] [ ]
[ ]
Var[ X ] = σ 2X = E ( X − E [X ])2 = E X 2 − 2 XE [X ] + (E [X ])2 = E X 2 − 2 E [X ]E [X ] + (E [X ])2 = E X 2 − (E [X ])2
La deviazione standard è pari alla radice quadrata della varianza
σ X = (Var [X ])1 2
Il coefficiente di variazione risulta pari al rapporto tra la deviazione standard e la media
VX = σ X µ X
ESEMPIO 3.10
Sulla varianza, la deviazione standard e il coefficiente di variazione
Con riferimento all’esempio 3.9 si hanno i seguenti valori di varianza, deviazione
standard e coefficiente di variazione della distribuzione delle velocità
Varianza = 224.81 km2/h2
Deviazione standard = 14.99 km/h
Coefficiente di variazione = 0.226
ESEMPIO 3.11_1
Ancora sulla varianza, la deviazione standard e il coefficiente di variazione
0.45
media 10 deviazione standard 1
0.4
media 10 deviazione standard 2
0.35
media 10 deviazione standard 5
0.3
0.25
0.2
0.15
0.1
0.05
0
-10
-5
0
5
10
15
20
25
30
ESEMPIO 3.11_2
Ancora sulla varianza, la deviazione standard e il coefficiente di variazione
-10
-5
0
5
10
1
media 10 deviazione standard 1
media 10 deviazione standard 2
media 10 deviazione standard 5
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
15
20
25
30
Coefficiente di skewness e coefficiente di kurtosis della variabile aleatoria X
Si definisce coefficiente di skewness o di asimmetria il momento del 3° ordine rispetto
alla media rapportato alla variazione standard secondo la seguente relazione
γ1 =
µ3
µ 32
=
[
]
{E [(X − E[X ]) ]}
E ( X − E [X ])3
2 3
=
[ ] [ ]
(E [X ]− (E[X ]) )
E X 3 − 3E X 2 E [X ] + 2(E [X ])3
2 32
2
Si definisce coefficiente di kurtosis il momento del 4° ordine rispetto alla media
rapportato alla variazione standard secondo la seguente relazione
γ2 =
µ4
µ 22
[
]
=
{E [(X − E[X ]) ]}
E ( X − E [X ])4
2 2
=
[ ] [ ]
[ ]
(E [X ]− (E[X ]) )
E X 4 − 4 E X 3 E [X ] + 6 E X 2 (E [X ])2 − 3(E [X ])4
2
2 2
Funzione generatrice dei momenti di una distribuzione
I momenti di una distribuzione sono degli indicatori numerici particolarmente utili per
ragioni teoriche ed applicative.
Per molte distribuzioni è possibile definire una appropriata funzione detta funzione
generatrice dei momenti che, sviluppata in una serie di potenze (serie di Maclaurin) di t
intorno allo zero, fornisce i momenti di vario ordine.
[ ]
1
1
⎡
⎤
M X (t ) = E e tX = E ⎢1 + Xt + ( Xt )2 + ...⎥ = 1 + µ1t + µ 2 t 2 + ...
2!
2!
⎣
⎦
Ovvero per variabili discrete si può scrivere
[ ] ∑e
M X (t ) = E e tX =
+∞
Mentre per variabili continue si ha
[ ] ∫e
M X (t ) = E e tX =
−∞
tx
f X (x )dx
tx j
( )
pX x j
Funzione generatrice dei momenti di una distribuzione
Dalle precedenti definizioni si ottiene evidentemente
+∞
⎡ +∞
⎤
∂M X (t = 0) ⎢
=
xe tx f X (x )dx ⎥
= x ⋅ f X (x )dx = E [X ]
⎢
⎥
∂t
⎣⎢−∞
⎦⎥ t =0 −∞
∫
∂ M X (t = 0 )
=
2
∂t
2
∂ M X (t = 0)
=
m
∂t
m
∫
+∞
∫
[ ]
x 2 ⋅ f X (x )dx = E X 2
−∞
+∞
∫
[ ]
x m ⋅ f X (x )dx = E X m
−∞
ESEMPIO 3.12
Sulla funzione generatrice dei momenti
Con riferimento alla seguente funzione di densità di probabilità
f X ( x ) = λ e − λx
la funzione generatrice dei momenti è data dalla seguente espressione
+∞
M X (t ) =
∫
e tx λe −λx dx =
λ
λ−t
t<λ
0
si calcola quindi la media e la varianza
µX =
λ
(λ − t )2
[ ]
E X2 =
=
t =0
2⋅λ
(λ − t )3
1
λ
=
t =0
2
λ2
[ ]
Var[X ] = E X 2 − (E [X ])2 =
1
λ2
Stima dei parametri di una distribuzione
Si supponga nota la distribuzione di una popolazione di eventi e si voglia stimare i
valori dei parametri che caratterizzano la distribuzione conoscendo un campione
significativo ma limitato di accadimenti
La determinazione dei caratteri quantitativi di una distribuzione che rappresenta una
specifica popolazione a partire da un campione rappresentativo ma limitato di eventi va
sotto il nome di inferenza statistica
Il metodo dei momenti
Nell’ipotesi che i momenti calcolati sulla base di un campione significativo di
accadimenti debbano risultare uguali ai momenti della distribuzione in ragione del fatto
che i parametri di forma della distribuzione stessa siano coerenti con le realizzazioni
del campione,
il metodo si basa sull’uguaglianza dei momenti della funzione di distribuzione, che
dipendono dai parametri della distribuzione stessa, con i momenti stimati sulla base
del campione di accadimenti disponibile
ESEMPIO 3.13_1
Sulla stima dei parametri con il metodo dei momenti
Sia noto il numero di incidenti al km in un anno su una tratta stradale lunga 100 km
di categoria B, extraurbana principale.
16
14
12
10
8
6
4
2
114
111
108
105
102
99
96
93
90
87
84
81
78
75
72
69
66
63
60
57
54
51
48
45
42
39
36
33
30
27
24
21
18
15
0
Sulla stima dei parametri con il metodo dei momenti
ESEMPIO 3.13_2
Ordinando il numero di accadimenti per classi e calcolando la frequenza di
accadimento si hanno i seguenti valori, il numero di accadimenti è rappresentato
per istogrammi in figura
classi
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
n°. accadimenti
8
20
21
14
12
5
4
6
2
3
1
2
1
0
0
1
frequenza
0.08
0.2
0.21
0.14
0.12
0.05
0.04
0.06
0.02
0.03
0.01
0.02
0.01
0
0
0.01
25
20
15
10
5
0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
ESEMPIO 3.13_3
Sulla stima dei parametri con il metodo dei momenti
Calcolando il momento primo (ovvero la media o valore atteso) del numero di
accadimenti si ha E(x) = 3.45 eventi incidentali
Adottando una distribuzione del tipo
f X ( x ) = λ e − λx
e noto che il momento primo di tale distribuzione è pari a (esempio 3.12)
µX =
1
λ
ESEMPIO 3.13_4
Sulla stima dei parametri con il metodo dei momenti
Si ha per inferenza la seguente distribuzione teorica, rappresentata in figura
f X ( x ) = 3.45 ⋅ e −3.45⋅ x
0.3
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
ESEMPIO 3.13_5
Sulla stima dei parametri con il metodo dei momenti
La distribuzione teorica cumulata è confrontata con le frequenze campionarie
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
3
6
9
12
15
Sulla stima dei parametri con il metodo dei momenti
ESEMPIO 3.14_1
Utilizzando un veicolo ARAN è stato eseguito il rilievo di una infrastruttura stradale
per uno sviluppo complessivo pari a 240 km circa.
I dati di tessitura rilevati con lama laser sono analizzati per sezioni di sviluppo pari
ad 1 km.
Si riporta, a titolo di esempio, un brevissimo estratto tipo in forma grafica.
Ampiezze [mm]
accadimenti
frequenze campionarie
cumulata
14
14.2
14.4
14.6
14.8
15
15.2
15.4
15.6
15.8
16
16.2
16.4
16.6
16.8
17
17.2
17.4
17.6
17.8
18
18.2
18.4
18.6
18.8
19
19.2
19.4
19.6
19.8
20
20
27
46
89
131
220
424
670
1061
1320
1901
2111
2210
2180
2001
1640
712
321
116
23
12
2
1
2
0
0
0
0
0
0
0
0.001
0.002
0.003
0.005
0.008
0.013
0.025
0.039
0.062
0.077
0.110
0.122
0.128
0.126
0.116
0.095
0.041
0.019
0.007
0.001
0.001
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.001
0.003
0.005
0.011
0.018
0.031
0.056
0.094
0.156
0.232
0.343
0.465
0.593
0.720
0.836
0.931
0.972
0.991
0.998
0.999
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
ESEMPIO 3.14_2
Sulla stima dei parametri con il
metodo dei momenti
Ordinando le ampiezze rilevate per
classi e calcolando la frequenza di
accadimento si hanno i seguenti
valori, la frequenza campionaria è
rappresentato in figura
Sulla stima dei parametri con il metodo dei momenti
ESEMPIO 3.14_3
In figura la frequenza cumulata in ordinata e il valore dell’ampiezza della tessitura
in mm misurata con lama laser in ascissa
… si stimano i momenti dal campione …
media = 16.3 e deviazione standard = 0.360
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
14
15
16
17
18
19
20
Sulla stima dei parametri con il metodo dei momenti
ESEMPIO 3.14_4
Nel diagramma delle frequenze cumulate si riporta la frequenza cumulata a
confronto con due curve di probabilità teoriche (normale in linea continua e
Gamma in linea tratteggiata) i cui parametri sono stati calcolati sulla base dei
momenti della distribuzione campionaria
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
14
15
16
17
18
19
20
Il metodo della massima verosimiglianza
Il metodo della massima verosimiglianza per la stima dei momenti di una distribuzione
si basa sull’ipotesi che il campione di eventi che si realizza, poiché si è realizzato,
risulta anche il più probabile, assumendo, ragionevolmente, che se non fosse proprio
questo il campione più probabile non si sarebbe realizzato
Se le n osservazioni xi sono tra loro indipendenti, una stima della probabilità di
accadimento del campione costituito dalle n xi realizzazioni concomitanti è data da
f (x1 ) dx f (x 2 ) dx f (x3 ) dx ... f (x n ) dx
Da cui si ricava la funzione di massima verosimiglianza (come produttoria o, in forma
logaritmica, come sommatoria)
L = Π i =1,n f ( xi )
ln (L ) =
∑
i =1,n
ln[ f ( xi )]
Il metodo della massima verosimiglianza
Avendo assunto che il campione realizzato è quello più probabile la derivata della
funzione L o della funzione in forma logaritmica, fatta rispetto ai parametri della
distribuzione deve essere nulla (condizione di valor massimo per la probabilità)
Ovvero, indicato con δ il generico parametro della generica distribuzione di probabilità,
deve risultare
[
]
∂L ∂ Π i =1,n f ( xi )
=
=0
∂δ
∂δ
⎡
∂⎢
∂ ln (L )
= ⎣
∂δ
∑
⎤
ln[ f ( xi )]⎥
i =1,n
⎦ =0
∂δ
ESEMPIO 3.15
Sulla stima dei parametri con il metodo della massima verosimiglianza
Con riferimento alla medesima distribuzione dell’esempio 3.7 si voglia stimare il
valore del momento primo con il metodo della massima verosimiglianza
ln (L ) =
∑
i =1,n
∂(ln L )
=0
∂λ
ln[ f (xi )] =
∑
i =1,n
λ=
[
]∑
ln λ ⋅ e −λxi =
∑
n
i =1,n
xi
=
1
E (x )
i =1,n
(ln λ − λxi ) = n ln λ − λ
∑
i =1,n
xi
QUESITO 3.1
Da un rilievo delle velocità in una sezione stradale è emerso che il limite imposto da
codice è superato dal 60 % dei veicoli.
La velocità dei veicoli che transitano con velocità illegali supera il limite di un valore di
velocità secondo quanto riportato in tabella:
V
[km/h]
pX(x)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0.02
0.03
0.05
0.08
0.11
0.13
0.16
0.22
0.10
0.05
0.01
0.02
0.01
0.00
0.01
0.01
0.00
0.00
0.00
0.00
si calcoli il valore atteso e la varianza del valore di velocità eccedente il limite di legge
QUESITO 3.2
In corrispondenza di un viadotto autostradale di significativo sviluppo nell’Appennino
calabrese si registra un non trascurabile rischio per i veicoli a causa della durata di
condizioni di forte vento.
La durata di condizioni di vento incompatibili con adeguati standard di sicurezza, sulla
base di misure anemomentriche, si distribuisce secondo la seguente pdf
fT (t) =0.0018 t 1.5
con il tempo espresso in ore,
la durata massima è risultata pari a 18 ore.
Si calcoli il valore massimo assunto dalla densità di probabilità, si trovi la media ed il
coefficiente di variazione della durata del vento critico ed infine si calcoli la probabilità che
un vento critico duri più di 9 ore.
QUESITO 3.3
Considerato che su alcune intersezioni stradali urbane semaforizzate in un mese
si sono verificati il seguente numero di guasti: 21, 53, 43, 56, 18, 17, 40, 14, 13
FT (t) =1 – e λt
si stimi il parametro λ con il metodo dei momenti e della massima verosimiglianza.
SOMMARIO
La funzione massa di probabilità di una variabile random X è una funzione matematica
p(X) che fornisce il valore della probabilità puntuale associata a ciascun valore X che
essa possa assumere
p(X) = Pr [X=x]
La funzione di distribuzione cumulata di una variabile random X rappresenta la
funzione matematica che esprime la probabilità di non superamento
Fx (x) = Pr [X ≤ x]
La funzione densità di probabilità si definisce per le variabili random di tipo continuo
La funzione densità di probabilità di una variabile random X è una funzione
matematica sempre positiva, non è adimensionale e rappresenta una “intensità” della
probabilità della variabile X
Al fine di caratterizzare sinteticamente l’andamento delle probabilità di una variabile
random si utilizzano dei descrittori numerici derivati direttamente dalle funzioni di
distribuzione descritte
SOMMARIO
Al fine di caratterizzare sinteticamente l’andamento delle probabilità di una variabile
random si utilizzano dei descrittori numerici derivati direttamente dalle funzioni di
distribuzione
Media o valore atteso,
Attesa matematica di una funzione di una variabile aleatoria,
Momenti di una distribuzione e funzione generatrice dei momenti,
Varianza, deviazione standard e cefficiente di variazione
Skewness e kurtosis
Una volta definita la funzione di distribuzione è necessario stimarne i parametri,
ciò è possibile attraverso molteplici metodi, i più noti sono:
il metodo dei momenti
il metodo della massima verosimiglianza