Esercizio SINTESI Si supponga di avere eseguito 170 misure della

Esercizio
SINTESI
Si supponga di avere eseguito 170 misure della velocità istantanea dei veicoli che transitano nelle
sezioni di due strade A e B. Si supponga che tali misure siano state eseguita in corrispondenza di
valori modesti del volume di traffico transitante (tali che le misure di velocità possano considerarsi
eventi indipendenti l’uno dall’altro).
I valori della velocità misurata rappresentano realizzazioni di una variabile aleatoria (continua).
Si vuole indurre dal campione rilevato la distribuzione di probabilità dell’intera popolazione. Per
far questo rappresentiamo attraverso i criteri della statistica descrittiva i dati misurati. Per fare ciò
dividiamo l’intero campo di variazione delle velocità misurato in un numero finito di intervalli di
eguale ampiezza. La scelta del numero di classi da utilizzare viene effettuata utilizzando la
relazione:
Nclassi=1+3.3LOG(170)= 8,360481441
Il numero di classi prescelte è pari a 9 con ampiezza di ∆ =15 km/h.
Si individuano pertanto per ciascuna classe il numero di osservazioni che a quella classe
appartengono ottenendo il seguente quadro:
Classe
Velocità
0-15
15.1 - 30
30.1 - 45
45.1 - 60
60.1 - 75
75.1 - 90
90.1 - 105
105.1 - 120
120.1 - 135
Numero totale osservazioni
Strada A
3
20
35
55
30
25
2
0
0
170
Strada B
0
2
10
20
28
40
30
25
15
170
STATISTICA DESCRITTIVA
Si valutano quindi per ciascuna classe le frequenze assolute e percentuali nonché il valore
hi=fi/∆. Il valore di hi è confrontabile con il valore della teorica funzione densità di probabilità
della popolazione ricordando che la probabilità che la variabile aleatoria velocità assuma valori
compresi in un intervallo ∆ è pari a f(x)* ∆ .
Strada B
Classe
Velocità
0-15
15.1 - 30
30.1 - 45
45.1 - 60
60.1 - 75
75.1 - 90
90.1 - 105
105.1 - 120
120.1 - 135
valore
7,50
22,50
37,50
52,50
67,50
82,50
97,50
112,50
127,50
frequenza
Frequ. ass
Frequ. %
hi
Freq. Cum
0
2
10
20
28
40
30
25
15
0
0,0118
0,0588
0,1176
0,1647
0,2353
0,1765
0,1471
0,0882
0
1,18
5,88
11,76
16,47
23,53
17,65
14,71
8,82
0
0,000787
0,00392
0,00784
0,01098
0,015687
0,011767
0,009807
0,00588
0
1,18
7,06
18,82
35,29
58,82
76,47
91,18
100
100
Si rappresenta la distribuzione ottenuta con un istogramma (vedi figura).
Si valutano alcuni indici descrittivi della distribuzione misurata; media, varianza e deviazione
standard.
0,018
0,016
0,014
hi
0,012
0,01
0,008
0,006
0,004
0,002
0
7,50
22,50 37,50 52,50 67,50 82,50 97,50 112,50 127,50
Velocità [km/h]
Valutiamo ora alcuni indici della distribuzione (media, varianza, deviazione standar, moda e
mediana.
Strada B
Classe
Valore
Velocità
xi
Frequenza assoluta
f*i
Xi * f*i
Xi2*f*i
0-15
15.1 - 30
30.1 - 45
45.1 - 60
60.1 - 75
75.1 - 90
90.1 - 105
105.1 - 120
120.1 - 135
7,50
22,50
37,50
52,50
67,50
82,50
97,50
112,50
127,50
0
2
10
20
28
40
30
25
15
0
0,0118
0,0588
0,1176
0,1647
0,2353
0,1765
0,1471
0,0882
0
0,2655
2,205
6,174
11,11725
19,41225
17,20875
16,54875
11,2455
0
5,97375
82,6875
324,135
750,41438
1601,5106
1677,8531
1861,7344
1433,8013
84,177
7738,11
Frequ. relativa
Somma=
X = ∑ f i ∗ xi = 84.177
[km/h]
i
m2 ( x) = ∑ f i ∗ xi2 = 7738.11
i
n
S 2 (x ) =
∑ (x
−X
i
i =1
n
∑f
i
) ⋅f
[(km/h)^2]
2
i
n
(
= ∑ xi − X
i =1
) ⋅f
2
*
i
9
(
)
2
= ∑ xi2 ⋅ f i * − X = 652.343 [(km/h)2]
i =1
i =1
2
S = 25.541
[km/h]
La moda corrisponde alla classe 75-90 km/h quindi si può associre al valore medio della classe
stessa pari a 82.50 ≈ media.
La classe mediana è 75-90 km/h pertanto il valore mediano è:
1 m −1 '
− ∑ fi
2 i =1
mediana = x m +
⋅ ∆ m = 82.81 km/h ≈ media
f m'
dove xm è l’estremo inferiore della classe mediana e ∆m è l’ampiezza della classe mediana.
L’indice di dissimmetria è pari a:
∑ (x
9
Dis ( x) =
−X
i
i =1
9
∑f
) ⋅f
3
i
= - 393349.85 / 170 =-2313.82 [[(km/h)3]
i
i =1
Dis (x) = - -13.23 [km/h]
Gli indici sintetici di variabilità e di dissimetria relativi sono:
S2
c = 2 = 0.092
X
Dis ( x)
d=
= -0.0038
3
X
L’osservazione dei dati del campione indica che essi sono distribuiti in maniera pressochè
simmetrica (media ≈ mediana ≈ moda) con una lieve dissimetria negativa (valori spostati verso
sinistra).
3
STATISTICA INDUTTIVA
Una stima non distorta della varianza della popolazione è fornita da:
µ ≈ X = 84.177 [km/h]
N
σ 2 ≈ S *2* = S 2 ⋅
= 652.34* (170/169)=656.2 [(km/h)2]
N −1
σ= σ ≈ S *2* = 25.62 [km/h]
Si confronta la distribuzione del campione con la distribuzione di una variabile aleatoria
caratterizzata da una legge densità di probabilità di tipo Normale, avente la stessa media e la stessa
varianza del campione. Si nota che l’ipotesi di distribuzione di tipo normale sembra plausibile alla
luce del confronto qualitativo eseguito.
valori funzione densità di
probabilità f(x)
0,018
0,016
0,014
0,012
0,01
0,008
0,006
0,004
0,002
0
0
15
30
45
60
75
90
105
120
velocità [km/h]
valori campione
distrib. Teorica
135
150
Si deve verificare l’ipotesi attraverso un test delle ipotesi (l’ipotesi è che il campione ottenuto
provenga da una popolazione distribuita con legge di probabilità di tipo Normale).
Ipotesi: πi=pi
Cioè che le probabilità incognite della classe i-esima siano uguali alla probabilità che una v.a.
Normale, con media e varianza pari a quella del campione, assuma un valore compreso
nell’intervallo che definisce la classe i-esima.
E’ intuitivo che tanto più è accettabile l’ipotesi quanto più prossime a zero sono le differenze:
p*i-pi
dove
n
pi* = i
N
cioè le differenze ni − N ∗ p i
Si dimostra che se l’ipotesi è vera :
k
(ni − N ⋅ pi )2
Χχ2 = ∑
N ⋅ pi
i =1
ha approssimativamente una distribuzione χ2 con ν =k-h-1 gradi di libertà, dove k è il numero
delle classi e h è il numero dei parametri della distribuzione teorica (in questo caso i parametri della
legge di probabilità Normale sono 2 µ e σ ).
Se risulta :
Χ χ 2 ≤ χ α2
dove
χ α2 è il valore della v.a. χ2 in corrispondenza del valore della funzione di distribuzione pari a
(α).
l’ipotesi nulla può essere accettata o meglio non è possibile rifiutare l’ipotesi ad un livello di
significatività pari ad α.
E’ necessario pertanto calcolare la probabilità pi che la v.a. descritta dalla distribuzione teorica di
probabilità (distribuzione Normale) assuma un valore compreso negli estremi che caratterizzano l’iesimo intervallo di velocità. Tale operazione può essere agevolmente eseguita consultando le tavole
che forniscono i valori della funzione di distribuzione di della v.a. normale standardizzata (vedi
tavola allegata). Per fare ciò dobbiamo trasformare i valori relativi agli estremi di ciascun intervallo
di velocità nei valori della corrispondente v.a. Normale standardizzata:
xiS−inf =
xi −sup − µ
xi −inf − µ
e xiS−sup =
σ
σ
Classe
Valore v.a.
NS
Funz. Distrib.
v.a. NS
Velocità
frequenza
Valore inf
Val. sup
ziinf
zisup
F(ziinf)
F(zisup)
F(zisup)-F(ziinf)
N*Pi
0-15
15.1 - 30
30.1 - 45
45.1 - 60
60.1 - 75
75.1 - 90
90.1 - 105
105.1 - 120
120.1 - 135
0
2
10
20
28
40
30
25
15
0
15,1
30,1
45,1
60,1
75,1
90,1
105,1
120,1
15
30
45
60
75
90
105
120
135
-3,286
-2,697
-2,111
-1,525
-0,940
-0,354
0,231
0,817
1,402
-2,700
-2,115
-1,529
-0,944
-0,358
0,227
0,813
1,398
1,984
0,000508
0,003503
0,017385
0,063572
0,173633
0,361541
0,591427
0,792973
0,919593
0,0034619
0,0172179
0,0630866
0,172634
0,3600796
0,5899105
0,7918555
0,919009
0,9763721
0,002954
0,013715
0,045702
0,109062
0,186446
0,228369
0,200428
0,126036
0,056779
0,5021528
2,3315761
7,7692699
18,540607
31,695837
38,822789
34,072764
21,426142
9,6524037
(ni-N*pi)^2/Npi
0,5021528
0,0471538
0,6404922
0,1148738
0,4309465
0,0356962
0,486823
0,5961159
2,9626596
5,8169138
Il valore in corrispondenza del quale la funzione di distribuzione della v.a. χ2 con 6 gradi di libertà (9-2-1) assume un valore pari a 0.05 è
12.591577 (vedi tavole allegate) che risulta maggiore del valore di 5.816
k
(ni − N ⋅ pi )2
Χχ2 = ∑
=5.816 < 12.59
N ⋅ pi
i =1
L’ipotesi, che le velocità istantanee sulla strada B si distribuiscano seguendo una legge di probabilità di tipo Normale, non può quindi essere
rifiutata al livello di significatività pari a 5%
Se si considera una probabilità di falso rifiuto o una significatività più basso e pari ad esempio a 0.01 (1%) si ha che il valore in corrispondenza del
quale la funzione di distribuzione della v.a. χ2 con 6 gradi di libertà (9-2-1) assume un valore pari a 0.01 è 16.81 che risulta maggiore del valore
di 5.816
ESERCIZIO N.1
Un osservatore registra
sezione
stradale
il numero dei veicoli che passano in una
durante
un
intervallo
di
30
sec.
Ripete
l’osservazione 120 volte (cioè tiene sotto controllo la sezione
stradale complessivamente per un’ora) e registra i risultati delle
osservazioni nella tabella seguente:
numero xi (numero di veicoli che passano
classe
in un intervallo di 30 sec)
1
0
2
1
3
2
4
3
5
4
6
5
7
6
8
7
9
8
10
9
11
10
12
11
13
12
fi frequenza assoluta (numero di
intervalli in cui sono giunti xi veicoli)
1
5
10
18
19
17
18
10
13
3
2
3
1
a) Disegnare il diagramma a segmenti della distribuzione delle
frequenze (assolute e relative);
b) Tabellare e disegnare la distribuzione cumulata delle frequenze
assolute e/o relative (simile alla funzione di distribuzione);
c) Trovare la media (speranza matematica), la varianza del campione
e l’indice di dissimetria;
d) Individuare la mediana e la moda della distribuzione;
e) Valutare gli indici relativi di dispersione e di dissimetria;
f) Simare media e varianza della popolazione a cui il campione
appartine;
g) Confrontare le frequenze relative (calcolate nel punto a)) con i
valori forniti dalla legge di probabilità di Poisson avente
media uguale a quella del campione osservato;
h) Verificare attraverso un test statistico l’ipotesi che la v.a.
sia distribuita come una variabile aleatoria di Poisson;
i) Ipotizzando che la popolazione segua una legge di probabilità di
Poisson valutare:
•
la probabilità che si abbia un distanziamento temporale
tra i veicoli ≤ 1 sec.,
•
il distanziamento temporale tra i veicoli che ha 80% di
probabilità
di
non
essere
superato
(funzione
di
distribuzione esponenziale).
ESERCIZIO N.2
Viene eseguito uno studio in cui si seleziona opportunamente un
campione significativo di guidatori. A tali guidatori viene
chiesto di percorrere una pista alla velocità costante di 90 km/h.
Sul percorso degli utenti vengono posizionati degli ostacoli e
viene misurato il tempo di percezione e reazione degli utenti
stessi. I dati ottenuti, suddivisi in classi sono riportati nella
tabella seguente.
Classe Tempo di
percezione e reazione
Numero di valori misurati
Estremo inferiore [sec] Estremo superiore [sec] appartenenti a ciscuna classe
1
1,15
0
1,15
1,3
0
1,3
1,45
0
1,45
1,6
3
1,6
1,75
11
1,75
1,9
17
1,9
2,05
16
2,05
2,2
9
2,2
2,35
3
2,35
2,5
1
2,5
2,65
0
2,65
2,8
0
2,8
2,95
0
2,95
3,1
0
3,1
3,25
0
3,25
3,4
0
3,4
3,55
0
Totale
misure eseguite =
60
Considerando come v.a. la grandezza ln(t):
a) Disegnare l’istogramma della distribuzione delle frequenze
(assolute e/o relative);
b) Tabellare e disegnare la distribuzione cumulata delle frequenze
assolute o relative (simile alla funzione di distribuzione);
c) Trovare la media (speranza matematica) e la varianza del
campione;
d) Indicare la mediana e la moda della distribuzione;
e) Stimare la media e la varianza della popolazione a cui il
campione appartiene
f) Confrontare le frequenze relative (calcolate nel punto a)) con i
valori forniti dalla legge di probabilità Normale con media e
varianza pari a quelle stimate in base al campione;
g) Verificare attraverso test statistico l’ipotesi che la v.a.
ln(t) sia distribuita come una variabile aleatoria Normale;
h) Ipotizzando che la popolazione, da cui abbiamo estratto il
campione, segua una legge di probabilità normale valutare il
tempo di percezione e reazione che ha il 90% di probabilità di
non essere superato (i.e. il valore corrispondente al 90°
percentile).