Esercizio SINTESI Si supponga di avere eseguito 170 misure della velocità istantanea dei veicoli che transitano nelle sezioni di due strade A e B. Si supponga che tali misure siano state eseguita in corrispondenza di valori modesti del volume di traffico transitante (tali che le misure di velocità possano considerarsi eventi indipendenti l’uno dall’altro). I valori della velocità misurata rappresentano realizzazioni di una variabile aleatoria (continua). Si vuole indurre dal campione rilevato la distribuzione di probabilità dell’intera popolazione. Per far questo rappresentiamo attraverso i criteri della statistica descrittiva i dati misurati. Per fare ciò dividiamo l’intero campo di variazione delle velocità misurato in un numero finito di intervalli di eguale ampiezza. La scelta del numero di classi da utilizzare viene effettuata utilizzando la relazione: Nclassi=1+3.3LOG(170)= 8,360481441 Il numero di classi prescelte è pari a 9 con ampiezza di ∆ =15 km/h. Si individuano pertanto per ciascuna classe il numero di osservazioni che a quella classe appartengono ottenendo il seguente quadro: Classe Velocità 0-15 15.1 - 30 30.1 - 45 45.1 - 60 60.1 - 75 75.1 - 90 90.1 - 105 105.1 - 120 120.1 - 135 Numero totale osservazioni Strada A 3 20 35 55 30 25 2 0 0 170 Strada B 0 2 10 20 28 40 30 25 15 170 STATISTICA DESCRITTIVA Si valutano quindi per ciascuna classe le frequenze assolute e percentuali nonché il valore hi=fi/∆. Il valore di hi è confrontabile con il valore della teorica funzione densità di probabilità della popolazione ricordando che la probabilità che la variabile aleatoria velocità assuma valori compresi in un intervallo ∆ è pari a f(x)* ∆ . Strada B Classe Velocità 0-15 15.1 - 30 30.1 - 45 45.1 - 60 60.1 - 75 75.1 - 90 90.1 - 105 105.1 - 120 120.1 - 135 valore 7,50 22,50 37,50 52,50 67,50 82,50 97,50 112,50 127,50 frequenza Frequ. ass Frequ. % hi Freq. Cum 0 2 10 20 28 40 30 25 15 0 0,0118 0,0588 0,1176 0,1647 0,2353 0,1765 0,1471 0,0882 0 1,18 5,88 11,76 16,47 23,53 17,65 14,71 8,82 0 0,000787 0,00392 0,00784 0,01098 0,015687 0,011767 0,009807 0,00588 0 1,18 7,06 18,82 35,29 58,82 76,47 91,18 100 100 Si rappresenta la distribuzione ottenuta con un istogramma (vedi figura). Si valutano alcuni indici descrittivi della distribuzione misurata; media, varianza e deviazione standard. 0,018 0,016 0,014 hi 0,012 0,01 0,008 0,006 0,004 0,002 0 7,50 22,50 37,50 52,50 67,50 82,50 97,50 112,50 127,50 Velocità [km/h] Valutiamo ora alcuni indici della distribuzione (media, varianza, deviazione standar, moda e mediana. Strada B Classe Valore Velocità xi Frequenza assoluta f*i Xi * f*i Xi2*f*i 0-15 15.1 - 30 30.1 - 45 45.1 - 60 60.1 - 75 75.1 - 90 90.1 - 105 105.1 - 120 120.1 - 135 7,50 22,50 37,50 52,50 67,50 82,50 97,50 112,50 127,50 0 2 10 20 28 40 30 25 15 0 0,0118 0,0588 0,1176 0,1647 0,2353 0,1765 0,1471 0,0882 0 0,2655 2,205 6,174 11,11725 19,41225 17,20875 16,54875 11,2455 0 5,97375 82,6875 324,135 750,41438 1601,5106 1677,8531 1861,7344 1433,8013 84,177 7738,11 Frequ. relativa Somma= X = ∑ f i ∗ xi = 84.177 [km/h] i m2 ( x) = ∑ f i ∗ xi2 = 7738.11 i n S 2 (x ) = ∑ (x −X i i =1 n ∑f i ) ⋅f [(km/h)^2] 2 i n ( = ∑ xi − X i =1 ) ⋅f 2 * i 9 ( ) 2 = ∑ xi2 ⋅ f i * − X = 652.343 [(km/h)2] i =1 i =1 2 S = 25.541 [km/h] La moda corrisponde alla classe 75-90 km/h quindi si può associre al valore medio della classe stessa pari a 82.50 ≈ media. La classe mediana è 75-90 km/h pertanto il valore mediano è: 1 m −1 ' − ∑ fi 2 i =1 mediana = x m + ⋅ ∆ m = 82.81 km/h ≈ media f m' dove xm è l’estremo inferiore della classe mediana e ∆m è l’ampiezza della classe mediana. L’indice di dissimmetria è pari a: ∑ (x 9 Dis ( x) = −X i i =1 9 ∑f ) ⋅f 3 i = - 393349.85 / 170 =-2313.82 [[(km/h)3] i i =1 Dis (x) = - -13.23 [km/h] Gli indici sintetici di variabilità e di dissimetria relativi sono: S2 c = 2 = 0.092 X Dis ( x) d= = -0.0038 3 X L’osservazione dei dati del campione indica che essi sono distribuiti in maniera pressochè simmetrica (media ≈ mediana ≈ moda) con una lieve dissimetria negativa (valori spostati verso sinistra). 3 STATISTICA INDUTTIVA Una stima non distorta della varianza della popolazione è fornita da: µ ≈ X = 84.177 [km/h] N σ 2 ≈ S *2* = S 2 ⋅ = 652.34* (170/169)=656.2 [(km/h)2] N −1 σ= σ ≈ S *2* = 25.62 [km/h] Si confronta la distribuzione del campione con la distribuzione di una variabile aleatoria caratterizzata da una legge densità di probabilità di tipo Normale, avente la stessa media e la stessa varianza del campione. Si nota che l’ipotesi di distribuzione di tipo normale sembra plausibile alla luce del confronto qualitativo eseguito. valori funzione densità di probabilità f(x) 0,018 0,016 0,014 0,012 0,01 0,008 0,006 0,004 0,002 0 0 15 30 45 60 75 90 105 120 velocità [km/h] valori campione distrib. Teorica 135 150 Si deve verificare l’ipotesi attraverso un test delle ipotesi (l’ipotesi è che il campione ottenuto provenga da una popolazione distribuita con legge di probabilità di tipo Normale). Ipotesi: πi=pi Cioè che le probabilità incognite della classe i-esima siano uguali alla probabilità che una v.a. Normale, con media e varianza pari a quella del campione, assuma un valore compreso nell’intervallo che definisce la classe i-esima. E’ intuitivo che tanto più è accettabile l’ipotesi quanto più prossime a zero sono le differenze: p*i-pi dove n pi* = i N cioè le differenze ni − N ∗ p i Si dimostra che se l’ipotesi è vera : k (ni − N ⋅ pi )2 Χχ2 = ∑ N ⋅ pi i =1 ha approssimativamente una distribuzione χ2 con ν =k-h-1 gradi di libertà, dove k è il numero delle classi e h è il numero dei parametri della distribuzione teorica (in questo caso i parametri della legge di probabilità Normale sono 2 µ e σ ). Se risulta : Χ χ 2 ≤ χ α2 dove χ α2 è il valore della v.a. χ2 in corrispondenza del valore della funzione di distribuzione pari a (α). l’ipotesi nulla può essere accettata o meglio non è possibile rifiutare l’ipotesi ad un livello di significatività pari ad α. E’ necessario pertanto calcolare la probabilità pi che la v.a. descritta dalla distribuzione teorica di probabilità (distribuzione Normale) assuma un valore compreso negli estremi che caratterizzano l’iesimo intervallo di velocità. Tale operazione può essere agevolmente eseguita consultando le tavole che forniscono i valori della funzione di distribuzione di della v.a. normale standardizzata (vedi tavola allegata). Per fare ciò dobbiamo trasformare i valori relativi agli estremi di ciascun intervallo di velocità nei valori della corrispondente v.a. Normale standardizzata: xiS−inf = xi −sup − µ xi −inf − µ e xiS−sup = σ σ Classe Valore v.a. NS Funz. Distrib. v.a. NS Velocità frequenza Valore inf Val. sup ziinf zisup F(ziinf) F(zisup) F(zisup)-F(ziinf) N*Pi 0-15 15.1 - 30 30.1 - 45 45.1 - 60 60.1 - 75 75.1 - 90 90.1 - 105 105.1 - 120 120.1 - 135 0 2 10 20 28 40 30 25 15 0 15,1 30,1 45,1 60,1 75,1 90,1 105,1 120,1 15 30 45 60 75 90 105 120 135 -3,286 -2,697 -2,111 -1,525 -0,940 -0,354 0,231 0,817 1,402 -2,700 -2,115 -1,529 -0,944 -0,358 0,227 0,813 1,398 1,984 0,000508 0,003503 0,017385 0,063572 0,173633 0,361541 0,591427 0,792973 0,919593 0,0034619 0,0172179 0,0630866 0,172634 0,3600796 0,5899105 0,7918555 0,919009 0,9763721 0,002954 0,013715 0,045702 0,109062 0,186446 0,228369 0,200428 0,126036 0,056779 0,5021528 2,3315761 7,7692699 18,540607 31,695837 38,822789 34,072764 21,426142 9,6524037 (ni-N*pi)^2/Npi 0,5021528 0,0471538 0,6404922 0,1148738 0,4309465 0,0356962 0,486823 0,5961159 2,9626596 5,8169138 Il valore in corrispondenza del quale la funzione di distribuzione della v.a. χ2 con 6 gradi di libertà (9-2-1) assume un valore pari a 0.05 è 12.591577 (vedi tavole allegate) che risulta maggiore del valore di 5.816 k (ni − N ⋅ pi )2 Χχ2 = ∑ =5.816 < 12.59 N ⋅ pi i =1 L’ipotesi, che le velocità istantanee sulla strada B si distribuiscano seguendo una legge di probabilità di tipo Normale, non può quindi essere rifiutata al livello di significatività pari a 5% Se si considera una probabilità di falso rifiuto o una significatività più basso e pari ad esempio a 0.01 (1%) si ha che il valore in corrispondenza del quale la funzione di distribuzione della v.a. χ2 con 6 gradi di libertà (9-2-1) assume un valore pari a 0.01 è 16.81 che risulta maggiore del valore di 5.816 ESERCIZIO N.1 Un osservatore registra sezione stradale il numero dei veicoli che passano in una durante un intervallo di 30 sec. Ripete l’osservazione 120 volte (cioè tiene sotto controllo la sezione stradale complessivamente per un’ora) e registra i risultati delle osservazioni nella tabella seguente: numero xi (numero di veicoli che passano classe in un intervallo di 30 sec) 1 0 2 1 3 2 4 3 5 4 6 5 7 6 8 7 9 8 10 9 11 10 12 11 13 12 fi frequenza assoluta (numero di intervalli in cui sono giunti xi veicoli) 1 5 10 18 19 17 18 10 13 3 2 3 1 a) Disegnare il diagramma a segmenti della distribuzione delle frequenze (assolute e relative); b) Tabellare e disegnare la distribuzione cumulata delle frequenze assolute e/o relative (simile alla funzione di distribuzione); c) Trovare la media (speranza matematica), la varianza del campione e l’indice di dissimetria; d) Individuare la mediana e la moda della distribuzione; e) Valutare gli indici relativi di dispersione e di dissimetria; f) Simare media e varianza della popolazione a cui il campione appartine; g) Confrontare le frequenze relative (calcolate nel punto a)) con i valori forniti dalla legge di probabilità di Poisson avente media uguale a quella del campione osservato; h) Verificare attraverso un test statistico l’ipotesi che la v.a. sia distribuita come una variabile aleatoria di Poisson; i) Ipotizzando che la popolazione segua una legge di probabilità di Poisson valutare: • la probabilità che si abbia un distanziamento temporale tra i veicoli ≤ 1 sec., • il distanziamento temporale tra i veicoli che ha 80% di probabilità di non essere superato (funzione di distribuzione esponenziale). ESERCIZIO N.2 Viene eseguito uno studio in cui si seleziona opportunamente un campione significativo di guidatori. A tali guidatori viene chiesto di percorrere una pista alla velocità costante di 90 km/h. Sul percorso degli utenti vengono posizionati degli ostacoli e viene misurato il tempo di percezione e reazione degli utenti stessi. I dati ottenuti, suddivisi in classi sono riportati nella tabella seguente. Classe Tempo di percezione e reazione Numero di valori misurati Estremo inferiore [sec] Estremo superiore [sec] appartenenti a ciscuna classe 1 1,15 0 1,15 1,3 0 1,3 1,45 0 1,45 1,6 3 1,6 1,75 11 1,75 1,9 17 1,9 2,05 16 2,05 2,2 9 2,2 2,35 3 2,35 2,5 1 2,5 2,65 0 2,65 2,8 0 2,8 2,95 0 2,95 3,1 0 3,1 3,25 0 3,25 3,4 0 3,4 3,55 0 Totale misure eseguite = 60 Considerando come v.a. la grandezza ln(t): a) Disegnare l’istogramma della distribuzione delle frequenze (assolute e/o relative); b) Tabellare e disegnare la distribuzione cumulata delle frequenze assolute o relative (simile alla funzione di distribuzione); c) Trovare la media (speranza matematica) e la varianza del campione; d) Indicare la mediana e la moda della distribuzione; e) Stimare la media e la varianza della popolazione a cui il campione appartiene f) Confrontare le frequenze relative (calcolate nel punto a)) con i valori forniti dalla legge di probabilità Normale con media e varianza pari a quelle stimate in base al campione; g) Verificare attraverso test statistico l’ipotesi che la v.a. ln(t) sia distribuita come una variabile aleatoria Normale; h) Ipotizzando che la popolazione, da cui abbiamo estratto il campione, segua una legge di probabilità normale valutare il tempo di percezione e reazione che ha il 90% di probabilità di non essere superato (i.e. il valore corrispondente al 90° percentile).