applicazioni delle medie statistiche

APPLICAZIONI DELLE MEDIE STATISTICHE
1
Misurazioni e statistica.
La misura di qualunque grandezza fisica è soggetta ad errori causati da vari fattori:
imperfezioni degli strumenti ed imperizia nel loro corretto uso, limitatezza dei sensi
umani, evento accidentali che influiscono sul processo di misurazione (ad esempio
eventi meterologici come pioggia o riduzione della visibilità, ecc...). Questo determina il
fatto per cui i valori rilevati in istanti diversi o nelle diverse prove di un esperimento
non sono in genere gli stessi ma sono variabili attorno al loro valore medio M.
Il valore medio aritmetico M di una serie di misurazioni effettuate è assunto, secondo
la concezione “ frequentista” della probabilità, quale valore “vero”, o valore più
probabile, della grandezza da misurare. La variabilità della serie di misurazioni, in
base agli indici statistici calcolati come lo scarto medio e lo scarto percentuale, lo
scarto quadratico medio ed il coefficiente di variabilità , fornisce non solo una
indicazione generica della dispersione dei dati rilevati ma anche un intervallo di valori
attorno al valore medio M entro il quale si può essere abbastanza sicuri che il valore
vero della velocità sia effettivamente collocato .
La distribuzione delle frequenze delle misure sperimentali di una grande fisica,
relativa ad un certo fenomeno e soggetta a “errori accidentali”, è una variabile
continua (nel senso che può assumere qualsiasi valore entro un dato intervallo) che
segue la “curva di Gauss”, una curva a “campana” ottenuta unendo tra loro i punti di
molte misurazioni (al limite possiamo dire infinite in senso astratto).
Frequenze
68 %
Misure
M-σ
M
M+σ
Ad ogni intervallo centrato sul valore medio di misurazione, [M −k⋅σ , M +k⋅σ] ,
dove k è un numero che identifica l'ampiezza dell'intervallo, corrisponde una data
probabilità P che il valore “vero” V vi appartenga e, tanto più grande è il valore scelto
di volta in volta per il numero k, e tanto più alta è questa probabilità.
Si può dimostrare che esiste la seguente corrispondenza tra intervalli di valori
attorno al valore medio M e probabilità che il valore vero V sia compreso in esso.
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.1
Ampiezza degli intervalli
Intervalli
Probabilità del valore V
k=0.68
[ M −0.68⋅σ , M +0.68⋅σ]
P≈50 %
k=1
[ M −σ , M +σ]
P≈68.3 %
k=2
[ M −2⋅σ , M+2⋅σ]
P≈95.5 %
k=3
[ M −3⋅σ , M+3⋅σ]
P≈97.3 %
Interpretando la tabella in termini di frequenze delle misure, possiamo dire che,
quando il numero di prove diviene molto grande (in astratto tendente ad infinito),
almeno il 50% dei valori misurati si trova entro l'intervallo numerico di centro M e
semiampiezza pari a 0.68⋅σ , almeno il 68% cade in quello di semiampiezza σ ,
almeno il 95% si trova in quello di semiampiezza 2⋅σ , ecc...
Supponiamo di dover rilevare la velocità , considerata in valore costante V, di un auto
in marcia per esempio, in autostrada. Velocità misurate in istanti diversi (Km/h):
128, 132, 130, 129, 129, 128, 132, 131, 130, 130, 129, 131, 130, 130, 131
Tabella valori-frequenze
128 km/h
129 Km/h
2
3
130 Km/h
131 Km/h
132 Km/h
5
3
2
Grafico a barre delle misurazioni della velocità
6
5
Frequenze
4
3
2
1
0
128
129
130
131
132
Velocità misurate [Km/h]
Valore medio
M=
128⋅2+129⋅3+130⋅5+131⋅3+132⋅2
=130 Km/h
15
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.2
I valori considerati in questo esempio , come si nota anche dal grafico, sono centrati
simmetricamente attorno al loro valore medio M. Anche se il numero di rilevazioni
effettuate non è grande (in tutto 15) possiamo supporre che la serie delle misure segua
una legge di distribuzione normale (legge di Gauss) per cui calcoliamo gli intervalli
entro i quali ci si aspetta che il valore V sia collocato con le probabilità della tabella
precedente.
Scarto quadratico medio:
σ=
√
(128−130)2⋅2+(129−130)2⋅3+0+(131−130)2⋅3+(132−130)2⋅2
≈1.2
15
In base al valore dello scarto riportiamo la tabella degli intervalli (valori approssimati
ad una cifra) di attribuzione del valore V e delle rispettive probabilità:
Ampiezza degli intervalli
Intervalli di V [Km/h]
Probabilità del valore V
k=0.68
[129.2 , 130.8]
P≈50 %
k=1
[128.8 , 131.2]
P≈68.3 %
k=2
[127.6 , 132.4 ]
P≈95.5 %
k=3
[126.4 ,133.6]
P≈97.3 %
Spetta allo sperimentatore, in base al livello di fiducia dato dalla probabilità scelta,
l'intervallo da adottare e , ad esempio l'ultimo della tabella, [126.4 ,133.6] per il
quale la probabilità che il valore V si trovi in esso vale il 97.3 % .
(Notiamo qui che gli estremi di questo intervallo distano dal valore medio M=130 per
meno di 4Km/h che è un valore non lontano dalla tolleranza ammessa dal vigente
codice della strada di 5 o di 10 km/h).
Talvolta, come nel caso dei valori che si riferiscono a molti prodotti industriali, un
valore misurato appare come: V ±k⋅σ per cui, per l'intervallo scelto nell'esempio si
può dire che la velocità misurata è, al 97.3% di probabilità, V = 130.0±3.6 Km/h.
Da questo semplice esempio, e con riferimento a quanto è stato esposto, si può
attribuire un notevole significato, sia concettuale che pratico, alla elaborazione
statistica delle misurazioni in qualunque campo.
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.3
2
Medie statistiche e variabilità dei primi cinque numeri naturali.
Media aritmetica M =
Scarto medio
1+2+3+4+5 15
= =3 .
5
5
̄S =∣1−3∣+∣2−3∣+∣3−3∣+∣4−3∣+∣5−3∣= 2+1+0+1+2 = 6 =1.2 .
5
5
5
Media quadratica
√
√
12+2 2+32 +4 2+5 2
55
Q=
=
= √ 11≈3.32 .
5
5
(1−3)2+(2−3)2+(3−3)2+(4−3)2+(5−3)2 4+1+0+1+4 10
=
= =2 .
Varianza VAR=
5
5
5
Scarto quadratico medio
σ=√ VAR=√ 2≈1.41 .
2
2
2
Proprietà scarto quadratico medio σ2 =Q2−M 2 →
← ( √ 2) =( √ 11) −3 → 2=11−9 .
Indici di variabilità relativi:
S
1.2
⋅100=40 % .
- Scarto medio percentuale ̄S %= ⋅100=
M
3
- Coefficiente di variabilità
Media geometrica
Media armonica
√2
CV = σ ⋅100= ⋅100≈47 % .
M
3
5
5
G=√ 1⋅2⋅3⋅4⋅5=√ 120≈2.6 .
A=
5
5
60
=
=5 ⋅
≈2.2
1 1 1 1 1 137
137
+ + + +
1 2 3 4 5 60
Diseguaglianze tra le medie statistiche A⩽G⩽M ⩽Q →
← 2.2⩽2.6⩽3⩽3.2 .
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.4
3
Media armonica di N valori.
La media armonica di N valori {x 1 , x 2 , ..... , x N } è definita come il reciproco della
media dei reciproci, ovvero:
A=
1
1 1
1
+ +.....+
x1 x2
xN
N
=
N
1 1
1
+ +.....+
x1 x 2
xN
Se ciascuno degli N dati è associato ad un ripettivo peso o frequenza la formula della
media armonica si modifica poiché ogni termine reciproco viene moltiplicato per la
rispettiva frequenza:
A=
N
1
1
1
⋅f 1 + ⋅f 2 +.....+ ⋅f N
x1
x2
xN
Consideriamo di seguito due esempi applicativi.
A- Media armonica dei prezzi
Spendendo periodicamente una certa somma S [€] per l'acquisto di un dato bene, o
S
servizio, ad un prezzo unitario p [€/unità di bene] si ottiene la quantità Q=
.
p
Di conseguenza, se il prezzo unitario varia di volta in volta con i valori p1 , p2 , .... p N ,
le quantità acquistate dopo N pagamenti sono Q1=
S
S
S
, Q2= , .... , Q N =
per cui
p1
p2
pN
la quantità totale del bene acquistato è Q=Q1+Q2+....+Q N =
S
S
S
+
.... +
.
p1 p 2
pN
Il prezzo medio di acquisto è dato dal rapporto tra la somma totale spesa in N spese
di valore S , pari a N⋅S , e la quantità totale, ovvero è la media armonica dei prezzi:
p=
N⋅S
N⋅S
N⋅S
N
=
=
=
Q
S
S
S
1 1
1
1 1
1
+
.... +
( + .... + )⋅S
+
.... +
p 1 p2
pN
p1 p2
pN
p1 p 2
pN
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.5
Esempio: calcolo del costo unitario di acquisto [€/Kg] del pane in N=5 giorni diversi,
spendendo un quota fissa pari a S=10 €: 3.1, 2.9, 3.2, 3.7, 4.1 .
Le quantità totale di pane acquistata è data dalla somma delle 5 quantità giornaliere:
10 10
10
Q=Q1+Q2+....+Q5 =
+
.... +
≈3.23+3.45+3.13+2.70+2.44=14.95
3.1 2.9
4.1
Essendo la spesa totale uguale a 10⋅5=50 €, il prezzo medio del bene è dato dal
50
≈3.3 €/Kg .
rapporto tra tale somma e la quantità totale comprata: p=
14.95
Calcolando più rapidamente il prezzo medio con la formula della media armonica si ha:
p=
B-
5
≈3.3
1
1
1
1
1
€/Kg .
+
+
+
+
3.1 2.9 3.2 3.7 4.1
Velocità media armonica.
La velocità media V [mt/sec] di un dato oggetto in moto è data dal rapporto tra lo
S
spazio percorso S [mt] ed il tempo T [sec] impiegato a percorrerlo : V =
.
T
Quando l'oggetto si sposta in N tappe della stessa lunghezza L , ed in ognuna di esse la
velocità media è diversa, V 1 , V 2 , ...... , V N , i singoli tempi di percorrenza sono:
L
L
L
T 1 = , T 2=
, ..... , T N =
. Il tempo impiegato è diverso per cui il tempo totale
V1
V2
VN
impiegato per percorrere l'intero percorso è dato da: T=T 1+T 2+.....+T N ovvero:
L
L
L
+
, ..... , +
. La velocità media è quindi data dal rapporto tra l'intera
V1 V2
VN
distanza percorsa in N tappe uguali, pari a S=L⋅N , ed il tempo totale T, cioè la
media armonica delle singole velocità medie:
T=
V=
L⋅N
L
L
L
+
, ..... , +
V1 V2
VN
L⋅N
=
(
1 1
1
+
, ..... , +
)⋅N
V1 V2
VN
=
N
1
1
1
+
, ..... , +
V1 V2
VN
Esempio: calcolare la velocità media di un ciclista che percorre tre tappe uguali alle
seguenti velocità medie: V 1=10.0 mt/sec , V 2=8.0 mt/sec , V 3=12.5 mt/sec.
Calcoliamo la velocità media direttamente, senza necessità di conoscere né le distanze
delle singole tappe né i tempi di percorrenza:
3
V=
≈9.84
1 1
1
[mt/sec] pari a V =9.84⋅3.6 ≈35.4 [Km/h]
+ +
10 8 12.5
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.6
4- Media geometrica.
La media geometrica G di N valori {x 1 , x 2 , ..... , x N } è definita come la radice
N-esima del loro prodotto, dove per radice N-esima di un certo valore intendiamo quel
particolare numero che, elevato all'esponente uguale all'indice N, fornisce quel valore:
N
N
G = √ x 1⋅x 2⋅.......⋅x N →
← G =x 1⋅x 2⋅.......⋅x N
Dalla definizione data discende che l'applicazione della media geometrica intressa
maggiormente tutti quei fenomeni nei quali un certo risultato dipende dalla
moltiplicazione di una serie di valori associati ai dati statistici. Questi dati statistici
potranno di volta in volta appartenere a campi diversi, ad esempio tassi di interesse in
matematica finanziaria, inflazioni in economia, livelli di crescita di popolazioni in
campo biologico, ecc..
A- Tasso medio di investimento.
Un capitale iniziale pari a C [€] viene investito in N periodi uguali (ad esempio, mesi,
semestri o anni) in ognuno dei quali frutta un interesse composto diverso un periodo
dall'altro {i 1 , i 2 , ..... , i N } . Alla fine del primo periodo il capitale complessivo
(montante del primo anno M 1 ) vale il capitale iniziale più gli interessi sul capitale,
ovvero M 1 =C+i 1⋅C=C (1+i 1) . Alla fine del secondo periodo il capitale è dato dal
montante del primo anno più gli interessi maturati sul montante del primo anno,
ovvero M 2 =M 1+i 2⋅M 1=M 1 (1+i 2 )=C (1+i 1 )(1+i 2 ) . Si può continuare così per
ogni anno trovando che, da un anno all'altro, il montante è ottenuto moltiplicando il
montante ad inizio anno per il fattore di capitalizzazione pari a (1+i), in modo che, al
termine degli N periodi uguali il montante finale è uguale al prodotto seguente:
M N =C⋅(1+i 1 )⋅(1+i 2 )⋅......⋅(1+i N )
Lo schema orizzontale mostra, l'ungo l'asse dei tempi, gli N periodi di capitalizzazione:
C 144424443
periodo 1
M1 144424443
periodo 2
M2
i
 1→
i
 2→
.......................................
periodo N
MN
144424443
i
 N→
Esempio: un capitale C=1000 [€] viene investito per tre anni consecutivi in
capitalizzazione composta ai seguenti tassi di interesse annuali:
i 1 =0.03, i 2 =0.05, i 3 =0.02 . La somma ritirabile dopo i tre anni vale:
M 3 =1000⋅(1+0.03)⋅(1+0.05)⋅(1+0.02)=1000⋅1.103=1103 [€]
*
*
*
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.7
Immaginiamo ora che esista un particolare valore x del tasso di interesse , detto anche
tasso medio di investimento che, applicato ugualmente a ciascuno degli N periodi di
capitalizzazione, fornisca lo stesso montante finale ottenuto con N tassi diversi:
C 144424443
periodo 1
M1 144424443
periodo 2
M2
i =x
i =x
 1 →
 2 →
.......................................
periodo N
MN
144424443
i =x
 N  →
Per ottenere l'espressione del montante finale in funzione di questo particolare valore
basta sostituire il suo simbolo al posto di ciascuno dei simboli dei tassi nella
espressione del montante finale M N =C⋅(1+i 1 )⋅(1+i 2 )⋅......⋅(1+i N ) , ovvero:
M N =C⋅(1+x)⋅(1+x)⋅......⋅(1+ x)=C⋅(1+ x)
N
Dovendo essere uguali i valori dei montanti, rispettivamente con tassi diversi e con
l'unico tasso x, occorre uguagliare le due espressioni per ottenerne il valore:
N
C⋅(1+ x) =C⋅(1+i 1 )⋅(1+i 2 )⋅......⋅(1+i N )
Ora, dopo avere diviso i due membri dell'equazione per il termine C comune si ottiene:
N
(1+x ) =(1+i 1 )⋅(1+i 2 )⋅......⋅(1+i N )
Infine, servendoci della definizione di radice geometrica, si può dire che il fattore di
capitalizzazione del tasso medio di ivestimento è uguale alla media geometrica dei
singoli fattori di capitalizzazione:
N
1+ x= √(1+i 1 )⋅(1+i 2 )⋅......⋅(1+i N )
Il tasso medio x di investimento di N periodi di capitalizzazione composta con tassi
diversi {i 1 , i 2 , ..... , i N } è quindi dato dall'espressione:
N
x= √ (1+i 1)⋅(1+i 2 )⋅......⋅(1+i N )−1
*
*
*
Dall'esempio precedente, per ottenere il valore del tasso medio di investimento dei tre
periodi annuali ai tassi i 1 =0.03, i 2 =0.05, i 3 =0.02 si applica la precedente formula
della media geometrica dei fattori di capitalizzazione:
3
3
x =√ (1+0.03)⋅(1+0.05)⋅(1+0.02)−1=√ 1.103−1=1.033−1=0.033
Pertanto, se il tasso applicato per i tre anni consecutivi è uguale al 3.3% il capitale da
ritirare alla fine del terzo anno è sempre pari a 1103 [€].
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.8
B- Crescita di una popolazione.
Data una certa popolazione di individui, si conta il loro numero iniziale P0 e, al termine
di ciascuno di N periodi di tempo tutti uguali, {P 1 , P 2 , ..... , P N } .
Al termine di ciascuno degli N periodi la polpolazione è cambiata rispetto al periodo
precedente secondo un certo incremento percentuale x% variabile in ognuno di essi:
x1
x1
=P 0⋅(1+
),
100
100
x
x
x
x
P 2=P 1 +P 1 ⋅ 2 =P 1⋅(1+ 2 )=P 0⋅(1+ 1 )⋅(1+ 2 )
100
100
100
100
P 1=P 0 +P 0⋅
.. e così via fino alla fine dell'ultimo periodo :
P N =P 0⋅(1+
x1
x2
xN
)⋅(1+
)⋅..........⋅(1+
)
100
100
100
Esempio 1: una popolazione che all'inizio contava P0=100 individui, è stata esaminata
per N=4 anni consecutivi e, al termine di ciascuno dei quattro anni la popolazione è
cambiata secondo i seguenti aumenti: x 1=13 % , x 2=22 % , x 3=15 % , x 4 =24 % .
La poplazione dopo N=4 anni conta un numero di individui pari a:
P 4 =100⋅(1+
13
22
15
24
)⋅(1+
)⋅(1+
)⋅(1+
)=100⋅1.966≈197 individui.
100
100
100
100
*
*
*
Se si immagina che una popolazione, anziché cresecere periodo dopo periodo secondo
cambiamenti percentuali diversi, ad un unico valore di incremento costante per
ognuno degli N periodi, detto tasso medio di accrescimento x%, mantenendo il
numero di individui allo stesso valore finale, l'espressione di tale numero si ottiene
sostituendo il valore x al posto degli N diversi tassi di crescita:
x
x
x
x
P N =P 0⋅(1+
)⋅(1+
)⋅..........⋅(1+
)=P 0⋅(1+
)
100
100
100
100
N
Dall'uguaglianza delle due espressioni e dopo avere diviso per il fattore comune, si ha
che il fattore medio di crescita è dato dalla media armonica dei singoli fattori :
N
x1
x2
xN
x
(1+
) =(1+
)⋅(1+
)⋅..........⋅(1+
)
100
100
100
100
x1
x2
xN
N
x
(1+
)= (1+
)⋅(1+
)⋅..........⋅(1+
)
100
100
100
100
√
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.9
Dall'esempio precedente, si ricava il fattore medio di crescita ed il tasso medio di
accrescimento della popolazione nel periodo di N=4 anni:
1+
√
x
13
22
15
24
4
4
= (1+
)⋅(1+
)⋅(1+
)⋅(1+
)=√ 1.966=1.184
100
100
100
100
100
x=(1.184−1)⋅100=18.4 % . Al tasso di crescita costante, pari al 18.4 % annuale, la
popolazione sarebbe ugualemente passata, dagli iniziali 100 individui, al finale di 197.
*
*
*
Esempio 2: dati di crescita della popolazione mondiale (wikipedia, Novembre 2011)
Popolazione mondiale storica e stime future (in milioni)
PERIODI
Regioni
Mondo
Africa
Asia
Europa
America Latina e Caraibi
Nord America
Oceania
1750 1800 1850 1900 1950 1999 2050 2150
791
106
502
163
16
2
2
978
107
635
203
24
7
2
1.262
111
809
276
38
26
2
1.650
133
947
408
74
82
6
2.521
221
1.402
547
167
172
13
5.978
767
3.634
729
511
307
30
8.909
1.766
5.268
628
809
392
46
9.746
2.308
5.561
517
912
398
51
Nell'arco di N=12 anni, dal 1999 ad oggi , la popolazione mondiale è passata da circa
P0=6 miliardi a circa P12=7 miliardi (Novembre 2011).
Determiniamo prima l'espressione del tasso medio x% di crescita in un periodo di N
anni in cui la popolazione passa da un valore iniziale P0 a un valore finale PN:
P 0⋅(1+
√
√
N
x
x
N PN
N PN
) =P N →
1+
=
→ x=(
−1)⋅100
←
100
100
P0
P0
Applichiamo ora l'espressione trovata ai dati in possesso:
x=
√
12
7
−1=(1.013−1)⋅100=1.3 %
6
Se questo tasso medio fosse mantenuto per altri 12 anni, la popolazione mondiale nel
2023 diventerebbe pari a P 2023=P 2011⋅1.01312≈7⋅1.43=10 miliardi di individui!
In realtà le previsioni più lontane indicano dei tassi di crescita minori in relazione,
probabilmente, a fattori quali la limitatezza delle risorse e i conflitti.
Prof. I. Savoia – Applicazioni delle medie statistiche – Novembre 2011 -
P.10