Capitolo 9 PROPAGAZIONE DEGLI ERRORI

Capitolo 9
PROPAGAZIONE DEGLI
ERRORI
La misura della grandezza fisica è generalmente accompagnata dalla stima
dell’errore ad essa associato. Sappiamo come stimare l’errore nel caso di una
misura diretta, ma che cosa accade quando la grandezza fisica in esame è
legata matematicamente ad una o più altre grandezze, ciascuna con il proprio
errore? Si consideri ad esempio l’equazione del moto uniforme:
s =vt
(9.1)
Supponiamo di voler misurare la velocità media di un corpo:
s
(9.2)
t
Entrambe le grandezze s e t sono misurate con una certo errore ∆s e ∆t.
Che errore ∆v dovremo associare alla velocità? In che modo gli errori delle
grandezze coinvolte si ripercuotono sull’errore della quantità che vogliamo
determinare?
Possiamo affermare quindi che nella maggior parte dei casi lo sperimentatore utilizza un metodo di misura indiretto: il valore della grandezza fisica
deriva da misure di altre grandezze, misurate o direttamente o con strumenti
tarati, legate ad essa da una qualche relazione funzionale.
Vediamo un esempio semplice:
Vogliamo calcolare l’area di una superficie S rettangolare conoscendo i
suoi lati a e b e vedere come si propagano gli errori ∆a e ∆b.
Se S = a b, l’errore massimo che possiamo compiere su S è dato da:
v=
S + ∆S = (a + ∆a) (b + ∆b) = a b + a ∆b + b ∆a + ∆ a∆b
89
(9.3)
90
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
Se ∆a ≪ a e ∆b ≪ b allora il termine ∆a ∆b è piccolo rispetto agli altri
termini e si può trascurare, cioè se ci fermiamo ai termini al primo ordine
possiamo scrivere:
∆S = a ∆b + b ∆a
(9.4)
Vediamo adesso in dettaglio come si propagano gli errori in vari sottocasi,
supponendo di aver misurato una o più grandezze a, b, c,... aventi errori ∆a,
∆b, ∆c, ... Chiamiamo x la quantità di cui vogliamo ottenere la misura e
l’indeterminazione per via indiretta.
9.1
Somme e differenze
Sia x = a + b. Il più alto valore probabile di a è a + ∆a, mentre di b è b + ∆b,
quindi il più alto valore probabile per x sarà:
x + ∆x = (a + ∆a) + (b + ∆b) = (a + b) + (∆a + ∆b)
Mentre il più basso sarà:
x − ∆x = (a − ∆a) + (b − ∆b) = (a + b) − (∆a + ∆b)
da cui ricaviamo che:
∆x = ∆a + ∆b
Analogamente, nel caso x = a − b, il più alto valore probabile per x sarà:
x + ∆x = (a + ∆a) − (b − ∆b) = (a − b) + (∆a + ∆b)
Mentre il più basso sarà:
x − ∆x = (a − ∆a) − (b + ∆b) = (a − b) − (∆a + ∆b)
da cui ricaviamo ancora che:
∆x = ∆a + ∆b
Quindi, generalizzando possiamo dire che:
l’errore massimo associato a una grandezza fisica che è il risultato della
somma, o della differenza o di una combinazione di esse, fra due o più grandezze, ciascuna misurata con la propria incertezza, si ottiene sommando gli
errori delle singole grandezze.
x = a + b − c + ....
(9.5)
∆x = ∆a + ∆b + ∆c + ....
(9.6)
91
9.2. PRODOTTI E QUOZIENTI
9.2
Prodotti e quozienti
Sia x = a b. Come prima, il più alto valore probabile di a è a + ∆a, mentre
di b è b + ∆b, quindi il più alto valore probabile per x sarà:
x + ∆x = (a + ∆a) (b + ∆b) = a b + a ∆b + b ∆a + ∆a ∆b
Nell’ipotesi che ∆a ≪ a e ∆b ≪ b, possiamo ragionevolmente assumere
che ∆a ∆b si possa trascurare.
Da cui ricaviamo che:
∆x = a ∆b + b ∆a
Conviene in questo caso introdurre il concetto di errore relativo ∆x/x:
∆x
a ∆b + b ∆a
∆a ∆b
=
=
+
x
ab
a
b
In realtà la notazione corretta è la seguente:
a ∆b + b ∆a
∆a ∆b
∆x
=
=
+
|x|
ab
|a|
|b|
questo perché l’errore relativo deve essere comunque una quantità positiva, a prescindere dal valore della grandezza fisica a cui è associato.
Nel caso in cui x = a/b, il più alto valore probabile per x sarà:
a + ∆a
b − ∆b
Introducendo anche qui l’errore relativo si ha:
x + ∆x =
∆a
a 1 + |a|
x + ∆x =
b 1 − ∆b
|b|
Moltiplicando numeratore e denominatore per 1 +
2
termini (∆b/|b|) e (∆a/|a|)(∆b/|b|), si ottiene:
x + ∆x =
a
∆a ∆b
(1 +
+
)
b
|a|
|b|
Sviluppando questa relazione si ricava:
1+
∆x
∆a ∆b
=1+
+
|x|
|a|
|b|
∆b
,
|b|
e trascurando i
92
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
E infine:
∆x
∆a ∆b
=
+
|x|
|a|
|b|
Quindi, generalizzando possiamo dire che:
l’errore relativo associato a una grandezza fisica che è il risultato del prodotto, o del quoziente o di una combinazione di essi, fra due o più grandezze,
ciascuna misurata con la propria incertezza, si ottiene sommando gli errori
relativi delle singole grandezze.
x=
ab
cd
∆x
∆a ∆b ∆c ∆d
=
+
+
+
|x|
|a|
|b|
|c|
|d|
9.3
(9.7)
(9.8)
Prodotto per una costante
Consideriamo adesso il caso in cui la grandezza di cui vogliamo stimare l’errore sia il risultato del prodotto di un’altra grandezza che misuriamo con una
costante priva di indeterminazione. Sia cioè: x = k b, con k costante.
Utilizziamo la formula trovata nella sezione precedente:
∆k ∆b
∆x
=
+
|x|
|k|
|b|
Poiché k non ha un errore associato, la quantità ∆k = 0. Quindi:
E infine:
∆b
∆x
=
|x|
|b|
∆x = |k| ∆b
9.4
Potenza
Consideriamo infine il caso in cui la grandezza di cui vogliamo determinare
l’incertezza è legata alla grandezza misurata, o alle grandezze misurate, da
una legge di potenza. Sia cioè: x = an .
E’ sufficiente scrivere la precedente espressione nella forma:
x = a1 a2 a3 ... an
93
9.5. CASO GENERALE
con
a1 = a2 = a3 = ... = an = a
Per cui, l’errore è dato da:
∆x
∆a
=n
|x|
|a|
Nel caso di espressioni più complesse che includono prodotti di potenze
di più variabili, come ad esempio:
x = an bk
si applica una combinazione della regola del prodotto e della potenza,
cioè:
∆x
∆a
∆b
= |n|
+ |k|
|x|
|a|
|b|
9.5
Caso generale
Supponiamo di aver misurato una grandezza x0 e aver determinato il suo
errore ∆x. Ora vogliamo sapere come si propagherà l’incertezza di x0 sulla
grandezza y = f (x).
f (x0+∆x)
f (x0 )
f (x0−∆x)
x0−∆x
x0
x0+ ∆x
Il più grande valore probabile di x0 è x0 + ∆x, mentre il più piccolo valore
probabile è x0 − ∆x. Dal grafico si può facilmente vedere che il più grande
e il più piccolo valore probabile di y saranno f (x0 + ∆x) e f (x0 − ∆x).
Se l’errore ∆x è sufficientemente piccolo rispetto a x0 , allora il tratto
di curva compreso fra x0 − ∆x e x0 + ∆x si può approssimare con la retta
94
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
tangente in x0 e assumere che, essendo uguale l’ampiezza degli intervalli
[x0 − ∆x, x0 ] e [x0 , x0 + ∆x] :
f (x0 + ∆x) − f (x0 ) = ∆f
f (x0 ) − f (x0 − ∆x) = ∆f
Da cui, sommando membro a membro, si ricava che l’indeterminazione
da associare alla funzione y è:
ossia:
f (x0 + ∆x) − f (x0 − ∆x) = 2∆f
f (x0 + ∆x) − f (x0 − ∆x)
2
Poiché in generale f (x0 +∆x) e f (x0 −∆x) sono spesso incogniti o difficili
da derivare, si deve ricorrere a qualche approssimazione. Consideriamo quindi
l’espressione:
∆f =
∆f = f (x0 + ∆x) − f (x0 )
Essendo ∆x piccolo, possiamo espandere la funzione y in serie di Taylor
al primo ordine e scrivere:
df df (x0 + ∆x − x0 ) = f (x0 ) + ∆x
f (x0 + ∆x) = f (x0 ) + dx x=x0
dx x=x0
E quindi:
df ∆f =
∆x
dx x=x0
cioè per trovare l’errore associato alla funzione y = f (x) dobbiamo caldf
e moltiplicarla per l’errore ∆x. Resta inteso che la
colare la derivata
dx
df
derivata
deve essere non nulla o prossima a zero per x = x0 .
dx
Si faccia inoltre attenzione che non necessariamente (x + ∆x) > (x − ∆x)
implica f (x + ∆x) > f (x − ∆x). Nel caso in cui la pendenza della retta sia
negativa, si avrà:
df ∆x
∆f = − dx x=x0
95
9.5. CASO GENERALE
E quindi generalizzando:
df ∆x
∆f = dx x=x0
Se adesso la grandezza y è funzione di k grandezze xj misurate direttamente, cioè y = f (x1 , x2 , · · · xk ), allora dovremo fare uso del concetto di
differenziale di una funzione di più variabili: per variazioni infinitesime dxj
la variazione di y è data dal differenziale di f (x):
k
X
∂f
df =
dxj
∂xj
j=1
Se gli errori ∆xj sono sufficientemente piccoli da giustificare l’approssimazione lineare e le derivate sono non nulle, l’errore massimo di y è dato dal differenziale della funzione f (x1 , x2 , · · · xk ), prendendo i moduli delle
derivate:
k X
∂f ∆f =
∂xj j=1
∆xj
xj =xjo
La propagazione degli errori massimi mediante l’uso del differenziale si
basa sull’assunzione che le variazioni infinitesime delle variabili siano date dai
rispettivi errori. Poiché si vuole stimare l’errore massimo per y è opportuno
sommare tutti i termini coerentemente, ovvero si prendono i moduli delle
derivate parziali. Di solito viene considerato l’errore massimo nei casi in cui:
(1) il metodo di misura sia grossolano, la ripetizione delle misure porti sempre
allo stesso risultato entro l’errore di sensibilità dello strumento o del metodo;
(2) non ci sia stata la possibilità di ripetere un numero sufficientemente alto
di misure (n ≥ 10) per poter stimare l’errore quadratico medio; (3) si possa
approssimare ∆f (x) ≈ 3 σf (x) per n ≥ 10.
96
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
9.6
9.6.1
Esempi in fisica
Legge di Snell
n1
i
r
n2
Quando un fascio di luce attraversa due mezzi aventi indice di rifrazione
diverso, subisce una deviazione nella sua direzione di propagazione, secondo
la famosa Legge di Snell:
n1 sin i = n2 sin r
Dove n1 e n2 sono gli indici di rifrazione dei due mezzi, i è l’angolo di
incidenza e r è l’angolo di rifrazione, entrambi misurati rispetto alla verticale
alla superficie di separazione dei due mezzi. Se assumiamo che il primo mezzo
sia l’aria, allora n1 = 1, e possiamo calcolare n2 = n misurando i due angoli
i ed r:
n=
sin i
sin r
Alla misura di questi angoli sarà associato un errore, rispettivamente ∆i
e ∆r. Applicando la formula generale della propagazione degli errori, si
ottiene:
∂n ∂n ∆n = ∆i + ∆r
∂i
∂r
Da cui:
97
9.6. ESEMPI IN FISICA
1 ∂sin i ∂ 1 ∆n = ∆i + sin i
∆r
sin r ∂i ∂r sin r cos i sin i cos r ∆i + −
∆r
∆n = sin r (sin r)2 Dividendo ambo i membri per n si ricava l’errore relativo:
∆n ∆i ∆r +
=
n
tan i tan r È possibile raggiungere il medesimo risultato applicando l’espressione della propagazione degli errori nel caso del quoziente. Si scriva X = sin i e
Y = sin r, allora sarà:
n=
X
Y
e l’errore relativo sarà:
∆n ∆X ∆Y
=
+
n
X Y
Poiché X e Y non sono quantità misurate direttamente ma ottenute
da funzioni delle quantità misurate i e r, le espressioni per ∆X e ∆Y si
otterranno differenziando X e Y :
∆X =
d sin i
∆i = cos i ∆i
di
∆Y =
d sin r
∆r = cos r ∆r
dr
Da cui:
E infine:
∆n cos i ∆i cos r ∆r +
=
n
sin i sin r ∆n ∆i ∆r +
=
n
tan i tan r 98
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
9.6.2
Legge dei punti coniugati
Consideriamo un sistema ottico, ad esempio una lente convergente sottile di
lunghezza focale f non conosciuta, e poniamo da un lato una sorgente luminosa a una distanza p dal centro della lente. La lente formerà un’immagine
dall’altro lato ad una distanza q dal centro.
p
f
q
Le tre quantità in gioco sono legate dalla legge dei punti coniugati:
1 1
1
+ =
p q
f
Vogliamo determinare la focale f e il suo errore ∆f , noti p ± ∆p e q ± ∆q.
Conviene scrivere l’espressione per la lunghezza focale nel modo seguente:
f=
pq
p+q
Sarà quindi:
∂f ∂f ∆f = ∆p + ∆q
∂p
∂q
Ora, la derivata parziale di f rispetto a p vale:
− (pq) ∂(p+q)
(p + q) ∂(pq)
q2
∂f
p
p
=
=
∂p
(p + q)2
(p + q)2
Mentre la derivata parziale di f rispetto a q vale:
p2
∂f
=
∂q
(p + q)2
E quindi sostituendo e calcolando l’errore relativo si ottiene:
99
9.6. ESEMPI IN FISICA
q ∆p p ∆q ∆f
=
+
f
p + q p p + q q Poiché p, q e f sono tutte quantità positive il modulo non è necessario, e
si può scrivere:
∆f
q + p − p ∆p p + q − q ∆q
=
+
f
p+q
p
p+q q
da cui si ottiene:
∆p ∆q ∆p + ∆q
∆f
=
+
−
f
p
q
p+q
Proviamo ora a vedere cosa accade se poniamo X = pq e Y = p + q. In
questo caso:
∆X ∆Y ∆f
=
+
f
X Y Per ottenere ∆X e ∆Y bisogna differenziare le loro espressioni:
∆X = q∆p + p∆q
∆Y = ∆p + ∆q
Da cui si ha:
q∆p + p∆q ∆p + ∆q ∆f
+
= p+q f
pq
∆p ∆q ∆p + ∆q ∆f
+ +
= f
p q p+q Di nuovo, essendo le variabili tutte quantità positive i moduli si possono
eliminare. Si può verificare agevolmente che quest’ultima espressione non
coincide con quella ottenuta applicando la formula generale per la propagazione degli errori! Questo accade perché le stesse variabili si presentano
sia al numeratore che al denominatore e quindi variazioni ∆p o ∆q agiscono
contemporaneamente e possono produrre un effetto compensativo. Di conseguenza, in questi casi particolari, utilizzare il metodo appena esposto produce
una sovrastima dell’errore e quindi non è consigliabile.
100
9.7
9.7.1
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
Esempi in astrofisica
Flusso e magnitudine
La magnitudine di una stella è legata al flusso di energia misurato dall’osservatore dalla seguente espressione:
m = m0 − 2.5 log10 f
dove m è la magnitudine, m0 è una costante e f è il flusso di energia
emesso dalla stella considerata. Il flusso viene misurato integrando il segnale
luminoso registrato su un rivelatore (CCD, lastra fotografica) all’interno di
un’apertura di raggio alcuni secondi d’arco. Al variare dell’apertura scelta,
varia anche il flusso di energia in essa contenuto. Le fluttuazioni casuali
del segnale, che chiamiamo rumore, introducono significative incertezze nella
misura del flusso.
Se misuriamo più volte il flusso della stella in esame, oppure se consideriamo più immagini della stessa stella e in ognuna di essere misuriamo il
flusso, possiamo stimare l’incertezza ∆f .
Come si traduce questa incertezza in termini di magnitudine, ∆m ?
Applichiamo le formule viste prima:
dm ∆f
∆m = df 101
9.7. ESEMPI IN ASTROFISICA
d
∆m = (m0 − 2.5 log10f ) ∆f
df
d
d
∆m = m0 ∆f + 2.5 log10 f ∆f
df
df
Convertendo il logaritmo decimale in logaritmo naturale, e considerando
che m0 è una costante, si ha:
2.5 d
∆f
lnf
∆m =
ln10 df
∆m = 1.086
∆f
f
In questo caso, poiché f è una quantità sicuramente positiva, il modulo
non è necessario. Un errore del 20% sulla misura del flusso, si traduce in
circa 0.2 mag di errore. Si consideri che la tecnica dei transiti, utilizzata
per identificare candidati pianeti extrasolari, ossia pianeti in orbita attorno
a stelle diverse dal Sole, richiede una precisione dell’ordine del millesimo di
magnitudine, che significa un errore nella misura del flusso dell’ordine dello
0.1%.
9.7.2
Flusso di una riga spettrale
Supponiamo di osservare una nebulosa della Via Lattea attraverso un telescopio dotato di uno spettrografo. Lo spettro I(λ) risultante mostrerà una
serie di righe spettrali in emissione che rappresentano la distribuzione di
energia in funzione della lunghezze d’onda. Ogni riga spettrale corrisponde
a un determinato salto di energia degli elettroni di un atomo o di una specie
atomica.
102
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
Per ottenere il flusso di una riga bisogna integrare il suo profilo nella direzione delle lunghezze d’onda. Il profilo ha una forma che ricorda la funzione
gaussiana e quindi si può usare l’approssimazione:
Z ∞
(λ−λ0 )2
f (λ0 ) =
I0 e− 2σ2 dλ
−∞
dove λ0 è la lunghezza d’onda della riga spettrale considerata, I0 è l’intensità della riga a λ = λ0 e infine σ è un parametro che da’ la larghezza
della riga. Il calcolo di questo integrale non è immediato, mentre il risultato
è molto semplice:
f (λ0 ) =
√
2πI0 σ
Il calcolo del flusso della riga è quindi funzione di due variabili, I0 e σ,
ognuna delle quali sarà misurata con una certa incertezza, ∆I0 e ∆σ.
Applicando la propagazione degli errori si ha:
∂f ∆I0 + ∂f ∆σ
∆f = ∂σ ∂I0 Da cui si ottiene:
∆f =
√
2π∆I0 +
Dividendo ambo i membri per f si ha:
√
2πI0 ∆σ
9.7. ESEMPI IN ASTROFISICA
∆f
=
f
√
103
√
2πσ∆I0 + 2πI0 ∆σ
√
2πI0 σ
E infine:
∆f
∆I0 ∆σ
=
+
f
I0
σ
Un errore del 10% nella misura di I0 e del 5% nella misura di σ si trasforma
in un errore del 15% nel flusso della riga. Si tenga conto che errori relativi
tipici nella misura dei flussi delle righe spettrali variano dal 5% al 20-30%.
9.7.3
Rapporti di intensità fra righe spettrali
In spettroscopia è usuale calcolare rapporti fra intensità delle righe spettrali misurate. Poiché ogni riga è accompagnata da un’incertezza, il rapporto fra due o più righe avrà a sua volta un’incertezza che si può facilmente
calcolare applicando il metodo di propagazione degli errori.
Supponiamo che il rapporto fra due righe spettrali di flusso f1 ± ∆f1 e
f2 ± ∆f2 sia:
104
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
R1 =
f1
f2
Allora, l’incertezza su R1 vale:
∂R1 ∂R2 ∆f1 + ∆R1 = ∂f2 ∆f2
∂f1 Da cui:
E infine:
∆f1 f1
+ − ∆f2 ∆R1 = 2
f2
f2
∆R1 ∆f1 ∆f2 =
+
R1
f1 f2 Anche in questo caso, poiché si stanno trattando grandezze positive, il
modulo non è necessario.
Nel caso in cui:
R2 =
f1 + f2
f3
L’incertezza su R2 vale:
∂R2 ∂R2 ∂R2 ∆f1 + ∆R2 = ∂f2 ∆f2 + ∂f3 ∆f3
∂f1 ∆R2 =
∆f1 ∆f2 f1 + f2
∆f3
+
+
f3
f3
f32
∆f1 + ∆f2 ∆f3
∆R2
=
+
R2
f1 + f2
f3
9.7.4
Legge di Hubble
Proviamo ad applicare la propagazione degli errori ad una delle leggi astronomiche più importanti e famose, la legge di Hubble:
v = H0 d
105
9.7. ESEMPI IN ASTROFISICA
Vogliamo calcolare la distanza d di una galassia e per farlo dobbiamo stimare la sua velocità di recessione v ± ∆v, sapendo che la costante di Hubble
vale H0 = 72 ± 3 km s−1 Mpc−1 . Per farlo puntiamo un telescopio dotato di uno spettrografo nella direzione della galassia in esame e acquisiamo
uno spettro, il quale per effetto dell’espansione dell’universo e quindi dell’allontanamento delle galassie dalla nostra posizione di osservatori, avrà le
righe spettrali spostate a lunghezze d’onda maggiori rispetto al valore che
avrebbero se questo allontanamento non ci fosse (redshift).
Consideriamo una riga spettrale di lunghezza d’onda λ0 , per effetto del
redshift essa si troverà a lunghezza d’onda λ, con λ > λ0 . Dalla misura
della posizione della riga spettrale nello spettro della galassia osservata si
determina il redshift z e la velocità di recessione:
z=
λ − λ0
λ0
v = cz
con c velocità della luce.
Quindi possiamo esprimere la distanza d in questi termini:
106
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
c
λ
d=
−1
H 0 λ0
Il valore della lunghezza d’onda misurata λ della riga spettrale in esame
avrà una certa incertezza ∆λ, quindi l’errore sulla distanza sarà influenzato
sia da ∆λ che da ∆H0 . Applicando la propagazione degli errori si ottiene:
∂d ∂d ∆H0
∆d = ∆λ + ∂λ
∂H0 ∂
∂
c
c(λ − λ0 ) 1 c ∆λ + ∆H0
λ−
∆d = ∂λ H0 λ0
H0 ∂H0
λ0
H0 c c(λ − λ0 ) 1 ∆H0
∆d = ∆λ + −
H 0 λ0 λ0
H02 E passando all’errore relativo:
∆λ
∆H0
∆d
=
+
d
(λ − λ0 )
H0
9.8. PROPAGAZIONE DEGLI ERRORI STATISTICI O QUADRATICI107
Essendo l’errore su H0 relativamente piccolo, è facile capire che la principale sorgente di errore nella determinazione della distanza sta nella misura
accurata delle posizioni delle righe spettrali.
Possiamo arrivare allo stesso risultato ponendo d = X Y , dove X =
Y = ( λλ0 − 1).
Infatti:
∆d ∆X ∆Y +
=
d
X Y c
H0
e
∆c ∆H0
∆H0
∆X
=
+
=
X
c
H0
H0
perché c è una costante priva di errore.
Inoltre:
∆Y =
∆λ
λ0
e
Quindi, concludendo:
9.8
9.8.1
∆λ
∆Y
=
Y
λ − λ0
∆d ∆H0 ∆λ +
=
d
H 0 λ − λ0 Propagazione degli errori statistici o quadratici
Caso 1
Supponiamo di voler calcolare una grandezza fisica y che sia funzione di una
sola grandezza x misurata direttamente. Sia cioè: y = f (x).
Effettuiamo adesso n misure dirette, indipendenti e nelle stesse condizioni della grandezza x, dalle quali poi calcoliamo la media aritmetica x̄ e
lo scarto quadratico medio σ(x). Qual è la miglior stima per f (x) e quale
indeterminazione dobbiamo associare?
108
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
In corrispondenza alle n misure dirette xi si hanno n valori di y =
y1 , y2 , · · · yn = f (x1 ), f (x2 ), · · · f (xn ), con valore medio:
Pn
f (xi )
ȳ = i=1
n
Ricordiamo che una funzione f (x) si può sviluppare in serie di Taylor
nell’intorno di un punto x0 arbitrario:
df 1 d2 f f (x) = f (x0 ) +
(x − x0 ) +
(x − x0 )2 + · · ·
2
dx x=x0
2 dx x=x0
Particolarizziamo lo sviluppo in serie ad un intorno del punto x̄ e trascuriamo i termini di ordine superiore al primo. Otteniamo cosı̀:
df (xi − x̄)
yi = f (xi ) ≃ f (x̄) +
dx x=x̄
Ciò può essere fatto per ogni misura diretta della variabile xi . La media
aritmetica delle quantità yi può essere scritta nella forma:
Pn
df nf (x̄) + dx
i=1 (xi − x̄)
x=x̄
ȳ =
n
Poiché la somma degli scarti rispetto alla media è nulla, cioè
n
X
i=1
Si ottiene:
(xi − x̄) = 0
ȳ = f (x̄)
cioè il valor medio di una funzione coincide con il valore della funzione in
corrispondenza al valore medio dell’argomento. Tale risultato è valido solo
approssimativamente, dato che nello sviluppo in serie di Taylor sono stati
trascurati i termini di grado superiore al primo. I termini dello sviluppo in
serie contengono le potenze (xi − x̄)i , quindi poterli trascurare è giustificato
se gli errori delle misure dirette sono piccoli. Il risultato è valido esattamente
se la funzione y dipende linearmente dalle altre grandezze.
Calcoliamo adesso lo scarto quadratico medio di y:
9.8. PROPAGAZIONE DEGLI ERRORI STATISTICI O QUADRATICI109
n
X
i=1
σ 2 (y) =
=
=
n X
i=1
n−1
=
2
df f (x̄) +
(xi − x̄) − f (x̄)
dx x=x̄
n−1
2 n X
df dx i=1
[f (xi ) − f (x̄)]2
x=x̄
(xi − x̄)2
n−1
=
df
dx
2
=
σ 2 (x)
Quindi lo scarto quadratico medio risulta:
df σ[f (x)] = σ(x)
dx
Risultato formalmente identico a quello trovato per gli errori massimi,
sostituendo σ(x) al posto di ∆x.
Vediamo di seguito alcune applicazioni di uso frequente.
• Moltiplicazione per una costante: y = α x
σ 2 (y) = α2 (x) σ 2 (x) → σ(y) = |α| σ(x)
• Logaritmo naturale: y = ln(x)
σ 2 (y) =
σ 2 (x)
σ(x)
→ σ(y) =
2
x
x
• Elevamento a potenza: y = xα
2
σ(y)
σ(x)
σ 2 (y)
2 σ (x)
=
α
→
= |α|
2
2
y
x
y
x
110
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
9.8.2
Caso 2
Consideriamo adesso un caso più generale, cioè sia y = f (x1 , x2 , · · · xk ), una
funzione di k grandezze misurate direttamente ed affette da errori accidentali, di entità σ1 , σ2 , · · · σk . Siamo in una situazione diversa rispetto agli errori
massimi. In quest’ultimo caso era sufficiente sommare coerentemente tutti i
contributi, presi in modulo. Nel caso degli errori accidentali ad ogni misura essi si combinano in modo imprevedibile, potendo portare anche ad una
parziale o totale compensazione.
Ripetendo n misure dirette per le k variabili si ottiene una distribuzione
di valori di y, data da tutte le possibili combinazioni degli errori accidentali
sulle xj . Tale distribuzione è rappresentata da un istogramma di frequenza,
con valori di y più frequenti di altri corrispondenti alle combinazioni più
frequenti di errori, e con larghezza determinata oltre che dall’entità dei ∆xj
anche dalle modalità di dette combinazioni.
Calcoliamo adesso il valore medio.
Sia y = f (x1 , x2 , · · · xk ) e si effettuino n misure per ciascuna delle k
variabili. Sia inoltre xji la misura i-esima della variabile j-esima.
Analogamente al caso di una sola variabile sviluppiamo in serie di Taylor
arrestandoci al termine di primo grado:
f (x1i , x2i , · · · xki ) = f (x̄1 , x̄2 , · · · x̄k ) +
k X
∂f
j=1
∂xj
xj =x̄j
(xji − x̄j )
Quindi, dalla definizione di valore medio di y si ottiene:
ȳ =
n
X
i=1
f (x1i , x2i , · · · xki )
n
n f (x̄1 , x̄2 , · · · x̄k ) +
=
n X
k X
∂f
i=1 j=1
∂xj
x=x̄
(xji − x̄j )
n
Dalla proprietà della media aritmetica per cui la somma degli scarti è
identicamente nulla,
n
X
i=1
otteniamo:
(xji − x̄j ) = 0; ∀ j = 1, 2, · · · k
9.8. PROPAGAZIONE DEGLI ERRORI STATISTICI O QUADRATICI111
ȳ = f (x̄1 , x̄2 , · · · x̄k )
Calcoliamo ora lo scarto quadratico medio.
Espandiamo la i-esima determinazione yi in serie di Taylor nell’intorno
del valore medio ȳ arrestata ai termini di primo ordine (approssimazione di
linearità):
yi = f (x1i , x2i , · · · xki ) = f (x̄1 , x̄2 , · · · x̄k ) +
k X
∂f
j=1
∂xj
xj =x̄j
(xji − x̄j )
Valutiamo lo scarto i-esimo rispetto alla media:
yi − ȳ =
k X
∂f
j=1
∂xj
xj =x̄j
(xji − x̄j )
Calcoliamo la varianza di y:
σ 2 (y) =
σ 2 (y) =
=
" k n
X
X ∂f 2
i=1
j=1
∂xj
n
X
i=1
(yi − ȳ)2
n−1
" k n
X
X ∂f i=1
j=1
∂xj
(xji − x̄j )
n−1
#2
=
#
k−1 X
k
X
∂f
∂f
(xli − x̄l )(xmi − x̄m )
(xji − x̄j )2 + 2
∂xl
∂xm
l=1 m=l+1
n−1
Si può vedere che σ(y)2 è dato dalla somma di due componenti, la prima
contenente termini quadratici del tipo (xji − x̄j )2 , la seconda contenente
termini misti del tipo (xli − x̄l )(xmi − x̄m ). La prima parte può essere riscritta
come:
2 X
k n
X
∂f
(xji − x̄j )2
j=1
∂xj
i=1
n−1
112
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
Quindi si può scrivere:
2
σ (y) =
2
k X
∂f
j=1
∂xj
σ 2 (xj )
a cui vanno aggiunti termini misti contenenti i prodotti
∂f
∂f
(xli − x̄l )(xmi − x̄m )
∂xl
∂xm
detti termini di covarianza.
Si dimostra che se le variabili sono indipendenti i termini di covarianza
sono piccoli e tendono a zero quando il numero di misure tende all’infinito. In
queste condizioni la legge di propagazione degli errori quadratici o statistici
diventa:
2
σ (y) =
2
k X
∂f
j=1
∂xj
σ 2 (xj )
Quindi in pratica si effettua la somma in quadratura dei prodotti delle
derivate parziali per gli errori statistici delle singole variabili.
Ricordiamo che tale trattazione approssimata vale quando: (1) le misure dirette sono affette da errori sufficientemente piccoli da legittimare la
linearizzazione della grandezza y (sviluppo in serie di Taylor arrestato al
primo ordine); (2) le grandezze misurate direttamente siano variabili indipendenti, cioè se in pratica non vi è influenza reciproca tra le misure delle
diverse grandezze. Il procedimento è esatto nel caso in cui la grandezza y sia
combinazione lineare di varibili indipendenti.
Vediamo di seguito alcune applicazioni di uso frequente.
• Somma o differenza : g = x ± y
σ 2 (g) = σ 2 (x) + σ 2 (y)
• Combinazioni lineari: g = ±a · x ± b · y ± · · ·
σ 2 (g) = a2 · σ 2 (x) + b2 · σ 2 (y) + · · ·
• Moltiplicazione o divisione: g = x · y o g = x/y
passando ai logaritmi ln(g) = ln(x) ± ln(y) e differenziando
9.8. PROPAGAZIONE DEGLI ERRORI STATISTICI O QUADRATICI113
σ 2 (g)
σ 2 (x) σ 2 (y)
=
+
ḡ 2
x̄2
ȳ 2
• Combinazioni del tipo: g = Axα · y β
passando ai logaritmi ln(g) = ln(A) + α · ln(x) + β · ln(y)
2
2
σ 2 (g)
2 σ (x)
2 σ (y)
=
α
·
+
β
·
ḡ 2
x̄2
ȳ 2
Applicando quanto sopra agli errori accidentali risulta che: (1) in caso di
somme o sottrazioni l’errore assoluto finale è la radice quadrata della somma
in quadratura dei singoli errori assoluti; (2) in caso di moltiplicazioni o divisioni l’errore relativo finale è la radice quadrata della somma in quadratura
dei singoli errori relativi.
9.8.3
Combinazione di errori massimi e statistici
Consideriamo il caso misto in cui la misura di una grandezza fisica dipenda
da altre grandezze affette da errori sia massimi che statistici. Si può operare
in modo diverso a seconda dello scopo della nostra misura.
Se vogliamo sapere con “certezza” in quale intervallo cada il valor vero della grandezza in esame dobbiamo usare la trattazione degli errori
massimi.
Consideriamo il caso di un singolo errore massimo e di un singolo errore
statistico, situazione cui sempre ci si può ricondurre combinando prima tutti
gli errori massimi e poi tutti quelli statistici. Si trasforma l’errore statistico
in massimo
∆m ≈ 3σm
dove σm è lo scarto quadratico medio della serie di determinazioni per m.
Infatti, nel caso ideale della distribuzione gaussiana degli errori accidentali
la probabilità di osservare uno scarto dalla media maggiore in modulo di 3σ
è inferiore allo 0.3% (molto piccola).
Se vogliamo ottenere una stima realistica ma probabilistica dell’errore
dobbiamo usare la trattazione degli errori quadratici.
Se una grandezza m è misurata con errore massimo ∆m, possiamo procedere in due modi:
• Assumere una distribuzione uniforme, ovvero costante (misure equiprobabili) entro l’intervallo [m − ∆m, m + ∆m] e nulla al di fuori. Si
114
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI
dimostra che tale distribuzione ha varianza σ 2 (m) =
l’ errore quadratico medio è
(2∆m)2
e quindi
12
∆m
σ(m) = √ ≃ 0.577 ∆m
3
• Assumere una distribuzione gaussiana, con picco centrato nel valor medio dell’intervallo ed errore quadratico medio tale che 6 σ(m)
copra l’intera larghezza dell’intervallo. Sotto queste ipotesi l’ errore
quadratico medio è
σ(m) =
9.8.4
∆m
≃ 0.333 ∆m
3
Lo scarto quadratico medio della media
L’indeterminazione statistica della media, o meglio la larghezza della distribuzione relativa alle medie di una serie di misure effettuate in condizioni
identiche, si può ottenere applicando la propagazione degli errori statistici.
Se n è il numero totale di misure e mi la misura i-esima:
m̄ =
n
X
mi
i=1
n
v
u n 2
uX ∂ m̄
t
σm̄ =
σ(mi )
∂m
i
i=1
Poiché le mi sono misure della stessa grandezza si può associare ad esse
∂ m̄
1
σ(mi ) = σ; inoltre si ha
= .
∂mi
n
Quindi lo scarto quadratico medio della media è:
σm̄ =
v
u
u
σm̄ = t
r
n σ2
σ
=√
2
n
n
n
X
1
(mi − m̄)2
n(n − 1) i=1
9.8. PROPAGAZIONE DEGLI ERRORI STATISTICI O QUADRATICI115
1
La dipendenza da √ rende sempre più difficile diminuire σm̄ aumenn
tando il numero di misure. Anche se si potesse realizzare un numero elevatissimo di misure, diventerebbe impossibile mantenere costanti le condizioni
sperimentali. L’usura degli strumenti potrebbe introdurre errori sistematici.
116
CAPITOLO 9. PROPAGAZIONE DEGLI ERRORI