Corso di biomatematica lezione 5:
propagazione degli errori
Davide Grandi
Sommario
•Dalla somma in quadratura:
•Somme e differenze
•Prodotti e quozienti
•Funzioni arbitrarie di una variabile
•La potenza
•Formula generale
•Livelli di confidenza
•Rigetto dei dati
•Metodo dei minimi quadrati
Propagazione degli errori
• Nota
Usiamo nei lucidi seguenti

y
Per indicare l’errore o l’accuratezza relativo alla stima di y
dove intendiamo non la deviazione standard, legata alla
bontà di una misura, ma l’errore standard, ovvero l’errore
della media, legato alla deviazione standard dalla relazione

x


N
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Relazione lineare
Partiamo dalla relazione lineare
y kx
y  kx
con
L’errore o l’accuratezza relativo alla stima di y dovuto alla
misura di x

y

k 
x
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Somme (e differenze)
Se invece abbiamo
y  x z
y  x z
con
Abbiamo già visto che l’errore o l’accuratezza relativo alla
stima di y dovuto alla misura di x e di z sarà

y

 x   z 
2
2
Che solo in alcuni casi può approssimarsi a
   
y
x
z
Davide Grandi - Dottorato in Biologia
(stima per eccesso)
Propagazione degli errori
• Prodotti e quozienti
Se invece abbiamo
a

b
y
cd
L’errore o l’accuratezza relativo alla stima di y dovuto alla
misura di a,b,c,d sarà (errore relativo)

y
2
y

2
2
2
 a   b   c   d 
       
 a   b   c   d 
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Giustif. errore relativo
Dato il caso semplice
a
y
b
Abbiamo che l’errore relativo per a (o per b) sarà

a

a
a
Per cui esprimerò a (o b) come
a


 a
 1 



a


Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Giustif. errore relativo
Da questo avremo che
1 a
a
a
a
y  
b b 1 b
b
Il valore più probabile più grande sarà con numeratore
grande (segno +) e denominatore piccolo (meno)
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Giustif. errore relativo
Ovvero
a
1
a
a
a
y  
b b 1 b
b
E siccome vale
avremo
1
1b
y a
b

1b


 a  b 
 1 
 

a b









Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Giustif. errore relativo
La somma in quadratura introdotta la lezione precedente
giustifica il passaggio da
y a
b


 a  b 
 1 
 

a b



a
y a
b



 1



 
  a 
 a 







2

2 
 b  
   

b

  

Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Funzioni arbitrarie
Data una funzione di diverse variabili
y y( x,...., z)
Avremo che l’errore (o l’accuratezza) dato dalla misura delle
variabili x,…z sarà:
 y


 y  x


 y



.........

 x 


 z
2


 z 

2
E non è mai più grande della somma ordinaria dei termini
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Potenza
Nel caso in cui
y x
n
avremo

y
y
 nx
x
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Livello di confidenza
Se abbiamo trovato con una misura un valore medio
(migliore stima)
y 
valore 
y
Rappresentato con la deviazione standard della media,
possiamo dire che la probabilità che il calcolo del valore
medio cada nell’intervallo
y   , y 
y
y
È il 68% (circa)
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Livello di confidenza
Partiamo dunque dall’ipotesi di avere una distribuzione
centrata sul valore vero yv, la cui larghezza viene stimata dal
parametro .
In questo modo avremo che la discrepanza tra il valor medio
ed il valor vero (espressa in unità di ) sarà
t

y y

v
In questo modo posso calcolare la probabilità che una misura
(una media) cada al di fuori di t
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Livello di confidenza
Come
P(fuori da t) = 1 – P(entro t)
Nel caso la probabilità della mia misura sia grande essa
risulterà accettabile, altrimenti inaccettabile (o significativa)
Ad esempio
P(fuori da 2) = 4.6%
P(fuori da 1.96) = 5%
P(fuori da 2.32) = 2%
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Rigetto dei dati
Dati ad esempio 6 valori di cui uno “sospetto”, in quanto
calcolato il valor medio e la deviazione standard noto che
dista dal valor medio 2 . A questo punto abbiamo visto che
P(fuori da 2) = 4.6%  5% (0.05)
Questo implica che 1 misura ogni 20 circa dovrebbe essere
2 oltre il valor medio, quindi:
Sse ho fatto 20 misure non ha senso rigettarla (rientra nella
coda statistica), invece nel nostro caso la probabilità sarà:
6 x 0.05= 0.3
Ovvero solo 1/3 di misura dovrebbe essere oltre 2
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Rigetto dei dati
Questo implica che se riteniamo 1/3 di misura altamente
improbabile, possiamo rigettare il dato “erroneo”.
Il criterio di Chauvenet pone il limite di improbabilità a ½
ovvero date N misure ed una di queste oltre ad esempio 2
calcoliamo
NP(fuori da 2) e se è minore di ½ “posso” rigettare il
rispettivo dato..
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Metodo dei minimi quadrati
Supponiamo di avere ottenuto una serie N di misure di una
variabile yi, ognuna in corrispondenza di un determinato
valore xi, ovvero di possedere una serie di coppie
(x1,y1), (x2,y2), ……. (xN,yN),
E di voler stabilire se esiste una relazione ad esempio lineare
tra le due classi di parametri, ovvero se posso scrivere
y=a+bx
Può ad esempio essere il caso di determinare le costanti a e b
con sufficiente precisione in quanto rappresentano l’obiettivo
finale della mia misura
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Metodo dei minimi quadrati
Agendo come nel caso del calcolo del valor medio, se i miei
dati si possono disporre su una retta dovrò minimizzare la
distanza di ciascuna coppia di valori dalla retta di equazione
y=a+bx, ottenendo:
2

 xi  y i  xi  xi y i 
a

N  xi yi  xi   yi
b



 
Davide Grandi - Dottorato in Biologia
Propagazione degli errori
• Metodo dei minimi quadrati
Dove abbiamo semplificato
 
  N  xi  xi 
2
2
Si può affermare che la misura di tutti gli yi sia normalmente
distribuita attorno al suo valore y=a+bx con larghezza

2
y
1 N


N  2 i 1
 yi a bxi 
Davide Grandi - Dottorato in Biologia
2
Propagazione degli errori
• Metodo dei minimi quadrati
Possiamo anche calcolare gli scarti per i coefficienti a e b,
che saranno:
b

a

N 



xi 

y
2
 y
Davide Grandi - Dottorato in Biologia
Regressione lineare
• Metodo dei minimi quadrati
Il metodo dei minimi quadrati che permette di stimare
a e b dall’equazione y=a+bx (x e y valori medi) in pratica
cerca di minimizzare l’errore residuo ei nella relazione
yi = a+bxi + ei
Davide Grandi - Dottorato in Biologia