Corso di biomatematica lezione 5: propagazione degli errori Davide Grandi Sommario •Dalla somma in quadratura: •Somme e differenze •Prodotti e quozienti •Funzioni arbitrarie di una variabile •La potenza •Formula generale •Livelli di confidenza •Rigetto dei dati •Metodo dei minimi quadrati Propagazione degli errori • Nota Usiamo nei lucidi seguenti  y Per indicare l’errore o l’accuratezza relativo alla stima di y dove intendiamo non la deviazione standard, legata alla bontà di una misura, ma l’errore standard, ovvero l’errore della media, legato alla deviazione standard dalla relazione  x   N Davide Grandi - Dottorato in Biologia Propagazione degli errori • Relazione lineare Partiamo dalla relazione lineare y kx y  kx con L’errore o l’accuratezza relativo alla stima di y dovuto alla misura di x  y  k  x Davide Grandi - Dottorato in Biologia Propagazione degli errori • Somme (e differenze) Se invece abbiamo y  x z y  x z con Abbiamo già visto che l’errore o l’accuratezza relativo alla stima di y dovuto alla misura di x e di z sarà  y   x   z  2 2 Che solo in alcuni casi può approssimarsi a     y x z Davide Grandi - Dottorato in Biologia (stima per eccesso) Propagazione degli errori • Prodotti e quozienti Se invece abbiamo a  b y cd L’errore o l’accuratezza relativo alla stima di y dovuto alla misura di a,b,c,d sarà (errore relativo)  y 2 y  2 2 2  a   b   c   d           a   b   c   d  Davide Grandi - Dottorato in Biologia Propagazione degli errori • Giustif. errore relativo Dato il caso semplice a y b Abbiamo che l’errore relativo per a (o per b) sarà  a  a a Per cui esprimerò a (o b) come a    a  1     a   Davide Grandi - Dottorato in Biologia Propagazione degli errori • Giustif. errore relativo Da questo avremo che 1 a a a a y   b b 1 b b Il valore più probabile più grande sarà con numeratore grande (segno +) e denominatore piccolo (meno) Davide Grandi - Dottorato in Biologia Propagazione degli errori • Giustif. errore relativo Ovvero a 1 a a a y   b b 1 b b E siccome vale avremo 1 1b y a b  1b    a  b   1     a b          Davide Grandi - Dottorato in Biologia Propagazione degli errori • Giustif. errore relativo La somma in quadratura introdotta la lezione precedente giustifica il passaggio da y a b    a  b   1     a b    a y a b     1        a   a         2  2   b        b      Davide Grandi - Dottorato in Biologia Propagazione degli errori • Funzioni arbitrarie Data una funzione di diverse variabili y y( x,...., z) Avremo che l’errore (o l’accuratezza) dato dalla misura delle variabili x,…z sarà:  y    y  x    y    .........   x     z 2    z   2 E non è mai più grande della somma ordinaria dei termini Davide Grandi - Dottorato in Biologia Propagazione degli errori • Potenza Nel caso in cui y x n avremo  y y  nx x Davide Grandi - Dottorato in Biologia Propagazione degli errori • Livello di confidenza Se abbiamo trovato con una misura un valore medio (migliore stima) y  valore  y Rappresentato con la deviazione standard della media, possiamo dire che la probabilità che il calcolo del valore medio cada nell’intervallo y   , y  y y È il 68% (circa) Davide Grandi - Dottorato in Biologia Propagazione degli errori • Livello di confidenza Partiamo dunque dall’ipotesi di avere una distribuzione centrata sul valore vero yv, la cui larghezza viene stimata dal parametro . In questo modo avremo che la discrepanza tra il valor medio ed il valor vero (espressa in unità di ) sarà t  y y  v In questo modo posso calcolare la probabilità che una misura (una media) cada al di fuori di t Davide Grandi - Dottorato in Biologia Propagazione degli errori • Livello di confidenza Come P(fuori da t) = 1 – P(entro t) Nel caso la probabilità della mia misura sia grande essa risulterà accettabile, altrimenti inaccettabile (o significativa) Ad esempio P(fuori da 2) = 4.6% P(fuori da 1.96) = 5% P(fuori da 2.32) = 2% Davide Grandi - Dottorato in Biologia Propagazione degli errori • Rigetto dei dati Dati ad esempio 6 valori di cui uno “sospetto”, in quanto calcolato il valor medio e la deviazione standard noto che dista dal valor medio 2 . A questo punto abbiamo visto che P(fuori da 2) = 4.6%  5% (0.05) Questo implica che 1 misura ogni 20 circa dovrebbe essere 2 oltre il valor medio, quindi: Sse ho fatto 20 misure non ha senso rigettarla (rientra nella coda statistica), invece nel nostro caso la probabilità sarà: 6 x 0.05= 0.3 Ovvero solo 1/3 di misura dovrebbe essere oltre 2 Davide Grandi - Dottorato in Biologia Propagazione degli errori • Rigetto dei dati Questo implica che se riteniamo 1/3 di misura altamente improbabile, possiamo rigettare il dato “erroneo”. Il criterio di Chauvenet pone il limite di improbabilità a ½ ovvero date N misure ed una di queste oltre ad esempio 2 calcoliamo NP(fuori da 2) e se è minore di ½ “posso” rigettare il rispettivo dato.. Davide Grandi - Dottorato in Biologia Propagazione degli errori • Metodo dei minimi quadrati Supponiamo di avere ottenuto una serie N di misure di una variabile yi, ognuna in corrispondenza di un determinato valore xi, ovvero di possedere una serie di coppie (x1,y1), (x2,y2), ……. (xN,yN), E di voler stabilire se esiste una relazione ad esempio lineare tra le due classi di parametri, ovvero se posso scrivere y=a+bx Può ad esempio essere il caso di determinare le costanti a e b con sufficiente precisione in quanto rappresentano l’obiettivo finale della mia misura Davide Grandi - Dottorato in Biologia Propagazione degli errori • Metodo dei minimi quadrati Agendo come nel caso del calcolo del valor medio, se i miei dati si possono disporre su una retta dovrò minimizzare la distanza di ciascuna coppia di valori dalla retta di equazione y=a+bx, ottenendo: 2   xi  y i  xi  xi y i  a  N  xi yi  xi   yi b      Davide Grandi - Dottorato in Biologia Propagazione degli errori • Metodo dei minimi quadrati Dove abbiamo semplificato     N  xi  xi  2 2 Si può affermare che la misura di tutti gli yi sia normalmente distribuita attorno al suo valore y=a+bx con larghezza  2 y 1 N   N  2 i 1  yi a bxi  Davide Grandi - Dottorato in Biologia 2 Propagazione degli errori • Metodo dei minimi quadrati Possiamo anche calcolare gli scarti per i coefficienti a e b, che saranno: b  a  N     xi   y 2  y Davide Grandi - Dottorato in Biologia Regressione lineare • Metodo dei minimi quadrati Il metodo dei minimi quadrati che permette di stimare a e b dall’equazione y=a+bx (x e y valori medi) in pratica cerca di minimizzare l’errore residuo ei nella relazione yi = a+bxi + ei Davide Grandi - Dottorato in Biologia