Corso di biomatematica lezione 5: propagazione degli errori Davide Grandi Sommario •Dalla somma in quadratura: •Somme e differenze •Prodotti e quozienti •Funzioni arbitrarie di una variabile •La potenza •Formula generale •Livelli di confidenza •Rigetto dei dati •Metodo dei minimi quadrati Propagazione degli errori • Nota Usiamo nei lucidi seguenti y Per indicare l’errore o l’accuratezza relativo alla stima di y dove intendiamo non la deviazione standard, legata alla bontà di una misura, ma l’errore standard, ovvero l’errore della media, legato alla deviazione standard dalla relazione x N Davide Grandi - Dottorato in Biologia Propagazione degli errori • Relazione lineare Partiamo dalla relazione lineare y kx y kx con L’errore o l’accuratezza relativo alla stima di y dovuto alla misura di x y k x Davide Grandi - Dottorato in Biologia Propagazione degli errori • Somme (e differenze) Se invece abbiamo y x z y x z con Abbiamo già visto che l’errore o l’accuratezza relativo alla stima di y dovuto alla misura di x e di z sarà y x z 2 2 Che solo in alcuni casi può approssimarsi a y x z Davide Grandi - Dottorato in Biologia (stima per eccesso) Propagazione degli errori • Prodotti e quozienti Se invece abbiamo a b y cd L’errore o l’accuratezza relativo alla stima di y dovuto alla misura di a,b,c,d sarà (errore relativo) y 2 y 2 2 2 a b c d a b c d Davide Grandi - Dottorato in Biologia Propagazione degli errori • Giustif. errore relativo Dato il caso semplice a y b Abbiamo che l’errore relativo per a (o per b) sarà a a a Per cui esprimerò a (o b) come a a 1 a Davide Grandi - Dottorato in Biologia Propagazione degli errori • Giustif. errore relativo Da questo avremo che 1 a a a a y b b 1 b b Il valore più probabile più grande sarà con numeratore grande (segno +) e denominatore piccolo (meno) Davide Grandi - Dottorato in Biologia Propagazione degli errori • Giustif. errore relativo Ovvero a 1 a a a y b b 1 b b E siccome vale avremo 1 1b y a b 1b a b 1 a b Davide Grandi - Dottorato in Biologia Propagazione degli errori • Giustif. errore relativo La somma in quadratura introdotta la lezione precedente giustifica il passaggio da y a b a b 1 a b a y a b 1 a a 2 2 b b Davide Grandi - Dottorato in Biologia Propagazione degli errori • Funzioni arbitrarie Data una funzione di diverse variabili y y( x,...., z) Avremo che l’errore (o l’accuratezza) dato dalla misura delle variabili x,…z sarà: y y x y ......... x z 2 z 2 E non è mai più grande della somma ordinaria dei termini Davide Grandi - Dottorato in Biologia Propagazione degli errori • Potenza Nel caso in cui y x n avremo y y nx x Davide Grandi - Dottorato in Biologia Propagazione degli errori • Livello di confidenza Se abbiamo trovato con una misura un valore medio (migliore stima) y valore y Rappresentato con la deviazione standard della media, possiamo dire che la probabilità che il calcolo del valore medio cada nell’intervallo y , y y y È il 68% (circa) Davide Grandi - Dottorato in Biologia Propagazione degli errori • Livello di confidenza Partiamo dunque dall’ipotesi di avere una distribuzione centrata sul valore vero yv, la cui larghezza viene stimata dal parametro . In questo modo avremo che la discrepanza tra il valor medio ed il valor vero (espressa in unità di ) sarà t y y v In questo modo posso calcolare la probabilità che una misura (una media) cada al di fuori di t Davide Grandi - Dottorato in Biologia Propagazione degli errori • Livello di confidenza Come P(fuori da t) = 1 – P(entro t) Nel caso la probabilità della mia misura sia grande essa risulterà accettabile, altrimenti inaccettabile (o significativa) Ad esempio P(fuori da 2) = 4.6% P(fuori da 1.96) = 5% P(fuori da 2.32) = 2% Davide Grandi - Dottorato in Biologia Propagazione degli errori • Rigetto dei dati Dati ad esempio 6 valori di cui uno “sospetto”, in quanto calcolato il valor medio e la deviazione standard noto che dista dal valor medio 2 . A questo punto abbiamo visto che P(fuori da 2) = 4.6% 5% (0.05) Questo implica che 1 misura ogni 20 circa dovrebbe essere 2 oltre il valor medio, quindi: Sse ho fatto 20 misure non ha senso rigettarla (rientra nella coda statistica), invece nel nostro caso la probabilità sarà: 6 x 0.05= 0.3 Ovvero solo 1/3 di misura dovrebbe essere oltre 2 Davide Grandi - Dottorato in Biologia Propagazione degli errori • Rigetto dei dati Questo implica che se riteniamo 1/3 di misura altamente improbabile, possiamo rigettare il dato “erroneo”. Il criterio di Chauvenet pone il limite di improbabilità a ½ ovvero date N misure ed una di queste oltre ad esempio 2 calcoliamo NP(fuori da 2) e se è minore di ½ “posso” rigettare il rispettivo dato.. Davide Grandi - Dottorato in Biologia Propagazione degli errori • Metodo dei minimi quadrati Supponiamo di avere ottenuto una serie N di misure di una variabile yi, ognuna in corrispondenza di un determinato valore xi, ovvero di possedere una serie di coppie (x1,y1), (x2,y2), ……. (xN,yN), E di voler stabilire se esiste una relazione ad esempio lineare tra le due classi di parametri, ovvero se posso scrivere y=a+bx Può ad esempio essere il caso di determinare le costanti a e b con sufficiente precisione in quanto rappresentano l’obiettivo finale della mia misura Davide Grandi - Dottorato in Biologia Propagazione degli errori • Metodo dei minimi quadrati Agendo come nel caso del calcolo del valor medio, se i miei dati si possono disporre su una retta dovrò minimizzare la distanza di ciascuna coppia di valori dalla retta di equazione y=a+bx, ottenendo: 2 xi y i xi xi y i a N xi yi xi yi b Davide Grandi - Dottorato in Biologia Propagazione degli errori • Metodo dei minimi quadrati Dove abbiamo semplificato N xi xi 2 2 Si può affermare che la misura di tutti gli yi sia normalmente distribuita attorno al suo valore y=a+bx con larghezza 2 y 1 N N 2 i 1 yi a bxi Davide Grandi - Dottorato in Biologia 2 Propagazione degli errori • Metodo dei minimi quadrati Possiamo anche calcolare gli scarti per i coefficienti a e b, che saranno: b a N xi y 2 y Davide Grandi - Dottorato in Biologia Regressione lineare • Metodo dei minimi quadrati Il metodo dei minimi quadrati che permette di stimare a e b dall’equazione y=a+bx (x e y valori medi) in pratica cerca di minimizzare l’errore residuo ei nella relazione yi = a+bxi + ei Davide Grandi - Dottorato in Biologia