1 Sintesi conclusiva su errori e loro propagazione Una volta termina la trattazione degli errori casuali è opportuno, prima di affrontare la spiegazione delle esperienze, fare una sintesi riassuntiva, che ripercorra alcune informazioni fornite a lezione e nelle varie note, e fissi dei criteri pratici per affrontare l’analisi dei dati sperimentali. Misura diretta di una grandezza fisica. La misura diretta di una grandezza fisica X è assegnare un numero x, che fornisca un rapporto rispetto alla grandezza omogenea fondamentale (campione di misura con relativa unità) ed un errore δx, che indichi l’errore su tale rapporto. L’operazione di misura Si è parlato di • grado di precisione δx/⏐x⏐, anche detto errore relativo. Se presentato come δx/⏐x⏐*100, errore percentuale. Le incertezze su una misura si possono catalogare come segue : • Incertezze (errori) sistematiche, per le quali si possono distingure due sottocategorie: o Incertezze sistematiche di accuratezza (ηx), la cui probabilità di verificarsi con un dato segno è maggiore di quella di verificarsi con il segno opposto. L’origine di tali incertezze è varia: uso non corretto di leggi o metodi, strumenti non tarati bene, operatore, condizioni ambientali, utilizzo improprio degli strumenti, ecc. ... o Incertezze (errori) sistematiche a priori o strumentali (εx), dette anche di sensibilità di misura, sono dovute alla risoluzione del dispositivo di misura utilizzato. • Incertezze (errori) casuali (σx), ogni valore dell’incertezza ha pari probabilità si manifestarsi in eccesso (segno positvo) o in difetto (segno negatico) sulla misura. Tali incertezze sono dovute alle non prevedibili interazioni del sistema con l’ambiente, anche all’operatore ecc. . Non sono facili da eliminare ma possono essere trattati statisticamente. Gli errori casuali si individuano facilmente, in quanto in misure ripetute di una stessa grandezza si osservano valori misurati diversi per ogni misura. Gli errori di accuratezza ηx sono di difficile individuazione, e possono essere corretti per confronto con uno strumento calibrato (tarato) o mediante una procedura opportuna di calibrazione (taratura). Si è espresso in modo formale quanto indicato con il disegno del tiro a segno nel capitolo 4 a pagina 97 del Taylor per l’accuratezza e la precisione: • Accuratezza = • Precisione = | | Si faccia attenzione alla differenza tra grado di precisione, riferito al valore della misura, utile per il confronto tra misure diverse, rispetto alla precisione che invece riguarda il metodo di misura e la strumentazione usata. L’errore assoluto totale sarà dato dal contributo di tutti tipi di errore, che essendo indipendenti tra loro si sommano in quadratura: 2 Si osservi che gli errori hanno un significato diverso ovvero: • errori sistematici ηx: assumiamo che il nostro risultato sia spostato (verso valori maggiori o minori) di ηx, e ci aspettiamo che tutte le nostre misure (100%) siano spostate in modo omogeneo. • errori a priori, strumentale, di sensibilità εx: è un errore massimo a priori, ovvero tutti i nostri risultati (100% dei dati ) sono compresi nel intervallo [x- εx; x + εx] • errori casuali σx : si fornisce l’intervallo entro il quale abbiamo la fiducia che si trovino il 68% dei nostri dati nell’intervallo [x- σx; x + σx]. Inoltre possiamo fornire anche la fiducia (68%) entro cui si troverebbe qualsiasi valore medio misurato nell’intervallo compreso tra più e meno la deviazione standard della media . Si deve cercare in tutti i modi di eliminare errori sistematici del tipo ηx, mediante il controllo della taratura degli strumenti, o una calibrazione della strumentazione. Fatto ciò si affronta il problema dei solo errori casuali e di sensibilità di lettura. Assumiamo di non avere errori sistematici del tipo ηx e quindi di avere solo errori casuali e di sensibilità di lettura anche nel caso di massima accuratezza comunque non si hanno misure prive di errore, per giunta anche se σx fosse pari a 0, saremmo limitati comunque dalla sensibilità di misura εx ≠ 0. Se ripetiamo una misura ed otteniamo sempre lo stesso risultato siamo nel caso in cui • εx>> σx: la nostra sensibilità è bassa e quindi non osserviamo le fluttuazioni statistiche. Nel caso in cui invece osserviamo per ogni misura ripetuta dei valori diversi, siamo nelle condizioni • εx<< σx: in questo caso possiamo utilizzare la statistica per la stima degli errori della misurazione. Si dovrebbero utilizzare strumenti sufficientemente sensibili per osservare le fluttuazioni statiche. Si deve precisare una cosa spesso per alcuni strumenti la casa costruttrice fornisce l’accuratezza anche come + un determinato valore, e quindi si può sommare in quadratura. Ci sono anche strumenti in cui l’accuratezza varia con le condizioni ambientali, e/o strumenti la cui accuratezza dipende anche dal valore misurato. Si può calibrare lo strumento con un altro o utilizzare una tecnica opportuna di calibrazione che permette di individuare precisamente l’errore ed il suo segno. In questo caso per non perdere l’informazione risulta più opportuno fornire la misura con l’errore separato da quello ci calibrazione Per evidenziare meglio che l’errore è stato stimato con la calibrazione o taratura, si è aggiunto al pedice “cal”. Nella misura diretta la distinzione tra gli errori è semplice e diretta, e si individua facilmente quali sono dominanti, percui si possono trascurare gli altri. Ma come ci si deve comportare quando è necessario combinare, nella propagazione degli errori, pero ottenere la misura indiretta di una grandezza g funzione di altre grandezze x, y, z ecc., misurate direttamente. Per affrontare questo argomento è necessario fare appello ad un teorema fondamentale: 3 Teorema del limite centrale: una combinazione lineare di g=a1·x+ a2·y + a3·z + …, di variabili aleatorie indipendenti x, y, z, …, ciascuna avente legge di distribuzione qualsiasi, ma con valori aspettati comparabili e varianze finite dello stesso ordine di grandezza, all’aumentare del numero di variabili aleatorie tende alla distribuzione normale con valore aspettato G e varianza σ date da: G= a1·X+ a2·Y + a3·Z + …. e σ2G= a21· σ2x+ a2·σ2y + a3·σ2z + …distribuzione dove X, Y, Z, … sono i valori di aspettazione delle variabili x, y, z … e σ2x, σ2y, σ2z, … sono le varianza rispettive. Per accettare questo teorema lo si utilizza per ricavare la varianza della media campionaria, già ottenuta in altro modo. Si supponga di avere M studenti che eseguano della stessa grandezza x con gli stessi strumenti un campione elevato di N misure. Indichiamo con xji la i-esima misura del j-esimo studente e con la media ottenuta dallo studente j-esimo. Questo teorema afferma, che anche se i campioni di misure dei vari studenti seguissero distribuzioni qualsiasi, le medie delle M serie di misure sarebbero distribuite normalmente intorno alla media delle medie ; quest’ultima quantità dato l’elevato numero di misure N·M presumiamo sia una misura più precisa del valore atteso X e sicuramente gaussiana. Per mostrare questo supponiamo che sia sempre lo stesso studente j-esimo che ripete le sue osservazioni, percui il pedice j individua ora la serie di N misure tratti dalla stessa popolazione, in genere la prima misura xj1, la seconda xj2, ecc., nei diversi campioni j non avranno lo stesso valore. Quindi la media dalla j-esima serie 1 1 1 1 … 1 può essere considerata una combinazione lineare di variabili aleatorie con coefficienti tutti uguali a1= a2 = a3= …= 1/N. Dato che le medie riguardano la stessa grandezza, ci aspettiamo che tendano allo stesso valore atteso X e che abbiamo anche la stessa deviazione standard σ. Il teorema del limite centrale afferma che il valore atteso è dato da 1 1 1 1 … quindi il teorema conferma quanto già derivato in altro modo. Per la varianza il teorema afferma che: 1 1 1 1 … anche per la varianza dal teorema si ottiene quanto già ricavato a suo tempo: √ ovvero la deviazione standard della media. Per il corso di laboratorio del primo anno riteniamo sufficiente aver ottenuto mediante l’utilizzo del teorema quanto ricavato in altro modo per accettare tale teorema. Ricordiamo che, dato che non sono noti i valori veri X e σ, possiamo solo fornire delle stime con la media e la deviazione standard del campione. Si noti che è illusorio pensare di ridurre aumentando in modo indefinito N, non sarà possibile mantenere inalterate le condizione sperimentali ed è inevitabile introdurre errori sistematici, si pensi al logorio per usura della strumentazione. Su questo ritorneremo più avanti nel corso di questo documento. Ripercorriamo le formule di propagazione degli errori con il supporto di questo teorema. La misura indiretta di una grandezza g, funzione di altre grandezze misurate direttamente x, y, z ... . Si è osservato che, se x, y, z ... sono grandezze affette solo da errori statistici e sono indipendenti, per la propagazione degli errori si ha: 4 2 2 2 …. (equ.1) Quindi la stima della deviazione standard definisce un intervallo di confidenza gaussiano solo se tutte le variabili sono gaussiane. Quindi g risulterà anch’essa gaussiana. Nel caso di errori totali, per variabili che non siano gaussiane, finora si è segnalato che se le grandezze misurate direttamente sono tra loro indipendenti si può utilizzare la relazione: 2 2 2 … . equ. 2 Le equazioni 1 e 2 sono simili, tranne che nella 1 sono errori statistici nella 2 sono invece errori totali. Ovviamente per errori strumentali e/o combinazione con tra errori diversi. Nel caso in cui non si sia sicuri del fatto che le grandezze siano scorrelate, si utilizza la propagazione degli errori in somma lineare sia per errori statistici σ sia per errori totali δ:, riportiamo di seguito la formula per gli errori totali, sostituendo alle δ le rispettivi σ si ha la formula per variabili casuali ma correlate tra loro: . equ. 3 Si è osservato che questo risulta un limite superiore per l’errore. È opportuno utilizzare tali formule, quando le grandezze sono correlate in modo complicato. Il valore assoluto delle derivate garantisce che l’effetto della propagazione venga sempre preso nel modo più sfavorevole, ovvero corrispondente ad un incremento positivo dell’errore di misura in ogni caso. Si considerino ora le incertezze strumentali (risoluzione) alle quali si attribuisce la densità uniforme (vedi es. 5.9). Nel caso che le grandezze non sono correlate si è riportato la somma in quadratura. Ma in questo caso bisogna fare una considerazione, si è visto che nel caso di una densità di probabilità uniforme, possiamo comunque definire una varianza che risulta per il caso di immediata comprensione relativo all’errore di sensibilità di lettura: √3 Su alcuni testi si riporta la risoluzione Δ, che risulta quindi 2· ε. percui spesso si trova: ∆ √12 Ovviamente se si hanno più variabili indipendenti affette da errori per le quali si assume una densità uniforme si può fornire la varianza data da 2 2 ∆ 2 ∆ ∆ … · 1 12 Queste varianze non vanno associate alla densità gaussiana. Mentre una combinazione lineare di errori gaussiani mantiene intervalli di confidenza gaussiani, in questo caso la somma di due o più variabili uniformi, dà luogo a densità differenti che dipendono dal numero di errori sommati. È solo grazie al teorema del limite centrale (…ciascuna avente legge di distribuzione qualsiasi…) che si può affermare che all’aumentare di N questa densità tende rapidamente ad una gaussiana. Il problema è stabilire a partire da quale numero di misure combinate linearmente sia lecito assumere che la combinazione di esse sia gaussiana. Il risultato sarà sorprendente. Se si assumuno due misure affette da errori sistematici uguali compresi in un intervallo [–a, a], si ottiene una densità di probabilità triangolare, questo non sarà dimostrata o ricavato in questo corso. 5 Ma assunto che si ottenga già da due variabili a densità uniforme una densità di probabilità triangolare, e ricavando la σ è possibile calcolare le probabilità di ottenere dei valori in determinati intervalli (es. 5.5). Questa probabilità per un valore x compreso nell’intervallo +σ si ha 0.649, tra + 2σ si ha 0.966 e tra + 3σ si ha 1. Se si confrontano questi probabilità con quelle relative agli stessi intervalli per una densità di probabilità gaussiana si ottengono dei valori molto vicini. Da questo ne consegue che gli sperimentatori considerano intervalli di confidenza gaussiani già a partire da errori ottenuti dalla combinazione di due soli errori sistematici a densità uniforme. Veniamo ora alla combinazione di errori sistematici (di tipo uniforme) ed errori gaussiani, sicuramente se già due variabili a densità uniforme tendono ad una gaussiana, si aspetta una tendenza più forte tra una gaussiana e una uniforme. Infatti si osserva che utilizzando la somma in quadratura delle due varianze ∆ 12 i livelli di probabilità sono molto vicini a quelli di una gaussiana sia per σ = Δ che per σ > Δ, solo nel caso di σ << Δ ( a circa 100 volte inferiore) tendono ad una densità di probabilità uniforme. Ripercorriamo ora come si propone di presentare i risultati sulla base delle considerazioni scaturite dal teorema del limite centrale. Misure affette solo da errore sistematico La misura non presenta fluttuazioni e quindi si ottiene sempre lo stesso risultato, si fornirà quindi il valore: x+εx con un livello di confidenza del 100%. In questo caso l’errore è l’errore massimo. Per il teorema e le considerazioni sulla densità di probabilità triangolare, possiamo affermare già per due variabili di questo tipo che la ∆ ∆ 12 12 Una varianza che ci permette di affermare che ci aspettiamo un livello di confidenza del 68%. Misure affette solo da errore statistico Misura di una grandezza fisica con un apparato di sensibilità elevata percui si osservano fluttuazioni statistiche. Si fanno una serie di misure N da cui si ottiene la media e la deviazione standard, siccome si assume che la misura tenda al valore vero X si presenterà il risultato come: √ con un livello di confidenza del 68 % (se N>10). Attenzione che per N → ∞ una misura di questo tipo tende ad avere errore nullo, ma l’ipotesi per dedurre questa formula è stata che lo strumento fosse perfetto, ovvero ε=0. In pratica i risultati vanno presentati in questo modo fino al limite in cui la dimensione del campione raggiunga una precisione della misura statistica che non competa con la sensibilità di lettura dell’apparato, cioè quando 6 √ Ribadiamo ancora che l’intervallo , fornisce la stima della probabilità di ottenere una singola misura. Quindi rappresenta la precisione di una singola misura. Invece /√ rappresenta la precisione della misura globale. Si osservi anche che se due misure hanno errori diversi è possibile ottenere la stessa precisione finale da entrambe se si soddisfa la relazione: Ovvero il numero di misure con errore dell’esperimento con errore più grande deve essere più grande. Nel caso di varie misure ottenute da vari campioni con medie e varianze differenti si deve utilizzare invece la media pesata: ∑ 1 ∑ ∑ Abbiamo ricavato questo per misure gaussiane, deviazione standard della media pesata descrive un livello di confidenza del 68% della misura globale (vedi σx). Ma grazie al teorema del limite centrale anche se i dati non fossero gaussiani per N > 10 vale il teorema del limite centrale. Come per il caso della deviazione standard della media. Misure affette da errori statistici e sistematici Nel caso di misure effettuate con un apparato, in cui si abbiano sia errori statistici che sistematici, misure ripetute forniscono comunque diversi valori e i risultati vengono presentati sotto forma di istogrammi. Ovviamente non ha senso scegliere la larghezza delle classi dell’istogramma inferiore all’errore sistematico. Supponiamo di aver raccolto un campione di N misure e di aver calcolato media e varianza. Nel seguito, sebbene espresso in simboli si tenga conto che risultato di una misura è un numero. La varianza del campione osservato è la somma di due varianze, quella statistica e quella sistematica ovvero: ∆ 12 E quindi fornire il risultato una distribuzione di probabilità uniforme e quindi ± ∆2 12 Chiariamo con esempio. Supponiamo di aver misurato come grandezza la costante di accelerazione gravitazionale pari a 9.75 ms-2 indirettamente, mediante la misura diretta di altre ⁄ variabili e di aver propagato separatamente errori casuali e quelli sistematici, se si suppone 2 -2 2 -2 2 = 0.2 (ms ) ∆ ⁄12 = 0.3 (ms ) si fornirà il risultato g = 9.75 + 0.84 ms-2 dove 0.84 si ottiene da √0.2 0.3 Per il teorema del limite centrale possiamo quindi considerare la variabile come una variabile gaussiana, e quindi fare gli studi opportuni per fornire il livello di confidenza di ottenere un determinato valore atteso. Sicuramente serve questo modo di procedere per tale confronto e per fornire la discrepanza con il valore atteso e il relativo livello di confidenza. 7 Spesso nella letteratura scientifica si preferisce tenere separati i due tipi di errore e quindi si riportare la misura come ∆ 2 √ Questo se si vuole dare evidenza ai due differenti tipi di errore. Con i valori numerici forniremo: g= 9.75 + 0.45 (stat) + 0.95 (sist) ms-2 in questo caso i livelli di confidenza risultano diversi per i due tipi di errore, 68 % per quello statistico e 100% quello sistematico. Alcuni invece preferisco presentare l’errore massimo totale e quindi 3· ∆ 2 percui si ha un livello di confidenza del 100% uniforme per entrambi gli errori. √ In questo modo si fornirebbe il risultato separato g= 9.75 + 1.35 (stat) + 0.95 (sist) ms-2 livello di confidenza 100%, o anche in quadratura: g= 9.75 + 1.65 ms-2 livello di confidenza 100%, Ovviamente quanto presentato va chiarito nel testo della relazione o articolo. Misure con calibrazione Nella descrizione precedente abbiamo usato quasi in modo generico sia ε che Δ per gli errori sistematici o strumentali. Spesso nei manuali viene fornita l’accuratezza come + val . Quindi segue le discussioni su riportate per le variabili a densità di probabilità uniforme. Quando non si ha a disposizione un manuale con le relative informazioni, si assume per un strumento di ottime prestazioni, che l’accuratezza sia maggiore della sensibilità di misura, quindi l’errore di accuratezza si minore percui rimane solo l’errore di sensibilità di lettura. Abbiamo anche detto che di solito l’accuratezza è un errore sistematico che ha un segno costante, e il modo per determinarlo e mediante la calibrazione o taratura. Nel caso di una calibrazione grazie alla quale si determina il valore ed segno dell’errore mediante una calibrazione si può presentare il risultato come ∆2 12 se si è misuraton con un apparato g= 10.0 ms-2, e si è ottenuto per gli errori il valore riportato sopra 0.84, che include errori statistici e strumentali del tipo suddetto, mentre accuratezza sono determinati dalla calibrazione. Si possono rifare tutte le considerazioni sui livelli di confidenza di sopra e portare ovviamente il risoltano nel modo seguente √ . ∆ √12 Ovvero numericamenre g= 10.0 + 0.45 (stat) + 0.6 (syst) - 0.2 (acc) ms-2 , con livello di confidenza del 68%.