Capitolo 1 Procedure di fit

annuncio pubblicitario
Capitolo 1
Procedure di fit
Si supponga di aver effettuato una serie di N coppie di misure di due grandezze
x ed y che si pensano legate tramite una funzione y f x; a , dove con a si
intende un insieme di M parametri ignoti, corrispondenti ad altrettante grandezze
fisiche che si vogliono determinare: effettuare un fit significa dare una stima del
loro valore ”vero” a0 , cercando quei valori b
a per i quali la “distanza” (dove la
“distanza” è un concetto che va ancora definito) tra i valori y misurati e quelli
calcolati tramite f a partire dai corrispondenti valori di x risulta minore.
= ( )
La stima delle grandezze fisiche non è altro che una misura indiretta, che porterà
ba a0 , e quindi ad una incertezza a associata alla
dunque ad un errore a
misura.
=
Solitamente, si adoperano due tipi di fit: nel caso in cui le incertezze su y siano
tutte uguali, o peggio siano sconosciute, si adopera il metodo dei minimi quadrati.
Se invece le incertezze su y risultano sensibilmente diverse tra di loro, si preferisce
adoperare il metodo del minimo 2 .
Perché il fit possa avere un senso, in numero di parametri indipendenti da cui
dipende la curva deve risultare strettamente minore del numero di misure a disposizione: questo dipende solamente da considerazioni di natura algebrica: se
le variabili indipendenti fossero maggiori, il minimo risulterebbe indeterminato.
La differenza tra il numero di misure ed il numero di parametri è detta numero di
gradi di libertà del fit: ngl N M . 1
=
1
Una operazione di fit non è altro dunque che una condensazione dell’informazione: ad esempio, possiamo immaginare di effettuare un fit mediante una retta ad un insieme N di dati. In questo
caso, gli N numeri iniziali si riducono a solamente due, con in più l’ipotesi che le variabili x ed y
siano legate da una relazione lineare. Oviamente, parte dell’informazione va persa: ad esempio,
se il legame tra le variabili contenesse un piccolo termine non lineare, di questo non rimarrebbe
traccia dopo il fit, mentre probabilemente una analisi accurata dei dati originari sarebbe in grado
1
CAPITOLO 1. PROCEDURE DI FIT
2
1.1 Fit col metodo dei minimi quadrati
Vediamo in dettaglio il caso in cui la “distanza” corrisponde allo scarto quadratico
tra la funzione ed i valori misurati, caso che costituisce appunto il metodo dei
minimi quadrati.
Si supponga che le N misure xi siano effettuate con errore nullo, o comunque trascurabile, e che le misure yi siano affette da una stessa indeterminazione y , nota
o ignota non importa; si parta per comodità da un valore arbitrario dei parametri a,
e si calcoli la differenza tra i valori misurati y e quelli calcolati tramite la funzione
f:
=
di
yi
f (xi ; a)
Le quantità di sono dette scarti o residui: in generale potranno essere positivi o
negativi, quindi non vanno bene per definire una distanza, che è sempre positiva.
Possiamo però, a partire dai residui, definire una “distanza” tra la funzione f ed i
valori osservati di y , prendendone il quadrato e costruendone la somma:
D2
=
N
N
X
X
d2 = [yi
i=1
i
i=1
f (xi ; a)℄2
Questa distanza, così definita, dipende solamente dai parametri a. È evidente che,
se la funzione rispecchia il reale legame tra le variabili, allora in corrispondenza
dei parametri ”veri” i residui saranno uguali agli errori sperimentali, e quindi a
media zero e deviazione standard y . Assumeremo quindi che i valori b
a in corrispondenza dei quali la sommatoria raggiunge il minimo siano la migliore stima
possibile dei parametri ”veri” a0 .
1.1.1 Stima delle incertezze
Nel caso in cui l’incertezza sulla misura di y sia ignota, o mal determinata, è
possibile effettuarne una stima a partire dal risultato del fit. Il metodo è il seguente:
dapprima si calcolano i parametri b
a minimizzando la distanza definita sopra; poi
a partire da questa si calcolano i residui. La deviazione standard dei residui dà
la stima dell’incertezza cercata. Ma attenzione: se abbiamo N misure, e il fit
contiene M parametri, allora il numero di gradi di libertà indipendenti sarà ngl
N M . Quindi la deviazione standard andrà calcolata utilizzando la formula :
=
di metterla in evidenza.
1.1. FIT COL METODO DEI MINIMI QUADRATI
dati =
sP
N
N 2
i=1 di
M
=
r
3
D2
N M
(1.1)
Questo metodo è molto utile, ma può dare risultati sbagliati se la funzione f
riproduce accuratamente la relazione vera tra x e y .
(x; a)non
Nel caso in cui esista una stima indipendente dell’incertezza y , è possibile confrontarne il valore con quello ottenuto dai dati: se i due valori non concidono,
perlomeno entro un fattore 2, è bene indagare le cause della discrepanza. Infatti
questo effetto potrebbe dipendere da svariati motivi, ad esempio:
La stima indipendente dell’incertezza su y potrebbe essere sbagliata: questo
è il caso più frequente, che non porta a gravi conseguenze sul piano pratico.
Le coppie di misure potrebbero non essere indipendenti: ad esempio, potrebbe esistere un errore sistematico comune a tutti i valori di y .
L’errore su x potrebbe non essere trascurabile.
I dati potrebbero essere legati da una relazione diversa da quella ipotizzata.
Il semplice confronto degli errori è però un test piuttosto rozzo della qualità dei dati, in quanto non tiene conto del numero di misure a disposizione. Si preferiscono
quindi adoperare test più raffinati, come quello del 2 .
1.1.2 Test del 2
Nel caso in cui l’errore nella misura delle ordinate sia conosciuto, è possibile
effettuare sulle misure il test del 2 : viene definita la quantità
N
X yi
2 =
i=1
N 2
f (x; ba) 2 X
di
=
=
y
i=1
D2
2
= (N
2
M ) dati
2
Si tratta, come si vede, essenzialmente della stessa quantità definita nell’equazione
??, calcolata per ogni misura, e sommata su tutte le misure: non è altro che il
rapporto tra il valore quadratico medio dei residui e la stima delle incertezze. Nel
caso in cui queste coincidano, il 2 vale pressappoco N M , ovvero il numero di
gradi di libertà residui dopo il fit. Quindi verificare che la quantità 2 = N M
(detto chi-quadro ridotto) sia pressappoco uguale ad uno equivale a confrontare le
stime degli errori ottenute dai dati e con metodi indipendenti.
(
)
CAPITOLO 1. PROCEDURE DI FIT
4
Figura 1.1: Procedura della stima degli errori: nella figura in alto, i punti corrispondenti agli errori sperimentali sono graficati senza barre di errore, assieme al
risultato del fit. Nella figura al centro, vengono mostrati i residui: le linee orizzontali corrispondo agli errori calcolati seguendo la procedura descritta. La figura in
basso è uguale a quella in alto, ma stavolta sono state aggiunte le barre di errore.
15
10
5
0
−5
0
2
4
6
8
10
12
0
2
4
6
8
10
12
0
2
4
6
8
10
12
4
2
0
−2
−4
15
10
5
0
−5
1.1. FIT COL METODO DEI MINIMI QUADRATI
5
Figura 1.2: Calcolo del 2 : nella figura in alto viene riportato il grafico dei dati
con la curva di fit e le barre di errore. Nella figura in mezzo sono invece mostrati
i residui. Infine nella figura in basso si vede il grafico di di = 2 : la somma delle
barre dà il valore di 2 . Si vede come il punto corrispondente ad x
, la cui
barra di errore non interseca il grafico dà alla sommatoria un contributo maggiore
di 1, mentre le altre danno un contributo minore.
(
)
=5
10
5
0
−5
−10
0
2
4
6
8
10
12
0
2
4
6
8
10
12
4
2
0
−2
−4
2
1.5
1
0.5
0
1
2
3
4
5
6
7
8
9
10
Però con il 2 si può fare molto di più: infatti è possibile calcolare la distribuzione
di probabilità della variabile casuale 2 nel caso in cui si abbiamo ngl gradi di
libertà. Dalla distribuzione di probabilità è possibile quindi farsi un’idea di quanto
risulti probabile il valore di 2 ottenuto nei dati che si stanno analizzando.
1.1.3 Fit polinomiale
In generale, data una funzione qualsiasi, la ricerca del minimo può presentare
una serie di problemi, dovuti a motivi matematici (la presenza di più minimi,
ad esempio) o fisici (quando il valore dei parametri corrispondente al minimo
non possiede significato fisico, ad esempio). Un caso interessante è però quello
CAPITOLO 1. PROCEDURE DI FIT
6
Figura 1.3: a) densità di probabilità del 2 per diversi gradi di libertà.
b) la stessa funzione, integrata fino a 1, mostra la probabilità di osservare un
valore del 2 più grande di quello ottenuto. Ad esempio, se otteniamo un 2 di
7.9 con 5 gradi di libertà (punto evidenziato in nero), dalla curva troviamo che la
probabilità di ottenere un valore più alto del 2 (e quindi dati che si discostano
maggiormente dalla curva osservata) è di circa il 16 %. Valori bassi della probalilità indicano che il fit riproduce male i dati sperimentali; d’altro canto valori
troppo alti possono generare il sospetto di una sovrastima delle incertezze.
+
5
10
a)
n=10
0
10
n=1
−5
10
−10
10
0
2
4
6
8
10
12
14
16
18
20
16
18
20
2
χ
1
b)
0.8
n=10
0.6
0.4
0.2
n=1
0
0
2
4
6
8
2
χ
10
12
14
1.1. FIT COL METODO DEI MINIMI QUADRATI
7
=P
M
k
che si ottiene quando la funzione f è un polinomio:f
k=1 ak x . In questo
caso, derivando rispetto ai vari valori di ak , si ottengono sempre equazioni lineari
facilmente risolvibili numericamente. La teoria generale esula da questo contesto,
ci limiteremo a trattare due casi particolari.
Costante
=
Si supponga una relazione del tipo: y
a0 , ovvero che non esista nessuna dipendenza dalla variabile x (in questa tipologia rientrano quei casi in cui viene
misurata più volte la stessa quantità: in questo caso la variabile x può essere una
variabile qualsiasi, come ad esempio un numero progressivo).
In tal caso:
N
X
D2 = (yi
i=1
N
X 2
a0 )2 =
yi
i=1
2a0
N
X
i=1
yi + Na20
Derivando rispetto ad a0 , si ottiene che il minimo corrisponde al caso in cui a0 è
uguale alla media di yi .
Relazione lineare
Il caso in cui la funzione è una retta,
facilità:
D2
=
N
X
(yi
i=1
N
X
a0
f
=
a0 + a1 x, si risolve con altrettanta
a1 xi )2 =
N
X
yi2 + Na20 + a21 x2i
i=1
i=1
2a0
N
X
i=1
yi
2a1
N
X
i=1
yi xi + 2a0 a1
N
X
i=1
xi
Derivando, ed imponendo che la derivata valga zero, si ottengono dopo un po’ di
conti le due equazioni accoppiate:
PN
PN
Na
+
a
x
=
0
1
i
iP
=1 N
PN
PNi=1 yi
2
a0 i=1 xi + a1 i=1 xi = i=1 xi yi
che hanno come soluzione:
(1.2)
CAPITOLO 1. PROCEDURE DI FIT
8
a0 =
a1 =
(P
)(PP x ) (PP x y )(P x )
PN ( x y ) x ()P ( y )(xP) x )
N(
P x ) (P x )
N(
y
N
i=1 i
N
i=1
N
2
i=1 i
N
2
i=1 i
i i
N
i=1
2
i
N
N
i=1 i i
i=1
2
N
i
i=1
N
N
i=1 i
i=1 i
2
N
i=1 i
i
2
Il valore di a0 rappresenta l’intercetta della retta con l’asse delle ordinate, mentre
il valore di a1 rappresenta la sua pendenza.
E’ possibile a questo punto ottenere una stima dell’incertezza su y , osservando la
dispersione dei valori di y intorno al risultato del fit: basterà calcolare dapprima i
residui, e successivamente la loro deviazione standard.
Nel caso in cui i punti utilizzati siano pochi (diciamo meno di 10), è buona regola
calcolare l’errore su y tramite la formula1.1, che in questo caso si scrive:
y =
sP
N 2
i=1 di
2
N
infatti visto che nel calcolo dei residui abbiamo adoperato due valori ricavati dai
dati stessi, il numero di gradi di libertà è stato ridotto conseguentemente.
A questo punto, possiamo calcolare anche gli errori sui parametri del fit: per
farlo, basta osservare come sia a0 che a1 sono due funzioni delle variabili casuali
yi. Quindi bisogna solalmente applicare la formula di popagazione degli errori
ed effettuare dei conti che qui per brevità ometteremo riportando solamente il
risultato finale:
a20
a21
=
=
P
PN a0 2
( i=1 i )
2
i=1 yi y = y N (PN x2 ) (PN xi )2
i=1 i
i=1
PN a1 2
N
2
i=1 yi y = y N (PN x2 ) (PN xi )2
N
i=1
i
x2
i=1
Esiste una correlazione tra i due parametri: è una cosa che si impara immediatamente quando si effettua il fit grafico col righello. Infatti, nel caso semplice in
cui tutti i dai si trovino nel primo quadrante (valori di x e y positivi) che per far
passare il righello attraverso tutti i dati, se si aumenta l’inclinazione allora il punto
di intersezione con l’asse delle ascisse si abbassa, e viceversa. Quindi se il fit produce come risultato un valore di a1 maggiore di quello vero, allora il valore di a0
risulterà molto probabilmente minore di quello vero: tra i due parametri esisterà
allora una correlazione di tipo negativo.
2
Una forma alternativa della soluzione si può scrivere nella forma:
a0 =
a1 =
PNi yxi ax xyi
PNi xi x
=1 (
=1 (
1
)(
)2
y)
1.1. FIT COL METODO DEI MINIMI QUADRATI
9
Figura 1.4: Correlazione tra pendenza ed intercetta: all’aumentare della pendenza diminuisce l’intercetta, e viceversa. La correlazione tra i due parametri
è quindi negativa (nel caso in cui i dati non giacciano tutti nel primo quadrante la
correlazione può essere tuttavia negativa o nulla).
20
18
16
14
12
10
8
6
4
2
0
0
2
4
6
8
10
12
CAPITOLO 1. PROCEDURE DI FIT
10
Per calcolare la correlazione si può procede nel modo seguente: si parte dall’idea
che una variazione yi in una delle misure produce nei parametri due variazioni
date da:
a0 = ay yi, a1 = ay yi. Se moltiplichiamo queste due espressioni tra di
0
1
i
i
loro, sommiamo su tutte le misure, e mediamo, otteniamo la covarianza dei due
parametri, che, assumendo che le misure yi siano tra di loro indipendenti, assume
la forma:
N
X
a0 a1 2
ov (a0 ; a1 ) =
= 2
i=1
yi yi
y
y
N
PN
PN
i=1 xi
P
2
i=1 xi
N
i=1 xi
2
ed infine il coefficente di correlazione risulta uguale a:
PN
x
r = q Pi=1 i
N Ni=1 x2i
Il coefficente di correlazione non dipende in nessun modo da y : dipende solo
dai valori di x. Questo ha come conseguenza interessante che per ottenere due
valori scorrelati della pendenza e dell’intercetta della retta basta fare delle misure
simmetriche intorno all’origine delle coordinate.
1.1.3.1 Esempi
Vediamo adesso alcuni esempi:
Esempio 1 Supponiamo che i valori “veri” delle grandezze
dalla relazione: y
x
=3 +1
x e y siano legati
Si effettuano 10 misure, con uno strumento che presenta una risoluzione pari a
y
:
=1
i 1 2
3
4
5
6
7
8
9
10
xi 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0
yi 4.1 6.9 11.8 12.0 16.6 19.6 22.4 23.9 27.0 30.5
A partire da questi dati, possiamo calcolare:
1.1. FIT COL METODO DEI MINIMI QUADRATI
11
PN
PNi=1 x2i =
PNi=1 xi =
xi yi =
Pi=1
N
55
385
1198
i=1 yi = 174:8
e quindi, applicando le formule:
a0 = 1:71 a1 = 2:87
A questo punto è possibile calcolare i residuidi
= yi
a0
a1 xi :
i
1
2
3
4
5
6
7
8
9
10
di -0.48 -0.55 1.48 -1.19 0.54 0.67 0.60 -0.77 -0.54 0.09
Applicando la formula1.1, si ottiene come erroredati = 0:87, in ottimo accordo
col valore atteso.
Le incerte sui parametri si calcolano utilizzando le formule ??, ottenendo infine:
a0 = 1:71
0:68
a1 = 2:87 0:11
con un coefficente di correlazione pari a -0.9.
Esempio 2 Supponiamo adesso che anche nelle misure di x si effettui un errore
con dispersione pari a x
: . I risultati potrebbero apparire come i seguenti:
=05
i 1 2
3
4
5
6
7
8
9
10
xi 1.0 1.6 2.2 4.9 5.6 6.4 7.6 8.2 8.3 10.7
yi 4.1 6.9 11.8 12.0 16.6 19.6 22.4 23.9 27.0 30.5
Stavolta il risultato del fit è notevolmente diverso:
a0 = 2:59, a1 = 2:63
Calcolando l’errore su y si ottiene y
= 2:0, il doppio di quello vero!
Il motivo sta nel fatto che la dispersione su x viene “trasformata” in una indeterminazione su y : si ha pressappoco:
2 = 2 + ( dy )2 2
dati
y
x
dx
CAPITOLO 1. PROCEDURE DI FIT
12
Esempio 3 Stavolta i dati siano i seguenti:
i
1
2
3
4
5
6
7
8
9
10
11
xi 0.0 0.1 0.2 0.3 0.4
0.5
0.6
0.7
0.8
0.9
1.0
yi .001 .012 .015 .024 0.031 0.029 0.033 0.040 0.039 0.042 0.042
Le y sono state misurate con una incertezza pari a 2 10 3 .
Il fit lineare porta al risultato:a0 = 0:008 0:001, a1 = 0:039 0:002.
I residui sono:
i
di(10
1
2
3
4 5
6 7
8
9
10 11
-9
3 ) -8 -6 4 2 4 7 5 3 -1 -2
= 6 10
Il calcolo dell’errore in base ai residui porta al risultato: dati
3, ed il
2 vale 42 per 9 gradi di libertà. Anche stavolta l’incertezza calcolata sui dati è
più grande di quella attesa, ma stavolta la causa è l’inadeguatezza della funzione:
infatti, esaminando i residui, si nota come questi, invece di essere positivi o negativi in modo casuale, sembrano seguire un andamento che porta i punti a passare
da sotto a sopra e poi di nuovo sotto la retta ottenuta trmite il fit. Questo fa sorgere il forte sospetto che i dati presentino una leggera concavità rivolta verso l’alto.
E’ interessante osservare come questo comportamento non risulta particolarmente
vistoso nel grafico che confronta i dati col fit, mentre è evidentissimo nel grafico
dei residui (fig.1.5).
1.1.4 Metodo matriciale
Un metodo alternativo di risolvere le equazioni 1.2 è quello di adoperare il metodo
matriciale. Data una opportuna trasformazione si possono infatti scrivere nella
forma:
A=
a0 ; M
a1
=
PN
xi
+
P P x2i ; V
xi
P = P yi
xi yi
= MA
+
A = M 1V
V
Quindi per trovare i parametri occorre invertire la matrice M : i vantaggi di
questo metodo stanno nel fato che la matrice è invertibile numericamente, ed il
formalismo si può estendere a casi più complicati, come vedremo nel prossimo
paragrafo.
1.1. FIT COL METODO DEI MINIMI QUADRATI
13
Figura 1.5: Terzo esempio: grafico dei dati (in alto) sovrapposto al risultato del
fit, e grafico dei residui. Si vede chiaramente come i dati presentino una leggera
curva che li fa passare da sotto a sopra e poi nuovamente sotto la retta del fit.
0.06
0.05
0.04
0.03
0.02
0.01
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.015
0.01
0.005
0
−0.005
−0.01
−0.015
CAPITOLO 1. PROCEDURE DI FIT
14
=
La matrice S
y2 M 1 è detta matrice di covarianza: si dimostra come i suoi
elementi siano:S00 a20 , S11 a21 , S01 S10 r a0 a1
=
=
=
=
1.1.5 Polinomio di grado generico
Un fit dei dati mediante un polinomio generico di grado M è sempre possibile,
purché il numero dei punti sperimentali sia almeno uguale al grado del polinomio
più due: infatti sappiamo che per N punti passa sempre uno ed un solo polinomio
di grado N-1. Quindi, se tentiamo il fit il queste condizioni, il polinomio passerà
esattamente per i punti sperimentali: i residui saranno tutti esattamente uguali a
zero, ed il polinomio trovato sarà il polinomio interpolante. Questo caso risulta
poco interessante nel caso di dati affetti da errore: la forza del fit infatti sta nel
ricavare pochi parametri sperimentali da molte misure, in modo tale che la ridondanza consenta di ridurre le incertezze sui singoli punti. Qualora il numero di
dati sperimentali risulti inferiore al grado del polinomio aumentato di 1, allora il
polinomio rimane indeterminato, ed il fit è impossibile.
Il metodo è simile a quello visto nel caso dell a retta: il polinomio avrà la forma:
p(x) = a0 + a1 x + a2 x2 + ::::: + aM xM
= PMk=0 ak xk
e quindi la funzione da minimizzare sarà:
D2 =
PN
i=1 (yi
p(xi ))2 =
PN PM
k
k=0 ak xi
i=1 yi
2
Derivando, e svolgendo i calcoli, si ottiene un’equazione in forma matriciale,
esattamente come nel caso della retta:
A = MV con: Ak = ak , Mlk =
PN
k+l
i=1 xi , Vl
= PNi=1 yixll
Per calcolare l’inverso della matrice M esistono metodi numerici molto efficaci,
per cui il problema risulta facilmente automatizzabile in tutti i casi di applicazione
pratica.
Gli errori sui parametri e i coefficenti di correlazione si calcolano a partire dagli
elementi della matrice di covarianza S y2 M 1 :
ak
= pSkk , rkl = S kl
ak al
=
.
1.1.6 Problemi con i fit polinomiali
I fit effettuati con un polinomio risultano molto comodi per la facilità con cui vengono effettuati: basta calcolare il vetore V , la matrice M , invertire quest’ultima
e moltiplicarla per V , tutte operazioni molto semplici per un calcolatore; inoltre,
1.1. FIT COL METODO DEI MINIMI QUADRATI
15
nel caso in cui la legge fisica che lega le quantità x e y risulti sconosciuta costituiscono sempre una buona approssimazione ai dati in un piccolo intervallo. Però i
polinomi non sono quasi mai in grado di riprodurre alcune caratteristiche comuni
a molte leggi fisiche, come la presenza di un asintoto o una rapida discesa verso
lo zero. Si potrebbe pensare che, a causa del teorema di Taylor, un polinomio di
grado sufficentemente alto dovrebbe costituire sempre una migliore approssimazione alla legge sperimentale ignota. Purtroppo non è così: a causa degli errori
sperimentali, i polinomi di grado eccessivamente elevato hanno la tendenza a diventare instabili, e a presentare caratteristiche, come massimi o punti di flesso,
assenti nei dati. Ad esempio, in figura 1.6 viene mostrato come aumentando il
grado del polinomio la curva risultante tende sempre più a distanziarsi dai dati.
Nella pratica, è raro che un polinomio di grado superiore al secondo si riveli utile.
Però spesso è possibile riuscire applicare ai dati delle trasformazioni in modo da
ottenere delle leggi polinomiali.
=
= ( )
=
= ()
Un caso molto frequente è quello dell’esponenziale descrescente:y Ae kx . Infatti, adoperando una nuova variabile z log y la legge diventa z log A kx.
Un’altro caso frequente è quello della legge esponenziale del tipo y
x : in
questo caso bisogna trasformare entrambe le variabili, prendendo log x ,
log y . La relazione diviene infatti: log .
= ()
= ()
= ( )+
L’unico problema, nell’adoperare questa tecnica, è che raramente dopo la trasformazione le incertezze sulle variabili rimangono uguali, o almeno comparabili:
quindi piuttosto che adoperare il metodo dei minimi quadrati conviene applicare
quello del minimo 2 , che verrà discusso nel prossimo capitolo.
1.1.7 Relazione di proporzionalità
Un caso interessante si ha quando si ipotizza tra x ed y una relazione di proporzionalità.
In questo caso, la funzione da minimizzare assume la forma:
N
X
D2 = (yi
i=1
Axi )2
Derivando rispetto ad A, ed eguagliando a zero il risultato, si ottiene:
A=
con errore dato da:
PN
yixi
Pi=1
N 2
i=1 xi
CAPITOLO 1. PROCEDURE DI FIT
16
Figura 1.6: Esempio di problemi nell’uso dei fit polinomiali: la relazione ”vera”
tra le variabili x ed y è una salita esponenziale verso un valore a regime (linea nera). Come vediamo, nessun polinomio è in grado di riprodurre il comportamento
asintotico, e all’aumento del grado si nota anzi una tendenza verso l’instabilità.
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1
1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO 2
17
A = qP y
N 2
i=1 xi
è facile verificare come i valori grandi di xi influenzino maggiormente il risultato.
1.2 Fit lineari tramite il metodo del minimo 2
1.2.1 Richiamo del metodo del minimo 2
Si supponga di avere effettuato una serie di misure yi in corrispondenza di N punti
xi . Ad ogni misura viene associata una incertezza i , mentre i valori di xi vengono
considerati esatti.
= ( )
Supponiamo che la quantità y dipenda da x tramite la relazione: y f x; a . Il
metodo del minimo 2 consiste nel determinare i parametri incogniti minimizzando la funzione :
X (yi
2 (a) =
i=1;N
f (x1 ; a))2
i2
Detto in parole povere: il 2 misura, in unità di deviazioni standard, quanto dista
il valore misurato yi dal valore previsto dal modello: se il punto coincide con
la previsione, il contributo sarà zero. Se invece dista una deviazione standard,
allora sarà 1; se dista due deviazioni standard il contributo sarà 4, e così via. Il
2 differisce dalla somma degli scarti quadratici in quanto stavolta le misure con
errore maggiore contribuiscono meno alla somma, con una minore influenza sul
risultato finale.
Per trovare il valore dei parametri che minimizzano il 2 èpossibile procedere
per via analitica (calcolando cioè le derivate esplicitamente) o per via numerica
(calcolando la funzione per vari valori dei parametri e scegliendo quelli per cui si
ottiene il valore minimo).
In genere, la via analitica è preferibile, ma sono pochissimi i casi in cui risulta
praticabile. La via numerica invece funziona in quasi tutti i casi, ma può risultare
eccessivamente lenta e macchinosa.
CAPITOLO 1. PROCEDURE DI FIT
18
1.2.1.1 Primo caso: costante.
Il caso banale corrisponde a quello per cui f è una costante. In questo caso il 2
assume la forma:
2 =
X (yi
i=1;N
a0 )2
i2
Derivando rispetto ad a0 , si ottiene:
2
a0
=2
X (yi
2
a0 )
i
i=1;N
da cui, infine:
a0 =
P
y = 2
P i 2i
1=i
Per calcolare l’errore su a0 , si utilizza la formula della propagazione degli errori:
2
a0
=
X a0 2
j =1;N
yj
j
=
X
j
1
=j2 2 2
1
P 2 j = P 2
1=i
1=i
Queste formule sono quelle che definiscono la media pesata di una serie di misure,
che così trova una giustificazione teorica. 3
1.2.1.2 Secondo caso: relazione lineare.
Supponiamo stavolta una relazione del tipo: y
Il 2 assume la forma:
2 =
X (yi
i=1;N
= a0 + a1 x.
a0 a1 xi )
i2
Derivando, si ha:
3
Un modo alternativo di ottenere queste formule quello di supporre che le misure siano distribuite secondo una distribuzione gaussiana, e di cercare il valore pi\‘u probabile del valore centrale
della distribuzione.
1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO 2
2
a0
2
a1
19
P
= 2PP yi=i2 2a0 P
1
=i2 2a1 xi =i2 = 0
= 2 xiyi=i2 2a0 P xi=i2 2a1 P x2i =i2 = 0
è possibile esprimere l’equazione precedente in forma matriciale:
A=
a0 ; M
a1
P 2 P
2 1
=
x
=
i
i
i
= P 2 P 2 2 ; V
xi =i
+
= MA
+
A = M 1V
xi =i
V
P
2 y
=
i
i
= P
2
xi yi=i
(1.3)
La matrice M e il vettore V sono facilmente calcolabili a partire dai dati; allo stesso modo, l’inversione numerica della matrice M non presenta in genere particolari
difficoltà, per cui il problema si può considerare risolto.
=
La matrice S M 1 assume un particolare significato: è possibile infatti dimostrare (tramite un conto che si trova nei testi specializzati e che qui non riproduciamo) che si tratta della matrice di covarianza, i cui elementi diagonali, come
abbiamo visto, sono uguali ai quadrati delle incertezze sui alori dei parametri:
Skk = a2k
L’elemento non diagonale è invece uguale alla covarianza dei parametri, ovvero
al loro coefficente di correlazione, moltiplicato per i rispettivi errori:
Sjk = aj ak rjk
Ricapitolando, il fit di un insieme di parametri tramite una retta col metodo dei
minimi quadrati richiede la costruzione di un vettore di dimensione 2, di una matrice , la sua inversione, e la moltiplicazione per il vettore precedentemente calcolato. Le incertezze sui parametri e i coefficenti di correlazione risultano
automaticamente dal calcolo dell’inverso della matrice.
2 2
1.2.1.3 Terzo caso: relazione di proporzionalità.
Si supponga una relazione del tipo:
y = a1 x.
CAPITOLO 1. PROCEDURE DI FIT
20
La funzione 2 diventa:
2 =
X (yi
a1 xi )
2
i
i=1;N
In questo caso, la derivata si calcola immediatamente:
2
a1
=2
X xi yi
i=1;N
i2
2a1
X x2i
2
i=1;N i
e quindi:
a1 =
P
x y = 2
P i 2 i 2i
(1.4)
xi =i
Infine, gli errori sulla quantità a1 si possono calcolare utilizzando la formula per
la propagazione degli errori:
2
a1
=
N X
a1 2
yj
j =1
j
2
N X
x
1
j =j
P 2 2 =P 2 2
=
xi =i
xi =i
j =i
(1.5)
1.2.2 Applicazioni: La legge di Malus.
Si consideri la serie di dati riportata in tabella 1.1 e mostrata in figura1.7.
Si tratta di un insieme di dati che rappresenta la quantità di luce laser che attraversa
un filtro polaroid in funzione dell’angolo di inclinazione. Gli angoli sono calcolati
a partire dal minimo dell’intensità; le intensità sono misurate in Volts, in quanto
lo strumento di misura non era calibrato. Le incertezze sono uguali a 0.1 Volts per
tutte le misure.
In queste condizioni, nell’ipotesi di luce laser completamente polarizzata, il grafico segue pressappoco la legge di Malus, che con questa scelta dell’origine delle
coordinate assume la forma: I I0 2 .
= sin
Per verificare la validità della legge, è possibile innanzitutto effettuare un cam2 : in questo modo, la
biamento di variabile, passando alla variabile x
legge di Malus diventa una semplice relazione di proporzionalità: I
I 0 x, e
quindi è possibile adoperare la formula 1.4. In questo modo si ottiene : I0
: : V olts. Il 2 del fit risulta di 331 per 36-1=35 gradi di libertà: come si
vede, il modello non sembra descrivere i dati in modo sufficentemente accurato.
= sin
18 01 0 03
=
=
1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO 2
Tabella 1.1: Dati raccolti nell’esperienza di verifica della legge di Malus
V
V
Æ
Æ
0
0.20.1 180
0.20.1
Æ
Æ
10
0.70.1 190
0.70.1
20Æ
2.10.1 200Æ 2.10.1
30Æ
4.40.1 210Æ 4.40.1
40Æ
7.30.1 220Æ 7.30.1
Æ
50
10.40.1 230Æ 10.00.1
60Æ 13.40.1 240Æ 12.90.1
70Æ 15.30.1 250Æ 15.60.1
80Æ 17.40.1 260Æ 17.40.1
90Æ 18.00.1 270Æ 18.10.1
100Æ 17.50.1 280Æ 17.60.1
110Æ 15.70.1 290Æ 16.20.1
120Æ 14.00.1 300Æ 13.80.1
130Æ 11.10.1 310Æ 10.80.1
140Æ 8.00.1 320Æ 7.90.1
150Æ 5.00.1 330Æ 4.60.1
160Æ 2.50.1 340Æ 2.30.1
170Æ 0.80.1 350Æ 0.80.1
21
CAPITOLO 1. PROCEDURE DI FIT
22
Figura 1.7: In alto: luce laser che attraversa un polarimetro in funzione dell’angolo di inclinazione dell’asse principale. Gli angoli sono misurati in gradi a partire
dalla direzione in cui la lettura del sensore presenta un minimo. La scala verticale
è misurata in Volts.
2 : si vede chiaramente
Al centro: gli stessi dati, ma riportati in funzione di
come questi di dispongano intorno ad una retta.
In basso: residui ottenuti effettuando un semplice fit di proporzionalità tra
l’intensità e il quadrato del seno dell’angolo.
sin
20
15
10
5
0
0
50
100
150
200
250
300
350
20
15
10
5
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1
0.5
0
−0.5
−1
0
50
100
150
200
250
300
350
1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO 2
23
Figura 1.8: In alto: risultato del secondo fit sovrapposto ai dati. In basso, grafico
dei residui
20
15
10
5
0
0
50
100
150
200
250
300
350
0
50
100
150
200
250
300
350
0.6
0.4
0.2
0
−0.2
−0.4
−0.6
−0.8
Un primo possibile problema è individuabile già esaminando la tabella dei dati:
infatti si nota immediatamente come la luminosità letta dallo strumento non si
azzera mai, mentre il modello proposto prevede che nessuna luce attraversi il poÆ . Una causa di questo comportamento può ad
laroid per inclinazioni di Æ e
esempio essere individuata nella non completa polarizzazione della luce del laser.
Un modello più accurato risulta allora: I I? I0 x, dove I? rappresenta la componente della luce laser polarizzata perpendicolarmente all’asse di polarizzazione
principale.
0 180
= +
=
A questo punto è possibile applicare la formula1.3, che dà come risultato I0
: : V; I?
: : V . Il 2 di questo fit è uguale a 283, mentre
il numero di gradi di libertà è passato da 35 a 34; notiamo inoltre come l’errore
statistico su I0 sia aumentato.
17 74 0 05
= 0 20 0 03
E’ possibile tuttavia migliorare ulteriormente il fit: osserviamo infatti come gli
angoli siano stati misurati a partire dal punto di minimo della luminosità, la cui
determinazione porta sempre con sé un errore, che si può ripercuotere negativa-
CAPITOLO 1. PROCEDURE DI FIT
24
mente sul fit: ingrandendo la figura 1.8 si potrebbe infatti osservare che i dati
risultano leggermente spostati verso destra rispetto al risultato del fit.
Conviene allora provare ad introdurre un nuovo parametro, corrispondente ad un
piccolo errore comune a tutti i dati nella determinazione degli angoli.
Stavolta il modello da utilizzare nel fit sarà:
I = I? + I0 sin2 (
)
Apparantemente, questa funzione risulta non lineare. Tuttavia è semplicemente
linearizzabile con una serie di passaggi: la prima operazione da effettuare è quella
di sfruttare le formule di bisezione degli angoli, in modo da ottenere:
I I
I = I? + 0 + 0 os(2
2
2)
2
Si possono inoltre applicare le formule di prostaferesi:
I I
I = I? + 0 + 0 os(2) os(2)
I0
2 sin(2) sin(2)
A questo punto, posto = I? + I2 , = I2 os(2), = I2 sin(2), ed inoltre
s = sin(2), = os(2), la funzione assume la forma semplice:
2
2
0
0
0
I = + + s
che è lineare, ma dipende da due variabili, e quindi non rientra nei casi esaminati
in precedenza.
Tuttavia, come vedremo, i conti risultano particolarmente semplici.
Il 2 , tenendo conto che gli errori sono uguali per tutte le misure, assume la forma:
X
2 =
i
(Ii
!
si
i )2 =I2
da cui, derivando rispetto ad , , , si ottiene:
2
2
2
=
=
=
2 (P Ii
i
I2
22 (P Ii si
i
I
22 (P Ii i
I
i
P
P
N si i )
P
P
P
si s2i si i )
P
P
P
i i si 2i )
=0
=0
=0
1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO 2
25
Una ulteriore ed importante semplificazione si ha osservando che, avendo effettuato le misure ad angoli equispaziati
tra di loro
P
P
P nell’intervallo ; , si ha (in
questo caso particolarissimo) i i
s
, e quindi:
i i
i i si
=
=
=0
[0 2 ℄
P
= P i Ii =N
P
= Pi Ii si = P s2i
=
2i
i Ii i =
Applicando la propagazione degli errori si trova inoltre:
2 = I2P
=N
2 = I2 = P s2i
2 = I2 = 2i
Queste formule, calcolate sui dati che stiamo analizzando, portano al risultato:
= 9:07 0:02;
= 0:33 0:02;
tornati ai parametri fisici, si trova:
= 8:8710 0:0236Una volta
p
I0 = 2 2 + 2 = 17:75 0:02, I? = I20 = 0:20 0:02, = 21 artan 0:019 0:002
Il valore del 2 scende bruscamente a 87, per 33 gradi di libertà.
=
Possiamo adesso porci la domanda: è stata una decisione saggia introdurre un
nuovo parametro nel fit? Dobbiamo tenere conto infatti del fatto che l’introduzione di nuovi parametri porta sempre, ovviamente, ad un migliore adattamento
ai dati, e ad un conseguente abbassamento del valore del 2 . Ovviamente c’è un
prezzo per questo, ed è l’aumento dell’incertezza sul valore dei parametri. Non ha
quindi senso continuare indefinitvamente ad introdurre parametri fino ad ottenere
una coincidenza perfetta con i dati.
Tipicamente, l’introduzione di un nuovo parametro è giustificata quando il valore del parametro stimato tramite fit risulta significativamente diverso da zero. In
quest’ultimo caso, spesso accade che il valore del 2 del fit diminuisce significativamente, e gli altri parametri subiscono delle variazioni più grandi dell’errore
statistico stimato.
Bisognerebbe evitare però di introdurre un nuovo parametro se questo non possiede un chiaro significato fisico. Spesso inoltre conviene verificare tramite un
controllo indipendente che effettivamente l’introduzione del nuovo parametro è
necessaria: ad esempio, nel caso della quantità I? , si può verificare come a laser
spento la lettura del fotometro è esattamente zero, mentre ruotando il polarimetro
a laser acceso la lettura non si azzera mai: quindi evidentemente una piccola parte
CAPITOLO 1. PROCEDURE DI FIT
26
Figura 1.9: In alto: grafico del terzo fit descritto nel testo sovrapposto ai dati. In
basso: grafico dei residui
20
15
10
5
0
0
50
100
150
200
250
300
350
0
50
100
150
200
250
300
350
1
0.5
0
−0.5
−1
1.2. FIT LINEARI TRAMITE IL METODO DEL MINIMO 2
27
della luce laser riesce ad attraversare comunque il polarimetro, non sappiamo bene se per effetto di una non completa polarizzazione del laser o di un difetto del
filtro.
Per quanto riguarda invece l’angolo , possiamo osservare come l’incertezza nella
determinazione del minimo nella procedura di allineamento che ha preceduto le
misure risultava dell’ordine di qualche grado, e pertanto compatibile col valore di
trovato.
A questo punto, l’introduzione di nuovi parametri risulta ingiustificata. Possiamo però chiederci come mai il valore del 2 risulti così alto, e se è ragionevole.
Possiamo osservare il grafico dei residui: una cosa in particolare colpisce, ed è
notare come alcuni punti risultano chiaramente sbagliati, e registrano una luminosità chiaramente più bassa degli altri. Questi punti sono molto probabilmente
dovuti a macchie o imperfezioni del polarimetro. Per migliorare la misura, due
strade sono possibile: la prima è quella di pulire accuratamente il filtro e di ripetere possibilmente tutte le misure da capo. Se abbiamo nuovamente accesso allo
strumento, questa è chiaramente la strada migliore. Se invece non possiamo ripetere le misure, allora possiamo decidere di eliminare le misure che presentano un
residuo più alto in valore assoluto, e ripetere il fit. Ad esempio, eliminando le 4
misure peggiori4, si ottiene un fit con un 2 di 32 per 29 gradi di libertà, che mostra
come il modello alla fine sia abbastanza accurato. Ovviamente, diminuendo i dati
adoperati, l’errore statistico sul risultato aumenterà.
4
Notiamo che molte delle semplificazioni effettuate in precedenza vengono a cadere, ed è
quindi necessario rifare alcuni conti.
Scarica