Calcolo retta Regressione Lineare utilizzando il metodo dei minimi

INFORMATICA 5ASA aprile 2015 docente Salvatore Mosaico
Calcolo retta Regressione Lineare utilizzando il
metodo dei minimi quadrati
La regressione formalizza e risolve il problema di una relazione funzionale tra variabili misurate sulla base di
dati campionari estratti da un'ipotetica popolazione infinita.
Più formalmente, in statistica la regressione lineare rappresenta un metodo di stima del valore atteso
condizionato di una variabile dipendente, , dati i valori di altre variabili indipendenti.
INFORMATICA 5ASA aprile 2015 docente Salvatore Mosaico
Metodo dei MINIMI QUADRATI
Si tratta di approssimare il fenomeno con una retta y=mx+qi cui coefficienti si ricavano dalla relazione
n(∑ xi yi ) − (∑ xi )(∑ yi )
m=
2
2
n ∑ xi − (∑ xi )
(
)
(
x )(∑y ) − (∑x )(∑x y )
∑
q=
2
i
i
i
i i
n(∑xi ) − (∑xi )
2
2
Che può essere più semplicemente scritta (dal punto di vista dei calcoli)
y − m∑x
∑
q=
i
i
n
L’analisi della correlazione fra due variabili conduce a misurare la forza, o l’intensità, del legame
fra le due variabili. Si misura mediante l’indice di Bravais-Pearson detto “Indice di correlazione
lineare”
2
INFORMATICA 5ASA aprile 2015 docente Salvatore Mosaico
r=
n∑xi yi − ∑xi ∑yi
n∑xi − (∑xi ) * n∑yi − (∑yi )
2
2
2
2
Frammento di codice che fa i calcoli in javascript
SOMMATORIAX = 0;
SOMMATORIAY = 0;
SOMMATORIAXX = 0;
SOMMATORIAXY = 0;
SOMMATORIAYY = 0;
for (i = 1; i <= N; i++)
SOMMATORIAX = SOMMATORIAX +
SOMMATORIAY = SOMMATORIAY +
SOMMATORIAXY = SOMMATORIAXY
SOMMATORIAXX = SOMMATORIAXX
SOMMATORIAYY = SOMMATORIAYY
// per ciascun punto
{
X[i];
Y[i];
+ X[i] * Y[i];
+ X[i] * X[i];
+ Y[i] * Y[i];
} // i = 1 to 16
PENDENZA = (N * SOMMATORIAXY - SOMMATORIAX * SOMMATORIAY) / (N * SOMMATORIAXX SOMMATORIAX * SOMMATORIAX);
QUOTA = (SOMMATORIAY - PENDENZA * SOMMATORIAX) / N;
r = (N * SOMMATORIAXY - SOMMATORIAX * SOMMATORIAY) / (pow(N * SOMMATORIAXX - SOMMATORIAX *
SOMMATORIAX, 0.5) * pow(N * SOMMATORIAYY - SOMMATORIAY * SOMMATORIAY, 0.5));
Esempio
Riportiamo i valori della differenza di potenziale V , ottenuti facendo variare la differenza di
potenziale ai capi di un conduttore (misurata in Volt, con un errore assoluto di (0,1V) e misurando
la corrispondente intensità di corrente I (misuarta in milliampere, con un errore di 0,2Ma)
Osservando la distribuzione dei punti ci aspettiamo una relazione lineare che andiamo a calcolare
Col metodo sopra descritto
3
INFORMATICA 5ASA aprile 2015 docente Salvatore Mosaico
Dopo avere calcolato abbiamo m e q possiamo calcolare i valori teorici
INFORMATICA 5ASA aprile 2015 docente Salvatore Mosaico
Una volta ottenuta la funzione si può vedere il valore teorico calcolato
Vediamo infine alcuni esercizi
INFORMATICA 5ASA aprile 2015 docente Salvatore Mosaico
1) Pressione Arteriosa
Data una popolazione di individui si vuole stimare la relazione tra pressione arteriosa ed età.
La seguente tabella riporta i dati relativi al campionamento:
ETA'
PRESSIONE
25
120
30
125
42
135
55
140
55
145
69
180
70
160
Si ipotizza una relazione lineare tra le grandezze del tipo:
y = ax + b
Si richiede di stimare i coefficienti della retta mediante il metodo dei minimi quadrati.
2) Fatturato
La seguente tabella riporta i dati relativi al fatturato degli ultimi cinque anni di una nota
azienda di giocattoli (il fatturato è espresso in milioni di Euro):
ANNO
FATTURATO
(106 €)
1
9
2
11,2
3
9,8
4
11,8
5
14
Si determini un modello di regressione lineare semplice per prevedere l'andamento futuro del
fatturato.
6