16/05/2011 In Statistica e in genere nelle scienze sperimentali, si studiano o si osservano “relazioni” fra grandezze Di solito, i punti osservati si dispongono su un diagramma chiamato diagramma a dispersione: Per esempio si può pensare allo studio della relazione fra reddito e risparmio di una popolazione oppure alla relazione tra altezza e peso dei militari, ecc. Definizione: Partendo da queste coppie di dati (x, y), si vuole determinare la funzione y = f(x) per interpolazione si intende la ricerca di una funzione matematica che approssima l’andamento di un insieme di punti che descrive il fenomeno 1 16/05/2011 Per trovare la funzione si può procedere in due modi: 1)determinare la funzione che assuma esattamente i punti (x, y) osservati (interpolazione per punti noti, o interpolazione matematica); 2) determinare la funzione che si accosti il più possibile ai punti (x, y) osservati (interpolazione fra punti noti, o interpolazione statistica). Si parla di interpolazione statistica (o interpolazione attraverso i punti) quando si intende rappresentare in maniera sintetica una relazione funzionale tra due (o più) variabili statistiche attraverso una funzione f(x). Questa funzione non ha l’obiettivo di passare per tutti i punti, ma di rappresentare “al meglio”, anche se in via sintetica, la relazione esistente tra i due caratteri X e Y. TIPI DI INTERPOLAZIONE Interpolazione MATEMATICA Calcola una funzione che passa PER tutti i punti una funzione che sia in grado di interpolare (cioè “di passare”) per tutti i punti disponibili in un piano cartesiano. In statistica, il termine interpolazione assume un diverso significato. Interpolazione STATISTICA Calcola una funzione che passa FRA i punti Obiettivo dell’interpolazione Gli scopi per cui si cerca una funzione di interpolazione statistica sono: •Descrivere sinteticamente la relazione fra due variabili osservate; •Determinare la legge di distribuzione dei dati statistici; •Ricavare eventuali dati intermedi mancanti; •Correggere valori affetti da errori accidentali o perturbati da cause secondarie. 2 16/05/2011 INTERPOLAZIONE STATISTICA A CHE COSA SERVE ? inserimento di uno o più dati in una serie che presenta vuoti ESTRAPOLAZIONE (valutazione di valori esterni alla serie dei dati). PEREQUAZIONE (livellazione o “regolazione” dei dati di una serie non regolare attraverso la “sostituzione” al posto dei dati rilevati, di dati ottenuti dalla funzione matematica trovata) → cioè una correzione Mentre nella interpolazione matematica la funzione interpolante deve passare per tutti i punti sperimentali, nell’interpolazione statistica la funzione passa attraverso i punti osservati. della distribuzione per ridurre delle misure che sono eccessivamente diverse dalle altre L’interpolazione statistica viene utilizzata quando il numero di punti sperimentali è elevato E’ necessario che la funzione interpolante passi il più vicino possibile ai valori interpolati. Ci sono vari metodi per attuare ciò, ma il più usato è quello dei minimi quadrati 6 5 Y 4 3 2 1 0 0 1 2 3 4 5 6 X 3 16/05/2011 Questo metodo consiste nel determinare i parametri della funzione interpolante prescelta in modo che sia minima la somma dei quadrati degli scostamenti dei punti dalla funzione La condizione di accostamento è dunque la seguente: La funzione teorica può assumere differenti aspetti RETTA PARABOLA n ∑(y i =1 − yˆ i ) ⇒ minima 2 i yi FUNZIONE ESPONENZIALE ŷ xi FUNZIONE INTERPOLANTE: RETTA Utilizzando il metodo di Cramer si giunge alle soluzioni del sistema Ŷ = bx + a i parametri da determinare sono quindi a e b n f (a, b ) = ∑ ( yi − bxi − a ) ⇒ minima 2 i =1 Questa è una funzione a due variabili di cui occorre trovare il minimo Si procede con la soluzione del sistema che pone le derivate parziali prime uguali a zero per la ricerca di eventuali punti critici: f 'b = 2∑ ( yi − bxi − a) ⋅ xi = 0 f 'a = 2∑ ( yi − bxi − a) ⋅1 = 0 ∑ y i ⋅ ∑ xi 2 − ∑ xi y i ⋅ ∑ xi a = 2 n ∑ xi − ( ∑ xi ) 2 n∑ x y − ∑ x ⋅ ∑ y i i i i b = 2 2 − n x ( x ) ∑ ∑ i i b ∑ xi 2 + a ∑ xi = ∑ xi yi b ∑ xi + na = ∑ yi 4