Note sui metodi SE e SET

annuncio pubblicitario
1
Metodo di Smorzamento Esponenziale (SE)
Indichiamo con x (t) il dato storico al tempo t, e con p (t) la previsione relativa
al tempo t (e¤ettuata in precedenza). Così p (t + 1) sarà la previsione relativa
al tempo t + 1, e così via.
E’ utile pensare che t sia il tempo presente, t + 1 il futuro (primo tempo
futuro), t 1 il passato (ultimo tempo prima del presente).
Il Metodo di Smorzamento Esponenziale sceglie come previsione p (t + 1) del
futuro una media pesata tra la previsione p (t) del presente, fatta in precedenza,
ed il valore attuale x (t) della serie storica:
p (t + 1) = x (t) + (1
) p (t) :
Il parametro è (di solito) compreso tra 0 ed 1.
Se = 1, signi…ca che decidiamo come previsione futura il valore odierno:
p (t + 1) = x (t), cioè la pura ripetizione del presente. Se ad esempio la serie x ha
delle oscillazioni, queste vengono riprodotte esattamente, in ritardo di un’unità
temporale.
Se = 0, vale p (t + 1) = p (t), quindi p (t + 1) = p (t) = ::: = p (1), cioè la
previsione è costante. Scegliamo come previsione una costante (nella migliore
delle ipotesi la media dei dati). Ignoriamo ogni struttura ulteriore, ogni variazione.
Se invece prendiamo 2 (0; 1), mediamo tra questi due estremi: otterremo
una previsione meno oscillante dei dati reali, ma non del tutto costante, lievemente concorde con l’ultimo dato.
La prvisione p (t + 1) è una media pesata tra un valore conservativo, p (t),
ed uno innovativo, x (t).
Un’ulteriore interpretazione viene dalla formula che si ottiene applicando la
ricorsione:
p (t + 1)
=
=
=
x (t) + (1
x (t) + (1
x (t) + (1
) p (t)
) ( x (t
) ( x (t
1) + (1
1) + (1
) p (t 1))
) ( x (t 2) + (1
) p (t
2)))
ecc. che si riscrive
p (t + 1) = x (t) +
(1
) x (t
1) +
(1
2
) x (t
2) + :::
Vediamo che la previsione futura è una media pesata di tutti i valori passati,
con pesi che descrescono esponenzialmente (da qui il nome SE). Si sceglie come
previsione una media pesata che dà più importanza agli ultimi valori rispetto ai
precedenti. Quanta più importanza, lo decide ( vicino ad 1 vuol dire molta
più importanza ai valori più recenti).
Per certi versi somiglia ad un AR, ma l’ordine p è teoricamente in…nito (anche
se i pesi esponenziali diventano insigni…canti dopo un certo punto in poi), e la
struttura dei pesi è …ssata, dipendente solo da un parametro, , invece che da
p parametri indipendenti.
1
Difetto certo: se la serie storica x (t) ha un trend, per
= 0 il metodo
darebbe una costante, pessima previsione; per = 1, viceversa fa il meglio che
può, ma può solo inseguire il trend in ritardo di un’unità temporale (si pensi a
due rette parallele).
2
Metodo di Smorzamento Esponenziale con Trend
(SET)
Indichiamo sempre con x (t) il dato storico al tempo t e con p (t) la previsione
relativa al tempo t. L’idea ora è di avere un comportamento rettilineo (trend
lineare), almeno localmente. Se siamo al tempo t, il presente, la previsione
dei valori futuri p (t + 1), p (t + 2), ecc., in generale p (t + i), con i = 1; 2; ecc.
decisiamo che sia data dalla formula
p (t + i) = m (t) i + s (t)
(equazione della retta di coe¢ ciente angolare m (t) ed intercetta s (t). E’utile
pensare che l’asse delle ordinate sia collocato al tempo t, per farsi un’idea gra…ca.
L’idea di far dipendere m e s dal tempo è basilare: vogliamo sì una previsione
con trend lineare, ma dobbiamo poterla modi…care nel tempo, se il trend cambia.
Mentre nel metodo precedente legavamo i valori futuri di p a quelli passati,
ora leghiamo i valori futuri delle grandezze ausiliarie m ed s a quelli passati.
Continuiamo ad usare una logica di media pesata tra un valore conservativo ed
uno innovativo. Per il oe¢ ciente angolare m la prima idea che viene in mente è
m (t) =
(x (t)
x (t
1)) + (1
) m (t
1)
media pesata tra il valore conservativo m (t 1) e quello innovativo x (t)
x (t 1), che è la pendenza osservata sui dati dell’ultimo periodo. Ma così ci si
espone troppo alle ‡uttuazioni casuali dei dati: la pendenza x (t) x (t 1) può
deviare marcatamente dall “pendenza media” dell’ultimo periodo. Serve una
grandezza simile a x (t) x (t 1) ma più stabile, meno esposta alle ‡uttuazioni
causali. Essa è s (t) s (t 1), come capiremo tra un momento.
Veniamo alla ricorsione per s (t). Se disegnamo un gra…co con due assi
verticali delle ordinate, uno al tempo t 1 ed uno al tempo t, vediamo che
l’intercetta al tempo t non deve essere simile all’intercetta al tempo t 1 ma
al valore sulla retta m (t 1) i + s (t 1). I due istanti t 1 e t distano di
un’unità, quindi s (t) è giusto che sia legata a m (t 1) + s (t 1) (cioè i = 1).
Questa è la parte conservativa della ricorsione. La parte innovativa è dire che
s (t) deve essere legato al valore vero x (t). Quindi s (t) sarà una media pesata
tra x (t) e m (t 1) + s (t 1). In conclusione, le due equazioni ricorsive sono:
s (t) =
m (t) =
x (t) + (1
) (m (t 1) + s (t 1))
(s (t) s (t 1)) + (1
) m (t 1) :
In pratica è necessario calcolare prima s (t) dalla prima equazione, per poterlo
sostituire nella seconda.
2
Vediamo che il metodo è proprio innovativo rispetto a SE ed anche agli AR.
Il metodo è ottimo per catturare i trend. Ma se c’è anche un’evidente periodicità, il metodo non riesce a riconoscerla come tale, quindi la insegue come se
fosse una modi…ca continua del trend, e commette troppi errori.
3
Inizializzazione
Le equazioni per ricorrenza vanno inizializzate. Supponiamo che la serie temporale x (t) parta da t = 1. Per SE, si tratta di stabilire p (1), la previsione al
primo istante temporale. In questo modo, se ci troviamo al tempo t = 1 (nostro
presente) e conosciao quindi x (1), potremo poi calcolare la previsione futura
p (2):
p (2) = x (1) + (1
) p (1) :
Quando poi ci troveremo al tempo t = 2, che sarà diventato il nostro presente,
conosceremo x (2) e potremo calcolare la previsione futura p (3):
p (3) = x (2) + (1
) p (2) :
E così via. Il valore di inizializzazione p (1) è abbastanza casuale da scegliere.
Per semplicità si può prendere ad esempio p (1) = x (1).
Per SET, se ci troviamo al tempo t = 1 e vogliamo calcolare le previsioni
p (1 + i), i = 1; 2; ::: servono i valori m (1) e s (1). Vista la natura di s descritta
sopra (si pensi al gra…co con l’asse verticale per t = 1), è naturale prendere
s (1) = x (1). La pendenza iniziale però è indecidibile senza vedere il futuro,
quindi scegliamo m (1) = 0, salvo abbiamo informazioni diverse di tipo previsivo.
Fatte queste scelte, possiamo calcolare le previsioni
p (1 + i) = m (1) i + s (1) ;
i = 1; 2; :::
Poi il tempo t = 2 diventerà il nostro presente. Calcoleremo m (2) e s (2) con le
formule (ora x (2) è noto)
s (2) =
m (2) =
x (2) + (1
) (m (1) + s (1))
(s (2) s (1)) + (1
) m (1)
da usarsi nell’ordine scritto. Avendo calcolato m (2) e s (2), la previsione del
futuro è
p (2 + i) = m (2) i + s (2) ;
i = 1; 2; :::
Si noti che il valore
p (1 + 2) = m (1) 2 + s (1)
calcolato al tempo t = 1 ed il valore
p (2 + 1) = m (2) 1 + s (2)
sono entrambe delle previsioni relative al tempo t = 3. Ci …deremo ovviamente
più della seconda, in quanto basata su più dati. per così dire, m (2) 1 + s (2)
3
è una sorta di aggiornamento di m (1) 2 + s (1). Lo stesso vale per i valori
successivi.
Si può inizializzare SET in un secondo modo: attendere alcuni istanti in più
prima di iniziare la previsione, ed utilizzarli per calcolare una retta di regressione, da usarsi come stima iniziale della pendenza. Chiaramente, più è lungo il
periodo iniziale che attendiamo, più è precisa la stima della pendenza, quindi le
previsioni inizieranno molto megli che con la semplice posizione m (1) = 0. Ma è
anche vero che, se iniziamo all’istante iniziale con m (1) = 0, dopo alcuni istanti
questa anomalia sarà stata automaticamente aggiustata dal metodo, tramite le
iterazioni che correggono di volta in volta m tramite i valori degli incrementi
s (t) s (t 1). Quindi alla …ne le cose si equivalgono abbastanza: i primi istanti
o non vengono proprio previsti oppure sono previsti un po’ male; i successivi
vengono previsti piuttosto bene.
4
Scarica