4.4.1 Ergodicità di Processi Aleatori Stazionari

annuncio pubblicitario
4.4. PROCESSI STAZIONARI ED ERGODICI
4.4.1
77
Ergodicità di Processi Aleatori Stazionari
Il termine ergodico proviene dalle parole greche εργoν (lavoro) e oδóσ (percorso) e il suo uso nella Teoria dei Processi
Aleatori è mutuato dall’uso che se ne fa nella meccanica di Gibbs. Interpretando le determinazioni della variabile
aleatoria xn come punti in uno spazio rappresentativo del valore assunto dal generico membro xi [n] in corrispondenza
dell’indice n, percorrendo la forma d’onda xi [n] si compie una “curva di lavoro” in questo spazio. Una serie aleatoria
stazionaria si dice “ergodica” quando la curva di lavoro passa, prima o poi, in tutti i punti, con probabilità 1. In
parole povere, osservato un membro della serie equivale ad averli osservati tutti; gli altri differiscono tra loro solo per
l’ordine con il quale appaiono le varie determinazioni di xn . In questo senso, useremo dire che ciascuna realizzazione
di una serie stazionaria ed ergodica è tipica (della serie stessa). Di conseguenza, le medie temporali coincidono con
le medie d’insieme, come abbiamo avuto modo di vedere nel semplice esempio di generazione di serie aleatoria prima
illustrato.
x[n] = -1
SI (memoria zero)
100(1 - P )%
x[n] = +1
100P %
Figura 4.3: Curva di lavoro del I ordine (memoria zero) descritta da una serie aleatoria stazionaria binaria.
In Fig.4.3 è riportato un esempio di curva di lavoro del I ordine relativamente al semplice caso di serie aleatoria
binaria stazionaria, con valori ±1 e misura di probabilità pX (x) = P · δ(x − 1) + (1 − P ) · δ(x + 1). Riconosciamo
un solo stato, S descrittivo del fatto che non siamo interessati alla “storia” con la quale la serie giunge al valore
assunto in corrispondenza dell’indice n, i.e. i valori assunti dalla serie in corrispondenza di tutti gli indici fuorchè
n possono essere qualsiasi.4.9
I due rami che escono e rientrano nello stato S descrivono il “punto” toccato dalla serie in corrispondenza
dell’indice n, i.e. uno dei due valori ±1. Il “lavoro” compiuto da una generico membro della serie si svolge
percorrendo questi rami allo scorrere dell’indice n: se la serie è ergodica, il ramo x[n] = +1 sarà percorso il
100 · P % delle volte, mentre il ramo x[n] = −1 sarà percorso il 100 · (1 − P )% delle volte, da tutti i membri della
serie. Se in corrispondenza di qualche membro osservassimo un diagramma diverso da quello mostrato in Fig.4.3,
allora la serie non sarebbe ergodica.
Queste curve di lavoro si possono tracciare per diversi ordini. Un esempio di curva di lavoro del II ordine è
riportato in Fig.4.4. Poichè gli istanti di estrazione n1 = n e n2 = n − m distano m = n1 − n2 , avremo curve di
lavoro diverse al variare di m. Nel caso binario abbiamo quattro transizioni: le etichette dei rami delle transizioni
esprimono le probabilità di osservare una certa coppia x[n], x[n − m],
Se la serie è ergodica, ciascun membro della serie traccerà la stessa curva di lavoro qualsiasi sia l’ordine considerato.4.10
4.9 La
“memoria” delle serie aleatorie è misurata, in senso probabilistico, dalla densità di probabilità di osservare un generico valore x[n]
condizionatamente all’avere osservato in precedenza i valori x[n − 1], x[n − 2], · · ·. Allora, posto xn = x[n], se risulta
pXn |Xn−1 ,Xn−2 ,···(xn |xn−1 , xn−2 · · · ) = pXn |Xn−1 ,Xn−2 ,···,Xn−N (xn|xn−1 , xn−2 · · · , xn−N )
si dice che la serie è di Markov (o Markoviana) con ordine (o memoria) N . In altre parole, l’influenza probabilistica esercitata sul valore osservato
in corrispondenza all’indice n dai valori osservati in corrispondenza degli indici precedenti svanisce dopo N indici.
4.10 Non è difficile dimostrare che un diagramma relativo a un certo ordine è comprensivo di tutti i diagrammi relativi ai gradi di memoria
inferiori a quello considerato. Ad esempio, per il caso illustrato nelle Figg.4.3-4.4, saturando rispetto alla variabile aleatoria x[n − m], si calcola
P = P+1,−1 + P+1,+1 .
78
CAPITOLO 4. PROCESSI ALEATORI
x[n] = -1 e x[n - m] = +1
100P-1,1 %
x[n] = +1 e x[n - m] = +1
100P1,1 %
SII,m (memoria zero)
x[n] = -1 e x[n - m] = -1
x[n] = +1 e x[n - m] = -1
100P-1,-1 %
100P1,-1 %
Figura 4.4: Curva di lavoro del II ordine, a distanza m descritta da una serie aleatoria stazionaria binaria. P
1,1
misura la
probabilità di osservare la coppia (x[n] = +1, x[n − m] = +1), P −1,1 misura la probabilità di osservare la coppia (x[n] =
−1, x[n − m] = +1), P1,−1 misura la probabilità di osservare la coppia (x[n] = +1, x[n − m] = −1), e P −1,−1 misura la
probabilità di osservare la coppia (x[n] = −1, x[n−m] = −1).
Il lettore attento avrà notato che sulle curve di lavoro tracciate nei grafici di Figg.4.3-4.4 si effettua una misura dell’istogramma (monodimensionale in Fig.4.3 e bidimensionale in Fig.4.4) sul membro della serie che si sta
osservando. Nel caso stazionario, possiamo considerare il numero dei campioni osservato grande quanto si vuole,
considerando l’istogramma sempre più vicino alla densità di probabilità che ha governato l’emissione di quel particolare membro sotto osservazione. Appare chiaro, quindi, come la proprietà di ergodicità sia legata alla maniera nella
quale la sorgente della serie decide quale membro emettere: quando da tutti i membri otteniamo sempre lo stesso
istogramma, la serie è ergodica.4.11
4.4.2
Sorgenti Riducibili ed Ergodicità di Processi Stazionari
Supponiamo che la generazione delle varie realizzazioni di processo aleatorio stazionario avvenga da parte di una
sorgente S, strutturata in N sottosorgenti S1 , · · · , SN , stazionarie e statisticamente indipendenti. Quando la sorgente
S deve emettere una forma d’onda, essa dapprima sceglie una sottosorgente Sk e poi lascia il compito dell’emissione
proprio alla sottosorgente individuata in precedenza.
Le sorgenti strutturate nel modo sopra descritto si dicono sorgenti riducibili (in sottosorgenti, appunto). Naturalmente, un processo aleatorio generato da una sorgente riducibile è stazionario. Per esempio, limitando la discussione
(S )
al primo ordine, sia pX k (x) la densità di probabilità associata alla sottosorgente Sk . Allora, nel caso in cui la
scelta della sottorgente avvenga in modo aleatorio con probabilità
Pk
di scelta per la sottosorgente Sk , la densità di
probabilità del processo si scrive
pX (x) =
N
Pk · p(S
k)
X
(x)
k=1
(S )
poichè le singole pX k (x) non dipendono dall’instante di estrazione, così sarà anche per la pX (x).
Altrettanto evidente è che un processo aleatorio generato da una sorgente riducibile non può essere anche ergodico.
Infatti, una certa realizzazione potrà essere tipica solo della sottosorgente stazionaria che l’ha generata, vedi Fig.4.5.
4.11 I
diagrammi con le curve di lavoro presentano complessità crescente all’aumentare del numero di valori assumibili dalla serie aleatoria e con
l’ordine considerato. Anche se questi diagrammi non possono essere più tracciati quando la variabile indipendente è il tempo continuo t, e/o quando
i valori della serie sono assunti sull’insieme continuo dei numeri reali R, essi continuano a svolgere un ruolo importante per la comprensione del
concetto di ergodicità.
4.4. PROCESSI STAZIONARI ED ERGODICI
L
S1
S2
S3
Sk
L
S
79
L
xia Sk f[n]
L
L
L
L
xia Sk f[n]
realizzazione tipica
della sola sottosorgente Sk
Sk
Figura 4.5: Sorgente riducibile.
Si possono dimostrare le seguenti due affermazioni:
Proposizione 4.1 Le realizzazioni emesse da una sorgente stazionaria singola (non riducibile), sono membri di
un processo stazionario ed ergodico.
Proposizione 4.2 Se un processo stazionario non é ergodico, allora esso é necessariamente generato da una
sorgente riducibile.
Scarica