4.4. PROCESSI STAZIONARI ED ERGODICI 4.4.1 77 Ergodicità di Processi Aleatori Stazionari Il termine ergodico proviene dalle parole greche εργoν (lavoro) e oδóσ (percorso) e il suo uso nella Teoria dei Processi Aleatori è mutuato dall’uso che se ne fa nella meccanica di Gibbs. Interpretando le determinazioni della variabile aleatoria xn come punti in uno spazio rappresentativo del valore assunto dal generico membro xi [n] in corrispondenza dell’indice n, percorrendo la forma d’onda xi [n] si compie una “curva di lavoro” in questo spazio. Una serie aleatoria stazionaria si dice “ergodica” quando la curva di lavoro passa, prima o poi, in tutti i punti, con probabilità 1. In parole povere, osservato un membro della serie equivale ad averli osservati tutti; gli altri differiscono tra loro solo per l’ordine con il quale appaiono le varie determinazioni di xn . In questo senso, useremo dire che ciascuna realizzazione di una serie stazionaria ed ergodica è tipica (della serie stessa). Di conseguenza, le medie temporali coincidono con le medie d’insieme, come abbiamo avuto modo di vedere nel semplice esempio di generazione di serie aleatoria prima illustrato. x[n] = -1 SI (memoria zero) 100(1 - P )% x[n] = +1 100P % Figura 4.3: Curva di lavoro del I ordine (memoria zero) descritta da una serie aleatoria stazionaria binaria. In Fig.4.3 è riportato un esempio di curva di lavoro del I ordine relativamente al semplice caso di serie aleatoria binaria stazionaria, con valori ±1 e misura di probabilità pX (x) = P · δ(x − 1) + (1 − P ) · δ(x + 1). Riconosciamo un solo stato, S descrittivo del fatto che non siamo interessati alla “storia” con la quale la serie giunge al valore assunto in corrispondenza dell’indice n, i.e. i valori assunti dalla serie in corrispondenza di tutti gli indici fuorchè n possono essere qualsiasi.4.9 I due rami che escono e rientrano nello stato S descrivono il “punto” toccato dalla serie in corrispondenza dell’indice n, i.e. uno dei due valori ±1. Il “lavoro” compiuto da una generico membro della serie si svolge percorrendo questi rami allo scorrere dell’indice n: se la serie è ergodica, il ramo x[n] = +1 sarà percorso il 100 · P % delle volte, mentre il ramo x[n] = −1 sarà percorso il 100 · (1 − P )% delle volte, da tutti i membri della serie. Se in corrispondenza di qualche membro osservassimo un diagramma diverso da quello mostrato in Fig.4.3, allora la serie non sarebbe ergodica. Queste curve di lavoro si possono tracciare per diversi ordini. Un esempio di curva di lavoro del II ordine è riportato in Fig.4.4. Poichè gli istanti di estrazione n1 = n e n2 = n − m distano m = n1 − n2 , avremo curve di lavoro diverse al variare di m. Nel caso binario abbiamo quattro transizioni: le etichette dei rami delle transizioni esprimono le probabilità di osservare una certa coppia x[n], x[n − m], Se la serie è ergodica, ciascun membro della serie traccerà la stessa curva di lavoro qualsiasi sia l’ordine considerato.4.10 4.9 La “memoria” delle serie aleatorie è misurata, in senso probabilistico, dalla densità di probabilità di osservare un generico valore x[n] condizionatamente all’avere osservato in precedenza i valori x[n − 1], x[n − 2], · · ·. Allora, posto xn = x[n], se risulta pXn |Xn−1 ,Xn−2 ,···(xn |xn−1 , xn−2 · · · ) = pXn |Xn−1 ,Xn−2 ,···,Xn−N (xn|xn−1 , xn−2 · · · , xn−N ) si dice che la serie è di Markov (o Markoviana) con ordine (o memoria) N . In altre parole, l’influenza probabilistica esercitata sul valore osservato in corrispondenza all’indice n dai valori osservati in corrispondenza degli indici precedenti svanisce dopo N indici. 4.10 Non è difficile dimostrare che un diagramma relativo a un certo ordine è comprensivo di tutti i diagrammi relativi ai gradi di memoria inferiori a quello considerato. Ad esempio, per il caso illustrato nelle Figg.4.3-4.4, saturando rispetto alla variabile aleatoria x[n − m], si calcola P = P+1,−1 + P+1,+1 . 78 CAPITOLO 4. PROCESSI ALEATORI x[n] = -1 e x[n - m] = +1 100P-1,1 % x[n] = +1 e x[n - m] = +1 100P1,1 % SII,m (memoria zero) x[n] = -1 e x[n - m] = -1 x[n] = +1 e x[n - m] = -1 100P-1,-1 % 100P1,-1 % Figura 4.4: Curva di lavoro del II ordine, a distanza m descritta da una serie aleatoria stazionaria binaria. P 1,1 misura la probabilità di osservare la coppia (x[n] = +1, x[n − m] = +1), P −1,1 misura la probabilità di osservare la coppia (x[n] = −1, x[n − m] = +1), P1,−1 misura la probabilità di osservare la coppia (x[n] = +1, x[n − m] = −1), e P −1,−1 misura la probabilità di osservare la coppia (x[n] = −1, x[n−m] = −1). Il lettore attento avrà notato che sulle curve di lavoro tracciate nei grafici di Figg.4.3-4.4 si effettua una misura dell’istogramma (monodimensionale in Fig.4.3 e bidimensionale in Fig.4.4) sul membro della serie che si sta osservando. Nel caso stazionario, possiamo considerare il numero dei campioni osservato grande quanto si vuole, considerando l’istogramma sempre più vicino alla densità di probabilità che ha governato l’emissione di quel particolare membro sotto osservazione. Appare chiaro, quindi, come la proprietà di ergodicità sia legata alla maniera nella quale la sorgente della serie decide quale membro emettere: quando da tutti i membri otteniamo sempre lo stesso istogramma, la serie è ergodica.4.11 4.4.2 Sorgenti Riducibili ed Ergodicità di Processi Stazionari Supponiamo che la generazione delle varie realizzazioni di processo aleatorio stazionario avvenga da parte di una sorgente S, strutturata in N sottosorgenti S1 , · · · , SN , stazionarie e statisticamente indipendenti. Quando la sorgente S deve emettere una forma d’onda, essa dapprima sceglie una sottosorgente Sk e poi lascia il compito dell’emissione proprio alla sottosorgente individuata in precedenza. Le sorgenti strutturate nel modo sopra descritto si dicono sorgenti riducibili (in sottosorgenti, appunto). Naturalmente, un processo aleatorio generato da una sorgente riducibile è stazionario. Per esempio, limitando la discussione (S ) al primo ordine, sia pX k (x) la densità di probabilità associata alla sottosorgente Sk . Allora, nel caso in cui la scelta della sottorgente avvenga in modo aleatorio con probabilità Pk di scelta per la sottosorgente Sk , la densità di probabilità del processo si scrive pX (x) = N Pk · p(S k) X (x) k=1 (S ) poichè le singole pX k (x) non dipendono dall’instante di estrazione, così sarà anche per la pX (x). Altrettanto evidente è che un processo aleatorio generato da una sorgente riducibile non può essere anche ergodico. Infatti, una certa realizzazione potrà essere tipica solo della sottosorgente stazionaria che l’ha generata, vedi Fig.4.5. 4.11 I diagrammi con le curve di lavoro presentano complessità crescente all’aumentare del numero di valori assumibili dalla serie aleatoria e con l’ordine considerato. Anche se questi diagrammi non possono essere più tracciati quando la variabile indipendente è il tempo continuo t, e/o quando i valori della serie sono assunti sull’insieme continuo dei numeri reali R, essi continuano a svolgere un ruolo importante per la comprensione del concetto di ergodicità. 4.4. PROCESSI STAZIONARI ED ERGODICI L S1 S2 S3 Sk L S 79 L xia Sk f[n] L L L L xia Sk f[n] realizzazione tipica della sola sottosorgente Sk Sk Figura 4.5: Sorgente riducibile. Si possono dimostrare le seguenti due affermazioni: Proposizione 4.1 Le realizzazioni emesse da una sorgente stazionaria singola (non riducibile), sono membri di un processo stazionario ed ergodico. Proposizione 4.2 Se un processo stazionario non é ergodico, allora esso é necessariamente generato da una sorgente riducibile.