Metodo Monte Carlo - Iac-Cnr

annuncio pubblicitario
Laboratorio
Processi Stocastici
Annalisa Pascarella
Istituto per le Applicazioni del Calcolo "M. Picone"
Consiglio Nazionale delle Ricerche
Roma
Informazioni

e-mail:




webpage




[email protected]
[email protected]
[email protected]
www.dima.unige.it/~pascarel/
Giovedì 10 Novembre PC2 12-14
Venerdì 11 Novembre PC2 11-13
Lunedì 5 Dicembre PC2 14-16
Programma

MATLAB


MCMC




esercizi vari durante il laboratorio
metodi Monte Carlo,
algoritmi per la generazione di numeri pseudo-casuali
Metropolis-Hastings
Simulazione processo di Poisson
MATLAB
MATLAB


MATrix LABoratory
Linguaggio di programmazione interpretato


legge un comando per volta eseguendolo immediatamente
Per avviarlo ->
icona sul desktop
workspace
command
window
MATLAB come calcolatrice
4+7
invio
è possibile definire
variabili e operare su esse
x = 9 -> invio
Operatori aritmetici:
Caratteri speciali: ; % :
help mean
+-*/^
Variabili predefinite: i, pi, NaN, Inf
Funzioni elementari: sin, cos, log, exp
Comandi utili

clear a


clear all


ultima variabile memorizzata
clc


per cancellare tutte le variabili dal workspace
ans


per cancellare una variabile dal workspace
pulisce lo schermo
help <nome_funzione>
Lavorare con MATLAB

In MATLAB tutte le variabili sono trattate come matrici




scalari
vettori riga
v = (v1,…, vn)
vettori colonna
v = (v1,…, vn)T
matrici
 a11  a1n 


A


 a a 
 m1
mn 
->
->
matrici 1 x 1
matrici 1 x n
->
matrici n x 1
->
matrici m x n
Vettori

Per definire un vettore riga

Per definire un vettore colonna

Usando :
a = [1 2 3 4 5]
a = [1, 2, 3, 4, 5]
a = [1; 2; 3; 4; 5]
a = [1 2 3 4 5] ’
a = 1:3:10
b = -5:5
Matrici

Per definire una matrice
size(A)


->
3 0
  R 22
A  
1 2 
dimensioni della matrice
per memorizzare le dimensioni
 3 0 3
  R 23
B  
1 2 0 
B(2,3)
B(2,3) = 1;
B
•
•
•
A = [3 0; 1 2]
A = [3 0
1 2]
per selezionare un elemento
per modificare l’elemento
per visualizzare B
-> [r c] = size(A)
b1 = [3;1]
b2 = [0; 2]
b3 = [3; 0]
B = [b1, b2, b3]
Il comando :

Importante per la manipolazione delle matrici

generazione di vettori che siano delle progressione aritmetiche di passo
costante





a = [1:10]
b = 1: .2 : 4
c = 3:0 ->
c = 3: -1: 1
o
a = 1:10
non produce niente!!!!
mediante : si possono estrarre righe e colonne
 3 0 3
  R 23
B  
1 2 0 
estrarre la riga R2
B(2,:)
estrarre la colonna C2
B(:,2)
Identità-zero-uno
identità di ordine n
matrice nulla m x n
matrice m x n di 1
->
eye(n)
eye(3)
1 0 0 


I  0 1 0
 0 0 1


->
zeros(m,n)
zeros(2,3)
0 0 0

Z  
0 0 0
->
ones(m,n)
ones(2,3)
1 1 1

Z  
1 1 1
Operazioni
Somma / Differenza
A+B, A-B
Trasposta
A’
Prodotto
A*B
Prodotto per uno scalare
A*k
Elemento per elemento
A.*B
size(A)= size(B)
#CA = #RB
size(A) = size(B)
Script e funzioni

Script



parametri in ingresso non modificabili
le variabili usate sono messe nella memoria di lavoro di MATLAB
Funzioni


script al quale si possono passare parametri in ingresso ed ottenerne in uscita
sintassi



y1,…,yn -> parametri in uscita
x1,…,xn –> parametri in entrata
le variabili usate all’interno sono locali
function [y1,…,yn] = nome_funzione(x1,…,xn)
Script

E’ possibile scrivere degli script in Matlab


cliccando su new
File -> New -> M-file
Le funzioni

L’m file va salvato col nome nome_funzione.m


La funzione può essere richiamata




il nome del file deve essere identico a quello della funzione
dalla finestra di comando
all’interno di uno script
da altre funzioni
digitando [y1,…,yn]=nome_funzione(x1,…,xn)
Per poter richiamare la funzione dobbiamo essere nella directory
nella quale è salvata la funzione oppure “settare” nel path di Matlab
la directory nella quale la funzione è salvata.
Cicli



Ciclo incondizionato
for i = n1:passo:n2
blocco di istruzioni
end
Ciclo condizionato
while condizione
blocco di istruzioni
end
Test condizionale
if condizione1
blocco di istruzioni
elseif condizione2
blocco di istruzioni
else
blocco di istruzioni
end
Operatori

Operatori relazionali:


< , <= , > , >= , == , = , =
si usano per confrontare tra di loro gli elementi di 2 matrici; il risultato
dell’operazione sarà



Operatori logici:



0 se la relazione è falsa
1 se la relazione è vera
&,|,
si usano per combinare tra loro gli operatori relazionali
Nota


= serve per assegnare valore ad una variabile
== per verificare se una variabile assume un determinato valore
Input\output


input
sprintf
n = input(‘inserisci un intero ’);
disp(sprintf(‘n = %d’,n))
disp(‘stringa di caratteri’)
Grafica

In MATLAB è possibile



disegnare funzioni in 2D e 3D
rappresentare graficamente dei dati
Il comando
plot(x,y)
si usa:



per rappresentare punti nel piano
per disegnare il grafico di una funzione
x e y devono essere vettori di ugual misura
Esempio - I

Per rappresentare dei punti nel piano
x = [1 2 3 7 -9 2];
y = [-2 -6 1 5 7 2];
plot(x,y)
figure(2)
plot(x,y,'*')
Esempio - II

Per “plottare” la funzione y=sin(x)
x = [-pi:.01:pi];
y = sin(x);
plot(x,y)
definiamo l’intervallo in
cui vogliamo disegnare la
funzione
definiamo la funzione
disegniamo la funzione
figure(2)
plot(x,y, '-g')
è possibile inserire un
terzo parametro di input
Sintassi del comando “plot”

plot(x, y)

x e y sono i vettori dei dati (ascisse e ordinate dei punti)
 plot(x, y, 'opzioni')

x e y come sopra; opzioni è una stringa opzionale che definisce il tipo di
colore, di simbolo e di linea usato nel grafico.


help plot per vedere quali sono le varie opzioni
plot(y)

realizza il grafico del vettore y rispetto ai propri indici
Comandi utili - I



figure(num)
per creare (richiamare) una finestra grafica
hold on
per avere più grafici nella stessa finestra
hold off per disattivare la funzione

axis([xmin xmax ymin ymax])
per riscalare il grafico

sublot(righe, colonne, sottofinestra)
per creare diversi grafici separati

in una stessa finestra
esistono diversi comandi per “abbellire” i grafici

title, xlabel, ylabel, legend
Risultati
usando hold on
figure(1); hold on; grid on
y2 = cos(x);
plot(x,y2,’r’)
title(‘seno e coseno’)
% creiamo delle sottofinestre
figure(3); subplot(1,2,1); plot(x,y); title('seno')
subplot(1,2,2); plot(x,y2); title('coseno')
usando subplot
Esercizio
Scrivere una funzione che crei
l’istogramma di un vettore
Caricare il vettore dei dati nella variabile
“data”:
data = load(‘dato_per_istogramma.dat’);
size(data)
Osserviamo i dati
plot(data)
plot(data, ones(size(data)) , ’ . ’)
Algoritmo istogramma
Scelta degli estremi e della larghezza intervallo
INF
DELTA
Contiamo quanti elementi del vettore cadono in
ogni intervallo: creiamo un vettore il cui valore
i-esimo rappresenti il numero di conteggi nell’iesimo intervallo
SUP
Algoritmo istogramma
Per ogni elemento del vettore data(i)
Per ogni intervallo
Se data(i) è compreso nei valori dell’intervallo
Incrementare il contatore relativo a quell’intervallo
INF
DELTA
SUP
Il j-esimo intervallo ha come estremi INF+(j-1)*DELTA e INF+j*DELTA
Algoritmo istogramma
INF = -4;
SUP = 4;
DELTA = 0.4;
NUM_INT = (SUP-INF)/DELTA; % numero di intervalli
contatore = zeros(1,NUM_INT) % inizializziamo il contatore;
for i = 1:size(data,2) % per ogni dato
for j = 1: NUM_INT % per ogni intervallo
if data(i)>INF+(j-1)*DELTA && data(i)<INF+j*DELTA
contatore(j) = contatore(j)+1;
end
end
end
VALORI = INF+DELTA/2 : DELTA : SUP-DELTA/2
figure
bar(VALORI, contatore)
Algoritmo istogramma (efficiente)
L’algoritmo appena scritto fa un ciclo di troppo...
INF
SUP
1
2
k
Osserviamo che il singolo valore data(i)
INF < data(i) < SUP
0 < data(i)-INF < SUP-INF=DELTA*NUM_INT
0 < (data(i)-INF)/DELTA < NUM_INT
Algoritmo istogramma (efficiente)
INF = -4;
SUP = 4;
DELTA = 0.4;
NUM_INT = (SUP-INF)/DELTA; % numero di intervalli
contatore = zeros(1,NUM_INT) % inizializziamo il contatore;
for i = 1:size(data,2) % per ogni dato
j = ceil((data(i)-INF)/DELTA);
contatore(j) = contatore(j) + 1;
end
VALORI = INF+DELTA/2 : DELTA : SUP-DELTA/2
figure
bar(VALORI, contatore)
Istogrammi e MATLAB
Esiste un comando che fa l’istogramma delle frequenze dei valori di
un vettore
data = load(‘dato_per_istogramma.dat’)
hist(data)
hist(data,50)
istogramma in 50 intervalli
[counts bins] = hist(data,50)
i conteggi in counts, i punti medi degli
intervalli in bins
Metodi Monte Carlo
Un po’ di storia

I numeri casuali sono utilizzati per costruire simulazioni di
natura probabilistica di




fenomeni fisici: reattori nucleari, traffico stradale, aerodinamica
problemi decisionali e finanziari: econometria, previsione Dow-Jones
informatica: rendering, videogiochi
Il legame che esiste tra il gioco e le simulazioni probabilistiche è
sottolineato dal fatto che a tali simulazioni è dato il nome di
metodi Monte Carlo

l’idea di utilizzare in modo sistematico simulazioni di tipo probabilistico
per risolvere un problema di natura fisica viene generalmente attribuita al
matematico polacco Ulam, uno dei personaggi chiave nel progetto
americano per la costruzione della bomba atomica durante la II guerra
mondiale)
Cos’è un numero casuale?


Lancio di un dado: l’imprevedibilità del numero
ottenuto come punteggio conferisce allo stesso
una forma di casualità
Diversi metodi per generare numeri casuali


hardware
calcolatore: il calcolatore è un oggetto puramente
deterministico e quindi prevedibile, per cui nessun
calcolatore è in grado di generare numeri puramente
casuali, ma solo numeri pseudo-casuali ossia numeri
generati da algoritmi numerici deterministici in grado di
superare una serie di test statistici che conferiscono a tali
numeri un’apparente casualità
Criteri

I fattori che determinano l’accettabilità di un metodo sono
essenzialmente i seguenti:





i numeri della sequenza generata devono essere uniformemente distribuiti
(cioè devono avere la stessa probabilità di presentarsi);
i numeri devono risultare statisticamente indipendenti;
la sequenza deve poter essere riprodotta;
la sequenza deve poter avere un periodo di lunghezza arbitraria;
il metodo deve poter essere eseguito rapidamente dall’elaboratore e deve
consumare poco spazio di memoria.
La generazione dei numeri casuali è troppo importante per essere
lasciata al caso…
(J.Von Neumann)
Generatori

Metodo middle-square



genera numeri pseudo-casuali distribuiti in modo uniforme
in tale distribuzione uniforme ogni possibile numero in un determinato
intervallo è ugualmente probabile
Il metodo LCG ha bisogno di un seme per generare la sequenza
di numeri pseudo-casuiali secondo la seguente regola
deterministica
xn+1


= (axn+c)mod
m,
con a,c ed m opportuni numeri interi costanti
xn+1 assume valori compresi tra 0, …, m-1
n>=0
Generatori e MATLAB


I generatori di numeri casuali più recenti non sono basati sul
metodo LCG, ma sono una combinazione di operazioni di
spostamento di registri e manipolazione sui bit che non
richiedono nessuna operazione di moltiplicazione o divisione.
Questo nuovo approccio risulta estremamente veloce e
garantisce periodi incredibilmente lunghi
Nelle ultime versioni di MATLAB il periodo è 21492


un milione di numeri casuali al secondo richiederebbe 10435 anni prima di
ripetersi!
data la coincidenza dell’esponente con la data della scoperta dell’America
questo generatore è comunemente chiamato il “generatore di Cristoforo
Colombo”
rand


La funzione rand genera una successione di numeri casuali
distribuiti uniformemente nell’intervallo (0,1)
La sintassi di tale funzione è
rand(n,m)
che genera una matrice n x m di numeri casuali distribuiti
uniformemente

Per vedere gli algoritmi utilizzati da MATLAB


help rand
Una volta avviato MATLAB, il primo numero casuale generato è
sempre lo stesso: 0.95012928514718 come anche la successione
di numeri casuali

rand(‘state’,0)
Metodo Monte Carlo


Vengono denominate le tecniche che utilizzano variabili casuali
per risolvere vari problemi, anche non di natura aleatoria.
Vediamo l’approccio generale: supponiamo che un problema si
riconduca al calcolo di un integrale
1
   g (u )du
0
Sia U la variabile casuale uniforme, allora
1
   g (u )du  Eg (U )
0
Metodo Monte Carlo

Siano U1, …, Uk variabili casuali i.i.d. come U allora g(U1 ), …,
g(Uk ) sono variabili casuali i.i.d. aventi come media 
k
g (U i )
 Eg (U )   ,

k
i 1
per
k 
Metodo Monte Carlo

N
L’idea è quella di estrarre un insieme i.i.d. di campioni X i i 1 da
una pdf target p definita su uno spazio a grandi dimensioni ai
quali sono associati dei pesi wi iN1 tale che l’integrale di una
qualsiasi funzione misurabile rispetto alla pdf target p(x)
E[ f ( X )]  I ( f ) 
X f ( x) p( x)dx
possa essere approssimato dalla somma pesata
N


I N ( f )   wi f ( X i )
i 1
i pesi wi sono determinati dalla stessa pdf
Tre approcci



random sampling -> campiono direttamente dalla pdf target
importance sampling
MCMC
Random sampling

Se X i iN1 è un insieme i.i.d. di campioni generato dalla pdf target
p il metodo Monte Carlo approssima la pdf target con la
seguente funzione di densità empirica
1 N
p ( x )    ( x  xi )
N i 1
usando tale densità empirica si può calcolare un’approssimazione
dell’integrale I
1 N
I N ( f )   f ( xi )
N i 1
per la legge dei grandi numeri si ha la convergenza a I(f)
Importance sampling

L’ipotesi principale per il random sampling è che si sappia
campionare da p(x), ma spesso si ha a che fare con pdf
complicate. L’idea alla base dell’IS è usare una pdf dalla quale si
sa campionare
I( f ) 
X
f ( x)
p( x)
p( x)
q ( x)dx  E q { f ( x)
}
q( x)
q( x)
Se si possono estrarre N i.i.d. campioni da q(x) e calcolare i pesi
p(x)/q(x) una stima Monte Carlo di I(f) sarà data da
p ( xi )
1 N
I N ( f )   f ( xi )
N i 1
q ( xi )
Applicazioni

Viene utilizzato per:




simulazione di fenomeni naturali
simulazione di apparati sperimentali
calcolo di integrali
Problemi di natura statistica in cui Monte Carlo viene utilizzato
per l’approssimazione di integrali sono ad esempio:


Inferenza Bayesiana → distribuzione a posteriori non appartiene a
famiglie di distribuzioni note, dunque i momenti associati possono essere
scritti sotto forma di integrale ma tipicamente non valutati analiticamente;
Problemi di massimizzazione della verosimiglianza → problemi
inferenziali in cui la verosimiglianza stessa è funzione di uno o più
integrali;
M/EEG
Risoluzione temporale: 1 ms
EEG
Campo elettrico
[mV]
Campo magnetico [fT]
MEG
Il problema inverso neuromagnetico
fisica
 
J (r ' )
   
B(r ), E (r )
matematici


Il problema inverso della MEG/EEG consiste nel ricostruire
l’evoluzione temporale delle sorgenti neuronali a partire dalle misure
effettuate
Approccio statistico Bayesiano alla soluzione dei problemi inversi
Approccio Bayesiano


Ogni variabile è considerata come una variabile aleatoria (B e J
sono le v.a. dei dati e dell’incognita mentre b e j sono le loro
realizzazioni)
La soluzione del problema inverso è la densità di probabilità
(pdf) dell’incognita condizionata dalle misure:
Teorema di Bayes::
 pr ( j )
 (b | j )
 (b)
 (b | j ) pr ( j )
 post ( j | b) 
 (b)
probabilità a priori: contiene l’informazione che abbiamo a priori su J
likelihood: contiene l’informazione sul problema diretto
costante di normalizzazione
Esercizio - calcolo di 



Supponiamo di lanciare N freccette ad un bersaglio formato da
un quadrato di lato L contenente una circonferenza
Assumiamo che le freccette siano lanciate casualmente all’interno
del quadrato e che quindi colpiscano il quadrato in ogni
posizione con uguale probabilità
Dopo molti lanci la frazione di freccette
che ha colpito la circonferenza sarà uguale
al rapporto tra l’area della circonferenza e
quella del quadrato
N
L2 1
  c
4
N
4L
2
4Nc
N
può essere usato per stimare 
Esercizio - calcolo di 

Calcolare  col metodo Monte Carlo




considerare un quadrato di lato 2 (come in figura) il cui centro coincide
con l’origine di un sistema di riferimento Oxy e una circonferenza inscritta
in esso
generare 2 vettori, x e y, di numeri casuali di lunghezza N
calcolare il numero dei punti (NC) (x,y) così generati che cadono
all’interno del cerchio
stimare  usando la formula 4 N
c

ripetere per diversi valori di N
N
Campionamento

In generale non è sufficiente utilizzare sequenze di numeri
casuali distribuiti uniformemente


Esempio:


in molti problemi è necessario disporre di numeri casuali estratti da densità
di probabilità diverse, quali la normale, l’esponenziale, la poissoniana, etc
Simulare l’energia di una particella con una distribuzione gaussiana intorno
ad un valore medio e con una data sigma
Varie possibilità:


Metodo dell’inversione
Metodo del rigetto
Generare numeri casuali con
distribuzione arbitraria
Metodo di inversione
Sia X una variabile aleatoria continua a valori in R e F : (0,1) 
R , la corrispondente funzione di ripartizione cumulativa:
F ( x)  P( X  x)
La variabile aleatoria U = F(X) ha una densità di probabilità
uniforme nell’intervallo [0,1]
P(U  y )  P( F ( X )  y )  P( X  F 1 ( y ))  FF 1 ( y )  y
Quindi per campionare una variabile aleatoria X con
distribuzione F basta campionare una variabile uniforme in [0,1]
e poi considerare X=F-1(U)
Metodo d’inversione
densità
funzione di
ripartizione
Il teorema ci fornisce una regola
per generare numeri con
distribuzione
arbitraria:
se
conosciamo F, prendiamo i
numeri {ui} distribuiti secondo
la legge uniforme e {F-1(ui)}
sono distribuiti secondo F.
Esempio: distribuzione esponenziale
Generare numeri distribuiti secondo la legge esponenziale: se i
numeri {ui} sono distribuiti secondo la legge uniforme, {F-1(ui)}
hanno F come funzione di ripartizione.
La variabile X ~exp(l) ha funzione di ripartizione
F ( x)  (1  e  lx )
La variabile X può essere ottenuta come trasformazione di
una variabile uniforme
1
X  F 1 (U )   log(1  U )
l
In MALTAB...
Ora provate...
data = rand(1,1000)
hist(data)
data = exprand(1,1,1000)
hist(data)
poissrnd
Poisson
randn
Gaussiana
Variabile aleatoria discreta

Supponiamo di voler simulare una variabile aleatoria discreta X
che può assumere m valori distinti xi, i=1,…,m con probabilità
P ( X  xi )  pi , i  1,  , n, 
Sia Fk la probabilità cumulativa
i pi  1
k
Fk  P ( X k  xk )   pi
i 1
Si verifichi che se U è una v.a. uniforme in [0,1] allora la variabile
 x1 , se U  F1 ,
 x , se F  U  F

1
2
X  2


 xm , se Fm 1  U  Fm
ha la probabilità desiderata
P( X  xi )  P( Fi 1  U  Fi )  Fi  Fi 1  pi
Variabile aleatoria discreta

Si scriva una funzione Matlab che, dati un intero n > 0 e i vettori
x = [x1, x2, . . . , xm] e p = [p1, p2, . . . , pm], restituisce il vettore
y contenente n campionamenti della variabile aleatoria discreta X.

Si consideri la variabile aleatoria X tale che:
1
1
1
P ( X  )  0.1 P ( X  )  0.4 P ( X  )  0.05
5
4
3
1
P ( X  )  0.25 P ( X  1)  0.2
2
si calcolino 1000 campioni della variabile aleatoria e si verifichi la
correttezza dei risultati ottenuti confrontando media, varianza e
funzione di ripartizione cumulativa (cdf) con i valori teorici.
Metodo del rigetto

Obiettivo: Estrarre una sequenza di numeri casuali secondo la
distribuzione f(x), nell’intervallo (x1, x2)

Metodo:




Generare x uniforme in (x1,x2)
Generare y uniforme in (0,fmax)
Valutare f(x)
Confrontare y con f(x)


fmax
Se y < f(x) accettare x
Se y > f(x) ripetere da a) in poi
x1
x2
Metodo del rigetto


Si può migliorare l’efficienza del metodo effettuando il
campionamento non in un “rettangolo” ma in una regione
definita da una funzione g(x) maggiorante di f(x).
Se si è in grado di generare numeri casuali distribuiti secondo
g(x) per esempio con il metodo dell’inversione, la procedura
dell’inversione diventa:



Si estrae x secondo g(x)
Si estrae u con distribuzione uniforme
tra 0 e g(x)
Se u<f(x) si accetta x
Metodo del rigetto

I presupposti per utilizzare questo metodo sono: costruire
un’opportuna nuova distribuzione di probabilità g da cui
sappiamo come campionare, e definire una funzione “envelope”
e(x) tale che e(x) = g(x)/α ≥ f (x)






Campioniamo Y dalla distribuzione g
Campioniamo U ∼ Unif (0, 1)
Eliminiamo il valore Y se U < f (Y)/e(Y)
Altrimenti, manteniamo il valore X=Y come un campionamento dalla
distribuzione obiettivo f
torniamo al punto iniziale.
Se riprendiamo il terzo punto, è come se avessimo campionato
da Unif (0, e(y)) ed accettassimo il valore se risulta essere
inferiore ad f (y)
Scarica