Algoritmi di controllo per la navigazione basati su spiking networks

annuncio pubblicitario

POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Algoritmi di controllo per la navigazione
basati su spiking networks
CRISTIANO ALESSANDRO
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Outline
• Neurone biologico
• Neurone Spiking
• Learning ed esperimento di Pavlov
• Spike Timing Dependent Plasticity (STDP)
• Applicazione per il Path Planning con Obstacle Avoidance
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Neurone Biologico
• Potenziale di membrana
• Potenziale pre-sinaptico
Efficacia
sinaptica
• Potenziale post-sinaptico
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Neurone Biologico
(Funzionamento)
Meccanismo di trasmissione dell’informazione quasi completamente di natura
elettrica.
Il potenziale di membrana è la differenza di potenziale negativa presente fra
l’interno e l’esterno della cellula. Tale potenziale è soggetto a variazioni dovute
alla “trasmissione di informazioni” con altri neuroni:
• iperpolarizzanti: fanno aumentare il potenziale di membrana;
• depolarizzanti: fanno diminuire il potenziale di membrana.
Il Neurite è l’unica parte della cellula capace di GENERARE segnali: spike o
potenziali di azione.
Si tratta di segnali impulsivi della durata di 1-2 ms non graduabili (digitali).
Le sinapsi sono connessioni unidirezionali tra l’uscita di un neurone e
l’ingresso dell’altro. Esse modulano l’ampiezza del segnale trasmesso in base
alla loro efficacia sinaptica (pesi delle sinapsi). VARIABILE NEL TEMPO!
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Neurone Biologico
(Funzionamento)
Il potenziale pre-sinaptico è il segnale presente prima della sinapsi.
Il potenziale post-sinaptico rappresenta il segnale di uscita al neurone,
ovvero il potenziale pre-sinaptico modulato dalla efficacia sinaptica.
L’ingresso del generico neurone è, quindi, la sommatoria di tutti i potenziali
post-sinaptici dei neuroni che lo precedono. Questo viene tradotto in una
variazione del suo potenziale di membrana: se l’efficacia sinaptica è
eccitatrice, il potenziale post-sinaptico causa una depolarizzazione altrimenti,
in caso di efficacia inibitrice, causa una iperpolarizzazione.
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Neurone Biologico
(Funzionamento)
Se il potenziale di membrana supera una certa soglia di innesca un processo
autonomo di depolarizzazione che determina nell’assone la formazione di uno
spike.
In risposta ad esso viene generato un segnale (potenziale pre-sinaptico) in
accordo con la seguente funzione.
 t 1−τt

ε (t ) = τ e
0
Ingresso al neurone j
x j (t ) = ∑ wij ε (t − t i )
i∈Γ j
if t > 0
if t ≤ 0
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Neurone Spiking
• Modello di Izhikevich
v′ = 0.04v 2 + 5v + 140 − u + I
u ′ = a (bv − u )
if
v ← c
v ≥ +30 mV ⇒ 
u ← u + d
v = Potenziale di membrana
u = Variabile di recupero
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Neurone Spiking
Possono essere definiti vari tipi di
neuroni in base alla scelta di a,b,c,d.
Class 1 excitable: la frequenza di
spike aumenta proporzionalmente
del segnale in ingresso.
Informazione contenuta nella
frequenza con cui gli spike vengono
emessi.
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Learning
• Sinapsi di Hebb
L’efficacia sinaptica non è statica e rappresenta la capacità di
memorizzazione di una rete neurale biologica (plasticity).
Le sinapsi di Hebb variano la loro efficacia in funzione dello
sfasamento temporale fra due impulsi: se lo spike pre-sinaptico
avviene prima del post-sinaptico essa viene rinforzata, viceversa
viene indebolita.
• Classical Conditioning
Permette di sviluppare associazioni fra stimoli incondizionati a
stimoli condizionati.
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Learning
(Classical conditioning)
Stimoli incondizionati (US)
Stimoli condizionati (CS)
US
UR
CS
CR
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Learning
(Hebb)
PRE
POST
L’attività del neurone PREsinaptico (sensoriale) attivato dal suono del campanello si accoppia
all’attività del neurone POSTsinaptico (effettore) attivato dalla presenza di cibo.
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Spike Timing Dependent Plasticity
Valore dinamico dell’efficacia
 A+ exp(∆t )
τ+

∆W = 
− ∆t )
− A− exp(
τ−

if
∆t < 0
if
∆t ≥ 0
∆t = t pre − synaptic − t post − synaptic
decay-rate
Sistema
adattativo
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Spike Timing Dependent Plasticity
Generalizzando, nel caso in cui vi siano n e m spike, rispettivamente pre e post
sinapsi...
∆t ij

A
exp(
 +
τ + ) if ∆t < 0
, 1 ≤ i ≤ n ;1 ≤ j ≤ m
δWij = 
− ∆t ij
− A− exp(
) if ∆t ≥ 0
τ

−
n
m
∆W = ∑∑ δwij
i =1 j =1
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
STDP
Problema irrisolto: come trattare le n*m
coppie di spike?
• All-to-All interaction
• Nearest-neighbor interaction
• Postsynaptic-centric interaction
• Presynaptic-centric interaction
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
Realizzazione di un algoritmo di controllo bioispirato per la navigazione di robot
Robot
Ambiente
(sensori)
(target e ostacoli)
Local Navigation
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
Ambiente dinamico, soggetto a cambiamenti
Algoritmo adattativo…
…biologicamente ispirato
• struttura (Modello di Izhikevich)
• apprendimento (STDP)
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
Behavior del Robot:
• Path Planning per il raggiungimento di target
• Camera – CS
• Sensori di target - US
• Obstacle Avoidance
• Sensori di distanza - CS
•Sensori di contatto - US
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
MNL
MNR
Terzo livello
Secondo livello
RFL RFR CDL CDR
TDL TDR
Primo livello
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
(Esperimento 1)
Prima...
...Dopo
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
(Esperimento 1)
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
(Esperimento 2)
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Applicazione
(Esperimento 2)
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Sviluppi futuri
Implementazione di un algoritmo di navigazione basato non solo sulle
informazioni sensoriali che il robot riceve istantaneamente dall’ambiente, ma
anche su una rappresentazione topologica e metrica dello stesso, che
permetta di pianificare la traiettoria da compiere per il raggiungimento di un
determinato obbiettivo.
Way-finding Navigation
POLITECNICO DI MILANO
Robotica 2 – a.a. 2006/07
Cristiano Alessandro
Bibliografia
P. Arena, L. Fortuna, M. Frasca, L. Patanè, C. Alessandro, D. Barbagallo, “Learning high
sensors from reflexes via spiking networks in roving robots”, 8th international IFAC symposium on
robot control, IFAC Syrco ’06 - 06/08/2006 Bologna, Italy.
Cristiano Alessandro. Algoritmi di controllo per la navigazione basati su spiking networks. Tesi di
laurea – Relatori: Paolo Arena, Mattia Frasca, Luca Patanè – DIEES University of Catania
Donato Barbagallo. Un ambiente per la simulazione di algoritmi di navigazione basati sulla
visione. Tesi di laurea – Relatori: Paolo Arena, Mattia Frasca, Luca Patanè – DIEES University of
Catania
Fabio Danieli. STDP per il controllo della navigazione. Tesi di Laurea – DIEES University of
Catania
Paolo Arena, Luigi Fortuna, Mattia Frasca, Luca Patanè. Navigation Control based on Spiking
Networks. DIEES University of Catania
E.M. Izhikevich. Simple Model of Spiking Neurons, IEEE Transactions on Neural Networks, Vol
14, n°6, pages 1569-1572, 2003.
http://www.nsi.edu/users/izhikevich/
Dominique Luzeaux, Andrè Dalgalarrondo. Hybrid Architecture for Autonomous Robots, Based
on Rappresentation, Perception and Intelligent Control. Recent Advances in Intelligent Paradigms
and Application. Pages 37-39, 2002
Oliver Trullier. Biologically-based Artificial Navigation System: Review and prospects. Progress in
Neurobiology, pages 1-10.
U. R. Karmarkar,M. T. Najarian, and D. V. Buonomano, Mechanismus and significance of spiketiming dependent plasticity, Biol. Cybern., vol. 87, pp. 373–382, 2002.