La motivazione come determinante del

Università degli Studi di Modena e Reggio Emilia
Facoltà di Scienze della Comunicazione e dell’Economia
Corso di Laurea Specialistica in Economia e Gestione delle Reti e dell’Innovazione
Anno Accademico 2005/06 (sessione straordinaria)
La motivazione come determinante del
comportamento di organismi artificiali:
una simulazione di Artificial Life
Relatore: Chia.mo Prof. Roberto Serra
Correlatore: Chia.mo Prof. Domenico Parisi
Candidato: Fabio Ruini (matr. 7496)
Il dualismo mente-corpo e gli
attuali limiti della psicologia
cognitivista
La psicologia sperimentale (laboratorio e metodo galileiano) nelle sue
varie correnti: strutturalismo, comportamentismo, cognitivismo.
Per la scienza resta un problema aperto: l’esistenza di due apparati
concettuali distinti, un vocabolario per il realtà fisica ed uno per la “mente”.
La riunificazione della mente con il resto della realtà:
 la metodologia della simulazione (per rendere precise e disambigue le
teorie della psicologia, “capire la realtà simulandola”);
 la nascita del connessionismo (per superare i limiti dell’intelligenza
artificiale, “mano armata” della psicologia cognitivista).
Oltre l’approccio connessionista:
l’Embodied Cognitive Science
Nella prospettiva connessionista, il comportamento
(individuale) è un fenomeno complesso, emergente
dalla moltitudine di interazioni che hanno luogo ad un
livello più basso e su una scala temporale più ristretta.
D’accordo. Ma l’ambiente?
Embodied Cognitive Science:
 Embodiment
 Situatedness
Lo spazio per un ulteriore passo
in avanti
Fino ad oggi, la quasi totalità degli studi condotti nel
campo della Embodied Cognitive Science ha riguardato
la creazione di organismi artificiali (simulati a computer
o implementati fisicamente mediante artefatti robotici)
impegnati ad assolvere a singoli compiti, molto specifici.
Magari implementabili attraverso sequenze di azioni più
o meno articolate e gerarchicamente organizzate, ma
comunque finalizzate al perseguimento di un singolo
obiettivo.
Una delle caratteristiche più interessanti del
comportamento umano, però, è la sua flessibilità, intesa
come capacità di mutare e di adattarsi alle diverse
circostanze.
La motivazione
“La motivazione (dall’etimo latino motus) è una
spinta per svolgere una certa attività e si può
definire come un processo di attivazione
dell’organismo finalizzato alla realizzazione di
un dato scopo in relazione alle condizioni
ambientali. Da tale processo dipende l’avvio, la
direzione, l’intensità e la cessazione di una
condotta da parte del soggetto.”
Anolli L., Legrenzi P., Psicologia Generale
(ed. Il Mulino, Bologna, 2006 - pag. 201)
Duplice relazione con l’ambiente
“[…] realizzazione di un dato scopo in relazione alle
condizioni ambientali […] ”
L’ambiente determina gli scopi e dunque il comportamento
di un individuo. Al tempo stesso, l’ambiente è il
palcoscenico sul quale tale comportamento si manifesta e
dal quale l’individuo trae successivamente un feedback.
Ne deriva che lo studio della motivazione non può essere
affrontato mediante l’approccio connessionista tradizionale.
Occorre introdurre tra i vari parametri presi in
considerazione anche l’ambiente di riferimento.
The Predator: l’ambiente
Mondo discreto non-toroidale, formato da
15x15 celle
Ogni cella ha probabilità 0.15 di contenere
al suo interno un’unità di cibo
Un organismo, che si muove all’interno
dell’ambiente alla ricerca del cibo
Un predatore (hard-wired), presente
mediamente per il 25% della vita
dell’organismo, che cerca di catturare
quest’ultimo
Raccolta e cattura hanno luogo
rispettivamente quando, in seguito ad un
movimento, organismo e cibo, oppure
organismo e predatore, si trovano nella
medesima cella
The Predator: l’architettura
neurale degli organismi
Due unità neurali di input, di tipo
continuo, deputate a gestire
l’informazione sensoriale relativa al
cibo (angolo e distanza). Altre due,
del tutto analoghe, dedicate alla
percezione del predatore.
Nove neuroni di tipo continuo nello
strato intermedio.
Due neuroni booleani di output, che
implementano la risposta motoria
dell’organismo:
00 : rimane fermo;
01 : ruota di 90° in senso orario;
10 : ruota di 90° in senso antiorario;
11 : si sposta in avanti di una casella
nella direzione in cui è orientato.
The Predator: dettagli tecnici
 Popolazione iniziale composta da 100 individui
 Evoluzione genetica per 1000 generazioni
 Ad ogni generazione, gli individui sono “testati”
individualmente per 25 epoche (di 100 passi ciascuna)
all’interno di altrettanti ambienti differenti (per una vita
complessiva di 2500 step)
 Formula di fitness: quantità di cibo raccolta - (numero di
catture subite x “capture damage”)
 I 20 migliori individui di ogni generazione si riproducono in
maniera asessuata, dando origine ciascuno a 5 individui
“figli”, che ereditano il materiale genetico del genitore, non
necessariamente identico (ciascun peso sinaptico ha
probabilità 0.25 di subire una mutazione casuale di un
valore compreso tra -1 e +1)
Fitness media e massima
(capture damage = 5)
Ammontare medio di cibo raccolto
(capture damage = 5)
Numero medio di catture subite
(capture damage = 5)
Ammontare medio di cibo raccolto
in presenza ed in assenza del
predatore (capture damage = 5)
L’emergere di un meccanismo di
attenzione selettiva: analisi
dell’hidden layer
Davvero gli organismi riescono a
discriminare tra gli input sensoriali?
Per scoprirlo sono stati messi a
confronto i pattern di attivazione dello
strato intermedio della rete neurale
relativa ai migliori organismi dell’ultima
generazione:
 in presenza esclusiva del predatore
 in presenza di predatore e cibo
Dist from pred
Dist from food
PD
4
9
  x
Food and predator
i, j
x
Only predator
j
i 1 j 1
4
APD
Dist from pred


Dist from food 1
PD
Dist from pred
2*Dist from food
4

Predator distance /
Food distance
P1/F2
P1/F4
P1/F6
P1/F8
P2/F2
P2/F4
P2/F6
P2/F8
P3/F2
P3/F4
P3/F6
P3/F8
P4/F2
P4/F4
P4/F6
P4/F8
P5/F2
P5/F4
P5/F6
P5/F8
P6/F2
P6/F4
P6/F6
P6/F8
P7/F2
P7/F4
P7/F6
P7/F8
P8/F2
P8/F4
P8/F6
P8/F8
PD
6.4063
6.5595
6.7030
6.8311
7.0756
7.2237
7.3610
7.4824
7.9049
8.0425
8.1643
8.2652
8.7859
8.9057
9.0002
9.0629
9.5610
9.6505
9.7009
9.7024
10.0892
10.1283
10.1103
10.0219
10.2913
10.2511
10.1338
9.9259
10.1430
9.9895
9.7440
9.4017
APD
6.624975
7.285675
8.094225
8.938675
9.6537
10.087425
10.150525
9.81955
Variazioni del valore del
parametro capture damage
Modificando il valore del parametro capture
damage, ovvero l’importanza relativa di una
cattura da parte del predatore al confronto
con la raccolta di un’unità di cibo, varia lo
schema comportamentale degli organismi.
Fitness media e massima
(capture damage = 5, 10 e 50)
Ammontare medio di cibo raccolto
(capture damage = 5, 10 e 50)
Numero medio di catture subite
(capture damage = 5, 10 e 50)
Percentuale di passi spesi senza
muoversi (capture damage = 5, 10 e 50)
I due livelli del comportamento
 Livello strategico: il “cosa fare”, deputato a
circuiti neurali relativamente semplici ed
avente uno stretto legame con la
motivazione;
 Livello tattico: il “come farlo”, data l’enormità
degli stimoli presenti nell’ambiente, necessita
del supporto di strutture particolarmente
sofisticate.
L’aggiunta di un circuito
“sotto-corticale” per la gestione del
“livello strategico” del comportamento
Modifica
dell’architettura di rete
con l’introduzione di
due neuroni intermedi
aggiuntivi, che
ricevono l’attivazione
dall’input sensoriale
relativo al predatore
(la componente
“emotivomotivazionale”)
Fitness media e massima
(con e senza circuito aggiuntivo)
Ammontare medio di cibo raccolto
(con e senza circuito aggiuntivo)
Numero medio di catture subite
(con e senza circuito aggiuntivo)
L’effetto del “rumore”
sull’evoluzione genetica
Condizione un po’ “particolare” è quella con capture damage = 0.
In questo caso, il predatore non provoca alcun danno all’organismo in
caso di cattura, limitandosi pertanto ad agire come un semplice
“fattore di disturbo”. “Rumore”, appunto.
Confronto:
 con un organismo dotato di un’architettura neurale più semplice,
che non prende in considerazione il predatore;
 con un organismo dotato della “solita” architettura di rete, ma che
riceve come input dei neuroni deputati a gestire l’informazione
sensoriale relativa al predatore, del semplice rumore gaussiano.
Fitness massima (predatore “innocuo” vs.
predatore assente)
Fitness media (predatore “innocuo”
vs. predatore assente)
Distribuzione della fitness
(predatore “innocuo”)
Distribuzione della fitness
(predatore assente)
Fitness massima (rumore gaussiano vs.
predatore “innocuo”)
Fitness media (rumore gaussiano vs.
predatore “innocuo”)
Conclusioni (I)
 Un meccanismo attentivo compare negli organismi della nostra
simulazione come fenomeno emergente, con modalità che variano
a seconda dell’ambiente (inteso come determinante della “struttura
motivazionale” dell’individuo).
 Un’architettura neurale dotata di un circuito
“motivazionale/emozionale” risulta essere più performante rispetto
ad una che ne è priva. Conferma alle tesi di vari neuroscienziati
(ad es. Ledoux, con il suo “Emotional Brain”), secondo i quali nel
sistema nervoso umano esistono strutture sotto-corticali che
agiscono “in appoggio” al più complesso sistema corticale.
Strutture presumibilmente dedicate alla gestione del “livello
strategico” del comportamento.
Conclusioni (II): un aspetto
metodologico
L’introduzione del rumore gioca un ruolo rilevante non soltanto
nell’apprendimento in vita (come già era noto, in virtù dei numerosi
studi effettuati con riferimento ai metodi di addestramento delle reti
neurali), ma anche nell’evoluzione biologica.
La presenza di un certo quantitativo di rumore, se da un lato
peggiora le performance dei migliori individui della popolazione,
dall’altro migliora le prestazioni medie. L’effetto è evidente in
riferimento alle “code di sinistra” delle distribuzioni della fitness
delle popolazioni.
Questo aspetto merita di essere approfondito ulteriormente in
futuro, con studi specifici volti ad indagare il perché del
manifestarsi di un tale effetto.