ALMA MATER STUDIORUM – UNIVERSITÀ DI BOLOGNA
CAMPUS DI CESENA
SCUOLA DI INGEGNERIA E ARCHITETTURA
CORSO DI LAUREA MAGISTRALE IN INGEGNERIA BIOMEDICA
Fenomeni di interazione audio-visiva in
soggetti sani e in soggetti autistici: analisi
mediante rete neurale
Tesi in
Sistemi Neurali LM
Relatore
Presentata da
Prof.ssa Elisa Magosso
Giancarlo Angotti
Sessione II
Anno Accademico 2013/2014
A mamma e papà
PAROLE CHIAVE
Modelli neurocomputazionali
Interazione audio-visiva
Sound-induced flash illusion
Finestra temporale di integrazione audio-visiva
Disordini dello spettro autistico
Indice
Introduzione
5
Capitolo Primo
Fenomeni di interazione audio-visiva: risultati di studi in soggetti sani
e soggetti autistici
8
1.1 Integrazione multisensoriale
8
1.2 Illusioni acustiche dovute alla modalità visiva
12
1.3 Illusioni visive dovute alla modalità acustica
13
1.4 Disturbi dello spettro autistico
20
1.5 Studi di integrazione multisensoriale nei soggetti autistici
22
Capitolo Secondo
Modello di rete neurale: descrizione qualitativa e quantitativa
29
2.1 Introduzione
29
2.2 Descrizione qualitativa del modello
30
2.3 Descrizione matematica del modello
32
2.4 Risultati del modello di base
39
Capitolo Terzo
Analisi di sensitività del modello: risposta del modello (flash illusion) al variare
del valore dei parametri
45
3.1 Analisi del modello in condizioni di base per diversi valori
di Stimulus Onset Asynchrony (SOA)
45
3.2 Analisi di sensitività del modello: comportamento in risposta a
diversi SOA al variare dei parametri
55
3
Capitolo Quarto
Risultati: simulazione del fenomeno illusorio (flash illusion) in soggetti sani e in
soggetti sani
82
4.1 Simulazioni soggetti sani
82
4.2 Simulazioni soggetti autistici
102
4.3 Analisi statistica dei risultati
107
Conclusioni
111
Bibliografia
114
4
INTRODUZIONE
In ogni istante della nostra vita, gli oggetti e gli eventi del mondo esterno stimolano
contemporaneamente più sensi del nostro organismo, fornendo informazioni di diversa
natura, quali, ad esempio, informazioni tattili, acustiche, visive. Sebbene il nostro
organismo sia dotato di organi sensoriali distinti e separati, le elaborazioni dei diversi
stimoli devono essere integrate e combinate tra loro, per ottenere una percezione unica e
coerente della realtà e fornire un adeguato output comportamentale. Negli ultimi
decenni, una molteplicità di studi scientifici (sia neurofisiologici che psicofisici) ha
infatti evidenziato come caratteristica fondamentale del nostro sistema nervoso la
capacità di combinare e integrare informazioni di diversa natura sensoriale: tale capacità
determina percezioni più accurate degli stimoli e degli eventi, consente di risolvere
ambiguità in caso di stimoli conflittuali, e genera risposte più pronte. A livello neurale,
l’interazione tra stimoli di diversa natura è stata evidenziata a diversi stadi di
elaborazione corticale, sia a livello di aree corticali primarie, che a livello di aree
corticali superiori di tipo associativo.
Tra i diversi tipi di interazione multisensoriale, uno dei più studiati è quello che riguarda
l’interazione tra informazioni visive e informazioni acustiche. Un approccio largamente
impiegato per studiare questo tipo di interazione consiste nell’imporre una situazione di
conflitto tra le informazioni generate dai due differenti stimoli sensoriali.
Quando presentiamo ad esempio ad un osservatore uno stimolo acustico e un
contemporaneo stimolo visivo, provenienti da posizioni spaziali diverse, la
localizzazione dello stimolo acustico è percepita spostata verso la posizione spaziale in
cui è applicato lo stimolo visivo. Questo effetto è generalmente conosciuto come effetto
ventriloquo (ventriloquist effect). Questo fenomeno mette in evidenza un effetto di
“cattura” della posizione spaziale acustica da parte dello stimolo visivo: nel dominio
dello spazio è il senso della vista che influenza principalmente gli altri. Tale dominanza
visiva sembra essere legata alla migliore risoluzione spaziale del sistema visivo rispetto
agli altri sensi, per cui, in presenza di situazioni incerte o conflittuali, è il sistema più
affidabile (ovvero quello visivo) a prevalere.
Molteplici studi hanno altresì dimostrato che nel dominio dei tempi è invece il senso
dell’udito che tende a dominare la percezione, in conseguenza della maggiore
5
risoluzione temporale del sistema uditivo rispetto agli altri sensi. Tema principale di
questa tesi è un importante esempio di come il senso dell’udito possa influenzare la
percezione visiva, ovvero un fenomeno illusorio visivo indotto dal suono, descritto per
la prima volta da Shams e alcuni colleghi nel lavoro “What you see is what you hear”
(Nature, vol. 408, 2000). Tale fenomeno illusorio (denominato sound-induced flash
illusion o Shams illusion) si verifica quando ai soggetti viene presentato un singolo flash
accompagnato da due o più beep sonori: in tale caso i soggetti spesso riportano di aver
visto due o più flash. Tale studio dimostra come stimoli acustici possono alterare la
percezione visiva. In studi successivi, inoltre, è stata individuata una “finestra
temporale”, cioè l’intervallo temporale in cui avviene l’interazione sensoriale che dà
luogo al fenomeno illusorio: più aumenta la distanza tra gli stimoli unimodali visivi e
acustici, minore è l’occorrenza del fenomeno illusorio visivo.
Poiché l’interazione multisensoriale è alla base di molti processi cognitivi anche di alto
livello (ad es. riconoscimento di oggetti, memorizzazione, linguaggio, comunicazione),
in anni recenti i fenomeni di interazione multisensoriale sono stati studiati anche in
soggetti che presentano disturbi psichiatrici e neurologici, quali ad es. i soggetti
autistici; questi sono in particolare caratterizzati da deficit che coinvolgono la
comunicazione e i meccanismi di interazione e integrazione con il mondo circostante.
Alcuni studi hanno dimostrato come l’effetto Shams si verifichi anche negli autistici,
dimostrando quindi che anche questi soggetti, nonostante la patologia,mantengono la
capacità di integrare stimoli di diversa natura sensoriale. Tuttavia si è evidenziata una
differenza negli aspetti temporali dell’interazione tra soggetti autistici e soggetti sani.
E’ stato infatti osservato che i soggetti autistici mostrano una maggiore propensione nel
riportare l’illusione rispetto ai soggetti sani, e in particolare, presentano una finestra
temporale d’integrazione che è superiore (circa doppia) rispetto ai sani.
Obiettivo di questo lavoro di tesi è stato studiare, tramite un modello matematico di
rete neurale, questo fenomeno di interazione audiovisiva che porta all’effetto illusorio
visivo nei soggetti sani e nei soggetti autistici.
Il modello proposto si basa su un precedente modello di rete neurale sviluppato dal
gruppo di Bioingegneria dell’Università di Bologna (“A neurocomputational analysis of
the sound-induced flash illusion”, Neuroimage , vol. 92, 2014). Tale modello, è in
grado si simulare il fenomeno descritto da Shams.
Tuttavia questo modello presenta dei limiti, infatti è ottimizzato per simulare il
fenomeno illusorio per un determinato valore di distanza temporale tra gli stimoli, non
6
prendendo in considerazione l’intera finestra temporale in cui si è osservato il fenomeno
illusorio. Inoltre, tale modello era stato utilizzato solo per simulare il fenomeno illusorio
in soggetti sani e non considerava le differenze osservate nei soggetti autistici.
In questo lavoro, il modello è stato opportunamente modificato ed utilizzato per studiare
e simulare il fenomeno del sound-induced flash illusion in questi altri casi non trattati
nella versione originale del modello. A tale scopo, una parte rilevante dell’attività svolta
si è concentrata sullo svolgimento di un’analisi di sensitività del modello al fine di
individuare quali variazioni dei parametri potessero spiegare l’illusione in un ampio
intervallo temporale (come osservato in letteratura), nonché spiegare le differenze
riportate tra soggetti sani e soggetti autistici.
Una volta individuate le variazioni da apportare al set di parametri, sono state effettuate
varie prove e simulazioni per testare il modello modificato e confrontare i risultati del
modello con i dati di letteratura.
La trattazione della tesi è suddivisa in 5 capitoli.
Il Capitolo 1 descrive i concetti fondamentali relativi all’integrazione multisensoriale e
illustra i principali fenomeni di interazione audiovisiva, tra cui in particolare il soundinduced flash illusion, mostrando i risultati di studi in soggetti sani e in soggetti
autistici.
Il Capitolo 2 descrive il modello di rete neurale utilizzato e le equazioni matematiche
che lo costituiscono, e illustra il suo principio di funzionamento e, descrivendo i
meccanismi alla base della riproduzione del fenomeno illusorio con la configurazione di
base dei parametri.
Il Capitolo 3 riporta un’analisi di sensitività del modello, ovvero descrive come varia la
risposta del modello al variare del valore di alcuni parametri, con particolare riferimento
alla capacità del modello di riprodurre il fenomeno illusorio in una ampia finestra di
distanze temporali tra gli stimoli acustici e visivi.
Il Capitolo 4 riporta i risultati delle simulazioni ottenute con il modello variando il set di
parametri sulla base dei risultati del capitolo 3. In particolare, si evidenzia il ruolo di
alcuni parametri nel riprodurre una maggiore propensione al fenomeno illusorio su
ampie finestre temporale, così come osservato nei soggetti autistici.
Le conclusioni infine riportano la discussione dei risultati ottenuti, i limiti del modello e
i possibili miglioramenti futuri.
7
Capitolo Primo
Fenomeni di interazione audiovisiva: risultati di studi
in soggetti sani e in soggetti autistici
1.1 INTEGRAZIONE MULTISENSORIALE
La percezione del mondo esterno è basata sull’integrazione di input e stimoli
provenienti da differenti modalità sensoriali. In ogni istante della nostra vita riceviamo
continuamente stimoli di diversa natura che forniscono contemporaneamente
informazioni di diverso tipo e che combinano vie sensoriali differenti, come stimoli
acustici, visivi, olfattivi, tattili.
Per molti anni il mondo scientifico ha guardato ad ogni senso come unico e separato
dagli altri: ogni modalità sensoriale si pensava funzionasse separatamente dalle altre e
che quindi ogni specifica informazione sensoriale venisse elaborata indipendentemente
dalle altre.
Tuttavia in molte situazioni di tutti i giorni riceviamo input non solo di un‘unica
modalità, ma spesso sono input che hanno insieme caratteristiche di più modalità, i
nostri sensi ricevono quindi spesso informazioni sensoriali correlate provenienti dallo
stesso input esterno, questa informazione quindi deve essere elaborata nel nostro
cervello al fine di dare una percezione unica dell’evento e di preparare un eventuale
output.
Gli stimoli che riceviamo vengono elaborati simultaneamente nel nostro cervello,
ognuno da apposite aree cerebrali dedicate, quali la corteccia visiva e la corteccia
uditiva. Le singole elaborazioni dei diversi stimoli devono essere però integrate e
combinate tra loro, in modo da dare un output adeguato e unico. Ciò implica che le
singole aree cerebrali devono anche comunicare tra loro e si influenzano a vicenda.
Un ruolo primario e fondamentale del sistema nervoso è quello di convertire gli input
sensoriali in un output univoco, in azioni dirette, integrando le informazioni di diverse
modalità sensoriali. L’abilità di integrare informazioni per generare comportamenti
opportuni e una corretta e completa percezione è strettamente collegata alle relazioni
8
spaziotemporali dei diversi input sensoriali [1]. L’importanza dei fattori spaziotemporali
per l’integrazione multisensoriale emerge evidente nello studio dei deficit
nell’elaborazione multisensoriali in soggetti clinici, quali i dislessici e, come vedremo,
gli autistici.
Mentre la ricerca si focalizzava soprattutto sullo studio delle aree cerebrali
separatamente, altri studi puntavano a dimostrare che l’interazione delle varie
componenti all’interno di una rete neurale complicata come il cervello era fondamentale
per capire funzionamento delle singole parti e al contempo della rete stessa [2].
Due o più modalità sensoriali possono quindi portare informazioni diverse dello stesso
evento del mondo esterno, per esempio quando vediamo e sentiamo una persona
parlare. Queste informazioni vengono poi integrate per dare un unico percetto (fig.
1.1a). Ma allo stesso tempo il sistema nervoso deve avere la capacità di discriminare
quando arrivano insieme informazioni sensoriali non correlate tra loro, ma provenienti
da due eventi diversi. Questo processo come vedremo può essere condizionato da
diverse correlazioni spaziali e temporali.
Recenti lavori forniscono evidenze che l’integrazione multimodale può anche dare un
feedback e influenzare le elaborazioni unimodali (fig. 1.1b).
Fig. 1.1. Schema a blocchi interazione multimodale
Questo schema illustra le nozioni convenzionali di integrazione multimodale descritte.
In un caso (a) abbiamo una informazione visiva (Vx) e una acustica (Ax) dello stesso
evento (x) che vengono integrate per ottenere una rappresentazione multimodale (Mx).
Nell’altro (b) questa rappresentazione multimodale può dare anche un feedback sulle
aree unimodali e influenzare l’elaborazione di stimoli unimodali successivi di eventi
diversi (Vy e Az).
9
Un esempio di quest’ultimo caso viene dall’attenzione spaziale crossmodale. In questi
casi si è mostrato che uno stimolo tattile che viene fornito in una posizione spaziale che
non si conosce a priori può influenzare l’elaborazione di uno stimolo visivo presentato
vicino a quello tattile [2].
A proposito di ciò uno studio tramite fMRI mostra che uno stimolo tattile congruente
può influenzare ed aumentare la risposta neurale ad uno stimolo visivo nella corteccia
visiva (che solitamente risponde a stimoli visivi unimodali) nel giro linguale.
Fig. 1.2. Risultati studio fMRI sul feedback dell’interazione multimodale
Il giro linguale sinistro, visibile nella figura precedente in rosso durante la sua
attivazione, è tradizionalmente considerato una regione della corteccia visiva
retinotopica che si attiva in presenza di uno stimolo unimodale. Questa regione risponde
in modo più pronunciato a uno stimolo visivo controlaterale (cioè proveniente dalla
parte opposta del campo visivo rispetto a dove essa si trova, quindi a destra in questo
caso) rispetto all’equivalente stimolo dato a sinistra (fig. 1.2) [2].
L’influenza dell’interazione multimodale si mostra quando viene fornito anche uno
stimolo tattile concorrente nella parte destra del campo visivo. In questo caso si nota un
aumento di attivazione della risposta neurale visiva, influenzata perciò dallo stimolo
tattile.
L’integrazione multisensoriale è quindi una delle caratteristiche principali del
funzionamento del cervello e delle aree nervose, necessaria al fine di ottenere una
percezione ottimale della realtà che ci circonda. L’integrazione multisensoriale è
10
fondamentale anche per la percezione più accurata e più pronta di un singolo stimolo
unimodale: quando il singolo stimolo unimodale è accompagnato da un secondo stimolo
di una modalità differente, l’insieme delle due percezioni e la loro simultanea
elaborazione consente una migliore percezione del singolo stimolo unimodale [3].
All’aumentare delle evidenze di una interazione tra i sensi nel nostro cervello, cresceva
l’interesse per identificare le aree cerebrali in cui tale interazione potesse avere luogo.
Inizialmente, l’integrazione tra le informazioni inoltre si pensava avvenisse solo in aree
corticali associative di alto livello, deputate allo svolgimento di compiti cognitivi più
complessi. Recenti studi ed esperimenti invece hanno suggerito che il fenomeno
integrativo è presente già in aree corticali di basso livello (tradizionalmente considerate
puramente unimodali), cioè all’inizio del processo di elaborazione degli input esterni,
sebbene i meccanismi neurali alla base dei processi di interazione multisensoriale in
aree unimodali di basso livello siano ancora oggetti di studio e dibattito. Ad esempio,
studi sull’uomo portati avanti con l’uso dei potenziali evento-correlati (ERP) hanno
mostrato esserci un’interazione acustico-somatosensoriale al livello della corteccia
acustica. Altre registrazioni intercraniche di potenziali hanno evidenziato l’effetto di
input visivi e somatosensoriali a livello della regione posteriore della corteccia acustica
A1. Ciò quindi porta a pensare che stimoli anche se non prettamente acustici possono
avere effetto sull’area acustica del cervello.
I differenti sensi non sono quindi trattati come moduli separati nel nostro cervello e, fin
dai primi passi del processo di elaborazione, l’interpretazione di uno stimolo in una
certa modalità (es. uno stimolo acustico) può essere influenzata da un’informazione
proveniente da un’altra modalità.
Per studiare i fenomeni di integrazione multisensoriale (o integrazione crossmodale), si
ricorre spesso a un approccio basato sulla creazione di situazioni di conflitto in cui due
differenti modalità sensoriali forniscono informazioni discordanti circa uno specifico
attributo dello stimolo o dell’evento. Una delle interazioni sensoriali maggiormente
studiata, ricorrendo anche alla creazione di situazioni di conflitto, è quella che avviene
tra la modalità visiva e la modalità acustica.
1.2 ILLUSIONI ACUSTICHE DOVUTE ALLA MODALITÀ VISIVA
La nostra percezione del mondo trae quindi beneficio dalle informazioni provenienti da
più modalità, visiva, acustica, tattile. Una frequente strategia per capire questo
meccanismo e per esaminare il peso relativo di ogni singola modalità sensoriale
11
nell’ambito di una percezione complessiva sta nel fornire un’informazione espressa da
due modalità in conflitto reciproco. Risultati di studi recenti hanno individuato la
visione come la più importante e la più dominante delle modalità sensoriali nel dominio
dello spazio.
In questo contesto vengono ad esempio imposte condizioni audiovisive spazialmente in
conflitto tra loro, cioè due diversi stimoli (uno visivo e uno acustico) provengono da
zone spaziali diverse. Quando vengono presentati ad un osservatore uno stimolo
acustico e allo stesso tempo uno stimolo visivo, ma in una posizione spaziale diversa
dall’acustico, la localizzazione dello stimolo acustico è percepita spostata verso la
posizione spaziale di presentazione dello stimolo visivo. Questo effetto è generalmente
conosciuto come effetto ventriloquo (ventriloquist effect). Questo fenomeno mette
quindi in evidenza un effetto di cattura spaziale dello stimolo acustico da parte dello
stimolo visivo. Gli stimoli seppure vengano dati da posizioni spaziali diverse, vengono
percepiti come se provenissero dallo stesso punto, il punto nel quale è applicato lo
stimolo visivo. Questo fenomeno è sfruttato dall’illusionista (detto appunto ventriloquo)
che muovendo con la mano un pupazzo ed emettendo suoni senza muovere labbra
inganna spettatore che ha l’illusione che sia il pupazzo a parlare. Nella comprensione
del linguaggio però, questo fenomeno di illusione può essere accresciuto da fattori
cognitivi addizionali.
Tuttavia, altri studi hanno mostrato che la cattura visiva della posizione spaziale dello
stimolo acustico occorre non solo con stimoli complessi e con un significato semantico,
ma anche con stimoli neutri e semplici, come uno spot luminoso o un tono acustico. Tali
studi suggeriscono che lo shift della posizione spaziale acustica non è dovuta solo a
fattori cognitivi, ma è dovuto, almeno in parte, ad un fenomeno di attrazione automatica
del suono da parte di un simultaneo e spazialmente separato stimolo visivo.
Il ventriloquismo è intuitivamente quindi spiegato da una dominanza di tipo spaziale
della visione rispetto agli altri sensi. Ma come questa dominanza si realizzi a livello
neurale è ancora materia di dibattito.
Alcune teorie affermano che l’evoluzione ha dato un vantaggio agli stimoli visivi
rispetto a quelli degli altri sensi, indipendentemente dalle condizione dello stimolo. Un
altro punto di vista alternativo assume che la dominanza del senso della vista risulta da
un’integrazione ottima (in senso Bayesiano) dell’informazione visiva e di quella
acustica. Secondo tale ipotesi, il nostro cervello si comporterebbe come un osservatore
ideale (in senso Bayesiano) che combina le informazioni sulla base della loro
12
affidabilità per dedurre la localizzazione spaziale di uno stimolo. Secondo questa teoria
quindi non c’è una dominanza intrinseca di un senso su un altro, ma è l’informazione
più attendibile che domina sulle altre. Poiché la vista è il senso caratterizzato dalla
maggiore acuità spaziale, l’informazione visiva essendo più attendibile domina su
quella fornita dagli altri sensi, nei compiti di localizzazione spaziale.
L’esposizione a un conflitto dal punto di vista spaziale tra uno stimolo visivo e uno
acustico, oltre a produrre un immediato effetto, appunto il ventriloquismo, produce un
effetto anche a lungo termine. E’ stato infatti dimostrato che la posizione dello stimolo
acustico continua ad essere percepita spostata verso la posizione dello stimolo visivo
anche offline, cioè quando l’input uditivo è presentato da solo. Questo fenomeno prende
il nome di ventriloquism aftereffect.
Fenomeni illusori di percezione come questi sono usati per capire e studiare i
meccanismi alla base dell’integrazione multisensoriale. Un diverso numero di fattori
influenzano queste illusioni, come il timing di presentazione dei diversi stimoli, o
quanto spazialmente sono lontani e diversi. Quando due modalità sensoriali portano
informazioni conflittuali, la percezione è dominata dalla modalità maggiormente
affidabile per il compito da effettuare in seguito alla ricezione di quelle informazioni.
Come si è detto poco sopra, nel caso della discrepanza spaziale tra due stimoli, il senso
della vista, che specifica più precisamente il luogo spaziale dell’input, prevale sul senso
dell’udito producendo appunto il fenomeno del ventriloquismo. Pertanto la percezione
della localizzazione spaziale dello stimolo acustico è influenzata dalla posizione dello
stimolo visivo, mentre non accade (se non in misura non significativa) il contrario.
Viceversa, come specificato in seguito, nel dominio dei tempi i risultati sono differenti e
si può verificare una influenza rilevante dello stimolo acustico sulla percezione dello
stimolo visivo.
1.3 ILLUSIONI VISIVE DOVUTE ALLA MODALITÀ ACUSTICA
Molteplici altri studi hanno dimostrato che nel dominio dei tempi è il senso dell’udito a
dominare la percezione. Questo sembra essere dovuto a una migliore risoluzione
temporale della modalità acustica rispetto a quella visiva. Infatti, gli stimoli acustici
sono processati con una latenza inferiore e più velocemente rispetto agli stimoli visivi;
pertanto nel dominio dei tempi, l’acuità del sistema uditivo è maggiore di quella del
sistema visivo.
13
A proposito di ciò vari studi hanno quindi rivelato che la modalità visiva può essere
fortemente influenzata da quella acustica nel dominio dei tempi.
Risultati di questi studi dicono che il suono può comportare una modifica della
percezione delle caratteristiche temporali di un dato stimolo visivo, come la sua durata,
la sua frequenza, la sua sincronizzazione. Non solo le caratteristiche temporali sono
influenzate, anche l’intensità percepita di uno stimolo visivo può essere aumentata dal
suono.
Altri studi ancora hanno dimostrato che il suono può altresì alterare la percezione della
direzione di un movimento.
Oggetto principale di questa tesi è un importante esempio di come il senso dell’udito
domina sulla visione, cioè un fenomeno illusorio visivo indotto dal suono che prende il
nome “sound-induced flash illusion”, descritto per la prima volta da Shams et al. [4]:
quando un singolo flash è presentato con due o più beep sonori, i soggetti spesso
riportano di aver visto due o più flash. Questa è anche chiamata fission illusion. Un’altra
illusione chiamata fusion illusion è stata altresì descritta, dove un singolo beep causa la
fusione di un doppio flash, ovvero i soggetti a fronte della presentazione di un singolo
beep accompagnato da più flash hanno la percezione di aver visto un flash solo.
I meccanismi neurali e fisiologici alla base di questi complessi fenomeni sono tuttora
oggetto di ricerca, studi psicofisici e di neuro-immagini hanno mostrato che
l’alterazione indotta dal suono sulla percezione visiva è associata ad una modulazione e
variazione nell’attività neurale della corteccia visiva. Più precisamente, potenziali
evocati visivi (VEP) modulati dal suono in opportuni trials di ricerca, suggeriscono che
questi effetti occorrono già a livello della corteccia occipitale, cioè già nei primi livelli
di elaborazione dell’informazione..
Nel seguito, verranno descritti più dettagliatamente gli esperimenti di sound-induced
flash illusion (o fission illusion) e gli esperimenti di fusion illusion, essendo questi (n
particolare la fission illusion) i fenomeni investigati in questa tesi.
In un esperimento [4] venivano forniti due tipi di stimoli ai partecipanti, uno di tipo
visivo e uno di tipo acustico (fig. 1.3). Lo stimolo visivo consisteva in un disco bianco
uniforme proiettato al centro di uno schermo nero di un computer, in successione, da
uno a quattro volte. L’input acustico consisteva in un beep fornito da un altoparlante. Se
si dava input visivo una volta sola questo veniva accompagnato da 0-4 beep, mentre in
caso di input visivi multipli si davano 0 o 1 beep.
14
Fig. 1.3. Configurazione degli stimoli usata nell’esperimento
Il primo flash era sempre preceduto dal primo beep di 23 ms. Ogni beep aveva una
durata di 7 ms, ogni flash una durata invece di 17 ms. Beep consecutivi erano separati
da 57 ms, flash consecutivi da 50 ms. Il compito di ogni osservatore (8 in tutto) era
quello di riportare il numero di flash ogni volta percepiti.
Fig. 1.4. Profilo temporale degli stimoli nell’esperimento
I risultati di questo esperimento sono mostrati in figura 1.5, la quale mostra i dati dei
trial in cui veniva presentato un singolo flash. Il numero di flash percepiti è graficato in
funzione dei beep applicati in ogni singolo trial. Gli osservatori hanno riportato di
vedere un flash quando il numero di beep che lo accompagnavano era uno.
15
Fig. 1.5. Risultati esperimento con i flash illusori percepiti
Al contrario, essi hanno riportato di percepire due o più flash quando un flash solo era
accompagnato da due o più beep. Il numero percepito di flash nei trial con un singolo
flash e due, tre, quattro beep è significativamente più grande di quello percepito nei trial
con un flash e un o nessun beep. E’ a questo fenomeno che ci riferiamo come illusione
visiva indotta dal suono (sound induced flash illusion). I risultati suggeriscono quindi
che beep multipli cambiano la percezione di un singolo flash in multipli flash.
Tale fenomeno è stato inoltre dimostrato che non dipendeva dalla difficoltà del compito
o dall’ambiguità degli stimoli forniti.
Tornando alla figura, notiamo che il numero dei flash percepiti aumenta col numero di
beep. Ciò può far pensare che il numero di flash riportati è legato alla risposta del
sistema uditivo in contrasto col visivo. Per verificare ciò sono stati effettuati altri trial,
in cui c’era una discrepanza tra numero di flash e beep: il numero di beep era uno
mentre il numero di flash variava da due a quattro. I risultati di questi trial sono mostrati
nella figura successiva (fig. 1.6), dove il numero di flash percepiti è graficato in
funzione del numero di flash forniti. Se la risposta degli osservatori è determinata dal
numero di beep e quindi dal senso dell’udito ci aspetteremmo un andamento dipendente
dal numero di beep, invece gli osservatori riportano flash percepiti concordi con quelli
forniti e in contrasto col numero di beep. Quindi rispondono in base alla loro percezione
visiva, non in base a meccanismi cognitivi derivati dal senso dell’udito.
16
Fig. 1.6. Risultati dei trial di controllo dell’esperimento
Per cui i risultati di figura 1.6 dimostrano che il sound-induced flash illusion è
un’illusione di percezione visiva e non è dovuta ad artefatti, come la difficoltà del
compito o meccanismi cognitivi.
A questo punto ci chiediamo se il flash illusorio è simile a quello reale. Per rispondere
consideriamo un altro grafico che combina i precedenti (fig. 1.7). Sull’asse delle
ordinate abbiamo i flash percepiti, mentre sull’asse delle ascisse abbiamo il numero di
beep e il numero di flash.
Fig. 1.7. Comparazione delle differenti condizioni nell’esperimento
Notiamo che la risposta degli osservatori era la stessa laddove erano esposti ad un flash
accompagnato con due beep, o nel caso di due flash accompagnati con uno o nessun
beep. Ciò suggerisce che un singolo flash accompagnato da due beep è percettivamente
equivalente a due flash accompagnati da uno o nessun beep.
17
In base a questo esperimento, dunque, il numero di beep influenza il numero di flash
percepiti. In questi studi, tuttavia, la temporizzazione degli stimoli era fissata ad un
singolo valore. Lo studio di Shams prosegue chiedendosi fino a che distanza temporale i
beep possono influenzare la percezione visiva, perché all’aumentare della distanza
temporale tra il flash e i beep, il fenomeno illusorio diventa via via più improbabile. Per
questo Shams e alcuni colleghi hanno effettuato un secondo esperimento che, sulla base
dei risultati di quello appena descritto, vuole trovare e misurare una “finestra temporale”
dentro la quale il suono altera la percezione visiva, cioè l’intervallo di tempo in cui
avviene l’integrazione sensoriale e il “legame” tra gli stimoli di diversa modalità
sensoriale. Tale finestra è stata definita temporal binding window (TBW).
La configurazione degli stimoli (visivi e acustici) era la stessa del primo esperimento,
col disco visivo su uno schermo e gli altoparlanti ai lati. Cambia invece il numero di
beep e flash. In questo caso in ogni trial un flash veniva accompagnato da due beep.
Uno dei beep era sempre fisicamente contemporaneo ad un flash, mentre la
presentazione temporale dell’altro beep variava da trial a trial secondo certi opportuni
intervalli SOA (stimulus onset asynchronies): 25, 70, 115, 160, 205, 250 ms tra un beep
e l’altro. Il beep solitario poteva precedere o seguire di un certo SOA la coppia flashbeep fornita simultaneamente (fig. 1.8).
Come nell’esperimento precedente il compito degli osservatori era quello di riportare il
numero di flash percepiti.
Fig. 1.8. Profilo temporale degli stimoli nel secondo esperimento
18
I risultati di questo secondo esperimento sono mostrati nella figura seguente (fig. 1.9):
sull’asse delle ordinate è riportata la percentuale di trial in cui gli osservatori hanno
visto più di un flash; questa può essere vista come una misura dell’intensità e della forza
del fenomeno illusorio. Sull’asse delle ascisse è riportato il timing del beep variabile
rispetto alla coppia contemporanea beep-flash (cioè il valore di SOA). Lo zero denota il
momento in cui viene dato il flash, mentre la parte positiva e negativa denota il
momento il cui viene dato il beep singolo, negativo se fornito prima del flash, positivo
se fornito dopo. Notiamo che l’illusione diminuisce da ±70 ms circa, ma tuttavia è
ancora significativa a ±115 ms.
Fig. 1.9. Risultati del secondo esperimento
Quindi questi risultati suggeriscono che il fenomeno del flash illusorio tende a svanire
quando il secondo beep è troppo lontano dal flash ed esce dalla finestra temporale
d’integrazione.
La finestra d’integrazione è quindi fondamentale per l’occorrenza di tale fenomeno e
obiettivo di molte ricerche è studiare e misurare tale finestra che ci consente di capire e
misurare l’intervallo d’integrazione multisensoriale. Questa finestra non è infatti uguale
per tutti i soggetti, e può essere modificata dalla presenza di patologie o anomalie.
Particolarmente interessante è il caso dei soggetti autistici.
19
1.4 DISTURBI DELLO SPETTRO AUTISTICO
L’autismo è un disturbo psichiatrico e neurologico che coinvolge diverse funzioni
cerebrali; si manifesta solitamente dai primi anni di età e comporta diversi deficit che
coinvolgono la comunicazione e i meccanismi di integrazione sociale con le altre
persone e di interazione con il mondo circostante, portando il soggetto all’isolamento.
Le cause eziologiche della sindrome sono molte e includono malformazioni genetiche,
caratteristiche ambientali o nascita prematura. Ciò che sembra comune a tutti gli
individui colpiti da autismo è un atipico comportamento in risposta a stimoli sensoriali,
che li porta ad avere problemi di comunicazione e di interazione [5].
Le possibili cause e i sintomi sono quindi molteplici, a seconda della gravità cambiano
da soggetto a soggetto, al che dare una definizione unica della sindrome è impossibile,
per cui per tutta una serie di patologie che hanno in comune queste difficoltà di
comunicazione e d’integrazione sociale si parla di Disturbi dello Spettro Autistico
(ASD, Autistic Spectrum Disorder).
La ricerca sulla neurofisiologia dell’autismo si è focalizzata inizialmente sullo studio
dell’elaborazione di semplici input sensoriali in diverse modalità, visiva, tattile, acustica
[5].
Lo studio dell’elaborazione degli stimoli acustici è essenziale per capire l’origine dei
disturbi autistici. Un metodo per misurare e studiare il percorso dell’informazione
acustica e di come viene elaborata è attraverso le risposte del tronco encefalico in cui
l’attività elettrica viene evocata da una serie di stimoli quali suoni e semplici toni.
L’attività elettrica viene misurata tramite elettrodi posizionati sullo scalpo. Tali studi
hanno però mostrato risultati contrastanti. Le risposte del tronco encefalico non sono
sufficienti a spiegare i deficit di tutti i soggetti autistici, però suggeriscono che in questi
soggetti differenze nell’elaborazione acustica (ad esempio discriminazione di toni e
linguaggio) avvengono già in questa area [5].
Oltre all’attività tronco encefalica, l’elaborazione dell’informazione acustica è stata
esaminata usando i potenziali evento correlati (ERP) con elettroencefalografia (EEG) e
magnetoencefalografia (MEG). I risultati riportano delle latenze atipiche anche al livello
della corteccia uditiva primaria [5].
In generale quindi studi neurofisiologici sull’elaborazione dell’informazione acustica
negli autistici riportano un’attività neurale atipica all’inizio dell’elaborazione dello
stimolo acustico, già a livello della corteccia acustica primaria. Tuttavia, alcuni studi
mostrano capacità percettive aumentate dei soggetti autistici in risposta a stimoli
20
acustici. Per esempio, è stato mostrato che individui con autismo hanno una miglior
capacità di discriminazione dei suoni in confronto ai soggetti sani [6].
Anche disturbi della sensitività tattile sono riportati tra i disturbi tipici dell’autismo,
anche se hanno ricevuto un’attenzione minore rispetto a disturbi di sensitività acustica.
Vista l’eterogeneità dei disturbi autistici però anche questo dominio va approfondito.
I soggetti autistici riportano anche atipici comportamenti in seguito alla presentazione di
stimoli visivi, ma anche qui, come nel caso dell’elaborazione acustica, i risultati sono
contrastanti [5].
In generale, dati i risultati contrastanti, si ritiene che le abilità percettive degli autistici
dipendono dalla natura e dalla complessità degli stimoli, nel caso di stimoli complessi
c’è un calo delle capacità di percezione, nel caso di stimoli semplici invece un aumento
[6] [7].
Oltre ad essere affetti da deficit che si presentano nei casi di stimoli sensoriali
unimodali, i soggetti autistici riportano deficit anche nel caso di stimoli sensoriali
multimodali. Tali deficit e comportamenti atipici si pensava fossero dovuti ad una
inabilità ad elaborare contemporaneamente stimoli di diversa modalità. In realtà è stato
dimostrato che i soggetti autistici presentano fenomeni illusori di percezione, il che
indica che la capacità di interazione multisensoriale è presente in tali soggetti. Tuttavia,
differenze rispetto ai soggetti sani sono state evidenziate negli aspetti temporali
dell’elaborazione multisensoriale.
Differenze evidenti ed importanti sono altresì presenti per l’integrazione multisensoriale
di basso e alto livello, cioè per i compiti cognitivi più complessi, quali il linguaggio e la
sua comprensione.
E’ noto che nell’autismo le difficoltà legate al comportamento sociale coesistono con
gravi problemi in funzioni complesse cognitive, come la percezione, l’attenzione, la
memoria, le emozioni, il linguaggio. La ricerca si è dedicata ad ognuna di queste aree,
studiando come i soggetti autistici decodificano input esterni, come eseguono compiti
attenzionali, di memoria, come elaborano le emozioni, se hanno o meno gravi deficit di
linguaggio. I risultati sono contrastanti, in letteratura non si trova quindi una causa
primaria e univoca delle varie disfunzioni associate all’autismo. Tuttavia, tali risultati
hanno mostrato che una componente essenziale di tutte queste funzioni è il processo
temporale dell’informazione. Tutte queste complesse funzioni richiedono l’interazione
ed integrazione di informazioni tra varie aree cerebrali, processi che devono avvenire
con precisi vincoli temporali [8].
21
Inoltre, è importante sottolineare che le anomalie dei soggetti autistici in compiti di alto
livello, possono riflettere – almeno in parte – disabilità a più basso livello, quali ad
esempio anomalie nell’interazione tra stimoli multisensoriali. Infatti, una alterazione
nelle caratteristiche del flusso di informazioni in ingresso, può avere profonde
implicazioni nelle successive elaborazioni di più alto livello. In particolare, data
l’importanza della integrazione multisensoriale nell’apprendimento, nella percezione
coerente della realtà, nel linguaggio, nella memorizzazione, una alterazione negli aspetti
temporali dell’integrazione multisensoriale può ripercuotersi profondamente a tutti i
livelli percettivi e cognitivi.
1.5 STUDI DI INTEGRAZIONE MULTISENSORIALE NEI SOGGETTI
AUTISTICI
Abbiamo visto come alcuni fenomeni di interazione multisensoriale nei soggetti sani
siano stati messi in evidenza usando semplici input come flash e beep acustici, come il
caso dello studio di Shams precedentemente trattato.
In uno studio del 2007 di van der Smagt et al. [9] il sound-induced flash illusion è stato
usata per testare l’integrazione audiovisiva durante funzioni cognitive complesse nei
soggetti autistici. Una integrazione multimodale anomala in questi soggetti può portare
ad una diminuzione dell’occorrenza del fenomeno illusorio o ad una minore intensità
dello stesso se confrontato con quello che avviene nei soggetti sani.
L’esperimento in questo studio consisteva in 12 condizioni differenti a cui sono stati
sottoposti un gruppo di soggetti autistici e un gruppo di soggetti sani di controllo: 3
condizioni visive dove venivano presentati 1, 2 o 3 flash, combinate con 4 condizione
acustiche, 0, 1, 2 o 3 beep. Talvolta il numero di flash e beep presentati era uguale, altre
volte no. La condizione più rilevante era quella di un unico flash presentato come nello
studio di Shams. Come in quest’ultimo studio, anche qui sono stati usati dei beep
provenienti da altoparlanti e dei flash provenienti da uno schermo, un disco bianco su
sfondo nero. La presentazione del disco era di 17 ms. Nel caso di flash multipli
presentati, la distanza temporale tra gli stimoli (SOA) visivi era di 50 ms. I beep invece
avevano durata di 9 ms, separati da un SOA di 50 ms nel caso di beep multipli. La
distanza tra il primo beep e il primo flash era di 17 ms (fig. 1.10).
22
Fig. 1.10. Profilo temporale degli stimoli nell’esperimento
I risultati sono presentati nella figura successiva (fig. 1.11), il numero di flash riportati
dai soggetti è riportato in funzione del numero di beep presentati. Ogni curva riferisce
ad un diverso numero di flash presentato: 1, 2 o 3 flash.
Ciò che si prefiggeva tale esperimento era di mostrare se i soggetti autistici mostrassero
una normale o anormale integrazione audiovisiva rispetto ai soggetti sani. Dal grafico si
nota come l’aumento del numero di flash o del numero di beep porta ad un aumento del
numero di flash percepiti. In particolare si osserva il fenomeno della fusion illusion nel
caso di più flash associati ad un singolo beep (i soggetti tendono a fondere insieme più
flash e a percepire quindi un numero inferiore di flash rispetto al numero effettivamente
presentato) e il fenomeno della fission (o flash illusion) in cui i soggetti tendono a
percepire un numero superiore di flash nel caso in cui il numero di beep presentati sia
superiore al numero di flash presentati. Tale studio dimostra che, nelle condizioni
sperimentali adottate, i fenomeni illusori sono presenti anche nei soggetti autistici e
sono paragonabili a quelli dei soggetti sani, suggerendo che i soggetti autistici
preservano la capacità di integrare informazioni audiovisive [9].
23
Fig. 1.11. Effetti del numero dei beep presentati sul numero di flash riportati per soggetti sani e autistici
Tuttavia,
come
evidenziato
precedentemente,
di
fondamentale
importanza
nell’integrazione multisensoriale sono gli aspetti temporali; mentre l’interazione tra
stimoli temporalmente vicini può essere funzionalmente utile in quanto i due stimoli
hanno un’elevata probabilità di provenire da uno stesso evento ed oggetto, stimolo
temporalmente molto separati devono essere processati e identificati come tali data
l’elevata probabilità che provengano da oggetti od eventi differenti. Gli aspetti
temporali di interazione multisensoriale sembrano essere alterati nei soggetti autistici.
Per esempio Szelag et al. [8] hanno mostrato come bambini autistici abbiano difficoltà a
riprodurre la lunghezza di stimoli visivi e acustici presentati con una durata standard.
Ciò significa che ci sono anormalità nel processamento temporale delle informazioni e
degli stimoli multisensoriali.
Una differenza importante tra soggetti autistici e sani è l’abilità di combinare parti di
informazioni in una percezione unica.
Studi recenti, infatti, hanno mostrato differenze nella capacità dei soggetti autistici di
combinare le informazioni provenienti da differenti modalità. Un esempio di questa
elaborazione multisensoriale alterata è la ridotta suscettibilità all’effetto McGurk.
L’effetto McGurk si verifica quando si osserva un movimento delle labbra che
suggerisce la pronuncia di una certa sillaba mentre se ne ascolta un’altra diversa; il
suono percepito è influenzato dalla visione, e quindi si ha la sensazione di percepire una
sillaba che è una via di mezzo tra quella vista e quella ascoltata. Nel caso dei soggetti
autistici questo effetto è meno evidente rispetto ai soggetti sani [10].
24
Uno studio recente si è occupato di evidenziare eventuali differenze temporali
nell’elaborazione di informazioni di stimoli semplici acustici e visivi tra soggetti sani e
autistici, in particolare tra bambini e adolescenti con uno sviluppo normale (TD, typical
development) e bambini e adolescenti autistici [11].
In precedenza è stato descritto uno studio che si prefiggeva di dimostrare il fenomeno
illusorio descritto da Shams nei soggetti autistici. Tale studio indicava l’abilità
preservata, nei soggetti autistici, di interazione multisensoriale; dal momento che in essi
si presentavano fenomeni illusori simili a quelli dei soggetti sani. Tuttavia tale studio
non esaminava se fossero eventualmente presenti differenze nella temporal binding
window tra soggetti sani ed autistici. Lo studio che descriveremo adesso si è occupato
proprio di questo. L’ipotesi era che cambiamenti nei parametri temporali degli stimoli
acustici e visivi utilizzati per produrre l’illusione, potessero dare delle differenze nella
finestra d’integrazione di stimoli multisensoriali nei soggetti autistici.
Come anche nello studio di Shams che descrisse il fenomeno illusorio di un flash
indotto dal suono, anche in questo caso è stato fornito come stimolo visivo un flash dato
su uno schermo nero e come stimoli acustici dei beep forniti da un altoparlante.
L’obiettivo era quindi verificare se un beep sonoro singolo fornito prima o dopo ad un
flash accompagnato da un beep, causasse l’illusione di un ulteriore flash. Cruciale è il
timing con cui il beep ulteriore veniva fornito, se prima o dopo la coppia flash-beep e
soprattutto a che distanza temporale da questi.
Per ogni trial è stato fornito quindi uno stimolo visivo di durata 21 ms e in
contemporanea un beep sonoro lungo 7 ms. A seconda della condizione il flash poteva
essere accompagnato da 0, 1 o 2 beep. La condizione un flash accompagnato da due
beep è stata quella usate per definire la finestra temporale in cui avviene l’integrazione
sensoriale sia per soggetti di controllo sani sia per soggetti autistici [11].
25
Fig. 1.12. Configurazione degli stimoli e loro profilo temporale
In tali condizioni, i 2 beep sono stati presentati a diversa distanza temporale tra loro
(SOAs), mentre un beep veniva fornito sempre insieme a un flash, l’altro beep
precedeva (condizione SOA negativo) o seguiva (condizione SOA positivo) la coppia a
distanza di volta in volta diversa. La distanza tra i 2 beep andava da 25 ms a 500 ms
secondo il seguente incremento: 25, 50, 100, 150, 200, 300, 400, 500 (fig. 1.12).
Per ogni condizione SOA è stata verificata l’occorrenza del fenomeno illusorio, e i
risultati (fig. 1.13) dimostrano una forte presenza del fenomeno illusorio. Tra i due
gruppi, sani di controllo (TD) e autistici, sono state fatte comparazioni sia nella
condizione un flash accompagnato da due beep, quindi la condizione che comporta
l’illusione, sia nella condizione di controllo di un flash accompagnato da un singolo
beep, atta a verificare che il fenomeno illusorio occorrente dipendesse dal secondo beep
fornito e non si verificasse sempre. E’ importante notare che, anche in questa
condizione di controllo (1 flash e 1 beep), sia i soggetti sani che i soggetti autistici
talvolta riportavano di aver visto un flash in più, anche se la percentuale era maggiore
per soggetti autistici.
26
Fig. 1.13. Risultati dell’esperimento per soggetti sani e autistici
Come si vede in figura, il fenomeno illusorio è significativamente influenzato dal valore
di SOA (per entrambi i gruppi di soggetti, il fenomeno illusorio diminuisce al crescere
della distanza temporale tra i due beep), confermando quindi l’importanza dell’aspetto
temporale nell’integrazione di stimoli sensoriali di modalità diverse. Ma si può notare
una significativa differenza tra i due gruppi di soggetti: infatti al crescere della distanza
temporale tra i due beep, i soggetti sani mostrano una diminuzione del fenomeno
illusorio molto più rapida dei soggetti autistici, sebbene anche in questi l’illusione sia
decrescente al crescere della distanza temporale tra i due beep acustici. Ciò indica
quindi che i soggetti autistici mostrano una maggiore propensione nel riportare
l’illusione rispetto ai soggetti sani.
Un’analisi statistica effettuata mediante t-test, che confronta l’incidenza del fenomeno
illusorio ad ogni SOA rispetto alla condizione di controllo (1 flash e 1 beep), mette in
evidenza una differenza significativa tra il numero di flash percepiti nella condizione
due beep e 1 flash rispetto alla condizione di controllo in una determinata finestra
temporale. Tali analisi suggeriscono approssimativamente una larghezza doppia della
finestra temporale d’integrazione nei soggetti autistici, che precisamente va da -300 ms
a 300 ms, mentre la finestra dei soggetti sani va da -150 ms a 150 ms.
Tale esperimento suggerisce dunque che i soggetti autistici presentino una finestra
temporale d’integrazione maggiore, all’interno della quale essi sono portati a legare
insieme stimoli multisensoriali di natura differente. Una possibile spiegazione di ciò è
27
che nei soggetti autistici i vincoli e le dinamiche temporali tra le regioni cerebrali
possono essere alterati [11].
I risultati riportati sono quindi in accordo con lo studio presentato in precedenza,
mostrando che l’integrazione multisensoriale di stimoli visivi e acustici di basso livello
avviene anche negli autistici; questo studio, in più, suggerisce una differenza nelle
finestra di integrazione multisensoriale tra i soggetti sani e i soggetti autistici.
28
Capitolo Secondo
Modello di rete neurale: descrizione qualitativa e
quantitativa
2.1 INTRODUZIONE
Finora sono stati descritti gli aspetti generali e le caratteristiche dell’integrazione
multisensoriale, in particolare dell’integrazione audiovisiva. Ciò sia per quanto riguarda
la normale fisiologia in soggetti sani, sia poi anche per quanto concerne ciò che succede
per soggetti autistici.
Il nostro obiettivo ora è simulare tramite un modello matematico di rete neurale questo
fenomeno di integrazione. A questo scopo, un modello preesistente è stato
opportunamente modificato allo scopo di approfondire lo studio di fenomeni
d’interazione audiovisiva, in particolare il fenomeno di un flash illusorio indotto dal
suono, nei soggetti sani e nei soggetti autistici per rimarcare se e come ci sono delle
differenze tra le due popolazioni.
Il modello qui proposto si basa su un precedente modello di rete neurale sviluppato dal
gruppo di Bioingegneria dell’Università di Bologna [12]. Tale modello, tramite dei
parametri fissati, è in grado si simulare il fenomeno descritto da Shams, quindi il flash
visivo illusorio indotto da beep sonori.
Tuttavia questo modello presenta dei limiti:
1. è ottimizzato per simulare il fenomeno illusorio soltanto nel caso in una
specifica situazione, non prendendo per esempio in considerazione una
variabilità del range temporale in cui vengono serviti ai soggetti i beep sonori;
2. riguarda una simulazione dell’integrazione audiovisiva per soggetti sani e non
patologici, quindi non considerando che determinati parametri possano essere
influenzati dall’incorrere della patologia.
Per approfondire questi ulteriori aspetti quindi, come vedremo in seguito, sono state
apportate opportune modifiche allo scopo di simulare e studiare il fenomeno
dell’integrazione in questi altri casi.
29
2.2 DESCRIZIONE QUALITATIVA DEL MODELLO
Il modello base da cui si è partiti consiste in due catene, due strati monodimensionali di
N neuroni, uno strato rappresenta l’area visiva e l’altro strato rappresenta l’area acustica
(fig. 2.1). Ogni cerchio grigio rappresenta un neurone, ogni linea invece rappresenta una
connessione sinaptica tra i neuroni. Le linee che terminano con una freccia indicano
connessioni sinaptiche eccitatorie, quelle che terminano con un pallino indicano
connessioni sinaptiche inibitorie.
Ogni neurone codifica le informazioni provenienti da una specifica posizione nello
spazio. Tutti i neuroni sono topologicamente allineati, quelli che occupano posizioni
vicine codificano posizioni prossimali nello spazio. Si è assunto che tra i neuroni dello
stesso layer, ci sia una distanza di 1°: dato che N è stato scelto essere uguale a 180, ogni
strato copre un’area di 180° dello spazio visivo in un caso e acustico nell’altro.
Questi valori sono fittizi e sono stati scelti per non appesantire troppo il modello dal
punto di vista computazionale.
Fig. 2.1. Schema di organizzazione della rete neurale
30
La risposta neurale è descritta mediante un’equazione differenziale con una dinamica
del primo ordine, che simula le proprietà integrative della membrana cellulare, e da una
caratteristica statica sigmoidale, che stabilisce la presenza di una soglia inferiore e di
una saturazione superiore per l’attivazione neurale. Il valore di saturazione è stato
imposto a 1, quindi tutte le uscite sono normalizzate al valore massimo.
Gli elementi neurali all’interno di ciascuno strato sono connessi tra loro attraverso
sinapsi laterali (sinapsi intra-area). Inoltre ogni neurone riceve degli input anche dai
neuroni dell’area sensoriale opposta (sinapsi inter-area). Così l’ingresso totale ricevuto
da ogni neurone risulta la somma di tre contributi: un input esterno, un input
proveniente dai neuroni della stessa area unisensoriale attraverso le sinapsi laterali, un
input cross-modale proveniente dai neuroni dell’altra modalità sensoriale.
Gli input visivi e acustici esterni sono rappresentati ognuno con una componente
spaziale e una componente temporale. Gli aspetti spaziali sono descritti con una
funzione Gaussiana che simula uno stimolo locale visivo o acustico, quindi un flash o
un beep, che origina da una posizione limitata dello spazio, filtrato poi dai campi
recettivi dei neuroni (receptive fields, RFs). Il punto centrale di tale funzione Gaussiana
(pa e pv come mostrati in figura precedente, rispettivamente per lo stimolo acustico e lo
stimolo visivo) corrisponde alla posizione di applicazione dello stimolo dal mondo
esterno, mentre la deviazione standard (σa e σv) è in relazione con la larghezza del
campo recettivo. Nel modello si considera come ipotesi che il sistema visivo sia
spazialmente più preciso rispetto a quello acustico, per cui si assume σv minore di σa.
Gli aspetti temporali degli input invece sono descritti usando una cinetica del secondo
ordine. Questa è caratterizzata da due costanti di tempo, rispettivamente τa e τv, una per
la modalità acustica e una per quella visiva.
Per l’input cross-modale è stato assunto che i neuroni delle due aree siano
reciprocamente connessi uno ad uno da sinapsi eccitatorie. Più precisamente, un
neurone riceve eccitazione solo dal neurone dell’altra modalità sensoriale posto in
corrispondenza della sua stessa posizione spaziale. La connessione tra le due aree è
simmetrica.
Gli input laterali originano invece dalle connessioni intra-area all’interno della stessa
area unimodale. Queste connessioni includono sinapsi laterali sia di tipo eccitatorio che
di tipo inibitorio, e hanno una disposizione classica a “cappello messicano”,
caratterizzata da una zona centrale eccitatoria circondata da un anello inibitorio. Così
ogni neurone eccita (ed è eccitato da) quelli vicini, e inibisce (ed è inibito da) quelli più
31
distanti. In questo modo stimoli distali della stessa modalità tendono a reprimersi
reciprocamente, interagendo tramite un meccanismo competitivo.
2.3 DESCRIZIONE MATEMATICA DEL MODELLO
In seguito, ciascun neurone sarà descritto attraverso un apice, m, che ne indica la
specifica area corticale (m = a o v , dove a è riferita all’area acustica e v a quella visiva),
e da un pedice, j, che si riferisce alla posizione spaziale relativa a quell’area (j = 1, 2,
3,…, 180). L’input e l’output della rete di un particolare neurone all’istante di tempo t
sono indicati rispettivamente con u(t) e y(t). Perciò, 𝑦𝑗𝑚 (t) rappresenta l’output di un
neurone nella posizione j-esima appartenente alla modalità m, e può essere descritta
dalla seguente equazione del primo ordine:
𝜏
𝑑𝑦𝑗𝑚 (𝑡)
𝑑𝑡
= −𝑦𝑗𝑚 (𝑡) + 𝐹(𝑢𝑗𝑚 (𝑡))
(1)
dove τ è la costante di tempo del neurone e F(u) rappresenta una relazione di tipo
sigmoidale:
𝐹(𝑢𝑗𝑚 ) =
1
1+𝑒
−𝑠(𝑢𝑚
𝑗 −𝜃)
(2)
dove s e θ sono i parametri che stabiliscono, rispettivamente, la pendenza e la posizione
centrale della funzione sigmoidale. La caratteristica sigmoidale è visibile nella figura
seguente (fig. 2.2). Il valore di saturazione è stato imposto a 1, così che le attività
neurali siano normalizzate al valore massimo.
32
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
20
25
Fig. 2.2. Caratteristica statica sigmoidale dei neuroni della rete
Per semplicità in questo lavoro tutti i neuroni appartenenti ad entrambe le aree sono stati
definiti utilizzando gli stessi parametri e la stessa costante di tempo nelle eq. (1) e (2).
L’input totale che arriva ad un neurone (la quantità 𝑢𝑗𝑚 (𝑡) nell’eq. (1)) è il risultato di
due componenti: la prima (detta componente “inside”) è il contributo delle sinapsi
laterali provenienti dai neuroni della stessa area ed è indicata come 𝑙𝑗𝑚 (𝑡); la seconda
(detta componente “outside”) è il risultato della combinazione tra un input esterno
𝑒𝑗𝑚 (𝑡), e un input cross-modale 𝑐𝑗𝑚 (𝑡), cioè proveniente dai neuroni dell’altra modalità,
trasmesso al neurone target attraverso le sinapsi inter-area eccitatorie.
Per simulare l’input laterale, 𝑙𝑗𝑚 (𝑡), i neuroni all’interno di ogni area interagiscono
tramite le sinapsi laterali eccitatorie e inibitorie: ogni neurone eccita ed è eccitato dai
neuroni prossimali, ed inibisce ed è inibito dai neuroni più distali. Quindi, l’input che un
neurone visivo o acustico riceve dagli altri neuroni della sua stessa area è definito come:
𝑚
𝑙𝑗𝑚 (𝑡) = ∑𝑘 𝐿𝑗𝑘
∙ 𝑦𝑘𝑚 (𝑡)
(3)
dove 𝑦𝑘𝑚 (𝑡) è l’attività del neurone pre-sinaptico della modalità m alla posizione k,
𝑚
mentre 𝐿𝑗𝑘
(𝑡) è la forza della sinapsi laterale che va dal neurone pre-sinaptico in
posizione k al neurone post-sinaptico in posizione j, entrambi della stessa modalità.
33
Queste sinapsi, come già accennato, sono organizzate secondo la distribuzione classica
detta a “cappello messicano” così definita:
𝑚
(𝑡) = {𝐿𝑒𝑥0 ∙ 𝑒
𝐿𝑗𝑘
(𝑑𝑗𝑘 )2
2𝜎2
𝑒𝑥
−
− 𝐿𝑖𝑛0 ∙ 𝑒
0
(𝑑𝑗𝑘 )2
2𝜎2
𝑖𝑛
−
𝑠𝑒 𝑑𝑗𝑘 ≠0
(4)
𝑠𝑒 𝑑𝑗𝑘 =0
In questa equazione, 𝐿𝑒𝑥0 e σex definiscono una funzione Gaussiana eccitatoria, mentre
𝐿𝑖𝑛0 e σin una inibitoria, e djk rappresenta la distanza tra il neurone pre-sinaptico in
posizione k e il neurone post-sinaptico in posizione j nella stessa area.
Per ottenere la distribuzione delle sinapsi a “cappello messicano” è stato imposto che
𝐿𝑒𝑥0 > 𝐿𝑖𝑛0 e 𝜎𝑒𝑥 < 𝜎𝑖𝑛 . Ciò fa sì che ogni neurone ecciti quelli vicini e inibisca quelli
lontani.
Gli elementi situati all’estremità della catena potrebbero non ricevere gli stessi input
dagli altri, producendo così degli effetti di bordo indesiderati. Per evitare questa
problematica si assume che lo strato di neuroni abbia una struttura circolare. Perciò, per
la distanza djk si assume la seguente definizione:
|𝑗 − 𝑘|, 𝑠𝑒 |𝑗 − 𝑘| ≤ 𝑁/2
𝑑𝑗𝑘 = {
𝑁 − |𝑗 − 𝑘|, 𝑠𝑒 |𝑗 − 𝑘| > 𝑁/2
(5)
dove N (=180) è il numero totale di neuroni in ogni area.
La condizione nulla per djk=0 evita i cosiddetti autoanelli, cioè casi di autoeccitazione
e/o autoinibizione dei neuroni. Le figure seguenti (fig. 2.3) mostrano la funzione
Gaussiana eccitatoria, quella inibitoria e la differenza tra le due.
34
Fig. 2.3. Distribuzione a “cappello messicano” delle sinapsi laterali di un neurone
Per minimizzare il numero di ipotesi alla base del modello, le sinapsi laterali sono
assunte con lo stesso pattern (questo descritto del “cappello messicano”) e con lo stesso
valore dei parametri per entrambe le aree.
Gli input esterni sono simulati mediante una funzione Gaussiana spaziale, per simulare
il campo recettivo dei neuroni. Considerando uno stimolo visivo o acustico
spazialmente localizzato e centrato alla posizione pm, l’input entrante alla rete può
essere descritto come:
𝑒𝑗𝑚 (𝑡) =
2
(𝑑𝑚
𝑗 )
−
𝐸0𝑚 𝑒 2(𝜎𝑚)2
(6)
dove 𝐸0𝑚 rappresenta la forza dello stimolo, 𝑑𝑗𝑚 è la distanza tra il neurone in posizione
j e lo stimolo alla posizione pm, e σm definisce la larghezza del campo ricettivo (RF) del
neurone. Come descritto in precedenza per le sinapsi laterali, per evitare indesiderati
35
effetti di bordo, anche gli input esterni e i campi recettivi sono implementati per avere
una struttura circolare. Per cui, la distanza 𝑑𝑗𝑚 è definita come:
𝑑𝑗𝑚
|𝑗 − 𝑝𝑚 |, 𝑠𝑒 |𝑗 − 𝑝𝑚 | ≤ 𝑁/2
={
.
𝑁 − |𝑗 − 𝑝𝑚 |, 𝑠𝑒 |𝑗 − 𝑝𝑚 | > 𝑁/2
(7)
L’input cross-modale, 𝑐𝑗𝑚 (𝑡), è ottenuto assumendo che ogni neurone riceve
un’eccitazione dal neurone dell’altra modalità posto nella corrispondente posizione
spaziale, c’è quindi una connessione reciproca uno a uno tra i neuroni delle due aree:
𝑐𝑗𝑚 (𝑡) = 𝑊 ∙ 𝑦𝑗𝑚 (𝑡 − ∆𝑡).
(8)
Con W indichiamo il peso della reciproca eccitazione tra i neuroni delle due aree. ∆t è il
ritardo (delay) che rappresenta la latenza con cui l’input cross-modale è scambiato tra la
corteccia visiva e l’acustica.
L’input esterno e l’input cross-modale, entrambi di tipo eccitatorio, sono responsabili
della componente outside dell’input. Tuttavia, prima che questi influenzino la risposta
neurale, vengono filtrati da un’equazione differenziale del secondo ordine che simula la
dinamica temporale dello stimolo nella corteccia, cioè simula gli aspetti temporali dei
campi recettivi.
Indicando con 𝑜𝑗𝑚 (𝑡) la componente outside degli input dopo questo filtraggio,
abbiamo:
{𝑑
𝑑𝑡
𝑑 𝑚
𝑜 (𝑡)
𝑑𝑡 𝑗
𝛿𝑗𝑚 (𝑡) =
𝐺𝑚
𝜏𝑚
= 𝛿𝑗𝑚 (𝑡);
∙ [𝑒𝑗𝑚 (𝑡) + 𝑐𝑗𝑚 (𝑡)] −
2∙𝛿𝑗𝑚 (𝑡)
𝜏𝑚
−
𝑜𝑗𝑚 (𝑡)
(𝜏𝑚 )
;
2
(9)
36
dove Gm rappresenta il guadagno, τm definisce le costanti di tempo della dinamica.
Quest’ultima equazione rappresenta una risposta all’impulso di secondo ordine con due
poli reali coincidenti. Questa è frequentemente usata nei modelli di reti neurali per
simulare l’evoluzione temporale degli input neurali e le dinamiche delle sinapsi.
Nell’esempio della prossima figura (fig. 2.4) è mostrata l’evoluzione temporale della
componente outside dell’input che arriva al neurone target visivo o acustico (A), quando
uno stimolo impulsivo esterno è applicato (B).
Come si nota l’input esterno acustico è più forte, ma leggermente più breve del visivo,
la risposta neurale dei neuroni acustici è più rapida di quella visiva; per via della sua
costante di tempo più piccola torna a riposo prima dell’area visiva che rimane attiva più
a lungo.
La linea tratteggiata orizzontale rappresenta la soglia di attivazione neurale, quando
l’input in ingresso al neurone è forte da superare tale soglia il neurone si attiva e
risponde all’input.
Fig. 2.4. Evoluzione temporale della componente outside (A) dopo aver dato stimolo esterno (B)
37
In base a quanto detto precedentemente, l’input totale, 𝑢𝑗𝑚 (𝑡), ricevuto da un neurone
della modalità m alla posizione j è definito come:
𝑢𝑗𝑚 (𝑡) = 𝑙𝑗𝑚 (𝑡) + 𝑜𝑗𝑚 (𝑡).
(10)
Come detto è quindi la somma delle componenti precedentemente descritte: il
contributo delle sinapsi laterali e il contributo delle sorgenti esterne, cioè la somma
dell’input fornito dall’esterno e del contributo delle sinapsi inter-area.
Per quanto riguarda l’assegnazione di tutti i parametri del modello, i valori sono stati
dati in base a dati presenti in letteratura e in accordo a tutti i criteri discussi in
precedenza. Sotto è riportata una tabella con i valori del modello base.
Neuroni
N=180
θ=16
s=2
τ=5 ms
τv=25 ms
Ga=e1
τa=15 ms
E0a=3
σa=32
Dinamica input
Gv=e1
Campi recettivi
E0v=1
σv=4
Sinapsi
W=0.35
∆t=16 ms
Lex0=2
σex=3
Lin0=1.8
σin=24
Tab. 2.1
Evidenze fisiologiche hanno mostrato che nel cervello il processo dell’informazione
acustica è più veloce, e i neuroni corticali acustici hanno una minore latenza di quelli
della corteccia visiva. Insieme a ciò, la corteccia visiva presenta campi recettivi spaziali
più piccoli, e quindi una maggior risoluzione spaziale, ma di contro presentano una
minore risoluzione temporale.
In questo modello quindi, i neuroni visivi hanno campi recettivi spaziali più piccoli
rispetto a quelli acustici, ma una maggiore costante di tempo. Queste sono le uniche
38
differenze tra le due aree, tutti gli altri parametri (per esempio i parametri della
dinamica delle sinapsi) sono stati assunti uguali per tutti i neuroni delle aree, per
semplicità e per ridurre le assunzioni nel modello.
Per quanto riguarda i parametri dei neuroni, l’ascissa centrale, θ, è assegnata per avere
un’attività trascurabile dei neuroni in condizioni di riposo, cioè in assenza di input
esterni. La pendenza della relazione sigmoidale, s, è assegnata per avere una transizione
graduale, non repentina, dalla situazione di riposo alla saturazione in risposta ad uno
stimolo dall’esterno.
I parametri che invece stabiliscono la forza e l’ampiezza delle sinapsi laterali in
entrambe le aree sono assegnati per soddisfare delle precise condizioni: l’inibizione
deve essere forte per garantire un meccanismo competitivo tra due stimoli all’interno
della stessa area, il bilancio tra inibizione ed eccitazione deve essere tale da evitare
problemi di instabilità, per esempio un’incontrollata eccitazione che si propaga in tutta
l’area.
La forza delle sinapsi inter-area (W) è assegnata in modo che sia sufficientemente alta
affinché l’input cross-modale proveniente da una data area possa rinforzare la risposta
dei neuroni dell’altra area laddove questi neuroni siano vicini alla loro soglia di
attivazione. Nello stesso tempo il valore di questa sinapsi è tenuta sufficientemente
bassa in modo che un input esterno in una data modalità non induca un’attività
“fantasma” nell’area dell’altra modalità, cioè che i neuroni di quest’ultima non si
attivino in mancanza dello stimolo per cui sono specifici.
2.4 RISULTATI DEL MODELLO DI BASE
Il modello fin qui descritto con i parametri assegnati come visto, è in grado quindi di
simulare il caso dell’illusione di un flash visivo indotto dal suono.
Innanzitutto il modello si comporta correttamente in risposta a stimoli unisensoriali,
come mostrato in figura 2.5 e in figura 2.6.
39
Fig. 2.5. Risposta del modello a stimoli unisensoriali acustici
40
Fig. 2.6. Risposta del modello a uno stimolo unisensoriale visivo
Nella figura 2.5 alla rete vengono presentati in ingresso due stimoli acustici in
successione ad una distanza di 56 ms l’uno dall’altro. Nella figura 2.6 invece alla rete
viene dato in ingresso un singolo stimolo visivo. Si può osservare che solo l’area che
riceve la stimolazione si attiva (acustica nel primo caso, visiva nel secondo caso),
mentre l’area non stimolata rimane silente.
In realtà, vista la presenza delle sinapsi inter-area, i neuroni dell’altra modalità risentono
dell’attività dei neuroni direttamente stimolati dall’input esterno, ma la loro attività resta
al di sotto della soglia al di sopra della quale abbiamo l’attivazione (terze immagini
delle figure 2.5 e 2.6).
Quindi è stata verificata la capacità della rete di riprodurre l’illusione visiva, ossia
quella riportata da Shams, e sono stati dati alla rete due input acustici e un input visivo
contemporaneo al primo beep sonoro (fig. 2.7).
In questo caso notiamo un picco di attività neurale visiva provocato dall’input fornito
dall’esterno, ma in seguito ne notiamo un altro che, visto che l’input visivo fornito
dall’esterno era uno solo, corrisponde al flash percettivo illusorio (fig. 2.9). Questo è
41
dovuto all’attività nell’area acustica (fig. 2.8), risultato del secondo input esterno,
trasmessa all’area visiva attraverso le sinapsi inter-area.
Fig. 2.7. Input esterni acustici e visivi dati insieme
Fig. 2.8. Attività neuroni acustici e visivi in risposta agli stimoli esterni visivi e acustici
Fig. 2.9. Dinamica totale input dei neuroni target visivi e acustici in risposta agli stimoli esterni
42
Si nota in particolare in questa ultima figura (fig. 2.9) che un solo input visivo produce
un’attività neurale sopra soglia; tuttavia quando lo stimolo visivo è accompagnato da un
input acustico, l’attività neurale visiva resta sopra soglia più a lungo, quindi i neuroni
visivi sono più attivi, di conseguenza l’attività dell’area visiva è più forte e più lunga.
Ciò fa sì che nonostante vada poi sotto soglia con la sua costante di tempo, non lo faccia
di molto, e quindi quando arriva l’input dall’area acustica provocato dal secondo beep
tramite le sinapsi inter-area, l’attività neurale dei neuroni visivi torna sopra soglia.
Come dimostrato nell’esperimento di Shams, il fenomeno illusorio non è debole, ma
resiste anche a modifiche di intensità dell’input fornito e modifiche delle caratteristiche
temporali. Tuttavia se diminuisce l’intensità dello stimolo acustico, diminuisce anche
l’intensità del percetto illusorio visivo, di conseguenza se l’input acustico è troppo
basso, l’illusione non avviene perché l’attività dell’area acustica non influenza
abbastanza l’area visiva (fig. 2.10).
Fig. 2.10. Attività neuroni acustici e visivi in risposta agli stimoli esterni visivi e acustici abbassando intensità stimoli
Stessa cosa avviene se si aumenta la distanza (SOA) tra i due beep acustici, si è visto
che già con una distanza di 65 ms l’illusione non occorre più (fig. 2.11).
Fig. 2.11. Attività neuroni acustici e visivi in risposta agli stimoli esterni visivi e acustici aumentando distanza
temporale tra i due stimoli acustici
43
Questi risultati dimostrano quindi che il modello può simulare l’effetto illusorio di
percezione di un flash indotto dal suono. Tuttavia è ottimizzato per simulare questo
effetto solo nel caso di una distanza tra i due beep (SOA) pari a 56 ms. In questo lavoro
di tesi invece vogliamo simulare l’effetto per più distanze temporali.
In particolare i nostri obiettivi sono:
1. simulare il fenomeno illusorio a distanze temporali (SOA) tra i beep differenti,
specificatamente in un intervallo che va da 25 ms a 500 ms;
2. simulare il caso in cui l’illusione visiva avvenga qualora un primo beep è dato
da solo ed è seguito dopo un certo SOA da una coppia di un beep e un flash dati
insieme (mentre il modello è ottimizzato laddove il primo beep e il flash sono
contemporanei e poi seguiti da un secondo beep);
3. vogliamo valutare tutto questo non solo per dei soggetti sani, ma anche per
soggetti autistici, simulando quindi l’integrazione audiovisiva e l’effetto Shams
anche per questa categoria di soggetti.
Per questo, come vedremo nel prossimo capitolo, abbiamo effettuato un’analisi di
sensitività del modello di base, al fine di apporre opportune modifiche dei parametri per
poter perseguire questi obiettivi.
44
Capitolo Terzo
Analisi di sensitività del modello: risposta del modello
(flash illusion) al variare del valore di alcuni parametri
3.1 ANALISI DEL MODELLO IN CONDIZIONE DI BASE PER DIVERSI
VALORI DI STIMULUS ONSET ASYNCHRONY (SOA)
Nel capitolo precedente è stato descritto il modello matematico da cui si è partiti e i suoi
limiti. Il nostro obiettivo è testare il fenomeno dell’illusione visiva dovuta a beep sonori
in una finestra temporale più ampia rispetto a quella per il quale il modello è stato
ottimizzato. In particolare il modello era ottimizzato per riprodurre il fenomeno illusorio
qualora i due beep sonori fossero temporalmente separati di 56 ms.
In questo lavoro, invece, vogliamo testare l’illusione visiva nel caso in cui l’intervallo
temporale che separa i due stimoli acustici (SOA) vari in un range molto più ampio: da
25 ms a 500 ms. In particolare i valori utilizzati per l’SOA sono quelli indicati in
letteratura, ovvero 25 ms, 50 ms, 100 ms, 150 ms, 200 ms, 300 ms, 400 ms, 500 ms.
Inoltre è necessario distinguere due condizioni di stimolazione che, negli esperimenti
riportati in letteratura, si sono mostrate entrambe in grado di produrre il fenomeno
illusorio.
Condizione 1: il primo beep è contemporaneo al primo flash e il secondo beep è isolato
(fig. 3.1). Ovvero la stimolazione (A+V) precede A.
45
1
visivo
0.8
0.6
0.4
0.2
0
0
100
200
300
400
500
600
700
800
1
acustico
0.8
0.6
0.4
0.2
0
0
100
200
300
400
500
600
700
800
Fig. 3.1. Configurazione stimolazione condizione 1
Condizione 2: il primo beep è isolato e il secondo beep è contemporaneo al flash (fig.
3.2). La stimolazione A precede (A+V).
1
0.8
0.6
0.4
0.2
0
0
100
200
300
400
500
600
700
800
900
0
100
200
300
400
500
600
700
800
900
1
0.8
0.6
0.4
0.2
0
Fig. 3.2. Configurazione stimolazione condizione 2
Il primo passo è stato quindi quello di testare il modello andando a vedere cosa succede
per questi valori diversi di SOA. Si noti che in queste prime simulazioni tutti i parametri
del modello sono stati mantenuti al loro valore basale.
46
Essendo il modello ottimizzato per un valore di SOA tra i due beep di 56 ms,
cominciamo a vedere cosa succede a una distanza di 50 ms.
SOA=50 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.3. Attività neuroni acustici e visivi ad un SOA di 50 ms tra i beep nella condizione 1
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.4. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 50 ms tra i beep nella condizione 1
Notiamo un picco di attività neurale visiva (blu) provocato dall’input fornito
dall’esterno, seguito da un secondo picco che corrisponde ad un flash percettivo
illusorio (fig. 3.3). Questo è dovuto all’attività in corso nell’area acustica (fig. 3.3),
risultato del secondo input esterno acustico (rosso), trasmessa all’area visiva attraverso
47
le sinapsi inter-area. Per cui per un SOA di 50 ms il modello replica bene l’effetto
Shams.
Si noti che la linea tratteggiata nella figura 3.4 (e nelle figure analoghe nel seguito)
indica la soglia di attivazione neurale, ovvero il valore dell’input al di sotto del quale il
neurone resta praticamente silente. Il valore di tale soglia dipende dai parametri
utilizzati per la funzione sigmoidale di attivazione neurale.
SOA=100 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.5. Attività neuroni acustici e visivi ad un SOA di 100 ms tra i beep nella condizione 1
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.6. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms tra i beep nella condizione 1
Anche in questo caso notiamo un primo picco visivo dovuto all’input visivo esterno
fornito (figura 3.5), ma non ne notiamo un secondo; possiamo tuttavia notare che si
48
verifica un secondo picco nell’input visivo dovuto all’attività dei neuroni acustici in
seguito alla presentazione del secondo beep, ma tale input non supera la soglia di
attivazione neurale, per cui non si verifica la percezione di un ulteriore flash (figura
3.6). Infatti come visibile nella figura 3.5 non abbiamo una ulteriore attività visiva in
seguito alla presentazione dell’altro beep. Quindi il modello, per un SOA di 100 ms non
riesce a replicare il fenomeno, di conseguenza non vi riuscirà neanche per SOA
superiori. Vediamo comunque per completezza, come si comporta il modello per un
SOA di 150 ms.
SOA=150 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.7. Attività neuroni acustici e visivi ad un SOA di 150 ms tra i beep nella condizione 1
25
visivo
acustico
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.8. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 150 ms tra i beep nella condizione 1
49
Come nel caso precedente abbiamo solo un picco visivo dovuto all’input esterno,
mentre il secondo beep non fornisce all’area visiva un input sufficiente per far sì che i
neuroni visivi superino la soglia di attivazione.
In conclusione, quindi il modello per SOA superiori a 50 ms non riesce a replicare
illusione. Complessivamente questo limite è dovuto al fatto che il secondo beep,
presentandosi con ritardo elevato dal primo beep (e quindi dallo stimolo visivo) agisce
sovrapponendosi all’input visivo precedente quando ormai quest’ultimo è sceso troppo
rispetto alla soglia di attivazione. Pertanto il contributo dovuto al secondo beep non è in
grado di portare l’input visivo nuovamente sopra soglia. Questo limite sembra quindi
essere dovuto principalmente a una dinamica (τv) del visivo troppo veloce.
SOA=25 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.9. Attività neuroni acustici e visivi ad un SOA di 25 ms tra i beep nella condizione 1
35
visivo
acustico
30
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.10. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 25 ms tra i beep nella condizione 1
50
Stavolta notiamo subito un andamento differente rispetto ai precedenti: si verifica un
unico picco acustico ed un unico elevato e duraturo picco visivo (fig. 3.9). Infatti, i due
beep acustici sono molto vicini e la dinamica temporale dei neuroni acustici (τa=15 ms)
non è sufficiente per permettere di generare due attivazioni separate. Di conseguenza i
due beep acustici determinano una relativamente lunga attivazione nell’area acustica;
quest’ultima, attraverso le sinapsi inter-area, determina una unica e prolungata
attivazione nell’area visiva.
Quindi, anche per un SOA di 25 ms il modello non riesce a replicare l’illusione a causa
del limite sulla dinamica temporale dei neuroni acustici.
Vediamo ora come si comporta il modello nella condizione 2, laddove il primo beep
venga dato singolo e poi sia seguito, dopo un certo SOA, da un beep e un flash dati
insieme.
Cominciamo con un SOA di 25 ms.
SOA=25 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.11. Attività neuroni acustici e visivi ad un SOA di 25 ms tra i beep nella condizione 2
51
35
visivo
acustico
30
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.12. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 25 ms tra i beep nella condizione 2
Anche in questo caso si nota come a causa della vicinanza dei due beep acustici, essi
non vengono percepiti separati e si ha un’unica attivazione nell’area acustica. Questa,
insieme all’input visivo fornito dall’esterno determina una prolungata (e unica)
attivazione visiva. Non si ha dunque il fenomeno illusorio di un secondo flash.
SOA=50 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.13. Attività neuroni acustici e visivi ad un SOA di 50 ms tra i beep nella condizione 2
52
25
visivo
acustico
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.14. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 50 ms tra i beep nella condizione 2
Anche in questo caso si ha un’unica prolungata attivazione nell’area visiva, dovuta
all’influenza esercitata dal doppio beep. In questo caso, il primo beep ha l’effetto di
generare un input non nullo all’area visiva ancora prima che venga presentato lo stimolo
visivo (infatti l’input all’area visiva è diverso da zero già un poco prima di 50 ms).
Questo accelera e rinforza l’attivazione nell’area visiva conseguente alla presentazione
del flash, che è a sua volta rinforzata dal secondo beep. Notiamo anche che l’elevato e
prolungato picco visivo influenza l’area acustica, per via delle sinapsi inter-area, la cui
attività infatti non scende subito a zero, ma risale per scendere poi lentamente.
SOA=100 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.15. Attività neuroni acustici e visivi ad un SOA di 100 ms tra i beep nella condizione 2
53
25
visivo
acustico
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.16. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms tra i beep nella condizione 2
Rispetto ai casi precedenti qui notiamo come il picco visivo abbia una durata inferiore.
Questo perché l’input all’area visiva causata dal primo beep tende a ridursi prima che
giunga il flash unito al secondo beep, per cui l’effetto nell’area visiva è quasi
esclusivamente dovuto al solo input visivo esterno fornito insieme al secondo beep.
Quindi anche in questo caso il modello non riesce a simulare l’effetto Shams. Mano a
mano che aumenta l’SOA il risultato non cambia.
Vediamo per completezza il caso di un SOA di 200 ms.
SOA=200 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
450
500
Fig. 3.17. Attività neuroni acustici e visivi ad un SOA di 200 ms tra i beep nella condizione 2
54
25
visivo
acustico
20
15
10
5
0
0
50
100
150
200
250
300
350
400
450
500
Fig. 3.18. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 200 ms tra i beep nella condizione 2
Anche qui il picco visivo è uno e causato dall’input visivo esterno. Notiamo che la
prima attivazione acustica determina un input non nullo all’area visiva, ma è di fatto
insufficiente a influenzare la risposta al singolo flash e quindi non è in grado di portare
alla percezione del flash illusorio. Pertanto, il modello con i valori di base dei parametri
non è adatto a replicare l’effetto Shams in nessun caso della condizione 2.
3.2 ANALISI DI SENSITIVITÀ DEL MODELLO: COMPORTAMENTO IN
RISPOSTA A DIVERSI SOA AL VARIARE DEI PARAMETRI
Poiché il modello, con i valori basali dei parametri non è in grado di riprodurre il
fenomeno illusorio per diversi SOA e nelle due condizioni 1 e 2, si è proceduto a
verificare se, variando i valori di alcuni parametri, il modello fosse in grado di replicare
il fenomeno illusorio in un set più vasto di configurazione degli input. Il passo
successivo è stato quindi provare a variare i parametri per analizzare il comportamento
del modello. Per prima cosa si è pensato di agire sulle costanti di tempo τv e τa per
modificare quindi la dinamica e l’andamento degli input in arrivo ai neuroni.
Vediamo cosa succede aumentando τv.
55
τv=30;
SOA=100 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.19. Attività neuroni acustici e visivi ad un SOA di 100 ms con τv=30
35
visivo
acustico
30
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.20. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms con τv=30
Se confrontiamo queste ultime figure con le 3.5 e 3.6 che mostravano l’andamento
sempre per un SOA di 100 ms, notiamo subito la differenza nell’andamento dell’attività
dei neuroni. L’attività dei neuroni visivi è più lenta, di conseguenza quando arriva il
secondo beep, l’area acustica dà un’influenza che è, questa volta, in grado di far risalire
l’input visivo oltre la soglia di attivazione. In realtà questa è ancora troppo lieve per
portare all’illusione visiva di un altro flash. Infatti se osserviamo la fig. 3.17, il secondo
picco visivo è molto piccolo, sotto 0,2. Per risolvere casi ambigui, nel modello e in
56
questo lavoro abbiamo fissato una soglia minima che denota se l’attivazione neurale
determina una percezione. Tale soglia è stata fissata arbitrariamente al valore 0,4, cioè
l’attività neurale deve raggiungere almeno il 40% del suo valore massimo, perché ad
essa corrisponda una percezione.
Vediamo che succede se si aumenta ancora τv.
τv=35;
SOA=100 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.21. Attività neuroni acustici e visivi ad un SOA di 100 ms con τv=35
35
visivo
acustico
30
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.22. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms con τv=35
Aumentando ancora la costante di tempo della dinamica visiva, l’influenza del secondo
beep è questa volta sufficiente a far risalire l’attività neurale visiva oltre la soglia e
57
portare così alla percezione illusoria. Quindi aumentando la costante τv abbiamo
ottenuto la simulazione del flash illusorio per un SOA pari a 100 ms.
τv=35;
SOA=150 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.23. Attività neuroni acustici e visivi ad un SOA di 150 ms con τv=35
25
visivo
acustico
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.24. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 150 ms con τv=35
Anche questa volta notiamo un primo picco nell’input totale che arriva all’area visiva
dovuto allo stimolo esterno. Si osserva anche un secondo picco nell’input visivo dovuto
58
al secondo beep, ma tale input non supera la soglia di attivazione neurale, per cui non
abbiamo illusione di un ulteriore flash dovuto al secondo beep. Quindi nonostante
l’aumento della costante di tempo, il modello non riesce a replicare il fenomeno per un
SOA pari a 150 ms. Perciò per ottenere il fenomeno anche per SOA ancora maggiori, si
dovrà alzare ancora la costante gradualmente. Tuttavia è importante notare che valori
maggiori della costante di tempo τv favoriscono l’emergere del fenomeno illusorio per
SOA elevati, ma nel contempo non permettono il verificarsi della percezione illusoria
per stimoli con SOA piccolo (in tal caso si tende infatti a generare uno stimolo visivo
prolungato). Una possibilità è quindi immaginare che il valore di τv vari in un range di
valori che tenga conto sia della variabilità inter-individuo sia della variabilità intraindividuo (dovuta ad esempio ad una “rumorosità” nei parametri neurali).
Vediamo ora che succede se aumentiamo la costante di tempo acustica τa.
τa=20;
SOA=100 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
Fig. 3.25. Attività neuroni acustici e visivi ad un SOA di 100 ms con τa=20
59
40
visivo
acustico
35
30
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.26. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms con τa=20
L’attività acustica è più elevata e ciò influenza più a lungo l’area visiva, di conseguenza
il secondo beep riporta oltre la soglia l’attività visiva e si ha quindi il secondo picco che
indica l’effetto illusorio del secondo flash. Tuttavia, per SOA maggiori questo
incremento di τa non è sufficiente poiché l’attività visiva andrà tanto in basso che
l’attività acustica non riuscirà ad influenzarla abbastanza da farla andare sopra soglia.
Vediamo quindi cosa succede se aumentiamo ancora la costante τa.
τa=25;
SOA=100 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.27. Attività neuroni acustici e visivi ad un SOA di 150 ms con τa=25
60
45
visivo
acustico
40
35
30
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.28. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 150 ms con τa=25
Aumentando ancora la costante acustica notiamo un effetto finora mai incontrato. La
costante di tempo dell’attività acustica è più lenta e questa con la sua azione impedisce
di fatto all’attività visiva di diminuire, ma la eccita molto. Questo effetto già forte
aumenta ancora di più quando arriva poi il secondo beep. Le due aree si influenzano a
vicenda e l’attività dei neuroni va e rimane in saturazione.. Per cui alzare troppo la
costante acustica non è una soluzione accettabile; il modello è molto sensibile a questo
parametro.
Per riuscire a simulare più casi quindi si è deciso di usare dei parametri che variassero
in un certo range, con una distribuzione uniforme. In particolare uno di questi parametri
è la costante di tempo visiva τv, in quanto abbiamo visto come a seconda del suo valore
consente l’occorrenza dell’illusione visiva per diversi SOA. La costante di tempo
acustica τa invece è stata mantenuta bassa e non variabile, in quanto valori più alti di τa
tendono a dare origine a fenomeni di attivazione duratura (come mostrato in figura
3.27) o fenomeni oscillatori (le attività nelle due aree oscillano tra 0 e il valore
massimo, effetto qui non mostrato). Inoltre un valore di τa sufficientemente basso,
consente di ottenere la separazione dei due beep acustici ad SOA di 25 ms.
In questo caso, a seconda del valore di τv, che veniva casualmente campionato dalla
distribuzione uniforme, si è ottenuto che l’illusione visiva occorreva in pochi casi, in
particolare per gli SOA più bassi della condizione 1, mentre non occorreva in nessun
caso nella condizione 2. Il range all’interno del quale il parametro τv è stato
uniformemente campionato è tra 8 e 28. Inoltre per dare una maggiore variabilità alle
simulazioni altri parametri che variavano in certo range sono stati: W (forza delle
61
connessioni sinaptiche), E0a e E0v (forza degli input esterni acustici e visivi). In
particolare il range di variabilità per W era tra 0,4 e 0,6; per E0a tra 3 e 3,5; per E0v tra 1
e 2.
τa=7; τv=10;
SOA=25 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.29. Attività neuroni acustici e visivi ad un SOA di 25 ms con τv variabile nella condizione 1
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.30. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 25 ms con τv variabile nella
condizione 1
In questo caso notiamo come la costante di tempo acustica bassa consente la
separazione dei due beep acustici, che quindi vengono percepiti separati, e l’influenza
62
del secondo beep è questa volta sufficiente a far risalire l’attività neurale visiva oltre la
soglia e portare così alla percezione illusoria.
Vediamo per l’SOA di 50 ms con un altro valore random della costante visiva.
τa=7; τv=16;
SOA=50 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.31. Attività neuroni acustici e visivi ad un SOA di 50 ms con τv variabile nella condizione 1
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.32. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 50 ms con τv variabile nella
condizione 1
63
Anche in questo caso i due beep acustici vengono percepiti ben separati, e l’influenza
del secondo beep è tale da riuscire a far risalire l’attività neurale dell’area visiva oltre la
soglia e portare così alla percezione illusoria di un secondo flash.
τa=7; τv=25;
SOA=100 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
450
500
3.33. Attività neuroni acustici e visivi ad un SOA di 100 ms con τv variabile nella condizione 1
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
450
500
Fig. 3.34. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms con τv variabile nella
condizione 1
64
Anche questa volta l’influenza del secondo beep è tale da riuscire a far risalire l’attività
neurale dell’area visiva oltre la soglia, grazie anche alla costante di tempo visiva che fa
diminuire lentamente la dinamica dovuta al flash dato.
Vediamo un esempio per la condizione 2.
τa=7; τv=16;
SOA=50 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.35. Attività neuroni acustici e visivi ad un SOA di 50 ms con τv variabile nella condizione 2
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.36. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 50 ms con τv variabile nella
condizione 2
65
Qui il picco visivo è uno e causato dall’input visivo esterno. La prima attivazione
acustica determina un leggero input non nullo all’area visiva, che si attiva prima
dell’arrivo dello stimolo esterno, ma è insufficiente a dare un’attività tale da portare alla
percezione del flash illusorio.
A questo punto si è deciso di agire su un altro parametro, il ritardo (delay) tra le due
aree, cioè il tempo impiegato dall’informazione per andare da un’area all’altra
attraverso le sinapsi inter-area (es. da quella visiva a quella acustica, lo abbiamo
chiamato DelVA) e viceversa (da quella acustica a quella visiva, DelAV). Questo ritardo
nel modello iniziale era stato supposto come parametro fisso ed uguale. In un primo
tempo quindi l’idea è stata quella di variarlo in un range, ma risultati sono stati
insoddisfacenti. Per cui il ritardo è stato supposto non solo variabile all’interno di un
range, ma diverso da un’area all’altra, in particolare il ritardo dall’area acustica all’area
visiva (DelVA) è stato scelto maggiore del ritardo dall’area visiva all’area acustica
(DelAV). In questo caso sono stati ottenuti diversi casi di stimoli SOA in cui occorreva
l’illusione del secondo flash, e in entrambe le condizioni. In queste simulazioni i
parametri DelAV e DelVA sono stati uniformemente campionati negli intervalli 5-15 il
primo, 45-120 il secondo.
Vediamo qualche esempio.
τa=7; τv=14; DelAV=12; DelVA=72;
SOA=25 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.37. Attività neuroni acustici e visivi ad un SOA di 25 ms con parametri e ritardo variabili nella condizione 1
66
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.38. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 25 ms con parametri e ritardo
variabili nella condizione 1
In questo caso, SOA di 25 ms, i due picchi dei beep forniti sono molto vicini, ma
comunque distinguibili e separati per via della costante di tempo acustica bassa, e in
grado di influenzare l’area visiva che andando oltre soglia genera flash illusorio.
Vediamo casi di SOA a 50 ms e 100 ms simulati sempre considerando parametri
variabili.
τa=7; τv=15; DelAV=9; DelVA=50;
SOA=50 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.39. Attività neuroni acustici e visivi ad un SOA di 50 ms con parametri e ritardo variabili nella condizione 1
67
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.40. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 50 ms con parametri e ritardo
variabili nella condizione 1
τa=7; τv=25; DelAV=10; DelVA=100;
SOA=100 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.41. Attività neuroni acustici e visivi ad un SOA di 100 ms con parametri e ritardo variabili nella condizione 1
68
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.42. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms con parametri e ritardo
variabili nella condizione 1
Come si può notare subito in entrambi i casi abbiamo il secondo picco che denota
l’occorrenza del secondo flash illusorio dovuto ai beep. Quindi con la generazione
random dei parametri variabili, in particolare la costante di tempo visiva, il ritardo
DelAV e il ritardo DelVA, riusciamo ad ottenere l’effetto Shams in più casi di stimoli
SOA nella condizione 1.
Vediamo ora qualche esempio nella condizione 2.
τa=7; τv=16; DelAV=8; DelVA=88;
SOA=25 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.43. Attività neuroni acustici e visivi ad un SOA di 25 ms con parametri e ritardo variabili nella condizione 2
69
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.44. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 25 ms con parametri e ritardo
variabili nella condizione 2
Con una opportuna combinazione di valori per i parametri τv, DelAV e DelVA
(campionati casualmente da distribuzioni uniformi) si riesce ad ottenere l’effetto Shams
nella condizione 2, primo beep dato singolo, il flash dato invece in contemporanea al
secondo beep. In questo caso notiamo bene il secondo picco visivo, l’attività acustica
infatti influenza abbastanza l’area visiva da permettere all’attività visiva di andare
nuovamente oltre la soglia. Possiamo sincerarci che l’effetto illusorio sia dovuto
veramente ai 2 beep e che non si verifichi nel caso di un solo beep.
τa=7; τv=16; DelAV=8; DelVA=88;
SOA=0 (condizione di controllo, 1 flash 1 beep)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.45. Attività neuroni acustici e visivi nella condizione 1 flash 1 beep con parametri e ritardo variabili
70
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.46. Dinamica totale input dei neuroni target visivi e acustici nella condizione 1 flash 1 beep con parametri e
ritardo variabili
Nella condizione di controllo (1 flash 1 beep) il secondo picco visivo non occorre,
quindi l’effetto Shams è davvero dovuto al primo beep dato singolarmente prima.
Si noti che, anche negli altri casi qui riportati di illusione del secondo flash, ci siamo
sincerati che quei valori dei parametri non determinassero l’illusione in corrispondenza
a un singolo flash e a un singolo beep.
Questi sono degli esempi positivi per far vedere che la scelta dei parametri variabili e
dei ritardi variabili è servita a simulare l’effetto Shams, ma a volte nella generazione
random dei parametri sono usciti valori che non portavano all’illusione visiva.
Vediamo ora per un SOA di 50.
τa=7; τv=21; DelAV=12; DelVA=109;
SOA=50 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.47. Attività neuroni acustici e visivi ad un SOA di 50 ms con parametri e ritardo variabili nella condizione 2
71
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.48. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 50 ms con parametri e ritardo
variabili nella condizione 2
E anche per un SOA di 100 ms.
τa=7; τv=20; DelAV=12; DelVA=95
SOA=100 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.49. Attività neuroni acustici e visivi ad un SOA di 100 ms con parametri e ritardo variabili nella condizione 2
72
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.50. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms con parametri e ritardo
variabili nella condizione 2
Anche in questi casi quindi la scelta di aver messo la costante di tempo visiva variabile
e i ritardi variabili tra le due aree ci consente di simulare l’effetto Shams anche nel caso
di stimoli ad SOA di 50 ms e 100 ms nella condizione 2.
Infine, abbiamo voluto analizzare l’effetto di introdurre delle latenze nella elaborazione
dell’informazione acustica nell’area acustica: ovvero l’input subisce un ritardo puro
prima di cominciare ad essere processato. Questa modifica è stata introdotta per cercare
di simulare i risultati riportati da Foss-Feig [11] in base ai quali flash illusori erano
percepiti (anche nei soggetti sani) anche per SOA maggiori a 100 ms, sebbene in
percentuale bassa, nonché anche nel caso della situazione di controllo di un flash e un
beep. Mentre tali risultati non erano ottenibili variando esclusivamente i parametri τv,
DelAV e DelVA. Avendo simulato casi con due beep, i ritardi puri inseriti nel modello
sono stati 2, DelA1 la latenza di risposta dei neuroni acustici al primo beep, DelA2 la
latenza di risposta dei neuroni acustici al secondo beep. L’intervallo di variabilità scelto
per questi due parametri è stato tra 5 e 15.
Quindi vediamo qualche esempio di diversi SOA nelle due condizioni con l’aggiunta di
questi ritardi puri.
73
τv=23; DelAV=10; DelVA=63; DelA1=10; DelA2=5;
SOA=25 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.51. Attività neuroni acustici e visivi ad un SOA di 25 ms con parametri e ritardo tra le aree variabile e ritardi puri
sui neuroni acustici nella condizione 1
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.52. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 25 ms con parametri e ritardo tra le
aree variabile e ritardi puri sui neuroni acustici nella condizione 1
Aggiungendo due ritardi pure sui neuroni acustici in questa condizione di SOA di 25 ms
riusciamo a simulare l’effetto Shams. Il secondo picco acustico è in questo caso molto
alto, risente dell’attività visiva causata dal primo flash. Di conseguenza agisce in
maniera rilevante a sua volta sull’area visiva facendo salire sopra la soglia l’attività
neurale visiva e portando al flash illusorio.
74
τv=22; DelAV=5; DelVA=94; DelA1=14; DelA2=11;
SOA=50 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
450
500
3.53. Attività neuroni acustici e visivi ad un SOA di 50 ms con parametri e ritardo tra le aree variabile e ritardi puri
sui neuroni acustici nella condizione 1
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
450
500
Fig. 3.54. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 50 ms con parametri e ritardo tra le
aree variabile e ritardi puri sui neuroni acustici nella condizione 1
Anche in questo caso (SOA di 50 ms) con questa impostazione dei parametri riusciamo
a simulare l’effetto. L’attività acustica è forte (il secondo picco molto alto influenzato
dal primo flash), di conseguenza influenza l’area visiva la cui attività va oltre la soglia
di attivazione. Vediamo per SOA molto grandi.
75
τv=24; DelAV=6; DelVA=78; DelA1=9; DelA2=6;
SOA=300 ms (condizione 1)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
100
200
300
400
500
600
700
3.55. Attività neuroni acustici e visivi ad un SOA di 300 ms con parametri e ritardo tra le aree variabile e ritardi puri
sui neuroni acustici nella condizione 1
30
visivo
acustico
25
20
15
10
5
0
0
100
200
300
400
500
600
700
Fig. 3.56. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 300 ms con parametri e ritardo tra le
aree variabile e ritardi puri sui neuroni acustici nella condizione 1
Come vediamo anche per un SOA molto grande, 300 ms, l’effetto illusorio si verifica.
Tuttavia è importante notare che il flash illusorio non è dovuto al secondo beep, infatti
notiamo che l’influenza causata da quest’ultimo c’è, ma non abbastanza forte da portare
l’attività visiva oltre soglia. L’illusione è causata quindi dal primo beep. Ma ciò è in
76
linea con lo studio di Foss-Feig, secondo il quale l’occorrenza dell’illusione per SOA
molto grandi è simile all’occorrenza dell’illusione nella modalità di controllo, quando
viene fornito un singolo flash accompagnato da un singolo beep [11].
Quindi con lo stesso set di parametri, di cui alcuni variabili come la costante di tempo
visiva, i ritardi tra le aree (in particolare con DelVA>DelAV), i ritardi puri sull’area
acustica possiamo ottenere potenzialmente l’effetto Shams a tutti gli SOA esaminati
nella condizione 1 (sebbene, per valori elevati di SOA al di sopra di 150 ms, l’effetto
Shams non sia conseguente al secondo beep ma sia un effetto “spurio” della
presentazione di un singolo flash e di un singolo beep)
Vediamo ora nella condizione 2.
τv=16; DelAV=8; DelVA=57; DelA1=10; DelA2=18;
SOA=50 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
3.57. Attività neuroni acustici e visivi ad un SOA di 50 ms con parametri e ritardo tra le aree variabile e ritardi puri
sui neuroni acustici nella condizione 2
77
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
Fig. 3.58. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 50 ms con parametri e ritardo tra le
aree variabile e ritardi puri sui neuroni acustici nella condizione 2
In questo esempio per un SOA di 50 ms, il modello riesce a simulare il secondo flash
illusorio usando il set di parametri variabili e i ritardi puri nell’area acustica, i due
picchi acustici attivano molto l’area visiva e provocano l’attivazione neurale che porta
alla percezione di un secondo flash.
τv=16; DelAV=11; DelVA=50; DelA1=16; DelA2=7;
SOA=100 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
300
350
400
450
500
3.59. Attività neuroni acustici e visivi ad un SOA di 100 ms con parametri e ritardo tra le aree variabile e ritardi puri
sui neuroni acustici nella condizione 2
78
30
visivo
acustico
25
20
15
10
5
0
0
50
100
150
200
250
300
350
400
450
500
Fig. 3.60. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 100 ms con parametri e ritardo tra le
aree variabile e ritardi puri sui neuroni acustici nella condizione 2
Anche in queste ultime figure, che riguardano il caso di SOA di 100 ms, si nota come il
modello riesca a simulare l’illusione. La risposta all’input visivo esterno fornito è resa
più forte dal primo beep (la risposta visiva comincia prima che arriva il flash esterno),
influenza a sua volta l’attività dell’area acustica che ancora a sua volta agirà sull’area
visiva portando all’illusione.
τv=18; DelAV=14; DelVA=88; DelA1=12; DelA2=9;
SOA=150 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
100
200
300
400
500
600
700
3.61. Attività neuroni acustici e visivi ad un SOA di 150 ms con parametri e ritardo tra le aree variabile e ritardi puri
sui neuroni acustici nella condizione 2
79
30
visivo
acustico
25
20
15
10
5
0
0
100
200
300
400
500
600
700
Fig. 3.62. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 150 ms con parametri e ritardo tra le
aree variabile e ritardi puri sui neuroni acustici nella condizione 2
Anche in quest’ultimo esempio, il modello riesce a simulare l’illusione visiva. Il primo
beep attiva già l’area visiva la cui attività cresce, rispondendo quindi già da attiva e non
da una condizione di riposo all’input visivo esterno. L’influenza poi del secondo beep fa
risalire l’attività dei neuroni visivi causando l’illusione.
τv=22; DelAV=5; DelVA=108; DelA1=9; DelA2=12;
SOA=200 ms (condizione 2)
1
visivo
acustico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
100
200
300
400
500
600
700
800
3.63. Attività neuroni acustici e visivi ad un SOA di 200 ms con parametri e ritardo tra le aree variabile e ritardi puri
sui neuroni acustici nella condizione 2
80
30
visivo
acustico
25
20
15
10
5
0
0
100
200
300
400
500
600
700
800
Fig. 3.64. Dinamica totale input dei neuroni target visivi e acustici ad un SOA di 200 ms con parametri e ritardo tra le
aree variabile e ritardi puri sui neuroni acustici nella condizione 2
Anche in quest’ultimo esempio, il caso di uno degli SOA maggiori, 200 ms, il modello
riesce a simulare l’illusione visiva. Il primo beep notiamo attiva già l’area visiva, che
poi risponde all’input visivo esterno. L’influenza poi del secondo beep fa risalire
l’attività dei neuroni visivi causando l’illusione.
Quindi siamo partiti da un set di parametri fissi di base per il modello che ci dava il
fenomeno illusorio in solo un caso specifico, e siamo arrivati ad un altro set in cui
variano alcuni parametri (quali la costante di tempo visiva, i ritardi tra le aree, i ritardi
puri nell’area acustica) che potenzialmente può darci il fenomeno in più casi, in diversi
stimoli SOA, e in entrambe le condizioni sperimentali che ci interessano. Essendo il set
variabile, altre volte i parametri random ottenuti non sono stati tali da ottenere la
simulazione dell’illusione del secondo flash, per questo come vedremo nel prossimo
capitolo sono state fatte più prove e un certo numero di simulazioni.
81
Capitolo Quarto
Risultati: simulazione del fenomeno illusorio (flash
illusion) in soggetti sani e in soggetti autistici
4.1 SIMULAZIONI SOGGETTI SANI
Nel capitolo precedente è stato mostrato come attraverso un’analisi di sensitività del
modello per i diversi valori di SOA di nostro interesse, si è arrivati alla scelta e
all’impostazione di un certo set di parametri: W=0,4-0,6; E0a=3-3,5; E0v=1-2; θ=12;
τa=7; τv=8-28; DelAV=5-15; DelVA=45-120; DelA1=5-20; DelA2=5-20. Gli altri valori
sono stati tenuti ai valori di base visibili nella tabella 2.1.
Come abbiamo detto, il modello iniziale era ottimizzato per simulare l’effetto Shams
con un SOA tra il primo e il secondo beep pari a 56 ms e con il primo beep e il flash
presentati contemporaneamente. Il nostro obiettivo invece è stato simulare l’effetto
Shams per diversi valori di SOA: 25, 50, 100, 150, 200, 300, 400, 500 ms e in due
condizioni diverse di stimolazione (il beep singolo precede o segue la coppia beep +
flash).
Inoltre, ci poniamo l’obiettivo di simulare la sound-induced flash illusion non solo per
una popolazione di soggetti sani, ma anche per una popolazione di soggetti autistici: in
particolare, vogliamo verificare se differenze nel set di parametri del modello sono in
grado di spiegare la più ampia finestra temporale di integrazione multisensoriale (cioè
di occorrenza dell’illusione) nei soggetti autistici rispetto ai sani.
Avendo usato un set di parametri che variano uniformemente all’interno di un range di
valori, sono state fatte più prove di simulazione per verificare l’occorrenza dell’illusione
visiva ai diversi SOA, al fine poi di ricavare un valore medio e una deviazione standard
relativi alla occorrenza percentuale del fenomeno ad ogni SOA. In particolare sono stati
simulati 10 ipotetici soggetti e per ogni soggetto sono state ripetute 10 simulazioni ad
ogni SOA. Ad ogni simulazione, i valori dei parametri sono stati campionati a caso da
una distribuzione uniforme.
A questo punto per ogni SOA sono stati analizzati i dieci grafici che mostravano
l’attivazione neurale delle aree visive ed acustiche di ogni singolo “soggetto”, per
82
vedere laddove si verificasse l’effetto illusorio del secondo flash; in questo modo si è
ottenuto, per ogni ipotetico soggetto e per ogni SOA la percentuale di occorrenza
dell’illusione. Così facendo, per ogni SOA si ottengono 10 valori di percentuale di
occorrenza dell’illusione.
Di questi valori è stato trovato poi il valore medio (che indica la percentuale media in
cui si è verificato l’effetto Shams per ogni SOA) e la deviazione standard. E’ stato
quindi calcolato l’errore standard della media (SEM, standard error of the mean), che
misura la deviazione standard della media campionaria. Alla fine quindi si è ottenuto un
grafico che riporta sulle ascisse i valori dei vari SOA e sulle ordinate il valore medio
della percentuale di occorrenza dell’illusione per ogni SOA d’interesse.
Oltre a queste prove, sono state fatte delle simulazioni per testare il modello nella
condizione di controllo, ovvero quella in cui venivano dati solo un flash e un beep
insieme, al fine di verificare per quali valori di SOA, la condizione di un flash più due
beep si differenziasse dalla condizione un flash più un beep (cioè per verificare in quale
condizione di SOA, l’illusione fosse una conseguenza genuina del secondo beep e non
un fenomeno spurio dovuto esclusivamente alla presentazione di un flash simultaneo a
un beep). In particolare sono state fatte anche in questo caso dieci prove, in cui in
ognuna si ripetevano quaranta simulazioni con valori random dei parametri variabili.
Come nel caso precedente anche qui sono stati analizzati i grafici dell’attivazione
neurale per verificare l’occorrenza dell’illusione. Una volta ottenuti i dieci valori
indicanti la percentuale media dell’occorrenza del secondo flash per ognuna delle dieci
prove, se ne è calcolato il valore medio e il SEM.
Di seguito vengono mostrati quindi i risultati delle prove, effettuate in diverse
configurazioni del modello considerato, corrispondenti a diversi set di valori dei
parametri.
a)
Modello
in
condizioni
di
base
con
parametri
fissi
(τa=15;
τv=25;
DelAV=DelVA=16). Le prime prove sono state fatte per verificare cosa otteniamo con i
dati iniziali di base del modello da cui siamo partiti.
83
Mean Percentage of Two Flashes Reported
110
100
90
80
70
60
50
40
30
20
10
0
-500
-400
-300
-200
-100
0
SOA
100
200
300
400
500
Fig. 4.1. Risultati delle prove effettuate per tutti gli SOA nelle due condizioni sperimentali coi parametri basali
Nel grafico 4.1 è riportata l’occorrenza o meno del flash illusorio per ogni SOA. La
parte positiva delle ascisse indica gli stimoli SOA nella condizione 1, coppia beep-flash
seguita da un altro beep, la parte negativa indica gli stimoli SOA nella condizione 2,
beep singolo seguito da coppia beep-flash. Lo zero invece indica la condizione di
controllo, un beep e un flash forniti insieme.
In questa serie di prove essendo i parametri fissi e non variabili, è stata fatta una
simulazione per ogni SOA. Come ci aspettavamo, il modello riesce a simulare l’effetto
Shams solo per lo stimolo SOA di 50 ms nella condizione 1, in tutti gli altri casi
l’occorrenza dell’illusione visiva è nulla.
Da questo punto in poi nelle simulazioni abbiamo sempre messo variabili i seguenti
parametri di base: W=0,4-0,6; E0a=3-3,5; E0v=1-2; inoltre è stata abbassata la costante τa
da 15 a 7.
b) Modello con τv variabile (τv=8-28; DelAV=DelVA=16).
Vediamo ora che succede usando un range variabile per la costante di tempo visiva,
mantenendo ai valori base gli altri parametri. In questo caso quindi sono state fatte più
prove secondo il criterio spiegato prima.
84
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.2. Attività neuroni acustici e visivi ad un SOA di 50 ms nella condizione 1 di dieci soggetti
Nella figura precedente è riportato un esempio dei grafici che mostrano le attività dei
neuroni acustici e visivi ad uno stimolo SOA di 50 ms nella condizione 1 di dieci
soggetti. Come vediamo in cinque casi (3, 5, 7, 8, 9) l’illusione visiva avviene, c’è un
secondo picco visivo, le altre volte abbiamo un picco visivo solo.
Quindi in questo caso nel 50% dei casi abbiamo l’occorrenza dell’effetto Shams. E’ una
differenza rispetto al primo caso, visto che coi parametri del modello fisso, per un SOA
di 50 ms l’illusione occorreva sempre.
Vediamo un esempio nel caso di un SOA di 100 ms.
85
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.3. Attività neuroni acustici e visivi ad un SOA di 100 ms nella condizione 1 di dieci soggetti
In questo caso l’effetto illusorio avviene tre volte (1, 8, 9), quindi con una percentuale
media del 30%. Quindi con la costante di tempo visiva variabile abbiamo il risultato di
ottenere potenzialmente l’illusione in più casi, rispetto all’uso dei parametri di base.
Vediamo due esempi nella condizione 2.
86
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.4. Attività neuroni acustici e visivi ad un SOA di 50 ms nella condizione 2 di dieci soggetti con τv variabile
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.5. Attività neuroni acustici e visivi ad un SOA di 100 ms nella condizione 2 di dieci soggetti con τ v variabile
87
Nelle figure precedenti sono mostrate le attività dei neuroni per stimoli SOA di 50 e 100
ms nella condizione 2. In nessun caso occorre l’illusione, abbiamo solo un picco visivo
dovuto all’input esterno fornito. Quindi come con i parametri basali del modello, anche
usando un range variabile per la costante di tempo visiva τv non otteniamo l’illusione in
nessun caso nella condizione 2.
Vediamo ora il grafico finale trovato.
Mean Percentage of Two Flashes Reported
90
80
70
60
50
40
30
20
10
0
-500
-400
-300
-200
-100
0
SOA
100
200
300
400
500
Fig. 4.6. Risultati delle prove effettuate per tutti gli SOA nelle due condizioni sperimentali con τ v variabile
Rispetto al risultato precedente (fig. 4.1) abbiamo ottenuto l’illusione visiva non solo
per un SOA=50 ms, ma anche per un SOA di 25 ms (seppure con una percentuale
bassa), e per un SOA di 100 ms. In tutti gli altri casi però non si ottiene mai. Neanche
nella condizione di controllo, un flash e un beep, abbiamo mai l’effetto.
c) Modello con τv e Delay variabile (τv=8-28; DelAV=8-20; DelVA=8-20).
A questo punto introduciamo anche la variabilità per i ritardi tra le aree, prima
immaginando il range variabile uguale per i due ritardi, DelAV e DelVA. Vediamo cosa
otteniamo.
88
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
0
400
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
0
400
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.7. Attività neuroni acustici e visivi ad un SOA di 50 ms nella condizione 1 di dieci soggetti con τv variabile e
ritardi tra le aree variabili nello stesso range
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.8. Attività neuroni acustici e visivi ad un SOA di 100 ms nella condizione 1 di dieci soggetti con τv variabile e
ritardi tra le aree variabili nello stesso range
89
Nelle figure precedenti sono mostrate le attività dei neuroni per stimoli SOA di 50 ms
(fig. 4.7) e 100 ms (fig. 4.8) nella condizione 1, in questo caso sono stati impostati
variabili anche i ritardi tra le aree acustica e visiva. Rispetto ai risultati precedenti (fig.
4.4 e fig. 4.5) notiamo che l’illusione si verifica seppure in una percentuale minore di
casi.
Per SOA maggiori, non si riesce a replicare l’illusione. Come mostrato nell’esempio
nella figura successiva.
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.9. Attività neuroni acustici e visivi ad un SOA di 200 ms nella condizione 1 di dieci soggetti con τv variabile e
ritardi tra le aree variabili nello stesso range
Nella condizione 2, anche con i parametri impostati in questo modo, il modello non
riesce mai a simulare l’illusione (fig. 4.10).
Vediamo poi il grafico finale risultante.
90
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
0
400
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
0
400
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.10. Attività neuroni acustici e visivi ad un SOA di 150 ms nella condizione 2 di dieci “soggetti” con τv
variabile e ritardi tra le aree variabili nello stesso range
Mean Percentage of Two Flashes Reported
90
80
70
60
50
40
30
20
10
0
-500
-400
-300
-200
-100
0
SOA
100
200
300
400
500
Fig. 4.11. Risultati delle prove effettuate per tutti gli SOA nelle due condizioni sperimentali con τ v variabile e ritardi
tra le aree variabili nello stesso range
91
Otteniamo un andamento simile al precedente (fig. 4.4), in cui veniva fatta variare solo
la costante di tempo visiva, ma fissi i ritardi tra le aree. L’illusione occorre negli stessi
casi (per SOA di 25, 50, 100 ms), anche se in questi ultimi due casi la percentuale
media di occorrenza dell’effetto Shams è minore. Siamo quindi ancora lontani
dall’ottenere l’illusione potenzialmente per tutti gli SOA, e in entrambe le condizioni di
interesse.
d) Modello con τv, DelAV e DelVA variabili (τv=8-28; DelAV=5-15; DelVA=45-120).
Il passo successivo, in base anche all’analisi di sensitività illustrata nel capitolo
precedente, è stato quello di impostare un range variabile diverso per i due ritardi tra le
aree, in particolare con il range di DelVA maggiore del range di DelAV.
Vediamo cosa otteniamo.
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.12. Attività neuroni acustici e visivi ad un SOA di 25 ms nella condizione 1 di dieci soggetti con τv variabile e
ritardi diversi variabili tra le aree
92
Nel caso di stimolo SOA di 25 ms notiamo subito un miglioramento nei risultati, infatti
in questo esempio l’occorrenza dell’illusione è del 60%, laddove prima era invece molto
bassa.
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.13. Attività neuroni acustici e visivi ad un SOA di 50 ms nella condizione 1 di dieci soggetti con τv variabile e
ritardi diversi variabili tra le aree
93
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.14. Attività neuroni acustici e visivi ad un SOA di 100 ms nella condizione 1 di dieci soggetti con τv variabile e
ritardi diversi variabili tra le aree
Come notiamo in queste due ultime figure, anche per stimoli SOA di 50 ms e 100 ms, il
modello con questa impostazione dei parametri riesce a simulare talvolta il fenomeno
illusorio.
Vediamo nella condizione 2 cosa succede.
94
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.15. Attività neuroni acustici e visivi ad un SOA di 25 ms nella condizione 2 di dieci “soggetti” con τ v variabile
e ritardi diversi variabili tra le aree
Per la prima volta notiamo che l’effetto illusorio del secondo flash riusciamo a
simularlo anche nella condizione 2, al fine di ciò è stato quindi determinante impostare
diverso il ritardo variabile tra le aree. In particolare in questo caso l’occorrenza è del
30%. Abbiamo ottenuto quindi il risultato di avere potenzialmente l’illusione anche
nella condizione 2.
Per quanto riguarda gli altri stimoli SOA nella condizione 2, l’illusione è occorsa anche
per SOA di 50 ms e di 100 ms, anche se con basse percentuali. Inoltre in qualche caso si
è verificata anche per SOA molto maggiori, come 300 ms e 400 ms. Questo è molto
importante al fine di ciò che vogliamo ottenere, il modello ora quindi riesce a riprodurre
l’effetto Shams in una finestra temporale maggiore rispetto ai casi precedenti. Vediamo
il grafico risultante dopo tutte le prove.
95
Mean Percentage of Two Flashes Reported
90
80
70
60
50
40
30
20
10
0
-500
-400
-300
-200
-100
0
SOA
100
200
300
400
500
Fig. 4.16. Risultati delle prove effettuate per tutti gli SOA nelle due condizioni sperimentali con τ v variabile e ritardi
diversi variabili tra le aree
L’andamento a destra nel grafico qui mostrato fa vedere come sia evidente il
miglioramento dei risultati, in particolare notiamo che l’illusione avviene anche per
SOA pari a 25, 50, 100, 150 e 300 ms. E otteniamo anche un andamento decrescente del
fenomeno illusorio all’aumentare della distanza tra i beep. A sinistra, condizione
sperimentale 2, abbiamo lo stesso andamento anche se ancora poco evidente, ma
riusciamo a simulare l’effetto per diversi SOA (sebbene con una percentuale bassa)
mentre nelle varianti precedenti del modello nella condizione 2 non riuscivamo mai a
ottenere l’effetto illusorio del secondo flash. Nella condizione di controllo invece
l’illusione non si verifica mai. Nello studio di Foss-Feig et al. tuttavia è stato riportato
come talvolta l’illusione visiva avvenisse anche in questa condizione [11].
e) Modello con τv, DelAV, DelVA, DelA1 e DelA2 variabili (τv=8-28; DelAV=5-15;
DelVA=45-120; DelA1=5-20; DelA2=5-20). A questo punto, come descritto nel capitolo
precedente, abbiamo aggiunto dei ritardi puri variabili nell’area acustica, DelA1 e
DelA2.
Vediamo cosa otteniamo con qualche esempio.
96
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
0
400
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
0
400
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.17. Attività neuroni acustici e visivi ad un SOA di 25 ms nella condizione 1 di dieci soggetti con τ v variabile,
ritardi diversi variabili tra le aree, ritardi puri variabili nell’area acustica
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.18. Attività neuroni acustici e visivi ad un SOA di 50 ms nella condizione 1 di dieci soggetti con τ v variabile,
ritardi diversi variabili tra le aree, ritardi puri variabili nell’area acustica
97
L’aggiunta dei ritardi puri sull’area acustica mantiene la possibilità che il modello riesca
a replicare l’effetto Shams per gli SOA più piccoli, 25 ms e 50 ms. La differenza
rispetto ai casi precedenti però, è che ci dà la possibilità di replicare il fenomeno
illusorio per tutti i valori SOA, anche i più grandi.
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
0
500
1000
0
0
500
1000
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
1
1
0.5
0.5
0
0
500
1000
0
0
500
1000
0
500
1000
0
0
500
1000
0
0
500
1000
0
500
1000
Fig. 4.19. Attività neuroni acustici e visivi ad un SOA di 300 ms nella condizione 1 di dieci soggetti con τ v variabile,
ritardi diversi variabili tra le aree, ritardi puri variabili nell’area acustica
Qui è mostrata una prova per un SOA di 300 ms. Notiamo che la percentuale
dell’occorrenza del fenomeno in questo caso è del 30%. In realtà l’effetto in questo
caso, a differenza dei precedenti di 50 ms e 100 ms, non è dovuto al secondo beep, ma
al primo dato insieme al flash. In realtà ciò è concorde con lo studio di Foss-Feig, che ci
dice infatti che la percentuale media dell’occorrenza del secondo flash per SOA grandi è
similare alla percentuale media nel caso della condizione di controllo, che talvolta può
dare percezione illusoria di un altro flash. L’introduzione dei ritardi puri variabili dà i
suoi effetti maggiori per ciò che riguarda la condizione 2, riportiamo qualche esempio.
98
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.20. Attività neuroni acustici e visivi ad un SOA di 25 ms nella condizione 2 di dieci soggetti con τ v variabile,
ritardi diversi variabili tra le aree, ritardi puri variabili nell’area acustica
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.21. Attività neuroni acustici e visivi ad un SOA di 50 ms nella condizione 2 di dieci soggetti con τ v variabile,
ritardi diversi variabili tra le aree, ritardi puri variabili nell’area acustica
99
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
0
200
400
0
0
200
400
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
200
400
0
1
1
0.5
0.5
0
0
200
400
0
0
200
400
0
200
400
0
0
200
400
0
0
200
400
0
200
400
Fig. 4.22. Attività neuroni acustici e visivi ad un SOA di 100 ms nella condizione 2 di dieci soggetti con τ v variabile,
ritardi diversi variabili tra le aree, ritardi puri variabili nell’area acustica
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
0
500
1000
0
0
500
1000
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
1
1
0.5
0.5
0
0
500
1000
0
0
500
1000
0
500
1000
0
0
500
1000
0
0
500
1000
0
500
1000
Fig. 4.23. Attività neuroni acustici e visivi ad un SOA di 200 ms nella condizione 2 di dieci soggetti con τ v variabile,
ritardi diversi variabili tra le aree, ritardi puri variabili nell’area acustica
100
In tutti questi casi di esempio, il modello riesce talvolta a simulare l’effetto Shams,
soprattutto per gli SOA più piccoli, 25 ms, 50 ms, 100 ms, con una buona occorrenza
(rispettivamente 50%, 30%, 40%). Rispetto alle simulazioni effettuate in precedenza
senza l’aggiunta dei ritardi puri nell’area acustica, questa volta abbiamo per tutti gli
SOA, anche i più grandi, potenzialmente l’illusione visiva (fig. 4.23 con SOA di 200
ms). Alla fine di tutte le prove otteniamo il seguente grafico finale.
Mean Percentage of Two Flashes Reported
90
80
70
60
50
40
30
20
10
0
-500
-400
-300
-200
-100
0
SOA
100
200
300
400
500
Fig. 4.24. Risultati delle prove effettuate per tutti gli SOA nelle due condizioni sperimentali con τv variabile, ritardi
diversi variabili tra le aree, ritardi puri variabili nell’area acustica
Rispetto ai risultati finali precedenti notiamo un miglioramento evidente dopo
l’aggiunta dei ritardi puri, infatti la percentuale media di occorrenza dei flash è diversa
da zero per tutti gli SOA in entrambe le condizioni d’interesse. Inoltre notiamo
l’andamento decrescente al crescere del valore di SOA, così come riportato in
letteratura. Altro risultato importante è che la percentuale media è diversa da zero anche
nella condizione di controllo, ed è in linea con la percentuale ottenuta ad SOA maggiori.
Ciò è quello che avevano riportato Foss-Feig et al. nel loro studio.
101
4.2 SIMULAZIONI SOGGETTI AUTISTICI
Il risultato precedente è idealmente ottenuto come simulazione di una popolazione di
soggetti sani. Le stesse simulazioni per tutti i valori di SOA e in entrambe le condizioni
ora vogliamo effettuarle idealmente per una popolazione di soggetti autistici. Essendo
questi soggetti affetti da una patologia, l’elaborazione delle informazioni e
l’integrazione multimodale possono risentire della malattia. In particolare, in base ai
risultati riportati da Foss-Feig, i soggetti autistici mostrano un effetto illusorio maggiore
rispetto ai sani per tutti i valori di SOA, risultante in una finestra di integrazione
temporale più larga rispetto ai sani. Per cercare di riprodurre tali risultati abbiamo agito
modificando alcuni parametri nelle aree di neuroni. In particolare i parametri su cui
siamo intervenuti sono state le costanti di tempo acustica τa e visiva τv, immaginando
che gli autistici possano avere una dinamica più lenta di elaborazione dell’informazione.
Inoltre, poiché i risultati della letteratura sembrano indicare una maggiore
compromissione dell’elaborazione degli stimoli acustici rispetto agli stimoli visivi, sono
stati aumentati anche i ritardi di scambio di informazioni tra le due aree e i ritardi puri
nell‘area acustica. Più precisamente i range dei parametri adottati per simulare i soggetti
autistici sono i seguenti: τv=8-30; DelAV=80-100; DelVA=200-250; DelA1=5-75;
DelA2=5-75. E’ stata inoltre alzata la costante di tempo acustica τa da 7 a 9.
Successivamente abbiamo effettuato la stessa serie di prove, con lo stesso criterio, fatte
per i soggetti sani. Riportiamo in seguito qualche esempio per alcuni SOA nelle
condizioni 1 e 2.
102
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
0
500
1000
0
0
500
1000
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
1
1
0.5
0.5
0
0
500
1000
0
0
500
1000
0
500
1000
0
0
500
1000
0
0
500
1000
0
500
1000
Fig. 4.25. Attività neuroni acustici e visivi ad un SOA di 25 ms nella condizione 1 di dieci soggetti autistici
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
0
500
1000
0
0
500
1000
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
1
1
0.5
0.5
0
0
500
1000
0
0
500
1000
0
500
1000
0
0
500
1000
0
0
500
1000
0
500
1000
Fig. 4.26. Attività neuroni acustici e visivi ad un SOA di 50 ms nella condizione 1 di dieci soggetti autistici
103
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
0
500
1000
0
0
500
1000
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
1
1
0.5
0.5
0
0
500
1000
0
0
500
1000
0
500
1000
0
0
500
1000
0
0
500
1000
0
500
1000
Fig. 4.27. Attività neuroni acustici e visivi ad un SOA di 150 ms nella condizione 1 di dieci soggetti autistici
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
0
500
1000
0
0
500
1000
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
1
1
0.5
0.5
0
0
500
1000
0
0
500
1000
0
500
1000
0
0
500
1000
0
0
500
1000
0
500
1000
Fig. 4.28. Attività neuroni acustici e visivi ad un SOA di 50 ms nella condizione 2 di dieci soggetti autistici
104
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
0
500
1000
0
0
500
1000
0
1
1
1
1
0.5
0.5
0.5
0.5
0
0
500
1000
0
1
1
0.5
0.5
0
0
500
1000
0
0
500
1000
0
500
1000
0
0
500
1000
0
0
500
1000
0
500
1000
Fig. 4.29. Attività neuroni acustici e visivi ad un SOA di 200 ms nella condizione 2 di dieci soggetti autistici
Nelle ultime figure si nota come in tutti i casi talvolta avvenga il secondo picco visivo
che denota il fenomeno illusorio. In generale aumentando quindi il range all’interno nel
quale variano i ritardi tra le aree e i ritardi puri nell’area acustica manteniamo la
possibilità di ottenere l’effetto Shams per tutti gli SOA e in entrambe le condizioni, ma
talvolta con una percentuale, in valore medio, maggiore. Vediamo quindi il grafico
risultante dalle prove di simulazione per i soggetti autistici.
105
Mean Percentage of Two Flashes Reported
90
80
70
60
50
40
30
20
10
0
-500
-400
-300
-200
-100
0
SOA
100
200
300
400
500
Fig. 4.30. Risultati delle prove effettuate per tutti gli SOA nelle due condizioni sperimentali per soggetti autistici
Dal grafico finale risultante dopo aver effettuato tutte le prove per i soggetti autistici
notiamo che la percentuale dei due flash riportati è diversa da zero in tutti gli SOA e in
entrambe le condizioni sperimentali. Abbiamo un andamento decrescente a destra per la
condizione 1 al crescere degli stimoli SOA. A sinistra invece notiamo un andamento
diverso, la percentuale media decresce fino a SOA=-100 ms per poi risalire leggermente
per SOA maggiori e quindi decrescere nuovamente da -200 a -500 ms. La percentuale
media è diversa da zero anche nella condizione di controllo.
Consideriamo ora il grafico risultante complessivo riportante il valore medio della
percentuale di occorrenza del flash illusorio ad ogni SOA sia per i soggetti sani che per i
soggetti autistici.
106
Mean Percentage of Two Flashes Reported
90
80
70
60
50
40
30
20
10
0
-500
-400
-300
-200
-100
0
SOA
100
200
300
400
500
Fig. 4.31. Risultati delle prove effettuate per tutti gli SOA nelle due condizioni sperimentali per soggetti sani e per
soggetti autistici
Da questo grafico, visivamente notiamo subito che i soggetti autistici (rosso) riportano,
ad eccezione di alcuni casi, medie percentuali di occorrenza di due flash
tendenzialmente maggiori rispetto ai soggetti sani (blu). A destra (condizione 1)
vediamo che a parte il caso di un SOA pari a 25 ms, i oggetti autistici hanno sempre una
media percentuale maggiore di occorrenza dell’effetto Shams rispetto ai sani. A sinistra
(condizione 2) riportano una percentuale leggermente maggiore per gli SOA fino a 150
ms, ma molto più ampia per gli SOA pari a 200 ms, 300 ms, 400 ms.
4.3 ANALISI STATISTICA DEI RISULTATI
Per quantificare la differenza dell’effetto illusorio a diversi SOA entro i singoli gruppi
(sani e autistici) e tra gruppi, è stata fatta un’analisi statistica. I risultati riguardano due
popolazioni differenti, soggetti sani e soggetti autistici. Per prima cosa è stata fatta
un’analisi della varianza (ANOVA) al fine di confrontare la variabilità dei risultati. E’
stata condotta un’analisi a due vie (o fattori): un fattore è rappresentato dal gruppo (sani,
autistici), l’altro fattore è rappresentato dall’SOA. I risultati dell’ANOVA hanno
107
mostrato che l’effetto dell’SOA è significativo [ F(15,288) = 39,87, p < 0.001 ]
confermando il legame tra l’intervallo temporale e la probabilità dell’integrazione
audiovisiva che causa l’illusione. Significativo è stato anche il fattore gruppo [ F(1,288)
= 54,44, p < 0.001 ]: i due gruppi differiscono quindi nella probabilità di riportare il
flash illusorio. Infine significativa è anche l’interazione tra i due fattori [ F(15,288) =
3,02, p = 0.0002 ], indicando che la relazione tra disparità temporale (cioè SOA) e
probabilità di integrazione è differente nei due gruppi.
Una volta verificato l’effetto dei due fattori, per eseguire confronti a coppie e verificare
se la differenza tra due medie è significativa abbiamo usato il test di Student, t-test.
Questi test statistici assumono inizialmente la cosiddetta ipotesi nulla. Qualora questa
ipotesi sia valida, i campioni vengono dalla stessa popolazione e le differenze tra i
campioni sono quindi non significative.
Abbiamo effettuato quindi dei t-test tra le medie percentuali di occorrenza dell’illusione
dei soggetti sani e le medie percentuali dei soggetti autistici.
Differenze significative sono state trovate per i seguenti SOA (tab. 4.1): 50 ms, 100 ms,
300 ms, 500 ms per la condizione 1; 50 ms, 200 ms, 300 ms, 400 ms per la condizione 2
(gli asterischi in figura 4.33 rappresentano tali differenze significative). Quindi
possiamo dire che soggetti autistici hanno una propensione maggiore di riportare
l’illusione visiva per questi SOA rispetto ai soggetti sani.
Altri t-test sono stati fatti per evidenziare l’esistenza di una finestra d’integrazione in cui
soggetti sani ed autistici possono riportare l’illusione. In questo caso i t-test sono stati
fatti confrontando le varie medie percentuali trovate per ogni SOA con la media
percentuale della condizione di controllo.
Per i soggetti sani risultati significati sono stati trovati per 25 ms, 50 ms, 100 ms per la
condizione 1; 25 ms e 50 ms per la condizione 2.
Per i soggetti autistici risultati significativi invece sono stati trovati per 25 ms, 50 ms,
100 ms, 200 ms, 300 ms, 400 ms, 500 ms per la condizione 1; 25 ms, 50 ms, 150 ms,
200 ms, 300 ms, 400 ms per la condizione 2.
In conclusione quindi possiamo dire che effettivamente, come riportato dalla letteratura
e dallo studio in vivo di Foss-Feig et al. (fig. 4.32), la finestra di integrazione all’interno
della quale può verificarsi il fenomeno illusorio dei soggetti autistici è più ampia di
quella dei soggetti sani (fig. 4.33).
108
Fig. 4.32. Risultati dell’esperimento di Foss-Feig per soggetti sani e autistici
Fig. 4.33. Risultati delle prove effettuate per tutti gli SOA nelle due condizioni sperimentali per soggetti sani e per
soggetti autistici con evidenziata la finestra di integrazione
109
SOA
p
50
p<0,001
100
p<0,001
300
p=0,0392
500
p=0,0291
-50
p=0,0326
-200
p=0.0111
-300
p=0,0169
-400
p=0,0277
Tab. 4.1. Risultati t-test tra le medie percentuali di occorrenza dell’illusione dei soggetti sani e le medie percentuali
dei soggetti autistici
110
CONCLUSIONI
Oggetto principale di questa tesi è stato un importante esempio di interazione
audiovisiva, un fenomeno illusorio visivo indotto dal suono che prende il nome “soundinduced flash illusion”: quando un singolo flash è presentato con due o più beep sonori,
i soggetti spesso riportano la percezione di aver visto due o più flash. In questi studi, in
genere, il flash è simultaneo ad un beep e un beep singolo precede o segue la coppia
simultanea flash e beep. La distanza che separa il beep singolo dalla coppia flash+beep
è definito Stimulus Onset Asynchrony (SOA). Il fenomeno del flash illusorio tende a
svanire al crescere dell’SOA. Per questo viene definita
una “finestra temporale”
d’integrazione, cioè quell’intervallo di valori di SOA all’interno del quale gli stimoli
acustici e visivi interagiscono determinando la possibilità di avere l’occorrenza
dell’illusione visiva.
Alcuni studi hanno mostrato che il fenomeno del sound-induced flash illusion è presente
anche nei soggetti autistici, suggerendo che i soggetti autistici hanno come i soggetti
sani la capacità di integrare stimoli audiovisivi. Tuttavia, alcuni studi hanno mostrato
che i soggetti autistici, rispetto ai soggetti sani, presentano una maggiore propensione
nel riportare l’illusione e una finestra d’integrazione circa doppia rispetto ai sani.
Obiettivo di questo lavoro è stato approfondire questi aspetti di interazione audiovisiva
mediante l’utilizzo di un modello di rete neurale. Il modello proposto si basa su un
precedente modello sviluppato dal gruppo di Bioingegneria dell’Università di Bologna.
Tale modello è in grado di simulare il fenomeno del sound-induced flash illusion,
tuttavia è ottimizzato per simularlo solo per un ristretto intervallo di SOA, cioè quando i
due beep sono separati di circa 50 ms, mentre non prendeva in considerazione l’ampio
valori di SOA in cui si osserva il fenomeno in letteratura. Il nostro scopo è stato quello
di approfondire lo studio del fenomeno illusorio e simularlo per valori di SOA differenti
e in due condizioni di stimolazioni differenti: 1) la prima condizione consisteva in un
beep e un flash dati insieme seguiti dopo un certo SOA da un altro beep; 2) la seconda
consisteva in un beep seguito dopo un certo SOA da una coppia beep+flash. Inoltre
abbiamo voluto valutare per quali configurazione di parametri il modello fosse in grado
di riprodurre i risultati osservati nei soggetti autistici, ovvero una più larga finestra di
interazione multisensoriale e una maggiore occorrenza del fenomeno illusorio.
111
Il set di parametri basali del modello si è dimostrato insoddisfacente nel riprodurre il
fenomeno illusorio per diversi valori di SOA, in entrambe le condizioni esaminate (1 e
2). Per modificare in modo opportuno i parametri è stata quindi effettuata un’analisi di
sensitività del modello, studiando la variazione della risposta del modello al variare di
uno o più parametri. Sulla base di tale studio, si è pervenuti alla scelta di un opportuno
set di parametri variabili in un certo intervallo, al fine di rendere il modello capace di
simulare l’effetto illusorio in un ampio intervallo di SOA, così come riportato in
letteratura. L’uso di un set di parametri variabili all’interno di un certo range (anziché
parametri fissati ad uno specifico valore) si è reso necessario per poter riprodurre il
fenomeno in una pluralità di differenti configurazioni di stimolazione. Tale variabilità è
comunque interpretabile sia come variabilità inter-individuo che intra-individuo.
Avendo usato un set di parametri che variano all’interno di un range di valori, sono state
fatte più prove di simulazione per verificare l’occorrenza dell’illusione visiva ai diversi
SOA, al fine poi di ricavare un valore medio e una deviazione standard relativi alla
occorrenza percentuale del fenomeno ad ogni SOA. Così facendo, il modello si è
rivelato in grado di riprodurre il fenomeno illusorio per diversi valori di SOA, in
accordo con i dati riportati in letteratura per i soggetti sani. In particolare, i parametri
che sono risultati parametri chiave per riprodurre i dati di letteratura riguardano la
dinamica temporale degli input visivi, i ritardi con cui vengono scambiate le
informazioni tra le aree visive e acustiche, e le latenze di elaborazione degli input
acustici. Inoltre, modificando opportunamente il range di variabilità di tali parametri (in
particolare riducendo leggermente la dinamica degli input visivi, aumentando i ritardi
dello scambio di informazione cross-modale ed aumentando la latenza di elaborazione
degli input acustici), il modello simula la maggiore propensione alla fenomeno illusorio
e la molto più ampia finestra di interazione osservati nei soggetti autistici.
Pertanto, le analisi svolte in questo lavoro possono contribuire a chiarire i seguenti
aspetti:
- i meccanismi alla base del fenomeno illusorio oggetto di studio e della finestra
temporale relativamente ampia in cui tale fenomeno ha luogo;
- quali sono le possibili alterazioni nei parametri delle vie sensoriali e nei parametri di
interazione tra aree cerebrali che possono interpretare le differenze osservate nei
soggetti autistici rispetto ai sani.
Questo ha implicazioni sia, in generale, nell’ambito della comprensione dei fenomeni di
interazione multisensoriale, sia, più nello specifico, per fare luce sulle anomalie
112
nell’elaborazione multisensoriale di basso livello nei soggetti autistici che possono
ripercuotersi in processi di più alto livello (come ad esempio la percezione del
linguaggio).
Il lavoro svolto presenta alcuni limiti:
1) il modello utilizzato è basato su un principio di parsimonia ed utilizza solo due strati
di neuroni reciprocamente interconnessi. Utilizzando un modello così semplice, per
riprodurre il fenomeno illusorio in un’ampia configurazione di stimolazioni, è stato
necessario adottare range ampi di variabilità dei parametri chiave. Un modello più
sofisticato potrebbe comprendere una terza area multisensoriale collegata con le due
aree unisensoriali attraverso sinapsi feedback e feedforward. La presenza di una terza
area multisensoriale potrebbe aiutare a riprodurre il fenomeno utilizzando range di
variabilità dei parametri più contenuti;
2) i dati relativi ai soggetti autistici sono stati ottenuti modificando il range di variabilità
di alcuni parametri, in particolare la dinamica e la latenza degli input sensoriali
(specialmente acustici). Tuttavia, non è stata al momento fatta un’analisi della
letteratura per verificare se le variazioni dei parametri qui ipotizzate possano trovare un
riscontro effettivo nei soggetti autistici.
Possibili miglioramenti futuri potrebbero quindi riguardare la struttura del modello, per
esempio aggiungendo un’altra area multisensoriale, e una più approfondita analisi della
letteratura scientifica circa le disabilità dei soggetti autistici sia a livello di elaborazione
di singoli stimoli sensoriali sia a livello di altri fenomeni di interazione multisensoriale.
113
Bibliografia
1. Stevenson R, Wallace A. Multisensory temporal integration: task and stimulus
dependencies. Exp Brain Res 2013; 227: 249-261.
2. Driver J, Spence C. Multisensory perception: beyond modularity and
convergence. Current Biology 2000, Vol. 10 N. 20, R731-R735.
3. Stein BE, Stanford TR. Multisensory integration: current issues from the
perspective of the single neuron. Nature Reviews Neuroscience 2008; Vol. 9.
4. Shams L, Kamitani Y, Shimojo S. Visual illusion induced by sound. Cognitive
Brain Researche 14, 2002, 147-152.
5. Marco EJ, Hinkley L, Hill SS, Nagarajan SS. Sensory processing in autism: a
review of neurophysiologic findings. Pediatric Research, Vol. 69, No. 5, Pt. 2,
2011.
6. Kwakye LD, Foss-Feig JH, Cascio CJ, Stone W, Wallace MT. Altered auditory
and multisensory temporal processing in autism spectrum disorders. Integrative
Neuroscience, January 2011, Vol. 4, Article 129.
7. Mongillo EA, Irwin JR, Whalen DH, Klaiman C, Carter AS, Schultz RT.
Audiovisual processing in children with and without autism spectrum disorders.
J Autism Dev Disord, 2008, 38: 1349-1358.
8. Szelag E, Kowalska J, Galkowski T, Poppel E. Temporal processing deficits in
high-functioning children with autism. British Journal of Psychology, 2004, 95:
269-282.
114
9. Van der Smagt MJ, Van Engeland H, Kemmer C. Brief report: can you see what
is not there? Low-lewel auditory-visual integration in autism spectrum
disorders. J Autism Dev Disord, 2007, 37: 2014-2019.
10. Stevenson RA, Siemann JK, Schneider BC, Eberly HE, Woynaroski TG,
Camarata SM, Wallace MT. Multisensory temporal integration in autism
spectrum disorders. The Journal of Neuroscience, January 15, 2014, 34(3): 691697.
11. Foss-Feig JH, Kwakye LD, Cascio CJ, Burnette CP, Kadivar H, Stone WL,
Wallace MT. An extended multisensory temporal binding window in autism
spectrum disorders. Exp Brain Res, 2010, 203: 381-389.
12. Cuppini C, Magosso E, Bolognini N, Vallar G, Ursino M. A neurocomputational
analysis of the sound-induced flash illusion. NeuroImage 92, 2014, 248-266
115