Vai al documento completo

UniversitàdegliStudiG.d’Annunzio
Chieti–Pescara
FacoltàdiPsicologia
CorsodiLaureainPsicologiaCognitiva
CorrelatiNeuraliDell’Integrazione
Multisensoriale:UnoStudioEEG
Candidato:Relatore:
BrunellaDonnoProf.MarcelloCostantini
Matricolan°:3152113Correlatore:
Prof.ssa Giorgia Committeri
Anno accademico 2014/2015
“Oderc ni em
oderc ni em
len oim eroma
rep etra, rep etra
is eroum”
(Carmen Consoli)
2
Alla mia famiglia senza la quale non avrei
continuato a credere in me stessa
3
Introduzione _________________________________________________________ 3
Capitolo I L’integrazione multisensoriale _________________________________ 5
1.
Il ruolo del collicolo superiore nel fenomeno di integrazione _______________ 6
2.
Le aree corticali implicate nel fenomeno di integrazione _________________ 10
3.
I principi alla base del fenomeno di integrazione multisensoriale ___________ 13
3.1.
La regola spaziale ____________________________________________ 13
3.2.
La regola temporale __________________________________________ 15
3.3.
La regola dell’efficacia inversa _________________________________ 17
4.
Fenomeni di integrazione: evidenze sperimentali _______________________ 21
4.1.
La rubber hand illusion (RHI) __________________________________ 22
4.2.
SJ e TOJ: paradigmi sperimentali per lo studio del fenomeno
di integrazione _____________________________________________ 24
Capitolo II La temporal binding window (TBW) _________________________ 27
1. SJ in fRMI _____________________________________________________ 28
2. Integrazione multisensoriale e malleabilità della TBW ___________________ 29
2.1.
La temporal binding window (TBW) come indice predittivo __________ 33
3. Integrazione multisensoriale e resting-state ____________________________ 35
Capitolo III Parte sperimentale ________________________________________ 39
1. Obiettivi della ricerca _____________________________________________ 39
2. Materiali e metodi _______________________________________________ 41
2.1.
Partecipanti _________________________________________________ 41
1
2.2.
Procedura sperimentale________________________________________ 41
2.3.
SJ visuo-tattile - valutazione____________________________________ 45
2.4.
SJ visuo-tattile - training_______________________________________ 45
3. Analisi dei dati __________________________________________________ 46
3.1.
Dati comportamentali _________________________________________ 46
3.2.
Elettroencefalogramma ________________________________________ 50
4. Discussione dei risultati ___________________________________________ 53
RINGRAZIAMENTI _________________________________________________ 58
BIBLIOGRAFIA ____________________________________________________ 59
2
Introduzione
Viviamo in un mondo nel quale ci viene imposto dall'ambiente stesso il modo in cui è
"preferibile" percepire la molteplicità di stimoli esistenti. Il fenomeno di integrazione
multisensoriale è un mezzo di cui ci avvaliamo per poter esperire velocemente e coerentemente questi stimoli; tale processo consiste nella capacità di combinare, quotidianamente, diverse fonti di informazione (una molteplicità di stimoli appartenenti a diversi
registri sensoriali) per evocare, come risposta finale, un percetto unitario che sintetizzi
significativamente i diversi stimoli percepiti. È interessante indagare, a nostro parere,
quali possano essere i correlati neurali di base di tale fenomeno, ma, soprattutto, esplorare i pattern neurali ad esso sottostanti. Nello specifico, nel nostro studio ci siamo interessati a ricercare, tramite registrazione EEG (elettroencefalografia) e mediante l'analisi
del resting-state, il substrato elettrofisiologico responsabile del suddetto fenomeno
quando l'attività cerebrale è momentaneamente in stato di "riposo".
Per lungo tempo, si è ritenuto che l’attività spontanea del cervello a riposo non fosse altro che rumore. Con “attività neurale spontanea” ci si riferisce ad un tipo di attività non
attribuibile ad uno specifico input ambientale, ma ad un'attività che viene intrinsecamente generata dal cervello. Solo negli ultimi anni, i ricercatori si sono interessati ad
indagare tale componente considerata fino a poco tempo fa “di disturbo” e si è potuto
constatare, in realtà, che si tratta di un'attività "organizzata" in maniera specifica (Fox et
al., 2005). Si può parlare, perciò, di connettività funzionale tra regioni distinte del cervello che si trovano ad essere connesse quando quest'ultimo è in uno stato vigile e cosciente, anche se rilassato e in assenza di stimoli a cui dover rispondere. Questi pattern
3
di connettività sono stati definiti come veri e propri network (reti), che si vengono a
creare nel momento in cui l'attività cerebrale è in "standby"; tali reti sono comunemente
indicate con il termine resting-state networks (RSNs). Il Default Mode Network (DMN)
rappresenta, in quest'ottica, il network “a riposo” più consistente; esso viene letteralmente considerato come una modalità di rete predefinita, ovvero una coorte di regioni
cerebrali congiuntamente attive durante lo stato di riposo (resting-state) e che si disattivano nello stesso istante, quando il cervello è chiamato ad eseguire dei compiti. Questa
rete neurale, distribuita in diverse regioni corticali e sottocorticali, coinvolge diverse
aree: corteccia prefrontale mediale, corteccia cingolata posteriore e corteccia parietale
inferiore destra e sinistra che svolgerebbero, cioè, un’"attività di fondo" destinata ad un
lavoro mentale principalmente introspettivo e di progettazione di azioni future (Yang et
al., 2013).
Siamo dell’idea, pertanto, che tale attività di fondo – registrata tramite EEG (elettroencefalografia) – possa rappresentare un indice esplicativo dell’attività cerebrale dei soggetti da noi esaminati e che questa attività “a riposo” funga da correlato neurale importante in grado di farci comprendere le dinamiche alla base del processo di integrazione
multisensoriale.
4
Capitolo I
L’integrazione multisensoriale
È sorprendente come la maggior parte delle capacità di cui l’essere umano è dotato –
nello specifico, la codifica e l’interpretazione delle informazioni biologicamente significative provenienti dall’ambiente esterno – rappresentino funzioni importanti del cervello; tali meccanismi, pertanto, necessitano della presenza di circuiti neurali di base, di veri e propri pattern neurali, affinché essi possano comunicare interattivamente. Tali funzioni, durante il corso evolutivo, hanno determinato in modo pregnante lo sviluppo di
una serie di organi di senso specializzati, ciascuno dei quali collegato a più regioni cerebrali altrettanto specializzate. L’estrema raffinatezza di cui i nostri organi di senso sono dotati è di utilità ottimale in relazione a ciò che esperiamo ogni giorno, poiché essi
aumentano notevolmente la probabilità di individuare e identificare eventi d’interesse.
La nostra capacità, determinata dalla sinergia tra gli organi di senso nel combinare diverse fonti di informazione, non rappresenta una strategia evolutiva nuova: basti pensare
al nostro primo progenitore unicellulare dotato di più “sensi”, di recettori in grado di
catturare e convertire i diversi stimoli ambientali per dare luogo ad una percezione unitaria(Stein & Stanford, 2008). Ed è proprio questa sinergia, questa interazione tra i sensi e la fusione del loro contenuto informativo, che è descritta pienamente dal concetto
definito come “integrazione multisensoriale”: la capacità di combinare efficacemente
stimoli cross-modali (una molteplicità di stimoli appartenenti a diversi registri sensoriali) per evocare, come risposta finale, un percetto unitario che sintetizzi significativamente i diversi stimoli percepiti. Del resto, quando ci si sofferma sul concetto di sintesi, si
deve necessariamente fare riferimento ai principi di organizzazione percettiva già indi5
viduati dalla Gestalt, secondo cui il nostro sistema cognitivo propende sempre verso un
principio d’economia nella percezione degli stimoli: in sostanza, la nostra attività cognitiva tende quanto più possibile a risparmiare energia in favore della sintesi percettiva;
per cui, per esempio ciò che ascoltiamo non è mai un rumore puro (sensazione) ma una
moto che romba o la porta che cigola (le cose "stesse" che ci circondano). La percezione, peraltro, rappresenta un processo primario e immediato non preceduto da sensazioni:
disponiamo di un’organizzazione interna che determina che cosa e come percepire gli
stimoli; di conseguenza, secondo i principi della Gestalt, gli oggetti apparirebbero come
totalità strutturate e, dunque, come unità coerenti. Quindi, mentre i sistemi sensoriali individuali trasducono forme distinte di energia dello stimolo proveniente dall’ambiente
esterno (convertendo l’energia degli stimoli in segnale elettrico), le informazioni che noi
estraiamo sono spesso legate in un unico percetto relativo alla manifestazione esterna,
noto anche come "ipotesi dell’unità": tale ipotesi assume che due input sensoriali provengono da un singolo evento, invece che da due eventi separati (Stevenson et. al,
2013).
1.
Il ruolo del collicolo superiore nel fenomeno di integrazione
Affinché possa aver luogo la sintesi “gestaltica” delle informazioni provenienti da diverse modalità sensoriali in favore dell’economia del nostro sistema cognitivo, due risultano essere le condizioni che necessariamente devono essere soddisfatte: in primo
luogo, la convergenza di informazioni relative a specifiche modalità sensoriali nella
stessa regione cerebrale (fenomeno di fusione sensoriale) e, in secondo luogo, la possibilità che si stabiliscano interazioni funzionali fra input riguardanti modalità sensoriali
differenti.
6
Per definire il concetto di integrazione multisensoriale ci si rifà principalmente ai
pattern funzionali eccitatori che si stabiliscono in seguito alla convergenza multimodale
di input di modalità sensoriali differenti su un unico neurone multisensoriale (Meredith,
2002): caratteristica dei neuroni multisensoriali del collicolo superiore (CS). Questa
struttura mesencefalica, nello specifico, è dotata di un’organizzazione laminare o a strati: gli strati superficiali sono deputati a rappresentare la sola informazione visiva, mentre
quelli profondi o subtettali rappresentano le informazioni multimodali visive, uditive e
tattili. Il CS evoca, perciò, una risposta dei neuroni multisensoriali significativamente
maggiore rispetto alla più vigorosa risposta unimodale (“multisensory enhancement”)
(Stein & Meredith, 1993; Meredith, 2002).
La funzione adattiva, come già ampiamente confermato, di tale pattern di convergenza neurale è quella di aumentare la salienza degli eventi sensoriali al fine di facilitare comportamenti funzionali rispetto all’ambiente, come, per esempio, l’abilità di
orientamento, le risposte di fuga, di evitamento e di localizzazione nello spazio di stimoli salienti.
A livello fisiologico, i meccanismi che regolano la funzione di integrazione multisensoriale in compiti spaziali sono stati largamente indagati nelle aree corticali del gatto e nel collicolo superiore del mesencefalo. Il CS, filogeneticamente e ontogeneticamente antico, è considerato una stazione di riferimento per la comprensione del funzionamento dei neuroni multisensoriali e delle loro interazioni con le aree corticali, poiché
comune a tutti i mammiferi, dai vertebrati inferiori a quelli più sviluppati (Stein & Meredith, 1993). Il CS presenta, difatti, un’alta incidenza di neuroni multisensoriali (visivi,
acustici e tattili), localizzati soprattutto negli strati profondi di cui questa struttura mesencefalica è composta; gli strati superficiali, invece, contengono neuroni di relais (di
7
comando) deputati esclusivamente all’analisi di stimoli visivi.
Un aspetto – che, perciò, risulta focale – riguarda i meccanismi con cui vengono
messe in atto risposte automatiche orientate verso segnali sensoriali che potrebbero presentarsi nello spazio; orientamento, appunto, esogeno, poiché si manifesta con uno spostamento dell’attenzione provocato da input esterni all’organismo, che non decide volontariamente, quindi, di indirizzare la propria attenzione verso stimoli da esso ritenuti
salienti. I processi di localizzazione spaziale e di orientamento motorio verso un target
sono svolti dal CS e le strutture tettali (tetto ottico del mesencefalo) fungono da interfaccia tra la localizzazione degli stimoli presenti nello spazio (input sensoriale) e le risposte di orientamento sotto forma di output motorio (Huber & Crosby, 1993; Maximino, 2008).
In questa via cosiddetta “diretta”, l’informazione relativa all’input visivo in entrata raggiunge il tetto ottico che rappresenta la prima stazione per l’analisi
dell’informazione. Qui, essa rimane principalmente a livello del mesencefalo, dove avviene una prima elaborazione inconsapevole, che comporta, appunto, lo spostamento
automatico dell’attenzione; l’analisi dell’informazione, perciò, non confluisce nella corteccia visiva primaria (V1).
Lo studio delle proprietà specifiche dei neuroni multisensoriali nei gatti, ancora,
ha permesso di comprendere che essi ricevono input sensoriali diretti (via diretta) dai
recettori visivi, uditivi e somatici (neuroni degli strati profondi del CS) e indiretti dai
collicoli inferiori e che essi, attraverso collegamenti con le aree motorie e premotorie,
danno luogo all’output motorio; ciò fa sì che, come risposta finale, avvengano movimenti oculari, del capo, del corpo e delle orecchie verso una posizione nello spazio.
La stimolazione di un neurone del collicolo evoca, quindi, una comparabile risposta di
8
orientamento verso un punto dello spazio che è precisamente mappato in queste strutture nervose; tale organizzazione neurale presiede, perciò, alla coordinazione sensomotoria rapida. Si parla, quindi, di una struttura sottocorticale mesencefalica coinvolta
nell’orientamento, nel controllo dei movimenti oculari e della testa, nell’attenzione e nei
processi di individuazione del target (Krauzlis et al., 2004; Stein & Meredith, 1993). Il
CS rappresenta, quindi, un’importante stazione di analisi visiva dei dati provenienti
dall’ambiente e, per tale ragione, è dotato di una disposizione topografica dei neuroni in
esso contenuti; la mappa retinotopica, infatti, è disposta in modo da essere congruente
alla mappa somatosensoriale e uditiva presente negli strati più profondi. Qui sono presenti neuroni multimodali che comunicano, nel contempo, con i neuroni della mappa visiva, somatosensoriale e uditiva: i neuroni della parte rostrale del CS rappresentano lo
spazio visivo ed uditivo più centrale e più anteriore, mentre i neuroni della parte caudale
rappresentano regioni progressivamente più periferiche e più posteriori dello spazio visivo e uditivo (Stein & Meredith, 1993).
Un’analoga mappatura è presente per i “campi di movimento” controllati dal CS.
Un campo di movimento è l’equivalente motorio di un campo recettivo: esso, cioè, consiste in un vettore di movimento orientato e direzionato verso una particolare posizione
dello spazio. Quindi, una delle proprietà peculiari del CS è rappresentata dalla stretta
corrispondenza spaziale tra l’aspetto sensoriale, costituito dall’integrazione di diverse
modalità, e l’aspetto motorio: tale corrispondenza è necessaria affinché un segnale sensoriale localizzato in una certa posizione nello spazio (che coinvolge, di conseguenza, i
campi recettivi di quella posizione per le diverse modalità), possa evocare un’immediata
reazione motoria rivolta precisamente verso quella posizione spaziale (coinvolgendo il
corrispondente campo motorio); tale corrispondenza fa sì che vengano messe in atto ri9
sposte motorie rapide a stimoli imprevisti e ciò conferma il ruolo di grande importanza
relativo a tale adattamento che sta alla base dei comportamenti di attacco e fuga. Il risultato di questa interazione così potente, che ha luogo tramite i suddetti meccanismi, è
l'integrazione di diversi segnali sensoriali, fenomeno che trova riscontro nella percezione complessa dello spazio esplorato dai sensi.
2.
Le aree corticali implicate nel fenomeno di integrazione
All’attività dei neuroni multimodali del CS contribuiscono, inoltre, oltre che le afferenze dirette dai sistemi sensoriali e dai collicoli inferiori, anche afferenze dalla corteccia
(corticotettali). Una regione corticale molto importante che proietta al CS nel gatto è
l’AES (solco ectosilviano anteriore), un’area associativa parietale suddivisa in una serie
di regioni che elaborano informazioni unimodali. L’attività elettrofisiologica dei neuroni
multimodali dei collicoli può venir ampiamente depressa dall’interruzione dei collegamenti con quest’area. La registrazione dell’attività di neuroni multimodali dei collicoli
ha, infatti, messo in luce come le risposte a presentazioni multimodali risultino selettivamente depresse dall’inattivazione farmacologica di AES (Stein et al., 1983).
Oltre alla corteccia cerebrale del gatto, studi di neuroimaging funzionale hanno
identificato molte regioni corticali "multisensoriali" sia negli esseri umani, sia nei primati non umani (Fig. 1). Non sembra esserci alcun dubbio, perciò, sul fatto che molte di
queste regioni contengano neuroni che sarebbero in grado di integrare stimoli crossmodali (Stein & Stanford, 2008).
10
Fig. 1 Regioni corticali multisensoriali nell’uomo.
Nell’immagine è possibile visualizzare le regioni multisensoriali del cervello umano.
Qui, è stato misurato il livello di ossigeno nel sangue (Blood Oxygen Level Dependent o
BOLD) in alcune aree la cui attività è relativa all’elaborazione di stimoli visivi, uditivi e
tattili. Il rosso denota regioni cerebrali trisensoriali in cui le attivazioni tattili, visive e
acustiche sono sovrapposte. In alcuni studi, per l'appunto, è stata presa in esame la corteccia parietale posteriore (PPC), dove è stato possibile constatare come convergano le
informazioni sensoriali provenienti da molte modalità differenti (visive, vestibolari, tattili e uditive); il blu indica le regioni (nello specifico, la STS), in cui le attivazioni uditi11
ve e visive sono sovrapposte (audiovisive) e, infine, il verde indica le regioni in cui le
attivazioni visive e tattili (visuotattili) si sovrappongono (Stein & Stanford, 2008).
La maggior parte dei risultati ottenuti sul fenomeno di integrazione multisensoriale nella corteccia umana, però, provengono da alcuni studi di neuroimaging dai quali
si è potuto evincere come le interazioni multisensoriali nella corteccia uditiva favoriscano l'integrazione relativa a quelle coppie di stimoli contenenti i volti dei conspecifici
messi in relazione, però, al discorso sonoro emesso. Nello specifico, in questi studi, il
livello del segnale BOLD aumentava in riferimento a coppie congruenti nel discorso
sonoro e nel movimento delle labbra; ed è andato decrescendo, di contro, in relazione a
coppie incongruenti suggerendo, ancora una volta, che le interazioni in STS alla base
degli effetti di integrazione multisensoriale, relative alla valorizzazione (coppie di stimoli congruenti) o alla depressione (coppie di stimoli incongruenti) nella percezione del
linguaggio parlato, siano anch'esse ben documentati.
Si è sostenuto, quindi, che la risposta BOLD per stimoli cross-modali debba superare la somma delle risposte per le componenti specifiche per modalità, affinché l'integrazione multisensoriale possa essere definitivamente stabilita (Calvert et al., 2001).
In definitiva, si è potuto constatare sperimentalmente come la STS integri informazioni
su una varietà di stimoli cross-modali (Stein & Stanford, 2008).
12
3.
I principi alla base del fenomeno di integrazione multisensoriale
Assodato che il fenomeno di integrazione produca, come effetto finale, benefici relativi
a differenti aspetti del comportamento (Stein & Stanford, 2008) – migliorando, nello
specifico, la capacità di rilevare stimoli bimodali e facilitando la creazione di esperienze
percettive unitarie – non si può evitare di fare riferimento alle regole che intervengono
affinché questi effetti possano aver luogo. Inoltre, è ormai ben noto che la latenza delle
risposte automatiche orientate ad uno stimolo, composto simultaneamente da più di una
modalità sensoriale, sia più breve della latenza ad uno stimolo che si presenta in una sola modalità (Goldring et al., 1996). Questi prerequisiti portano, inevitabilmente, a specificare le tre proprietà fondamentali che caratterizzano i neuroni multimodali del CS:
•
la regola spaziale,
•
la regola temporale,
•
la regola dell’efficacia inversa
3.1. La regola spaziale
E’ stato possibile constatare che quanto più è presente una stretta corrispondenza tra le
posizioni nello spazio dei singoli input sensoriali, tanto più lo stimolo multimodale darà
luogo alla valorizzazione della risposta (enhancement). Il principio spaziale diviene,
perciò, di particolare importanza per il ruolo svolto dai neuroni del CS nell'orientamento
spaziale. Ogni neurone multisensoriale, infatti, è costituito da più campi recettivi eccitatori, uno per ogni modalità a cui è deputato a rispondere. Questi campi (per esempio,
due campi recettivi visivo-uditivo di un neurone che si sovrappongono) sono strettamente connessi tra loro nel registro spaziale, in modo tale che queste due modalità di13
verse possano essere definite come provenienti dalla stessa posizione di origine fintanto
che rientrino all'interno dello spazio che viene registrato dai loro campi recettivi che si
sovrappongono. Se, di contro, gli stimoli provengono da posizioni spazialmente disparate, tale che uno stimolo cade all'interno e l'altro all'esterno del campo recettivo del neurone, la valorizzazione della risposta non avrà luogo, oppure si potrà verificare la depressione della risposta. Quest’ultima si verifica, difatti, quando il secondo stimolo viene a trovarsi all'interno di una regione inibitoria che confina con i campi recettivi eccitatori di alcuni neuroni del CS e può essere abbastanza potente da sopprimere l'eccitazione evocata dagli altri stimoli (Stein & Stanford, 2008). La validità di tale regola è stata
confermata, a tal proposito, da uno studio del 2014 di Kanayama e collaboratori nel quale i partecipanti sono stati istruiti a tenere un piccolo cubo nella mano sinistra: le 3 condizioni prevedevano la somministrazione di stimoli visuo-tattili congruenti (il LED e la
vibrazione erano presentati nella stessa porzione del cubo), incongruenti (il LED e la vibrazione venivano presentati nella porzione opposta) e di stimoli tattili presentati in
modalità unisensoriale (Fig. 2).
Fig. 2 Setting sperimentale: somministrazione di stimoli visuo-tattili
14
Nello specifico, gli autori hanno dato conferma di come l'integrazione potesse avvenire
in modo efficace solo nella condizione in cui ai partecipanti era somministrato il LED e
la vibrazione nella medesima porzione di spazio all'interno del cubo; in questo modo, è
stato possibile registrare una significativa diminuzione nei tempi di risposta nella condizione di congruenza degli stimoli rispetto a quando gli stimoli erano somministrati separatamente in due punti distinti all'interno dello stesso (condizione di incongruenza degli
stimoli) (Fig. 3).
Fig. 3 L’integrazione ha luogo nella condizione di congruenza spaziale degli
stimoli
3.2. La regola temporale
Analogamente, esiste una sincronizzazione ottimale (regola temporale) relativa alla
comparsa delle componenti unimodali per poter ottenere, come risultato, questa valorizzazione e non sempre tale sincronizzazione corrisponde alla presentazione contemporanea dei singoli stimoli (Meredith & Stein, 1983). In questo caso, affinché la regola temporale possa essere pienamente soddisfatta e possa manifestarsi a tutti gli effetti il fenomeno di integrazione, l’intervallo temporale tra i due stimoli, appartenenti a registri
15
sensoriali diversi, deve essere necessariamente breve, dell’ordine di pochi millisecondi
tra l’inizio della comparsa del primo stimolo e l’inizio della comparsa del secondo (Stimulus Onset Asynchrony o SOA). L'effetto McGurk, nello specifico, dimostra la forte
dominanza del canale visivo sulla percezione uditiva; questo fenomeno venne scoperto
nel 1976 da Harry McGurk e dal suo collaboratore John MacDonald e pubblicato in un
articolo dal titolo “Hearing lips and seeing voices” (“Sentire labbra e vedere voci”).
L'effetto McGurk è un fenomeno percettivo che dimostra l’esistenza di una forte
interazione di base tra l'udito e la vista nel riconoscimento di una parola o di un singolo
fonema; questo tipo di effetto, sperimentato dai due autori, rappresenta la prova evidente di come il riconoscimento linguistico sia un processo multimodale che coinvolge informazioni da più di una sorgente sensoriale. Gli autori, a tal proposito, sperimentarono
il fenomeno montando un video in cui era presente una donna che, muovendo le labbra,
produceva un determinato fonema, il quale venne doppiato, però, con il suono registrato
di un altro fonema sovrapposto. Ciò che gli autori osservarono fu come spesso il fonema
percepito fosse una via di mezzo tra i due; per esempio, il video che mostra /ga/ combinato con l'audio di /ba/ è spesso percepito come /da/. Il percetto risultante sarà il fonema
‘da-da’ o ‘ta-ta’ nonostante il labiale della donna nel video riproduca il fonema ‘ga-ga’,
ma il suono realmente prodotto sia ‘ba-ba’. Si tratta di una situazione di conflitto tra la
vista e l’udito, dal momento che, non osservando le labbra chiudersi all’inizio della sillaba, il cervello ritiene – tramite un’inferenza cognitiva – di non poter udire il suono
‘ba’. Esso risolve, perciò, quest’ambiguità tramite un compromesso, ritenendo
di percepire una via di mezzo tra i due suoni, ovvero ‘da’ o ‘ta’. Per poter percepire correttamente il fonema è necessario, quindi, riascoltarlo chiudendo gli occhi: in questo caso, si sarà in grado di udire il suono reale, ovvero ‘ba-ba’, poiché non sarà concesso al
16
canale visivo di interferire con quello uditivo; ciò fa supporre che l'effetto McGurk potrebbe avere una grande influenza nelle percezioni della vita quotidiana.
Recentemente, l’effetto McGurk è stato studiato da Keil e collaboratori (2011)
che, avvalendosi della MEG (magnetoencefalografia), hanno dimostrato come tale percezione illusoria sia preceduta da un incremento dell'attività prestimolo del ritmo beta e
che questa attività sia distribuita principalmente nel giro temporale superiore sinistro
(ISTG), un'area considerata di rilevante importanza nel fenomeno di integrazione; la potenza del ritmo beta in quest'area riflette, perciò, la predisposizione ad integrare informazioni multimodali. Quest'effetto si manifesta, inoltre, nel momento in cui l'inizio della presentazione dello stimolo acustico non coincide con l'inizio della comparsa di quello visivo; gli stimoli unisensoriali presentati, perciò, sono percepiti come incompleti
poichè non perfettamente sovrapposti. Per risolvere almeno in parte il problema della
mancata corrispondenza, gli autori hanno dimostrato, appunto, come la ISTG si occupi
della fusione degli stimoli per poter produrre una percezione coerente che crea, però,
l'illusione.
In conclusione è possibile affermare come il sistema multisensoriale sia organizzato in
modo tale che le risposte di eccitazione e depressione dei neuroni siano elicitate solo in
virtù delle relazioni spaziali e temporali tra gli stimoli e non della loro modalità di appartenenza.
3.3. La regola dell’efficacia inversa
Esperimenti elettrofisiologici hanno, inoltre, dimostrato che la stimolazione di un solo
canale sensoriale produce una minore attività di scarica (response depression) rispetto
alla stimolazione simultanea di più canali sensoriali (response enhancement) (Meredith
17
& Stein, 1983). Tale proprietà, definita “regola dell’efficacia inversa”, è regolata soprattutto dagli aspetti spaziali (regola spaziale) e temporali (regola temporale) relativi alla
presentazione multimodale di stimoli. E’ stato dimostrato come la maggior parte delle
integrazioni multisensoriali avvenga mediante sommazione lineare degli input specifici
per modalità, ma è interessante notare come anche due stimoli modalità-specifici deboli
abbiano una maggiore probabilità di produrre una risposta neuronale superadditiva; e
come, invece, due stimoli altamente salienti ed efficaci abbiano una maggiore probabilità di determinare una risposta subadditiva (Meredith & Stein, 1983). A tal proposito,
uno studio del 2014 di Kanayama e collaboratori ha dato prova di come la risposta prodotta fosse superadditiva nella condizione di congruenza spaziale degli stimoli presentati quando, però, lo stimolo tattile somministrato era di debole intensità rispetto a tutte le
altre condizioni (Fig. 4).
Fig. 4 Risposta superadditiva nella condizione di congruenza spaziale degli stimoli e di
debole intensità dello stimolo tattile
La conseguenza diretta di ciò fa sì che l’integrazione multisensoriale risulti essere più
vantaggiosa per l’individuazione di fonti multisensoriali composte da stimoli modalitàspecifici deboli (Fig. 5).
18
Fig. 5 Le risposte multisensoriali di rilevamento favoriscono l'integrazione e la velocità
nell’elaborazione di una risposta.
Nella figura 5) sono raffigurati una donna e un gatto intenti a rilevare l'avvicinarsi di un
cane tramite la vista e l’udito. Nell’immagine 1 in alto a destra, è possibile constatare
come, quando questi segnali sono deboli (ovvero, quando il cane è lontano), la computazione neurale coinvolta nell’integrazione degli stimoli visivo e acustico sia superadditiva, tale che la risposta valorizzata non solo supera la risposta agli input sensoriali unimodali, ma supera addirittura la loro somma. Nel momento in cui il cane si avvicina
(immagine 2 al centro), i segnali diventano sempre più efficaci, le risposte delle componenti unisensoriali diventano più vigorose e le risposte integrate proporzionalmente più
piccole. Qui l’integrazione diventa additiva (al centro) – la risposta multisensoriale,
cioè, non è diversa dalla somma aritmetica delle risposte agli stimoli unimodali che la
compongono– per poi divenire subadditiva (immagine 3 in basso a destra). Sebbene anche l’integrazione additiva e quella subadditiva – per cui la risposta multisensoriale è
inferiore alla somma aritmetica delle risposte agli stimoli unimodali che la compongono
19
– producano responces enhancement che superano la risposta all’input unimodale più
vigoroso (cioè, in entrambi è possibile osservare il fenomeno di integrazione), la loro
valorizzazione è, comunque, proporzionalmente inferiore rispetto a quella superadditiva. I campi recettivi visivi e uditivi dei neuroni del CS e le posizioni degli stimoli legati
da una stretta corrispondenza topografica, quindi, sono rappresentati all'interno dello
spazio visivo e uditivo dei neuroni. Allo stesso modo, nella Fig. 6, il pannello a) evidenzia come gli stimoli visivi e uditivi debolmente efficaci siano integrati in maniera vigorosa per dar luogo alla produzione della risposta multisensoriale valorizzata. In questo
caso, la risposta (superadditiva) – data dalla combinazione dei due input deboli – supera
la somma delle risposte dei singoli stimoli. Nel pannello b), l'associazione dello stimolo
visivo con un altro stimolo visivo produce, invece, un'interazione subadditiva, che non
riesce a soddisfare il criterio di valorizzazione. Questi rappresentano, perciò, degli
esempi delle differenze esistenti tra le computazioni neurali che sono alla base del fenomeno di integrazione multisensoriale e unisensoriale (Stein & Stanford, 2008).
20
Fig. 6Integrazionemultisensorialeeunisensorialeinunneuronemultisensoriale del
collicolo superiore.
4. Fenomeni di integrazione: evidenze sperimentali
È comune, perciò, pensare erroneamente che i nostri sensi (vista, tatto, udito, etc..) siano
fondamentalmente separati e che operino in maniera indipendente l’uno dall’altro. Ciò è
corretto solo in parte, poiché i nostri organi sensoriali (occhi, orecchie, etc.) lavorano
inizialmente in autonomia; ciò che viene captato, solo in un secondo momento, viene
convogliato direttamente nelle aree cerebrali specializzate nell’analisi degli stimoli in
arrivo. Infatti, le informazioni convogliate dai nostri organi sensoriali, una volta giunte
21
al cervello, vengono integrate tra loro per dare vita a una percezione unitaria
dell’esperienza vissuta.
L'esempio di illusione più noto è l'effetto “ventriloquismo”, per cui si ha la convinzione
che il suono, proveniente dalle labbra di chi parla (ventriloquo), venga emesso direttamente dalla bocca che si muove del pupazzo; in questo modo, quindi, il suono viene trasposto. Tale situazione è anche ciò che si sperimenta durante la visione di un film, per
cui la voce di ogni personaggio è posizionata correttamente sullo schermo, indipendentemente dal movimento del personaggio, anche se tutti i suoni, in realtà, provengono
dalla posizione statica delle casse audio.
4.1. La rubber hand illusion (RHI)
Largamente documentati in letteratura sono, inoltre, gli effetti che le illusioni hanno relativamente alla percezione del nostro corpo; si tratta di un’area di ricerca che, negli ultimi anni, ha prodotto un numero sempre maggiore di studi, accrescendo le conoscenze
sul modo in cui si è in grado di percepire il nostro corpo. A tal proposito, un fenomeno
scoperto nel 1999 da Botvinick e Cohen è quello relativo all’illusione di possedere una
mano di gomma (rubber hand illusion); l’effetto ha luogo nella condizione in cui la mano destra del soggetto è nascosta alla sua vista, mentre davanti a lui è posizionata una
finta mano di gomma. Sia la vera mano (non vista dal soggetto sperimentale), che la
mano di gomma (da lui percepita) vengono toccate contemporaneamente dallo sperimentatore per un breve periodo di tempo. L’effetto di questa stimolazione è che il soggetto percepirà velocemente l’illusione (in media, dopo circa 11 secondi) che la mano di
gomma sia parte integrante del proprio corpo (Fig. 7). In questo caso, il nostro cervello
integra le informazioni tattili e visive per costruire un’esperienza unitaria che crea, con22
cretamente, l’illusione di “avere” una mano di gomma a tutti gli effetti.
Fig. 7 L’esperimento della mano di gomma (RHI) relativo all’effetto illusorio di possedere realmente una mano di gomma
A tal proposito, è stato possibile notare come un’aggressione alla mano di gomma (per
esempio, la torsione del dito) provochi una reazione spontanea di ritrazione della vera
mano del soggetto, con la sensazione che questa sia stata effettivamente aggredita. Se,
da un lato, questi stimoli provocano un aumento della forza dell’illusione nell’integrare
la mano di gomma (Giummara et al., 2010), d’altro canto, essi possono anche minacciare la mano artificiale e ciò può far sì che vengano prodotte risposte protettive da parte
del soggetto stesso; infatti, lo spostamento di un coltello o di un ago verso la mano artificiale spesso induce il ritiro effettivo della mano, che, a sua volta, rompe l'illusione. La
minaccia per la mano – ritenuta parte integrante di sé – è sufficiente a causare, di conseguenza, l'attivazione di regioni cerebrali coerenti con la conservazione del corpo (Ehrsson et al., 2007). La forza dell’illusione della mano di gomma (RHI) dipende, quindi,
sia dalla congruenza temporale di stimoli crossmodali tra ciò che una persona sente at23
traverso le vie somatosensoriali e ciò che vede, ma anche dal fatto che la mano di gomma sia posta in una posizione anatomicamente plausibile (Tsakiris, 2010).
Press et al. (2008) hanno suggerito, inoltre, che i livelli iniziali di elaborazione delle informazioni sensoriali (ad esempio, la corteccia somatosensoriale secondaria, SII) siano
modulati dalla presentazione sincrona (regola temporale) di stimoli visivi e tattili; inoltre, che i livelli successivi di elaborazione siano influenzati dalla compatibilità spaziale
(regola spaziale) tra la posizione degli stimoli nello spazio esterno e dall’effettiva posizione del corpo nello spazio e, infine, che le successive variazioni dell'attività neuronale
sembrano essere correlate alla somiglianza fisica tra l'oggetto posto in quella parte dello
spazio (nello specifico, la mano di gomma) e il corpo del partecipante. Questo fenomeno dimostra come l’integrazione multisensoriale sia utilizzata anche per costruire il senso che possediamo del nostro corpo; ciò diviene possibile grazie alla corteccia parietale
e premotoria, i cui ruoli risultano importanti per indurre l’illusione (Ehrsson et al.
2004), ma anche grazie all’insula destra e all’opercolo frontale, che si occupano, d’altro
canto, di mantenere l’illusione e di evocare il senso di appartenenza della mano di
gomma (Tsakiris et al. 2007).
4.2. SJ e TOJ: paradigmi sperimentali per lo studio del fenomeno di integrazione
Un numero sempre crescente di ricerche comportamentali e neurofisiologiche ha messo
in evidenza il ruolo cruciale che la sincronia temporale e la coincidenza spaziale giocano nel modulare gli effetti dell’integrazione multisensoriale (Stein & Meredith, 1993). I
ricercatori hanno sviluppato, a lungo, diversi paradigmi sperimentali per approfondire lo
studio dei processi di integrazione multisensoriale negli esseri umani, tra cui il compito
di giudizio di ordine temporale (Temporal Order Judgments o TOJ) nel quale ai parte24
cipanti viene chiesto di indicare quale, tra due stimoli crossmodali presentati, sia quella
che compare per prima e il compito di giudizio di simultaneità (Simultaneity Judgments
o SJ).
In un tipico compito di SJ, vengono presentate coppie di stimoli visuo-acustici la cui
comparsa è inserita in una serie di intervalli temporali di presentazione; la presentazione
di tali stimoli è, però, asincrona e i partecipanti sottoposti al task sono tenuti a giudicare
soggettivamente se gli stimoli siano stati presentati simultaneamente o meno (Engel &
Dougherty, 1971). L'analisi dei risultati ottenuti dalle risposte, registrate dai soggetti, è
utilizzata per determinare, successivamente, l'intervallo temporale entro il quale essi abbiano avuto maggiore probabilità di percepire la comparsa degli stimoli come simultanea. In uno studio del 2005, lo scopo di Zampini e collaboratori è stato, appunto, quello
di esaminare se le posizioni relative alla presentazione di stimoli uditivi e visivi fossero
in grado di modulare la percezione della simultaneità audiovisiva dei soggetti. A tal fine, le coppie di stimoli visuo-acustici sono state presentate sia nella stessa posizione
spaziale ma anche in diverse posizioni, ad intervalli temporali differenti; il compito dei
partecipanti era quello di rispondere se gli stimoli fossero comparsi simultaneamente o
meno. Gli autori hanno avanzato l'ipotesi secondo cui i soggetti sarebbero più propensi
a rispondere "simultaneo", nel momento in cui le coppie di stimoli vengano presentate
nella stessa posizione, piuttosto che da posizioni diverse. Questa previsione si basa sul
fatto che dovrebbe esserci una maggiore tendenza a "legare" stimoli provenienti da modalità sensoriali differenti quando essi provengono dalla stessa posizione piuttosto che
da posizioni diverse (Stein & Meredith, 1993). Tale fusione sarebbe, cioè, in grado di
prevalere sulla percezione delle singole caratteristiche sensoriali relative alla presentazione degli stimoli aumentando, in questo modo, la probabilità di percepire questi ultimi
25
come facenti parte dello stesso stimolo (percezione di simultaneità degli stimoli), piuttosto che come due eventi unimodali separati.
26
Capitolo II
La Temporal Binding Window (TBW)
Come si è detto, il processo di integrazione delle informazioni – attraverso modalità
sensoriali differenti – è fortemente dipendente dalla coincidenza temporale e spaziale
degli input in ingresso. A tal proposito, è stato dimostrato in molteplici studi come differenti informazioni vengano integrate all'interno di un intervallo temporale, definito
multisensory temporal binding window (TBW) posseduta dai soggetti che varia tra gli
individui. La grandezza della TBW di un individuo è, dunque, legata alla capacità di
fondere gli input in un percetto unificato. Il fenomeno di integrazione multisensoriale
viene, quindi, catturato dalla TBW, che determina la gamma di input temporali entro cui
un individuo è in grado di “legare” i diversi stimoli, percepiti come parte dello stesso
evento ambientale, attraverso modalità sensoriali differenti. Molti lavori, recentemente,
hanno esaminato i fattori temporali, che rappresentano una parte importante nel processo di integrazione, di alcune patologie rivolgendo proprio l'attenzione alla temporal binding window per indagare il limite temporale entro il quale gli stimoli provenienti da diverse modalità vengono integrati e percettivamente “legati".
E’ stato dimostrato, per l’appunto, come la dimensione della TBW risulti alterata nei
bambini con disturbo dello spettro autistico (Szelag et al., 2004). Questo risultato ha dato prova dell'esistenza di anomalie, in questa categoria di soggetti, nel processamento
temporale delle informazioni e nell’integrazione degli stimoli multisensoriali; difatti,
una differenza importante tra bambini autistici e sani riguarda proprio l’abilità di combinare diverse informazioni in una percezione unificata. Un esempio di come sia presente un'elaborazione multisensoriale alterata nei bambini con disturbo dello spettro autisti27
co è relativa alla ridotta suscettibilità all’effetto McGurk; questo effetto è, cioè, meno
evidente in questi ultimi rispetto ai soggetti sani (Foss-Feig et al., 2010). Evidenze simili sono state riscontrate anche per i pazienti affetti da schizofrenia il cui quadro clinico,
relativo al fenomeno di integrazione, risulta allo stesso modo alterato (Tseng et al.,
2015).
1. SJ in fRMI
La capacità del cervello di integrare gli stimoli in entrata dipende, come si è detto, dalla
struttura temporale di queste informazioni: le relazioni spaziali e temporali degli stimoli
in entrata, perciò, forniscono informazioni su come questi segnali dovrebbero essere integrati al fine di creare una rappresentazione percettiva unitaria. In uno studio del 2007
Noesselt e collaboratori, avvalendosi del paradigma di SJ in fRMI, hanno tentato di indagare la rete "multisensoriale" alla base di tale processo. Nello, specifico, gli autori
hanno dimostrato come la risposta BOLD aumentasse in corrispondenza del solco temporale superiore multisensoriale (mSTS) controlateralmente rispetto allo porzione di
spazio in cui veniva presentato lo stimolo visivo, e che aumentasse anche quando quest'ultimo coincideva temporalmente con la comparsa dello stimolo uditivo; gli autori
hanno osservato, di contro, un decremento nella risposta BOLD nella condizione di incongruenza temporale in riferimento alla presentazione dei due stimoli. Quindi, l'esistenza di una rete di aree multisensoriali attive durante la condizione di congruenza degli stimoli ha dato prova di come, non solo il fenomeno di integrazione possa influenzare le strutture cerebrali multisensoriali "convenzionali" (come la mSTS), ma anche le
aree sensoriali primarie come quella uditiva e visiva. Questa attivazione, però, è possibile evidenziarla nel momento in cui gli input visivi e uditivi presentano una struttura
28
temporale in comune come nel caso, appunto, della presentazione sincrona di due stimoli unisensoriali.
2. Integrazione multisensoriale e malleabilità della TBW
Come è stato possibile notare, diversi studi hanno descritto i limiti temporali della
TBW, ma pochi hanno, però, esaminato la sua malleabilità. Studi recenti hanno, invece,
dimostrato che questa finestra è malleabile e che può essere ridotta attraverso la somministrazione di feedback percettivi all'interno di una sessione di training sperimentale
(Stevenson et al., 2013). La malleabilità della dimensione della TBW è stata studiata,
già precedentemente, da Powers e collaboratori in uno studio del 2009 che ha utilizzato
un paradigma di training percettivo nel quale ai soggetti sono stati somministrati dei
feedback visivi in merito alla correttezza delle risposte date durante lo svolgimento di
un compito di SJ audiovisivo: nello specifico, i soggetti hanno avuto due alternative di
scelta forzate (2-AFC task), per cui sono stati chiamati a rispondere premendo il tasto 1,
se gli stimoli comparivano simultaneamente, e il tasto 2, se non comparivano nello stesso istante. Ciò che è emerso chiaramente è che il training ha determinato un marcato restringimento della dimensione della finestra del 40% (Fig. 8a).
29
Fig. 8a) Effetti del 2-AFC training sulla dimensione della TBW
Nello specifico, nel task iniziale ai partecipanti è stato chiesto di giudicare se la comparsa dello stimolo visivo (flash) e di quello uditivo (beep) fossero "simultanei" o "non simultanei". Il training, invece, differiva nella valutazione delle performances dei soggetti
rispetto al task iniziale, in quanto, dopo aver dato una risposta, i partecipanti venivano
premiati con dei feedback percettivi visivi in merito alla correttezza o meno della risposta data, in modo tale che i soggetti potessero migliorare la loro performance diventando, di conseguenza, più abili nel discriminare gli stimoli presentati. Il gruppo dei partecipanti, nel complesso, ha mostrato una diminuzione significativa nella probabilità di
giudicare le coppie di stimoli come simultanei dopo essere stati sottoposti al training;
ciò sta ad indicare il grado di miglioramento nell'abilità di discriminazione degli stimoli
(i soggetti giudicavano, cioè, con minor frequenza gli stimoli come simultanei ed erano,
invece, maggiormente inclini a rispondere che fossero non simultanei). L'accuratezza
30
nel discriminare gli stimoli corrisponde ad una effettiva diminuzione della grandezza
della TBW dei soggetti (Fig. 8b).
Fig. 8b) Riduzione dimensione della TBW: primo giorno e ultimo giorno di training
Nel complesso, è possibile notare come le dimensioni medie delle TBW dei soggetti
(TBW totale, TBW di sinistra e TBW di destra) diminuiscano in modo significativo anche solo dopo la prima ora di training, per poi rimanere stabili (Fig. 8c).
31
Fig. 8c) Riduzione dimensione della TBW dopo la prima ora di training
In conclusione, con questo studio gli autori hanno dimostrato che il paradigma di training percettivo multisensoriale è in grado di addurre cambiamenti significativi e duraturi nei giudizi dei partecipanti sulla simultaneità percepita tra gli stimoli visivi e uditivi
suggerendo un elevato grado di flessibilità nell’elaborazione temporale multisensoriale;
gli autori hanno, in aggiunta, fornito una forte evidenza che questi effetti sono guidati
da un reale cambiamento nella capacità di discriminazione percettiva generata dal training e che essi non sono il risultato di una semplice esposizione passiva agli stimoli presentati ripetutamente. Uno degli effetti più sorprendenti del training percettivo è stato il
suo sviluppo nel tempo: sono emersi, cioè, effetti significativi anche solo dopo un giorno di training e gli effetti che quest'ultimo ha comportato, in aggiunta, hanno evidenzia32
to una stabilità nella dimensione raggiunta dalla TBW che è rimasta tale per una settimana anche dopo la cessazione del training. L'importanza del feedback utilizzato in
quest'ultimo per la riduzione osservata nella TBW, inoltre, si adatta bene con ciò che è
noto circa gli argomenti che coinvolgono la plasticità sensoriale. Diversi studi hanno
dimostrato, infatti, che una significativa riorganizzazione potrebbe essere guidata in
maniera bottom-up da un’esposizione ad un set forzato di stimoli sensoriali nelle prime
fasi di sviluppo (Hubel et al., 1977) e che l'esposizione passiva a questi stessi stimoli
non sia servita a guidare il cambiamento comportamentale e neanche la riorganizzazione neurale nel momento in cui un animale, per esempio, avesse raggiunto il termine critico del periodo di sviluppo (Hubel & Wiesel, 1963). Aggiungendo, invece, un segnale
istruttivo (feedback) si assiste ad una riorganizzazione sensoriale nei partecipanti, come
supportato dai risultati di questo studio.
2.1. La temporal binding window (TBW) come indice predittivo
Mentre il lavoro di Powers e collaboratori del 2009 ha indagato principalmente la plasticità della TBW non è, tuttavia, ancora chiaro se i cambiamenti nell'esperienza multisensoriale siano una componente necessaria per le modifiche indotte nella percezione
degli stimoli o se questi effetti possano essere guidati, in modo simile, attraverso cambiamenti nell’elaborazione temporale delle singole componenti unisensoriali. Partendo
da queste considerazioni, Stevenson e collaboratori nel 2013 hanno tentato di approfondire i risultati relativi alla malleabilità della TBW esaminando, nello specifico, se l'esperienza multisensoriale possa andare incontro a modifiche, sottoponendo i soggetti ad un
training percettivo di TOJ esclusivamente unisensoriale (visivo) rispetto al training audiovisivo utilizzato da Powers e collaboratori. Gli autori hanno scelto di sottoporre i
33
soggetti ad un training visivo poiché è stato dimostrato, da studi precedenti, che i cambiamenti nella percezione multisensoriale possono essere indotti proprio all'interno del
sistema visivo (Adini et al., 2002). Dai risultati dello studio è emerso come il training
percettivo di TOJ nel quale ai partecipanti è stato chiesto di indicare quale tra i due stimoli presentati comparisse per primo, seguito dalla somministrazione di feedback, abbia
migliorato l’accuratezza nei giudizi visivi di ordine temporale; ancor più rilevante sembra essere il fatto che il training visivo abbia migliorato notevolmente la percezione
multisensoriale audiovisiva nei compiti di SJ; un miglioramento che comporta, appunto,
la diminuzione della dimensione iniziale della TBW dei soggetti. Per gli autori, perciò, i
risultati ottenuti, in termini di miglior performance nel discriminare gli stimoli, assumono una grande importanza nel panorama scientifico: il training con feedback visivi è, infatti, sufficiente a generare cambiamenti nella percezione multisensoriale degli stimoli
audiovisivi; la sola esposizione al compito e gli effetti associati al training in assenza di
feedback, invece, non sembrano indurre modifiche nella percezione multisensoriale. Un
dato di estrema rilevanza è rappresentato, inoltre, dalla dimensione iniziale della TBW
dei soggetti: precedenti ricerche hanno dimostrato che esiste una correlazione tra le dimensioni della TBW iniziale e il grado in cui essa può essere ridotta in seguito alla
somministrazione del training. Nello specifico, è stato osservato che quanto più ampia
risulta essere la TBW iniziale, tanto maggiore risulterà l'impatto relativo all’effetto indotto dal training (Powers et al., 2009). La dimensione iniziale della TBW rappresenta,
di conseguenza, un forte indice predittivo degli effetti di miglioramento nelle prestazioni dei soggetti che sono stati sottoposti al training. In effetti, questa analisi ha mostrato
una correlazione sorprendente, poiché si è visto che il grado di plasticità della TBW
sembra essere determinato dalla sua dimensione iniziale: in questo modo, i soggetti con
34
grandi finestre multisensoriali, prima di essere sottoposti al training, sono quei soggetti
che registrano i maggiori effetti del training e che mostrano una più evidente diminuzione
della
grandezza
della
TBW.
Inoltre, mentre gli studi precedenti (Alais & Cass, 2010) hanno dimostrato che la pratica
audiovisiva può influenzare l'apprendimento visivo a livello percettivo, questo è il primo studio a mostrare una relazione reciproca in cui il training con feedback visivi induce modifiche sull’elaborazione multisensoriale. In definitiva, è evidente come la ricerca
per le basi neurali della TBW sia diventata una zona sempre più attiva di indagine; un
certo numero di studi indicano la presenza di una grande rete dinamica di aree che comprende l'insula, la corteccia parietale posteriore e la corteccia temporale superiore; aree
critiche, queste, nella percezione della simultaneità audiovisiva (Bushara et al., 2003);
più di recente, però, l'interesse si è concentrato sul ruolo potenziale delle oscillazioni
neuronali nell’elaborazione temporale multisensoriale (Lakatos et al, 2007). Insieme,
questi lavori si sono focalizzati sulla corteccia cerebrale che rappresenta la zona critica
per lo studio approfondito del fenomeno di plasticità percettiva (Maertens & Pollmann,
2005).
3.
Integrazione multisensoriale e resting-state
Le neuroscienze hanno a lungo ritenuto che i circuiti neurali di base fossero fondamentalmente spenti nel momento in cui la nostra attività cerebrale risultasse apparentemente
in “standby”. Esperimenti di neuroimaging hanno, invece, dimostrato la presenza di un
livello persistente di attività di fondo; questa cosiddetta "modalità di default" potrebbe
essere essenziale nella pianificazione di azioni future, ma ancor più nella comprensione
e nell’individuazione di quelli che potrebbero essere considerati i pattern neurali di base
35
in grado di predire i cambiamenti nella dimensione della TBW. Recentemente, uno studio di Powers e collaboratori del 2012 ha dimostrato non solo che, attraverso la somministrazione di un paradigma di training percettivo, è possibile osservare una riduzione
del 40% della larghezza della TBW nei soggetti sottoposti al training – che rimane stabile per almeno una settimana anche dopo la cessazione di quest'ultimo –, ma anche
come sia possibile risalire ai substrati neurali di questi cambiamenti. Il compito era
uguale a quello somministrato nel precedente studio; gli autori, perciò, hanno misurato,
tramite fMRI (risonanza magnetica funzionale), la connettività funzionale a riposo prima e dopo aver sottoposto i partecipanti al paradigma di training. Dai risultati dello studio è emerso chiaramente come il solco temporale superiore posteriore (pSTS) e le aree
della corteccia visiva e uditiva esibiscano un robusto decremento della risposta BOLD
in seguito alla sessione di training al quale i soggetti sono stati sottoposti; l'analisi del
resting-state, in aggiunta, ha messo in luce un aumento significativo, in seguito alla
somministrazione del training, della forza dei pattern neurali che si vengono a creare tra
queste aree. Questi risultati forniscono, perciò, una prima prova dei correlati neurali che
sottostanno ai cambiamenti nella finestra di integrazione multisensoriale. Nello specifico, gli autori hanno avanzato l'ipotesi che sia possibile ottenere un cambiamento nella
risposta BOLD nella pSTS e nelle aree uditive e visive e che, il modo in cui queste regioni funzionalmente interagirebbero, verrebbe alterato dopo aver sottoposto tali soggetti al training percettivo. L’attività del segnale BOLD in pSTS diminuisce, difatti, in seguito al training e ciò rifletterebbe il grado di miglioramento nel processo di discriminazione degli stimoli percepiti come sincroni e come asincroni: gli autori hanno attribuito questo decremento del segnale BOLD ad un restringimento della popolazione neurale
coinvolta nel processo, a favore di un sottoinsieme di neuroni più limitato e specializza36
to. In questo modo, la direzione del cambiamento, in seguito al training, potrebbe essere
interpretata a sostegno dell'ipotesi degli autori, secondo la quale il training aumenterebbe l'efficienza, da parte dei soggetti, nel distinguere le coppie di stimoli oggettivamente
simultanee da quelle, invece, altamente asincrone.
Ancor più rilevante risulta essere, però, l’analisi del resting-state in seguito alla
sessione di training; dopo aver individuato la rete di aree corticali sensoriali, che sembrano giocare un ruolo importante nei cambiamenti indotti dal training nella grandezza
della TBW, gli autori hanno tentato, in aggiunta, di indentificare i cambiamenti funzionali tra la pSTS e le altre aree connesse: mentre all'inizio del training non era ancora
presente una completa sovrapposizione tra la pSTS e le aree uditive e visive, in seguito
alla sessione di training è stato possibile osservare, invece, un aumento significativo
della forza della connettività funzionale tra le suddette aree. Tra le aree implicate nel
processo sono state evidenziate il giro temporale superiore destro (corteccia uditiva secondaria), il giro paraippocampale destro, il solco parietale inferiore e la corteccia premotoria sinistra (Fig. 9a).
Fig. 9a) Le aree implicate nel fenomeno di integrazione
37
La forza di tali connessioni in seguito al training è stata osservata, inoltre, anche tra
pSTS e il CS, così come nel cervelletto superiore (Fig. 9b).
Fig. 9b) La connettività funzionale nel resting-state aumenta tra la pSTS e le aree uditive in seguito alla sessione di training.
Come si è detto, i dati presentati da questo studio rappresentano il primo tentativo di caratterizzare, ma soprattutto di dimostrare la possibilità di modificare – attraverso un
training audiovisivo di SJ – le dinamiche di un network di specifiche aree alla base del
processo di integrazione multisensoriale e di come alcuni nodi di questa rete (pSTS e le
altre aree implicate) siano strettamente legati; quest’ultima evidenza è supportata dal
fatto che l’attività e la connettività funzionale di queste aree sono soggette a cambiamenti in seguito al training percettivo a cui i soggetti sono stati sottoposti. Tale alterazione nei pattern funzionali, perciò, chiarisce il ruolo che queste aree svolgono durante
la percezione degli eventi multisensoriali di tutti i giorni.
38
Capitolo III
Parte sperimentale
1.
Obiettivi della ricerca
Il fenomeno di integrazione multisensoriale, come si è visto, ha luogo nel momento in
cui i tre principi di base (regola spaziale, temporale e dell’efficacia inversa) vengono rispettati (Kanayama et al., 2014; Keil et al., 2011). Molteplici studi, inoltre, si sono avvalsi del paradigma di SJ in fRMI nel tentativo di indagare la rete "multisensoriale" alla
base di tale processo (Noesselt et al., 2007). Un indice di come avvenga tale fenomeno è
sicuramente rappresentato da un intervallo temporale (TBW) proprio di ogni soggetto,
che varia tra gli individui e che determina la gamma di input sensoriali entro cui un
soggetto è in grado di “legare” i diversi stimoli, percepiti come parte dello stesso evento
ambientale, attraverso modalità sensoriali differenti.
Come è stato possibile constatare, diversi studi hanno descritto i limiti della temporal
binding window ma pochi hanno, però, esaminato la sua malleabilità; essa, in realtà, si è
visto che può essere ridotta attraverso la somministrazione di feedback percettivi in una
sessione di training sperimentale. L’utilizzo di feedback è di utilità ottimale in relazione
all’accuratezza delle risposte date dai soggetti sottoposti al training: il fatto di avere degli indizi percettivi, in grado di indirizzare le loro decisioni, ha dato prova di come
l’utilizzo di questi feedback correlli significativamente con la riduzione della dimensione della TBW. Le performance dei soggetti miglioravano e, di conseguenza, essi divenivano più abili nel discriminare correttamente gli stimoli presentati.
39
Sulla scia dello studio nel 2009 condotto da Powers e collaboratori, ulteriori studi hanno
tentato di approfondire gli effetti del training sui processi di integrazione multisensoriale; in uno studio del 2013, Stevenson e collaboratori hanno dimostrato come il training
unisensoriale con feedback visivi sia, in realtà, sufficiente a generare cambiamenti nella
percezione multisensoriale degli stimoli audiovisivi; mentre, la sola esposizione al compito e gli effetti associati al training in assenza di feedback non sembrano indurre modifiche nella percezione multisensoriale. In generale, tutti questi risultati hanno evidenziato come la dimensione iniziale della TBW rappresenti un forte indice predittivo degli
effetti di miglioramento nelle prestazioni dei soggetti che sono stati sottoposti al training: nello specifico, è stato osservato che quanto più ampia risulta essere la TBW iniziale, tanto maggiore risulterà l'impatto relativo all’effetto indotto dal training. I soggetti con grandi finestre multisensoriali, prima di essere sottoposti al training, sono quei
soggetti che registrano i maggiori effetti di quest’ultimo e che mostrano una più evidente diminuzione della grandezza della TBW (Powers et al., 2009). Lo studio di Powers e
collaboratori del 2012 ha dimostrato, difatti, non solo che, attraverso la somministrazione di un paradigma di training percettivo è possibile osservare una riduzione del 40%
della larghezza della TBW, ma anche come sia possibile risalire ai substrati neurali di
questi cambiamenti e come aumenti la connettività tra alcune aree implicate nel fenomeno in seguito alla somministrazione del training, nonostante non sia stato trovato, però, alcun indice neurale che possa predire l’andamento del training.
La presente ricerca è stata condotta con l’intento di identificare non solo i correlati neurali di base del suddetto fenomeno, ma soprattutto di esplorare i meccanismi neurali ad
esso sottostanti in grado di predire i cambiamenti nella dimensione della TBW prima
che i soggetti vengano sottoposti ad una sessione di training di SJ visuo-tattile. Ci siamo
40
avvalsi, perciò, non solo delle registrazioni, mediante utilizzo di EEG, dell’attività cerebrale a riposo per condurre l’analisi del resting-state, ma abbiamo anche registrato
l’attività cerebrale evocata durante la somministrazione del paradigma di SJ percettivo.
Pertanto abbiamo tentato di indagare quali siano i meccanismi neurali alla base dei
cambiamenti relativi alla dimensione della TBW dei soggetti da noi esaminati: nello
specifico se, osservando l’attività a riposo di questi soggetti prima che vengano sottoposti al training, sia possibile evidenziare e predire il grado di riduzione nella dimensione
della TBW conseguente alla somministrazione del training.
2.
Materiali e metodi
2.1. Partecipanti
Hanno preso parte all’esperimento 22 soggetti di cui 12 femmine e 10 maschi con
un’età media di 22,72 (DS=1,8).
Nessuno dei partecipanti risultava affetto da disturbi neurologici o psichiatrici e, coloro
che erano stati sottoposti ad operazioni chirurgiche cerebrali, non sono stati sottoposti
all’esperimento. Il loro livello di scolarizzazione andava dal diploma superiore alla laurea triennale. Nessuno dei partecipanti era a conoscenza dell’ipotesi sperimentale.
2.2. Procedura sperimentale
I partecipanti reclutati sono studenti iscritti all’università Gabriele D’Annunzio di Chieti-Pescara e sono stati chiamati presso l’ITAB (Istituto Tecnologie Avanzate Biomediche) per svolgere l’esperimento. Per prima cosa sono stati raccolti i dati socioanagrafici
utilizzati per la descrizione del campione ed è stato chiesto loro di firmare il consenso
41
informato. Musicisti e ballerini non sono stati considerati idonei a partecipare
all’esperimento poichè è stato dimostrato come la TBW di questi soggetti risulti essere
di dimensioni ridotte rispetto a non ballerini e non musicisti, di conseguenza, è stato
possibile constatare come essi siano maggiormente sensibili all’allineamento temporale
degli stimoli audio-visivi percepiti (Hweeling & Uta, 2014). Ai partecipanti è stato
quindi chiesto di eseguire una prima sessione comportamentale di SJ visuo-tattile per
poter calcolare la TBW iniziale. Tale misura è stata utile per definire l’idoneità o meno
dei soggetti: difatti, quei soggetti che hanno registrato ridotte dimensioni delle TBW
(circa 250 millisecondi), non sono stati considerati idonei per questo studio: essendo interessati ad evidenziare indici predittivi del miglioramento della prestazione, i soggetti
con TBW troppo piccole avrebbero potuto non mostrare effetti del training. In questa
prima fase, perciò, i soggetti sono stati fatti accomodare in una stanza buia; il setting
sperimentale prevedeva che i partecipanti si sedessero di fronte ad un tavolo sul quale
era posizionato un piccolo cubo di polistirolo al quale è stato applicato un LED rosso
(stimolo visivo) e, applicati al dito medio della mano sinistra, degli elettrodi collegati ad
un elettrostimolatore che generava delle scosse di bassa intensità (stimolo tattile). Per
poter applicare i cavi, direttamente a contatto con il dito medio della mano sinistra dei
soggetti, abbiamo utilizzato un gel conduttore per favorire la trasmissione. Successivamente, abbiamo regolato l’intensità della stimolazione in maniera differente per ogni
soggetto con l’obiettivo di adattare l’intensità di quest’ultima in base alla loro differente
soglia percettiva e, una volta trovata, abbiamo aumentato l’intensità della stimolazione
per essere sicuri che i soggetti la percepissero chiaramente. Ai soggetti è stato chiesto
di tenere con la mano sinistra, sulla quale venivano somministrati gli stimoli tattili, il
cubo con il LED: è stato possibile, in questo modo, rispettare la regola spaziale alla base
42
del fenomeno di integrazione multisensoriale. Successivamente è stata avvicinata, alla
mano destra dei soggetti, la testiera di risposta. Il compito prevedeva la presentazione, a
diversi intervalli temporali (delay) che andavano da -500 a +500 millisecondi, di coppie
di stimoli cross modali visivi e tattili. I soggetti sono stati istruiti a rispondere esprimendo un giudizio di simultaneità soggettivo: con un tasto, se gli stimoli fossero stati percepiti come “simultanei” e, con l’altro, se fossero stati percepiti come “non simultanei”. I
tasti di risposta sono stati controbilanciati fra i soggetti.
Il giorno seguente, si è passati alla registrazione dell’elettroencefalogramma: si è cominciato con la preparazione della superficie della testa dei soggetti. Per poter applicare
correttamente sulla loro testa il sistema di registrazione, abbiamo misurato la distanza
tra inion e nasion, tale misura è stata divisa a metà per poter individuare il punto centrale dello scalpo sulla linea saggittale. Successivamente, si è misurata la distanza fra i due
punti auricolari destro e sinistro, tale misura è stata divisa a metà per poter individuare il
punto centrale dello scalpo sulla linea coronale. L’incrocio di questi due punti è servito
per definire la posizione dell’elettrodo Cz e, quindi, il corretto posizionamento della
cuffietta EEG secondo il sistema internazionale 10:10; dopo averla posizionata, è stato
applicato dell’alcool all’interno di ogni elettrodo per poter esporre la cute del soggetto.
In seguito, è stato passato dello scrub sulla cute in corrispondenza delle cavità degli
elettrodi non ancora montati per abbassare l’impedenza naturale della pelle a circa 15
kiloohm (kΩ). Una volta attaccati gli elettrodi, sono stati riempiti con gel elettroconducente, si sono attesi alcuni minuti affinchè il segnale si stabilizzasse e, nel contempo, è
stato spiegato ai soggetti quello che avrebbero dovuto fare durante il compito. Il compito sperimentale era un SJ visuotattile dove, però, non si prevedeva la somministrazione
di tutti gli intervalli temporali, ma solo di una selezione mirata ad indagare alcuni feno43
meni specifici della TBW, non oggetto di tale elaborato. La sessione di registrazione
aveva la durata di 3 ore circa e prevedeva la somministrazione di 2 blocchi di restingstate (della durata rispettivamente di 4 minuti) durante i quali ai soggetti non è stato
presentato alcuno stimolo: in un blocco, ai soggetti è stato chiesto di rimanere con gli
occhi chiusi; nell’altro, è stato chiesto di tenere gli occhi aperti e di concentrare la propria attenzione su una croce di fissazione sul monitor di un computer posto di fronte a
loro. Subito dopo, i soggetti sono stati sottoposti al compito di SJ. Al termine del task,
sono stati nuovamente sottoposti a 2 blocchi di resting-state della stessa durata dei primi
due. Successivamente, i soggetti, nei 3 giorni seguenti, sono stati richiamati e invitati a
completare una sessione di training di SJ visuo-tattile: tale sessione di training prevedeva la somministrazione di 3 blocchi di SJ in cui venivano somministrati solamente intervalli temporali che andavano da -150 a +150. Il compito di training prevedeva la presenza di feedback uditivi che informassero i soggetti sulla correttezza o meno della loro
risposta. Tali blocchi avevano una durata minore rispetto a quelli di valutazione per avere la certezza che i soggetti si potessero impegnare e concentrare durante tutta la sessione di training. Alla fine (circa 25 minuti), i soggetti hanno eseguito 2 blocchi di SJ di
valutazione per poter valutare gli effetti del training.
L’ultimo giorno, esattamente come nella prima sessione di elettroencefalografia, i soggetti sono stati richiamati per essere nuovamente sottoposti alla sessione di registrazione
tramite EEG. Quest’ultima sessione, come la prima, prevedeva la presenza di 2 blocchi
di resting-state iniziali, seguiti dal task e, infine, la somministrazione dei 2 blocchi di
resting-state finali. Alla fine del compito, i soggetti sono stati ripuliti dai residui di gel e
adeguatamente informati sul reale scopo della ricerca.
44
2.3. SJ visuo-tattile - valutazione
In questo task sono state presentate coppie di stimoli visuo-tattili: nello specifico, i 16
intervalli di presentazione degli stimoli (delay) andavano da -500 a +500 millisecondi (500, -400, -300, -200, -150, -100, -50, -25, 25, 50, 100, 150, 200, 300, 400, 500); per
ogni delay sono state somministrate 14 coppie di stimoli in ogni blocco: gli intervalli
negativi indicavano quei trial in cui lo stimolo tattile veniva presentato per primo (tactile-leading); gli intervalli positivi, viceversa, indicavano quei trial in cui lo stimolo visivo veniva presentato per primo (visual-leading). In ognuno dei 3 blocchi sono stati presentati rispettivamente 224 trial, i soggetti hanno completato 3 blocchi di valutazione,
per un totale complessivo di 672 trial.
2.4. SJ visuo-tattile - training
In questo task sono state presentate coppie di stimoli visuo-tattili: nello specifico, i 7 intervalli di presentazione degli stimoli (delay) andavano da -150 a +150 millisecondi (150, -100, -50, 0, 50, 100, 150). Per i delay non simultanei (-150, -100, -50, 50, 100,
150) sono stati presentati 10 stimoli ognuno; per la condizione di simultaneità (0 ms),
invece, 60 stimoli: i delay non sono stati equamente distribuiti, in quanto il rapporto fra
la condizione di simultaneità è stato di 6:1 rispetto a quelle di non simultaneità. In questo modo le due condizioni avevano lo stesso numero di trial minimizzando, in questo
modo, la probabilità di incorrere in bias di risposta. In un blocco erano presenti 120 stimoli totali; i soggetti hanno completato 3 blocchi di training, per un totale di 260 trial.
Gli intervalli negativi indicavano quei trial in cui lo stimolo tattile veniva presentato per
primo (tactile-leading); gli intervalli positivi, viceversa, indicavano quei trial in cui lo
stimolo visivo veniva presentato per primo (visual-leading). In aggiunta, come si è det45
to, sono stati somministrati due feedback uditivi 400 millisecondi dopo che i soggetti
avessero risposto: il suono alto è stato associato alla risposta “corretta” che prevedeva
che i soggetti rispondessero di aver percepito gli stimoli come non simultanei nella condizione di non simultaneità; mentre, il suono basso è stato associato alla risposta “sbagliata” che prevedeva che essi rispondessero di aver percepito gli stimoli come simultanei nella condizione di non simultaneità. I feedback erano invertiti nella condizione di
simultaneità.
3. Analisi dei dati
Tutti i dati sono stati raccolti con MatLab. Di seguito sono riportate le principali analisi
statistiche e i relativi risultati ottenuti analizzando i dati del campione preso in esame.
Sono stati ricavati i seguenti dati: le misure relative all’estensione delle TBW dei soggetti (la TBW baseline calcolata durante il primo giorno di valutazione e le TBW misurate durante i 3 giorni di training) e i dati neurali raccolti durante le due sessioni di elettroncefalografia.
3.1. Dati comportamentali
Per indagare gli effetti del training, è stata eseguita un’ANOVA con un fattore within a
4 livelli (time point: baseline vs 1 giorno vs 2 giorno vs 3 giorno). Tale analisi ci ha
permesso di confrontare la TBW nelle diverse sessioni, evidenziando un miglioramento
dopo il primo giorno di training.
L’effetto principale dei diversi time point risulta essere significativo per F (3,63) =
12,05, p < 0,001. Abbiamo quindi eseguito i post hoc di Newman-Keuls che hanno mo46
strato una differenza significativa fra la baseline (M= 405 msec, DS= 131) e i tre giorni
di training (giorno 1: M=307, DS= 77,04; giorno 2: M=294, DS= 70,8; giorno 3:
M=284, DS=75,63) (p < 0,001 per tutti i confronti). Non sono state rilevate differenze
significative fra il tre diversi giorni di training (p > 0,56) (Grafico n. 1).
TBWTotale
450
millisecondi
400
405
350
307
294
300
284
250
baseline
1giorno
2giorno
3giorno
timepoint
Grafico 1 Effetto significativo del training tra la baseline e i 3 giorni di training
Non avendo trovato differenze fra i diversi giorni di training, tale variabile è stata collassata, confrontando solamente la TBW di baseline con la media dei tre giorni di training: è stato quindi eseguito un t-test per campioni indipendenti per confrontare la prestazione pre training e quella post training così ottenuta: l’effetto del training continua
ad essere significativo per t (21,1) = 3,8; p = 0,001 (Grafico n. 2) (Pre Training: M =
405, DS = 131; Post Training: M = 295, DS = 66).
47
TBW
Millisecondi
450
400
405
350
300
295
250
PreTraining
PostTrainig
Grafico 2 Differenza significativa tra il Pre e il Post Training
In aggiunta, è stato indagato se esistesse una differenza tra i due lati della TBW (tactileleading e visual-leading): a tale scopo, abbiamo effettuato un’ANOVA 2x2 con i seguenti fattori within subject: la sessione (due livelli, pre training e post training) e i lato
della TBW (due livelli, tactile-leading e visual-leading). Tale analisi ha confermato
l’effetto principale della sessione per F(1,21) = 14,51; p = 0,001, mostrando come la
TBW post training sia significativamente ridotta rispetto al pre training (Pre Training:
M=202,7, DS=68,9; Post Training: M=147; DS=34,9).
Né l’effetto del lato, né l’interazione sessione x lato risultano significative (lato: F(1,21)
= 0,33, p = 0,56; lato x sessione: F(1,21) = 0,33, p = 0,57). (Grafico n. 3, Tabella 1).
48
millisecondi
TBWTactileleadingvsVisual
leading
240
220
200
180
160
140
120
100
205
199
147
148
Tactileleading VisualLeading Tactileleading VisualLeading
PreTraining
PostTraining
Grafico 3 Nessun effetto significativo del lato e dell'interazione sessione x lato
Media
Dev.st
Pre Training
Tactile leading
199
83
Post Training
Visual Leading Tactile leading
205
147
54
30
Visual Leading
148
40
Tabella 1
49
3.2. Elettroencefalogramma
In questa sessione verranno presentati i dati elettroencefalografici relativi ai blocchi di
resting-state registrati ad occhi aperti ed eseguiti prima del task in elettroencefalogramma nelle due sessioni, prima e dopo il training. I dati sono stati analizzati utilizzando il software gratuito EEGLAB (Delorme A & Makeig S, 2004). In principio, i dati
sono stati ricampionati a 500 Hz, è stato applicato un filtro passa basso a 30 Hz e un
passa alto a 0,5 Hz. In seguito, sono stati rimossi gli artefatti da movimenti oculari utilizzando l’Analisi delle Componenti Indipendenti sfruttando l’algoritmo FastICA (MatLab).
In seguito, per ogni soggetto e, per ogni banda di frequenza (Delta: 1 – 4 Hz; Theta: 4,8
– 7 Hz; Alpha: 7 – 13 Hz; Beta: 13 – 20 Hz), è stato calcolato il picco di frequenza che
presentasse la maggior potenza. Quindi, per ogni soggetto, sono stati ricavati quattro valori relativi al picco di frequenza maggiormente espresso in ogni banda.
Essendo interessati ad evidenziare un correlato neurale che possa spiegare e predire il
grado di miglioramento in seguito al training multisensoriale, sono state analizzate le
correlazioni fra i dati elettroencefalografici così ottenuti e l’estensione della TBW prima
e dopo il training, esaminando sia le possibili relazioni con la TBW presa integralmente, sia analizzandone i due lati separatamente.
Tale analisi ha evidenziato una correlazione positiva significativa fra le frequenze in
Theta e la TBW Pre Training Tactile Leading (r = 0,45, p = 0,03) (Grafico n. 4).
50
FrequenzeThetaPreTrainingvs
TBWtactileleading
FrequenzeTheta(Hz)
7,5
7
6,5
6
5,5
5
4,5
4
100
150
200
250
300
350
400
TBW(millisecondi)
Grafico 4 Correlazione positiva significativa tra le frequenze in Theta e la TBW Pre
Training Tactile-Leading
Tale correlazione evidenzia come ad una frequenza Theta più alta corrisponda una TBW
pre training più alta. Tale correlazione però non si ritrova nel post training (r = -0,21; p
= 0,33) (Grafico n. 5.)
FrequenzeTheta(Hz)
FrequenzeThetaPostTrainingvsTBWtactileleading
7,5
7
6,5
6
5,5
5
4,5
4
50
100
150
200
TBW(millisecondi)
Grafico 5 Nessuna correlazione tra le frequenze in Theta e la TBW Post Training Tactile-Leading
51
Inoltre è stata evidenziata una correlazione significativa fra la frequenza Theta individuale e l’equivalente trasformazione dell’estensione della medesima TBW in frequenza
(1000/TBW in millisecondi; r= -,48; p = 0,022) (Grafico n. 6).
FrequenzeTheta(Hz)
FrequenzaThetapretrainingvsTBWinHz
7,5
7
6,5
6
5,5
5
4,5
4
2,00
3,00
4,00
5,00
6,00
TbwinHz
7,00
Grafico 6 Correlazione negativa significativa tra le frequenze in Theta e la TBW
espressa in frequenza
La frequenza Theta non presenta differenze significative fra pre training e post training
(Pre Training: M=5,89, DS=0,76; Post Training: M=5,97, DS= 0,77; t (21,1) = -0,37; p
= 0,71) (Grafico n. 7).
FrequenzeTheta(Hz)
FrequenzeThetaPreePostTraining
8
7
6
5
4
5,89
5,97
PreTraining
PostTraining
3
Grafico 7 Nessuna differenza tra il Pre e il Post Training nelle frequenze Theta
52
4.
Discussione dei risultati
In questo studio ci siamo interessati a ricercare mediante l'analisi del resting-state, il
substrato elettrofisiologico responsabile del fenomeno di integrazione multisensoriale
quando l'attività cerebrale è momentaneamente in stato di "riposo". Siamo dell’idea che
tale attività di fondo – registrata tramite EEG – possa rappresentare un indice esplicativo dell’attività cerebrale dei soggetti da noi esaminati e che questa attività “a riposo”
funga da correlato neurale importante per comprendere le dinamiche alla base del processo di integrazione. Infatti, emerso come il processo di integrazione venga catturato
da una finestra di integrazione multisensoriale (TBW) che determina la gamma di intervalli temporali entro cui un individuo è in grado di fondere stimoli provenienti da modalità sensoriali differenti, diversi studi in aggiunta hanno dimostrato che questa finestra è
malleabile e che può essere ridotta attraverso un training con l’ausilio di feedback percettivi. Sulla scia di queste ricerche, nel suddetto studio si è tentato di ampliare tali risultati esaminando la malleabilità della TBW sottoponendo i soggetti ad un training visuo-tattile e, avvalendoci dell’EEG, abbiamo cercato di risalire a dei marker neurali in
grado di predire il grado di malleabilità della TBW.
I risultati comportamentali hanno mostrato come il training percettivo abbia prodotto un
miglioramento - in termini di performance dei soggetti – nel discriminare le coppie di
stimoli presentate, già dopo il primo giorno di training; evidenziando, in questo modo,
il grado di riduzione delle TBW post training. Inoltre, dai dati elettroencefalografici è
emersa una stretta correlazione tra le frequenze Theta a riposo e la TBW di baseline; tale correlazione, però, non si evidenzia nel post training. La frequenza Theta, quindi, risulta essere un indice in grado di definire il meccanismo di integrazione multisensoriale
individuale ma non il grado di malleabilità dello stesso. Infatti, abbiamo osservato come
53
la frequenza pre e post training, presa in esame, non mostri alcun cambiamento. Questo
dato è in linea con diversi studi condotti recentemente, nei quali è stato possibile evidenziare una correlazione esistente tra il comportamento e l’attività cerebrale di base,
cosiddetta “a riposo”. Difatti, è stato osservato come il 74% del nostro comportamento e
delle nostre reazioni sia attribuibile alle fluttuazioni cerebrali spontanee e intrinseche
(ongoing fluctuations) quando il nostro cervello è momentaneamente in stato di “riposo”. Questo studio, in aggiunta, non solo è in grado di definire la suddetta correlazione,
ma ne identifica anche una maggiormente specifica tra il comportamento manifesto (in
un compito di detezione semplice visiva dello stimolo) e l’attività cerebrale spontanea
(resting-state), correlazione che fa riferimento alla variabilità inter-trial (Fox et al.,
2007). E’ stato osservato, inoltre, come tale attività di base sia in grado di predire la tipologia di risposta in un compito in cui è stato chiesto ai soggetti di esprimere un giudizio relativo alla percezione visiva di figure bistabili. In questo caso, gli autori si sono
avvalsi dell’illusione del Vaso di Rubin con il quale sono stati in grado di identificare
una correlazione tra l’attività prestimolo nell’area fusiforme delle facce (FFA, face fusiform area) e il tipo di risposta che i soggetti avrebbero dato. I dati hanno evidenziato
come ad un’alta attività prestimolo dell’area fusiforme dei volti corrispondesse la percezione, da parte dei soggetti esaminati, dei due volti di profilo e come, di contro, ad una
bassa attività della stessa area corrispondesse la percezione del vaso (Hesselmann et al.,
2008). Anche quando si fa riferimento al concetto di soglia percettiva, è stato possibile
delineare una correlazione simile tra un’alta attività prestimolo nelle aree uditive e le risposte date dai soggetti esaminati, in un compito che prevedeva la risposta a degli stimoli uditivi somministrati a soglia percettiva, quindi percepibili nel 50% dei casi: nello
specifico, nel momento in cui i soggetti percepivano correttamente lo stimolo (“hits”), si
54
registrava un’alta attività prestimolo nelle aree uditive; di contro, quando i soggetti non
percepivano correttamente lo stimolo (“miss”), si registrava una bassa attività prestimolo nelle stesse aree (Sadaghiani et al., 2009). Ulteriori ricerche hanno, inoltre, dato conferma di come anche nelle aree relative al movimento (MT, area medio temporale) si
possa evidenziare una attività spontanea che aumenta, però, solo nel momento in cui gli
stimoli presentati danno l’impressione, al soggetto, di muoversi nella medesima direzione in maniera coerente rispetto a quando il movimento degli stimoli è del tutto casuale (Hesselmann et al., 2008). Quindi se, facendo riferimento al comportamento umano
“manifesto” i suddetti studi hanno tentato di indagare le varie tipologie di risposta a
compiti che vanno dalla detezione semplice dello stimolo fino a quelli di decision making percettivo ed è stato possibile, in questo modo, risalire ai substrati neurali dei diversi processi, il medesimo discorso è stato possibile affrontarlo in altri studi che hanno
tentato, ancor più, di ampliare tali risultati ad ambiti di ricerca più specifici. In particolare, si è visto come l’abilità dei soggetti nel rilevare gli stimoli, anche questi somministrati a soglia percettiva, sia fortemente correlata con la fase dell’oscillazione cerebrale;
i dati, difatti, hanno mostrato un collegamento diretto tra le fluttuazioni spontanee del
cervello misurate a frequenze molto basse (infraslow frequencies: 0,01 – 0,1 Hz) e la fase dell’oscillazione in cui viene a trovarsi un dato stimolo. A tal proposito, è stato dimostrato che se quest’ultimo cade nella cosiddetta fase “up” dell’oscillazione, allora esso
non verrà percepito dal soggetto; di contro, se lo stesso cade nella fase definita “down”,
lo stimolo di conseguenza verrà percepito correttamente (Monto et al., 2008). Seguendo
la scia dei risultati emersi dalle ricerche precedentemente condotte, quindi, un ulteriore
studio ha tentato di indagare se e in che modo la potenza e la fase delle oscillazioni alpha (10 Hz) siano in grado di predire con successo la percezione tattile consapevole.
55
Nello specifico, sono state somministrate delle stimolazioni tattili vicine alla soglia percettiva alla mano sinistra dei soggetti esaminati e, nel contempo, è stata registrata
l’attività cerebrale attraverso una sessione di EEG in corrispondenza della corteccia somatosensoriale destra, controlateralmente alla stimolazione. Questo primo risultato suggerisce, quindi, l’esistenza di una relazione tra la potenza dell’alpha prestimolo e la detezione dello stimolo tattile presentato. Dallo studio è emersa, in aggiunta, una differenza significativa relativa, questa volta, alla fase in cui lo stimolo presentato veniva a trovarsi: questo risultato è stato in grado di predire il tipo di risposta che i soggetti avrebbero dato agli stimoli presentati successivamente: se i soggetti, cioè, avrebbero o meno
percepito lo stimolo tattile prima ancora che avessero dato una risposta. Questi risultati,
in conclusione, suggeriscono come le oscillazioni alpha misurate nelle aree somatosensoriali esercitino un forte controllo inibitorio sulla percezione tattile e come, in aggiunta,
l'inibizione degli impulsi modelli lo stato dell’attività cerebrale necessario affinchè avvenga la percezione cosciente degli stimoli (Ai & Ro, 2013). Le evidenze emerse da
questi studi fanno ben comprendere come l’ongoing activity rappresenti, quindi, un correlato neurale fondamentale e importante poiché, tramite questo, è stato possibile predire e spiegare differenti processi che vanno dalla detezione semplice degli stimoli a quelli relativi al decision making percettivo. Il presente studio, perciò, si propone di allargare questo nuovo assetto di conoscenze teorizzato negli ultimi anni, relativo all’ongoing
activity, allo studio del fenomeno di integrazione multisensoriale da noi preso in esame.
In effetti, la correlazione significativa trovata fra le frequenze Theta e la dimensione
della TBW dei soggetti stabilisce un collegamento diretto tra una determinata banda di
frequenza e il comportamento manifesto dei soggetti. A questo punto, rimane da spiegare un aspetto fondamentale, ovvero per quale motivo le frequenze Theta, e non le altre,
56
siano utili a spiegare questo specifico fenomeno. Per rispondere a tale quesito, è stato
possibile notare come la frequenza Theta risulti avvicinarsi, di più rispetto alle altre frequenze, all’estensione in millisecondi della TBW media dei soggetti esaminati: difatti, è
possibile osservare come tale frequenza di oscillazione sia pari a circa 200 millisecondi
(5 Hz) e come, questo dato, maggiormente correli con la dimensione della TBW media
che è risultata essere pari a circa 200 millisecondi. Quindi, l’oscillazione di tale frequenza sembra riflettere al meglio l’estensione media della TBW. Inoltre, la trasformazione in frequenza della TBW è compresa in un range di frequenze paragonabili a quelle Theta (da 3 a 6,7 Hz). Per questo motivo, le oscillazioni proprie della frequenza Theta
sembrano essere adatte a descrivere l’estensione della finestra di integrazione multisensoriale propria di ogni soggetto. In conclusione, i risultati di questo studio suggeriscono
che la organizzazione spazio temporale dell’attività neurale determina la nostra percezione degli stimoli ambientali.
57
RINGRAZIAMENTI
Ringrazio il Professor Marcello Costantini, Relatore, per la possibilità che mi ha concesso nell’entrare a far parte dei collaboratori di questo lavoro ma, soprattutto, per aver
riposto in me tanta fiducia.
Un ringraziamento speciale va al Dottor Daniele Migliorati senza il quale, con la sua
pazienza, la sua umiltà, il suo supporto costante e la sua guida sapiente, questa tesi non
esisterebbe.
58
BIBLIOGRAFIA
Adini, Y., Sagi, D., e Tsodyks, M., 2002. Context-enabled Learning In The Human Visual System. Nature, 415: 790-793.
Ai, L., & Ro, T., 2013. The Phase Of Prestimulus Alpha Oscillations Affects Tactile
Perception. J Neurophysiol 111: 1300–1307, 2014.
Alais, D., & Cass, J., 2010. Multisensory Perceptual Learning Of Temporal Order: Audiovisual Learning Transfers To Vision But Not Audition. PLoS One, 5: e11283.
Bell H.A., & Munoz P.D., 2008. Activity In The Superior Colliculus Reflects Dynamic
Interactions Between Voluntary And Involuntary Influences On Orienting Behaviour.
European Journal of Neuroscience, vol. 28, pp. 1654-1660.
Botvinick, M., & Cohen, J., 1998. Rubber Hands ‘Feel’ Touch That Eyes See. Nature,
391,756.
Bushara, K.O., Hanakawa, T., Immisch, I., Toma, K., Kansaku, K., e Hallett, M., 2003.
Neural Correlates Of Cross-modal Binding. Natural Neuroscience, 6: 190-195.
Calvert, G.A., Hansen, P.C., Iversen, S.D. e Brammer, M.J, 2001. Detection Of Audiovisual Integration Sites In Humans By Application Of Electrophysiological Criteria To
The BOLD Effect. Neuroimage, 14: 427-438.
Delorme, A., & Makeig, S., 2004. EEGLAB: An Open Source Toolbox For Analysis Of
Single-trial EEG Dynamics. Journal of Neuroscience Methods, 134:9-21.
Ehrsson, H.H., 2007. The Experimental Induction Of Out-of-body Experiences. Sci59
ence, 317, 1048.
Ehrsson, H.H., Spence, C., e Passingham, R.E., 2004. That’s My Hand! Activity In Premotor Cortex Reflects Feeling Of Ownership Of A Limb. Science, 305: 875-877.
Engel, G.R., & Dougherty, W.G., 1971. Visual–auditory Distance Constancy. Nature,
234, 308.
Foss-Feig, J.H., Kwakye, L.D., Cascio, C.J., Burnette, C.P., Kadivar, H., Stone, W.L.,
Wallace, M.T., 2010. An Extended Multisensory Temporal Binding Window In Autism
Spectrum Disorders. Exp Brain Res, 203: 381-389.
Fox, D.M., Snyder, Z.A., Vincent, L.J., Corbetta, M., Van Essen, C.D., e Raichle, E.M.,
2005. The Human Brain Is Intrinsically Organized Into Dynamic, Anticorrelated Functional Networks. Proceedings Of The National Accademy Of Sciences, 9673-9678.
Fox, M.D., Snyder A.Z., Vincent J.L., e
Raichle M.E., 2007. Intrinsic
Fluctuations
Within Cortical Systems Account For Intertrial Variability In Human Behavior. Neuron 56(1):171–184.
Giummarra, M.J., Georgiou-Karistianis, N., Nicholls, M.E.R., Gibson, S.J., e Bradshaw,
J.L., 2010. The Phantom In The Mirror: A Modified Rubber-hand Illusion In Amputees
And Normals. Perception, 39: 103-118.
Goldring, J.E., Dorris, M.C., Corneil, B.D., Ballantyne, P.A., e Munoz, D.P., 1996.
Combined Eye-head Gaze Shifts To Visual And Auditory Targets In Humans. Experimental Brain Research, 111: 68-78.
60
Hesselmann, G., Kell C.A., e Kleinschmidt, A., 2008. Ongoing Activity Fluctuations In
hMT+ Bias The Perception Of Coherent Visual Motion. J Neurosci 28(53):14481–
14485.
Hesselmann, G., Kell C.A., Eger, E., e Kleinschmidt, A., 2008. Spontaneous Local Variations In Ongoing Neural Activity Bias Perceptual Decisions. Proc Natl Acad Sci
USA 105(31):10984–10989.
Hubel, D.H., & Wiesel, T.N., 1963. Receptive Fields Of Cells In Striate Cortex Of Very
Young, Visually Inperienced Kittens. Journal Of Neurophysioly, 26: 994-1002.
Hubel, D.H., Wiesel, T.N., e LeVay, S., 1977. Plasticity Of Ocular Dominance Columns In Monkey Striate Cortex. Philosophical Transactions of the Royal Society B: Biological Sciences, 278: 377-409.
Huber, G.C., & Crosby, E.C., 1993. A Phylogenetic Consideration Of The Optic Tectum. Proceedings Of The National Academy Of Sciences Of The U.S.A., 19: 15-22.
Hweeling, L., & Uta, Noppeney, 2014. Music Expertise Shapes Audiovisual Temporal
Integration Windows For Speech, Sinewave Speech, And Music. Frontiers In Psychology, 5: 868.
Kanayama, N., Kimura, K., e Hiraki, K., 2015. Cortical EEG Components That Reflect
Inverse Effectiveness During Visuotactile Integration Processing. Brain Res, 1598:1830.
61
Keil, J., Muller, N., Ihssen, N., e Weisz, N., 2011. On The Variability Of The McGurk
Effect: Audiovisual Integration Depends On Prestimulus Brain States. Cerebral Cortex,
22: 221-231.
Krauzlis J.R., Liston D., e Carello D.C., 2004. Target Selection And The Superior Colliculus: Goals, Choices And Hypotheses. Vision Research, 44: 1445-1451.
Lakatos, P., Chen, C.M., O’Connell, M.N., Mills, A., e Schroeder, C.E., 2007. Neuronal
Oscillations And Multisensory Interaction In Primary Auditory Cortex. Neuron, 53:
279-292.
Maertens, M., & Pollmann, S., 2005. fMRI Reveals A Common Neural Substrate Of Illusory And Real Contours In V1 After Perceptual Learning. Journal Cognitive Of Neuroscience, 17: 1553-1564.
Maximino, C., 2008. Evolutionary Changes In The Complexity Of The Tectum Of Nontetrapods: A Cladistic Approach. Plos One, 3: e385.
McGurk, H., & MacDonald, J., 1976. Hearing Lips And Seeing Voices. Nature, 264:
746-8.
Meredith A.M., 2002. On The Neural Basis For Multisensory Convergence: A Brief
Overview. Cognitive Brain Research. 14, 31-40.
Monto, S., Palva, S., Voipio, J., e Palva J.M., 2008. Very Slow EEG Fluctuations Predict The Dynamics Of Stimulus Detection And Oscillation Amplitudes In Humans. J
Neurosci 28(33):8268–8272.
Noesselt, T., Rieger, J.A., Schoenfeld, M.A., Kanowski, M., Hinrichs, H., Heinze, H.J.,
e Driver, J., 2007. Audio-visual Temporal Correspondence Modulates Multisensory Su62
perior Temporal Sulcus Plus Primary Sensory Cortices. Journal Of Neuroscience,
27(42): 11431-11441.
Powers, R.A., Hevey, A.M., e Wallace, T.M., 2012. Neural Correlates Of Multisensory
Perceptual Learning. Journal Of Neuroscience, 32(18): 6263-6274.
Powers, R.A., Hillock, R.A., e Wallace, T.M., 2009. Perceptual Training Narrows The
Temporal Window Of Multisensory Binding. Journal Of Neuroscience, 9(39):1226512274.
Press, C., Heyes, C., Haggard, P., e Eimer, M., 2008. Visuotactile Learning And Body
Representation: An ERP Study With Rubber Hands And Rubber Objects. J. Cognitive
Neuroscience, 20: 312-323.
Sadaghiani, S., Hesselmann, G., e Kleinschmidt, A., 2009. Distributed And Antagonistic Contributions Of Ongoing Activity Fluctuations To Auditory Stimulus Detection. J
Neurosci 29(42):13410–13417.
Stein, B.E., Spencer, R.F., e Edwards, S.B., 1983. Corticotectal And Corticothalamic
Efferent Projections Of SIV Somatosensory Cortex In Cat. Journal Of Neurophisiology,
50: 896-909.
Stein, E.B., & Meredith, M., 1993. The Merging Of The Senses. Cambridge, Mass.,
MIT Press.
Stein, E.B., & Stanford, R.T., 2008. Multisensory Integration: Current Issues From The
Perspective Of The Single Neuron. Nature Reviews Neuroscience, vol. 9, pp. 255-266 .
63
Stevenson, A.R., Wilson, M.M., Powers, A.R., e Wallace, T.M., 2013. The Effects Of
Visual Training On Multisensory Temporal Processing. Exp Brain Res. 225(4), 479489.
Szelag, E., Kowalska, J., Galkowski, T., Poppel, E., 2004. Temporal Processing Deficits
In High-functioning Children With Autism. British Journal Of Psychology, 95: 269282.
Tsakiris, M., 2010. My Body In The Brain: A Neurocognitive Model Of Bodyownership. Neuropsychologia, 48: 703-712.
Tsakiris, M., Hesse, M.D., Boy, C., Haggard, P., e Fink, G.R., 2007. Neural Signatures
Of Body Ownership: A Sensory Network For Bodily Self-consciousness. Cereb. Cortex,
17: 2235-2244.
Tseng, H.H., Bossong, M.G., Modinos, G., Chen, K.M., McGuire, P., e Allen, P., 2015.
A
Systematic
Review
Of Multisensory Cognitive-affective
Integration
In Schizophrenia. Neuroscience & Biobehavioural Reviews.
Yang, X.F., Bossmann, J., Schiffhauer, B., Jordan, M., e Immordino-Yang, M.H., 2013.
Intrinsic Default Mode Network Connectivity Predicts Spontaneous Verbal Descriptions Of Autobiographical Memories During Social Processing. Frontiers In Psychology, 3: 592.
Zampini, M., Guest, S., Shore, D.I., e Spence, C., 2005. Audio-visual Simultaneity
Judgments. Perception & Psychophysics, 67 (3), 531-544.
64