UniversitàdegliStudiG.d’Annunzio Chieti–Pescara FacoltàdiPsicologia CorsodiLaureainPsicologiaCognitiva CorrelatiNeuraliDell’Integrazione Multisensoriale:UnoStudioEEG Candidato:Relatore: BrunellaDonnoProf.MarcelloCostantini Matricolan°:3152113Correlatore: Prof.ssa Giorgia Committeri Anno accademico 2014/2015 “Oderc ni em oderc ni em len oim eroma rep etra, rep etra is eroum” (Carmen Consoli) 2 Alla mia famiglia senza la quale non avrei continuato a credere in me stessa 3 Introduzione _________________________________________________________ 3 Capitolo I L’integrazione multisensoriale _________________________________ 5 1. Il ruolo del collicolo superiore nel fenomeno di integrazione _______________ 6 2. Le aree corticali implicate nel fenomeno di integrazione _________________ 10 3. I principi alla base del fenomeno di integrazione multisensoriale ___________ 13 3.1. La regola spaziale ____________________________________________ 13 3.2. La regola temporale __________________________________________ 15 3.3. La regola dell’efficacia inversa _________________________________ 17 4. Fenomeni di integrazione: evidenze sperimentali _______________________ 21 4.1. La rubber hand illusion (RHI) __________________________________ 22 4.2. SJ e TOJ: paradigmi sperimentali per lo studio del fenomeno di integrazione _____________________________________________ 24 Capitolo II La temporal binding window (TBW) _________________________ 27 1. SJ in fRMI _____________________________________________________ 28 2. Integrazione multisensoriale e malleabilità della TBW ___________________ 29 2.1. La temporal binding window (TBW) come indice predittivo __________ 33 3. Integrazione multisensoriale e resting-state ____________________________ 35 Capitolo III Parte sperimentale ________________________________________ 39 1. Obiettivi della ricerca _____________________________________________ 39 2. Materiali e metodi _______________________________________________ 41 2.1. Partecipanti _________________________________________________ 41 1 2.2. Procedura sperimentale________________________________________ 41 2.3. SJ visuo-tattile - valutazione____________________________________ 45 2.4. SJ visuo-tattile - training_______________________________________ 45 3. Analisi dei dati __________________________________________________ 46 3.1. Dati comportamentali _________________________________________ 46 3.2. Elettroencefalogramma ________________________________________ 50 4. Discussione dei risultati ___________________________________________ 53 RINGRAZIAMENTI _________________________________________________ 58 BIBLIOGRAFIA ____________________________________________________ 59 2 Introduzione Viviamo in un mondo nel quale ci viene imposto dall'ambiente stesso il modo in cui è "preferibile" percepire la molteplicità di stimoli esistenti. Il fenomeno di integrazione multisensoriale è un mezzo di cui ci avvaliamo per poter esperire velocemente e coerentemente questi stimoli; tale processo consiste nella capacità di combinare, quotidianamente, diverse fonti di informazione (una molteplicità di stimoli appartenenti a diversi registri sensoriali) per evocare, come risposta finale, un percetto unitario che sintetizzi significativamente i diversi stimoli percepiti. È interessante indagare, a nostro parere, quali possano essere i correlati neurali di base di tale fenomeno, ma, soprattutto, esplorare i pattern neurali ad esso sottostanti. Nello specifico, nel nostro studio ci siamo interessati a ricercare, tramite registrazione EEG (elettroencefalografia) e mediante l'analisi del resting-state, il substrato elettrofisiologico responsabile del suddetto fenomeno quando l'attività cerebrale è momentaneamente in stato di "riposo". Per lungo tempo, si è ritenuto che l’attività spontanea del cervello a riposo non fosse altro che rumore. Con “attività neurale spontanea” ci si riferisce ad un tipo di attività non attribuibile ad uno specifico input ambientale, ma ad un'attività che viene intrinsecamente generata dal cervello. Solo negli ultimi anni, i ricercatori si sono interessati ad indagare tale componente considerata fino a poco tempo fa “di disturbo” e si è potuto constatare, in realtà, che si tratta di un'attività "organizzata" in maniera specifica (Fox et al., 2005). Si può parlare, perciò, di connettività funzionale tra regioni distinte del cervello che si trovano ad essere connesse quando quest'ultimo è in uno stato vigile e cosciente, anche se rilassato e in assenza di stimoli a cui dover rispondere. Questi pattern 3 di connettività sono stati definiti come veri e propri network (reti), che si vengono a creare nel momento in cui l'attività cerebrale è in "standby"; tali reti sono comunemente indicate con il termine resting-state networks (RSNs). Il Default Mode Network (DMN) rappresenta, in quest'ottica, il network “a riposo” più consistente; esso viene letteralmente considerato come una modalità di rete predefinita, ovvero una coorte di regioni cerebrali congiuntamente attive durante lo stato di riposo (resting-state) e che si disattivano nello stesso istante, quando il cervello è chiamato ad eseguire dei compiti. Questa rete neurale, distribuita in diverse regioni corticali e sottocorticali, coinvolge diverse aree: corteccia prefrontale mediale, corteccia cingolata posteriore e corteccia parietale inferiore destra e sinistra che svolgerebbero, cioè, un’"attività di fondo" destinata ad un lavoro mentale principalmente introspettivo e di progettazione di azioni future (Yang et al., 2013). Siamo dell’idea, pertanto, che tale attività di fondo – registrata tramite EEG (elettroencefalografia) – possa rappresentare un indice esplicativo dell’attività cerebrale dei soggetti da noi esaminati e che questa attività “a riposo” funga da correlato neurale importante in grado di farci comprendere le dinamiche alla base del processo di integrazione multisensoriale. 4 Capitolo I L’integrazione multisensoriale È sorprendente come la maggior parte delle capacità di cui l’essere umano è dotato – nello specifico, la codifica e l’interpretazione delle informazioni biologicamente significative provenienti dall’ambiente esterno – rappresentino funzioni importanti del cervello; tali meccanismi, pertanto, necessitano della presenza di circuiti neurali di base, di veri e propri pattern neurali, affinché essi possano comunicare interattivamente. Tali funzioni, durante il corso evolutivo, hanno determinato in modo pregnante lo sviluppo di una serie di organi di senso specializzati, ciascuno dei quali collegato a più regioni cerebrali altrettanto specializzate. L’estrema raffinatezza di cui i nostri organi di senso sono dotati è di utilità ottimale in relazione a ciò che esperiamo ogni giorno, poiché essi aumentano notevolmente la probabilità di individuare e identificare eventi d’interesse. La nostra capacità, determinata dalla sinergia tra gli organi di senso nel combinare diverse fonti di informazione, non rappresenta una strategia evolutiva nuova: basti pensare al nostro primo progenitore unicellulare dotato di più “sensi”, di recettori in grado di catturare e convertire i diversi stimoli ambientali per dare luogo ad una percezione unitaria(Stein & Stanford, 2008). Ed è proprio questa sinergia, questa interazione tra i sensi e la fusione del loro contenuto informativo, che è descritta pienamente dal concetto definito come “integrazione multisensoriale”: la capacità di combinare efficacemente stimoli cross-modali (una molteplicità di stimoli appartenenti a diversi registri sensoriali) per evocare, come risposta finale, un percetto unitario che sintetizzi significativamente i diversi stimoli percepiti. Del resto, quando ci si sofferma sul concetto di sintesi, si deve necessariamente fare riferimento ai principi di organizzazione percettiva già indi5 viduati dalla Gestalt, secondo cui il nostro sistema cognitivo propende sempre verso un principio d’economia nella percezione degli stimoli: in sostanza, la nostra attività cognitiva tende quanto più possibile a risparmiare energia in favore della sintesi percettiva; per cui, per esempio ciò che ascoltiamo non è mai un rumore puro (sensazione) ma una moto che romba o la porta che cigola (le cose "stesse" che ci circondano). La percezione, peraltro, rappresenta un processo primario e immediato non preceduto da sensazioni: disponiamo di un’organizzazione interna che determina che cosa e come percepire gli stimoli; di conseguenza, secondo i principi della Gestalt, gli oggetti apparirebbero come totalità strutturate e, dunque, come unità coerenti. Quindi, mentre i sistemi sensoriali individuali trasducono forme distinte di energia dello stimolo proveniente dall’ambiente esterno (convertendo l’energia degli stimoli in segnale elettrico), le informazioni che noi estraiamo sono spesso legate in un unico percetto relativo alla manifestazione esterna, noto anche come "ipotesi dell’unità": tale ipotesi assume che due input sensoriali provengono da un singolo evento, invece che da due eventi separati (Stevenson et. al, 2013). 1. Il ruolo del collicolo superiore nel fenomeno di integrazione Affinché possa aver luogo la sintesi “gestaltica” delle informazioni provenienti da diverse modalità sensoriali in favore dell’economia del nostro sistema cognitivo, due risultano essere le condizioni che necessariamente devono essere soddisfatte: in primo luogo, la convergenza di informazioni relative a specifiche modalità sensoriali nella stessa regione cerebrale (fenomeno di fusione sensoriale) e, in secondo luogo, la possibilità che si stabiliscano interazioni funzionali fra input riguardanti modalità sensoriali differenti. 6 Per definire il concetto di integrazione multisensoriale ci si rifà principalmente ai pattern funzionali eccitatori che si stabiliscono in seguito alla convergenza multimodale di input di modalità sensoriali differenti su un unico neurone multisensoriale (Meredith, 2002): caratteristica dei neuroni multisensoriali del collicolo superiore (CS). Questa struttura mesencefalica, nello specifico, è dotata di un’organizzazione laminare o a strati: gli strati superficiali sono deputati a rappresentare la sola informazione visiva, mentre quelli profondi o subtettali rappresentano le informazioni multimodali visive, uditive e tattili. Il CS evoca, perciò, una risposta dei neuroni multisensoriali significativamente maggiore rispetto alla più vigorosa risposta unimodale (“multisensory enhancement”) (Stein & Meredith, 1993; Meredith, 2002). La funzione adattiva, come già ampiamente confermato, di tale pattern di convergenza neurale è quella di aumentare la salienza degli eventi sensoriali al fine di facilitare comportamenti funzionali rispetto all’ambiente, come, per esempio, l’abilità di orientamento, le risposte di fuga, di evitamento e di localizzazione nello spazio di stimoli salienti. A livello fisiologico, i meccanismi che regolano la funzione di integrazione multisensoriale in compiti spaziali sono stati largamente indagati nelle aree corticali del gatto e nel collicolo superiore del mesencefalo. Il CS, filogeneticamente e ontogeneticamente antico, è considerato una stazione di riferimento per la comprensione del funzionamento dei neuroni multisensoriali e delle loro interazioni con le aree corticali, poiché comune a tutti i mammiferi, dai vertebrati inferiori a quelli più sviluppati (Stein & Meredith, 1993). Il CS presenta, difatti, un’alta incidenza di neuroni multisensoriali (visivi, acustici e tattili), localizzati soprattutto negli strati profondi di cui questa struttura mesencefalica è composta; gli strati superficiali, invece, contengono neuroni di relais (di 7 comando) deputati esclusivamente all’analisi di stimoli visivi. Un aspetto – che, perciò, risulta focale – riguarda i meccanismi con cui vengono messe in atto risposte automatiche orientate verso segnali sensoriali che potrebbero presentarsi nello spazio; orientamento, appunto, esogeno, poiché si manifesta con uno spostamento dell’attenzione provocato da input esterni all’organismo, che non decide volontariamente, quindi, di indirizzare la propria attenzione verso stimoli da esso ritenuti salienti. I processi di localizzazione spaziale e di orientamento motorio verso un target sono svolti dal CS e le strutture tettali (tetto ottico del mesencefalo) fungono da interfaccia tra la localizzazione degli stimoli presenti nello spazio (input sensoriale) e le risposte di orientamento sotto forma di output motorio (Huber & Crosby, 1993; Maximino, 2008). In questa via cosiddetta “diretta”, l’informazione relativa all’input visivo in entrata raggiunge il tetto ottico che rappresenta la prima stazione per l’analisi dell’informazione. Qui, essa rimane principalmente a livello del mesencefalo, dove avviene una prima elaborazione inconsapevole, che comporta, appunto, lo spostamento automatico dell’attenzione; l’analisi dell’informazione, perciò, non confluisce nella corteccia visiva primaria (V1). Lo studio delle proprietà specifiche dei neuroni multisensoriali nei gatti, ancora, ha permesso di comprendere che essi ricevono input sensoriali diretti (via diretta) dai recettori visivi, uditivi e somatici (neuroni degli strati profondi del CS) e indiretti dai collicoli inferiori e che essi, attraverso collegamenti con le aree motorie e premotorie, danno luogo all’output motorio; ciò fa sì che, come risposta finale, avvengano movimenti oculari, del capo, del corpo e delle orecchie verso una posizione nello spazio. La stimolazione di un neurone del collicolo evoca, quindi, una comparabile risposta di 8 orientamento verso un punto dello spazio che è precisamente mappato in queste strutture nervose; tale organizzazione neurale presiede, perciò, alla coordinazione sensomotoria rapida. Si parla, quindi, di una struttura sottocorticale mesencefalica coinvolta nell’orientamento, nel controllo dei movimenti oculari e della testa, nell’attenzione e nei processi di individuazione del target (Krauzlis et al., 2004; Stein & Meredith, 1993). Il CS rappresenta, quindi, un’importante stazione di analisi visiva dei dati provenienti dall’ambiente e, per tale ragione, è dotato di una disposizione topografica dei neuroni in esso contenuti; la mappa retinotopica, infatti, è disposta in modo da essere congruente alla mappa somatosensoriale e uditiva presente negli strati più profondi. Qui sono presenti neuroni multimodali che comunicano, nel contempo, con i neuroni della mappa visiva, somatosensoriale e uditiva: i neuroni della parte rostrale del CS rappresentano lo spazio visivo ed uditivo più centrale e più anteriore, mentre i neuroni della parte caudale rappresentano regioni progressivamente più periferiche e più posteriori dello spazio visivo e uditivo (Stein & Meredith, 1993). Un’analoga mappatura è presente per i “campi di movimento” controllati dal CS. Un campo di movimento è l’equivalente motorio di un campo recettivo: esso, cioè, consiste in un vettore di movimento orientato e direzionato verso una particolare posizione dello spazio. Quindi, una delle proprietà peculiari del CS è rappresentata dalla stretta corrispondenza spaziale tra l’aspetto sensoriale, costituito dall’integrazione di diverse modalità, e l’aspetto motorio: tale corrispondenza è necessaria affinché un segnale sensoriale localizzato in una certa posizione nello spazio (che coinvolge, di conseguenza, i campi recettivi di quella posizione per le diverse modalità), possa evocare un’immediata reazione motoria rivolta precisamente verso quella posizione spaziale (coinvolgendo il corrispondente campo motorio); tale corrispondenza fa sì che vengano messe in atto ri9 sposte motorie rapide a stimoli imprevisti e ciò conferma il ruolo di grande importanza relativo a tale adattamento che sta alla base dei comportamenti di attacco e fuga. Il risultato di questa interazione così potente, che ha luogo tramite i suddetti meccanismi, è l'integrazione di diversi segnali sensoriali, fenomeno che trova riscontro nella percezione complessa dello spazio esplorato dai sensi. 2. Le aree corticali implicate nel fenomeno di integrazione All’attività dei neuroni multimodali del CS contribuiscono, inoltre, oltre che le afferenze dirette dai sistemi sensoriali e dai collicoli inferiori, anche afferenze dalla corteccia (corticotettali). Una regione corticale molto importante che proietta al CS nel gatto è l’AES (solco ectosilviano anteriore), un’area associativa parietale suddivisa in una serie di regioni che elaborano informazioni unimodali. L’attività elettrofisiologica dei neuroni multimodali dei collicoli può venir ampiamente depressa dall’interruzione dei collegamenti con quest’area. La registrazione dell’attività di neuroni multimodali dei collicoli ha, infatti, messo in luce come le risposte a presentazioni multimodali risultino selettivamente depresse dall’inattivazione farmacologica di AES (Stein et al., 1983). Oltre alla corteccia cerebrale del gatto, studi di neuroimaging funzionale hanno identificato molte regioni corticali "multisensoriali" sia negli esseri umani, sia nei primati non umani (Fig. 1). Non sembra esserci alcun dubbio, perciò, sul fatto che molte di queste regioni contengano neuroni che sarebbero in grado di integrare stimoli crossmodali (Stein & Stanford, 2008). 10 Fig. 1 Regioni corticali multisensoriali nell’uomo. Nell’immagine è possibile visualizzare le regioni multisensoriali del cervello umano. Qui, è stato misurato il livello di ossigeno nel sangue (Blood Oxygen Level Dependent o BOLD) in alcune aree la cui attività è relativa all’elaborazione di stimoli visivi, uditivi e tattili. Il rosso denota regioni cerebrali trisensoriali in cui le attivazioni tattili, visive e acustiche sono sovrapposte. In alcuni studi, per l'appunto, è stata presa in esame la corteccia parietale posteriore (PPC), dove è stato possibile constatare come convergano le informazioni sensoriali provenienti da molte modalità differenti (visive, vestibolari, tattili e uditive); il blu indica le regioni (nello specifico, la STS), in cui le attivazioni uditi11 ve e visive sono sovrapposte (audiovisive) e, infine, il verde indica le regioni in cui le attivazioni visive e tattili (visuotattili) si sovrappongono (Stein & Stanford, 2008). La maggior parte dei risultati ottenuti sul fenomeno di integrazione multisensoriale nella corteccia umana, però, provengono da alcuni studi di neuroimaging dai quali si è potuto evincere come le interazioni multisensoriali nella corteccia uditiva favoriscano l'integrazione relativa a quelle coppie di stimoli contenenti i volti dei conspecifici messi in relazione, però, al discorso sonoro emesso. Nello specifico, in questi studi, il livello del segnale BOLD aumentava in riferimento a coppie congruenti nel discorso sonoro e nel movimento delle labbra; ed è andato decrescendo, di contro, in relazione a coppie incongruenti suggerendo, ancora una volta, che le interazioni in STS alla base degli effetti di integrazione multisensoriale, relative alla valorizzazione (coppie di stimoli congruenti) o alla depressione (coppie di stimoli incongruenti) nella percezione del linguaggio parlato, siano anch'esse ben documentati. Si è sostenuto, quindi, che la risposta BOLD per stimoli cross-modali debba superare la somma delle risposte per le componenti specifiche per modalità, affinché l'integrazione multisensoriale possa essere definitivamente stabilita (Calvert et al., 2001). In definitiva, si è potuto constatare sperimentalmente come la STS integri informazioni su una varietà di stimoli cross-modali (Stein & Stanford, 2008). 12 3. I principi alla base del fenomeno di integrazione multisensoriale Assodato che il fenomeno di integrazione produca, come effetto finale, benefici relativi a differenti aspetti del comportamento (Stein & Stanford, 2008) – migliorando, nello specifico, la capacità di rilevare stimoli bimodali e facilitando la creazione di esperienze percettive unitarie – non si può evitare di fare riferimento alle regole che intervengono affinché questi effetti possano aver luogo. Inoltre, è ormai ben noto che la latenza delle risposte automatiche orientate ad uno stimolo, composto simultaneamente da più di una modalità sensoriale, sia più breve della latenza ad uno stimolo che si presenta in una sola modalità (Goldring et al., 1996). Questi prerequisiti portano, inevitabilmente, a specificare le tre proprietà fondamentali che caratterizzano i neuroni multimodali del CS: • la regola spaziale, • la regola temporale, • la regola dell’efficacia inversa 3.1. La regola spaziale E’ stato possibile constatare che quanto più è presente una stretta corrispondenza tra le posizioni nello spazio dei singoli input sensoriali, tanto più lo stimolo multimodale darà luogo alla valorizzazione della risposta (enhancement). Il principio spaziale diviene, perciò, di particolare importanza per il ruolo svolto dai neuroni del CS nell'orientamento spaziale. Ogni neurone multisensoriale, infatti, è costituito da più campi recettivi eccitatori, uno per ogni modalità a cui è deputato a rispondere. Questi campi (per esempio, due campi recettivi visivo-uditivo di un neurone che si sovrappongono) sono strettamente connessi tra loro nel registro spaziale, in modo tale che queste due modalità di13 verse possano essere definite come provenienti dalla stessa posizione di origine fintanto che rientrino all'interno dello spazio che viene registrato dai loro campi recettivi che si sovrappongono. Se, di contro, gli stimoli provengono da posizioni spazialmente disparate, tale che uno stimolo cade all'interno e l'altro all'esterno del campo recettivo del neurone, la valorizzazione della risposta non avrà luogo, oppure si potrà verificare la depressione della risposta. Quest’ultima si verifica, difatti, quando il secondo stimolo viene a trovarsi all'interno di una regione inibitoria che confina con i campi recettivi eccitatori di alcuni neuroni del CS e può essere abbastanza potente da sopprimere l'eccitazione evocata dagli altri stimoli (Stein & Stanford, 2008). La validità di tale regola è stata confermata, a tal proposito, da uno studio del 2014 di Kanayama e collaboratori nel quale i partecipanti sono stati istruiti a tenere un piccolo cubo nella mano sinistra: le 3 condizioni prevedevano la somministrazione di stimoli visuo-tattili congruenti (il LED e la vibrazione erano presentati nella stessa porzione del cubo), incongruenti (il LED e la vibrazione venivano presentati nella porzione opposta) e di stimoli tattili presentati in modalità unisensoriale (Fig. 2). Fig. 2 Setting sperimentale: somministrazione di stimoli visuo-tattili 14 Nello specifico, gli autori hanno dato conferma di come l'integrazione potesse avvenire in modo efficace solo nella condizione in cui ai partecipanti era somministrato il LED e la vibrazione nella medesima porzione di spazio all'interno del cubo; in questo modo, è stato possibile registrare una significativa diminuzione nei tempi di risposta nella condizione di congruenza degli stimoli rispetto a quando gli stimoli erano somministrati separatamente in due punti distinti all'interno dello stesso (condizione di incongruenza degli stimoli) (Fig. 3). Fig. 3 L’integrazione ha luogo nella condizione di congruenza spaziale degli stimoli 3.2. La regola temporale Analogamente, esiste una sincronizzazione ottimale (regola temporale) relativa alla comparsa delle componenti unimodali per poter ottenere, come risultato, questa valorizzazione e non sempre tale sincronizzazione corrisponde alla presentazione contemporanea dei singoli stimoli (Meredith & Stein, 1983). In questo caso, affinché la regola temporale possa essere pienamente soddisfatta e possa manifestarsi a tutti gli effetti il fenomeno di integrazione, l’intervallo temporale tra i due stimoli, appartenenti a registri 15 sensoriali diversi, deve essere necessariamente breve, dell’ordine di pochi millisecondi tra l’inizio della comparsa del primo stimolo e l’inizio della comparsa del secondo (Stimulus Onset Asynchrony o SOA). L'effetto McGurk, nello specifico, dimostra la forte dominanza del canale visivo sulla percezione uditiva; questo fenomeno venne scoperto nel 1976 da Harry McGurk e dal suo collaboratore John MacDonald e pubblicato in un articolo dal titolo “Hearing lips and seeing voices” (“Sentire labbra e vedere voci”). L'effetto McGurk è un fenomeno percettivo che dimostra l’esistenza di una forte interazione di base tra l'udito e la vista nel riconoscimento di una parola o di un singolo fonema; questo tipo di effetto, sperimentato dai due autori, rappresenta la prova evidente di come il riconoscimento linguistico sia un processo multimodale che coinvolge informazioni da più di una sorgente sensoriale. Gli autori, a tal proposito, sperimentarono il fenomeno montando un video in cui era presente una donna che, muovendo le labbra, produceva un determinato fonema, il quale venne doppiato, però, con il suono registrato di un altro fonema sovrapposto. Ciò che gli autori osservarono fu come spesso il fonema percepito fosse una via di mezzo tra i due; per esempio, il video che mostra /ga/ combinato con l'audio di /ba/ è spesso percepito come /da/. Il percetto risultante sarà il fonema ‘da-da’ o ‘ta-ta’ nonostante il labiale della donna nel video riproduca il fonema ‘ga-ga’, ma il suono realmente prodotto sia ‘ba-ba’. Si tratta di una situazione di conflitto tra la vista e l’udito, dal momento che, non osservando le labbra chiudersi all’inizio della sillaba, il cervello ritiene – tramite un’inferenza cognitiva – di non poter udire il suono ‘ba’. Esso risolve, perciò, quest’ambiguità tramite un compromesso, ritenendo di percepire una via di mezzo tra i due suoni, ovvero ‘da’ o ‘ta’. Per poter percepire correttamente il fonema è necessario, quindi, riascoltarlo chiudendo gli occhi: in questo caso, si sarà in grado di udire il suono reale, ovvero ‘ba-ba’, poiché non sarà concesso al 16 canale visivo di interferire con quello uditivo; ciò fa supporre che l'effetto McGurk potrebbe avere una grande influenza nelle percezioni della vita quotidiana. Recentemente, l’effetto McGurk è stato studiato da Keil e collaboratori (2011) che, avvalendosi della MEG (magnetoencefalografia), hanno dimostrato come tale percezione illusoria sia preceduta da un incremento dell'attività prestimolo del ritmo beta e che questa attività sia distribuita principalmente nel giro temporale superiore sinistro (ISTG), un'area considerata di rilevante importanza nel fenomeno di integrazione; la potenza del ritmo beta in quest'area riflette, perciò, la predisposizione ad integrare informazioni multimodali. Quest'effetto si manifesta, inoltre, nel momento in cui l'inizio della presentazione dello stimolo acustico non coincide con l'inizio della comparsa di quello visivo; gli stimoli unisensoriali presentati, perciò, sono percepiti come incompleti poichè non perfettamente sovrapposti. Per risolvere almeno in parte il problema della mancata corrispondenza, gli autori hanno dimostrato, appunto, come la ISTG si occupi della fusione degli stimoli per poter produrre una percezione coerente che crea, però, l'illusione. In conclusione è possibile affermare come il sistema multisensoriale sia organizzato in modo tale che le risposte di eccitazione e depressione dei neuroni siano elicitate solo in virtù delle relazioni spaziali e temporali tra gli stimoli e non della loro modalità di appartenenza. 3.3. La regola dell’efficacia inversa Esperimenti elettrofisiologici hanno, inoltre, dimostrato che la stimolazione di un solo canale sensoriale produce una minore attività di scarica (response depression) rispetto alla stimolazione simultanea di più canali sensoriali (response enhancement) (Meredith 17 & Stein, 1983). Tale proprietà, definita “regola dell’efficacia inversa”, è regolata soprattutto dagli aspetti spaziali (regola spaziale) e temporali (regola temporale) relativi alla presentazione multimodale di stimoli. E’ stato dimostrato come la maggior parte delle integrazioni multisensoriali avvenga mediante sommazione lineare degli input specifici per modalità, ma è interessante notare come anche due stimoli modalità-specifici deboli abbiano una maggiore probabilità di produrre una risposta neuronale superadditiva; e come, invece, due stimoli altamente salienti ed efficaci abbiano una maggiore probabilità di determinare una risposta subadditiva (Meredith & Stein, 1983). A tal proposito, uno studio del 2014 di Kanayama e collaboratori ha dato prova di come la risposta prodotta fosse superadditiva nella condizione di congruenza spaziale degli stimoli presentati quando, però, lo stimolo tattile somministrato era di debole intensità rispetto a tutte le altre condizioni (Fig. 4). Fig. 4 Risposta superadditiva nella condizione di congruenza spaziale degli stimoli e di debole intensità dello stimolo tattile La conseguenza diretta di ciò fa sì che l’integrazione multisensoriale risulti essere più vantaggiosa per l’individuazione di fonti multisensoriali composte da stimoli modalitàspecifici deboli (Fig. 5). 18 Fig. 5 Le risposte multisensoriali di rilevamento favoriscono l'integrazione e la velocità nell’elaborazione di una risposta. Nella figura 5) sono raffigurati una donna e un gatto intenti a rilevare l'avvicinarsi di un cane tramite la vista e l’udito. Nell’immagine 1 in alto a destra, è possibile constatare come, quando questi segnali sono deboli (ovvero, quando il cane è lontano), la computazione neurale coinvolta nell’integrazione degli stimoli visivo e acustico sia superadditiva, tale che la risposta valorizzata non solo supera la risposta agli input sensoriali unimodali, ma supera addirittura la loro somma. Nel momento in cui il cane si avvicina (immagine 2 al centro), i segnali diventano sempre più efficaci, le risposte delle componenti unisensoriali diventano più vigorose e le risposte integrate proporzionalmente più piccole. Qui l’integrazione diventa additiva (al centro) – la risposta multisensoriale, cioè, non è diversa dalla somma aritmetica delle risposte agli stimoli unimodali che la compongono– per poi divenire subadditiva (immagine 3 in basso a destra). Sebbene anche l’integrazione additiva e quella subadditiva – per cui la risposta multisensoriale è inferiore alla somma aritmetica delle risposte agli stimoli unimodali che la compongono 19 – producano responces enhancement che superano la risposta all’input unimodale più vigoroso (cioè, in entrambi è possibile osservare il fenomeno di integrazione), la loro valorizzazione è, comunque, proporzionalmente inferiore rispetto a quella superadditiva. I campi recettivi visivi e uditivi dei neuroni del CS e le posizioni degli stimoli legati da una stretta corrispondenza topografica, quindi, sono rappresentati all'interno dello spazio visivo e uditivo dei neuroni. Allo stesso modo, nella Fig. 6, il pannello a) evidenzia come gli stimoli visivi e uditivi debolmente efficaci siano integrati in maniera vigorosa per dar luogo alla produzione della risposta multisensoriale valorizzata. In questo caso, la risposta (superadditiva) – data dalla combinazione dei due input deboli – supera la somma delle risposte dei singoli stimoli. Nel pannello b), l'associazione dello stimolo visivo con un altro stimolo visivo produce, invece, un'interazione subadditiva, che non riesce a soddisfare il criterio di valorizzazione. Questi rappresentano, perciò, degli esempi delle differenze esistenti tra le computazioni neurali che sono alla base del fenomeno di integrazione multisensoriale e unisensoriale (Stein & Stanford, 2008). 20 Fig. 6Integrazionemultisensorialeeunisensorialeinunneuronemultisensoriale del collicolo superiore. 4. Fenomeni di integrazione: evidenze sperimentali È comune, perciò, pensare erroneamente che i nostri sensi (vista, tatto, udito, etc..) siano fondamentalmente separati e che operino in maniera indipendente l’uno dall’altro. Ciò è corretto solo in parte, poiché i nostri organi sensoriali (occhi, orecchie, etc.) lavorano inizialmente in autonomia; ciò che viene captato, solo in un secondo momento, viene convogliato direttamente nelle aree cerebrali specializzate nell’analisi degli stimoli in arrivo. Infatti, le informazioni convogliate dai nostri organi sensoriali, una volta giunte 21 al cervello, vengono integrate tra loro per dare vita a una percezione unitaria dell’esperienza vissuta. L'esempio di illusione più noto è l'effetto “ventriloquismo”, per cui si ha la convinzione che il suono, proveniente dalle labbra di chi parla (ventriloquo), venga emesso direttamente dalla bocca che si muove del pupazzo; in questo modo, quindi, il suono viene trasposto. Tale situazione è anche ciò che si sperimenta durante la visione di un film, per cui la voce di ogni personaggio è posizionata correttamente sullo schermo, indipendentemente dal movimento del personaggio, anche se tutti i suoni, in realtà, provengono dalla posizione statica delle casse audio. 4.1. La rubber hand illusion (RHI) Largamente documentati in letteratura sono, inoltre, gli effetti che le illusioni hanno relativamente alla percezione del nostro corpo; si tratta di un’area di ricerca che, negli ultimi anni, ha prodotto un numero sempre maggiore di studi, accrescendo le conoscenze sul modo in cui si è in grado di percepire il nostro corpo. A tal proposito, un fenomeno scoperto nel 1999 da Botvinick e Cohen è quello relativo all’illusione di possedere una mano di gomma (rubber hand illusion); l’effetto ha luogo nella condizione in cui la mano destra del soggetto è nascosta alla sua vista, mentre davanti a lui è posizionata una finta mano di gomma. Sia la vera mano (non vista dal soggetto sperimentale), che la mano di gomma (da lui percepita) vengono toccate contemporaneamente dallo sperimentatore per un breve periodo di tempo. L’effetto di questa stimolazione è che il soggetto percepirà velocemente l’illusione (in media, dopo circa 11 secondi) che la mano di gomma sia parte integrante del proprio corpo (Fig. 7). In questo caso, il nostro cervello integra le informazioni tattili e visive per costruire un’esperienza unitaria che crea, con22 cretamente, l’illusione di “avere” una mano di gomma a tutti gli effetti. Fig. 7 L’esperimento della mano di gomma (RHI) relativo all’effetto illusorio di possedere realmente una mano di gomma A tal proposito, è stato possibile notare come un’aggressione alla mano di gomma (per esempio, la torsione del dito) provochi una reazione spontanea di ritrazione della vera mano del soggetto, con la sensazione che questa sia stata effettivamente aggredita. Se, da un lato, questi stimoli provocano un aumento della forza dell’illusione nell’integrare la mano di gomma (Giummara et al., 2010), d’altro canto, essi possono anche minacciare la mano artificiale e ciò può far sì che vengano prodotte risposte protettive da parte del soggetto stesso; infatti, lo spostamento di un coltello o di un ago verso la mano artificiale spesso induce il ritiro effettivo della mano, che, a sua volta, rompe l'illusione. La minaccia per la mano – ritenuta parte integrante di sé – è sufficiente a causare, di conseguenza, l'attivazione di regioni cerebrali coerenti con la conservazione del corpo (Ehrsson et al., 2007). La forza dell’illusione della mano di gomma (RHI) dipende, quindi, sia dalla congruenza temporale di stimoli crossmodali tra ciò che una persona sente at23 traverso le vie somatosensoriali e ciò che vede, ma anche dal fatto che la mano di gomma sia posta in una posizione anatomicamente plausibile (Tsakiris, 2010). Press et al. (2008) hanno suggerito, inoltre, che i livelli iniziali di elaborazione delle informazioni sensoriali (ad esempio, la corteccia somatosensoriale secondaria, SII) siano modulati dalla presentazione sincrona (regola temporale) di stimoli visivi e tattili; inoltre, che i livelli successivi di elaborazione siano influenzati dalla compatibilità spaziale (regola spaziale) tra la posizione degli stimoli nello spazio esterno e dall’effettiva posizione del corpo nello spazio e, infine, che le successive variazioni dell'attività neuronale sembrano essere correlate alla somiglianza fisica tra l'oggetto posto in quella parte dello spazio (nello specifico, la mano di gomma) e il corpo del partecipante. Questo fenomeno dimostra come l’integrazione multisensoriale sia utilizzata anche per costruire il senso che possediamo del nostro corpo; ciò diviene possibile grazie alla corteccia parietale e premotoria, i cui ruoli risultano importanti per indurre l’illusione (Ehrsson et al. 2004), ma anche grazie all’insula destra e all’opercolo frontale, che si occupano, d’altro canto, di mantenere l’illusione e di evocare il senso di appartenenza della mano di gomma (Tsakiris et al. 2007). 4.2. SJ e TOJ: paradigmi sperimentali per lo studio del fenomeno di integrazione Un numero sempre crescente di ricerche comportamentali e neurofisiologiche ha messo in evidenza il ruolo cruciale che la sincronia temporale e la coincidenza spaziale giocano nel modulare gli effetti dell’integrazione multisensoriale (Stein & Meredith, 1993). I ricercatori hanno sviluppato, a lungo, diversi paradigmi sperimentali per approfondire lo studio dei processi di integrazione multisensoriale negli esseri umani, tra cui il compito di giudizio di ordine temporale (Temporal Order Judgments o TOJ) nel quale ai parte24 cipanti viene chiesto di indicare quale, tra due stimoli crossmodali presentati, sia quella che compare per prima e il compito di giudizio di simultaneità (Simultaneity Judgments o SJ). In un tipico compito di SJ, vengono presentate coppie di stimoli visuo-acustici la cui comparsa è inserita in una serie di intervalli temporali di presentazione; la presentazione di tali stimoli è, però, asincrona e i partecipanti sottoposti al task sono tenuti a giudicare soggettivamente se gli stimoli siano stati presentati simultaneamente o meno (Engel & Dougherty, 1971). L'analisi dei risultati ottenuti dalle risposte, registrate dai soggetti, è utilizzata per determinare, successivamente, l'intervallo temporale entro il quale essi abbiano avuto maggiore probabilità di percepire la comparsa degli stimoli come simultanea. In uno studio del 2005, lo scopo di Zampini e collaboratori è stato, appunto, quello di esaminare se le posizioni relative alla presentazione di stimoli uditivi e visivi fossero in grado di modulare la percezione della simultaneità audiovisiva dei soggetti. A tal fine, le coppie di stimoli visuo-acustici sono state presentate sia nella stessa posizione spaziale ma anche in diverse posizioni, ad intervalli temporali differenti; il compito dei partecipanti era quello di rispondere se gli stimoli fossero comparsi simultaneamente o meno. Gli autori hanno avanzato l'ipotesi secondo cui i soggetti sarebbero più propensi a rispondere "simultaneo", nel momento in cui le coppie di stimoli vengano presentate nella stessa posizione, piuttosto che da posizioni diverse. Questa previsione si basa sul fatto che dovrebbe esserci una maggiore tendenza a "legare" stimoli provenienti da modalità sensoriali differenti quando essi provengono dalla stessa posizione piuttosto che da posizioni diverse (Stein & Meredith, 1993). Tale fusione sarebbe, cioè, in grado di prevalere sulla percezione delle singole caratteristiche sensoriali relative alla presentazione degli stimoli aumentando, in questo modo, la probabilità di percepire questi ultimi 25 come facenti parte dello stesso stimolo (percezione di simultaneità degli stimoli), piuttosto che come due eventi unimodali separati. 26 Capitolo II La Temporal Binding Window (TBW) Come si è detto, il processo di integrazione delle informazioni – attraverso modalità sensoriali differenti – è fortemente dipendente dalla coincidenza temporale e spaziale degli input in ingresso. A tal proposito, è stato dimostrato in molteplici studi come differenti informazioni vengano integrate all'interno di un intervallo temporale, definito multisensory temporal binding window (TBW) posseduta dai soggetti che varia tra gli individui. La grandezza della TBW di un individuo è, dunque, legata alla capacità di fondere gli input in un percetto unificato. Il fenomeno di integrazione multisensoriale viene, quindi, catturato dalla TBW, che determina la gamma di input temporali entro cui un individuo è in grado di “legare” i diversi stimoli, percepiti come parte dello stesso evento ambientale, attraverso modalità sensoriali differenti. Molti lavori, recentemente, hanno esaminato i fattori temporali, che rappresentano una parte importante nel processo di integrazione, di alcune patologie rivolgendo proprio l'attenzione alla temporal binding window per indagare il limite temporale entro il quale gli stimoli provenienti da diverse modalità vengono integrati e percettivamente “legati". E’ stato dimostrato, per l’appunto, come la dimensione della TBW risulti alterata nei bambini con disturbo dello spettro autistico (Szelag et al., 2004). Questo risultato ha dato prova dell'esistenza di anomalie, in questa categoria di soggetti, nel processamento temporale delle informazioni e nell’integrazione degli stimoli multisensoriali; difatti, una differenza importante tra bambini autistici e sani riguarda proprio l’abilità di combinare diverse informazioni in una percezione unificata. Un esempio di come sia presente un'elaborazione multisensoriale alterata nei bambini con disturbo dello spettro autisti27 co è relativa alla ridotta suscettibilità all’effetto McGurk; questo effetto è, cioè, meno evidente in questi ultimi rispetto ai soggetti sani (Foss-Feig et al., 2010). Evidenze simili sono state riscontrate anche per i pazienti affetti da schizofrenia il cui quadro clinico, relativo al fenomeno di integrazione, risulta allo stesso modo alterato (Tseng et al., 2015). 1. SJ in fRMI La capacità del cervello di integrare gli stimoli in entrata dipende, come si è detto, dalla struttura temporale di queste informazioni: le relazioni spaziali e temporali degli stimoli in entrata, perciò, forniscono informazioni su come questi segnali dovrebbero essere integrati al fine di creare una rappresentazione percettiva unitaria. In uno studio del 2007 Noesselt e collaboratori, avvalendosi del paradigma di SJ in fRMI, hanno tentato di indagare la rete "multisensoriale" alla base di tale processo. Nello, specifico, gli autori hanno dimostrato come la risposta BOLD aumentasse in corrispondenza del solco temporale superiore multisensoriale (mSTS) controlateralmente rispetto allo porzione di spazio in cui veniva presentato lo stimolo visivo, e che aumentasse anche quando quest'ultimo coincideva temporalmente con la comparsa dello stimolo uditivo; gli autori hanno osservato, di contro, un decremento nella risposta BOLD nella condizione di incongruenza temporale in riferimento alla presentazione dei due stimoli. Quindi, l'esistenza di una rete di aree multisensoriali attive durante la condizione di congruenza degli stimoli ha dato prova di come, non solo il fenomeno di integrazione possa influenzare le strutture cerebrali multisensoriali "convenzionali" (come la mSTS), ma anche le aree sensoriali primarie come quella uditiva e visiva. Questa attivazione, però, è possibile evidenziarla nel momento in cui gli input visivi e uditivi presentano una struttura 28 temporale in comune come nel caso, appunto, della presentazione sincrona di due stimoli unisensoriali. 2. Integrazione multisensoriale e malleabilità della TBW Come è stato possibile notare, diversi studi hanno descritto i limiti temporali della TBW, ma pochi hanno, però, esaminato la sua malleabilità. Studi recenti hanno, invece, dimostrato che questa finestra è malleabile e che può essere ridotta attraverso la somministrazione di feedback percettivi all'interno di una sessione di training sperimentale (Stevenson et al., 2013). La malleabilità della dimensione della TBW è stata studiata, già precedentemente, da Powers e collaboratori in uno studio del 2009 che ha utilizzato un paradigma di training percettivo nel quale ai soggetti sono stati somministrati dei feedback visivi in merito alla correttezza delle risposte date durante lo svolgimento di un compito di SJ audiovisivo: nello specifico, i soggetti hanno avuto due alternative di scelta forzate (2-AFC task), per cui sono stati chiamati a rispondere premendo il tasto 1, se gli stimoli comparivano simultaneamente, e il tasto 2, se non comparivano nello stesso istante. Ciò che è emerso chiaramente è che il training ha determinato un marcato restringimento della dimensione della finestra del 40% (Fig. 8a). 29 Fig. 8a) Effetti del 2-AFC training sulla dimensione della TBW Nello specifico, nel task iniziale ai partecipanti è stato chiesto di giudicare se la comparsa dello stimolo visivo (flash) e di quello uditivo (beep) fossero "simultanei" o "non simultanei". Il training, invece, differiva nella valutazione delle performances dei soggetti rispetto al task iniziale, in quanto, dopo aver dato una risposta, i partecipanti venivano premiati con dei feedback percettivi visivi in merito alla correttezza o meno della risposta data, in modo tale che i soggetti potessero migliorare la loro performance diventando, di conseguenza, più abili nel discriminare gli stimoli presentati. Il gruppo dei partecipanti, nel complesso, ha mostrato una diminuzione significativa nella probabilità di giudicare le coppie di stimoli come simultanei dopo essere stati sottoposti al training; ciò sta ad indicare il grado di miglioramento nell'abilità di discriminazione degli stimoli (i soggetti giudicavano, cioè, con minor frequenza gli stimoli come simultanei ed erano, invece, maggiormente inclini a rispondere che fossero non simultanei). L'accuratezza 30 nel discriminare gli stimoli corrisponde ad una effettiva diminuzione della grandezza della TBW dei soggetti (Fig. 8b). Fig. 8b) Riduzione dimensione della TBW: primo giorno e ultimo giorno di training Nel complesso, è possibile notare come le dimensioni medie delle TBW dei soggetti (TBW totale, TBW di sinistra e TBW di destra) diminuiscano in modo significativo anche solo dopo la prima ora di training, per poi rimanere stabili (Fig. 8c). 31 Fig. 8c) Riduzione dimensione della TBW dopo la prima ora di training In conclusione, con questo studio gli autori hanno dimostrato che il paradigma di training percettivo multisensoriale è in grado di addurre cambiamenti significativi e duraturi nei giudizi dei partecipanti sulla simultaneità percepita tra gli stimoli visivi e uditivi suggerendo un elevato grado di flessibilità nell’elaborazione temporale multisensoriale; gli autori hanno, in aggiunta, fornito una forte evidenza che questi effetti sono guidati da un reale cambiamento nella capacità di discriminazione percettiva generata dal training e che essi non sono il risultato di una semplice esposizione passiva agli stimoli presentati ripetutamente. Uno degli effetti più sorprendenti del training percettivo è stato il suo sviluppo nel tempo: sono emersi, cioè, effetti significativi anche solo dopo un giorno di training e gli effetti che quest'ultimo ha comportato, in aggiunta, hanno evidenzia32 to una stabilità nella dimensione raggiunta dalla TBW che è rimasta tale per una settimana anche dopo la cessazione del training. L'importanza del feedback utilizzato in quest'ultimo per la riduzione osservata nella TBW, inoltre, si adatta bene con ciò che è noto circa gli argomenti che coinvolgono la plasticità sensoriale. Diversi studi hanno dimostrato, infatti, che una significativa riorganizzazione potrebbe essere guidata in maniera bottom-up da un’esposizione ad un set forzato di stimoli sensoriali nelle prime fasi di sviluppo (Hubel et al., 1977) e che l'esposizione passiva a questi stessi stimoli non sia servita a guidare il cambiamento comportamentale e neanche la riorganizzazione neurale nel momento in cui un animale, per esempio, avesse raggiunto il termine critico del periodo di sviluppo (Hubel & Wiesel, 1963). Aggiungendo, invece, un segnale istruttivo (feedback) si assiste ad una riorganizzazione sensoriale nei partecipanti, come supportato dai risultati di questo studio. 2.1. La temporal binding window (TBW) come indice predittivo Mentre il lavoro di Powers e collaboratori del 2009 ha indagato principalmente la plasticità della TBW non è, tuttavia, ancora chiaro se i cambiamenti nell'esperienza multisensoriale siano una componente necessaria per le modifiche indotte nella percezione degli stimoli o se questi effetti possano essere guidati, in modo simile, attraverso cambiamenti nell’elaborazione temporale delle singole componenti unisensoriali. Partendo da queste considerazioni, Stevenson e collaboratori nel 2013 hanno tentato di approfondire i risultati relativi alla malleabilità della TBW esaminando, nello specifico, se l'esperienza multisensoriale possa andare incontro a modifiche, sottoponendo i soggetti ad un training percettivo di TOJ esclusivamente unisensoriale (visivo) rispetto al training audiovisivo utilizzato da Powers e collaboratori. Gli autori hanno scelto di sottoporre i 33 soggetti ad un training visivo poiché è stato dimostrato, da studi precedenti, che i cambiamenti nella percezione multisensoriale possono essere indotti proprio all'interno del sistema visivo (Adini et al., 2002). Dai risultati dello studio è emerso come il training percettivo di TOJ nel quale ai partecipanti è stato chiesto di indicare quale tra i due stimoli presentati comparisse per primo, seguito dalla somministrazione di feedback, abbia migliorato l’accuratezza nei giudizi visivi di ordine temporale; ancor più rilevante sembra essere il fatto che il training visivo abbia migliorato notevolmente la percezione multisensoriale audiovisiva nei compiti di SJ; un miglioramento che comporta, appunto, la diminuzione della dimensione iniziale della TBW dei soggetti. Per gli autori, perciò, i risultati ottenuti, in termini di miglior performance nel discriminare gli stimoli, assumono una grande importanza nel panorama scientifico: il training con feedback visivi è, infatti, sufficiente a generare cambiamenti nella percezione multisensoriale degli stimoli audiovisivi; la sola esposizione al compito e gli effetti associati al training in assenza di feedback, invece, non sembrano indurre modifiche nella percezione multisensoriale. Un dato di estrema rilevanza è rappresentato, inoltre, dalla dimensione iniziale della TBW dei soggetti: precedenti ricerche hanno dimostrato che esiste una correlazione tra le dimensioni della TBW iniziale e il grado in cui essa può essere ridotta in seguito alla somministrazione del training. Nello specifico, è stato osservato che quanto più ampia risulta essere la TBW iniziale, tanto maggiore risulterà l'impatto relativo all’effetto indotto dal training (Powers et al., 2009). La dimensione iniziale della TBW rappresenta, di conseguenza, un forte indice predittivo degli effetti di miglioramento nelle prestazioni dei soggetti che sono stati sottoposti al training. In effetti, questa analisi ha mostrato una correlazione sorprendente, poiché si è visto che il grado di plasticità della TBW sembra essere determinato dalla sua dimensione iniziale: in questo modo, i soggetti con 34 grandi finestre multisensoriali, prima di essere sottoposti al training, sono quei soggetti che registrano i maggiori effetti del training e che mostrano una più evidente diminuzione della grandezza della TBW. Inoltre, mentre gli studi precedenti (Alais & Cass, 2010) hanno dimostrato che la pratica audiovisiva può influenzare l'apprendimento visivo a livello percettivo, questo è il primo studio a mostrare una relazione reciproca in cui il training con feedback visivi induce modifiche sull’elaborazione multisensoriale. In definitiva, è evidente come la ricerca per le basi neurali della TBW sia diventata una zona sempre più attiva di indagine; un certo numero di studi indicano la presenza di una grande rete dinamica di aree che comprende l'insula, la corteccia parietale posteriore e la corteccia temporale superiore; aree critiche, queste, nella percezione della simultaneità audiovisiva (Bushara et al., 2003); più di recente, però, l'interesse si è concentrato sul ruolo potenziale delle oscillazioni neuronali nell’elaborazione temporale multisensoriale (Lakatos et al, 2007). Insieme, questi lavori si sono focalizzati sulla corteccia cerebrale che rappresenta la zona critica per lo studio approfondito del fenomeno di plasticità percettiva (Maertens & Pollmann, 2005). 3. Integrazione multisensoriale e resting-state Le neuroscienze hanno a lungo ritenuto che i circuiti neurali di base fossero fondamentalmente spenti nel momento in cui la nostra attività cerebrale risultasse apparentemente in “standby”. Esperimenti di neuroimaging hanno, invece, dimostrato la presenza di un livello persistente di attività di fondo; questa cosiddetta "modalità di default" potrebbe essere essenziale nella pianificazione di azioni future, ma ancor più nella comprensione e nell’individuazione di quelli che potrebbero essere considerati i pattern neurali di base 35 in grado di predire i cambiamenti nella dimensione della TBW. Recentemente, uno studio di Powers e collaboratori del 2012 ha dimostrato non solo che, attraverso la somministrazione di un paradigma di training percettivo, è possibile osservare una riduzione del 40% della larghezza della TBW nei soggetti sottoposti al training – che rimane stabile per almeno una settimana anche dopo la cessazione di quest'ultimo –, ma anche come sia possibile risalire ai substrati neurali di questi cambiamenti. Il compito era uguale a quello somministrato nel precedente studio; gli autori, perciò, hanno misurato, tramite fMRI (risonanza magnetica funzionale), la connettività funzionale a riposo prima e dopo aver sottoposto i partecipanti al paradigma di training. Dai risultati dello studio è emerso chiaramente come il solco temporale superiore posteriore (pSTS) e le aree della corteccia visiva e uditiva esibiscano un robusto decremento della risposta BOLD in seguito alla sessione di training al quale i soggetti sono stati sottoposti; l'analisi del resting-state, in aggiunta, ha messo in luce un aumento significativo, in seguito alla somministrazione del training, della forza dei pattern neurali che si vengono a creare tra queste aree. Questi risultati forniscono, perciò, una prima prova dei correlati neurali che sottostanno ai cambiamenti nella finestra di integrazione multisensoriale. Nello specifico, gli autori hanno avanzato l'ipotesi che sia possibile ottenere un cambiamento nella risposta BOLD nella pSTS e nelle aree uditive e visive e che, il modo in cui queste regioni funzionalmente interagirebbero, verrebbe alterato dopo aver sottoposto tali soggetti al training percettivo. L’attività del segnale BOLD in pSTS diminuisce, difatti, in seguito al training e ciò rifletterebbe il grado di miglioramento nel processo di discriminazione degli stimoli percepiti come sincroni e come asincroni: gli autori hanno attribuito questo decremento del segnale BOLD ad un restringimento della popolazione neurale coinvolta nel processo, a favore di un sottoinsieme di neuroni più limitato e specializza36 to. In questo modo, la direzione del cambiamento, in seguito al training, potrebbe essere interpretata a sostegno dell'ipotesi degli autori, secondo la quale il training aumenterebbe l'efficienza, da parte dei soggetti, nel distinguere le coppie di stimoli oggettivamente simultanee da quelle, invece, altamente asincrone. Ancor più rilevante risulta essere, però, l’analisi del resting-state in seguito alla sessione di training; dopo aver individuato la rete di aree corticali sensoriali, che sembrano giocare un ruolo importante nei cambiamenti indotti dal training nella grandezza della TBW, gli autori hanno tentato, in aggiunta, di indentificare i cambiamenti funzionali tra la pSTS e le altre aree connesse: mentre all'inizio del training non era ancora presente una completa sovrapposizione tra la pSTS e le aree uditive e visive, in seguito alla sessione di training è stato possibile osservare, invece, un aumento significativo della forza della connettività funzionale tra le suddette aree. Tra le aree implicate nel processo sono state evidenziate il giro temporale superiore destro (corteccia uditiva secondaria), il giro paraippocampale destro, il solco parietale inferiore e la corteccia premotoria sinistra (Fig. 9a). Fig. 9a) Le aree implicate nel fenomeno di integrazione 37 La forza di tali connessioni in seguito al training è stata osservata, inoltre, anche tra pSTS e il CS, così come nel cervelletto superiore (Fig. 9b). Fig. 9b) La connettività funzionale nel resting-state aumenta tra la pSTS e le aree uditive in seguito alla sessione di training. Come si è detto, i dati presentati da questo studio rappresentano il primo tentativo di caratterizzare, ma soprattutto di dimostrare la possibilità di modificare – attraverso un training audiovisivo di SJ – le dinamiche di un network di specifiche aree alla base del processo di integrazione multisensoriale e di come alcuni nodi di questa rete (pSTS e le altre aree implicate) siano strettamente legati; quest’ultima evidenza è supportata dal fatto che l’attività e la connettività funzionale di queste aree sono soggette a cambiamenti in seguito al training percettivo a cui i soggetti sono stati sottoposti. Tale alterazione nei pattern funzionali, perciò, chiarisce il ruolo che queste aree svolgono durante la percezione degli eventi multisensoriali di tutti i giorni. 38 Capitolo III Parte sperimentale 1. Obiettivi della ricerca Il fenomeno di integrazione multisensoriale, come si è visto, ha luogo nel momento in cui i tre principi di base (regola spaziale, temporale e dell’efficacia inversa) vengono rispettati (Kanayama et al., 2014; Keil et al., 2011). Molteplici studi, inoltre, si sono avvalsi del paradigma di SJ in fRMI nel tentativo di indagare la rete "multisensoriale" alla base di tale processo (Noesselt et al., 2007). Un indice di come avvenga tale fenomeno è sicuramente rappresentato da un intervallo temporale (TBW) proprio di ogni soggetto, che varia tra gli individui e che determina la gamma di input sensoriali entro cui un soggetto è in grado di “legare” i diversi stimoli, percepiti come parte dello stesso evento ambientale, attraverso modalità sensoriali differenti. Come è stato possibile constatare, diversi studi hanno descritto i limiti della temporal binding window ma pochi hanno, però, esaminato la sua malleabilità; essa, in realtà, si è visto che può essere ridotta attraverso la somministrazione di feedback percettivi in una sessione di training sperimentale. L’utilizzo di feedback è di utilità ottimale in relazione all’accuratezza delle risposte date dai soggetti sottoposti al training: il fatto di avere degli indizi percettivi, in grado di indirizzare le loro decisioni, ha dato prova di come l’utilizzo di questi feedback correlli significativamente con la riduzione della dimensione della TBW. Le performance dei soggetti miglioravano e, di conseguenza, essi divenivano più abili nel discriminare correttamente gli stimoli presentati. 39 Sulla scia dello studio nel 2009 condotto da Powers e collaboratori, ulteriori studi hanno tentato di approfondire gli effetti del training sui processi di integrazione multisensoriale; in uno studio del 2013, Stevenson e collaboratori hanno dimostrato come il training unisensoriale con feedback visivi sia, in realtà, sufficiente a generare cambiamenti nella percezione multisensoriale degli stimoli audiovisivi; mentre, la sola esposizione al compito e gli effetti associati al training in assenza di feedback non sembrano indurre modifiche nella percezione multisensoriale. In generale, tutti questi risultati hanno evidenziato come la dimensione iniziale della TBW rappresenti un forte indice predittivo degli effetti di miglioramento nelle prestazioni dei soggetti che sono stati sottoposti al training: nello specifico, è stato osservato che quanto più ampia risulta essere la TBW iniziale, tanto maggiore risulterà l'impatto relativo all’effetto indotto dal training. I soggetti con grandi finestre multisensoriali, prima di essere sottoposti al training, sono quei soggetti che registrano i maggiori effetti di quest’ultimo e che mostrano una più evidente diminuzione della grandezza della TBW (Powers et al., 2009). Lo studio di Powers e collaboratori del 2012 ha dimostrato, difatti, non solo che, attraverso la somministrazione di un paradigma di training percettivo è possibile osservare una riduzione del 40% della larghezza della TBW, ma anche come sia possibile risalire ai substrati neurali di questi cambiamenti e come aumenti la connettività tra alcune aree implicate nel fenomeno in seguito alla somministrazione del training, nonostante non sia stato trovato, però, alcun indice neurale che possa predire l’andamento del training. La presente ricerca è stata condotta con l’intento di identificare non solo i correlati neurali di base del suddetto fenomeno, ma soprattutto di esplorare i meccanismi neurali ad esso sottostanti in grado di predire i cambiamenti nella dimensione della TBW prima che i soggetti vengano sottoposti ad una sessione di training di SJ visuo-tattile. Ci siamo 40 avvalsi, perciò, non solo delle registrazioni, mediante utilizzo di EEG, dell’attività cerebrale a riposo per condurre l’analisi del resting-state, ma abbiamo anche registrato l’attività cerebrale evocata durante la somministrazione del paradigma di SJ percettivo. Pertanto abbiamo tentato di indagare quali siano i meccanismi neurali alla base dei cambiamenti relativi alla dimensione della TBW dei soggetti da noi esaminati: nello specifico se, osservando l’attività a riposo di questi soggetti prima che vengano sottoposti al training, sia possibile evidenziare e predire il grado di riduzione nella dimensione della TBW conseguente alla somministrazione del training. 2. Materiali e metodi 2.1. Partecipanti Hanno preso parte all’esperimento 22 soggetti di cui 12 femmine e 10 maschi con un’età media di 22,72 (DS=1,8). Nessuno dei partecipanti risultava affetto da disturbi neurologici o psichiatrici e, coloro che erano stati sottoposti ad operazioni chirurgiche cerebrali, non sono stati sottoposti all’esperimento. Il loro livello di scolarizzazione andava dal diploma superiore alla laurea triennale. Nessuno dei partecipanti era a conoscenza dell’ipotesi sperimentale. 2.2. Procedura sperimentale I partecipanti reclutati sono studenti iscritti all’università Gabriele D’Annunzio di Chieti-Pescara e sono stati chiamati presso l’ITAB (Istituto Tecnologie Avanzate Biomediche) per svolgere l’esperimento. Per prima cosa sono stati raccolti i dati socioanagrafici utilizzati per la descrizione del campione ed è stato chiesto loro di firmare il consenso 41 informato. Musicisti e ballerini non sono stati considerati idonei a partecipare all’esperimento poichè è stato dimostrato come la TBW di questi soggetti risulti essere di dimensioni ridotte rispetto a non ballerini e non musicisti, di conseguenza, è stato possibile constatare come essi siano maggiormente sensibili all’allineamento temporale degli stimoli audio-visivi percepiti (Hweeling & Uta, 2014). Ai partecipanti è stato quindi chiesto di eseguire una prima sessione comportamentale di SJ visuo-tattile per poter calcolare la TBW iniziale. Tale misura è stata utile per definire l’idoneità o meno dei soggetti: difatti, quei soggetti che hanno registrato ridotte dimensioni delle TBW (circa 250 millisecondi), non sono stati considerati idonei per questo studio: essendo interessati ad evidenziare indici predittivi del miglioramento della prestazione, i soggetti con TBW troppo piccole avrebbero potuto non mostrare effetti del training. In questa prima fase, perciò, i soggetti sono stati fatti accomodare in una stanza buia; il setting sperimentale prevedeva che i partecipanti si sedessero di fronte ad un tavolo sul quale era posizionato un piccolo cubo di polistirolo al quale è stato applicato un LED rosso (stimolo visivo) e, applicati al dito medio della mano sinistra, degli elettrodi collegati ad un elettrostimolatore che generava delle scosse di bassa intensità (stimolo tattile). Per poter applicare i cavi, direttamente a contatto con il dito medio della mano sinistra dei soggetti, abbiamo utilizzato un gel conduttore per favorire la trasmissione. Successivamente, abbiamo regolato l’intensità della stimolazione in maniera differente per ogni soggetto con l’obiettivo di adattare l’intensità di quest’ultima in base alla loro differente soglia percettiva e, una volta trovata, abbiamo aumentato l’intensità della stimolazione per essere sicuri che i soggetti la percepissero chiaramente. Ai soggetti è stato chiesto di tenere con la mano sinistra, sulla quale venivano somministrati gli stimoli tattili, il cubo con il LED: è stato possibile, in questo modo, rispettare la regola spaziale alla base 42 del fenomeno di integrazione multisensoriale. Successivamente è stata avvicinata, alla mano destra dei soggetti, la testiera di risposta. Il compito prevedeva la presentazione, a diversi intervalli temporali (delay) che andavano da -500 a +500 millisecondi, di coppie di stimoli cross modali visivi e tattili. I soggetti sono stati istruiti a rispondere esprimendo un giudizio di simultaneità soggettivo: con un tasto, se gli stimoli fossero stati percepiti come “simultanei” e, con l’altro, se fossero stati percepiti come “non simultanei”. I tasti di risposta sono stati controbilanciati fra i soggetti. Il giorno seguente, si è passati alla registrazione dell’elettroencefalogramma: si è cominciato con la preparazione della superficie della testa dei soggetti. Per poter applicare correttamente sulla loro testa il sistema di registrazione, abbiamo misurato la distanza tra inion e nasion, tale misura è stata divisa a metà per poter individuare il punto centrale dello scalpo sulla linea saggittale. Successivamente, si è misurata la distanza fra i due punti auricolari destro e sinistro, tale misura è stata divisa a metà per poter individuare il punto centrale dello scalpo sulla linea coronale. L’incrocio di questi due punti è servito per definire la posizione dell’elettrodo Cz e, quindi, il corretto posizionamento della cuffietta EEG secondo il sistema internazionale 10:10; dopo averla posizionata, è stato applicato dell’alcool all’interno di ogni elettrodo per poter esporre la cute del soggetto. In seguito, è stato passato dello scrub sulla cute in corrispondenza delle cavità degli elettrodi non ancora montati per abbassare l’impedenza naturale della pelle a circa 15 kiloohm (kΩ). Una volta attaccati gli elettrodi, sono stati riempiti con gel elettroconducente, si sono attesi alcuni minuti affinchè il segnale si stabilizzasse e, nel contempo, è stato spiegato ai soggetti quello che avrebbero dovuto fare durante il compito. Il compito sperimentale era un SJ visuotattile dove, però, non si prevedeva la somministrazione di tutti gli intervalli temporali, ma solo di una selezione mirata ad indagare alcuni feno43 meni specifici della TBW, non oggetto di tale elaborato. La sessione di registrazione aveva la durata di 3 ore circa e prevedeva la somministrazione di 2 blocchi di restingstate (della durata rispettivamente di 4 minuti) durante i quali ai soggetti non è stato presentato alcuno stimolo: in un blocco, ai soggetti è stato chiesto di rimanere con gli occhi chiusi; nell’altro, è stato chiesto di tenere gli occhi aperti e di concentrare la propria attenzione su una croce di fissazione sul monitor di un computer posto di fronte a loro. Subito dopo, i soggetti sono stati sottoposti al compito di SJ. Al termine del task, sono stati nuovamente sottoposti a 2 blocchi di resting-state della stessa durata dei primi due. Successivamente, i soggetti, nei 3 giorni seguenti, sono stati richiamati e invitati a completare una sessione di training di SJ visuo-tattile: tale sessione di training prevedeva la somministrazione di 3 blocchi di SJ in cui venivano somministrati solamente intervalli temporali che andavano da -150 a +150. Il compito di training prevedeva la presenza di feedback uditivi che informassero i soggetti sulla correttezza o meno della loro risposta. Tali blocchi avevano una durata minore rispetto a quelli di valutazione per avere la certezza che i soggetti si potessero impegnare e concentrare durante tutta la sessione di training. Alla fine (circa 25 minuti), i soggetti hanno eseguito 2 blocchi di SJ di valutazione per poter valutare gli effetti del training. L’ultimo giorno, esattamente come nella prima sessione di elettroencefalografia, i soggetti sono stati richiamati per essere nuovamente sottoposti alla sessione di registrazione tramite EEG. Quest’ultima sessione, come la prima, prevedeva la presenza di 2 blocchi di resting-state iniziali, seguiti dal task e, infine, la somministrazione dei 2 blocchi di resting-state finali. Alla fine del compito, i soggetti sono stati ripuliti dai residui di gel e adeguatamente informati sul reale scopo della ricerca. 44 2.3. SJ visuo-tattile - valutazione In questo task sono state presentate coppie di stimoli visuo-tattili: nello specifico, i 16 intervalli di presentazione degli stimoli (delay) andavano da -500 a +500 millisecondi (500, -400, -300, -200, -150, -100, -50, -25, 25, 50, 100, 150, 200, 300, 400, 500); per ogni delay sono state somministrate 14 coppie di stimoli in ogni blocco: gli intervalli negativi indicavano quei trial in cui lo stimolo tattile veniva presentato per primo (tactile-leading); gli intervalli positivi, viceversa, indicavano quei trial in cui lo stimolo visivo veniva presentato per primo (visual-leading). In ognuno dei 3 blocchi sono stati presentati rispettivamente 224 trial, i soggetti hanno completato 3 blocchi di valutazione, per un totale complessivo di 672 trial. 2.4. SJ visuo-tattile - training In questo task sono state presentate coppie di stimoli visuo-tattili: nello specifico, i 7 intervalli di presentazione degli stimoli (delay) andavano da -150 a +150 millisecondi (150, -100, -50, 0, 50, 100, 150). Per i delay non simultanei (-150, -100, -50, 50, 100, 150) sono stati presentati 10 stimoli ognuno; per la condizione di simultaneità (0 ms), invece, 60 stimoli: i delay non sono stati equamente distribuiti, in quanto il rapporto fra la condizione di simultaneità è stato di 6:1 rispetto a quelle di non simultaneità. In questo modo le due condizioni avevano lo stesso numero di trial minimizzando, in questo modo, la probabilità di incorrere in bias di risposta. In un blocco erano presenti 120 stimoli totali; i soggetti hanno completato 3 blocchi di training, per un totale di 260 trial. Gli intervalli negativi indicavano quei trial in cui lo stimolo tattile veniva presentato per primo (tactile-leading); gli intervalli positivi, viceversa, indicavano quei trial in cui lo stimolo visivo veniva presentato per primo (visual-leading). In aggiunta, come si è det45 to, sono stati somministrati due feedback uditivi 400 millisecondi dopo che i soggetti avessero risposto: il suono alto è stato associato alla risposta “corretta” che prevedeva che i soggetti rispondessero di aver percepito gli stimoli come non simultanei nella condizione di non simultaneità; mentre, il suono basso è stato associato alla risposta “sbagliata” che prevedeva che essi rispondessero di aver percepito gli stimoli come simultanei nella condizione di non simultaneità. I feedback erano invertiti nella condizione di simultaneità. 3. Analisi dei dati Tutti i dati sono stati raccolti con MatLab. Di seguito sono riportate le principali analisi statistiche e i relativi risultati ottenuti analizzando i dati del campione preso in esame. Sono stati ricavati i seguenti dati: le misure relative all’estensione delle TBW dei soggetti (la TBW baseline calcolata durante il primo giorno di valutazione e le TBW misurate durante i 3 giorni di training) e i dati neurali raccolti durante le due sessioni di elettroncefalografia. 3.1. Dati comportamentali Per indagare gli effetti del training, è stata eseguita un’ANOVA con un fattore within a 4 livelli (time point: baseline vs 1 giorno vs 2 giorno vs 3 giorno). Tale analisi ci ha permesso di confrontare la TBW nelle diverse sessioni, evidenziando un miglioramento dopo il primo giorno di training. L’effetto principale dei diversi time point risulta essere significativo per F (3,63) = 12,05, p < 0,001. Abbiamo quindi eseguito i post hoc di Newman-Keuls che hanno mo46 strato una differenza significativa fra la baseline (M= 405 msec, DS= 131) e i tre giorni di training (giorno 1: M=307, DS= 77,04; giorno 2: M=294, DS= 70,8; giorno 3: M=284, DS=75,63) (p < 0,001 per tutti i confronti). Non sono state rilevate differenze significative fra il tre diversi giorni di training (p > 0,56) (Grafico n. 1). TBWTotale 450 millisecondi 400 405 350 307 294 300 284 250 baseline 1giorno 2giorno 3giorno timepoint Grafico 1 Effetto significativo del training tra la baseline e i 3 giorni di training Non avendo trovato differenze fra i diversi giorni di training, tale variabile è stata collassata, confrontando solamente la TBW di baseline con la media dei tre giorni di training: è stato quindi eseguito un t-test per campioni indipendenti per confrontare la prestazione pre training e quella post training così ottenuta: l’effetto del training continua ad essere significativo per t (21,1) = 3,8; p = 0,001 (Grafico n. 2) (Pre Training: M = 405, DS = 131; Post Training: M = 295, DS = 66). 47 TBW Millisecondi 450 400 405 350 300 295 250 PreTraining PostTrainig Grafico 2 Differenza significativa tra il Pre e il Post Training In aggiunta, è stato indagato se esistesse una differenza tra i due lati della TBW (tactileleading e visual-leading): a tale scopo, abbiamo effettuato un’ANOVA 2x2 con i seguenti fattori within subject: la sessione (due livelli, pre training e post training) e i lato della TBW (due livelli, tactile-leading e visual-leading). Tale analisi ha confermato l’effetto principale della sessione per F(1,21) = 14,51; p = 0,001, mostrando come la TBW post training sia significativamente ridotta rispetto al pre training (Pre Training: M=202,7, DS=68,9; Post Training: M=147; DS=34,9). Né l’effetto del lato, né l’interazione sessione x lato risultano significative (lato: F(1,21) = 0,33, p = 0,56; lato x sessione: F(1,21) = 0,33, p = 0,57). (Grafico n. 3, Tabella 1). 48 millisecondi TBWTactileleadingvsVisual leading 240 220 200 180 160 140 120 100 205 199 147 148 Tactileleading VisualLeading Tactileleading VisualLeading PreTraining PostTraining Grafico 3 Nessun effetto significativo del lato e dell'interazione sessione x lato Media Dev.st Pre Training Tactile leading 199 83 Post Training Visual Leading Tactile leading 205 147 54 30 Visual Leading 148 40 Tabella 1 49 3.2. Elettroencefalogramma In questa sessione verranno presentati i dati elettroencefalografici relativi ai blocchi di resting-state registrati ad occhi aperti ed eseguiti prima del task in elettroencefalogramma nelle due sessioni, prima e dopo il training. I dati sono stati analizzati utilizzando il software gratuito EEGLAB (Delorme A & Makeig S, 2004). In principio, i dati sono stati ricampionati a 500 Hz, è stato applicato un filtro passa basso a 30 Hz e un passa alto a 0,5 Hz. In seguito, sono stati rimossi gli artefatti da movimenti oculari utilizzando l’Analisi delle Componenti Indipendenti sfruttando l’algoritmo FastICA (MatLab). In seguito, per ogni soggetto e, per ogni banda di frequenza (Delta: 1 – 4 Hz; Theta: 4,8 – 7 Hz; Alpha: 7 – 13 Hz; Beta: 13 – 20 Hz), è stato calcolato il picco di frequenza che presentasse la maggior potenza. Quindi, per ogni soggetto, sono stati ricavati quattro valori relativi al picco di frequenza maggiormente espresso in ogni banda. Essendo interessati ad evidenziare un correlato neurale che possa spiegare e predire il grado di miglioramento in seguito al training multisensoriale, sono state analizzate le correlazioni fra i dati elettroencefalografici così ottenuti e l’estensione della TBW prima e dopo il training, esaminando sia le possibili relazioni con la TBW presa integralmente, sia analizzandone i due lati separatamente. Tale analisi ha evidenziato una correlazione positiva significativa fra le frequenze in Theta e la TBW Pre Training Tactile Leading (r = 0,45, p = 0,03) (Grafico n. 4). 50 FrequenzeThetaPreTrainingvs TBWtactileleading FrequenzeTheta(Hz) 7,5 7 6,5 6 5,5 5 4,5 4 100 150 200 250 300 350 400 TBW(millisecondi) Grafico 4 Correlazione positiva significativa tra le frequenze in Theta e la TBW Pre Training Tactile-Leading Tale correlazione evidenzia come ad una frequenza Theta più alta corrisponda una TBW pre training più alta. Tale correlazione però non si ritrova nel post training (r = -0,21; p = 0,33) (Grafico n. 5.) FrequenzeTheta(Hz) FrequenzeThetaPostTrainingvsTBWtactileleading 7,5 7 6,5 6 5,5 5 4,5 4 50 100 150 200 TBW(millisecondi) Grafico 5 Nessuna correlazione tra le frequenze in Theta e la TBW Post Training Tactile-Leading 51 Inoltre è stata evidenziata una correlazione significativa fra la frequenza Theta individuale e l’equivalente trasformazione dell’estensione della medesima TBW in frequenza (1000/TBW in millisecondi; r= -,48; p = 0,022) (Grafico n. 6). FrequenzeTheta(Hz) FrequenzaThetapretrainingvsTBWinHz 7,5 7 6,5 6 5,5 5 4,5 4 2,00 3,00 4,00 5,00 6,00 TbwinHz 7,00 Grafico 6 Correlazione negativa significativa tra le frequenze in Theta e la TBW espressa in frequenza La frequenza Theta non presenta differenze significative fra pre training e post training (Pre Training: M=5,89, DS=0,76; Post Training: M=5,97, DS= 0,77; t (21,1) = -0,37; p = 0,71) (Grafico n. 7). FrequenzeTheta(Hz) FrequenzeThetaPreePostTraining 8 7 6 5 4 5,89 5,97 PreTraining PostTraining 3 Grafico 7 Nessuna differenza tra il Pre e il Post Training nelle frequenze Theta 52 4. Discussione dei risultati In questo studio ci siamo interessati a ricercare mediante l'analisi del resting-state, il substrato elettrofisiologico responsabile del fenomeno di integrazione multisensoriale quando l'attività cerebrale è momentaneamente in stato di "riposo". Siamo dell’idea che tale attività di fondo – registrata tramite EEG – possa rappresentare un indice esplicativo dell’attività cerebrale dei soggetti da noi esaminati e che questa attività “a riposo” funga da correlato neurale importante per comprendere le dinamiche alla base del processo di integrazione. Infatti, emerso come il processo di integrazione venga catturato da una finestra di integrazione multisensoriale (TBW) che determina la gamma di intervalli temporali entro cui un individuo è in grado di fondere stimoli provenienti da modalità sensoriali differenti, diversi studi in aggiunta hanno dimostrato che questa finestra è malleabile e che può essere ridotta attraverso un training con l’ausilio di feedback percettivi. Sulla scia di queste ricerche, nel suddetto studio si è tentato di ampliare tali risultati esaminando la malleabilità della TBW sottoponendo i soggetti ad un training visuo-tattile e, avvalendoci dell’EEG, abbiamo cercato di risalire a dei marker neurali in grado di predire il grado di malleabilità della TBW. I risultati comportamentali hanno mostrato come il training percettivo abbia prodotto un miglioramento - in termini di performance dei soggetti – nel discriminare le coppie di stimoli presentate, già dopo il primo giorno di training; evidenziando, in questo modo, il grado di riduzione delle TBW post training. Inoltre, dai dati elettroencefalografici è emersa una stretta correlazione tra le frequenze Theta a riposo e la TBW di baseline; tale correlazione, però, non si evidenzia nel post training. La frequenza Theta, quindi, risulta essere un indice in grado di definire il meccanismo di integrazione multisensoriale individuale ma non il grado di malleabilità dello stesso. Infatti, abbiamo osservato come 53 la frequenza pre e post training, presa in esame, non mostri alcun cambiamento. Questo dato è in linea con diversi studi condotti recentemente, nei quali è stato possibile evidenziare una correlazione esistente tra il comportamento e l’attività cerebrale di base, cosiddetta “a riposo”. Difatti, è stato osservato come il 74% del nostro comportamento e delle nostre reazioni sia attribuibile alle fluttuazioni cerebrali spontanee e intrinseche (ongoing fluctuations) quando il nostro cervello è momentaneamente in stato di “riposo”. Questo studio, in aggiunta, non solo è in grado di definire la suddetta correlazione, ma ne identifica anche una maggiormente specifica tra il comportamento manifesto (in un compito di detezione semplice visiva dello stimolo) e l’attività cerebrale spontanea (resting-state), correlazione che fa riferimento alla variabilità inter-trial (Fox et al., 2007). E’ stato osservato, inoltre, come tale attività di base sia in grado di predire la tipologia di risposta in un compito in cui è stato chiesto ai soggetti di esprimere un giudizio relativo alla percezione visiva di figure bistabili. In questo caso, gli autori si sono avvalsi dell’illusione del Vaso di Rubin con il quale sono stati in grado di identificare una correlazione tra l’attività prestimolo nell’area fusiforme delle facce (FFA, face fusiform area) e il tipo di risposta che i soggetti avrebbero dato. I dati hanno evidenziato come ad un’alta attività prestimolo dell’area fusiforme dei volti corrispondesse la percezione, da parte dei soggetti esaminati, dei due volti di profilo e come, di contro, ad una bassa attività della stessa area corrispondesse la percezione del vaso (Hesselmann et al., 2008). Anche quando si fa riferimento al concetto di soglia percettiva, è stato possibile delineare una correlazione simile tra un’alta attività prestimolo nelle aree uditive e le risposte date dai soggetti esaminati, in un compito che prevedeva la risposta a degli stimoli uditivi somministrati a soglia percettiva, quindi percepibili nel 50% dei casi: nello specifico, nel momento in cui i soggetti percepivano correttamente lo stimolo (“hits”), si 54 registrava un’alta attività prestimolo nelle aree uditive; di contro, quando i soggetti non percepivano correttamente lo stimolo (“miss”), si registrava una bassa attività prestimolo nelle stesse aree (Sadaghiani et al., 2009). Ulteriori ricerche hanno, inoltre, dato conferma di come anche nelle aree relative al movimento (MT, area medio temporale) si possa evidenziare una attività spontanea che aumenta, però, solo nel momento in cui gli stimoli presentati danno l’impressione, al soggetto, di muoversi nella medesima direzione in maniera coerente rispetto a quando il movimento degli stimoli è del tutto casuale (Hesselmann et al., 2008). Quindi se, facendo riferimento al comportamento umano “manifesto” i suddetti studi hanno tentato di indagare le varie tipologie di risposta a compiti che vanno dalla detezione semplice dello stimolo fino a quelli di decision making percettivo ed è stato possibile, in questo modo, risalire ai substrati neurali dei diversi processi, il medesimo discorso è stato possibile affrontarlo in altri studi che hanno tentato, ancor più, di ampliare tali risultati ad ambiti di ricerca più specifici. In particolare, si è visto come l’abilità dei soggetti nel rilevare gli stimoli, anche questi somministrati a soglia percettiva, sia fortemente correlata con la fase dell’oscillazione cerebrale; i dati, difatti, hanno mostrato un collegamento diretto tra le fluttuazioni spontanee del cervello misurate a frequenze molto basse (infraslow frequencies: 0,01 – 0,1 Hz) e la fase dell’oscillazione in cui viene a trovarsi un dato stimolo. A tal proposito, è stato dimostrato che se quest’ultimo cade nella cosiddetta fase “up” dell’oscillazione, allora esso non verrà percepito dal soggetto; di contro, se lo stesso cade nella fase definita “down”, lo stimolo di conseguenza verrà percepito correttamente (Monto et al., 2008). Seguendo la scia dei risultati emersi dalle ricerche precedentemente condotte, quindi, un ulteriore studio ha tentato di indagare se e in che modo la potenza e la fase delle oscillazioni alpha (10 Hz) siano in grado di predire con successo la percezione tattile consapevole. 55 Nello specifico, sono state somministrate delle stimolazioni tattili vicine alla soglia percettiva alla mano sinistra dei soggetti esaminati e, nel contempo, è stata registrata l’attività cerebrale attraverso una sessione di EEG in corrispondenza della corteccia somatosensoriale destra, controlateralmente alla stimolazione. Questo primo risultato suggerisce, quindi, l’esistenza di una relazione tra la potenza dell’alpha prestimolo e la detezione dello stimolo tattile presentato. Dallo studio è emersa, in aggiunta, una differenza significativa relativa, questa volta, alla fase in cui lo stimolo presentato veniva a trovarsi: questo risultato è stato in grado di predire il tipo di risposta che i soggetti avrebbero dato agli stimoli presentati successivamente: se i soggetti, cioè, avrebbero o meno percepito lo stimolo tattile prima ancora che avessero dato una risposta. Questi risultati, in conclusione, suggeriscono come le oscillazioni alpha misurate nelle aree somatosensoriali esercitino un forte controllo inibitorio sulla percezione tattile e come, in aggiunta, l'inibizione degli impulsi modelli lo stato dell’attività cerebrale necessario affinchè avvenga la percezione cosciente degli stimoli (Ai & Ro, 2013). Le evidenze emerse da questi studi fanno ben comprendere come l’ongoing activity rappresenti, quindi, un correlato neurale fondamentale e importante poiché, tramite questo, è stato possibile predire e spiegare differenti processi che vanno dalla detezione semplice degli stimoli a quelli relativi al decision making percettivo. Il presente studio, perciò, si propone di allargare questo nuovo assetto di conoscenze teorizzato negli ultimi anni, relativo all’ongoing activity, allo studio del fenomeno di integrazione multisensoriale da noi preso in esame. In effetti, la correlazione significativa trovata fra le frequenze Theta e la dimensione della TBW dei soggetti stabilisce un collegamento diretto tra una determinata banda di frequenza e il comportamento manifesto dei soggetti. A questo punto, rimane da spiegare un aspetto fondamentale, ovvero per quale motivo le frequenze Theta, e non le altre, 56 siano utili a spiegare questo specifico fenomeno. Per rispondere a tale quesito, è stato possibile notare come la frequenza Theta risulti avvicinarsi, di più rispetto alle altre frequenze, all’estensione in millisecondi della TBW media dei soggetti esaminati: difatti, è possibile osservare come tale frequenza di oscillazione sia pari a circa 200 millisecondi (5 Hz) e come, questo dato, maggiormente correli con la dimensione della TBW media che è risultata essere pari a circa 200 millisecondi. Quindi, l’oscillazione di tale frequenza sembra riflettere al meglio l’estensione media della TBW. Inoltre, la trasformazione in frequenza della TBW è compresa in un range di frequenze paragonabili a quelle Theta (da 3 a 6,7 Hz). Per questo motivo, le oscillazioni proprie della frequenza Theta sembrano essere adatte a descrivere l’estensione della finestra di integrazione multisensoriale propria di ogni soggetto. In conclusione, i risultati di questo studio suggeriscono che la organizzazione spazio temporale dell’attività neurale determina la nostra percezione degli stimoli ambientali. 57 RINGRAZIAMENTI Ringrazio il Professor Marcello Costantini, Relatore, per la possibilità che mi ha concesso nell’entrare a far parte dei collaboratori di questo lavoro ma, soprattutto, per aver riposto in me tanta fiducia. Un ringraziamento speciale va al Dottor Daniele Migliorati senza il quale, con la sua pazienza, la sua umiltà, il suo supporto costante e la sua guida sapiente, questa tesi non esisterebbe. 58 BIBLIOGRAFIA Adini, Y., Sagi, D., e Tsodyks, M., 2002. Context-enabled Learning In The Human Visual System. Nature, 415: 790-793. Ai, L., & Ro, T., 2013. The Phase Of Prestimulus Alpha Oscillations Affects Tactile Perception. J Neurophysiol 111: 1300–1307, 2014. Alais, D., & Cass, J., 2010. Multisensory Perceptual Learning Of Temporal Order: Audiovisual Learning Transfers To Vision But Not Audition. PLoS One, 5: e11283. Bell H.A., & Munoz P.D., 2008. Activity In The Superior Colliculus Reflects Dynamic Interactions Between Voluntary And Involuntary Influences On Orienting Behaviour. European Journal of Neuroscience, vol. 28, pp. 1654-1660. Botvinick, M., & Cohen, J., 1998. Rubber Hands ‘Feel’ Touch That Eyes See. Nature, 391,756. Bushara, K.O., Hanakawa, T., Immisch, I., Toma, K., Kansaku, K., e Hallett, M., 2003. Neural Correlates Of Cross-modal Binding. Natural Neuroscience, 6: 190-195. Calvert, G.A., Hansen, P.C., Iversen, S.D. e Brammer, M.J, 2001. Detection Of Audiovisual Integration Sites In Humans By Application Of Electrophysiological Criteria To The BOLD Effect. Neuroimage, 14: 427-438. Delorme, A., & Makeig, S., 2004. EEGLAB: An Open Source Toolbox For Analysis Of Single-trial EEG Dynamics. Journal of Neuroscience Methods, 134:9-21. Ehrsson, H.H., 2007. The Experimental Induction Of Out-of-body Experiences. Sci59 ence, 317, 1048. Ehrsson, H.H., Spence, C., e Passingham, R.E., 2004. That’s My Hand! Activity In Premotor Cortex Reflects Feeling Of Ownership Of A Limb. Science, 305: 875-877. Engel, G.R., & Dougherty, W.G., 1971. Visual–auditory Distance Constancy. Nature, 234, 308. Foss-Feig, J.H., Kwakye, L.D., Cascio, C.J., Burnette, C.P., Kadivar, H., Stone, W.L., Wallace, M.T., 2010. An Extended Multisensory Temporal Binding Window In Autism Spectrum Disorders. Exp Brain Res, 203: 381-389. Fox, D.M., Snyder, Z.A., Vincent, L.J., Corbetta, M., Van Essen, C.D., e Raichle, E.M., 2005. The Human Brain Is Intrinsically Organized Into Dynamic, Anticorrelated Functional Networks. Proceedings Of The National Accademy Of Sciences, 9673-9678. Fox, M.D., Snyder A.Z., Vincent J.L., e Raichle M.E., 2007. Intrinsic Fluctuations Within Cortical Systems Account For Intertrial Variability In Human Behavior. Neuron 56(1):171–184. Giummarra, M.J., Georgiou-Karistianis, N., Nicholls, M.E.R., Gibson, S.J., e Bradshaw, J.L., 2010. The Phantom In The Mirror: A Modified Rubber-hand Illusion In Amputees And Normals. Perception, 39: 103-118. Goldring, J.E., Dorris, M.C., Corneil, B.D., Ballantyne, P.A., e Munoz, D.P., 1996. Combined Eye-head Gaze Shifts To Visual And Auditory Targets In Humans. Experimental Brain Research, 111: 68-78. 60 Hesselmann, G., Kell C.A., e Kleinschmidt, A., 2008. Ongoing Activity Fluctuations In hMT+ Bias The Perception Of Coherent Visual Motion. J Neurosci 28(53):14481– 14485. Hesselmann, G., Kell C.A., Eger, E., e Kleinschmidt, A., 2008. Spontaneous Local Variations In Ongoing Neural Activity Bias Perceptual Decisions. Proc Natl Acad Sci USA 105(31):10984–10989. Hubel, D.H., & Wiesel, T.N., 1963. Receptive Fields Of Cells In Striate Cortex Of Very Young, Visually Inperienced Kittens. Journal Of Neurophysioly, 26: 994-1002. Hubel, D.H., Wiesel, T.N., e LeVay, S., 1977. Plasticity Of Ocular Dominance Columns In Monkey Striate Cortex. Philosophical Transactions of the Royal Society B: Biological Sciences, 278: 377-409. Huber, G.C., & Crosby, E.C., 1993. A Phylogenetic Consideration Of The Optic Tectum. Proceedings Of The National Academy Of Sciences Of The U.S.A., 19: 15-22. Hweeling, L., & Uta, Noppeney, 2014. Music Expertise Shapes Audiovisual Temporal Integration Windows For Speech, Sinewave Speech, And Music. Frontiers In Psychology, 5: 868. Kanayama, N., Kimura, K., e Hiraki, K., 2015. Cortical EEG Components That Reflect Inverse Effectiveness During Visuotactile Integration Processing. Brain Res, 1598:1830. 61 Keil, J., Muller, N., Ihssen, N., e Weisz, N., 2011. On The Variability Of The McGurk Effect: Audiovisual Integration Depends On Prestimulus Brain States. Cerebral Cortex, 22: 221-231. Krauzlis J.R., Liston D., e Carello D.C., 2004. Target Selection And The Superior Colliculus: Goals, Choices And Hypotheses. Vision Research, 44: 1445-1451. Lakatos, P., Chen, C.M., O’Connell, M.N., Mills, A., e Schroeder, C.E., 2007. Neuronal Oscillations And Multisensory Interaction In Primary Auditory Cortex. Neuron, 53: 279-292. Maertens, M., & Pollmann, S., 2005. fMRI Reveals A Common Neural Substrate Of Illusory And Real Contours In V1 After Perceptual Learning. Journal Cognitive Of Neuroscience, 17: 1553-1564. Maximino, C., 2008. Evolutionary Changes In The Complexity Of The Tectum Of Nontetrapods: A Cladistic Approach. Plos One, 3: e385. McGurk, H., & MacDonald, J., 1976. Hearing Lips And Seeing Voices. Nature, 264: 746-8. Meredith A.M., 2002. On The Neural Basis For Multisensory Convergence: A Brief Overview. Cognitive Brain Research. 14, 31-40. Monto, S., Palva, S., Voipio, J., e Palva J.M., 2008. Very Slow EEG Fluctuations Predict The Dynamics Of Stimulus Detection And Oscillation Amplitudes In Humans. J Neurosci 28(33):8268–8272. Noesselt, T., Rieger, J.A., Schoenfeld, M.A., Kanowski, M., Hinrichs, H., Heinze, H.J., e Driver, J., 2007. Audio-visual Temporal Correspondence Modulates Multisensory Su62 perior Temporal Sulcus Plus Primary Sensory Cortices. Journal Of Neuroscience, 27(42): 11431-11441. Powers, R.A., Hevey, A.M., e Wallace, T.M., 2012. Neural Correlates Of Multisensory Perceptual Learning. Journal Of Neuroscience, 32(18): 6263-6274. Powers, R.A., Hillock, R.A., e Wallace, T.M., 2009. Perceptual Training Narrows The Temporal Window Of Multisensory Binding. Journal Of Neuroscience, 9(39):1226512274. Press, C., Heyes, C., Haggard, P., e Eimer, M., 2008. Visuotactile Learning And Body Representation: An ERP Study With Rubber Hands And Rubber Objects. J. Cognitive Neuroscience, 20: 312-323. Sadaghiani, S., Hesselmann, G., e Kleinschmidt, A., 2009. Distributed And Antagonistic Contributions Of Ongoing Activity Fluctuations To Auditory Stimulus Detection. J Neurosci 29(42):13410–13417. Stein, B.E., Spencer, R.F., e Edwards, S.B., 1983. Corticotectal And Corticothalamic Efferent Projections Of SIV Somatosensory Cortex In Cat. Journal Of Neurophisiology, 50: 896-909. Stein, E.B., & Meredith, M., 1993. The Merging Of The Senses. Cambridge, Mass., MIT Press. Stein, E.B., & Stanford, R.T., 2008. Multisensory Integration: Current Issues From The Perspective Of The Single Neuron. Nature Reviews Neuroscience, vol. 9, pp. 255-266 . 63 Stevenson, A.R., Wilson, M.M., Powers, A.R., e Wallace, T.M., 2013. The Effects Of Visual Training On Multisensory Temporal Processing. Exp Brain Res. 225(4), 479489. Szelag, E., Kowalska, J., Galkowski, T., Poppel, E., 2004. Temporal Processing Deficits In High-functioning Children With Autism. British Journal Of Psychology, 95: 269282. Tsakiris, M., 2010. My Body In The Brain: A Neurocognitive Model Of Bodyownership. Neuropsychologia, 48: 703-712. Tsakiris, M., Hesse, M.D., Boy, C., Haggard, P., e Fink, G.R., 2007. Neural Signatures Of Body Ownership: A Sensory Network For Bodily Self-consciousness. Cereb. Cortex, 17: 2235-2244. Tseng, H.H., Bossong, M.G., Modinos, G., Chen, K.M., McGuire, P., e Allen, P., 2015. A Systematic Review Of Multisensory Cognitive-affective Integration In Schizophrenia. Neuroscience & Biobehavioural Reviews. Yang, X.F., Bossmann, J., Schiffhauer, B., Jordan, M., e Immordino-Yang, M.H., 2013. Intrinsic Default Mode Network Connectivity Predicts Spontaneous Verbal Descriptions Of Autobiographical Memories During Social Processing. Frontiers In Psychology, 3: 592. Zampini, M., Guest, S., Shore, D.I., e Spence, C., 2005. Audio-visual Simultaneity Judgments. Perception & Psychophysics, 67 (3), 531-544. 64