46 3. TRASFORMAZIONI COMPLESSE: LIVELLO CORTICALE 3.1 L’elaborazione talamica E’ conveniente segmentare il flusso dell’elaborazione dell’informazione in diversi stadi. I criteri adottati, tuttavia, non sono univoci e variano a seconda del livello di analisi che vogliamo ottenere. Come già accennato in precedenza, il principio che verrà abbracciato è prevalentemente di carattere funzionale. E’ quindi possibile operare una distinzione preliminare fra un primo stadio di input, contemporaneo livellamento di parte del rumore, estrazione delle variazioni di luminanza, ed una successiva elaborazione che porterà a combinare queste grandezze fondamentali, vale a dire incrementi e decrementi di illuminazione, in un sistema più complesso in grado di rendere l’organismo, in questo caso la rete artificiale, capace di interagire con profitto con l’ambiente. Come già detto, il modello opera delle ovvie semplificazioni della circuiteria neurale. In questa fase introdurremo un ulteriore stadio di elaborazione che riceve come input le efferenze dello strato di unità intermedie e, come vedremo in seguito, input di carattere diverso oltre che segnali di feed-back. Dal punto di vista anatomico, le strutture fondamentali che ci troveremo a modellare sono alcune cellule della corteccia visiva primaria (V1). Allo stato attuale della ricerca la trasformazione che avviene nell’interazione bipolari-amacrine-gangliari non è del tutto chiara, seppure almeno una nuova classe di cellule, le Y, sono presenti a questo livello. Tuttavia, non esistono grosse evidenze a favore di una profonda differenziazione fra cellule bipolari, gangliari e genicolate (Hubel e Wiesel, 1961): in tutti questi neuroni è presente un’organizzazione circolare del campo recettivo, con una separazione delle vie center-on ed off, come originariamente rilevato da Kuffler (Kuffler, 1953) e da Barlow (Barlow, 47 1953). Se ci basiamo su una modellistica prettamente funzionale, quindi, possiamo accattare una semplificazione di questi stadi. Nel modello un solo strato di neuroni artificiali, quelli intermedi, riassume alcune delle caratteristiche computazionali delle cellule bipolari, gangliari, genicolate ed annessi interneuroni. Viene tuttavia da chiedersi quale sia, allora, la funzione di alcune di queste formazioni. Il discorso si fa molto più intrigante per il nucleo genicolato laterale. Quest’ultimo riceve più connessioni dalla V1 che dalla stessa retina: le fibre che dalla V1 giungono al NGL sono quattro volte maggiori di quelle che da quest’ultimo si dipartono verso la corteccia (Sherman e Koch, 1986). E’ improbabile che questo nucleo funga da semplice stazione di ritrasmissione dell’informazione. Sarebbe stato alquanto antieconomico creare una struttura tanto complessa per una funzione che avrebbe potuto essere espletata da una semplice “estensione” dell’assone delle cellule gangliari fino alla V1. Il NGL sembra invece essere un sito importante di elaborazione dell’informazione visiva, sede di interazione fra segnali reticolari (arousal), feed-back corticali (V1) ed input retinici. E’ particolarmente importante notare che la trasformazione non appare implicare la modifica del campo recettivo, cosa che invece vedremo accadere a livello corticale. L’interazione deve avere qualche altro, notevole effetto. Una delle differenze fondamentali risiede nella presenza di forti segnali inibitori, mediati da interneuroni presenti nello stesso nucleo. Si potrebbe ipotizzare, quindi, che la massa di connessioni di feedback provenienti dall’area V1 abbia come scopo principale quello di “spegnere” l’input che giunge alla corteccia. Questa funzione potrebbe avere importanti proprietà, in quanto permetterebbe un maggior controllo delle afferenze. In questo modo l’unità corticale potrebbe ricevere una sorta di segnale codificato in “pacchetti di spike” piuttosto che un flusso continuo di potenziali, evitando che il segnale che arrivi al neurone sia costituito da una sorta di media dell’attività del nodo di input lungo un arco di tempo troppo ampio. 48 Quest’ipotesi potrebbe essere sostenibile. Va tuttavia rilevato che un risultato analogo potrebbe essere ottenuto mediante una più semplice ed economica inibizione ricorrente basata su interneuroni locali che operino analogamente al neurone corticale, ottenendo una simile funzionalità con costi notevolmente minori, senza la necessità di precise connessioni a feedback a lungo raggio. In questa tesi verrà abbracciata questa seconda ipotesi: mentre lo “spegnimento” dell’input è addebitato ad interazioni di carattere eminentemente locale, le afferenze che dallo strato 6 della V1 proiettano al NGL sono di segno prevalentemente eccitatorio. E’ noto dai dati neurofisiologici che i tempi di propagazioni dei potenziali dalle cellule dello strato 6 di V1 verso il talamo sono piuttosto lenti: le fibre amielinizzate necessitano dai 2 ai 20 o più msec per trasmettere il segnale al NGL (Tsumoto et al, 1978). Le connessioni sono inoltre molto selettive e retinotopicamente organizzate: le cellule corticali proiettano preferenzialmente agli stessi neuroni dai quali ricevono afferenze, evitando quindi che il segnale si propaghi ai neuroni contigui. La caratteristica di indirizzare proiezioni di feedback verso le aree di afferenza è una qualità formante di tutto il SN: la stessa V1 riceve proiezioni retinotopicamente organizzate dalle aree visive superiori alle quali è connessa. L’elaborazione di uno stadio è quindi influenzata dal risultato della “computazione” di quello successivo. Queste proprietà, vale a dire segnali di feed-back ritardati e connessioni selettive, potrebbero far pensare ad un meccanismo di riverberazione che coinvolga V1 e NGL. Questo concetto è spesso indicato come una delle caratteristiche che stanno alla base dei processi coscienti nel SNC (Llinàs 1988). In questo lavoro non tratteremo in dettaglio la dinamica temporale del modello, anche se il tema è indubbiamente affascinante. Lo faremo en passant, ma non raggiungeremo una profondità tale da farci apprezzare appieno il suo significato. Quale potrebbe essere, allora, la conseguenza 49 eminentemente computazionale di queste connessioni di feed-back? Come abbiamo visto dalle simulazioni, il modello è in grado di cogliere alcune proprietà della stimolazione, come i decrementi e gli incrementi di luminanza. Le superfici che giacciono all’interno ed all’esterno di questi, tuttavia, vengono pressoché ignorate dalle cellule bipolari: queste si dimostrano molto sensibili per i bordi degli oggetti, ma la loro codifica per le superfici uniformi risulta impoverita. Questo è il prezzo che si paga: un modulo elaborativo estrae informazione a scapito di altra informazione. Solo la cooperazione fra più stadi permette di mitigare questa perdita. Anche se, come abbiamo notato in precedenza, gran parte dell’informazione visiva rilevante è presente nei confini fra le superfici, un organismo incapace di cogliere e distinguere due oggetti in base alla quantità di illuminazione che riflettono risulterebbe enormemente deficitario in un contesto adattivo. Mentre l’illuminazione assoluta abbiamo visto essere una informazione trascurabile, la perdita completa dei valori di luminanza potrebbe avere effetti catastrofici. Vedremo come la corteccia sarà in grado di porre rimedio a questo deficit. Le funzioni del LGN possono essere quindi comprese in relazione al pattern di connessioni con V1 e, quindi, con l’organizzazione funzionale di quest’ultima. Mentre gli insetti, i crostacei, i rettili e gli uccelli sono in possesso di neuroni con proprietà di risposta piuttosto complesse fin dai primi stadi di elaborazione visiva, lo stesso non sembra valere per i mammiferi, dotati di un sistema visivo corticale altamente sviluppato. Se consideriamo come il successo evolutivo di quest’ultima specie sia indissolubilmente legato allo sviluppo esplosivo della neocorteccia lungo la filogenesi, uno studio della sua organizzazione, nel nostro caso dell’area visiva primaria, è indispensabile per una piena comprensione dei processi di elaborazione e trasformazione dell’input visivo. 50 3.2 Corteccia visiva primaria Il target principale delle proiezioni alla corteccia visiva primaria (area 17 di Brodmann, V1) è lo strato 4, anche se terminazioni sono presenti negli strati 1, 3 e 6 (Hubel & Wiesel 1972). Il pattern che lega V1 con le altre aree è invece più complesso. La rappresentazione del campo visivo è alquanto modificata nella corteccia, con un dilagare della superficie devoluta all’analisi del centro del CR. Questa osservazione è compatibile con l’esperienza, accessibile a chiunque, dell’impoverimento dell’analisi nelle zone più periferiche del campo visivo. La scoperta forse più importante fatta da Hubel e Wiesel nei loro studi pionieristici sulla V1 è quella che individuò la presenza di cellule selettive per pattern con uno specifico orientamento spaziale (Hubel & Wiesel 1959). Non solo: essi proposero anche come tali campi recettivi potessero venire formati attraverso l’organizzazione degli input talamici. La figura 38 esemplifica le loro idee. Fig. 38 Struttura del campo recettivo di un campione di cellule retiniche e del NGL (A1 e A2) e di cellule corticali semplici (B - F) con asse di orientamento verticale. X = zone eccitatorie, ∆ zone inibitorie. (Modificata da Hubel e Wiesel, 1962) 51 Sempre nelle loro prime ricerche, Hubel & Wiesel (1959, 1962) fecero notare come le cellule semplici a livello della V1 fossero non solo selettive per l’orientamento, ma in qualche modo fossero anche sensibili alla frequenza spaziale dello stimolo. Questa selettività è cruciale per comprendere quella notevole messe di ricerche che si sono succedute fino ad oggi al riguardo di una probabile codifica della stimolazione visiva attraverso una sua analisi in termini di frequenza spaziale. La funzione di sensibilità al contrasto (contrast sensitivity function , CSF, fig 39) evidenzia come il sistema visivo umano possieda una banda di frequenza preferenziale all’interno della quale la stimolazione è massimamente visibile. Mentre negli anni ’60 la CSF veniva spiegata ipotizzando un unico meccanismo alla base, che vedeva tutte le cellule gangliari in possesso di un profilo di sensitività riproducente la funzione, a partire dalla ricerca pionieristica di Campbell e Robson (Campbell & Robson 1968) si ebbe una vera e propria rivoluzione nella visione del problema. Questi autori suggerirono la presenza di una serie di canali indipendenti, ciascuno con una propria, ristretta sensibilità ad una data frequenza spaziale. La CSF sarebbe allora il risultato dell’attività combinata di questi canali indipendenti (fig 40B) come dimostrano gli esperimenti sull’adattamento selettivo. (fig 40A). Questa proposta incontrò notevole Fig 39 Curva di sensibilità al contrasto (CSF) misurata da Campbell e Robson utilizzando come stimoli delle griglie in bianco e nero con frequenza spaziale variabile (Campbell e Robson, 1968). 52 favore in quanto gettava le basi per una condivisione dei principi ispiratori di sistemi percettivi alquanto diversi come quello uditivo e visivo. Mentre per il primo ha senso una codifica dell’input in termini di frequenza temporale, data la natura ridondante della stimolazione acustica, il perché il sistema visivo debba comportarsi analogamente non è del tutto evidente in prima analisi. Fig 40 A. CSF misurata prima (linea piena) ed in seguito (punti) ad adattamento ad una griglia di frequenza spaziale pari a 10 c/deg (cicli per grado di angolo visivo). B. Modello schematico del funzionamento dei canali sensibili a diverse frequenze spaziali (De Valois e De Valois, 1988). Tre canali (A, B e C) sono qui raffigurati. X ed y sono due stimoli con diversa frequenza spaziale. Una volta che il canale B viene adattato e la sua sensibilità diventa B’, il rapporto fra i due stimoli risulta alterato. prima analisi. Che cosa intendevano essenzialmente Campbell e Robson con il termine canale? In generale, ci si riferisce a questo come ad un meccanismo capace di filtrare l’informazione, nel caso specifico una frequenza spaziale, a scapito di altra informazione. Il sistema proposto da questi ricercatori, quindi, suggerisce che ogni data localizzazione spaziale venga analizzata in parallelo da un certo numero di canali, ciascuno con una sensibilità preferenziale (ma non esclusiva) ad una data frequenza (vale a dire, capace di rilevare energia a quella data frequenza). Se, allora, una data immagine può essere codificata in termini della somma indipendente dell’attivazione 53 di questi singoli canali, il sistema visivo potrebbe in realtà portare a termine qualcosa di simile ad un’analisi di Fourier dello stimolo. Baron Jean Fourier, nel 1822, dimostrò come un’onda periodica di qualsivoglia complessità possa essere decomposta nella somma di una serie di onde più semplici e con una frequenza specificata (fig 41). Fig 41 Trasformazione di Fourier. Qualsiasi onda può essere scomposta (o sintetizzata da) un numero arbitrario di onde con diversa frequenza, ampiezza e fase. L’onda raffigurata in alto, quindi, può essere ottenuta sia sommando linearmente le tre onde in A che un numero maggiore di onde, come in B.(Adattato da De Valois De Valois, 1988). Non è negli obiettivi di questa tesi entrare nei dettagli della teoria e delle sue implicazioni. E’ sufficiente rilevare come il concetto di un sistema visivo considerato come equivalente ad un “decompositore” di frequenze spaziali complesse in frequenze più semplici è alquanto popolare e supportata da una notevole mole di dati empirici (per una rassegna, vedere De Valois & De Valois, 1988). Che vantaggi potrebbe trarre un sistema visivo nel portare a termine un’analisi di questo tipo? Mentre una certa regolarità è presente nella stimolazione acustica, con un relativo vantaggio di un sistema recettivo in grado di rilevarla, si può forse dire altrettanto per quella visiva? Per rispondere a questa domanda non è necessaria una riflessione approfondita. E’ sufficiente che fissi la struttura regolare della 54 tastiera del computer sul quale sto scrivendo, o guardi fuori da una delle tante finestre ugualmente spaziate dell’edificio in cui mi trovo, o volti lo sguardo verso la mia destra, dove si trovano dozzine di scaffali ordinati contenenti centinaia di libri regolarmente disposti. Oppure osservi il soffitto, costellato di decine di luci al neon distanziate circa tre metri l’una dall’altra in un soffitto a quadri regolari. O, semplicemente, basta guardare la maglia che indosso, tessuta con una trama sottile di righe verticali parallele, come i miei jeans. Si potrebbe obiettare che queste regolarità non siano molto significative dal punto di vista evoluzionistico, in quanto il nostro sistema visivo si è sviluppato di gran lunga prima dell’avvento della moderna carpenteria e degli stilisti di grido. Va tuttavia rilevato che, se l’uomo è così tanto attratto dalle strutture simmetriche e periodiche da costruirle con incredibile perseveranza, ci sarà pure qualche motivo. Fig 42 A sinistra è rappresentata la CSF rivista secondo l’interpretazione di Campbell. La curva è una “composizione” di curve più finemente orientate verso una frequenza spaziale preferenziale. A destra vengono confrontate due visioni di come la funzione possa essere generata: ogni cellula ha una curva di sensibilità uguale alla CSF (sinistra); alternativamente, ogni zona del CR è analizzata in parallelo da più canali con diversa sensibilità (destra). (Adattato da De Valois De Valois, 1988). Ma accogliamo l’obiezione per buona e volgiamo la nostra attenzione al mondo fisico e biologico. Quella minoranza degli uomini che vive ancor oggi a stretto contatto con la natura non incontrerà meno strutture periodiche dei cugini civilizzati. Gli alberi di una foresta, le foglie 55 di un ramo, i fili d’erba in un prato: tutte strutture che presentano alta simmetria e ridondanza. Alla base di tali entità giacciono delle costrizioni di carattere fisico e biologico. Per esempio, gli alberi di un bosco tenderanno a spaziarsi regolarmente: se un albero crescesse troppo vicino ad un altro, ne sarebbe oscurato; se fosse troppo lontano perderebbe il riparo dal vento offerto dal primo e permetterebbe ad un'altra pianta di crescere e rubargli spazio e risorse. Ecco allora che esiste una distanza preferenziale che massimizzi l’adattamento dei due alberi. Altrettanto si può dire per molti altri organismi biologici. Anche molti animali presentano delle strutture periodiche nella loro pelle, come zebre, tigri, molti pesci, uccelli, rettili, insetti. Tali strutture altamente simmetriche e periodiche, evolute a scopo prevalentemente mimetico, non avrebbero senso in un ambiente che non presentasse queste caratteristiche. Nello stesso dominio fisico è possibile riscontrare una simile periodicità, come nella struttura dei cristalli, della neve, nella regolare increspatura del mare e dei laghi, nella forma delle rocce, nella loro stratificazione regolare. Nei cristalli, per esempio, le forze che governano le relazioni reciproche fra gli atomi li fanno oscillare attorno ad una posizione di equilibrio, come se fossero mutuamente legati da delle fasce elastiche. La posizione di equilibrio dei queste particelle rende conto della struttura altamente ripetitiva e simmetrica di questi materiali. Il concetto di simmetria ha da sempre affascinato filosofi, matematici e fisici, alla ricerca delle ragioni per cui il mondo fisico, così come quello biologico, presentino tale organizzazione. Ad esempio, il matematico Hermann Weil, nel suo libro “Symmetry” (Weil 1952), analizza come la simmetria dell’organizzazione della materia sia una caratteristica pervasiva del nostro universo, fisico e biologico. Quindi si può affermare a ragion veduta che la periodicità è la regola, non l’eccezione del mondo percettivo. Laddove vi sia una periodicità spaziale, allora l’informazione visiva può essere più velocemente ed economicamente codificata in termini di frequenza piuttosto che da una 56 57 58 costosa analisi punto a punto dell’ambiente. Viene da chiedersi a questo punto se l’esistenza di meccanismi biologici per la codifica di questa informazione siano alla base della percezione delle strutture simmetriche o, viceversa, sia questa simmetria che ha facilitato, da un punto di vista adattivo, lo sviluppo di organismi in grado di cogliere questa basilare proprietà del mondo fisico. Il classico problema dell’uovo e della gallina, insomma. Si può dire che, qualunque sia la risposta, le strutture simmetriche sono altamente gradite al nostro sistema visivo e sono state in grado di fare evolvere con profitto le specie in possesso di facoltà in grado di rilevarle. Con buona pace di tutte le altre proprietà del mondo fisico che non siamo in grado di percepire. Sappiamo dagli esperimenti di adattamento selettivo ad una certa frequenza spaziale (Blakemore & Campbell, 1968) come sia probabile l’esistenza di canali relativamente indipendenti per la codifica della frequenza dello stimolo. La risposta ad un dato input, inoltre, vede la partecipazione parallela di tutti questi canali, come evidenziato dai risultati ottenuti da Blakemore e Sutton (Blakemore & Sutton, 1969). Nella figura 40 si vede come la percezione di griglie con medesima frequenza e contrasto venga alterata dall’adattamento selettivo ad una certa frequenza spaziale. L'aftereffect in questione potrebbe essere spiegato ipotizzando il venir meno del contributo del canale adattato. Se la percezione delle griglie è una funzione complessiva dell’attivazione di questi canali, ecco che laddove sia stato adattato il canale sensibile alle basse frequenze spaziali la percezione della griglia “propenderà” per le alte frequenze, in quanto determinata in gran parte dai canali integri. Il concetto di analisi delle frequenze spaziali sembra essere in parziale dissonanza con la classica visione tipica dello Human Information Processing e della neurobiologia che assume una precoce codifica dell’informazione spaziale in termini di primitive quali bordi, segmenti con un certo orientamento, angoli, ed una successiva combinazione gerarchicamente organizzata di queste grandezze. In realtà, sembra che