La domanda più giusta sarebbe: “Perché vediamo ciò che vediamo? L’oggetto è esattamente come lo
vedo?” “Un insieme di molecole sospese nel nostro cervello ci permettono di “vedere” le superfici di oggetti
secondo parametri di luminosità e di colore che sono interpretazioni del nostro cervello.
Non siamo sicuri di come sia l’oggetto che vediamo e, soprattutto, c’è un solo modo in cui quell’oggetto
può essere? A queste domande, oggi, non possiamo rispondere e quindi limitiamoci a fare il punto su come
funziona il nostro occhio e su come otteniamo le immagini che sono così importanti per la nostra
sopravvivenza e per il nostro piacere.
L’occhio è l’organo di senso dell’uomo ,e non solo, che riceve continuamente
i segnali luminosi provenienti dall’ambiente esterno.
Il verbo ricevere è speso con attenzione in questo contesto perché
effettivamente le onde luminose, i fotoni, entrano continuamente nell’occhio.
Ma cosa accade nell’occhio e con quali sistemi rileviamo la luce, ricostruiamo
la singola immagine e il movimento nel suo complesso?
Il complesso sistema di ricezione del segnale luminoso è organizzato per
analizzarne alcune caratteristiche, sia sotto il profilo quantitativo che qualitativo,
con una certa frequenza dettata dalle capacità del sistema biochimico
denominato retina.
Approfondiamo il funzionamento della retina e della ricostruzione della realtà
che con essa otteniamo.
La retina è costituita da due tipi di fotorecettori: coni e bastoncelli.
I fotorecettori sono cellule che contengono pigmenti che subiscono
alterazioni biochimiche, causate dalle radiazioni luminose, che scatenano alla
loro estremità depolarizzazioni tali da generare variazioni elettriche che
viaggiano come onde all’interno delle cellule nervose.

I coni sono circa 6,3 milioni, sono localizzati nella parte centrale della retina, detta fovea, sono
sensibili a luci intense e per questo essi operano solo in condizione di pieno giorno. Poiché sono
in rapporto 1:1 con le cellule neuroniche, essi portano ogni singolo segnale ricevuto direttamente
al cervello. Riconoscono i colori grazie a tre tipi di proteine (opsine) sensibili a tre fasce diverse di
lunghezza d’onda. I coni, nell’uomo, sono specializzati nella
ricezione del rosso, del verde e del blu.
o I coni-S (short) hanno un picco di assorbimento di circa
430 nanometri e quindi sono sensibili al colore bluvioletto,
o I coni-M (medium) hanno un picco di assorbimento di
circa 530 nanometri e quindi sono sensibili al colore
verde
o I coni-L (Long) hanno un picco di assorbimento sui 570
nanometri e quindi sono sensibili al colore rosso
o Il colore fondamentale giallo non è rilevato ed esso
viene visto a fronte di una stimolazione elevata dei coni-M e dei coni-L ed in assenza di
stimolazione dei coni-S.

I
bastoncelli
sono
concentrati in tutte le altre parti della
retina e sono circa 120 milioni. Poiché
una moltitudine di bastoncelli confluisce
in un singolo interneurone, il segnale
che arriva al cervello corrisponde alla
somma dei segnali di più bastoncelli.
Per questo la visione notturna è in
bianco e nero e per questo i bastoncelli
continuano a lavorare efficientemente
anche quando le condizioni di luce non
permettono più ai coni di essere
efficienti. Chiaramente il fatto però che
più bastoncelli confluiscano nello
stesso interneurone comporta una
identificazione più approssimata della
fonte del segnale e quindi una visione notturna e periferica meno distinta.
I recettori sono disposti nella retina rivolti verso l'interno dell'occhio e non verso l'esterno: in questo
modo si evitano effetti di riflessione interna. Inoltre la membrana posta dietro alla retina, è ricca di
melanina che fa da superficie assorbente della radiazione luminosa mettendo fine alla corsa della
radiazione dopo che questa ha prodotto gli effetti desiderati nei coni e nei bastoncelli.
Il fotone causa una modifica temporanea della struttura molecolare della rodopsina posta sul fondo
della retina. Questo cambiamento, attraverso una serie di trasformazioni chimiche, innesca una
iperpolarizzazione del fotorecettore che modificherà la terminazione sinaptica del neurotrasmettitore.
Subito dopo tutte le componenti tornano ad una situazione di riposo depolarizzando il fotorecettore,
pronto a ricevere un nuovo fotone e quindi a segnalarlo attraverso una nuova iperpolarizzazione.
Le fibre del nervo ottico sono come cavetti rivestiti di mielina e sono un
vero e proprio prolungamento del nostro cervello.
Recenti studi avvalorano l'ipotesi che la retina sia il terminale del nostro
cervello composto da una serie di nodi o stazioni di filtraggio e decodifica.
Il processo di filtraggio può tradursi in diverse funzioni: trasformazione,
codifica, purificazione.
L’informazione luminosa infatti, da energia fisica(fotone) si trasforma in
energia chimica (rotazione quindi trasformazione della molecola di rodopsina) ed infine in energia
elettrica (ioni rilasciati lungo l'assone della cellule fotorecettore), gli ioni dall'assone del fotorecettore
raggiungono il primo livello e il secondo livello di cellule nervose (le ganglionari).
Il numero delle cellule, dalla retina al cervello, diminuisce e ad ogni livello di trasformazione e si
assiste ad una loro riduzione come in una struttura piramidale a gradoni, si pensi ad uno zigurat.
Ad ogni stazione di trasformazione sono presenti altre cellule, oltre a quelle entranti e a quelle uscenti,
che sono tutt’oggi oggetto di studio e che probabilmente concorrono a funzioni di filtraggio e di
ricostruzione.
La percezione visiva è quindi funzione dalla capacità di ricreare, esaminare e archiviare le immagini
nel cervello a partire dalle informazioni ricevute dall'occhio. La vista periferica è iper sensibile alla
variazione di luce sebbene non sia precisa nella rilevazione della fonte, cosa che determina una scarsa
ricostruzione delle forme. Quando un oggetto entra però nella vista
periferica si ha un movimento istintivo della testa e/o dell'occhio che
porta l'immagine nella fovea (la zona centrale della retina) dove
invece abbiamo la prevalenza di coni che permettono di “vedere”
colori e di distinguere bene le forme.
Qui a fianco la distribuzione dei coni per specializzazione di
colore nella fovea.
Come si vede vi è una netta prevalenza dei coni L e M, prossimi
nella rilevazione e quindi capaci di rilevare in modo fine sfumature di
rosso e di verde, rispetto alla presenza dei coni S che determinano i
colori freddi, combinati con l’M, la rilevazione del giallo.
Nel daltonismo si ha una alterazione nella presenza dei coni e
della loro specializzazione. Se un daltonico non distingue il verde dal
rosso è perché è privo dei coni M.
Visione e analisi
La ricostruzione dell’immagine, la sua analisi e archiviazione necessitano di un certo tempo.
Sia t tale tempo.
Il cervello riesce ad elaborare 24 immagini al secondo e quindi t = 1/24 di secondo.
Sappiamo che un film è una lunga sequenza di diapositive poste in una pizza di celluloide che scorre
davanti alla lampada alla velocità di 24 diapositive al secondo.
Ciò che noi vedremo sarà un film che a noi apparirà “completo” di tutte le proprie sequenze, mentre sarà
solo un elenco di fotografie ravvicinate, ma isolate.
Se le comparassimo attentamente vedremmo che gli attori, tra due fotogrammi adiacenti, si sono spostati
di scatto.
1
Mancano infatti tutti gli istanti intermedi .
2
Ad esempio i rapaci hanno la necessità di riuscire ad analizzare la realtà più frequentemente dell’essere
umano ed hanno una FFF pari a circa 70-80.
Per un rapace quindi osservare un film o la televisione progettata per gli esseri umani sarebbe di difficile
interpretazione perché vedrebbe una serie di diapositive in rapida successione, ma non abbastanza da
poterle interpretare come un movimento continuo.
Le libellule hanno una FFF di più di 300 eventi al secondo e il loro cervello è in grado di elaborare ad
altissima velocità queste informazioni. Per una libellula e per le mosche noi ci muoviamo quindi lentamente
tanto da riuscire ad evitare il nostro movimento di cattura.
Il Lodolaio e gli uccelli che si nutrono di insetti devono quindi avere una frequenza di analisi paragonabile
a quella delle loro prede.
Proviamo infine a pensare ad un volo in picchiata a 150 km/h per catturare un coniglio o un topo.
Convertiamo i Km/h in m/s e dividiamo per la FFF dell’uomo: 24 [150Km/h = 150.000/3.600m/s = 41,67m/s].
In picchiata verticale un uomo esaminerebbe un fotogramma ogni 1,7 metri, decisamente troppo per voler
vivere a lungo.
Torniamo al nostro occhio.
Cosa fa il nostro occhio ? riceve e trasmette la realtà, tutta.
E allora chi è che perde parte di questa realtà? Il cervello che deve ricevere, confrontare, riconoscere,
archiviare, pensare…
Come fa il cervello ad esempio a distinguere un pallone da basket da uno da calcio o da rugby?
Confronta l’immagine che vede con quella di un archivio di immagini già “certificate” dalla propria
esperienza passata e cerca l’abbinamento. Se lo trova riconosce l’oggetto, altrimenti lo cataloga come un
“ufo” e inizia ad indagare per conoscere meglio di che si tratta.
La stessa cosa avverrebbe se invece di vedere il pallone lo annusassimo o lo toccassimo. Ogni pallone,
in base al materiale usato, ha un proprio odore e una propria riconoscibilità tattile.
Definiamo allora come Continuo la realtà vista dal nostro occhio, che non pensa, e che si limita a far
passare tutta la luce per tutto il tempo.
Definiamo ora Discreto la realtà osservata coscientemente dal nostro cervello, quella elaborata
approssimativamente ogni ventiquattresimo di secondo.
Ecco, il cervello discretizza l’informazione, ovvero la digitalizza, isolando alcune immagini da tutte le altre
come se da una retta disegnata a matita ci divertissimo a cancellare parti di essa a intervalli regolari,
lasciandola espressa da una sequenza di punti isolati.
Operando in questo modo creeremmo dei vuoti, ma osservandola da lontano ne capiremmo comunque
l’andamento e osservandola sempre da più lontano i vuoti diverrebbero sempre meno significativi e l’insieme
dei tratti tenderebbe e riprendere la sembianza di una retta.
Certo oggi c’è chi crea i primi film in digitale ad alta velocità filmando 48 frames al secondo. Possiamo
anche proiettare dieci milioni di punti. L’effetto sarà di una maggiore definizione e di nitidezza dell’immagine,
ma tutto ciò deriva dal fatto che staremo utilizzando sistemi di rappresentazione più ricchi di quelli di cui
siamo dotati e quindi daremo una informazione più ricca al nostro cervello, rispetto a quella che esso è
capace di raccogliere ed analizzare.
In teoria, se facessimo tendere all’infinito la ricchezza dell’informazione (film girati fotografando centinaia
o migliaia di frames al secondo, immagini costituite da miliardi, triliardi di punti…) potremmo tendere di nuovo
a registrare la realtà con strumenti talmente raffinati e ricchi da rappresentarla quasi nella sua “continuità”,
ma allora sarebbe comunque l’uomo a digitalizzarne la rappresentazione filtrandola con i propri “limitati”
sistemi di analisi.
1
La pubblicità, e non solo, ha scoperto che tra un fotogramma ed il successivo è possibile far scorrere
altri fotogrammi che sono in grado di influenzare il soggetto che assiste alla proiezione delle immagini. Quei
fotogrammi (una bibita ad esempio) stimolano in modo inconscio la persona e ne influenzano il
comportamento. Si tratta di una messaggistica subliminale capace di passare all’insaputa del soggetto che
la subisce e di influenzare in modo inconsapevole la persona. Ciò dimostra che l’occhio vede per tutto il
tempo e che il cervello non è capace di guardare tutto quel che l’occhio vede. Al massimo rimangono tracce
al livello sub cosciente di ciò che transita sul nervo ottico tra i fotogrammi esaminati.
2
FFF Flicker Fusion Frequency che nell’uomo è pari a 24 fotogrammi al secondo.
Pensiamo ai mosaici e a come essi possano apparire diversamente ai nostri occhi, da vicino e da
lontano.
Pensiamo infine alla enorme differenza tra un pianoforte ed un violino. Tra due tasti adiacenti,
corrispondenti a due note, si ha un salto, mentre scorrendo l’archetto sulla corda del violino tra un DO e il RE
adiacente il suono varierà in maniera continua; non solo, anche l’emissione sarà diversa: mentre il pianoforte
emetterà una sequenza ravvicinata di note singole, il violinista potrà scorrere l’archetto continuamente sulle
corde senza mai staccarlo ed eseguendo quindi una lunga unica nota che varierà con continuità la propria
tonalità.