La presentazione perfetta Ovvero una riflessione sul cervello Di Matteo Temporin Di cosa parla questa presentazione • Questa presentazione parla del trasferimento di informazioni e di concetti neuroscientifici usando le neuroscienze come modello di spiegazione • Vuole dimostrare come il cervello sia determinato dal ruolo sociale del corpo che coordina • Tutto si spiega in termini di riduzione dell’energia necessaria alla soddisfazione di bisogni esistenziali degli individui in una comunità • Per fare questa presentazione ho usato un metodo che ho chiamato delle «post-ontologie», che non so spiegare a me stesso, figurarsi a voi… Chi sono • Matteo Temporin • Mi sono laureato in matematica nel 1980 e in informatica nel 1985 • Ho fatto e faccio il programmatore, l’analista programmatore e l’analista funzionale di progetti informatici che frequentemente usano motori di calcolo matematici e statistici nei settori applicativi della finanza, della elaborazione di immagini mediche, del credito ecc… • Insegno a contratto dal 1993 Informatica all’Università Cattolica di Milano. Ho insegnato «Sistemi e metodi per la gestione della conoscenza» (Machine Learning) per alcuni anni • Mi interesso di intelligenza artificiale da sempre applicandola dove ho potuto: dalle reti neurali nella finanza ai modelli ad agenti negli aeroporti • Da cinque anni mi interesso di modelli comportamentali nel gioco d’azzardo patologico • Pubblicazioni (poche): vedi google scholar Spiegare • • • • • • • • Se devo spiegare qualcosa lo faccio usando i miei e altrui organi di senso e supponendo che le capacità di assegnare significato a questi segni sia comune La semantica di una regola è la realizzazione della regola su di un substrato fisico Problema: perché sensi e capacità semantiche sono comuni? Risposta normale: perché siamo della stessa specie. Sbagliato! perché la struttura fine (connectoma) degli organi di senso e di elaborazione dei significati è troppo complessa per essere geneticamente determinata Risposta cognitiva: il corredo genetico ci fornisce una struttura intelligente, il corpo ed il cervello in esso, in grado di apprendere dall’ambiente, inducendo regole nuove e deducendo da queste regole secondarie ecc… Sbagliato! Il problema è logico/informatico, perché la semantica di un programma genetico è determinata dal contesto in cui si attua, il corpo nel suo ambiente nel passato, ma un nuovo comportamento complesso non era in quel passato… In altre parole un individuo dovrebbe avere maggiori capacità da giovane, la induzione, rispetto a quanto gli serve da vecchio, la deduzione Conclusioni • • • Occorrerebbe una macchina geneticamente determinata in grado di produrre programmi comportamentali, ma questo non è possibile (Turing) perché la creazione di nuovi linguaggi di regole per nuovi substrati non è possibile scriverla come regola, a meno di non creare regole e substrati isomorfi ai precedenti (come quando si passa dal linguaggio verbale ad un altro o a quello dei segni) Risposta giusta: i comportamenti nuovi basate su regole complesse sono creati casualmente in una collettività di individui per variazioni successive dei substrati fisici comuni (anche genetici) e nel nostro cervello abbiamo organi geneticamente determinati per riceverli (adattamento), per usarli (assimilazione), diffonderli e conservarli con piccole variazioni Conclusioni delle conclusioni (il mio messaggio in una bottiglia al mondo): gli adattamenti semantici non sono stabili e la macchina risultante può fallire singolarmente (patologie comportamentali) o collettivamente (scomparsa di una popolazione o di una specie). Partiamo da chi apprezza i fiori UN ESEMPIO DI PRESENTAZIONE Come un’ape Ai, Hiroyuki. "Sensors and Sensory Processing for Airborne Vibrations in Silk Moths and Honeybees." Sensors 1 3.7 (2013): 9344-9363. Come un’ape La integrazione Il modello (ma come si crea nella muta da larva ad ape?) Ipotesi (scientificamente falsificabile (forse)) • Un’ape che non cresca in un ambiente collettivo in cui altre api le indichino come raggiungere il polline con il meccanismo delle vibrazioni in volo non è in grado di usare o trasmettere queste informazioni • Lo stesso vale anche per questa presentazione, cioè se non avessimo acquisito collettivamente un linguaggio comune e creato un substrato per la sua esecuzione (il pensiero scientifico) non sarebbe possibile usare o trasmettere questa ipotesi Le regole del gioco (o quasi) IL METODO SCIENTIFICO Metaphysical in nature • Popper’s view of science is of course not falsifiable, it is thus metaphysical in nature. • But Popper differs from the positivists in that he does not consider metaphysics to be necessarily a bad thing, on the contrary. • When Darwin proposed his theory of evolution it was a metaphysical theory really, a suggestion as how order can arise out of chaos without the intervention of a designing intellect. This metaphysical idea has transformed the science of biology. With the advent of Mendel, which indicated a more specific mechanism for inheritance, Darwinism became more scientific, as it could start formulating more of its theories in a testable way. • Still there are many questions as to Darwinism which we are as of yet unable to handle scientifically. • Ulf Persson Review a: Popper, Karl. The logic of scientific discovery. Routledge, 2014. Ipotesi scientificamente falsificabile (o quasi) • • • • • Anche il metodo scientifico è falsificabile, cioè non è metafisico, perché corrisponde ad un principio di riduzione dell’energia libera necessaria alla spiegazione del mondo In altre parole l’utilizzo del principio di falsificabilità è la stessa cosa che dire che la regola scoperta deve valere anche per gli altri uomini in cui una parte (gli scienziati) si concentrano sul verificarla (falsificarla) e tutti gli altri sono liberi di utilizzarla nel frattempo Gli scambi energetici, stipendi e prestigio, tra questi due gruppi si adattano alle necessità biologiche, psichiche e sociali degli esseri umani Possono esistere e sono esistiti altri metodi di relazione sociale specializzata (es. caste sacerdotali) nella spiegazione del tutto, il metodo scientifico è uno di questi. Se si verifica scientificamente che è il più efficace sul lungo periodo allora è anche scientificamente provato. In questa luce potremo capire, scientificamente, le resistenze economiche e sociali alla sua introduzione. Ad esempio il problema che le regole possono essere scientificamente riviste può creare problemi economici sul breve termine. Un modello che va per la maggiore L’ENERGIA LIBERA DI FRISTON Friston, Karl. "The free-energy principle: a unified brain theory?." Nature Reviews Neuroscience 11.2 (2010): 127-138. Un esempio Il modello base Cosa è il principio della minimizzazione dell’energia libera? (scusate la matematica, ma mi serve nel seguito) Modello Generativo >0 per San Gibbs information divergence Ipotesi scientificamente falsificabile (probabilmente) • • • • Il modello a minimizzazione dell’energia libera di Karl Friston, sebbene sia fondamentale, non è in grado di produrre un modello comportamentale come quello della danza di un’ape. Incontrerebbe troppi minimi locali sul cammino, qualsiasi sia il modello generativo «m» tentato. Solo il cambiamento di substrato da cervello individuale a collettivo, da epigenetica individuale a genetica della specie può permettere il concorrente sviluppo del sistema di comunicazione e il suo utilizzo Troppe opportunità ambientali, ontogenetiche e filogenetiche di più specie (api e fiori) devono essere sfruttate per ottenere una riduzione dell’energia libera come quella ottenuta dalla comunicazione del percorso delle api In ogni caso il sistema sensomotorio delle api entra simmetricamente nella ottimizzazione e i gradi di libertà dei due modelli esplodono (come in ogni comunicazione, anche questa). Insomma un programma (il modello di minimazzazione dell’energia libera) non può creare altri programmi diversi da esso e funzionanti per qualche altro scopo utile Un problema aperto L’ADATTAMENTO E L’ASSIMILAZIONE DI PIAGET E KAHNEMANN Daniel Kahneman: Thinking, Fast and Slow • Any time you have to make sense of something, your mind applies two systems to the question at hand. The first is “System 1,” or the mental processing that reads emotions and handles your automatic skills, like driving your car or adding two plus two. • System1 takes over your thinking when you comprehend simple statements. System 1 supplies associated meanings (including stereotypes) rapidly and involuntarily. • By contrast, you use “System 2” when you’re focusing on specific details, like counting or figuring out how to complete your income tax forms. System 2 applies effort consciously, such as when you do complicated math, try new physical activities or search for a specific person in a crowd. • System 2 thinking is slower, but you need it for methodical thinking processes such as formal logic. • (dal getabstract del libro) Jean Piaget :The development of thought: Equilibration of cognitive structures. • In the process of assimilation, intellectual activities have to structuralize empirical materials from the external world and integrate them into the pre-existing schema or intellectual structure. • In the process of accommodation, intellectual activities have to change the structure of schema constantly to adapt to the new environment. • The operation of these two mechanisms is a bi-directional dialectical process—only when assimilation and accommodation reach equilibrium and the structure or schema of intelligence becomes a steady system, will the process of adaptation be completed. • Tratto da : Hwang, Kwang-Kuo. "The mandala model of self." Psychological Studies 56.4 (2011): 329-334. Ipotesi scientificamente falsificabile (facilmente) • • • In termini scientifici la teoria dei due sistemi di Kahnemann è molto simile senza riconoscimento del contributo di Piaget (non vi è neppure una citazione di Piaget nel libro di Kahnemann) Del resto Massimo Piattelli-Palmarini in "Ever since language and learning: Afterthoughts on the Piaget-Chomsky debate." Cognition on Cognition (1995): 361-392. A pag 383 diceva: Many of typical experiment à la Tversky and Kahneman replicate exactly the qualitative results obtained by Piaget and his collaborators on children. The simple secrets is to change the domain. Del resto è scusabile perche come scrive Pierre Barrouillet in "Dual-process theories and cognitive development: Advances and challenges." Developmental Review 31.2 (2011): 79-85: Dual processing accounts of reasoning, judgment, and social cognition are so abundant in the literature that Evans (vedi tabella nella slide successiva) judged the task of drawing some coherent overview of this topic to be complex and challenging. Tanti modi diversi di dire le stesse cose (oltre a Piaget non citato) Evans, J. St. B. T. (2008). Dual processing accounts of reasoning, judgment and social cognition. Annual Review of Psychology, 59, 255–278. Cosa succede alle scienze cognitive? • • • • • • • Il problema è che il contesto delle sperimentazioni parte da ipotesi leggermente diverse di come siano in realtà i due processi, non sui risultati, che dovrebbero essere utilizzati da tutti (se riproducibili) La comunità scientifica non si è neppure accordata sul nome da dare a questi fenomeni, seppur essi siano riproducibili Lo fa perché ognuno cerca di proporre un proprio linguaggio Si tratta di un risultato sperimentale sulla scienza come fenomeno sociale di ricerca di una energia libera minima locale favorendo i singoli individui, a scapito di una ottimizzazione globale che favorirebbe la conoscenza di tutti gli individui della nostra specie su un tema così importante come la cognizione Potremmo parlare della scienza reale come di un sistema 3, o dei limiti del sistema 2, o di post-ontologie, come ho proposto io per ovvi motivi … marketing? Date anche voi un nome al prossimo livello! L’importante è che capiamo cosa sia ( a me interessava l’aspetto di molteplice riflessione della «cosa» su se stessa sia in termini individuali che sociali) Una spiegazione IL LINGUAGGIO SOCIALE DELL’ADATTAMENTO: L’ENERGIA Alcune banalità • Il principale problema di un organismo è l’assorbimento dell’energia libera (lavoro disponibile rispetto agli equilibri termodinamici di fondo nel mondo) necessaria all’equilibrio dei suoi cicli biologici, la sua struttura, la sua modalità di modifica del mondo per catturare in esso l’energia libera necessaria a mantenere nel tempo questa modalità • L’energia libera tende a diminuire per il secondo principio della termodinamica, una volta consumata non possiamo recuperarla, il processo è irreversibile, la freccia del tempo ecc… • Inoltre questa quantità di energia libera deve essere la minima necessaria, perché altrimenti dobbiamo aumentare la complessità della struttura del singolo individuo per gestirla/dominarla, della singola cellula, del singolo organismo pluricellulare, o della popolazione di individui che condivide la medesima struttura informativa di definizione della struttura Altre banalità • Il problema affrontato dal cervello negli organismi viventi è proprio quello di un cambiamento della struttura funzionale senza una modifica dei cicli biologici, una modifica del software durante la vita dell’individuo senza una modifica dell’hardware. • In altre parole un flessibile sistema di regolazione dell’energia libera necessaria alla struttura sottostante, che viene resa il più stabile possibile • Il cervello non nasce per produrre sistemi cognitivi di assimilazione, che elaborano, come potrebbe fare un aggregato di cellule muscolari da cui le cellule neuronali derivano ontogeneticamente, dati secondo un programma prestabilito, ma per consentire processi di accomodamento direbbe Piaget, di adattamento dei processi di assimilazione Ipotesi scientificamente falsificabile • • • • I processi di accomodamento dei sistemi di assimilazione non servono al singolo individuo, esso li subisce e ad essi deve resistere perché sono rischiosi per la sua stabilità strutturale, ma servono alla struttura più ampia di gestione dell’energia libera nella popolazione a cui appartiene l’individuo e che, se la struttura funziona, ne trae dei benefici indirettamente Un cervello adatto all’adattamento deve essere più ampio perché deve poter comunicare con i cervelli degli altri individui indirettamente. Lo svezzamento è la fase in cui questo adattamento viene effettuato. In questa fase i cervelli del neonato e del caregiver sono biologicamente sincronizzati per poter trasmettere quelle informazioni strutturali che non potevano geneticamente essere trasmesse In modo complesso, ma linguistico, queste informazioni strutturali sono trasmesse attraverso un unico atomo significante: la sorpresa informativa Altra ipotesi • • • La sorpresa informativa trasmessa da un caregiver all’oggetto di cure ha un minimo quando il suo cervello ha la medesima struttura di quella del caregiver in presenza dei medesimi contesti sensomotori ed ambientali che sono la struttura di gestione dell’energia libera che, alla fine del processo, viene condivisa Il linguaggio, prototipo di tutti i linguaggi, di trasmissione ed esecuzione dell’adattamento è fatto da parti significanti indipendenti ai due, di esplorazione casuale della realtà, e da un unico segno trasmesso che produce in quel contesto il medesimo effetto cerebrale ai due: la sorpresa, ma che solo a uno dei due cambia, in strutture cerebrali specifiche che vedremo, dall’interno, i processi di assimilazione Solo nella fase di svezzamento i processi di adattamento funzionano per tutti i vertebrati e solo negli animali più evoluti prosegue, in parte, per tutta la vita. Questo per consentire lo sviluppo di nuove strutture di gestione dell’energia libera nelle diverse popolazioni a cui apparterrà l’individuo per ragioni di durata della vita e di sovra-strutturazione sociale. Sempre però ricorrendo ai medesimi meccanismi di trasmissione della sorpresa informativa associati a segni o suoni La soluzione di Friston • • • • • • In un recente articolo in via di pubblicazione Karl Friston affronta il tema della comunicazione tra individui. (Friston, Karl, Frith, Christopher, A Duet for one, Consciousness and Cognition, in press) In esso si fa ad esempio il caso di due uccelli che si scambiano canti articolati Nella nostra ipotesi si tratta di due strutture che comunicano per assimilazione, sono in grado di farlo perché già adattate allo scopo Con questo non voglio dire che si tratti di una comunicazione noiosa, priva di sorpresa, ma che essa in un certo senso era prevista e che quello che veramente conta è come gli uccelli ottengano questa complessa capacità Si veda ad esempio il limite di una spiegazione genetica dei comportamenti nelle popolazioni in Stamps, Judy. "Behavioural processes affecting development: Tinbergen's fourth question comes of age." Animal Behaviour 66.1 (2003): 1-13. Insomma è necessario un salto concettuale che porta alla comprensione degli aspetti profondi dell’adattamento, che sono essenzialmente sociali La casualità al servizio dell’intelligenza IL RESERVOIR COMPUTING Il modello di apprendimento del reservoir computing LukoševiΔius, Mantas. "A practical guide to applying echo state networks." Neural Networks: Tricks of the Trade. Springer Berlin Heidelberg, 2012. 659-686 Qualche dettaglio • • • • I neuroni del reservoir x sono connessi in modo casuale tra loro e con gli input. La dinamica nel tempo del reservoir assomiglia ad un eco (Echo State Network) che si trasmette tra i neuroni e permette di classificare segnali variabili Solo i pesi di output vengono cambiati permettendo l’uso di tecniche lineari di apprendimento (ridge regression) Gli studi sul Reservoir Computing hanno una generale capacità di calcolo attraverso la dimostrazione della loro equivalenza ad una macchina di Turing. Vedi Maass, Wolfgang, Thomas Natschläger, and Henry Markram. "Real-time computing without stable states: A new framework for neural computation based on perturbations." Neural computation 14.11 (2002): 2531-2560. L’approccio di trasformazione funzionale basato sulle trasformate di Fourier (vedi prossimo capitolo) e quello di integrazione dei valori dei nodi del reservoir sembrano equivalenti da un punto di vista di capacità computazionale e in termini matematici e strutturali e quindi come capacità di produrre un output con le medesime capacità rappresentative. Come la matematica chiuda i cerchi LE TRASFORMATE DI FOURIER Cosa sono? • • • • Le trasformate di Fourier trasformano una funzione in una serie di coefficienti. Potremmo dire che trasformano un processo in un programma, cioè in una serie di parametri che rappresentano in modo statico tutte le possibili realizzazioni dinamiche del processo basato su quel programma. Ad esempio quando noi diciamo che una musica è fatta da note di una certa durata, uno spartito, stiamo dando una trasformata di Fourier della musica che udiamo nel tempo Lo stesso metodo lo possiamo utilizzare scomponendo in parti con un certo peso, in processi di calcolo semplici, un processo di calcolo combinatorico qualsiasi. Si chiamano trasformate di Fourier sul cubo booleano e i processi di calcolo elementari sono funzioni di parità degli input (una base ortogonale). Il metodo ha ricevuto molta attenzione perché pochi coefficienti possono rappresentare (statisticamente) fenomeni complessi e questi pochi coefficienti significativi si possono ottenere non esaminando tutti i casi, metodi sublineari. La cosa è fondamentale sui big data che hanno miliardi di record con migliaia di campi Definizione • • Il coefficiente della trasformata di Fourier della funzione f su S (gli input della funzione di parità ππ ) sarà: π π = π, ππ = Ε(π β ππ ) Dove il prodotto interno vale, per definizione, la media dei valori del normale prodotto tra i risultati delle due funzioni su tutte le combinazioni degli ingressi cioè: π, π = 1/2π π(π₯) β π(π₯) = Ε(π β π) π₯π 0,1 π • E quindi π π = 1/2π π(π₯) β ππ (π₯) π₯π 0,1 π • Una qualsiasi funzione booleana f è allora esprimibile come la sommatoria su tutti i possibili sottoinsiemi S dei risultati della funzione parità moltiplicati per il coefficiente di Fourier relativo: π(π₯) = π π β ππ (π₯) π O'Donnell, Ryan. Analysis of boolean functions. Cambridge University Press, 2014 Teorema di Temporin (sic!) • • • Le Rappresentazioni Funzionali sono l’insieme dei coefficienti di Fourier della funzione π(π₯) che rappresenta la frequenza di apparizione di x in input al blocco funzionale BF. In questo caso possiamo dimostrare che la π π può essere ottenuta sommando ogni volta che abbiamo in input x il termine 1 π‘π π₯ = π . ππ (π₯) 2 Il contributo dato a π π da tutte le π(π₯) volte che compare x sarà 1 ππ π₯ = π π₯ . π . ππ (π₯) 2 In questo modo il coefficiente della trasformata di Fourier 1 π′ π = ππ π₯ = π π₯ . π . ππ (π₯) 2 π π π₯π 0,1 • π₯π 0,1 Ma questa è proprio la trasformata di Fourier della funzione frequenza di x: 1 π′ π = . π π₯ . ππ (π₯) π 2 π π₯π 0,1 π′ π = 1 2π π π₯ . ππ (π₯) = π π π₯π 0,1 π Ipotesi scientificamente falsificabile (spero di no!) • Nel cervello si ottengono delle distribuzioni di probabilità degli input sensoriali che possono essere utilizzate per elaborare le formule di Friston e ottimizzare facilmente i parametri del modello generativo • L’ipotesi è che una estrazione casuale di basi anche non ortogonali di trasformazione come quelle del reservoir possano essere facilmente integrate per ottenere una sintetica ed efficiente rappresentazione della dinamica delle cortecce sensomotorie ed emotive • Le distribuzioni di probabilità sono la base dei calcoli della sorpresa che vengono fatte nei gangli di base con l’aiuto dell’ippocampo • Queste stesse distribuzioni di probabilità vengono rappresentate in modo da condividerle con altri individui ottenendo nuovi schemi di riduzione dell’energia libera a livello di popolazioni Hic sunt leones • Il resto della presentazione è basato sulla ipotesi precedente, quindi non cito i risultati neuroscientifici che secondo me la avvalorano, perché il processo più importante è l’opposto: cercare i risultati neuroscientifici che la smentiscono • Il difetto fondamentale delle neuroscienze, a mio parere, è quello di cercare e citare conferme, quando si dovrebbero cercare risultati falsificanti • Se continuano così le neuroscienze corrono lo stesso rischio delle scienze cognitive: diventare obese di risultati quasi simili, non in netto contrasto, e quindi non reciprocamente falsificabili • Da parte mia continuerò a cercare smentite, ho consultato centinaia di pubblicazioni che mi hanno consentito di smentire i modelli precedenti, per migliorare il modello, ma non essendo uno specialista, a questo punto, da solo non ho molte speranze… Una ipotesi per capirci qualcosa LA RAPPRESENTAZIONE FUNZIONALE DELL’ENERGIA Cosa è • Se l’obiettivo dell’assimilazione è la riduzione della quantità di energia libera necessaria al suo equilibrio strutturale è necessario che essa venga informativamente calcolata per poter essere minimizzata dai processi di accomodamento, per ottenere un adattamento dei processi di assimilazione • Abbiamo chiamato questo risultato Rappresentazione Funzionale (RF) ed è in pratica la trasformazione della distribuzione di probabilità dei contesti sensoriali rilevanti, cioè non assimilati attraverso una azione che li riduca • Queste configurazioni sensoriali rilevanti, che essendo rilevanti per la sopravvivenza dell’organismo sono una rappresentazione della sua «non adeguatezza», sono quindi una misura dell’energia libera in eccesso associata a comportamenti in cui l’assimilazione non ha avuto successo e alla loro frequenza Come si ottiene con Reservoir Computing u(t) π x(t) ππ₯ = π₯(π‘) ππ‘ = πΉπ₯ π· π π‘=0 y(t) Dove D(U) è la distribuzione di probabilità delle traiettorie U dell’input u(t), una descrizione funzionale indipendente dal tempo, dopo un periodo di utilizzo significativo T del blocco funzionale. In rosa abbiamo messo i pesi oggetto di apprendimento, le azioni y(t) che riducono gli input. Come si gestiscono π π₯(π‘) π‘=0 u(t) ππ₯ x(t) x’(t) y(t) ππ₯′ y’(t) πππ₯ ππ‘ L’adattamento • • • • La integrazione cx tra i due RC può essere vista come un filtro passa basso tra l’attività dei neuroni del primo e i neuroni del secondo livello con i feedback sui neuroni del primo. L’apprendimento dell’output del secondo livello che diventa input del primo viene automaticamente fatto per coerenza tra gli output e gli input che esso riceve come cx del primo. Insomma una convergenza di traiettorie a due scale temporali diverse . L’ipotesi più coerente è che y’(t) rappresenti la derivata di cx nel tempo e cioè la differenza tra la distribuzione di probabilità attuale e quella desiderata dai blocchi funzionali di alto livello. In questo modo abbiamo in input l’inverso di quello che rappresentano i cx, cioè y’(t) diventa una derivata dove cx rappresenta un integrale del comportamento delle x(t). Gli output di blocco y(t) sono l’effetto che vogliamo sul mondo e sono pesati in modo da annullare l’input, cioè l’input viene sempre considerato come errore, cioè la sorpresa informativa. La triade delle memorie IL MODELLO DEL CERVELLO Una architettura generale • La nostra ipotesi è che la integrazione spaziotemporale avvenga su rappresentazioni funzionali (RF) dei singoli sistemi senso-motori-emotivi (SMES). • Queste RF definiscono il funzionamento dinamico delle singole SMES nella loro interazione con il mondo esterno ed interno. • I sistemi centrali di integrazione (CIS) sono i Gangli di Base (BG) e l’ippocampo per la memoria delle traiettorie dinamiche globali dell’organismo, la corteccia parietale che memorizza i singoli episodi in modo integrato in un Bus Associativo (AB) e la corteccia prefrontale (PFC) che mantiene una memoria di lavoro concentrata su una certa attività. • I CIS producono RF integrate nello spazio e nel tempo delle RF degli SMES e quindi una inversione delle RF. La inversione di una RF produce la funzione che rappresenta. Nel nostro caso produce la realtà del funzionamento dinamico dell’intero corpo. Una architettura generale SMES Realtà Realtà Esterna RF Interna CIS La condivisione della stessa realtà esterna RF1 RF2≠ RF1 non produce rappresentazioni funzionali simili, ma ecologicamente coerenti La comunicazione, cioè condivisione di una realtà esterna coprodotta da conspecifici RF1 RF2≈ RF1 produce RF simili, che una evoluzione culturale seleziona per la loro efficacia sociale Specificità umane • Negli esseri umani questa rappresentazione esterna ed interna delle informazioni oggetto di adattamento è esplosa per via della relazione vista/arti superiori liberi dalla deambulazione e direttamente socializzabili attraverso la relazione sensomotoria tra le mie mani e l’altrui vista. • Solo nei sistemi cerebrali integranti preesistenti poteva avvenire questo percorso di adattamento, e cioè nei Gangli di Base, sfruttando la scarsa pericolosità strutturale e il piccolo costo energetico dei movimenti delle mani e degli occhi, o, probabilmente solo in seguito, della voce e dell’udito. ππ₯ π = π₯(π‘) π‘=0 xa(t) π₯′ y’a(t) π΄π΅ (t) Memoria Episodica Bus Associativo (AB) ππ₯π ub(t) yb(t) πππ₯ ππ‘ ππ₯π ua(t) ya(t) π¦ ′ (t) = xb(t) y’b(t) ππ₯π uc(t) yc(t) π₯ ′ π΅πΊ (t) Xc(t) Gangli di Base (BG) Ippocampo y’c(t) ππ₯π ud(t) yd(t) Xd(t) y’d(t) Connessioni variabili e apprese Connessioni stabili e casuali Controllo Topologico Neuromodulazione es. Dopamina Talamo Cortecce Sensomotorie ed emotive (SMES) xn(t) Reservoir π₯ ′ ππΉπΆ (t) Corteccia Prefrontale (PFC) Funzionamento • • • Gli stati di output y’AB(t), il bus associativo cioè la memoria episodica nella corteccia parietale, arricchiti e coordinati, vengono mandati solo ai blocchi funzionali sensomotori ed emotivi che fungono quindi anche da integratori della trasmissione verso gli altri blocchi. Non vi è un collegamento diretto, cioè, tra la corteccia parietale e i gangli di base e la corteccia prefrontale, ma esso avviene in funzione del feedback come RF dalle SMES. I blocchi di percorso e di esecuzione, cioè i gangli di base e la corteccia prefrontale, rappresentano la sintassi e la semantica del contenuto socialmente appreso del processo. In termini meno vaghi i BG decidono la sequenza e la PFC decide il posto di quanto succede adesso e ora in questa sequenza dove aver imparato sequenze e posti nel confronto sociale. Il boostrap di questo modello è delicato e prevede una fase di elevata plasticità giovanile dei blocchi di primo livello che vengono irrigiditi in una fase di esecuzione adulta delle sequenze apprese. La base è imparare una sequenza del risultato del bus associativo, quasi indipendentemente dalla semantica, e poi prolungarla fisicamente nel funzionamento previsivo dei blocchi di primo livello. Il risultato è una visione semantica di alto livello che abbiamo chiamato c’x, o rappresentazione funzionale globale e che essenzialmente prodotta dalla corteccia prefrontale. Il ritmo di queste due fasi nella sequenza è deciso dall’alternarsi della dopamina tra la decisione del percorso (fetch) e la attività di riconoscimento semantico (exec). Controllo topologico • • • • • Senza un controllo sociale la sequenza verrebbe appresa da un giovane senza il significato vissuto dall’adulto. Le sequenze innate di integrazione dell’intero corpo sono basate solo sulla sopravvivenza del giovane, in modo che possa sopravvivere per acquisire quelle dell’adulto. Cioè un vitello non apprenderebbe a brucare se non avesse un adulto che glielo propone, al momento giusto, come alternativa all’allattamento (verificare questo non dovrebbe essere troppo difficile). Del resto i giovani mammiferi potrebbero essere visti ecologicamente come dei «parassiti altamente specializzati». I BG sono una rete RC risonante, con una elevata profondità, un numero limitato di input (dalle SMES) e un numero elevato di elementi interni (nell’ippocampo). L’output è diretto a coordinare le connessioni talamiche della corteccia prefrontale con le SMES e coordina il risultato della risonanza dello stato attuale in essa (fase di exec e dopamina verso la PFC). I BG non mandano output diretti agli SMES, ma lo fanno indirettamente tramite la PFC. La presenza di RF in input attiva la risonanza nella fase di fetch dello stato successivo (dopamina verso i BG e riduzione della dopamina verso la PFC). La PFC manda un output ai sistemi sensomotori ed emotivi che è essenzialmente la differenza tra le RF ricevute dagli SMES e quelle previste in quello stato del percorso deciso dai BG. La sorpresa e l’attenzione • • • • Nel complesso gli input gestiti da BG e PFC sono un sottoinsieme di quelli di AB (i coefficienti più importanti o quelli che i BG ritengono importanti per la PFC). La selezione di quali è tutta da chiarire (attenzione e task switching ne sono il risultato dinamico generale da equilibrare). Questa differenza dimensionale e la sua dinamica sono la base dello stato cosciente e incosciente dell’individuo e del senso di realtà cosciente delle sensazioni rispetto alla supervisione previsiva (nel pensiero ad esempio) che ne viene fatta. In pratica lo stato cosciente è quello che decide la topologia delle connessioni tra la PFC e le SMES (l’attenzione). I BG hanno cioè la possibilità di decidere il livello di integrazione e il coordinamento tra le parti in funzione del percorso che i BG decidono in funzione della sua efficacia a ridurre il suo errore. Di questo esser diversi nel tempo noi ci accorgiamo e siamo coscienti della sua variazione nel tempo per il feedback che gli stessi sistemi sensomotori ci danno di questo coordinamento deciso dall’alto. Nella relazione di adattamento, durante lo svezzamento negli animali e per tutta la vita negli uomini, alcune SMES percepiscono la sorpresa altrui (gli RF) rispetto al nostro comportamento. Queste RF indotte attivano i BG e vengono memorizzate negli episodi in AB e permettono ai PFC di evolvere, adattandoli, i processi di assimilazione nelle SMES Come l’energia si trasforma in rappresentazioni funzionali IL VISSUTO DELLE EMOZIONI Cosa sono le emozioni • • • • • Gli attrattori su cui persistono i sistemi omeodinamici delle emozioni sono rappresentati come trasformate di Fourier sul cubo booleano come tutti gli altri blocchi funzionali. Gli attrattori vengono cioè rappresentati come una probabilità degli stati e della loro evoluzione lungo una traiettoria. Nell’amigdala e nell’insula l’intero insieme di evoluzioni omeodinamiche viene rappresentato in relazione agli aspetti esperienziali provenienti dal bus associativo della memoria episodica. Come avvenga questo legame con gli stati della corteccia sensomotoria non è chiaro, ma è esperienza di tutti l’associazione emotiva ad aspetti sensoriali semplici come ad esempio ai colori o agli odori. Quello che caratterizza le rappresentazioni funzionali delle emozioni è sicuramente il tempo di reazione emotiva che viene ad alzarsi rapidamente rispetto ad uno stimolo per poi permanere nel tempo indipendentemente dalla evoluzione esperienziale. In questa interdipendenza dalla esperienza sensomotoria stanno le caratteristiche più importanti delle emozioni . Le specificità • • • • • Innanzitutto l’attivazione di una emozione non è direttamente volontaria: l’emozione viene vista attraverso il richiamo di episodi o comportamenti che la contengono e non come azione in se. In questo l’emozione sta nel mondo, il mondo interno, rispetto alla coscienza vissuta nei BG. L’agire agisce sulle emozioni indirettamente come risultato di un comportamento, come ad esempio quando si mangia o si beve si alterano gli stati omeodinamici della sete e della fame. Le rappresentazioni funzionali dei circuiti omeodinamici delle emozioni rappresentano direttamente la distribuzione dell’energia libera dell’organismo nel suo insieme. Maggiore è la probabilità di un certo stato omeodinamico minore è la sua energia libera. Ad esempio se la maggior parte delle esperienze di ciclo setebere sono in un certo sottospazio sensomotorio, minore è l’energia libera in quel sottospazio. Il feedback negativo della rottura di equilibri omeodinamici è quindi esperienziale. Le esperienze volontarie o meno acquisiscono quindi un senso, una semantica, nello spazio delle esperienze tendenti a regolare un circuito omeodinamico. Una visione unitaria • • • • Il sistema limbico è essenzialmente parallelo e controlla i circuiti omeodinamici con continuità. Ogni concentrazione su di un fare esclude gli altri ed è necessaria la valutazione di probabilità congiunta tra il percorso sensomotorio scelto e quelli non in esecuzione apparente. Cioè gli attrattori rappresentati dalle RF del sistema limbico danno una valutazione continua del fare rispetto allo stato di benessere/malessere globale. A differenza degli organi sensomotori che si focalizzano su una parte della realtà con una parte dei propri processi, il sistema limbico è una realtà sempre presente e i suoi attrattori vengono modificati dal fare in atto diminuendo la loro probabilità di soddisfare gli altri circuiti omeodinamici nel loro continuo mutare (crescita della sensazione di sete o di stanchezza fisica o mentale ad esempio). Seppure in modo non cosciente, tutto quello che non si fa è presente a livello emotivo. Anticipazione delle emozioni • • • • • In parte qualsiasi azione è su un attrattore che riguarda tutti gli altri aspetti emotivi, tutti gli altri fare, ma nella maggior parte dei casi un fare esclude la soddisfazione di altri fare che portano a riduzione dei livelli emotivi. Non serve che questi equilibri siano effettivi, ma che vengano o meno anticipati dal fare in corso. Un attrattore è infatti un percorso per la loro soddisfazione e, a livelli diversi, tutto può essere visto come qualcosa che serve a soddisfare ad esempio la sete o la fame. Eppure certi percorsi vengono a essere più rilevanti di altri, se ne diminuisce la probabilità di avvenire all’aumentare dei valori degli enterecettori a causa di quello che si sta facendo e non facendo. Se ad esempio vedo dell’acqua e ho sete, questa situazione è di scarsa probabilità nell’attrattore, negli stati di cui ho fatto una RF con Fourier, e viene mandato un segnale che spinge i BG a recuperare un maggiore normalità bevendo. Ma questo bere viene visto come scarsamente probabile se ad esempio per educazione non posso bere, andando su un percorso di maggior equilibrio emotivo sociale a scapito di quello individuale. Insomma le azioni che svolgo (o le parole che dico per rappresentarle) hanno un valore emotivo globale e attinente alla singola attività solo in termini oppositivi (il valore di ciò che non ho fatto). Una visione semiotica • • • Il concetto di categoria semantica di Algirdas Julien Greimas è fondato sull'idea che si tratti sempre di una categoria oppositiva: il bianco senza il nero non è in sé dotato di senso. Nella nostra ipotesi le emozioni, corrispondendo in parallelo un senso energetico ai gesti e ai non gesti, alle esperienze sensoriali e alle esperienze sensoriali precedenti, forniscono un substrato neuroscientifico a questa visione del senso del senso. Questa visione porta ad alcune conclusioni, quali – la definizione di senso sulla base solo delle esperienze vissute – La inconoscibilità di un senso a se stessi, potendoci conoscere solo se tutto è stato vissuto (come dice Nietsche), vedendo solo in questa possibilità, una completezza di esplorazione delle reazioni di senso che noi abbiamo in ogni esperienza – La continua revisione del senso in funzione delle nuove esperienze anche non attinenti all’oggetto, all’azione o alla parole a cui stiamo attribuendo un senso Altre idee • • • • Vi è un motivo profondo per la mancanza di una descrivibilità del senso emotivo di una volontà espressa ed è la sovrapposizione delle reti di equilibri omeodinamici, che si intersecano in maniera complessa in un dato momento e tutta questa complessità viene rivissuta cumulativamente nel sentire “ciò che non si è voluto”. Ovviamente c’è uno spazio esperienziale profondo nell’amigdala e nell’insula e tutta una serie di esperienze di riparazione dei cicli omeodinamici riproducibili (come ad esempio il pianto di un bambino che da altri circuiti omeodinamici trae una riduzione degli enterorecettori della fame o del dolore). Cioè la natura ha posto una serie di interazioni (istinti) tra i modelli omeodinamici singoli per ottenere una riproducibilità anche in assenza di un sistema sensomotorio in grado di riprodurre volontariamente cicli riproducibili e frequenti. La terra incognita dei sistemi omeodinamici vive di vita propria per gran parte delle funzioni di base come la pressione sanguigna, l’alimentazione od il sesso, cablando da hardware una serie di risposte comportamentali che rimangono per tutta la vita. In altre parole gli attrattori di base dell’alfabeto emotivo son presenti fin dalla nascita e sono una guida per tutta la vita. In questo ambito il dolore rappresenta un caso a sé di valore esperienziale enorme. Altre ancora • • • L’estrema importanza di questo circuito del dolore e del piacere ha portato l’evoluzione a creare neuromodulatori specializzati che cambiano gli assetti funzionali dell’intera corteccia. Una modulazione di secondo livello che vede il cervello come una parte dell’organismo, una componente di un sistema omeodinamico globale che include i processi cognitivi che abbiamo visto. La probabilità stessa, prodotta dalle RF delle emozioni, diventa quindi un parametro di funzionamento delle RF di secondo livello dei BG, PFC e AB assieme alla stessa RF delle emozioni. Essa è la dopamina e ne abbiamo visto il ruolo nelle fasi fetch ed exec della mente cosciente. La dopamina è semplicemente il risultato della probabilità sensomotoria ed emotiva prodotta dall’RF globale attuale nelle RF dei sistemi di memorizzazione del cervello. Cioè in un certo senso i Gangli di Base che stimolano la produzione di dopamina sulla base della sorpresa sono l’organo di integrazione emotiva più ampio (come fa supporre anche la sua origine evolutivamente antica). Esso integra come emozione anche le discordanze tra i processi sensomotori previsti e quelli attuali. Questo modo integrato di vedere piacere e dolore come effetto informativo lo si evidenzia ad esempio nel piacere che dà eseguire azioni all’interno di un “flusso”. Errori esistenziali LE PATOLOGIE COMPORTAMENTALI Come nascono • • • • • • Le patologie comportamentali (come il gioco d’azzardo patologico o lo shopping compulsivo) sono comportamenti che se non eseguiti provocano gli stessi sintomi di una astinenza da sostanze Sono oggetto di attenzione clinica da decenni per il dolore provocato ai soggetti che ne soffrono e per i danni sociali che i comportamenti provocano La medesima sintomatologia di craving (smania) delle droghe ha fatto supporre la medesima natura cerebrale, che è stata in parte confermata In altre parole si è verificato che i sintomi rappresentano feedback negativi come quelli da rottura di equilibri omeodinamici emotivi Il processo di eziologia prevede la acquisizione di abitudini per effetto dei benefici dopaminergici delle emozioni associate al comportamento Le abitudini, che sono gestite dalla corteccia prefrontale, si trasformano, probabilmente nella amigdala o nella insula, in circuiti omeodinamici da tenere in equilibrio Il senso delle emozioni • • • Il bisogno emotivo dei circuiti omeo dinamici da gestire fornisce un senso energetico direttamente correlato alla frequenza con cui si presenta il bisogno (le RF rappresentazioni funzionali), cioè la distribuzione di probabilità, e quindi si trasla questo senso sul comportamento messo in atto per soddisfarlo nella realtà. La realtà si sposta nella realtà interna e da li nasce tutto: linguaggio e razionalità. Tutto è energia, o meglio è l’energia che vincola all’adattamento i processi di apprendimento del cervello. La sete non ha normalmente un elevato significato emotivo perché raramente i comportamenti di sua soddisfazione hanno un elevato valore energetico, e quindi sono rari i fenomeni di sete. Non è così ovviamente per i comportamenti costosi, che sono alla base di tutte le dipendenze, che sono gravi non per il loro impatto economico, ma perché diventano dipendenze proprio per questo loro elevato costo. Diventano dipendenze perché la loro frequenza di non soddisfazione, il numero di situazioni in cui non le possiamo soddisfare è elevato. Alcune ovvietà sulla prevenzione e la cura • • • • Energia, costo e dipendenza sono strettamente collegati dal funzionamento del nostro cervello che ci fa cercare ciò che è difficile avere, che nella nostra società è in diretta proporzione al suo valore economico. Quindi la soluzione ovvia è cercare comportamenti che costano relativamente poco, e che gratificano bisogni, ma il problema è la rappresentazione sociale di questa ovvietà, cioè dare molte indicazioni di percorsi con bassi costi energetici, opportunità di soddisfazione relativamente vantaggiose, nel luogo, oggi, dove si promuovono i comportamenti costosi, che diventano la promozione psicologica del comportamento “virtuoso” per tutti rispetto a quello “vizioso” per pochi. La cosa potrebbe diventare conveniente comunque, facendo capire che il comportamento costoso non è una opportunità, ma ha un costo extra dovuto alla natura umana che sottrae al comportamento frugale risorse. In questo ambito il valore oppositivo di ciò che facciamo ci aiuta e ci danneggia: le nuove esperienze, se non molto forti, richiamano le emozioni di non soddisfazione. Solo una ricostruzione, spesso casuale a volte di ristrutturazione della resilienza, degli assetti di senso delle esperienze può far uscire dalla dipendenza. Quando le comunità si suicidano LE PATOLOGIE SOCIALI Definizione • • • • • • Le patologie sociali sono quelle che portano a una manipolazione della volontà altrui, un «voglio che tu voglia fare» e non un semplice «desidero che tu faccia» La bulimia della volontà interiore vorrebbe che fosse identica alla volontà degli altri, per insicurezza della propria o per semplice riduzione dello sforzo a continuare a manifestarla e promuoverla La teoria della mente, cioè la descrizione a noi stessi di che cosa abbiamo dentro al cervello, prevede strutture logiche obsolete (una identità sempre come punto di partenza e di arrivo di tutto) e inesistenti Quindi il modello di relazione sociale basato su essa, se pensato e non semplicemente vissuto, è necessariamente sbagliato Ma anche questa mia definizione, in-fatti, è un esempio di patologia sociale se cercassi di condividerla basandomi sulla «teoria della mente» Ma la teoria della mente risultante dal modello descritto è invece simile alla frase di Samuel Beckett in «Worstward Ho»: «Prova ancora. Fallisci ancora. Fallisci meglio» Una spiegazione • • • • Il cervello umano è naturalmente resistente alle manipolazioni di volontà, ma si sono, geneticamente, create alcune finestre socialmente utili in cui questa manipolazione avviene. Ovviamente ci riferiamo alla base stessa della vita mentale, e cioè alla fase di attaccamento in cui al bambino viene insegnata la teoria della mente (identità, gestione delle emozioni, ruoli sociali, ecc…) che poi usa nel resto della sua vita La imperfezione di questa fase è assodata e evolutivamente giustificata: la resistenza ad un eccessivo conformismo emotivo e comportamentale è utile alla resistenza delle popolazioni offrendogli una diversificazione che si può utilizzare di fronte a cambiamenti ambientali Il problema è l’equilibrio tra modelli e imperfezioni nel conformismo delle autoidentificazioni, che porta poi all’equilibrio dei meccanismi sociali di adattamento e individuali di assimilazione Una soluzione • • • • • Dalla nostra natura non possiamo sfuggire, e i meccanismi stessi che determinano il nostro comportamento sono basati su processi emotivi di allocazione di senso che sono gli unici che abbiamo a disposizione, anche per descriverli illustrandone pregi e difetti. Non si tratta di una macchina, ma di un intero ecosistema che vive in se stesso e nel contempo si rapporta al mondo. La risonanza di questo ecosistema con gli altri ecosistemi che lo circondano lo chiamiamo linguaggio. Le basi del linguaggio sono nel magma emotivo stesso, che si è adeguato, recentemente, a gestirlo. Certo una uniformità di volontà sarebbe comoda, ma tutti gli ecosistemi interni al nostro cervello si trasformerebbero in ingranaggi privi di valore, privi della casualità emotiva che ci rende uomini proprio perché dotati di volontà che nasce dall’ignoto e si getta nel mondo. Inoltre questa volontà uniforme ci dovrebbe far dimenticare che invecchiamo e moriamo individualmente (cosa che le patologie sociali tolgono subito dal discorso), con bisogni emotivi unici in un certo momento e diversi da quelli che possono essere condivisi dagli altri. Insomma una volontà unica, come quella professata dal comunismo, dal consumismo o dall’islamismo fanatico sarebbe uno stupro alla nostra natura, natura di esseri viventi sostanzialmente uguali come struttura biologica, ma unici e oggettivamente indefinibili nel come questa struttura riesca a concretizzarsi, attraverso le emozioni, nel rapporto con gli altri e nella realtà del mondo. Perché la comunità scientifica si sta suicidando e una nuova «teoria della mente» per evitarlo PROPOSTE IN LIBERTÀ Il suicidio della comunità scientifica • • • • • • La comunità scientifica, gli esseri umani che ne fanno parte, si stanno strutturalmente suicidando perché non hanno più il coraggio di affermare risultati che possono essere smentiti La scusa di questa vaghezza, che è invece una tattica di sopravvivenza di medio periodo, è la complessità dei fenomeni che ultimamente stanno esaminando, come la genetica ed il cervello (o la teoria del tutto in fisica) Il danno ottenuto è terribile, perché chiunque, complici i media orizzontali può produrre qualsiasi risultato non falsificabile e distruggere socialmente risultati che quasi lo sono La scienza ha bisogno di «soldati che muoiono» di fronte alle proprie ipotesi che si rivelano errate e non di «generali che sopravvivono» discutendo amabilmente del sesso degli angeli Spero, umilmente, di aver dimostrato che la complessità è spesso invocata a sproposito, se un non scienziato come me è riuscito a farsi una idea globale del mondo e di se stesso, sicuramente sbagliata, ma con poche alternative nella rischiosità per chi le espone Coraggio! Il primo passo da fare • La prima cosa da fare è linguistica: eliminare da tutti i testi e da tutti gli esperimenti la parola «io», la identità del soggetto che svolge o subisce l’esperimento biologico, genetico, cognitivo o neuroscientifico. • Non è definibile una procedura di misura per definire una persistenza o una collocazione di una entità di identità, non esiste a livello di virus, cellula, organismo o comunità di organismi • Non è facile introdurre una nuova «teoria della mente» nella mente dello scienziato o altrove, l’unica soluzione è farne a meno • Lo so è difficile, per ragioni linguistiche, ma è la prima rivoluzione copernicana da fare: ipotizzare processi di misura e di sperimentazione che abbiano consistenza falsificabile solo in se stessi L’etica dell’azione, dell’opera e del lavoro CONCLUSIONI Un ragionamento etico • Tutto quello che ho scritto ha suggeritori profondi, così sacri da essere innominabili, per non nominarli invano. • Ma voglio osare, uno di questi è Hanna Arendt, che, nel suo Vita Activa, descrive con chiarezza tutto (o quasi). • Essa ipotizza tre livelli della vita activa: – Il lavoro che serve alla sopravvivenza – L’opera che serve al lavoro e lo cambia con nuovi strumenti o idee – L’azione, quello che si fa gratuitamente, di cui noi esseri umani abbiamo l’unica apparizione nell’amore totale tra due individui • Dato che fin qui abbiamo parlato di lavoro e di opera, c’è uno spazio infinito sopra a noi prima di poter fare finalmente una azione, o forse tutto ciò, la presentazione, è una azione (spero) di gratuito amore «Prova a cambiare tutto finché non va» ovvero mia moglie e l’intelligenza artificiale che funziona (un esperimento scientifico che continua da una vita e, purtroppo, non riproducibile) POST SCRIPTUM La gestione della tecnologia da parte di mia moglie • Non ho ottenuto i diritti di pubblicazione, ma ho già strutturato l’articolo, in – Stato dell’arte – Materiali e metodi – Risultati • È sulla «discussione» che non ho ricevuto la liberatoria, anche se era la parte più interessante dell’articolo Per approfondire MATERIALE SUPPLEMENTARE Opere da consultare • Tutte le opere di Pier Paolo Pasolini (in particolare il documentario su Marylin Monroe) • Tutte le opere di Gustavo Rol (in particolare la testimonianza di come divenne piccolo a sufficienza per entrare in una 500) • Tutte le opere di Federico Fellini (in particolare i film che non ha fatto) • Tutte le opere dei Dogon del Mali (in particolare quelle che non vendono)