UNIVERSITÀ DEGLI STUDI DI MILANO Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Genomica Funzionale e Bioinformatica Impiego di una rete neurale artificiale per la decodifica fine in tempo reale dei segnali neurali biologici all'interno di un sistema robotico ibrido biologico/elettronico. Relatore: Prof.ssa Rita PIZZI Correlatori: Dott. Giovanni CINO Tesi di Laurea di: Roberto ROSSONI Matr. n. 670380 Anno Accademico 2004/2005 Alla mia famiglia Indice Indice Introduzione Capitolo 1. Neuroni e cellule staminali 1 1.5 Propagazione del potenziale d’azione lungo la fibra nervosa 1.6 Trasmissione a livello delle sinapsi 1.7 Le cellule staminalI 4 4 7 10 12 14 16 19 Capitolo 2. Interfacce neuroelettroniche 2.1 Robotica biomorfa 2.2 Esperimenti d’interfaccia neuroelettronica effettuati sino al 2000 2.3 Esperimento d’interfaccia neuroelettronica del Prof. Fromherz (2002/03) 2.4 Interfaccia di neuroni-array di microelettrodi ( MEA ) 2.5 Utilizzo di MEA per i nostri esperimenti 23 23 24 28 33 34 Capitolo 3. Tecniche classiche per la codifica dell’ informazione neurale 3.1 Il problema della codifica neurale 3.2 Identificazione e caratterizzazione degli eventi di spike 3.2.1 Spike detection 3.2.2 Spike burst detection 3.3 Analisi statistiche classiche per la codifica neurale 3.4 Fasi di un progetto per la codifica di spike train neurali 3.5 Problematiche legate all’utilizzo di tecniche classiche e algoritmi 38 38 40 41 44 46 53 54 Capitolo 4. Introduzione alle reti neurali artificiali 4.1 Intelligenza artificiale classica, non classica e la teoria del connessionismo 4.2 Architettura delle reti neurali 4.3 Reti artificiali che apprendono 4.4 L’apprendimento 4.5 Le regole per l’apprendimento 4.6 Applicazioni generali 58 58 62 71 72 78 80 Capitolo 5. La rete SOM e l’evoluzione ad ITSOM 5.1 Self Organizing Map ( SOM ) 5.2 ITSOM ( Inductive Tracing Self Organizing Map ) 5.3 Descrizione della rete neurale artificiale utilizzata nell’esperimento 82 82 89 92 1.1 I neuroni: tra biologia ed informatica 1.2 Il neurone biologico 1.3 Il potenziale a riposo di membrana 1.4 Il potenziale d’azione ( PA ) Capitolo 6. Esperimento per la strutturazione di un circuito ibrido biologico/elettronico 6.1 Trasporto del segnale attraverso il circuito ibrido biologico/elettronico 6.1.1 Generazione del segnale 6.1.2 Elaborazione del segnale da parte della componente biologica, i neuroni umani 6.1.3 Decodifica del segnale per mezzo di ITSOM 6.1.4 Attuazione del segnale tramite robot 6.2 Protocollo sperimentale 97 98 98 103 105 106 108 I Indice Capitolo 7. Risultati 7.1 Risultati sperimentali 113 113 Capitolo 8. Conclusioni 8.1 Considerazioni finali 8.2 Sviluppi futuri 130 130 136 Appendice -DSP_systemSoftware per l’analisi dei segnali 138 138 Bibliografia 148 Ringraziamenti 157 II Introduzione Introduzione. La presente trattazione si colloca all’ interno di un più ampio progetto di ricerca condotto dal gruppo LNL ( Living Networks Lab ) presso il Dipartimento di Tecnologie dell’Informazione dell’ Università degli Studi di Milano. LNL opera nell’ambito delle neuroscienze. In particolare si trattano le applicazioni tecnologiche derivabili dall’ utilizzo di materiale nervoso ( es. neuroni umani o di ratto ), direttamente connesso a sistemi elettronici. Il lavoro di questa tesi è centrato nel mostrare come una rete neurale biologica sia in grado di apprendere la capacità di classificare pattern d’ingresso, in un circuito elettrico ad essa interfacciato, attuando una corretta discriminazione tra le differenti tipologie possibili di input. Lo scopo generale è la strutturazione di un circuito chiuso all’ interno del quale può essere fatta passare dell’ informazione. Nel nostro caso l’informazione sarà un comando di spostamento, generato per mezzo di un software, al fine di far compiere movimenti ad un robot. Può non essere d’ immediata comprensione l’originalità dell’ esperimento, in quanto sono diffusi circuiti elettronici in grado di far muovere a distanza parti meccaniche robotiche ( partendo dalle automobili elettriche per bambini fino ad arrivare alla sonda spaziale “Spirit”). I circuiti diffusi per il movimento di parti meccaniche a distanza sono circuiti di tipo non misto ( unicamente elettronici ), e pertanto artificiali. Completamente differente è la costituzione di circuiti ibridi ( misti ) con componenti biologiche ed elettroniche contemporaneamente. In tal caso il circuito risulta essere non totalmente artificiale poiché possiede una parte di materiale naturale. Ciò che viene trasmesso tra le varie componenti di un circuito, sotto differenti forme, si può definire informazione. Di tale informazione si conosce tutto per quanto riguarda la parte elettronica dei circuiti, mentre molto diversa è la situazione dell’ informazione legata al materiale biologico. 1 Introduzione I pattern forniti alla rete sono segnali elettrici in onda quadra. La scelta a riguardo della tipologia d’onda utilizzata è stata determinata in maniera tale da ottimizzare le capacità di apprendimento della rete biologica, tenendo conto di una serie di parametri che permettono un’attività dei neuroni funzionalmente simile a quella in vivo, senza comprometterne vitalità e funzionalità. Il segnale elettrico viene fornito alla rete biologica per mezzo di un’interfacciamento neuroelettronico permesso da una tecnologia sviluppata nei primi anni ’90: le piastre MEA ( Multi Electrode Array ). Queste piastre sono caratterizzate, sul fondo, da un array di microelettrodi sul il quale è possibile far crescere una coltura cellulare di neuroni. La coltura è costituita da cellule staminali neurali provenienti da feti naturalmente abortiti. Durante la crescita si assiste alla “costruzione” della rete biologica con la formazione delle classiche strutture sinaptiche e dendritiche di collegamento fra le unità cellulari. La rete di neuroni risulta essere direttamente interfacciata con l’array di microelettrodi, attraverso il quale è possibile effettuare esperimenti di stimolazione e registrazione dell’ attività elettrica della rete biologica. Affermare che una rete biologica sia in grado di apprendere significa aver implicitamente compreso il sistema di decodifica dell’ informazione contenuta all’ interno dei segnali elettrici neurali. La tesi prende in considerazione quelli che sono i metodi tradizionali per lo studio delle caratteristiche di segnali elettrici prodotti dai neuroni, considerando le principali analisi statistiche che si effettuano per l’individuazione e la caratterizzazione di “spike” e “burst”. Gli algoritmi basati su tali analisi hanno come fondamento un modello matematico semplicistico, che porta spesso a risultati con accuratezza discutibile. Il quadro della situazione si complica ulteriormente se a tali algoritmi viene richiesto di funzionare in modalità “real-time” come è necessario per lo svolgimento dell’ esperimento di robotica effettuato durante il periodo di tesi. 2 Introduzione Per risolvere l’incapacità degli algoritmi classici, si è applicata un struttura informatica differente per l’analisi dei segnali : le reti artificiali neurali ( ANN ). Le “artificial neural networks” costituiscono un importante strumento nel campo dell’ informatica avanzata, che prende a modello meccanismi biologici. Utilizzando una rete neurale artificiale con particolare architettura ( ITSOM), ampiamente descritta all’ interno della tesi, si è decodificato l’insieme dei segnali provenienti dai neuroni biologici ed è stato possibile inviare questa decodifica come input ad un attuatore robotico. Fornendo tramite l’array di microelettrodi quattro differenti segnali elettrici ( corrispondenti ai comandi per le direzioni avanti, indietro, destra, sinistra ) il robot è stato in grado di compiere movimenti nelle direzioni stabilite. L’intuizione che rende interessanti i risultati ottenuti è stata l’applicazione delle reti neurali, che ha significato utilizzare un mezzo informatico ispirato alle reti di neuroni per interfacciare i neuroni stessi con altre componenti elettroniche. Con le reti artificiali si vedrà come nonostante il metodo di decodifica dell’ informazione rimanga ignoto, sia stato possibile utilizzare segnali elettrici di natura biologica per l’indirizzamento di devices elettronici. Per meglio descrivere soluzioni e problematiche a riguardo del progetto presentato, oltre ai risultati ottenuti da questo, si sono rielaborati i risultati di un esperimento precedente, il quale venne effettuato prima della taratura delle rete neurale artificiale e per mezzo di robot simulato. 3 Capitolo 1 Neuroni e cellule staminali Capitolo 1 Neuroni e cellule staminali 1.1 I neuroni: tra biologia ed informatica. Il cervello umano è costituito da 1010 neuroni, collegati fra di loro in una rete molto complessa ed articolata. Ogni neurone è costituito da un corpo centrale (soma), da un lunga fibra detta assone e da una serie di ramificazioni di varia grandezza ed estensione dette dendriti ( Nicholls et al. 1992 ). Un neurone comunica con un altro attraverso dei contatti detti sinapsi ed in questo modo un singolo neurone può essere collegato fino a circa diecimila altri neuroni. Una rete di neuroni interconnessi prende il nome di rete neurale. La zona del cervello che distingue nettamente l’uomo da ogni altro essere animale è la corteccia cerebrale, una lamina pieghettata, stretta contro il cranio, di spessore di circa 4.5 mm, che è deputata ai processi mentali. Un impulso elettrico viaggia di solito lungo l’assone e, nel momento in cui raggiunge la sinapsi, cioè il collegamento con il dendrite o con il soma di un altro neurone, provoca la secrezione di particolari sostanze chimiche, dette neurotrasmettitori ( se ne conoscono oggi circa una trentina di tipi diversi ), che permettono all’impulso di superare la sinapsi e tornare a propagarsi come impulso elettrico lungo il secondo neurone. Il neurone si comporta come un elemento logico binario: acceso (1) se la somma degli impulsi ricevuti attraverso le varie sinapsi è sufficiente per stimolare la partenza di un impulso elettrico lungo l’assone e spento (0) nel caso contrario. La rete neurale opera in parallelo, cioè esegue molte operazioni contemporaneamente, a differenza dei computer tradizionali che sono sequenziali, cioè eseguono una operazione alla volta. Questa caratteristica ha 4 Capitolo 1 Neuroni e cellule staminali suggerito in campo informatico di progettare computer sempre più potenti basati sul calcolo parallelo. La memoria può essere considerata un sistema che ha il compito di conservare le informazioni che provengono dall’ambiente che ci circonda, di organizzarle e di renderle recuperabili in qualsiasi momento. Ogni persona dispone di una memoria diversa che riflette le diverse esperienze che ha avuto nel corso della sua vita. Una prima fondamentale distinzione viene operata fra memoria a breve termine e memoria a lungo termine. La memoria a breve termine dura alcuni secondi o minuti, mentre quella a lungo termine può durare ore, giorni o anni. In una celebre definizione il filosofo latino Seneca paragonò la memoria a breve termine ad una scritta sulla sabbia spazzata via dalle onde e quella a lungo termine ad una scritta scavata sulla pietra. Strettamente associata alla memoria è la funzione del ricordare che significa associare qualcosa proveniente dalla nostra memoria ad un stimolo sensoriale esterno. Quando arriva uno stimolo, la rete neurale incomincia una complessa attività elettrica che la porta ad associare a quello stimolo un determinato ricordo a breve termine, che solitamente avrà una vita molto precaria. Se tuttavia entrano in attività gruppi di neuroni associati alla memoria a lungo termine, allora incominciano ad affluire tutta una serie di ricordi collegati con lo stimolo iniziale. La memoria può anche essere distinta in memoria visiva (ci si ricorda di un viso, della forma di un oggetto, ecc.), uditiva (ci si ricorda una canzone, una particolare voce, ecc.), spaziale (ci si ricorda un luogo e la strada per arrivarci, siamo in grado di orientarci, ecc.), emotiva (ci si ricorda di un certo avvenimento passato piacevole o doloroso, ecc.) e così via. Due tecniche che hanno permesso di conseguire progressi nello studio della memoria e del ricordo sono la PET (tomografia ad emissione di positroni), e la risonanza magnetica funzionale ( fMRI ), che consentono di individuare la zona del cervello che entra in funzione quando ricordiamo qualcosa. Il cervello, nel momento in cui ricorda un qualsiasi evento passato, consuma 5 Capitolo 1 Neuroni e cellule staminali zucchero ed ossigeno proprio in quella particolare zona che è coinvolta nel ricordo. Il metabolismo del cervello viene quindi registrato con la tecnica del PET ed in questo modo si può ottenere una mappa abbastanza precisa della nostra memoria. Analogamente la fMRI sfrutta le proprietà magnetiche dell’ emoglobina per individuare le zone più o meno ossigenate. Le ricerche di tipo biologico riguardanti il funzionamento del cervello partono dal presupposto che il cervello possa essere schematizzato come un sistema cognitivo auto-organizzato in grado di elaborare l’informazione che riceve dall’esterno. Il suo comportamento è molto complesso, perché non bisogna pensare ad una semplice legge del tipo che associa ad ogni stimolo ricevuto una ben determinata risposta, ma invece considerare che lo stimolo mette in moto nel cervello una complessa dinamica neurale che associa allo stimolo una rappresentazione particolare, fra le tante archiviate in memoria. Per esempio basta che sentiamo l’inizio di una canzone per ripercorrere con la mente non solo tutto il resto del brano, ma anche tutti i ricordi piacevoli o meno che sono associati a quella canzone. Un semplice stimolo uditivo è in grado di mettere in moto un certo numero di aree distinte del cervello e di far nascere nella nostra mente un continuo flusso di ricordi. Le reti neurali sono state studiate mediante il computer per determinare i meccanismi che entrano in gioco quando ricordiamo, vediamo, sentiamo, ecc., partendo dalla constatazione che i neuroni sono elementi logici a due stati (spento o acceso, 0 o 1 come un bit). Questi elementi sono poi collegati fra di loro, ma la forza di questa connessione è ovviamente variabile. Due neuroni possono avere una forte connessione, cioè se un impulso arriva nel primo riuscirà quasi sicuramente a passare nel secondo, o viceversa una connessione molto debole. Secondo l’approccio biologico la natura della mente umana è strettamente collegata alle proprietà fisico-chimiche dei neuroni e quindi la rete neurale che simula il funzionamento del cervello deve comunque tener conto del fatto che l’uomo è un “computer fatto di carne”. 6 Capitolo 1 Neuroni e cellule staminali I fautori dell’intelligenza artificiale sostengono invece che ci si può sempre ricondurre al livello di semplici interazioni fra unità logiche elementari, essendo il cervello solo un hardware particolare fra i tanti possibili, perché per un programma è assolutamente inessenziale l’hardware che viene utilizzato, sia esso costituito da cellule o chip di silicio, come negli ordinari computer. 1.2 Il neurone biologico. Fig.1.1 Struttura della cellula nervosa e relativa connessione per mezzo di un bottone sinaptico ad un'altra cellula neurale. Il neurone rappresenta l’unità strutturale e funzionale del sistema nervoso. Un tipico neurone possiede un corpo cellulare ( pirenoforo ), neurofibrille, 7 Capitolo 1 Neuroni e cellule staminali neurotubuli e, come la maggior parte delle cellule un nucleo, mitocondri ed altri organuli cellulari ( Albert et al. 1994 ). Il neurone (fig. 1.1) è provvisto di due tipi di prolungamenti cellulari, i dendriti e gli assoni. I dendriti formano di regola numerose ramificazioni che raccolgono i segnali afferenti (di eccitazione e di inibizione ) provenienti da altri neuroni ( spesso migliaia ) e che generano attraverso la membrana cellulare del pirenoforo una somma dei segnali. L’assone che si origina in corrispondenza del cono di emergenza del pirenoforo, ha il compito di trasmettere il segnale nervoso efferente ad altri neuroni o agli organi effettori ( cellule ghiandolari o muscolari ), spesso situati a notevoli distanze. Nel suo percorso spesso l’assone emana dei rami collaterali che si suddividono ulteriormente in corrispondenza delle loro porzioni distali ( Martinez Martinez 1982 ). Se, a livello del cono di emergenza, la somma dei segnali supera un determinato valore soglia, allora si genera un potenziale d’azione che si propaga lungo l’assone fino ai bottoni sinaptici. Dall’apparato del Golgi localizzato nel pirenoforo fino alle porzioni terminali dei dendriti e dell’assone si verifica un trasporto assoplasmatico rapido di vescicole contenenti proteine, lipidi, zuccheri, sostanze di trasmissione ed altro. Questo trasporto anterogrado lungo i neurotubuli avviene grazie ad una proteina simile alla miosina, la chinesina, la cui attività richiede utilizzo di ATP. In senso retrogrado ( dalla periferia al pirenoforo ) vengono invece trasportati fattori di crescita nervosa ( NGF, nerve growth factor ). La membrana plasmatica del pirenoforo continua lungo l’assone come assolemma e risulta circondata nel SNC da oligodendrociti e nel sistema nervoso periferico da cellule di Schwann. In alcuni neuroni le cellule di Schwann formano numerosi strati fosfolipidici concentrici intorno all’assone, il cosiddetto strato mielinico che funge da isolante per i flussi ionici e risulta interroto lungo l’assone ogni 1,5 mm da un cosiddetto nodo di Ranvier. Le fibre nervose mieliniche sono caratterizzate da una maggiore velocità di propagazione dell’ impulso rispetto alle fibre nervose amieliniche. La velocità di propagazione aumenta inoltre con il diametro della fibra nervosa ( Albert et al. 1994 ). 8 Capitolo 1 Neuroni e cellule staminali La sinapsi rappresenta la zona di contatto tra l’assone di una cellula nervosa e un effettore o un altro neurone (fig.1.2). Nei mammiferi in corrispondenza delle sinapsi avviene ( con poche eccezioni ) una trasmissione chimica e non elettrica. In seguito all’arrivo del segnale elettrico, a livello della membrana presinaptica vengono liberate mediante esocitosi delle vescicole contenenti un neurotrasmettitore ( Nicholls et al. 1992). Questo diffonde attraverso la fessura sinaptica fino alla membrana post-sinaptica, dove genera nuovamente cambiamenti elettrici della membrana. Fig 1.2 Si evidenzia la natura chimica del segnale a livello delle sinapsi. Questo segnale, originariamente di tipo elettrico, verrà poi commutato nuovamente in segnale elettrico dopo la trasmissione di neurotrasmettitori alla membrana postsinaptica. A seconda del tipo di neurotrasmettitore e del tipo recettoriale inserito nella membrana post-sinaptica questa viene eccitata o inibita. Poichè la membrana post-sinaptica non rilascia neurotrasmettitori, a livello della sinapsi la 9 Capitolo 1 Neuroni e cellule staminali trasmissione del segnale è unidirezionale. Le sinapsi possiedono pertanto una funzione valvolare fondamentale per la trasmissione ordinata dell’ informazione, e rappresentano inoltre il luogo in cui la propagazione neuronale può essere modificata da parte di altri neuroni ( attivazione o inibizione ) ( Nicholls et al. 1992, Albert et al. 1994 ). 1.2.1 Il potenziale a riposo di membrana. Nelle cellule vive la membrana la membrana possiede un potenziale elettrico, Em, che nelle fibre nervose a riposo viene definito potenziale di membrana a riposo. Tale potenziale varia, a seconda del tipo cellulare, tra –50 e –100mV ( versante interno della cellula carico negativamente ). Il potenziale si genera a causa della disomogenea distribuzione degli ioni (fig.1.3) tra liquido intracellulare ( LIC ) e liquido extracellulare ( LEC ) ( Hodgkin et al. 1939 ). Fig 1.3 Concentrazioni effettive tipiche e potenziali d’equilibrio dei principali ioni nel muscolo scheletrico a 37° C. 10 Capitolo 1 Neuroni e cellule staminali I seguenti fenomeni sono i principali contribuenti alla formazione del potenziale di riposo: Mantenimento della distribuzione disomogenea degli ioni: grazie all’attività della Na+-K+ATPase, ioni Na+ vengono continuamente pompati fuori dalla cellula, mentre K+ vengono trasportati all’interno, cosicché nell’ambiente intracellulare la concentrazioni degli ioni K+ risulta circa 35 volte più elevata, mentre quella degli ioni Na+ è circa 20 volte più bassa rispetto alla concentrazione di questi ioni nell’ambienta extracellulare. Come in ogni altro tipo di trasporto attivo, anche la Na+-K+ATPase, richiede energia, in questo caso ATP. In caso di carenza di energia o in seguito all’inibizione della Na+-K+ATPase, il gradiente ionico sui due versanti della membrana diminuisce e il potenziale di membrana crolla. Bassa conduttanza degli ioni Na+ a riposo: in condizioni di riposo, la membrana plasmatica risulta estremamente poco permeabile agli ioni Na+, cosicché la differenza di concentrazione di Na+ non può essere prontamente annullata con la diffusione passiva degli ioni all’interno della cellula. Elevata conduttanza per gli ioni K+: nella cellula a riposo, la membrana è discretamente permeabile agli ioni K+ ( circa il 90% della conduttanza complessiva ). A causa dell’elevata differenza di concentrazione, gli ioni K+ diffondono per tanto dal LIC al LEC. A causa della loro carica positiva, anche lo spostamento di un ridotto numero di ioni provoca uno spostamento di cariche sui due versanti della membrana. Questo potenziale di diffusione continua fino a quasi compensare il gradiente di concentrazione che agisce da forza motrice dell’efflusso di ioni K+. 11 Capitolo 1 Neuroni e cellule staminali 1.2.2 Il potenziale d’azione ( PA ). Fig 1.4 Rappresentazione schematica classica del potenziale d’azione delle cellule nervose. Il potenziale d’azione (fig.1.4) è il segnale ( impulso ) che si propaga attraverso le cellule neurali lungo l’assone ( Adrian 1932, Hodgkin et al. 1939, Nicholls 1992 ). L’eccitazione si genera quando il potenziale di membrana si allontana dal suo valore riposo per assumere valori meno negativi ( predepolarizzazione ). La causa dell’eccitazione può essere l’apertura, a opera di un neurotrasmettitore, di canali per i cationi situati nella membrana postsinaptica, oppure un’eccitazione proveniente dall’ambiente circostante. Se durante l’eccitazione il potenziale di membrana si avvicina ad un determinato valore critico, il cosiddetto potenziale soglia, allora vengono attivati canali per gli ioni Na+ voltaggio-dipendenti, ovvero la conduttanza agli ioni Na+ aumenta e tali ioni intraprendono un flusso in entrata alla membrana. Se il potenziale soglia non viene raggiunto questa eccitazione locale non provoca alcun 12 Capitolo 1 Neuroni e cellule staminali ulteriore cambiamento. Se Em supera il potenziale soglia, si forma allora il potenziale d’azione che risponde alla regola tutto-o-nulla, ovvero nel modo caratteristico per il tipo cellulare e indipendentemente dall’ intensità dello stimolo che lo ha generato ( Nicholls 1992 ). Inizialmente viene attivato un numero progressivamente maggiore di canali per gli ioni Na+, e accelerando la depolarizzazione la conduttanza agli ioni sodici aumenta ulteriormente. In questo modo Em crolla molto rapidamente ( fase di depolarizzazione ) e raggiunge temporaneamente persino valori positivi come +20 +30 mV . I canali per gli ioni Na+ si inattivano molto velocemente ( 0,1 ms ), in funzione dei quali il potenziale s’inverte e viene a ristabilirsi il potenziale a riposo ( fase di ripolarizzazione ). In seguito alla depolarizzazione si sono aperti numerosi canali per gli ioni K+, e la conduttanza per tale ione è aumentata ( abbastanza lentamente ) di modo da favorire la ripolarizzazione (fig. 1.5). Fig 1.5 Si riportano le differenti conduttanze ioniche per gli ioni Na+ e K+. Sono illustrate le differenti velocità di variazione delle conduttanze per i due differenti ioni. 13 Capitolo 1 Neuroni e cellule staminali Essendo che spesso la conduttanza agli ioni potassici risulta ancora aumentata quando la membrana ha già raggiunto il potenziale a riposo, si può verificare un’iperpolarizzazione (fig.1.6). A tale fenomeno può inoltre contribuire un maggiore attività della Na+-K+ATPase. Possono generarsi molti PA in breve tempo, dal momento che la quantità di ioni che fluiscono attraverso la membrana è molto bassa. Poco dopo l’inizio di un PA, anche stimoli estremamente intensi non ne possono innescare un altro, perché nella membrana depolarizzata i canali per gli ioni Na+ non possono essere attivati ( periodo refrattario ). Fig 1.6 Attività dei canali per gli ioni Na+ voltaggio dipendente. 1.2.3 Propagazione del potenziale nervoso lungo la fibra nervosa. All’inizio della propagazione del potenziale d’azione si assiste ad un breve afflusso di ioni Na+ all’ interno della fibra nervosa ( Nicholls 1992 ). La membrana cellulare, inizialmente carica negativamente in corrispondenza del 14 Capitolo 1 Neuroni e cellule staminali suo versante interno, adesso manifesta una carica opposta ( adesso all’ interno varia tra +20 e +30 mV ), cosicché si genera una differenza di carica rispetto alle porzioni adiacenti non ancora eccitate (fig. 1.7). Ciò provoca un trasferimento elettrotonico passivo di cariche dalle porzioni adiacenti, generando in tali zone una depolarizzazione. Se in questo modo viene raggiunto il potenziale di soglia, si origina un nuovo potenziale d’azione, mentre quello originatosi nella porzione precedente si esaurisce. Normalmente il PA si propaga in un’unica direzione, poiché la porzione di fibra nervosa eccitata in precedenza si trova in fase refrattaria. Se nonostante ciò si verifica un’eccitazione in senso retrogrado ( ad es. in seguito alla stimolazione della fibra con un elettrodo ) essa termina al più tardi in corrispondenza della sinapsi più prossima ( funzione valvolare ). La progressiva generazione di potenziale d’azione nella porzione di fibra di volta in volta più prossima rigenera sempre il segnale, ma richiede tempo : nelle fibre amieliniche, caratterizzate da questo tipo di conduzione, la velocità di conduzione ( θ ) risulta relativamente bassa e corrisponde a 1 m/s. Un valore molto più elevato di θ si osserva nelle fibre nervose mieliniche, ove può raggiungere i 90 m/s ( Nicholls 1992 ). Dato che a livello degli internodi queste fibre risultano isolate dall’ ambiente circostante dalla guaina mielinica, una depolarizzazione sufficiente per generare un PA può avvenire per distanze maggiori ( circa 1,5 mm) ovvero in corrispondenza dei nodi di Ranvier, dove la fibra è priva di mielina ma ricca di canali per gli ioni Na+. In questo senso il PA si propaga in modo saltatorio da un nodo a quello successivo. La lunghezza del salto è compensata dal fatto che la corrente di compensazione ( 1-2 nA ) diminuisce all’ aumentare della distanza. Prima che tale corrente raggiunga un valore “sottosoglia”, il segnale deve pertanto essere rigenerato presso un nodo di Ranvier. 15 Capitolo 1 Neuroni e cellule staminali Fig 1.7 schematizzazione della propagazione del PA. Nelle figure 1 a e 1 b viene riportata la propagazione continua tipica delle fibre amieliniche. La figura 2 riporta la propagazione saltatoria delle fibre mieliniche. 1.2.4 Trasmissione a livello delle sinapsi. Le fibre nervose sono connesse tra loro e con cellule sensoriali ed effettori attraverso le sinapsi. Le sinapsi elettriche sono collegamenti diretti tra neuroni adiacenti che permettono il passaggio di ioni attraverso canali ( connessoni ) localizzate a livello delle giunzioni serrate( Hodgkins et al. 1939, Nicholls 1992 ). Tali sinapsi provvedono per esempio alla propagazione dell’ eccitazione nella muscolatura liscia, nel miocardio, nella retina e nel SNC a livello delle cellule epiteliali e tra cellula della glia. Le sinapsi chimiche provvedono alla conduzione dell’ informazione per mezzo di sostanze chimiche chiamate neurotrasmettitori. Tali sinapsi non servono soltanto per la semplice trasmissione del segnale, ma rappresentano anche gli elementi del sistema nervoso a livello dei quali la trasmissione dell’ impulso può venire indirizzata su determinati circuiti, può essere potenziata, inibita ed elaborata con altre informazioni. In corrispondenza della sinapsi chimica (fig. 1.8), il PA proveniente dall’ assone libera il neurotrasmettitore contenuto nelle terminazione presinaptiche ( bottoni terminali ). Tale sostanza diffonde 16 Capitolo 1 Neuroni e cellule staminali attraverso la stretta fessura sinaptica ( circa 30 nm ) e si lega a livello della membrana post-sinaptica a determinati recettori di neurone di una cellula secernente o di una cellula muscolare. A seconda del tipo di neurotrasmettitore e del tipo di recettore, la membrana può essere eccitata o inibita. La liberazione del trasmettitore avviene mediante l’esocitosi regolata delle vescicole sinaptiche. Ogni vescicola contiene un determinato quantum di trasmettitore. Un certo numero di vescicole è già legato alla membrana ( zona attiva ) ed il loro contenuto può essere prontamente riversato all’ interno della fessura sinaptica mediante esocitosi. Fig 1.8 processo di liberazione del neurotrasmettitore a livello della sinapsi chimica. Il segnale per la liberazione del trasmettitore è rappresentato dai potenziali d’azione e più è alta la loro frequenza e più è grande il numero di vescicole che libero il proprio contenuto. Un PA provoca, attraverso un aumento della frequenza d’apertura dei canali per Ca2+ voltaggi-dipendenti situati nella membrana presinaptica, un aumento della concentrazione citoplasmatica degli 17 Capitolo 1 Neuroni e cellule staminali ioni Ca2+. Ioni Mg2+ extracellulari impediscono tale processo. Gli ioni Ca2+ si legano alla sinaptotagmina, innescando in tal modo l’interazione della sintassina e di SNAP25, localizzati nella membrana presinaptica con la sinaptobrevina contenuta nelle vescicole sinaptiche. Ciò provoca l’esocitosi delle vescicole già associate alla membrana ( circa 100 per ogni PA ). Gli ioni Ca2+ stimolano la proteina cinasi II calcio-calmodulina-dipendente ( CAM-cinasi II ), che attiva a livello della terminazione presinaptica l’enzima sinapsina ( Nicholls 1992 ). Quest’ultima favorisce l’avvicinamento di ulteriori vescicole nella zona attiva (fig. 1.9). Fig 1.9 illustrazione presinaptica che dell’ancoraggio porta delle all’attivazione vescicole e alla alla membrana liberazione del neurotrasmettitore. 18 Capitolo 1 Neuroni e cellule staminali 1.3 Le cellule staminali. Una cellula staminale (fig.1.10) viene comunemente definita come una cellula che si divide (di solito raramente) dando origine a due cellule diverse tra loro: una cellula figlia è uguale alla cellula madre ( staminale ) mentre l’altra cellula figlia è diversa (progenitore) e, anche se può dividersi numerose volte, non può più farlo indefinitamente ( perdita della staminalità ) e prima o poi tutta la sua progenie differenzierà in un solo tipo ( cellula staminale unipotente ) o in diversi tipi ( cellula staminale multipotente ) di cellule differenziate. Fig.1.10 la parte A illustra la duplicazione delle staminali. Le figure B e C riportano rispettivamente la duplicazione di staminali unipotenti e multipotenti. Questa definizione è teorica poiché non disponiamo di marcatori molecolari che ci permettano di distinguere tra loro le due cellule figlie di una cellula staminale. Possiamo soltanto derivare questa definizione da saggi funzionali retrospettivi. È oggi possibile ricostituire l’intero sistema ematopoietico di un topo irradiato letalmente con una singola cellula staminale. Questa procedura è facilitata dall’impiego di un topo transgenico che esprime in tutte le sue cellule 19 Capitolo 1 Neuroni e cellule staminali una proteina fluorescente (GFP o green fluorescent protein), così che la cellula donatrice e tutta la sua progenie saranno facilmente identificabili perché fluorescenti. Pertanto, se una singola cellula staminale fluorescente (più un certo quantitativo di progenitori non fluorescenti necessari per mantenere l’emopoiesi durante il periodo di espansione e colonizzazione midollare da parte della cellula staminale fluorescente ) viene trapiantata in un topo letalmente irradiato, il topo ricevente sopravvivrà e tutte ( o quasi ) le sue cellule del sangue saranno fluorescenti per il resto della sua vita. Inoltre, è possibile trapiantare con il midollo fluorescente del topo trapiantato un secondo topo irradiato e ripetere la procedura alcune volte. Questo dimostra che una singola cellula staminale emopoietica ha la capacità di generare tutti gli elementi figurati del sangue per tutta la vita di uno o più organismi (almeno nei roditori). Al contrario, se viene trapiantato un progenitore, questo sarà in grado di dare origine agli elementi figurati del sangue del topo ricevente per un periodo limitato di tempo (settimane o pochi mesi), trascorso il quale, tutte la progenie differenzierà in cellule mature del sangue e poi il midollo andrà in aplasia. In base alle conoscenze attuali le cellule staminali vengono divise in due gruppi principali: cellule staminali embrionali e cellule staminali adulte. Questa classificazione risulta essere imprecisa in quanto tra le cellule staminali adulte sono comprese quelle fetali, presenti negli abbozzi degli organi, quelle neonatali, isolabili dal cordone ombelicale e quelle propriamente adulte, presenti in molti (o forse tutti) gli organi del nostro organismo (Galli et al. 2003 ). Le cellule staminali adulte sono presenti in molti e forse in tutti gli organi dei mammiferi, anche se il loro numero si riduce probabilmente con l’età. In passato si riteneva che soltanto i tessuti soggetti a continuo ricambio (sangue ed epiteli) possedessero cellule staminali, necessarie per sostituire con nuove cellule differenziate le cellule perdute quotidianamente durante tutta la vita dell’individuo. Ciò spiegava come questi tessuti fossero soggetti principalmente a patologie di tipo proliferativo (tumori). Al contrario, i tessuti 20 Capitolo 1 Neuroni e cellule staminali le cui cellule non si rinnovano (o si rinnovano con estrema lentezza) nella vita adulta (muscolo scheletrico e cardiaco, tessuto nervoso) erano ritenuti privi di cellule staminali e quindi prevalentemente soggetti a patologie di tipo degenerativo. Le cose sono cambiate con la dimostrazione, oggi incontrovertibile, che il sistema nervoso centrale e quello periferico contengono cellule staminali neurali, capaci di proliferare indefinitamente o quasi nelle opportune condizioni sperimentali e di generare i principali tipi cellulari del sistema nervoso quali neuroni e glia. Inoltre, anche il cuore, finora ritenuto incapace di rigenerazione, probabilmente contiene cellule staminali, capaci di generare nuovi cardiociti e forse anche cellule muscolari lisce ed endoteliali. Le cellule staminali embrionali sono presenti nella massa cellulare interna ( o embrioblasto ) della blastocisti, poco prima dell’impianto nella mucosa uterina (fig.1.11). 21 Capitolo 1 Fig 1.11 Neuroni e cellule staminali Dopo la gastrulazione le cellule staminali embrionali ( multipotenti ) diventano adulte ( unipotenti ). Tra i vari tessuti in cui si riscontrano cellule staminali adulte in rosso si le cellule neurali cerebrali. Queste cellule possono essere coltivate in opportune condizioni per lunghi periodi e sono quindi in grado di generare un numero elevatissimo di cellule figlie le quali mantengono la capacità di differenziare in tutti i tessuti dell’organismo e per tale motivo sono definite “totipotenti”. Le cellule staminali embrionali o ES ( dall’inglese: “embryonic stem” cells ) possono essere geneticamente modificate in vitro mediante sostituzione di un gene sano con uno mutato o viceversa ( ricombinazione omologa ). Quando iniettate nella cavità (blastocele) di una blastocisti ospite, le ES colonizzano tutti i tessuti dell’embrione chimerico ( così definito perché composto dalla mescolanza di due genotipi diversi ) compresa la linea germinale. In riferimento agli esperimenti condotti durante la tesi si precisa che le cellule staminali utilizzate provengono da tessuti di cervelli ottenuti da feti umani abortiti naturalmente dopo dieci settimane di gestazione. Le cellule staminali sono state prelevate dal telencefalo e dal diencefalo e differenziate con apposito protocollo in vitro ( Gritti et al. 2001 ). 22 Capitolo 2 Interfacce neuroelettroniche Capitolo 2 Interfacce neuroelettroniche 2.1 Robotica biomorfa. Le ricerche riguardanti campi come la biologia, l’informatica, l’ingegneria, hanno trovato un comun denominatore. Gli scienziati che si occupano di queste discipline hanno scoperto un modo di unire gli sforzi, applicando le loro conoscenze in ambiti di ricerca comuni. Lo studio che ha unito discipline così apparentemente distanti tra loro, prende il nome di “Biomorphic Robotics”, un’area di ricerca molto attiva negli ultimi anni. Lo scopo di questa disciplina è quello di creare delle interfacce che permettano la comunicazione tra organismi animali ed apparecchiature elettroniche. Quello della robotica biomorfa è un settore molto aperto ad applicazioni pratiche, dato che, oltre a diverse università, anche enti privati e governativi cominciano ad organizzare conferenze e workshop che riguardano queste tematiche. La NASA, per esempio, nell’agosto 2000, ha organizzato “Workshop on Biomorphic Robotics” a Pasadena in California. Lo scopo della conferenza era sia di presentare un visione d’insieme di ciò che s’intende per robotica biomorfa, che di stabilire una collaborazione tra la NASA e altri istituti di ricerca, e di definire la maniera per sviluppare sistemi artificiali in grado di emulare sistemi biologici o per lo meno comunicare con essi. I maggiori sforzi di chi ricerca in questo campo, sono mirati da un lato a comprendere come avviene il meccanismo dell’ apprendimento e dell’ adattamento, cercando di formalizzarlo e riprodurlo sul calcolatore, dall’altro a creare dispositivi in grado sia di interpretare correttamente i segnali elettrici generati dal cervello di un essere vivente, che di poterne inviare a sua volta, modificando il comportamento del cervello stesso. 23 Capitolo 2 Interfacce neuroelettroniche 2.2 Esperimenti d’interfaccia neuroelettronica effettuati sino all’anno 2000. L’ interfaccia neurone/componente elettronica rappresenta fisicamente il punto di contatto tra due discipline che insieme porteranno a scoperte sicuramente stupefacenti. È possibile sia che il circuito elettronico diventi l’accettore di un apparato biologico, sia che il corpo umano subisca un innesto elettronico; certo è che in entrambi i sensi di sviluppo l’interesse medico, elettronico e commerciale è elevatissimo. I primi esperimenti significativi d’interfacciamento neuroelettronico si sono svolti all’inizio degli anni novanta, e sfruttavano le elevate dimensioni dei neuroni di sanguisughe per una maggiore facilità di manipolazione. In questi esperimenti l’interfaccia avveniva con transistor applicati su piastre di silicio. Questi esperimenti hanno fatto da apripista nel campo della ricerca neurofisiologica ma anche per i futuri sistemi ibridi biologico/elettronici, protesi biolelettroniche, biorobotica e computazione biologica, individuando quali fossero le due strade da seguire per poter raggiungere risultati importanti. La prima riguarda il perfezionamento del contatto che avviene tra il neurone e la piastra di silicio con il transistor. Questa è una visione di tipo microscopico che punta ad accertare che le proprietà di un fragile elemento come il neurone non vengano in qualche modo modificate rispetto al reale funzionamento biologico, falsando così gli esperimenti effettuati. L’altra visione mira alla costruzione di sistemi composti da una fitta rete neurale biologica a contatto con una rete elettrica artificiale non invasiva. Questa tipologia permette studi di apprendimento e memoria da parte delle reti biologiche. Da notare come in quest’ultimo caso non ci si preoccupa di come avvengono i contatti tra i neuroni e il materiale elettrico artificiale, bensì s’intende valutare un segnale elettrico ( in entrata o uscita ) da parte della rete biologica nel suo complesso ( Egert et al. 1988, Akin et al. 1994, Wilson et al. 24 Capitolo 2 Interfacce neuroelettroniche 1994, Breckenridge et al. 1995, Bove et al. 1996, Weis et al. 1996, Borkholder et al.1997, Canepari et al. 1997, Jenkner e Fromherz 1997, Schatzthauer e Fromherz 1998, Maher et al. 1999, Jimbo e Robinson 2000 ). Nel 1999 il gruppo di ricerca cui fa capo il professor William Ditto presso l’Università di Atlanta ( Georgia ), ha dato quella che può essere considerata la prima vera svolta nell’interfaccia computazionale con i neuroni ( Ditto 1998 ) (fig. 2.1). Ditto riuscì a dimostrare che da una rete composta da soli due neuroni interconnessi tra loro è possibile ottenere lo svolgimento di addizioni in modo corretto. Successivamente, grazie ai risultati offerti da questo esperimento, altri gruppi di ricerca s’interessarono a questa disciplina e riuscirono a simulare al computer lo svolgimento di sottrazioni, moltiplicazioni, divisioni e altre operazioni logiche da parte di una rete neurale ( Garcia et al. 2003, Potter 2001 ). Esperimenti di maggior complessità vollero testare la capacità di memorizzazione e di addestramento di una rete neurale. Vennero prelevati dei neuroni dall’ ippocampo di topo, sfruttando la loro capacità di formare rapidamente delle sinapsi anche su un supporto di silicio (Fromherz et al. 1993, Fromherz e Schaden 1994, Maher et al. 1999, Schatzthaeuer et al. 1998 ). 25 Capitolo 2 Interfacce neuroelettroniche Fig 2.1 Neuroni dell’ ippocampo di topo coltivati su di un chip su supporto in silicio. Stimolando la rete neurale con “potenziali d’azione simulati” per mezzo del circuito elettrico esterno, si spera di osservare dei cambiamenti morfologici nelle reti di neuroni così coltivate, che possono indicare come i neuroni, nei cervelli viventi, modificano la disposizione sinaptica in base agli stimoli elettrici cui sono sottoposti. Questi segnali possono indurre, oltre a cambiamenti nel numero o nella grandezza delle sinapsi, anche variazioni nella crescita dendritica, nella formazione di spine dendritiche o nella interazione con le cellule gliali. Studiando i fenomeni base di come l’attività elettrica influenza la morfologia neuronale, e come a sua volta questi cambiamenti influenzano le proprietà elettriche della rete stessa, si potranno avere anche preziosi parametri per lo studio delle reti neurali artificiali su computer. Questo permetterà di sviluppare 26 Capitolo 2 Interfacce neuroelettroniche sistemi di apprendimento artificiali che si avvantaggiano dell’adattamento intelligente presente nei sistemi biologici ( Pineda 1988 ). L’elaborazione di reti neurali “miste” potrebbe aprire nuove strade sia nel campo dell’informatica che in quello delle protesi. Già oggi esiste un orecchio (coclea) elettronico che registra i suoni, li trasmette a minuscoli elettrodi che attivano il nervo cocleare di una persona affetta da sordità: negli impianti effettuati con successo, il cervello deve rielaborare gli impulsi elettrici e interpretare lo spettro dei suoni digitalizzati attribuendo loro un significato. Ovviamente si è ancora lontani dall’ottimizzazione necessaria per l’applicazione su larga scala, ma si è dimostrato che reti neurali biologiche opportunamente connesse con apparecchi elettronici possono essere utilizzate per l’apprendimento, dimostrando un volta per tutte come i neuroni siano dotati della capacità di associarsi in reti intelligenti e di interfacciarsi con circuiti artificiali purché questi siano in grado di recepire i loro segnali e ritrasmetterli alla rete neurale. La prima creazione di una creatura ibrida costituita da un corpo meccanico controllato dal cervello di un pesce venne messa a punto nel 2000 tramite una collaborazione tra due università statunitensi e un italiana ( Northwestern University of Chicago, Illinois University e Università degli studi di Genova ). Il robot possiede poche neuroni prelevati dalla Lampreda Marina ( Petromyzon marinus ), un vertebrato primitivo simile alle anguille. Per creare questo animale artificiale i ricercatori hanno estratto il cervello e la parte della corteccia con anestesia totale e l’ hanno mantenuta in una soluzione salina ossigenata e refrigerata; hanno poi isolato un gruppo di poche cellule note con il nome di “cellule di Muller”. Queste cellule sono responsabili dell’ interazione tra i segnali provenienti dai sensori e i comandi inviati alle parti meccaniche, oltre che aiutare nell’orientamento della Lampreda. I neuroni tuttavia non sono stati posti all’ interno del corpo meccanico ma sono stati collegati ad esso per mezzo di cavi. Di fronte ad alcuni stimoli luminosi il robot ha presentato diversi comportamenti di movimento ( Reger et al. 2000 ). 27 Capitolo 2 Interfacce neuroelettroniche 2.3 Esperimento d’ interfaccia neuroelettronica del Prof. Fromherz ( 2002/03). Di particolare rilevanza è l’esperimento condotto dal Professor Peter Fromherz, neuroscienziato di fama mondiale che opera presso l’istituto di biochimica “Max Planck” di Monaco di Baviera ( Fromherz 2003 ). I risultati ottenuti danno l’idea di come in pochi anni si siano fatti passi da gigante nello studio e nell’ implementazione, tuttavia ancora allo stato embrionale, di interfacce tra neuroni e chip di silicio. Il silicio è un materiale adatto a fungere da substrato elettronicamente conduttivo per due ragioni: 1. Attualmente è disponibile una tecnologia dei semiconduttori molto avanzata e ben stabilita che consente di fabbricare dispositivi elettronici microscopici in silicio. 2. La crescita su uno strato di biossido di silicio sopprime i processi elettrochimici che possono portare alla corrosione e al danneggiamento delle cellule. Le cellule nervose, che hanno un diametro di 10-100 µm, sono circondate da una membrana elettricamente isolante. Un sottile strato, spesso circa 5 nm, separa l’elettrolita intracellulare dall’ ambiente. La corrente elettrica attraverso la membrana è mediata da specifici canali proteici per il sodio e il potassio ( pompa sodio/potassio) con una conduttanza di circa 10-100 pS. I neuroni e gli elettroliti sono conduttori di ioni, mentre il silicio è un conduttore di elettroni. Una volta soppressa la corrente di Faraday all’ interno dell’ interfaccia del biossido di silicio, l’accoppiamento tra le cellule e il chip può essere raggiunto solo attraverso la polarizzazione elettrica. Tuttavia, quando una cellula nervosa cresce su di un supporto solido, non ci si deve aspettare che la membrana lipidica e il biossido di silicio formino un dielettrico coerente che possa perfettamente mediare un’interazione capacitiva. Le molecole delle proteine, che si protendono dalla membrana alla cellula e che si depositano sul substrato, 28 Capitolo 2 Interfacce neuroelettroniche danno vita a una pellicola elettrolitica tra la cellula ed il chip (fig.2.2): questo fenomeno disaccoppia elettricamente il chip e la cellula. Si crea allora una struttura a “sandwich” in cui un sottile strato conduttivo viene separato dagli ambienti conduttivi di silicio e citoplasma grazie a sottili pellicole isolanti di biossido di silicio e membrane lipidiche. Fig. 2.2 Modello di contatto cellula-semiconduttore La giunzione cellula-semiconduttore ha la natura fisica di un nucleo conduttore isolato. Le correnti elettriche e la diffusione degli ioni in questa struttura a “sandwich” governano la stimolazione e la registrazione dell’attività neuronale sul chip. L’eccitazione di una cellula nervosa, come gia detto nel capitolo precedente di questa tesi, è dovuta al potenziale d’azione e consiste in una rapida apertura dei canali sodio con un concomitante flusso di corrente all’interno della cellula e in una ritardata apertura dei canali per il potassio con un flusso di corrente verso l’esterno. Durante un potenziale d’azione, le correnti capacitive e ioniche scorrono attraverso la membrana del contatto. La corrente è spinta attraverso la resistenza del nucleo dando così origine nella giunzione ad un voltaggio extracellulare Vj(t) dipendente dal tempo. Se sufficientemente forte, questo stimolo è in grado di influenzare la membrana cellulare, in particolare può aprire i canali di ioni controllati dal voltaggio, in modo tale da ottenere 29 Capitolo 2 Interfacce neuroelettroniche eventualmente un potenziale d’azione. L’efficienza dell’accoppiamento neurone-silicio dipende dalla resistenza della giunzione e dalla corrente elettrica che attraversa la membrana cellulare collegata alla stessa giunzione, ma non solo: è importante anche capire quale debba essere la distanza che separa il chip dalla cellula e quale sia la sua resistenza elettrica. La misurazione della distanza tra chip e cellula viene fatta attraverso una procedura che viene denominata FLIC ( fluorescence interference contrast ) che si basa su alcune proprietà del silicio, tra le quali quella di riflettere la luce (fig.2.3). Fig. 2.3 Fluorescence interference contrast ( FLIC ) Sono stati fabbricati chip in silicio con piazzole microscopiche di biossido di silicio ( 2,5x 2,5 µm2, con un’altezza di circa 20 nm ) su cui sono state coltivate cellule neurali per studiare il gap che divide la cellula dal chip. Negli esperimenti condotti si è potuto notare che la distanza misurata si attesta attorno ai 109 nm. Questa “grande” distanza è causata dalle forze entropiche delle molecole proteiche che sono ancorate alla membrana e sono usate per isolare il chip in modo da sviluppare la crescita cellulare. Sono stati utilizzati diversi tipi di cellula e rivestimenti ed il risultato migliore è stato un distanza di 40 nm. Per quanto riguarda invece la resistenza del gap tra cellula e chip, in base ad alcune misurazioni ed anche alla teoria questa si attesta intorno ai 10Mohm. 30 Capitolo 2 Interfacce neuroelettroniche È molto affascinate combinare in un singolo esperimento due fondamentali campi della scienza moderna, la biologia e quella dei semiconduttori, osservando la diretta interazione degli elementi fondamentali della dinamica del cervello e dei transistor ( Bels e Fromherz 2002, Fromherz 2002 ). Un potenziale d’azione si propaga attraverso la membrana cellulare e il gap che separa la cellula dal chip. Il voltaggio extracellulare Vj(t), che modula la struttura a banda del semiconduttore, nasce da una sovrapposizione di tutte le correnti, ioniche e capacitive, presenti nel contatto. La forma e l’ampiezza del segnale è controllata dall’accumulo e dal rilascio delle conduttanze di ioni ( nella membrana ) e dalla specifica conduttanza nella giunzione. Monitorando l’attività dei neuroni nelle sanguisughe, lumache e topi, si possono osservare una certa varietà dei segnali che possono essere compattati in tre classi (fig. 2.4): 1. il voltaggio extracellulare è proporzionale alla derivata prima del potenziale d’azione. Questa risposta di tipo A-type avviene quando tutte le conduttanze di ioni sono rilasciate nella giunzione e le correnti capacitive sono controllate. 2. il voltaggio extracellulare è proporzionale al potenziale d’azione stesso. Questa risposta di tipo B-type è stata osservata quando una non specificata conduttanza prevale nel contatto in modo che una corrente ohmica attraverso la membrana e il gap controlli il voltaggio extracellulare. 31 Capitolo 2 3. Interfacce neuroelettroniche il voltaggio extracellulare assomiglia all’inversa della derivata prima del potenziale d’azione. Il segnale si presenta quando tutte le conduttanze di ioni pertinenti sono accumulate nella giunzione. Un’intera classe di segnali ( C-type) è stata osservata per la selettiva accumulazione dei vari canali di ioni nei neuroni di sanguisughe e topi. Fig 2.4 Rappresentazione grafica delle tre classi di segnali ottenute. La stimolazione del neurone attraverso l’interfaccia elettrica senza la presenza di correnti di Faraday richiede un’alta capacità per area unitaria del chip, per far modo di iniettare corrente sufficiente nella giunzione. Sono stati costruiti punti di stimolazione molto efficienti utilizzando il silicio fortemente drogato con un sottile strato di biossido di silicio. I neuroni delle sanguisughe possono essere stimolati da un singolo voltaggio ( impulso ) applicato ai punti di stimolazione sotto il neurone. Il meccanismo della stimolazione, tuttavia, non è ancora chiaro ed alcuni risultati sono ancora 32 Capitolo 2 Interfacce neuroelettroniche da interpretare. È noto che uno stimolo dà origine ad un voltaggio extracellulare Vj(t) con velocità esponenziale che si presenta nel gap tra la membrana ed il chip. Quando si è in presenza di una giunzione B-type, come sempre accade con i neuroni delle sanguisughe, il voltaggio Vj(t) inietta una corrente nel neurone che ha come conseguenza la stimolazione del neurone stesso. Quando invece si è in presenza di una giunzione A-type, la stimolazione del neurone avviene tramite un voltaggio molto forte e improvviso applicato al chip. 2.4 Interfaccia neuroni-array di microelettrodi (MEA) Per comprendere l’attività spazio-temporale nelle reti neurali e le interazioni tra le differenti aree del cervello la possibilità di effettuare delle registrazioni “multisito” risulta essere un prerequisito fondamentale ( Maher et al. 1999, Jimbo e Robinson 2000, Reger et al. 2000, School et al. 2000, Braun e Fromherz 2001 ). Per raggiungere quest’obiettivo nell’effettuazione di studi in vitro, recentemente si è sviluppata una nuova tecnologia per una più rapida e migliore registrazione dei segnali elettrici di una rete biologica, le piastre MEA ( Jenkner et al. 2001, Bonifazi e Fromherz 2002 ) (fig. 2.5). 33 Capitolo 2 Interfacce neuroelettroniche Fig 2.5 vista dall’alto di una piastra MEA composta da 60 microelettrodi. Queste piastre sono comuni piastre per la crescita di colture cellulari caratterizzate dalla presenza di un elevato numero di elettrodi per la registrazione dell’attività elettrofisiologia della rete nella base. I microelettrodi delle MEA sono in genere più di una sessantina e offrono grandi vantaggi nella registrazione dell’ impulso elettrico neurale. Infatti le tre caratteristiche principali delle piastre MEA sono: 1. Facilitano la crescita delle colture ( nel caso di neuroni, favoriscono la formazione di reti con relative sinapsi ) 2. Sono una tecnica non invasiva 3. Attuano la registrazione dell’attività elettrica non di un singolo neurone ma di tutta la rete presente nella piastra. La non invasività degli elettrodi in MEA ha permesso di effettuare studi sulla funzionalità elettrofisiologia di culture cellulari a lungo termine, in quanto le cellule cresciute su queste piastre, se opportunamente conservate, possono vivere anche per alcune settimane. Sfortunatamente questo non è il caso delle cellule neurali le quali risultano essere particolarmente fragili, e nessuno è ancora riuscito ad effettuare studi in vitro a lungo termine ( Zeck e Fromherz . 2001 ). 2.4.1 Utilizzo di MEA per i nostri esperimenti. Come vedremo più avanti, anche negli esperimenti trattati in questo lavoro sono state utilizzate MEA per la registrazione dei segnali elettrici delle colture neurali (fig. 2.6). 34 Capitolo 2 Interfacce neuroelettroniche Fig. 2.6 Piastra MEA utilizzata durante gli esperimenti. Come si vede dall’ immagine i cavi elettrici sono interfacciati alla piastra per mezzo di in placca di rame posta a contatto con i circuiti dei microelettrodi della MEA e bloccata da quattro morsetti alle estremità. L’utilizzo di queste piastra ha necessitato di alcuni accorgimenti. In quanto i MEA, prima di essere utilizzati, dato che vengono assemblati utilizzando silicone, che è neurotossico, essi devono poi essere lavati accuratamente seguendo un preciso protocollo: • lavare in alcool 70% la piastra servendosi di un bastoncino di cotone • lasciare la piastra per 6 ore sotto l’acqua corrente, possibilmente distillata • lasciare la piastra per 6 ore in alcool 70% • lavare con 4 brevi risciacqui la piastra con detergente non saponato e acido • sciacquare con alcool 70% • lavare con acqua distillata • lasciare in acqua distillata sotto raggi UV “overnight” • aspirare l’acqua e lasciare asciugare sotto cappa sterile 35 Capitolo 2 Interfacce neuroelettroniche Una volta effettuato il lavaggio dal silicone la procedura prevedeva la piastrazione delle cellule per mezzo di “matrigel”, molecola di adesione ricavata dal sarcoma di verme. Il matrigel a temperatura ambiente gelifica in breve tempo ( in frigo a 4° C è liquefatto ) permettendo una corretta adesione delle cellule alla piastra. I primi tentativi dell’ utilizzo di questa molecola d’adesione furono fallimentari in quanto il matrigel dopo due giorni dall’estrazione dal frigo si sollevava dal piano della piastra fino al distacco (fig. 2.7), provocando in questo modo la morte delle cellule pilastrate. Fig 2.7 L’immagine mostra il sollevamento del matrigel dalla piastra che porta alla sensazione di frammentazione del gel. Nella parte superiore è visibile una parte dove è avvenuta la completa rottura del gel. Per superare questo problema si è deciso di lasciare gelificare il matrigel “overnight”, e procedere alla piastrazione delle cellule in un secondo momento. In questo modo l’adesione rimaneva costante per tutti i 25 giorni necessari alla maturazione cellulare prima dell’effettuazione degli esperimenti. 36 Capitolo 2 Interfacce neuroelettroniche Fig 2.8 Immagine al microscopio delle cellule correttamente adese trascorsi 15 giorni dalla piastrazione. Come si nota dalla figura 2.8 a soli 15 giorni dalla piastrazione già si possone notare le celule a diretto contatto con i microelettrodi della MEA. Ogni elettrodo è connesso attraverso un sottile percorso isolato ad un collegamento esterno. Di tutti i collegamenti situati nel supporto alcuni fungono da input, altri da output ed altri ancora hanno il compito di fungere da massa. I MEA vengono posti dentro ad un box per il controllo della temperatura. Si richiede infatti il mantenimento costante a 37° C, temperatura che garantisce la gelificazione del matrigel. 37 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale Capitolo 3 Tecniche codifica classiche dell’ per la informazione neurale. 3.1 Il problema della codifica neurale. I neurofisiologi generalmente forniscono stimoli e simultaneamente registrano l’attività neurale da parte della regione cerebrale che si sta studiando. Lo stimolo può essere di natura fisica molto variabile come la luce, utilizzata per la stimolazione dei neuroni della retina, o come il suono per stimolare l’attività elettrica neurale della corteccia auditoria. La questione sperimentale si concentra sulla relazione esistente tra un possibile stimolo e una risposta, individuale o di gruppo che sia, in termini di spike prodotti. Inizialmente gli studi si concentravano sulla risposta che poteva essere fornita da un’unica unità neuronale ( Hodgkin e Huxley 1952, Catterall 1988 ). In tempi più recenti, con l’avvento di tecniche che permettono la registrazione dell’ attività elettrica di una porzione di rete neurale biologica ( ad es. MEA, vedi cap.2 ), questo tipo d’analisi è stata abbandonata. Infatti in ogni piccola porzione del cervello animale, migliaia di spike vengono emessi ogni millisecondo, e si propagano attraverso una complessa rete costituita da migliaia di connessioni ( Nicholls 1992 ). La fig. 3.1 aiuta ad immaginare la quantità di segnali che vengono emessi dai neuroni di un organismo, riportandone solamente una piccola parte. 38 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale Fig 3.1 Pattern spazio-temporale delle pulsazioni in termini di spike, da parte di 30 neuroni ( A1-E6, plottati lungo l’asse orizzontale ). Il tempo di registrazione è di soli 4 secondi. Gli spike sono caratterizzati dalle linee verticali nere. Essendo certo che gli animali rispondo agli stimoli secondo canoni precisi, e che le informazioni sono trasmesse per mezzo del sistema nervoso, alle varie parti del corpo, tramite segnali elettrici come quelli nella figura qui sopra riportata, ciò che ci si domanda è : qual è l’informazione contenuta all’ interno dei pattern spazio-temporali? Qual è il codice utilizzato dai neuroni per trasmettere le informazioni? Come fanno i neuroni che ricevono il segnale a codificarne il contenuto? Come osservatori esterni al sistema nervoso, possiamo capire qual è il messaggio contenuto nell’attività elettrica dei neuroni? Le suddette domande indicano il problema della codifica neurale, uno dei temi più interessanti della neuroscienza. Risposte ben definite alle domande appena formulate non sono ancora state trovate. Tradizionalmente si è pensato che la maggior parte, se non tutte, le informazioni rilevanti fossero contenute nel 39 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale tasso medio di “firing” del neurone. Il firing rate è definito solitamente da una media temporale: ν = np ( T )/ T Solitamente il tempo T è posto come T= 1000 ms o T=500 ms, e vengono contati il numero di spike np( T ) che compaiono all’ interno della finestra temporale considerata ( Jimbo et al.1992 ). La divisione del numero di spike per la durate della finestra fornisce il firing rate medio. Il concetto di firing rate medio è stato ampliamente utilizzato negli studi effettuati nel corso degli ultimi 80 anni. Ci si può infatti rifare a lavori molto datati come quello effettuato da Adrian nel 1928 dove veniva mostrato che il firing rate dei neuroni muscolari era relazionato con la forza applicata dai muscoli ( Adrian 1928 ). Nei decenni seguenti, le misurazioni di firing rate sono diventate uno strumento standard per la descrizione delle proprietà di tutti i neuroni sensoriali o corticali. È chiaro, tuttavia, come un metodo basato in media temporale trascuri tutte le informazioni presumibilmente contenute nella sincronizzazione esatta dei punti. Nonostante questa enorme approssimazione di un sistema complesso quale può essere considerato la rete di neuroni biologici, è sull’analisi della frequenza degli spike che si basano i metodi classici per la codifica delle informazioni trasmesse attraverso il sistema nervoso. 3.2 Identificazione e classificazione degli eventi di spike. Nell’ultimo decennio, il progresso nel campo della neuroingegneria ha aperto nuove possibilità di analisi dell’attività elettrica dei neuroni. Oggigiorno, durante gli esperimenti di neurofisiologia, non vi è alcuna registrazione di tipo individuale di spike. Ciò avviene in quanto la registrazione avviene per mezzo di piastre multielettrodo. Tali piastre danno misurazione del voltaggio extracellulare tramite ognuno degli elettrodi di registrazione, dai quali si registra la simultanea attività di un numero imprecisato di neuroni facenti parte 40 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale di una rete biologica. Da questi voltaggi registrati si possono identificare gli eventi di spike; tale processo di caratterizzazione viene generalmente definito come “spike sorting”. Lo spike sorting è il processo iniziale obbligatorio per l’analisi di spike train. Alcuni algoritmi sono stati sviluppati per riuscire ad identificare e classificare gli eventi di spike registrati durante un esperimento di neurofisiologia, ma ad oggi non si è ancore riuscito a stabilire quale sia il migliore. È stata infatti riscontrata una discordanza di output forniti dall’analisi delle medesime registrazione elettriche. L’impossibilità di far convergere le soluzioni ad un risultato unico e certo ci dà la dimensione della complessità del problema della caratterizzazione di spike e dell’estrazione dell’informazione che si ritiene in essi contenuta. I complessi algoritmi d’elaborazione sono spesso nascosti all’utente da un’interfaccia utente semplice ed intuitiva realizzata secondo gli standard Graphical User Interfaces (GUIs), Mouse Driven Events ed i risultati delle sessioni di analisi sono facilmente condivisibili in quanto compatibili con i più diffusi strumenti di visualizzazione ed analisi, quali ad esempio Microsoft Excel o Microcal(™) Origin. 3.2.1 Spike detection. Gli studi di estrazione dei parametri rilevanti da una popolazione di neuroni sono contraddistinte da misurazioni a lungo termine ( possono durare minuti o ore ), le quali producono file nell’ordine dei Gigabyte come risultato di un unico esperimento. La scarsa maneggevolezza dei dati ottenuti, dovuta alla dimensione, risulta essere un fattore limitante l’analisi dei segnali ottenuti. Un esempio classico di algoritmi per la determinazione degli spike ( spike detection ) all’interno di segnali neurofisiologici è rappresentato da quella categoria di algoritmi basati sul metodo della soglia picco-picco ( Perkel et al. 1967 ). Tali algoritmi permettono di seguire le eventuali oscillazioni del segnale, e di una finestra mobile, dimensionata in modo tale che possa contenere al più uno 41 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale spike: idealmente, la sua durata è pari alla durata degli spikes da individuare; la finestra viene fatta scorrere sul segnale finché la differenza tra il valore massimo ed il valore minimo del segnale contenuto nella finestra non supera la soglia picco-picco ( fig. 3.2 ). Quando questo accade, è segnalato uno spike. Fig 3.2 individuazione del picco per mezzo di un algoritmo peak-to-peak threshold. Il rettangolo tratteggiato rappresenta la finestra mobile che scorre lungo il segnale registrato mache non trova un valore sufficiente per determinare la presenza di uno spike. Diversamente nel rettangolo successivo la soglia viene superata e si riscontra uno spike. La soglia viene di fianco mostraro per mezzo della freccia. Il valore soglia da utilizzare per la ricerca dei picchi di minimo e di massimo che contraddistinguono gli spike viene calcolata come un multiplo della deviazione standard ( STD ) del rumore biologico. In genere si assume che la soglia sia sette volte superiore ad STD. La finestra mobile scorre lungo il segnale registrato ed identifica gli spike contenuti in esso. I due parametri necessari per la determinazione degli spike per mezzo della finestra mobile sono: la latenza di spike e il valore della soglia picco-picco. Una volta immessi tali parametri l’algoritmo segue la variabilità biologica del segnale e ne estrae caratteristiche rilevanti per ulteriori procedure di analisi. Per stimare il grado di 42 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale attività della rete in esame, simultaneamente all’ identificazione dei potenziali d’azione, viene calcolato il firing rate medio. Un parametro che viene sempre preso in considerazione quanto si tratta la rilevazione di spike è lo ISI, Inter Spike Interval ( Chiappalone et al. 2004 ). L’ inter spike interval è definito come l’intervallo temporale che intercorre tra due spikes successivi (fig.3.3) e l’istogramma degli inter spike intervals si costruisce raggruppando gli ISI. Fig 3.3 ISI, Inter Spike Interval. Intervallo temporale tra due spike consecutivi ( ta, ta+1 ) L’istogramma ISI (fig.3.5) fornisce una stima statistica della densità di probabilità di “firing” di una sequenza di spikes rispetto uno spike di riferimento. Attraverso le ISI può essere osservata l’attività di “bursting” nei neuroni, dove gli intervalli che intercorrono tra un burst ed il successivo corrispondono a lunghi intervalli nella distribuzione delle ISI. 43 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale Fig 3.4 ISIH, Inter Spike Interval Histogram, fornisce una stima della densità di probabilità di bursting dei neuroni. 3.2.2 Spike Burst detection Oltre all’ormai nota attività di spike, le reti di neuroni corticali mostrano un comportamento molto importante, a cui si è gia accennato anche nel paragrafo precedente, a livello neurofisiologico: lo spike burst ( Mallat 1989, Chiappalone et al. 2004 ). Il burst ( dall’ inglese scoppio ) può essere definito come un insieme di eventi spike molto ravvicinati nel tempo, tanto da poter essere considerati un’unica entità elettrofisiologica di studio (fig.3.5). 44 Capitolo 3 Fig. 3.5 Tecniche classiche per la codifica dell’informazione neurale Registrazione di un burst. La zona interessata dal burst ( evidenziata dal cerchio rosso ) è caratterizzata da un’elevata serie spike ravvicinati. Anche nel caso della determinazione dei burst (fig.3.6), l’attività di rilevazione può avvenire per mezzo di una finestra mobile ( come quella utilizzata per la rilevazione di singoli spike ) che scorre lungo il segnale elettrofisiologico registrato. La determinazione da parte dell’ algoritmo può avvenire in due modi differenti, considerando un burst come una sequenza di pochi spike molto ampi, o come pacchetti di spike caratterizzati da un livello di attività tenue ma duraturo nel tempo. Fig. 3.6 in rosso dall’alto sono riportati: gli spike rilevati dall’algoritmo e il segnale registrato. In basso in verde troviamo gli ISIH relativi alla registrazione. 45 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale L’immagine della fig. 3.6 illustra la tipologia dei file registrati dagli algoritimi per la rilevazione di spike e burst. Tali risultati costituiscono il punto di partenza per le successive analisi statistiche. 3.3 Analisi statistiche classiche per la codifica neurale. Lo studio della codifica dell’ informazione neurale è basata sull’ implementazione di analisi statistiche che considerano l’ attività sincronizzata della rete di neuroni come la somma di piccole attività di spike ( Sanger 2002, Chiappalone et al. 2004 ). Per studiare il livello di sincronizzazione dell’attività della rete e rilevare le variazioni significative dovute a stimolazione elettriche dall’esterno, sono stati implementati algoritmi per lo svolgimento di funzioni statistiche classiche . Si possono infatti trovare algoritmi per lo studio della densità di probabilità di burst ( ISIH ), della funzione di autocorrelazione per mezzo di JISIH ( joint ISI histogram ) e della funzione di cross correlazione tramite CISIH ( cross ISI histogram ) per stimare la sincronizzazione relativa all’ attività di spike. Altra classica osservazione compiuta è quella di JPSTH ( Joint Peri-Stimulus Time Histogram ), che mette in risalto la possibile attività sincronizzata di due neuroni. Cambiando la scala del tempo, è possibile estrarre informazioni simili dall’ attività di burst, utilizzando IBIH ( Inter Burst Interval Histogram ), il cross IBIH e joint IBIH. Dato uno spike di riferimento, la JISI è un’analisi statistica costruita a partire da due variabili: l’ISI che precede lo spike di riferimento e l’ISI che lo segue (fig.3.7), calcolata per tutti gli spikes del treno. 46 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale Fig 3.7 Illustrazione delle variabili in gioco per la trattazione di JISI • JISI ( Joint Inter Spike Interval) Gli intervalli pre-ISI e post-ISI sono rappresentati in un piano cartesiano, pertanto il risultato della JISI è un istogramma tridimensionale. La formula che permette tale operazione è la seguente: dove τx e τy indicano l’intervallo post e pre ISI. 47 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale Fig. 3.8 Le due rappresentazioni sono modi differenti per presentare l’analisi JISI. Le coordinate (x,y,z) dell’ istogramma descrivono rispettivamente valore di pre-spike, post-spike e frequenza di spike. Utilizzando la color map, le due dimensioni (x,y) descrivono pre e postspike,la terza dimensione ( frequenza ) è data dal colore rosso. Per quanto concerne l’interpretazione dei grafici riportati in fig. 3.8 bisogna dire che: la distribuzione dell’istogramma JISI fornisce una stima statistica della probabilità che l’occorrenza di uno spike sia legata allo spike precedente e al successivo. Ciascun punto della JISI è descritto dalle coordinate: (x, y, z) = (post-ISI, pre-ISI, numero di occorrenze) e quando si verificano dei raggruppamenti di punti in una zona è molto plausibile che esista una dipendenza tra le post-ISI e le pre-ISI. Raggruppamenti orizzontali o verticali sono indice di indipendenza tra gli intervalli pre e post-ISI. • CISI ( Conditional Cross Inter Spike Interval ) Con la CISI si cerca di stimare la probabilità che si verifichi attività caratterizzata da un particolare ISI a partire dall’occorrenza di uno spike nel neurone di riferimento, un certo intervallo dopo che il neurone condizionante abbia emesso,a sua volta, uno spike. Pertanto il calcolo dell’istogramma CISI bisogna avere un file di riferimento ed un file condizionante. Siano: A lo spike 48 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale train di riferimento; B lo spike train condizionante; la relazione della CISI è espressa dalla: Dove τx è post-ISI, τy pre(cross)ISI e tb l’istante dell’ occorrenza impulso nel treno B (fig.3.9). Fig. 3.9 Nella parte superiore dell’ immagine si riporta il treno dello spike di riferimento. Nella parte inferiore vi è il treno dell’ impulso condizionante. Se i punti formano una banda orizzontale, allora esiste una correlazione tra il cross-intervallo ed il post-intervallo, rispetto lo spike di riferimento. Bande verticali di punti, invece, indicano che non esiste alcuna correlazione tra gli intervalli delle occorrenze rispetto un particolare spike di riferimento. In altre parole, l’attività dei neuroni di riferimento è indipendente dall’attività dei neuroni condizionanti. 49 Capitolo 3 • Tecniche classiche per la codifica dell’informazione neurale IBIH ( Inter Burst Interval Histogram ) Si è pensato di eseguire, per le sequenze di bursts, lo stesso tipo d’indagine statistica adottata per gli spike trains. Ovviamente le occorrenze considerate non sono più i singoli picchi, bensì i pacchetti d’attività; pertanto la finestra d’esame deve essere dell’ordine delle centinaia di millisecondi ed il periodo d’esame, cioè la durata massima dell’IBI, deve essere dell’ordine delle decine di secondi. La formula per il calcolo dell’istogramma IBI è: Dove t è l’intervallo tra due burst consecutivi ( IBI ) (fig.3.10). Fig. 3.10 Rappresentazione grafica di un IBI, che rappresenta la distanza nel tempo tra due eventi di burst consecutivi 50 Capitolo 3 • Tecniche classiche per la codifica dell’informazione neurale JBIH ( Joint Burst Interval Histogram ) Questo tipo di elaborazione calcola l’istogramma delle distanze temporali tra un burst di riferimento e, rispettivamente, quello che lo precede e quello che lo segue. La formula che permette questa operazione è la seguente: τx e τy indicano l’intervallo post e pre-IBI (fig.3.11). Fig. 3.11 rapprentazione degli intervalli considerati nello studio di JIBI. • CIBI ( Conditional Cross Inter Burst Interval ) Analogamente alla CISI, con la CIBI si cerca di stimare la probabilità che si verifichi attività caratterizzata da un particolare IBI a partire dall’occorrenza di un burst nel neurone di riferimento, un certo intervallo dopo che il neurone condizionante abbia prodotto,a sua volta, un burst. Pertanto anche per il calcolo dell’istogramma CIBI bisogna avere un file di riferimento ed un file condizionante. 51 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale τx, post-IBI; τy pre(cross)-IBI ; t b istante di occorrenza del burst. • JPSTH ( Joint Peri-Stimulus Time Histogram ) L’ analisi joint peri-stimulus time histogram è la logica estensione della singleneuron PSTH. Mentre PSTH mostra il numero di spike prodotti da un singolo neurone per unità di tempo, JPSTH mostra, per mezzo di un istogramma bidimensionale, la conta del numero di spike al tempu u per un dato neurone 1, e quella per un dato tempo v per il neurone 2 (fig.3.12). Fig. 3.12 PST joint histogram. Plot diagonale di due single-neuron PSTH, a dare JPSTH. I due PSTH sono disegnati in verde sugli assi delle ascisse e ordinate. La diagonale mostrata in fig 3.12 fornisce per ogni tempo t il tasso di firing simultaneo per i due neuroni considerati. Viene spesso utilizzata una modificazione di JPSTH, chiamata JPSTH normalizzato. Il JPSTH normalizzato serve per eliminare l’ errore che si può commette osservando come dipendenti gli eventi di firing di due neuroni ad elevata attività di spike, che in realtà sono indipendenti l’uno dall’ altro, senonchè casualmente hanno spike sovrapposti nel tempo. Il JSPTH normalizzato della coppia dei tempi (u,v) definisce la loro correlazione di Pearson del firing dei neuroni 1al tempo u, e del neurone 2 al tempo v. Sommando le diagonali di tutti i JSPTH prodotti 52 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale durante l’ intero studio riferito a tutta la rete neurale in esame, si ottiene il cross-correlogramma normalizzato. 3.4 Fasi di un progetto per la decodifica di spike train neurali. Gli algoritmi per la decodifica di spike train sono tecniche matematiche utilizzate in neuroscienza per studiare come i pattern di spike train, di un singolo neurone o di un’insieme di essi, rappresentino gli stimoli esterni e segnali biologici. L’analisi di decodifica si sviluppa generalmente in due fasi: la fase di codifica e quella di decodifica (fig.3.13). Durante la fase di codifica, l’attività di spiking neurale è caratterizzata come funzione del segnale biologico. Al contrario, nelle fase di decodifica, tale relazione viene invertita, ed il segnale biologico viene stimato a partire dall’ attività neurale. 53 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale Fig. 3.13 Decodifica della posizione tramite l’attività spike di neuroni di ratto. (a) Analisi di codifica nella quale la relazione tra lo stimolo biologico (traiettoria del ratto, vedi pannello ”posizione”) e l’attività di spike, viene stimata come “recettività del campo” da parte di tre neuroni. (b) Analisi di decodifica nella quale la “ recettività di campo ” viene utilizzata dall’algoritmo Bayesiano per predirre la posizione ( linea nera sottile) del ratto nell’ ambiente tramite una registrazione di dell’ attività di spike del ratto durante la fase di decodifica. La regioni di confidenza nella determinazione della posizione è mostrata nel pannello centrale. Tra i primi studi sviluppati con un approccio di questo tipo vi sono quelli effettuati con neuroni della corteccia cerebrale di ratto per la decodifica del segnale legato al movimento (fig.3.13). Algoritmi basati su “ reverse correlation ” sono stati utilizzati per studiare gruppi di neuroni rappresentanti l’informazione nei sistemi visivo-motori. Tali algoritmi sono stati pensati per lo svolgimento della fase di codifica. Per la seconda fase ( decodifica ) vengono utilizzati algoritmi Bayesiani, i quali devono assegnare il corretto significato biologico ( nel caso di fig. 3.13 si tratta della traiettoria del ratto ) alla registrazione dell’ attività di spike di un dato gruppo di neuroni. 3.5 Problematiche legate all’utilizzo di tecniche classiche e algoritmi. Come si può facilmente intuire, quello della comprensione del meccanismo di trasmissione dell’ informazione biologica da parte di neuroni umani non è un problema di facile risoluzione. La registrazione simultanea di spike train multipli prodotti da un’ elevato numero di neuroni apre un’interessante finestra sulla concertazione del lavoro che avviene all’ interno di una rete neurale. Senza lo sviluppo d’innovative metodologie, nel prossimo futuro, le possibilità di comprendere il suddetto meccanismo di trasmissione risultano essere fortemente ridotte ( Brown et al. 2004 ). 54 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale Infatti gli attuali metodi d’analisi dei segnali presentano ad oggi una serie di problematiche tecniche e teoriche che portano all’ ottenimento di risultati non molto convincenti. A parte alcune eccezioni i risultati ottenuti appaiono fortemente limitati dall’ incapacità di compiere analisi in grado di considerare molte unità neurali connesse tra loro contemporaneamente. L’accuratezza dei risultati ottenuti tramite “spike sorting” sembra essere molto influenzata dall’ accuratezza dei risultati delle registrazioni elettriche ottenute dalle prove sperimentali. Questa situazione rende precaria l’analisi dei dati, in quanto la registrazione dell’attività neurale mostra delle differenze significative a seconda del numero di neuroni implicati nell’analisi, del numero degli elettrodi di registrazione, della geometria di tali elettrodi e della modalità di connessione dei neuroni. Diventa chiaro come ad un problema di natura già complessa, come quello trattato, si vadano ad aggiungere ulteriori variabili che giocano un ruolo determinante per l’ottenimento di risultati corretti. Le formule applicate per l’estrapolazione delle caratteristiche dei segnali, nelle analisi statistiche effettuate, sono deficitarie di queste particolari specifiche. In altre parole è possibile sostenere che il modello matematico non è sufficientemente accurato, e che il suo livello di astrazione è troppo elevato. La delicatezza dei segnali elettrici risulta essere ancora più affascinate ( e al tempo stesso problematica per chi ne affronta lo studio ) se si considera l’elevatissimo livello di articolazione dell’ informazione trasportata. Basti pensare all’innumerevole quantità di movimenti possibili ad ogni singola parte del corpo umano, e che per ognuno di essi vi deve essere una differente produzione e/o interpretazione degli spike train. Successiva, ancora più dura, ma certamente interessante è la sfida che alcuni gruppi all’ avanguardia nel mondo hanno intrapreso occupandosi della costruzione di sistemi prostetici artificiali, caratterizzati da un interfacciamento diretto macchina-cervello. La prima grande complicazione da affrontare rispetto agli studi classici sinora qui trattati, riguarda la necessità di una corretta elaborazione dei dati in tempo reale. La quantità di dati con la quale si deve trattare risulta essere molto elevata. In tutti i metodi presentati in questo capitolo per l’analisi dei segnali neurali questa variabile non è mai stata 55 Capitolo 3 Tecniche classiche per la codifica dell’informazione neurale considerata. Le due fasi espresse nel paragrafo precedente ( fase di codifica e di decodifica ) vengono infatti svolte in maniera distanziata nel tempo. Dalla fase di codifica si cercano di estrapolare quelle che sono le basi matematiche che poi l’algoritmo, scritto in un secondo tempo, dovrà utilizzare come fondamento per la propria implementazione. Affinché i risultati ottenuti nella fasi di codifica possano essere considerati attendibili, si ha la necessità di svolgere un certo numero di registrazioni prolungate nel tempo. In questo modo i file generati durante le registrazioni sono di elevate dimensioni ( non inferiori al Gb ). Una macchina che deve essere in grado di compiere le proprie funzioni in tempo reale non può considerare accettabili tempi di elaborazione superiori al secondo. Riassumendo si può affermare che l’algoritmo necessario per un simile esperimento è un algoritmo in grado di svolgere ambedue le fasi ( codifica e decodifica ) in un tempo inferiore ad un secondo, basandosi su modelli matematici che ad oggi nessuno sembra in grado di elaborare, e con la capacità di variare in tempo reale alcuni dei propri parametri di decodifica a seconda dei risultati di codifica ottenuti in continuo durante l’acquisizione del segnale dalle cellule neurali. È inutile dire che algoritmi con simili caratteristiche non esistono e forse non potranno mai esistere, a causa dell’ enorme complessità computazionale del problema. 56 Capitolo 4 Introduzione alle reti neurali artificiali Capitolo 4 Introduzione alle reti neurali artificiali 4.1 Intelligenza artificiale classica, non classica e la teoria del connessionismo. La filosofia delle reti neurali, ispirandosi ai sistemi biologici visti nel capitolo precedente, considera un numero elevato di processori che hanno una capacità computazionale elementare, i neuroni artificiali o nodi, connessi ad altre unità dello stesso tipo (di qui il termine connessionismo che designa questo approccio) ( Pitt e McCulloch 1943 ). Ad ogni connessione è assegnato un peso, cioè può essere più o meno debole in modo tale che un neurone possa influenzarne un altro in funzione della “forza” della connessione fra i due, proprio come nei sistemi neurali biologici in cui un neurone (pre-sinaptico) influenza un altro neurone (post-sinaptico) in funzione del potenziale post-sinaptico della sinapsi fra l’assone del neurone presinaptico e il dendrite del neurone post-sinaptico. Ma più che sulla contrapposizione fra computer seriale e connessionismo è bene soffermarsi sulla contrapposizione fra intelligenza artificiale (IA) classica, legata storicamente alla logica dei calcolatori seriali e l’IA subsimbolica legata all’approccio connessionista ed alla computazione neurale ( Clark e Cowell (1976) ). L'IA classica si occupa della simulazione dei processi cognitivi superiori adottando un approccio di elaborazione simbolica. In base alla famosa ipotesi del sistema simbolico fisico per il comportamento intelligente è necessario e 58 Capitolo 4 Introduzione alle reti neurali artificiali sufficiente un sistema di occorrenze di simboli collegate in modo fisico e processi che operano su tale struttura simbolica; necessario perché un sistema che esibisce intelligenza generale mostrerà ad una successiva analisi di essere un sistema simbolico fisico; sufficiente perché ogni sistema simbolico fisico può essere organizzato per produrre intelligenza ( Newell e Simon 1976 ). Lo sviluppo dei sistemi intelligenti, di conseguenza, in questo approccio segue la filosofia computazionale tipica dei calcolatori digitali. Anche il calcolatore, infatti, è fatto di dati e di istruzioni per manipolare dati, dove sia i dati che le istruzioni sono simboli. Il comportamento intelligente può essere tradotto in un algoritmo opportuno e riprodotto attraverso il computer. Tale approccio metodologico ha portato allo sviluppo di sistemi in grado di risolvere teoremi, in quanto si pensava che questa fosse l’essenza del comportamento intelligente, mentre si ritenevano meno degni di attenzione processi quali possono per esempio essere le azioni di movimento del corpo in risposta ad una serie di stimoli. In realtà un bambino di un anno riconosce oggetti odori e sapori in base ai quali compie movimenti in modo più veloce ed accurato del più evoluto programma di IA implementato nel più veloce supercomputer. Questa evidenza sottolinea da una parte che i compiti di processamento delle immagini visive non sono banali, dall’altra rinforza la convinzione che il cervello umano sia di gran lunga superiore ai sistemi intelligenti artificiali e che debba tale superiorità alle caratteristiche della sua struttura interna. Tale struttura, permette al sistema biologico di avere diverse proprietà significativamente diverse da quelle dei sistemi artificiali ( Hertz, Krogh e Palmer 1991 ): • parallelismo; • robustezza e tolleranza agli errori. Le cellule nervose nel cervello muoiono ogni giorno senza avere effetti significativi sulla performance totale del sistema; 59 Capitolo 4 • Introduzione alle reti neurali artificiali flessibilità. La struttura si può facilmente adeguare a un nuovo ambiente attraverso l’apprendimento (non deve essere programmata in Pascal, Fortran o C); • capacità di trattare informazioni confuse, probabilistiche, indefinite o inconsistenti; • struttura piccola, compatta e che dissipa veramente poca energia. La simulazione della struttura dei sistemi neurali biologici potrebbe portare allo uno sviluppo di sistemi artificiali che conservino le caratteristiche del comportamento intelligente dei sistemi biologici. Ciò rappresenta un cambiamento di prospettiva piuttosto radicale rispetto alla computazione convenzionale. Il processo di calcolo nella computazione neurale è inteso come “metafora del cervello” in quanto tenta di modellarne la struttura, non più come “metafora del computer” dei sistemi artificiali classici, che focalizzavano l’attenzione su un processo, tradotto in un algoritmo opportuno e realizzato secondo la logica dei computer digitali. In altre parole il connessionismo utilizza il computer come strumento che consente di simulare i fenomeni tipici dei sistemi neurali biologici, e il calcolatore in questo modo diviene anche uno strumento di ricerca ma soprattutto una fonte di ispirazione per sviluppare teorie e modelli della mente ( Parisi 1986 ). Si è più volte ripetuto che le reti neurali si ispirano ai sistemi neurali biologici. Questo però non significa certamente avere la presunzione di costruire il cervello artificiale. Tanto più che le caratteristiche delle reti neurali biologiche riprese dalla computazione neurale artificiale sono un’esigua minoranza. Tom Schwartz nel 1989, a questo proposito, nota che i neuroni artificiali sono solo un’approssimazione dei neuroni biologici in quanto riproducono solo tre dei circa 150 processi che sono tipici dei neuroni del cervello umano ( Schwartz 1989 ). 60 Capitolo 4 Introduzione alle reti neurali artificiali Pertanto è bene sottolineare che la computazione neurale ha a che fare con le macchine, non con il cervello. In altre parole l’obiettivo è quello di costruire macchine ispirate a sistemi biologici che riproducano comportamenti intelligenti e non quello, come si è detto, di ricostruire artificialmente un cervello biologico. L’obiettivo di costruire tali macchine, d’altra parte, può essere guidato da diversi scopi: un approccio, che si potrebbe definire ingegneristico, è interessato alla macchina in sé in funzione delle applicazioni potenzialmente utili a scopo applicativo; un secondo approccio, che si potrebbe definire scientifico, è interessato alle macchine per le informazioni che possono trarne allo scopo di saperne di più riguardo ai sistemi intelligenti in generale e quindi anche riguardo ai sistemi biologici. La computazione neurale è detta anche subsimbolica: ciò vuol dire che il simbolo non è presente in modo esplicito in tali sistemi. Non esiste un algoritmo che traduca la realtà percepita, per esempio attraverso una telecamera, in un insieme di simboli che denotino gli oggetti percepiti nemmeno un insieme di manipolazioni possibili di tali simboli, come per esempio una serie di regole di produzione. La conoscenza nei sistemi neurali è distribuita: non è presente da qualche parte in modo esplicito come simbolo o insieme di simboli, ma il risultato dell’interazione di un numero elevato di neuroni attraverso le connessioni fra essi. Tali concetti verranno ripresi più avanti e risulteranno più chiari allorché si introdurrà la struttura di una rete neurale. Per ora basti ricordare due aspetti della computazione neurale: 1. si contrappone alla computazione digitale classica dei calcolatori di tipo Von Neumann dal punto di vista strutturale. I sistemi neurali sono caratterizzati da un parallelismo massiccio e la conoscenza è distribuita all’interno di tali sistemi. I computer digitali, invece, centralizzano le risorse computazionali deputandole ad un singolo processore (CPU) e le operazioni devono essere eseguite in modo seriale; 61 Capitolo 4 Introduzione alle reti neurali artificiali 2. all’interno dell’IA si situa in una dimensione parallela a quella della progettazione di sistemi simbolici. Non è necessariamente una posizione alternativa, ma un modo diverso di affrontare il problema della costruzione di sistemi intelligenti: simulare la struttura (il cervello) diviene funzionale alla produzione di macchine intelligenti, laddove l’IA simbolica focalizzava l’attenzione più sulla simulazione del processo. Infine è opportuno ricordare che la computazione neurale si serve, per la costruzione di modelli dei processi di percezione, memorizzazione e apprendimento, di un nuovo paradigma - il paradigma connessionista - che presuppone l’equivalenza fra il comportamento dinamico di un qualunque sistema a quello di una rete di unità interconnesse, in grado di attivarsi in presenza di segnali d’ingresso. Queste reti, come già detto, sono ispirate ai sistemi neurali biologici. Pertanto è opportuno partire da una descrizione delle proprietà delle reti neurali biologiche e, soprattutto, dei loro componenti elementari: i neuroni. 4.2 Architettura delle reti neurali. Un neurone artificiale, che all’interno del connessionismo prende il nome di processing element (PE), è l’unità computazionale atomica di una rete neurale (fig.4.1). Esso simula diverse funzioni di base del neurone biologico: valuta l’intensità di ogni input, somma i diversi input e confronta il risultato con una soglia opportuna. Infine determina quale sia il valore dell’output. Diversi stadi del processo verranno di seguito discussi uno ad uno. La raffigurazione schematica di un PE è illustrata nella seguente figura. 62 Capitolo 4 Introduzione alle reti neurali artificiali Fig 4.1 Un singolo PE (Processing Element, nodo o neurone artificiale. Si osservi che a diversi ingressi (i1, i2, ..., in) corrisponde un’unica uscita. Un neurone biologico, come si è detto, riceve diversi ingressi attraverso i dendriti. Così anche il neurone artificiale (PE o anche nodo) riceve diversi valori in ingresso (i1, i2,..., in). Tutti gli ingressi vengono sommati ed il risultato costituisce il valore computato dal PE. Se tale valore supera una certa soglia (fig.4.2), il neurone produce un segnale di output, o potenziale, altrimenti rimane silente. Fig 4.2 Un PE con la soglia. L’uscita viene comparata con la soglia q per produrre il Potenziale P. 63 Capitolo 4 Introduzione alle reti neurali artificiali Come si vede dalla figura 2.2, l’uscita U sarà data da : U= i1 + i2 + ... + in Tale caratteristica del PE, quella cioè di sommare algebricamente il valore dei suoi ingressi, rappresenta la prima funzione implementata dal neurone artificiale: la funzione somma. Comparando l’uscita U con un opportuno valore di soglia θ, il potenziale P sarà: P=U - θ Fig. 4.3 Esempio di somma pesata. Ogni ingresso i contribuisce alla somma in funzione del relativo peso w. Il valore della soglia θ è 1. Con i valori assegnati agli ingressi ed ai relativi pesi così come si vede in figura, il risultato della somma pesata sarà 1.75, mentre il potenziale di uscita, comparato con la soglia θ sarà 0.75. Si osservi che l’ingresso I3, pur essendo di valore superiore agli altri due ingressi, ha un effetto inibitorio sulla somma totale per effetto del suo peso w3=-1. Ad ogni ingresso deve essere assegnato un peso, cioè un valore numerico che modula l’impatto che ha tale ingresso sulla somma totale per determinare il potenziale del PE. In altre parole ogni ingresso contribuisce in modo maggiore o minore a determinare il superamento del valore di soglia e l’innesco del potenziale. Anche questa proprietà si ispira ad una caratteristica dei neuroni 64 Capitolo 4 Introduzione alle reti neurali artificiali biologici. La caratteristica in questione è propria delle sinapsi che l’assone di un neurone crea con il dendrite di un altro neurone. Dal punto di vista del neurone post-sinaptico, gli ingressi, costituiti dal potenziale di altri neuroni i cui assoni creano sinapsi sui suoi dendriti, vengono modulati proprio da tali sinapsi: alcuni di essi avranno un effetto maggiore sulla somma totale, altri addirittura avranno carattere inibitorio, cioè avranno l’effetto di abbassare il valore della somma totale degli ingressi e, di conseguenza, di diminuire la probabilità che essa superi il valore di soglia e si inneschi un potenziale. Questa proprietà dei sistemi biologici viene modellata nei sistemi connessionisti con il concetto matematico di peso. Il peso di una connessione è un valore numerico per il quale moltiplicare il valore dell’ingresso. In questo modo l’ingresso avrà un effetto maggiore o minore sulla somma totale degli ingressi in funzione dell’entità del peso (fig.4.3). La somma degli ingressi diventerà ora la somma pesata degli ingressi. Formalmente, per la definizione di somma pesata, la diventa: U= i1 *w1 +i2 *w2 + ... + in*wn Matematicamente si può pensare all’ingresso e al peso corrispondente come a vettori del tipo I = (i1, i2,..., in) e W = (w1, w2,..., wn). Il segnale d’ingresso totale, quello che si è chiamato la somma degli ingressi, sarà il prodotto scalare di questi due vettori (I•W). Si moltiplica cioè ogni componente del vettore i con il componente corrispondente del vettore w e si sommano tutti i prodotti (Ingresso1 = i1*w1, Ingresso2=i2*w2 e così via, poi si sommano Ingresso1 + Ingresso2 + ... + ingresson). Il risultato sarà uno scalare, la somma pesata degli ingressi; ogni ingresso partecipa alla somma in modo proporzionale all’entità del peso. 65 Capitolo 4 Introduzione alle reti neurali artificiali Un esempio pratico chiarirà ancor meglio il meccanismo. La figura 4.3 illustra una situazione in cui sono assegnati dei valori numerici agli ingressi, ai relativi pesi e alla soglia θ. Il PE incomincia la computazione facendo la somma pesata degli ingressi ik (k=1,...,n): In base alla definizione di somma pesata ogni ingresso ik deve essere moltiplicato per il relativo peso wk e i diversi valori pesati devono poi essere sommati. Il PE di figura 2.3 ha tre ingressi: per l’ingresso i1 il valore pesato sarà: i1 *w1 = 1.5 * 0.5 = 0.75 per l’ingresso i2 tale valore sarà: i2 *w2 = 1 * 3 = 3 allo stesso modo per l’ingresso i3 sarà: i3 *w3 = 2 * (-1) = -2 La somma dei tre valori pesati sarà: 0.75+ 3 - 2 =1.75 Tale valore (1.75) supera il valore di soglia, che è stato fissato a 1, quindi il potenziale del neurone, per la (2) sarà: 1.75 - 1 = 0.75. Si osservi che l’ingresso i3, pur avendo in origine un valore più elevato rispetto ad i2, per effetto del peso dà un contributo negativo (inibitorio) alla somma totale. Se la soglia fosse stata uguale a 2, la somma non avrebbe superato tale soglia ed il potenziale sarebbe stato nullo, proprio per il contributo determinante del peso w3 che ha conferito all’ingresso i3 un carattere inibitorio. 66 Capitolo 4 Introduzione alle reti neurali artificiali Si introdurrà ora un’ altra proprietà del neurone artificiale ispirata ancora una volta ad una proprietà del neurone biologico. Si è detto che il neurone biologico, a livello del soma, somma tutti i potenziali post-sinaptici dei dendriti. In realtà tale somma non è proprio la somma algebrica dei valori di tali potenziali; diversi fattori, fra cui la resistenza passiva della membrana del neurone, fanno sì che il risultato della somma di tali valori non sia l’esatta somma algebrica, ma una funzione, di solito non lineare, di tale somma. In altre parole il neurone artificiale somma gli ingressi pesati e poi modifica il risultato in base ad una determinata funzione f (fig.4.4). Tale funzione è detta funzione di trasferimento e, applicata all’uscita del PE determina il suo potenziale effettivo. Fig. 4.4 Il potenziale P del PE è una funzione f della somma pesata degli ingressi ik comparata con la soglia θ. Esistono diversi tipi di funzioni di trasferimento applicate ai PE delle reti neurali artificiali. a) funzione a gradino. Se il valore in ingresso alla funzione x è maggiore di zero il valore restituito f(x) è 1; se x è minore di zero, f(x) è uguale a -1. 67 Capitolo 4 Introduzione alle reti neurali artificiali Formalmente: La funzione a gradino può assumere valori bipolari (-1, 1), come quella descritta sopra, oppure valori binari (0, 1). In quest’ultimo caso se x è maggiore o uguale a zero f(x) assume valore 1, mentre se x è minore di zero, f(x) assume valore 0. b) funzione lineare con saturazione. Se il valore di x è compreso fra 0 e 1, f(x) diventa una funzione lineare e restituisce proprio il valore di x. D’altra parte la funzione appiattisce i valori per x<0, per cui f(x)=0, e per x>1, per cui f(x)=1. Formalmente: b) funzione sigmoide. Se il valore di x è 0, il valore restituito da f(x) è 0.5. Con l’aumentare del valore di x, f(x) tende asintoticamente a 1, mentre col diminuire di x, f(x) tende asintoticamente a 0. 68 Capitolo 4 Introduzione alle reti neurali artificiali Formalmente: La funzione sigmoide è continua e derivabile. Per questo viene usata nei modelli di rete neurale nei quali l’algoritmo di apprendimento richiede l’intervento di formule in cui compaiano derivate. e) funzione segno. Questo tipo di funzione ha una curva uguale alla precedente, ma passa per l’origine, e la f(x) può assumere anche valori negativi. Essa infatti restituisce valori compresi fra -1 e 1: con l’aumentare della x sull’asse positivo (x>0) la f(x) aumenta in modo asintotico e tende ad 1, mentre con l’aumentare della x sull’asse negativo (x<0) la f(x) tende in modo asintotico a -1. Per x=0, f(x) è nulla. Formalmente: Dopo aver descritto le proprietà di un PE, anche chiamato nodo, si passerà ora a descrivere l’architettura vera e propria di una rete neurale. Ciò significa da una parte illustrare fisicamente l’architettura di una rete neurale artificiale, dall’altra stabilire il ruolo di ogni singolo PE all’interno di tale struttura. Si supponga di avere diversi ingressi e diversi nodi in modo tale che ciascun ingresso sia connesso a tutti i nodi. 69 Capitolo 4 Introduzione alle reti neurali artificiali Fig. 4.5 Struttura fondamentale di una rete neurale. Ogni ingresso ik (k=1,..., n) è connesso con tutti i nodi di uscita oh (h=1,..., m); I pesi wnm determinano quanto ogni ingresso influisca sull’uscita di ogni nodo (PE). Ogni ingresso ik (k=1,..., n) è connesso con tutti i nodi di uscita oh (h=1,..., m); ogni nodo oh possiede tutte le proprietà descritte precedentemente e svolge la sua attività parallelamente a quella degli altri nodi. Presentando un pattern in ingresso si avranno dei valori per le uscite che dipendono sia dai valori in ingresso, sia dai pesi della rete. In generale un peso determinerà quanto l’ingresso relativo è in grado di influenzare un particolare nodo (fig.4.5). L’insieme dei nodi, della struttura di fig. 4.5 prende il nome di strato. Le reti neurali possono essere anche a più strati. In una certa misura ogni strato aggiunto alla rete ne aumenta la capacità computazionale. Gli ingressi I sono valori numerici che vengono valutati dai pesi delle connessioni con il primo strato di nodi H ( detto anche strato hidden o nascosto). Qui ogni nodo esegue la computazione ed eventualmente produce un potenziale che, a sua volta, si propaga verso i nodi dello strato di uscita O. Il potenziale prodotto dai nodi di uscita O costituisce l’uscita computata dalla rete neurale. 70 Capitolo 4 Introduzione alle reti neurali artificiali In generale quando si parla di architettura di una rete neurale si fa riferimento al modo in cui sono connessi i diversi nodo l’uno con l’altro. L’architettura per strati è tipica delle reti neurali feed-forward. Tali reti sono caratterizzate dal fatto che l’attivazione dei nodi d’ingresso si propaga in avanti verso quelli dello strato (o degli strati) nascosto e da questi verso quelli dello strato di uscita. Se nella rete ci fossero delle connessioni di ritorno (retroazione) avremmo delle strutture di tipo recurrent (o feedback); si tratta di reti dinamiche le cui uscite, opportunamente modificate, vengono retroazionate agli ingressi causando una sequenza di valori di uscita fino al raggiungimento della stabilità. Cambiando il modo in cui sono connessi i nodi l’uno all’altro, si cambia l’architettura della rete. Ciò non ha solo conseguenze di ordine pratico in quanto muta la capacità computazionale della rete, ma ha anche importanti conseguenze di ordine teorico che coinvolgono il concetto di apprendimento. 4.3 Reti artificiali che apprendono. Uno dei concetti fondamentali per computazione neurale è quello di apprendimento. Fino ad ora si è parlato di reti neurali dal punto di vista delle unità computazionali elementari, i PE o nodi, e dal punto di vista dell’architettura, il modo cioè in cui tali unità sono connesse fra loro all’interno di una struttura. Ora è necessario vedere in che modo una rete neurale apprende ad emettere risposte appropriate in relazione a determinati pattern d’ingresso, incominciando a definire il concetto stesso di apprendimento in ordine alla computazione neurale. L’apprendimento potrebbe essere definito come la modifica del comportamento in conseguenza dell’interazione con l’ambiente e il risultato dell’esperienza che determina l’emergere di nuovi pattern di risposta agli stimoli esterni. Volendo adattare tale definizione ad una rete neurale, è necessario definire innanzi tutto cosa si intende per interazione con l’ambiente, 71 Capitolo 4 Introduzione alle reti neurali artificiali stimoli esterni e pattern di risposta di una rete neurale. Poi bisogna descrivere in che modo la rete neurale accumula esperienza. Saranno questi gli argomenti dei paragrafi che seguono. 4.3.1 L’apprendimento. La capacità sorprendente di apprendere propria dei sistemi neurali biologici risiede nella loro grande plasticità a livello microstrutturale ( Hebb 1949 ). Le sinapsi modificano le loro proprietà in relazione a particolari stimoli esterni per far sì che il sistema neurale nel suo complesso produca risposte adeguate a determinati stimolo ambientali. Questa è la caratteristica a cui si ispirano i sistemi neurali artificiali che apprendono. In altre parole concetti come interazione con l’ambiente, stimoli e pattern di risposta trovano i loro corrispondenti all’interno della computazione neurale. Dire che una rete interagisce con l’ambiente significa sostanzialmente affermare che dall’ambiente riceve gli stimoli attraverso i suoi ingressi ( input ), e risponde attraverso la produzione di un pattern di uscita ( output ). La risposta della rete neurale deve essere modificata in modo da diventare il più appropriata possibile al pattern d’ingresso in quel momento. Questo viene ottenuto variando il valore dei pesi delle connessioni in modo che in presenza di un determinato pattern in ingresso alla rete si abbia una risposta corrispondente. La forma della risposta della rete, il pattern di uscita, può essere decisa a priori. In questo caso si parla di apprendimento supervisionato: l’operatore umano decide che in corrispondenza di un determinato pattern vi debba essere una determinata risposta. Altrimenti, se la forma della risposta non è nota a priori, si parla di apprendimento non supervisionato. La differenza fra i due tipi di apprendimento sta nell’algoritmo che si adotta per far apprendere la rete. 72 Capitolo 4 Introduzione alle reti neurali artificiali L’algoritmo di apprendimento specifica in che modo vengono modificati i pesi in modo tale da far sì che la rete apprenda. Successivamente sono illustrati i principi di funzionamento generali delle due classi di algoritmi di cui si parlava sopra: gli algoritmi con supervisione e quelli senza supervisione. La logica su cui si fonda l’algoritmo per l’apprendimento supervisionato è quella di modificare i pesi delle connessioni in modo tale che, dato un pattern d’ingresso alla rete, il pattern d’uscita corrisponda ad una forma già definita a priori. Il più celebre di questi algoritmi è senz’altro chiamato Back-propagation ( Rumelhart e McClelland 1986 ). Gli algoritmi di apprendimento non supervisionato seguono una logica sostanzialmente diversa. La forma dell’output non è conosciuta a priori e l’aggiustamento dei pesi della rete neurale avviene in base ad alcune valutazioni della qualità del pattern d’ingresso da parte delle funzioni dell’algoritmo stesso. Per esempio un pattern può avere più elementi attivi, diversi da zero, di un altro: i pesi della rete verranno modificati in modo tale che presentando in ingresso il primo dei due pattern si avrà una certa risposta, mentre presentando il secondo se ne avrà un’altra in base al criterio della numerosità degli elementi attivi. Il seguente esempio potrebbe essere molto utile per chiarire il concetto di pattern d’ingresso e di pattern di uscita corrispondente all’interno delle due categorie di algoritmi. Nella fig. 4.6 è illustrata una rete neurale che processa 73 Capitolo 4 Introduzione alle reti neurali artificiali Fig. 4.6 Esempio di rete neurale che processa un pattern in ingresso I e computa un’uscita O. I nodi d’ingresso corrispondono ai pixel di una retina artificiale di 4×5 elementi. I nodi ombreggiati hanno valore 1, quelli bianchi hanno valore 0. Ogni nodo d’ingresso è connesso a tutti i nodi nascosti H (per motivi di leggibilità sono raffigurate solo le connessioni di un nodo d’ingresso). Ogni nodo nascosto è connesso con i due nodi di uscita. Ad ogni connessione è associato un peso. La modifica dei pesi operata dall’algoritmo d’apprendimento fa sì che la rete apprenda le associazioni ingresso-uscita. un pattern d’ingresso I costituito da una retina artificiale di 4×5 pixel. Come si può osservare, il pattern di sinistra rappresenta una ‘F’ mentre quello di destra una ‘L’. I pixel ombreggiati avranno valore uno, mentre gli altri avranno valore zero. L’insieme dei valori binari zero ed uno costituiscono gli ingressi alla rete ed ogni ingresso è connesso a tutti i nodi dello strato nascosto H ( per motivi di leggibilità in figura 4.6 sono raffigurate solo le connessioni di un ingresso ). L’uscita della rete è costituita da due nodi. 74 Capitolo 4 Introduzione alle reti neurali artificiali Ora si supponga che il compito della rete debba essere quello di classificare l’immagine in ingresso: se l’immagine raffigura una ‘F’ (pattern di sinistra) il valore del nodo di uscita di destra deve essere uno e quello del nodo di sinistra zero; viceversa se in ingresso vi è il pattern corrispondente all’immagine ‘L’ (pattern di destra). I pesi della rete neurale all’inizio avranno valori casuali, in quanto risulterebbe assai arduo definirli in modo manuale. La risposta della rete neurale, pertanto, sarà casuale: applicando in ingresso una immagine o l’altra si avranno risposte casuali, cioè il valore dei nodi non sarà quello desiderato. Per far sì che tale valore sia effettivamente quello desiderato si deve applicare alla rete un algoritmo di apprendimento che modifichi i pesi della rete in modo che la sua risposta sia coerente con il pattern di ingresso, nel modo descritto sopra. Di seguito sarà descritto schematicamente il significato dell’applicazione di un algoritmo di apprendimento supervisionato e non supervisionato. 1. Apprendimento con supervisione significa sostanzialmente che alla rete è necessario fornire degli esempi e che la modifica dei pesi avviene in base al confronto fra uscita effettiva della rete (sbagliata, all’inizio) e uscita desiderata. La modifica dei pesi fa sì che l’uscita corretta e quella desiderata convergano. Riguardo all’esempio di fig 4.6, il procedimento schematico potrebbe essere il seguente: si presenta alla rete il pattern di sinistra e si calcola l’uscita. Poiché ai pesi viene dato valore casuale, anche l’uscita sarà casuale. Si confronta tale uscita con quella desiderata (valore 1 al nodo di sinistra, 0 a quello di destra) e in base alla differenza uscita effettiva/uscita desiderata si modificano i pesi della rete. Poi si presenta il pattern di destra e si compie la stessa operazione di confronto e modifica dei pesi, sennonché in questo caso l’uscita desiderata è diversa (valore 0 al nodo di sinistra, 1 a quello di destra) e la modifica dei pesi verrà operata in questo senso. Ripetendo tale operazione un numero elevato di volte la rete incomincia a restituire risposte sempre più simili a quelle desiderate; la struttura dei pesi cambia in modo che presentando il pattern d’ingresso di sinistra si attiva il nodo di uscita sinistro, mentre presentando il 75 Capitolo 4 Introduzione alle reti neurali artificiali pattern di destra, sempre alla rete con la stessa struttura di pesi, si attiva il nodo di destra. Questa caratteristica prende il nome di superimposizione. In questo modo si costruisce la capacità della rete neurale di raggiungere una struttura interna tale che la stessa struttura reagisca in modo diverso a pattern di ingresso diversi, fornendo uscite consistenti con tali pattern. In questo caso, ciò avviene in base all’associazione ingresso-uscita decisa dal supervisore. Su questo argomento si ritornerà in modo più diffuso in seguito. 2. Apprendimento senza supervisione significa che l’algoritmo di apprendimento è in grado di identificare differenze fra i pattern di ingresso basandosi solamente su caratteristiche fisiche di tali pattern. Per esempio, considerando sempre la fig. 4.6, la matrice di pixel di sinistra è diversa da quella di destra sia da un punto di vista quantitativo (i pixel attivati nella matrice di sinistra sono tre in più che in quella di destra), che da un punto di vista qualitativo (per esempio la disposizione spaziale dei pixel attivati è diversa). Basandosi sull’uno o sull’altro tipo di proprietà del pattern d’ingresso o su entrambi, l’algoritmo modifica i pesi in modo da enfatizzare le differenze fra i pattern a livello dell’uscita. Pertanto, ad apprendimento ultimato, presentando il pattern di sinistra si attiverà uno dei due nodi, mentre presentando in ingresso il pattern di destra si attiverà quello opposto. La differenza fondamentale dall’algoritmo di apprendimento supervisionato è che non è necessario sapere a priori la forma dell’uscita e quindi non è necessario un confronto uscita effettiva - uscita corretta. La conseguenza, nell’esempio di fig 4.6, è che non è possibile stabilire a priori quale dei due nodi di uscita risponderà a ciascuno dei pattern d’ingresso. In altre parole può darsi che alla fine di un apprendimento non supervisionato sia il nodo di destra a rispondere al pattern di sinistra e viceversa. 76 Capitolo 4 Introduzione alle reti neurali artificiali Fig. 4.7 Presentando alla rete, addestrata con i pattern a sinistra e centrale all’apprendimento dell’associazione ingresso-uscita raffigurata, un nuovo pattern che non partecipava all’apprendimento (a destra) l’uscita della rete sarà coerente con le caratteristiche del nuovo pattern in relazione a quelle dei pattern di addestramento. In questo il pattern di richiamo possiede caratteristiche comuni ad entrambi i pattern di addestramento, con una affinità leggermente maggiore per il pattern ‘L’. Si è accennato al concetto di superimposizione come la proprietà di una rete neurale di raggiungere, dopo l’apprendimento, una configurazione dei pesi stabile in modo tale che presentando pattern diversi in ingresso alla stessa rete essa fornisca risposte diverse per ognuno di questi pattern, coerenti con gli esempi forniti nella fase di apprendimento. Un altro concetto fondamentale della computazione neurale è quello di generalizzazione. Per illustrarlo si richiamerà l’esempio di fig.4.6. Cosa succederebbe se alla rete neurale che ha appreso ad associare gli ingressi e le uscite nel modo di fig. 4.6 si presentasse un altro pattern d’ingresso, ad esempio corrispondente ad una ‘C’, come illustrato in figura 4.7? La risposta più plausibile è che la rete fornisca un a risposta a metà fra quella alla ‘F’ e quella alla ‘L’. La spiegazione deriva dal fatto che in fase di apprendimento, la 77 Capitolo 4 Introduzione alle reti neurali artificiali struttura interna della rete, ovvero il valore dei pesi, si è modificata in modo da ricercare i tratti distintivi delle due matrici utilizzate per l’apprendimento. Osservando la fig. 4.7, il pattern che raffigura la ‘C’ presenta caratteristiche intermedie fra quello che raffigura la ‘F’ e quello che raffigura la ‘L’: la differenza fra la ‘F’ e la ‘L’ nella matrice di pixel è principalmente nel fatto che i pixel della prima riga della matrice ‘F’ sono attivi (=1) mentre quelli della matrice ‘L’ non lo sono (=0); viceversa per i pixel dell’ultima riga. Nel pattern relativo alla ‘C’, invece, sono attivi sia i pixel della prima riga che quelli dell’ultima. La rete neurale, quindi, processerà le caratteristiche del nuovo pattern e fornirà una risposta intermedia fra quelle relative ai pattern usati per l’apprendimento, con una leggera propensione per l’uscita relativa al pattern ‘L’ che per quella relativa al pattern ‘F’ (0.6 contro 0.4) perché con esso è maggiore l’affinità. I pattern utilizzati nella fase di apprendimento sono chiamati pattern di addestramento ( training set ). Quando si presenta un pattern nuovo alla rete e la fase di apprendimento è finita, come in questo caso, tale pattern prende il nome di pattern di richiamo ( testing set ). Il pattern di richiamo viene processato in base alle stesse proprietà dei pattern di addestramento per cui la rete ha appreso ad associare tali pattern ad una specifica uscita. La capacità della rete di riconoscere anche i pattern di richiamo prende il nome di generalizzazione. 4.3.2 Le regole per l’apprendimento. Vengono di seguito illustrate quelle che sono considerate le due regole principali per l’aggiornamneto dei pesi all’interno di una rete neurale artificiale. L’apprendimento della rete si esprime attraverso la seguente formula di aggiornamento dei pesi wij(t)=wij (t-1) + .wij 78 Capitolo 4 Introduzione alle reti neurali artificiali dove t il passo attuale e .wij è la variazione dei pesi che può essere ottenuta attraverso diverse leggi. La regola più usata per aggiustare i pesi di un neurone è la Delta rule o regola di Widrow - Hoff . Sia x = (x1 ,…,xn ) l’ingresso fornito al neurone. Se y’ ed y sono, rispettivamente, l’uscita desiderata e l’uscita neurale,l’errore è dato da d = y’-y La delta rule stabilisce che la variazione del generico peso wi . è: ∆wi = η δ xi dove η è un numero reale compreso tra 0 e 1 detto learning rate . Il learning rate determina la velocità di apprendimento del neurone. La delta rule modifica in maniera proporzionale all’errore solo i pesi delle connessioni che hanno contribuito all’errore (cioè che hanno xi diverso da 0). Al contrario, se xi =0, wi non viene modificato poiché non si sa se ha contribuito all’errore. Il nuovo valore dei pesi è quindi: wi = wi + ∆wi Un’altra legge comunemente usate è la Legge di Hebb, legge di origine biologica. Siano xi e yi due nodi, allora la variazione dei pesi avverrà secondo la seguente legge: ∆ wij= xiyj ossia lo stimolo fornito da un neurone ad un altro attraverso l’assone, rinforza la connessione ( ossia il peso ). Il peso della sinapsi sarà variato dal prodotto degli stati dei due neuroni: aumentando il peso se i due neuroni hanno valori concordi, diminuendolo in caso di valori discordi. 79 Capitolo 4 Introduzione alle reti neurali artificiali 4.4 Applicazioni generali. Dal punto di vista del tipo di utilizzo possiamo distinguere tre categorie basilari: • memorie associative; • simulatori di funzioni matematiche complesse (e non conosciute); • classificatori. Le memorie associative possono apprendere associazioni tra patterns (insieme complesso di dati come un insieme di pixels di una immagine) in modo che la presentazione di un pattern A dia come output il pattern B anche se il pattern A è impreciso o parziale (resistenza al rumore). Esiste anche la possibilità di utilizzare la memoria associativa per fornire in uscita il pattern completo in risposta ad un pattern parziale in input. Le reti sono inoltre in grado di comprendere la funzione che lega output con input in base a degli esempi forniti in fase di apprendimento. Dopo la fase di apprendimento, viene fornito un output in risposta ad un input anche diverso da quelli usati negli esempi di addestramento. Ne consegue una capacità della rete di interpolazione ed estrapolazione sui dati del training set. Tale capacità è facilmente verificabile addestrando una rete con una sequenza di dati input/output proveniente da una funzione nota e risulta, invece, utile proprio per il trattamento e la previsione di fenomeni di cui non sia chiaro matematicamente il legame tra input e output. In ogni caso la rete si comporta come una "black box", poiché non svela in termini leggibili la funzione di trasferimento che è contenuta al suo interno. Di questo tipo fa parte la rete a retropropagazione dell’ errore o “error back propagation”. Le reti neurali permettono di classificare dati in specifiche categorie in base a caratteristiche di similitudine. In questo ultimo tipo di rete esiste il concetto di apprendimento non supervisionato o "autoorganizzante", nel quale i dati di 80 Capitolo 4 Introduzione alle reti neurali artificiali input vengono distribuiti su categorie non predefinite ( Kohonen 1993, Kohonen 1995c ). L’algoritmo di apprendimento di una rete neurale dipende essenzialmente dal tipo di utilizzo della stessa, così come l’architettura dei collegamenti. Le reti multistrato supervisionate prevedono ad esempio l’algoritmo a retropropagazione dell’errore. 81 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM Capitolo 5 La rete SOM e l’evoluzione ad ITSOM. 5.1 SELF ORGANIZING MAP (SOM) La Self-Organizing Map (SOM) è una tra le più importanti architetture di reti neurali ( Kohonen 1982 ). È stata sviluppata principalmente da Teuvo Kohonen tra il 1979 e il 1982, in parte sulla base di studi svolti precedentemente ( Von der Malsburg 1973, Willshaw e Von der Malsburg 1976 ). Nelle SOM viene definito, come elemento caratteristico, uno strato, detto strato di Kohonen, costituito da neuroni artificiali disposti spazialmente in modo ordinato. Possono teoricamente considerarsi strati di Kohonen monodimensionali, bidimensionali, tridimensionali, e anche a più di tre dimensioni. La dimensionalità tipica per lo strato di Kohonen è di due dimensioni, e a questa ci si riferirà nel seguito, se non altrimenti specificato. Tale strato di processing elements ( PE o neuroni artificiali ) si evolve durante l’apprendimento, come vedremo, specializzando le posizioni dei singoli PE come indicatori delle caratteristiche statistiche importanti degli stimoli di ingresso. Questo processo di organizzazione spaziale delle caratteristiche di dati di ingresso è chiamato anche “Feature Mapping”. Le SOM realizzano il feature mapping con una tecnica di apprendimento non supervisionato, da cui il nome che indica l’auto-organizzazione ( Kohonen 1990, Kohonen 1991, Kohonen 1993 ). Una delle più importanti applicazioni è proprio, in generale, la 82 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM rappresentazione in una mappa, solitamente bidimensionale, delle topologie associate ai dati di ingresso definiti in spazi con elevata dimensionalità e, quindi, l’applicazione in problemi di raggruppamento dei dati (data clustering). Come molte architetture di reti neurali, anche le SOM hanno basi biologiche che ispirano il modello proposto. Una prima analogia tra il sistema biologico e quello artificiale delle SOM è a livello di funzionamento macroscopico del cervello. Nel cervello umano, durante la crescita, avviene una suddivisione in aree specializzate per stimoli di ingresso. In modo analogo nelle SOM, durante l’apprendimento, si ha la creazione di una mappa nello strato di Kohonen divisa in regioni, ciascuna delle quali risponde a una particolare regione dello spazio di ingresso. Un’ulteriore analogia si ha a livello più microscopico, ovvero a livello di tessuto nervoso laminare. Si può osservare, infatti, come in un tale tipo di tessuto, sotto l’azione di uno stimolo, i neuroni manifestano attività in modo coordinato. Un gruppo di neuroni contigui si organizza in una “bolla” ad alta attività, ben delimitandosi da tutti gli altri neuroni a bassa attività. Questo fenomeno di formazione di bolle viene modellato nella rete di Kohonen, come vedremo, con un meccanismo di aggiornamento dei pesi esteso al vicinato del PE vincitore. Le SOM sono costituite da due strati (fig. 5.1): uno strato unidimensionale di ingresso, con un PE per ognuna delle N componenti dell’ingresso X=(x1, x2, …, xN) e uno strato, tipicamente bidimensionale, detto di Kohonen, costituito da M = MR · MC PE disposti in una griglia bidimensionale di MC PE per riga e MR PE per colonna. Il generico PE dello strato di Kohonen, verrà indicato con PEr, con r = 1, 2, …, M. Lo strato di ingresso è completamente connesso allo strato di Kohonen: ogni PE dello strato di Kohonen ha in ingresso tutti i PE dello strato di ingresso. 83 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM Fig. 5.1 Illustrazione dei due strati che compongono la rete di Kohonen. In particolare si nota la struttura bidimensionale dello strato di Kohonen e la sua completa connessione con la strato di ingresso. Al generico PE dello strato di Kohonen è associato un vettore di pesi relativi ai collegamenti dai PE di ingresso. Il vettore associato al generico PEr dello strato di Kohonen sarà indicato con il vettore Wr = (wr1, wr2, …, wrN). L’ingresso della rete è costituito da valori definiti nell’insieme dei reali, senza particolari limitazioni. Tuttavia, nella pratica, è spesso conveniente presentare allo strato di ingresso vettori normalizzati. I PE dello strato di ingresso hanno l’unica funzione di strato di buffer: non effettuano nessuna modifica sull’ingresso che gli viene presentato. Dallo strato di Kohonen viene estratta l’informazione d’uscita. In questo strato i PE vengono fatti funzionare in competizione. Nel funzionamento base ad ogni presentazione di un ingresso un PE viene eletto come vincitore. L’informazione di uscita è in questo caso la posizione del PE nella griglia, ed è quindi una informazione a valori discreti. L’operazione effettuata tra ingresso e uscita è anche chiamata quantizzazione vettoriale. Lo strato di Kohonen non è comunque semplicemente definibile come strato di uscita. Esso è soprattutto lo strato cuore della rete in cui l’algoritmo competitivo opera. 84 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM La prima operazione a cui la rete viene sottoposta è l’inizializzazione. Le variabili fondamentali da inizializzare sono i vettori dei pesi. Per essi è sufficiente scegliere piccoli valori casuali, facendo inoltre in modo che non ci siano PE con uguali vettori. La fase successiva consiste nell’apprendimento da parte della rete dei valori di un insieme di ingresso ( training set ). Durante questa fase i vettori di ingresso vengono presentati alla rete in modo casuale o ciclico fino al raggiungimento di uno stato di equilibrio. L’apprendimento nelle SOM è di tipo non supervisionato ( Kohonen 1991, Kohonen 1995b ). Non esiste dunque alcun supervisore che durante l’apprendimento proponga il target corretto per l’ingresso presentato: l’algoritmo usato fa sì che la rete sia in grado di correggere i pesi dopo la presentazione di ogni ingresso autoorganizzandosi. In particolare, il meccanismo è il seguente: detto X il vettore d’ingresso presentato durante un ciclo generico d’apprendimento, viene calcolato quale PE tra i generici PEr dello strato di Kohonen ha vettore dei pesi Wr più vicino ad esso. Tale PE, eletto come vincitore, verrà indicato con PES. La vicinanza dei vettori può essere misurata in diversi modi. Un primo modo è quello di misurarla in termini di prodotto scalare Cr dei vettori dei pesi Wr associati ai PE dello strato di Kohonen con il vettore di ingresso X, eleggendo come vincitore PES il PE per il quale il prodotto scalare ha valore massimo (Cs): Un altro modo per calcolare la vicinanza è tramite la distanza euclidea Dr tra i vettori dei pesi Wr associati ai PE dello strato di Kohonen con il vettore di 85 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM ingresso X, eleggendo come vincitore PES il PE per il quale la distanza euclidea è minima (Ds): D’altra parte si può dimostrare che, se i vettori di ingresso e dei pesi sono normalizzati, i due modi sopra descritti sono equivalenti, ovvero il vettore dei pesi con minima distanza euclidea dal vettore di ingresso coincide con il vettore dei pesi a massimo prodotto vettoriale con esso ( Kohonen 1991 ). La SOM prevede a questo punto un meccanismo cosiddetto di inibizione laterale, che e' presente anche in natura sotto forma di trasformazioni chimiche a livello sinaptico. Nella regione corticale del cervello, infatti, neuroni fisicamente vicini ad un neurone attivo mostrano legami più forti, mentre ad una certa distanza da questo iniziano a mostrare legami inibitori. In questa architettura, ciascun elemento riceve sia stimoli eccitatori da parte degli elementi adiacenti ( la cosiddetta neighborhood ), sia stimoli inibitori da parte degli elementi più lontani, secondo la cosiddetta forma "a cappello messicano" (fig.5.2). Fig 5.2 Classica forma “ a cappello messicano” che descrive la probabilità di vittoria di un neurone, appartenente allo strato competitivo della SOM, in funzione della distanza rispetto al neurone vincente. 86 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM L'esistenza della neighborhood e' utile per non polarizzare la rete su pochi neuroni vincenti. In tal modo vengono attivati solo gli elementi con distanza al di sotto di un certo valore, in casi restrittivi solo l'unità con minima distanza. Basandoci sulla distanza euclidea d, definita nello strato di Kohonen, tra il generico PEr e il PEs eletto vincitore. In sostanza si definisce una funzione h(d) che descrive l’entità con cui il generico PEr. subirà l’aggiornamento ∆W(d) del relativo vettore dei pesi Wr. L’aggiornamento sarà del tipo: La funzione h(d), tipicamente, ha valori positivi, con massimo per d = 0, ed è decrescente all’aumentare di d. Dunque ad ogni aggiornamento i vettori dei pesi dei PE vengono spostati verso l’ingresso presentato, con una intensità decrescente all’aumentare della distanza dal PE eletto come vincitore per quell’ingresso. Lo strato di Kohonen è quindi una matrice di PE che vengono fatti funzionare in competizione e che tende, ciclo dopo ciclo, a far sì che i vettori associati a questi PE si assimilino ai differenti pattern di ingresso. La SOM effettua così una quantizzazione vettoriale, ossia una mappatura da uno spazio a molte dimensioni in uno spazio con numero minore di dimensioni, conservando la topologia di partenza. In altre parole viene effettuata una forma di clustering di tipo Nearest Neighbor (NN), in cui ogni elemento dello strato competititvo viene a rappresentare la classe di appartenenza degli elementi di input. La classificazione NN classifica un pattern a seconda del più piccolo valore ottenuto fra tutte le distanze da un insieme di pattern di riferimento. Questo metodo è utile per separare classi rappresentabili da segmenti di iperpiani ( Kohonen 1995a ). 87 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM Per questo motivo la SOM classifica bene pattern topologicamente ben distribuiti, ma si trova in maggiore difficoltà nel caso di distribuzioni non lineari. Inoltre appare evidente l'importanza della configurazione iniziale dei pesi, che deve essere il più possibile simile alla topologia di input. L'equazione di aggiornamento dei pesi mostra che minore è il valore della dimensione del vicinato, minore è il numero di PE il cui vettore dei pesi viene spostato significativamente durante un ciclo di apprendimento. In questo modo è maggiore la possibilità per i PE di differenziarsi, ovvero è maggiore il numero di gradi di libertà che ha la rete per auto-organizzarsi e ordinare i dati di ingresso nella mappa di Kohonen. Maggiori sono i gradi di libertà con cui una rete può adattarsi a un dato ingresso, maggiori dettagli possono essere appresi e codificati e maggiore risulta, comunque, la complessità di questo processo di apprendimento. Una volta che la rete ha appreso, essa può essere utilizzata per fornire risposte in uscita in corrispondenza ad ingressi presentati. Come già accennato, l’uscita viene estratta dallo strato di Kohonen, addestrato durante la fase precedente di learning. Il valore di uscita è sostanzialmente la posizione del PE vincitore. Questa può essere indicata con un vettore di M componenti, tante quanti sono i PE dello strato di Kohonen: U = (u1, u2, …, uM), avente tutte le componenti a valore zero, tranne quella del PE vincitore (PEs): In alternativa, in certi casi può essere utile usare come valore di uscita, il vettore dei pesi del PE vincitore: Ws = (ws1, ws2, …, wsN), che è fisso una volta che la rete è stata addestrata. Nell’algoritmo base l’apprendimento prevede che ad ogni presentazione di un nuovo ingresso vengano coinvolti il PE vincitore e i PE del vicinato. Accade quindi che a fine apprendimento i PE rappresentino con maggiore dettaglio quelle regioni dello spazio di ingresso per le quali sono state date maggiori informazioni durante l’apprendimento, ovvero per le quali sono stati forniti valori in ingresso con maggiore frequenza. Questo fenomeno è normalmente un effetto indesiderato. Per contrastare questo inconveniente è stato proposto 88 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM un meccanismo, detto di coscienza durante l’apprendimento ( Kohonen 1995a, Kohonen 1995c, Kohonen 1996 ). Il principio di base del meccanismo è quello di considerare, per l’elezione del PE vincitore, le distanze tra vettore dei pesi del PE e vettore di ingresso opportunamente modificate. Queste vengono aumentate se il PE sta vincendo con frequenza superiore alla frequenza di vittoria uniformemente distribuita (1/M), vengono invece diminuite nel caso opposto. Tale correzione ha come effetto quello di far diminuire le differenze nelle frequenze di vittoria dei PE, dovute a ingressi presi con probabilità non uniforme nello spazio di ingresso ( Kohonen 1991 ). 5.2 ITSOM ( Inductive Tracing Self Organizing Map ) La SOM ha dei limiti, tra cui quello della difficoltà di risalire all’input una volta generata la classificazione ( Ermentrout 1992 ). Per ovviare a questo inconveniente è stata sviluppata l’architettura ITSOM. Osservando la sequenza temporale dei neuroni vincenti di una SOM si nota che questa tende a ripetersi creando una serie temporale costituente attrattori caotici o precisi cicli limite, e che questi caratterizzano univocamente l’elemento di input che li ha prodotti. Di fatto la regola di apprendimento fa sì che il peso vincitore rappresenti un’approssimazione del valore dell’input ( Pizzi et al. 1998 ). All’ interno dell’ architettura ITSOM, ad ogni epoca il nuovo peso vincitore, insieme al peso che ha vinto nell’epoca precedente, va a costituire un’approssimazione del second’ordine del valore di input, e così via. E’ quindi possibile ricavare il valore dell’input confrontando le configurazioni caratteristiche di ciascun input con le configurazioni proprie di vettori di cui è noto il valore ( Ermentrout 1992, Pizzi et al. 1998 ). 89 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM Viene così effettuato un vero e proprio processo di induzione, perché una volta prodotta una quantizzazione vettoriale molti-a-pochi dall’input sullo strato dei pesi, si opera un passaggio pochi-a-molti da configurazioni note di neuroni vincenti alla totalità degli input. Questa forma di induzione (fig.5.3) è molto più fine di quella ricavabile risalendo dall’unico neurone vincente di una rete SOM portata a convergenza agli input ad esso corrispondenti, perchè i neuroni dello strato competitivo sono troppo pochi per fornire una classificazione significativa. Altro è far riferimento ad un insieme di neuroni, la cui configurazione può assumere un’altissima varietà di forme, dalle quali si potrà discriminare le diverse caratteristiche dell’input. Fig. 5.3 Architettura di una ITSOM. Va sottolineato che la caratteristica di questa rete è che non necessita di essere portata a convergenza, perchè le configurazioni di neuroni vincenti raggiungono la stabilità necessaria entro poche decine di epoche. Si è verificato che per ottenere i migliori risultati la rete non deve polarizzare su troppo pochi neuroni ma nemmeno disperdersi su tutto lo strato. L’algoritmo verificato ottimale per riconoscere le configurazioni create dalla rete si basa sul metodo dello z-score. I punteggi cumulativi relativi a ciascun input vengono normalizzati secondo la distribuzione della variabile standardizzata z data da 90 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM Dove µ e’ la media dei punteggi sui vari neuroni dello strato dei pesi e σ lo scarto quadratico medio. Fissata una soglia 0 < τ ≤ 1, che costituisce quindi uno dei parametri di questo tipo di rete, si pone poi z = 1, se z > 0 z = 0, se x ≤ 0 In tal modo ogni configurazione di neuroni vincenti è rappresentata da un numero binario formato da uni e da zeri, tanti quanti sono i pesi dello strato di output. È poi immediato confrontare tra loro questi numeri binari. Altri metodi di discriminazione delle configurazioni vincenti sono possibili, tenendo conto che e’ necessario “fuzzificare” la loro composizione numerica, in quanto descrivono attrattori caotici che sono costituiti da un nucleo ripetitivo con molte variazioni simili nel proprio intorno. Il meccanismo della SOM e’ stato scritto tenendo conto dei meccanismi neurofisiologici di mappatura degli stimoli sensoriali sulla neocorteccia: risulta infatti che input simili sono mappati su luoghi vicini della corteccia in modo ordinato e conservativo della topologia ( Kohonen 1996 ). Sia la SOM che le altre reti neurali artificiali fondano il processo di apprendimento sulla ripetizione ciclica dello stimolo di input. Anche nel cervello esiste la prova dell’esistenza di circuiti riverberanti che rinforzano l’impressione dell’informazione di input sulla mappa corticale. Sembra tuttavia 91 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM improbabile che tali “loop” si possano ripetere per migliaia di volte alla ricerca di un bersaglio fisso, anche perchè riesce difficile immaginare che il cervello possa andare in seguito a riconoscere solo l’ultimo neurone attivato come quello più importante ( Pizzi et al. 1998 ). Appare invece più ragionevole pensare che l’attività di riverbero si esaurisca spontaneamente con l’esaurirsi della scarica elettrica di attivazione, e che le mappe corticali siano costituite da una costellazione di neuroni attivati, la cosiddetta traccia mestica che servirà successivamente al recupero dell’informazione. Per questo motivo il meccanismo della ITSOM sembra più fisiologicamente giustificato. Anche il meccanismo induttivo che apprende un numero molto alto di nuove informazioni sfruttando la traccia mestica di un nucleo di informazioni preesistenti sembra ragionevole e confermato da esperimenti neurofisiologici. Il fatto che l’apprendimento non sia un processo completamente supervisionato ( basato su esempi ), ma nemmeno del tutto non supervisionato, ed abbisogni quindi di almeno un insieme di punti di riferimento noti, sembra confermato sia dall’esperienza quotidiana che da numerosi studi ( Ermentrout 1992, Pizzi et al. 1998, Reger et al. 2000, Pizzi et al. 2003a, Pizzi et al. 2003b ). 5.3 Descrizione della rete neurale artificiale utilizzata nell’esperimento. Di seguito si descrive l’architettura neurale artificiale adottata nell’esperimento che è oggetto della presente tesi e che verrà descritto nei capitoli successivi. La rete è scritta in linguaggio C. Suo obbiettivo è la classificazione dei segnali provenienti dai neuroni in una delle quattro direzioni che verranno indicate all’ attuatore robotico : Su, Giù, Destra e Sinistra. Nel caso il robot debba muoversi nella direzione di un ostacolo, ci si limita a non farlo muovere. La rete è stata scritta considerando il susseguirsi di due fasi : 92 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM 1. fase di Training : si accettano solo i segnali di addestramento per permettere la generazione degli z-score di riferimento utilizzati poi per la classificazione; 2. fase di Testing : si ricevono segnali direzionali che dovranno essere classificati grazie agli z-score creati nella prima fase. Si sono definiti dei parametri fondamentali che incidono profondamente sul comportamento della rete : • NI: si tratta del numero di neuroni costituenti lo strato di input; • NY: `e il numero di neuroni dello strato di Kohonen; • STREAM: indica la dimensione totale del file contenente i campioni da analizzare intesa come il numero di campioni presenti; • PAUSA: fornisce al programma il numero di epoche per campionamento; • EPSILON e ALPHA: rispettivamente tasso di apprendimento e di dimenticanza della rete; • DELTA: valore della soglia utilizzata nel calcolo degli z-score; La rete è una ITSOM, l’architettura descritta più sopra, adattata al particolare compito che deve svolgere. Lo strato di input è composto da cinquecento neuroni, mentre lo stato competitivo, o di Kohonen, ne comprende dodici. Tale numero di neuroni sullo strato di output è stato determinato come ottimale grazie ad un precedente esperimento di taratura della rete artificiale, effettuato dal gruppo di ricerca Living Network Lab. Inserita in un’applicazione LabView sotto forma di DLL Windows 32, la rete resta in attesa di una notifica da parte del programma che gestisce le risposte dei neuroni. Esso registra gli output delle cellule in appositi file binari il cui nome indica chiaramente la fase in cui ci si trova e che segnale contiene. L’utilizzo di file binari è legata al fatto che nel linguaggio C tali file consentono un accesso più immediato ai valori in esso contenuti rispetto ad un 93 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM file di testo. La gestione delle stringhe risulta onerosa in termini di prestazioni e di complessità del codice. Per ogni file di segnali, contenente 32000 valori, viene inviata alla DLL una matrice bidimensionale composta da 8 colonne e 4000 righe il cui tipo numerico è “double”. Essa non viene analizzata in un’unica volta, ma si divide il numero totale di valori per il numero di z-score di riferimento da generare ( o generati se siamo in fase di testing ) per ogni direzione per ogni campionamento. Tale nuovo valore viene diviso per il numero di neuroni sullo strato di input ottenendo il numero di campionamenti necessari per processare tutti i dati. Tramite test empirici si è scelto di generare otto z-score di riferimento per ogni direzione. In pratica ogni neurone ha, per ogni campionamento, 8 valori di 1 e 0 che indicano il suo stato di vincente o perdente risultante dall’elaborazione di quella parte dei dati di input. Reiterando questo processo per tutti e otto i campionamenti si ottengono gli otto z-score necessari per la corretta definizione di un pattern. Esiste una matrice tridimensionale per ogni direzione, e in essa si memorizzano tutti gli z-score di riferimento. Ne viene di seguito illustrata la struttura (fig.5.4). Fig. 5.4 Struttura della matrice di z-score. Nel caso dell’ utilizzo di questa tesi ne esistono quattro differenti, ognuna contenente i pattern relativi ad una specifica direzione. 94 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM Ognuna delle parti in cui viene diviso il numero di valori nel file viene sottoposta all’elaborazione della rete. Per ogni campionamento si determina il neurone vincente in base alla distanza minima sopra descritta, quindi si provvede a punire o premiare tale neurone mediante la modifica dei pesi. La premiazione del vincente si compie spostando il valore del peso della connessione verso il valore della media degli input di una percentuale, di tale distanza, determinata dal tasso di apprendimento ε. Si tiene conto delle vittorie di ogni neurone e se ne definisce un numero oltre il quale è meglio scoraggiarne di ulteriori. In questo caso e in caso di neurone perdente, si attua una punizione mediante un lieve allontanamento del peso dal valore medio degli input, questa volta grazie ad una percentuale indicata dal tasso di dimenticanza α . Questa fase viene ripetuta per un dato numero di epoche al fine di generare la serie temporale di vittorie e approssimazioni necessarie alla creazione di z-score significativi. Questi ultimi vengono poi calcolati mediante l’algoritmo descritto nel paragrafo precedente e si arriva a rappresentare con sequenze di 1 e 0 le configurazioni dei neuroni vincenti per ogni campionamento. La differenza tra le fasi di Training e Testing è data dal fatto che, nella prima, non si procede a classificare gli z-score generati, ma li si memorizzano in un’apposita matrice, avendo così i riferimenti rappresentanti le configurazioni dei neuroni vincenti in relazione ai diversi pattern di training ricevuti in input. Tutto questo non avviene nella fase di Testing, dove si procede alla classificazione: una volta generati gli z-score si procede a confrontarli con quelli memorizzati nella prima fase, e non appena si riscontra la medesima configurazione in entrambi gli z-score si classifica quel segnale di test come segnale indicante quella direzione. La rete è un’ applicazione che viene gestita tramite Lab-View. Si tratta di un ambiente di sviluppo grafico con funzionalità incorporate per l’acquisizione, l’analisi delle misure e la presentazione dei dati, che garantisce la flessibilità di un potente linguaggio senza la complessità a dei tradizionali “tool” di sviluppo. 95 Capitolo 5 La rete SOM e l’evoluzione ad ITSOM LabView offre avanzate capacità di acquisizione, analisi e presentazione in un unico ambiente. I segnali direzionali vengono generati da un’applicazione che può essere considerata server (fig.5.5). Essa genera i segnali direzionali, li invia al controller che li converte in segnali elettrici atti a stimolare i neuroni, quindi, mediante la scheda di acquisizione, riceve i segnali di ritorno dalle cellule e li memorizza in file binari. Fig. 5.5 Interfaccia grafica del software per la generazione di segnali elettrici. Una volta che il file binario è pronto viene inviata una notifica che attiva l’applicazione in cui è inclusa la DLL. Quando la si riceve, l’applicazione procede nell’aprire il file, estrarre i dati e generare tutti i valori di tipo “double” che vengono poi usati per riempire la matrice destinata alla DLL. LabView mette a disposizione elementi grafici equivalenti alle diverse strutture tipiche di un programma C. 96 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico Capitolo 6 Esperimento per la strutturazione di un circuito ibrido biologico/elettronico. Scopo dell’esperimento ed oggetto di questa tesi è testare un sistema di decodifica dei segnali neurali biologici attraverso una rete neurale artificiale ( ANN ). A questo scopo è necessario inviare stimoli sensoriali simulati ad una rete di neuroni biologici, e verificare poi, attraverso la decodifica da parte della ANN, che i neuroni biologici abbiano correttamente appreso gli stimoli a loro indirizzati, il che avviene quando a stimoli uguali rispondono con segnali uguali. Un attuatore robotico connesso alla ANN evidenzierà il risultato della decodifica. All’ interno di questo capitolo si focalizzerà l’attenzione su quanto svolto durante il laboratorio nel corso della strutturazione di un circuito chiuso all’ interno del quale può essere fatta passare un’ informazione. Nel nostro caso l’informazione sarà un comando di spostamento, generato per mezzo di un software, al fine di far compiere movimenti ad un robot. Può non essere d’ immediata comprensione l’originalità dell’ esperimento, in quanto esistono già circuiti elettronici in grado di far muovere a distanza parti meccaniche robotiche ( partendo dalle automobili elettriche per bambini fino ad arrivare alla sonda spaziale “Spirit”). I circuiti diffusi per il movimento di parti meccaniche a distanza sono circuiti di tipo non misto ( unicamente elettronici ), 97 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico e pertanto artificiali. Completamente differente è la costituzione di circuiti ibridi ( misti ) con componenti biologiche ed elettroniche contemporaneamente. In tal caso il circuito risulta essere non totalmente artificiale poiché possiede una parte di materiale naturale. Ciò che viene trasmesso, sotto differenti forme, tra le varie componenti di un circuito la si può definire informazione. Di tale informazione si conosce tutto per quanto riguarda la parte elettronica dei circuiti, mentre molto diversa è la situazione dell’ informazione legata al materiale biologico ( vedi le problematiche esposte nel capitolo 3 ). L’informazione che passa all’ interno del circuito ibrido costituto durante l’esperimento è definita da quattro differenti comandi di spostamento indirizzati al terminale mobile ( robot ). Tale circuito compie la generazione di un segnale di tipo elettronico, che funge da input al circuito neuronale biologico, che a sua volta dirige i suoi segnali verso il circuito elettronico, guidando un robot. 6.1 TRASPORTO DEL SEGNALE ATTRAVERSO IL CIRCUITO IBRIDO BIOLOGICO/ELETTRONICO. Il trasporto del segnale attraverso il circuito ibrido e le relative componenti vengono presentate seguendo l’ordine del passaggio dell’ informazione, partendo dalla generazione per arrivare all’ attuazione robotica del movimento. 6.1.1 GENERAZIONE DEL SEGNALE. La generazione del segnale avviene per mezzo di un controller hardware implementato dal gruppo LNL (fig.6.1), in grado di generare segnali elettrici desiderati con determinate caratteristiche tecniche. Il segnale elettrico prodotto 98 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico in questa fase deve possedere corretti requisiti che ne permettano l’utilizzo per la stimolazione dell’attività della rete biologica di neuroni. Per questo motivo il segnale generato deve essere caratterizzato da una frequenza d’onda inferiore a 1 Hz, essere un segnale elettrico a corrente alternata per evitare la lisi cellulare e con un voltaggio pari a 300 mV. Particolare interessante è la tipologia dell’onda utilizzata per le stimolazione neurali: l’onda quadra. Tale modalità è stata definita da differenti studi come l’onda più adatta per lo svolgimento di esperimenti per la stimolazione di neuroni. Fig. 6.1 Controller implementato dal gruppo LNL. Vi sono numerati gli otto canali per la stimolazione. Una volta definito quelle che sono le caratteristiche generali del segnale elettrico occorre fare ulteriori specifiche per meglio caratterizzare il segnale in entrata nelle piastre cellulari.. Infatti i pattern d’informazione sono stimoli elettrici in funzione del tempo. Pertanto le stimolazioni elettriche passanti gli otto canali della scheda non si differenziano in base all’intensità del segnale ( costante a 300 mV), bensì in base al proprio andamento temporale. In fig. 6.2 vengono riportati tre differenti stimolazioni in onda quadra. 99 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico a) b) c) 1s Fig. 6.2 Tre esempi di onda quadra. (a) Nel primo caso abbiamo due stimoli della durata di 2 s intervallati da un secondo di pausa e seguiti da uno stimolo di alrtri 2 s. (b) Nel secondo caso abbiamo 2 s di pausa e due secondi di stimolo intervallati da un altro secondo di pausa, poi 4 s senza stimolo. (c) in questo caso si ha uno stimolo di 1 s dopo 1 s di pausa, seguito da 3,5 s di pausa, stimolo di 1 s e 2s. di pausa. Il controller (fig.6.1) invia i pattern elettrici in onda quadra per mezzo di otto canali elettrici collegati alla piastra MEA ( vedi capitolo 2 ) . I quattro pattern si differenziano in maniera da avere una differente composizione degli andamenti temporali delle onde nel tempo. Si è studiato un particolare metodo di rappresentazione dei pattern in questione. Si prendano in considerazione una griglia composta da 8 x 8 bit . Ogni bit è caratterizzato da una durata temporale di 300 ms. Si considera il bit “vuoto” ( bianco ) quando non vi è lo stimolo e pieno ( pallino nero ) quando vi è stata la stimolazione. Tale rappresentazione è utilizzabile in quanto non si necessitano ulteriori specifiche sulle caratteristiche dello stimolo posto sempre a 300 mV. Se il controller non invia alcuno stimolo lungo gli otto canali la griglia presenterà tutti i bit vuoti (fig.6.3). 100 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico a) b) Fig 6.3 (a) rappresentazione per mezzo di una griglia 8 x 8 bit. Nell’ immagine presentata non vi è alcuno stimolo. (b) onde corrispondenti alla mancanza di stimolazione. Come si può notare sono otto segnali “nulli”, senza stimolo. Se invece avvengono una serie di eventi di stimolazione ci si trova davanti a situazioni come quella di seguito illustrata (fig. 6.4). Fig. 6.4 Rappresentazione della griglia 8 x 8 bit dove si è avuta stimolazione tramite tre canali sugli otto possibili. A fianco vengono riportate onde le caratteristiche che hanno generato il pattern rappresentato nella griglia. I canali privi di stimoli sono stati omessi. 101 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico Gli esempi riportati nelle fig. 6.3 e 6.4 sono atti a far comprendere meglio il rapporto tra la rappresentazione del pattern per mezzo della griglia 8 x 8 bit e le stimolazioni che effettivamente vengono trasmesse alla piastra di neuroni. I pattern elettrici vengono inviati alla rete biologica in maniera ripetuta, di modo che abbia luogo l’apprendimento e le connessioni di neuroni raggiungano una struttura stabile che differenzi adeguatamente le sue risposte in base alle 4 combinazioni di onde quadre inviategli in input. Come sottolineato in precedenza i pattern da inviare alle cellule devono descrivere comandi per lo spostamento di un’ unità robotica posta come terminale del circuito. I pattern generati vengono classificati con DESTRA (R), SINISTRA (L), AVANTI (F). RETRO (B) ( fig. 6.5 ). Fig. 6.5 Rappresentazione dei quattro pattern sperimentali per mezzo della griglia 8 x 8 bit. Sopra le griglie sono riportate le corrispondenti classificazioni (Right, Left, Forward, Back). Essendo ormai chiaro che ogni bit della griglia corrisponda a 300 ms, si evince come lo stimolo inviato alla piastra abbia una durata complessiva di 2.4 s.una 102 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico volt a inviato lo stimolo, l’informazione passa a livello della piastra di neuroni biologici, cui aspetta la fase successiva alla generazione dei segnali. 6.1.2 ELABORAZIONE DEL SEGNALE DA PARTE DELLA COMPONENTE BIOLOGICA, I NEURONI UMANI. Successivamente alla generazione del segnale avviene ciò che in apertura di questo capitolo era stato anticipato. Una volta entrato all’ interno della piastra di neuroni, l’informazione si trasforma. da segnale elettronicamente generato ( e quindi artificiale ) a segnale elaborato biologicamente da una rete di neuroni umani. Il meccanismo di funzionamento riportato dall’ impiego della registrazione per mezzo di MEA sono ampiamente descritti all’ interno del capitolo 2 di questa trattazione. Come detto nel paragrafo precedente, gli elettrodi del microarray in piastra sono in grado di funzionare sia in modalità per l’invio di un segnale elettrico che in modalità di ricezione. Tramite un’ analisi al microscopio vengono scelti i neuroni che presentano adesione certa alla superficie esterna di neuroni della rete biologica. L’utilizzo di soli otto elettrodi dei sessantaquattro che costituiscono l’array della MEA utilizzata non costituisce una limitazione tecnica per l’esperimento. Infatti uno dei principi su cui si basano le registrazioni con MEA è che non è importante andare a verificare l’attività elettrica di ogni neurone in coltura, bensì è importante registrare il funzionamento della rete nel complesso. È chiaramente consigliabile che stimoli e registrazioni avvengano comunque tramite elettrodi ben connessi alla rete biologica per poter ottenere dati con maggior accuratezza. 103 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico Fig. 6.6 La freccia gialla indica il controller dal quale si vedono chiaramente dipartire gli otto canali (freccia blu). All’ interno del box giallo (freccia rossa) vi è la piastra con i neuroni umani. Il box serve a mantenere l’ambiente termostatato a 37°C per meglio preservare le cellule. I pattern d’ingresso hanno una durata costante di 2.4 s per tutte e quattro le direzioni considerate. Una volta inviato lo stimolo gli elettrodi passano istantaneamente in modalità di registrazione. Tale attività di acquisizione del segnale viene mantenuta per 400 ms. La scelta del tempo di registrazione è un parametro ricavato dal gruppo di ricerca LNL mediante l’ esperimento precedente al lavoro di questa tesi, durante il quale vennero effettuate delle prove per stabilire quale fossero i migliori parametri da impostare per l’ottimizzazione della rete neurale artificiale, in quanto sarà tale rete a dover elaborare i segnali in uscita dalla piastra. I segnali registrati vengono inviati, attraverso i medesimi otto canali di connessione (fig.6.4), alla scheda di acquisizione. Dalla scheda di acquisizione si assiste all’ apertura di due applicazioni che lavorano contemporaneamente. La prima è l’applicazione di registrazione dei segnali, la seconda è l’applicazione d’invio immediato del segnale in uscita dalla piastra verso la 104 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico rete neurale artificiale ITSOM ( descritta nel capitolo 5 ). La registrazione dei segnali non serve all’attuazione dell’ esperimento di tesi. Ad ogni modo si è deciso di conservare le registrazioni effettuate per una maggior completezza della documentazione sperimentale. 6.1.3 DECODIFICA DEL SEGNALE PER MEZZO DI ITSOM. Il segnale in uscita dalla rete neurale biologica viene passato alla rete neurale ITSOM ( Inductive Tracing Self Organizing Map ). L’attività e le caratteristiche tecniche, quali numero di neuroni sui vari strati, numero di epoche, tasso d’apprendimento e di dimenticanza sono state ampiamente descritte nel capitolo 6 di questa trattazione. In parte verranno riprese per meglio descrivere come viene elaborata l’informazione proveniente dai neuroni umani. La registrazione effettuata dalla scheda di acquisizione ha una frequenza di 10 KHz, ovvero si registra l’attività elettrica diecimila volte al secondo. Essendo i canali di registrazione 8 ed il tempo di acquisizione della risposta pari a 400 ms, ci si trova a dover decodificare un set di 32000 campioni. Questi campioni vengono introdotti all’ interno una matrice composta da 8 colonne e 4000 righe. I valori elettrici vengono convertiti in valori binari ( vedi cap.5 ). La quantità di dati è troppo elevata per poter essere computata correttamente dalla rete, la quale presenta solo 500 neuroni sullo strato input. Si suddividono i dati in otto campionamenti differenti. Ogni processo di campionamento darà origine ad uno z-score di riferimento. Una volta generati gli otto z-score in grado di descrivere accuratamente il pattern in questione, la rete neurale funziona in maniera differenziata in base che ci si trovi in fase di “training” o in fase di “testing”. Nel caso si stia effettuando il training gli z-score vengono memorizzati e conservati, allo scopo di fungere da riferimento per la fase di testing con pattern ignoti. Al contrario se si sta effettuando la fase di testing, gli otto z-score ottenuti sono confrontati con 105 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico quelli di riferimento salvati all’ interno delle matrici ( una per ogni pattern ), in maniera che venga definita la direzione del comando tramite confronto. Ciò è possibile in quanto ci si basa sul fatto che gli z-score di due medesimi pattern presentano una elevata similarità rispetto ai valori z-score delle matrici di pattern differenti. 6.1.4 ATTUAZIONE DEL SEGNALE TRAMITE ROBOT. A seconda che ci si trovi in fase di training o di testing il segnale in uscita dalla rete neurale artificiale compie due percorsi differenti. Infatti a seguito della fase di training non si ha una vera e propria uscita del segnale, in quanto la serie degli z-score viene utilizzata come riferimento per la successiva fase di test, a conclusione della quale si arriva all’attuazione robotica del segnale. A questo punto si utilizza una struttura “case of”. Questa struttura è una classica costruzione algoritmica che permette di assegnare dei valori interi a processi elaborati. Infatti viene assegnato un valore intero differente per ogni direzione decodificata dalla rete ITSOM: • 1 = DIETRO • 2 = AVANTI • 3 = DESTRA • 4 = SNISTRA A seconda dell’assegnazione di numero intero che viene effettuata, la rete neurale artificiale genera una particolare segnalazione elettrica. Anche in questo caso si tratta di segnali elettrici in onda quadra (fig.6.7). Queste 106 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico differenti segnalazioni vengono inviate per mezzo di una connessione elettrica alla scheda di acquisizione Personal DAQ 6052E prodotta da National Instrument. Questa scheda è in grado di ricevere in input il segnale elettrico uscente dalla rete ITSOM, convertirlo in un dato digitale che verrà poi opportunamente convertito in un comando che un apposito device ad infrarossi invierà al robot. Fig. 6.7 Segnali in uscita dalla rete neurale artificiale inviati alla scheda d conversione Personal DAQ. Il robot utilizzato per l’esperimento possiede una porta per la ricezione dei segnali infrarossi ed è quindi in grado di essere manovrato a distanza dal sistema hardware implementato dal gruppo LNL. 107 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico 6.2 PROTOCOLLO SPERIMENTALE. Viene ora riportato il protocollo sperimentale per lo svolgimento dell’ attività di laboratorio. Tale protocollo è suddiviso in due parti differenti, la prima durante la quale avviene la fase di apprendimento per la rete biologica e il training per la rete artificiale. Durante la seconda parte invece avviene la fase di testing per la decodifica di pattern ignoti. PROTOCOLLO ESPERIMENTO ROBOTICO Attrezzatura: Software di gestione dell’ esperimento 1 piastra MEA ( staminali umane ) Controller 8 cavi elettrici per connessione NI 6052E-MEA Scheda di acquisizione Personal DAQ Cavo elettrico per connessione output ITSOM/telecomando robot. schema di connessione degli elementi: 108 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico 1) scelta del pattern 2) invio del segnale generato per mezzo del controller alla rete neurale biologica 3) uscita del segnale dalla piastra MEA 4) compilazione della matrice dei dati in valori binari 5) trasferimento della matrice elaborata alla rete neurale artificiale 6) uscita del segnale decodificato da ITSOM 7) invio del segnale I.R. di movimento al robot PRIMA FASE: TRAINING Pattern R 8 bit x 8 bit Ogni bit ha la durata di 300 ms a 300 mV Durata stimolo: 300 x 8 = 2400 ms = 2.4 s ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ Dopo la stimolazione seguono 1 s di pausa, durante la quale viene attivata la registrazione e l’ascolto da parte della rete neurale artificiale. L’ascolto della rete neurale avviene durante la prima fazione successiva allo stimolo pari a 400 ms. 109 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico Il pattern viene somministrato 10 volte: 4.8 x 10 = 48 s Pattern L, Pattern F, Pattern B : come sopra. Alla fine del training di ciascun pattern si fa una pausa di 5 secondi. ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ ■ • 10 secondi di pausa prima di passare alla fase di testing 110 Capitolo 6 Strutturazione di un circuito ibrido biologico/elettronico SECONDA FASE: TESTING Sono predisposti a video 4 bottoni (uno per ogni pattern ). Schiacciando il bottone R si provoca la stimolazione del pattern R per 2.4 s e subito si entra in registrazione. Lo stesso per gli altri bottoni. L’esperimento prevede che si schiaccino vari bottoni in ordine sparso. Dopo premuto un bottone, la rete neurale artificiale acquisisce il segnale per 400 ms e comincia a lavorare, fino ad inviare il segnale alla scheda di acquisizione DAQ. La scheda Personal DAQ invia il segnale all’ attuatore robotico . Ripetere l’operazione premendo nuovamente un tasto. 111 La differenza maggiore tra le due fasi dell’ esperimento è che durante il testing il robot (fig.6.8) è acceso e connesso al circuito, nella fase di training il robot è off-line, in quanto non connesso al circuito. Ciò avviene in quanto durante la fase di training si intende allenare la rete biologica a meglio definire i differenti impulsi in entrata, e la rete artificiale per generare gli z-score di riferimento necessari per il riconoscimento dei pattern durante la fase di testing. Fig. 6.8 Attuatore robotico in grado di muoversi comandato a distanza tramite raggi infrarossi. 112 Capitolo 7 Risultati Capitolo 7 Risultati 7.1 RISULTATI SPERIMENTALI. In questa parte della presente trattazione si analizzeranno i risultati ottenuti dall’ esperimento descritto nel capitolo precedente. Ovviamente quanto verrà ora proposto si riferisce unicamente alla fase di testing, in quanto la fase di training serve per ottimizzare la funzionalità del circuito ibrido costituito. Come già menzionato precedentemente (cap.6), si sono somministrati alcuni pattern direzionali scelti casualmente dell’ operatore. Ogni volta che un segnale veniva generato si annotava quale fosse la risposta data dal movimento dell’attuatore robotico. I risultati ottenuti dall’esperimento sono stati classificati in tre modi differenti, corretto nel caso il pattern in input corrisponda al movimento del robot, non corretto nel caso la direzione intrapresa dal robot sia differente da quella descritta dallo stimolo generato e non classificato nel caso il robot successivamente ad uno stimolo sia rimasto immobile. Risulta evidente come vista la tipologia della classificazione dei risultati, i pattern eseguibili dal robot sono cinque ( le quattro direzioni più la non classificazione ) mentre i pattern direzionali in input siano quattro. Come vedremo in seguito, da un punto di vista di decodifica del segnale, attuato dalla rete neurale artificiale, il fatto che un pattern sia caratterizzato erroneamente piuttosto che non caratterizzato ha un significato molto differente. Nel corso dell’ esperimento sono stati forniti al circuito un numero di pattern pari a 23. Questo numero di prove effettuate è stato concordato in base ad esperienze pregresse del gruppo di ricerca che hanno definito una forte calo di 113 Capitolo 7 Risultati attività da parte delle cellule neurali umane dopo i primi venti stimoli di testing. Nella seguente tabella vengono riportati i risultati riferiti all’ esperimento con il robot reale. nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 STIMOLO dietro sinistra avanti avanti sinistra sinistra destra sinistra dietro dietro avanti dietro avanti sinistra dietro destra destra destra sinistra avanti avanti destra sinistra SPOSTAMENTO dietro dietro avanti avanti sinistra sinistra destra sinistra dietro dietro fermo dietro avanti sinistra dietro fermo destra destra sinistra destra destra destra destra CLASSIFICAZIONE corretta non corretta corretta corretta corretta corretta corretta corretta corretta corretta non classificato corretta corretta corretta corretta non classificato corretta corretta corretta non corretta non corretta corretta non corretta Tab 7.1 Risultati ottenuti sperimentalmente. In verde sono riportati i risultati corretti, in giallo le non classificazioni ed in rosso le classificazione errate. Come si può intuire dalla tabella 7.1, il circuito costituito sembra funzionare in maniera corretta, al di sopra delle aspettative. Infatti sono ben 17 su 28 le classificazioni corrette, solo 3 quelle non corrette e 2 sole quelle non avvenute. 114 Capitolo 7 Risultati Di seguito si riporta un’ulteriore modalità di rappresentazione dei dati che può essere utile per estrapolarne un’ interessante discussione. SUDDIVISIONE DEGLI IMPULSI F B R L Pattern AVANTI DIETRO DESTRA SINISTRA TOTALE 6 5 7 5 corretto 3 5 5 4 non corretto 2 / 2 / non classificato 1 / / 1 Tab. 7.2 Ripartizione degli impulsi forniti durante l’esperimento all’ interno delle tre classi. Vengono inoltre riportati gli impulsi totali per ogni pattern direzionale. A lato sono riportate le sigle per ogni pattern F ( avanti), B ( dietro), R ( destra ), L ( sinistra ). Dalla tabella 7.2 risulta evidente come il numero totale degli impulsi per ogni pattern non sia sempre uguale. Infatti, come già detto più volte, gli impulsi venivano lanciati come input per il circuito in maniera del tutto casuale. Chiaramente si è cercato di non fornire quantità di pattern troppo differenti per non falsare l’analisi funzionale circuitale. La prima cosa evidente è che il pattern direzionale dietro è stato correttamente individuato nel 100% dei casi. In particolare è stato identificato per ben cinque generazioni del pattern corrispondente. Cinque sono anche le corrette identificazioni del pattern destra, ma il numero di volte in cui è stato generato un segnale indicante lo spostamento a destra è stato di due unità superiore. In particolare si osserva come nel caso di errata attuazione del segnale R da parte del robot, non è mai avvenuta una mancata classificazione. Ciò non avviene nel caso del pattern avanti, dove si hanno 2 risultati su 6 non correttamente classificati e uno non classificato. Diversamente dagli altri il pattern sinistra presenta un’ unica eccezione alle classificazioni non corrette, con la quale il robot non si è mosso dando così origine ad una non classificazione. 115 Capitolo 7 Risultati Una completa esposizione dei risultati richiede che venga mostrato in che modo è avvenuta un’errata classificazione per ogni tipo di pattern (tab.7.3). In questo modo si possono osservare se l’attuazione errata di un dato pattern tende essere correlata con l’attuazione di un altro in particolare. F R L Input pattern AVANTI DESTRA SINISTRA Movimento attuato n.c./ destra/ destra n.c. dietro / destra Nr.errati 3 1 2 TOTALE = 6 Tab. 7.3 Tabella riportante il movimento compiuto dal robot nel corso di risultati con classificazioni errate. La colonna a destra riporta il numero di stimoli non correttamente elaborati e decodificati tramite il circuito ibrido. Come si può vedere il numero di campioni errati è piuttosto basso ( pari a 6 ). Unico caso di movimento errato ripetuto per un medesimo pattern lo si riscontra con la generazione del segnale per il movimento in avanti. Infatti per ben due volte su tre, quando il pattern avanti è stato classificato erroneamente si è assistito ad un movimento verso destra. Nell’altra classificazione errata di questo pattern il robot è rimasto immobile. Per gli altri due pattern che hanno riportato classificazioni errate il movimento compiuto dall’attuatore è sempre stato differente. Per il segnale a sinistra si sono avuti due movimenti errati, uno a destra e uno all’indietro. Nel caso errato per il pattern destra si è ottenuta la non classificazione del segnale. A questo punto vengono mostrate le percentuali riferite alle prestazioni del circuito ibrido costituito (tab.7.4a,b). Oltre che sul totale degli stimoli effettuati, è necessario considerare le prestazioni del sistema in maniera differenziata per ognuno dei quattro pattern. 116 Capitolo 7 Risultati a) F B R L Pattern AVANTI DIETRO DESTRA SINISTRA % corretto 50 100 71,4 80 % non corretto 33,3 0 28,6 0 % non classificato 16,4 0 0 20 b) Totale Pattern % corretto 73,9 % non corretto 17,4 % non classificato 8,7 Tab. 7.4 Vengono riportate le percentuali riferite alle prestazioni di classificazione riscontrate nel corso dell’esperimento. (a) Tali percentuali sono ripartite tra i quattro differenti pattern. (b) Le percentuali si riferiscono alla prestazione del circuito ibrido considerando l’intero esperimento. I dati riferiti alle prestazioni sono molto positivi. Infatti se si osservano le percentuali riportate nella tabella 7.4b si vede come la rete abbia funzionato correttamente per quasi tre casi su quattro. Solamente in un terzo dei casi di classificazione errata, l’attuatore non è riuscito ad individuare nessuno dei quattro pattern pattern possibili rimanendo fermo. I due pattern meglio riconosciuti sono dietro e sinistra. Infatti per questi due segnali si può scartare con certezza la casualità dell’identificazione. Le percentuali d’ identificazione legate a questi due pattern ( rispettivamente 100% e 80% ) indicano un’ottima capacità di apprendimento sviluppata dalla rete biologica e ottima capacità di decodifica della rete ITSOM. Le percentuali riferite a questi due pattern sono maggiormente confrontabili in quanto sono riferite ad un identico numero di generazione dei segnali ( cinque per pattern ). Va però sottolineato come tali due direzioni corrispondano al minor numero di prove effettuate sul circuito 117 Capitolo 7 Risultati ibrido. Da questo punto di vista il pattern maggiormente testato è stato destra, sono infatti sette le prove effettuate con la somministrazione del suo segnale corrispondente (tab.7.1). La percentuale della prestazione riferita a questo pattern è molto elevata ( 80% ), e anche questo caso non si può parlare di casualità dell’ identificazione. Considerando il 20% come percentuale di riferimento per una identificazione casuale ( ricordo che le possibilità di classificazione sono quattro, date dai pattern, più il caso di default della non identificazione ), non si può parlare di casualità per un fenomeno con una percentuale quattro volte superiore. Differenti sono le prestazioni riguardanti il pattern avanti. Questa direzione è stata correttamente caratterizzata per il 50% dei casi. Basandoci su quanto appena detto a riguardo della percentuale di casualità al 20% si nota come il valore riferito al pattern sia comunque positivo poiché superiore al doppio. Bisogna comunque tenere conto che per questa direzione l’identificazione sembra avere carattere maggiormente di tipo “random”. Il problema del basso numero di campioni eseguiti ( 23 prove ), come precedentemente detto, è legato alla bassa vitalità della rete di neuroni umani quando viene sottoposta agli stimoli generati dal controller. A questi ventitre stimoli di testing vanno sommati i 40 precedenti stimoli ( 10 per ogni direzione ) necessari per il training delle reti. È per tanto lecito aspettarsi delle prestazioni migliori nello spazio dei campionamenti sia distante dall’inizio e dalla fine della fase sperimentale. 118 Capitolo 7 Risultati Istogramma delle classificazioni rete artificiale tarata 1 corretto c l a s s i non classificato non corretto 0,5 0 1 3 5 7 9 11 13 15 17 19 21 23 campioni Fig. 7.1 Istogramma delle classificazioni per l’esperimento con rete artificiale tarata. Questo grafico risulta essere molto utile per visualizzare la distribuzione delle classi nel corso dell’ esperimento. Per mezzo dell’ istogramma rappresentato in figura 7.1 si può verificare se vi è la costituzione di particolari aree, all’interno dello spazio dei campioni, dove la classificazione presentata è caratterizzata da prestazioni più basse. Effettivamente si nota come la classificazione degli ultimi campioni sia stata meno efficiente. Il 75% delle classificazioni errate avvenute si riscontrano negli ultimi quattro campioni, i n. 20, 21 e 23. Questo risultato ci riporta alle anticipazioni fatte a riguardo del calo di attività della rete biologica. Infatti l’area nella quale vi sono le tre classificazioni errate ha inizio al ventesimo pattern di testing generato, che sommato ai 40 stimoli per il training costituiscono il sessantesimo pattern inviato alla piastra cellulare. Particolarmente interessante può essere il risultato corretto d’identificazione del campione n. 22 (fig.7.1). Considerando il fatto che cade in una zona a bassa 119 Capitolo 7 Risultati efficienza del sistema, e che il pattern destra non risulta essere quello meglio caratterizzato, vi è un’elevata probabilità che tale identificazione sia stata casuale. Se per la zona descritta dagli ultimi campionamenti si parla di abbattimento delle prestazioni della rete di neuroni umani, certamente di differente natura deve essere l’errata identificazione del pattern numero 2. Tra le varie possibilità vi sono: l’errore casuale ( possibilità mai da scartare ), una bassa affinità per il riconoscimento di questo pattern ( tesi non supportata dai dati raccolti con 80% delle identificazioni corrette per il segnale di comando sinistra ) oppure una difficoltà della rete biologica nel passaggio dalla fase di training alla fase di testing. Oltre alle due zone con errate classificazioni, dal grafico di fig. 7.1 si evince la posizione dei due campioni non classificati con i quali non è stato attuato alcun tipo di movimento da parte del robot. Le due non classificazioni cadono nella zona centrale dello spazio dei campioni, verificandosi allo stimolo numero 11 e numero 16. Innumerevoli sono le variabili che possono portare a questo tipo di risultato. Per poter ipotizzare quali siano le cause di tale non classificazione si pensa sia importante analizzare i pattern dell’ intorno. Se si osservano i pattern dell’ intorno al campione 11, si nota come i pattern numero 9, 10, 12 siano stati correttamente identificati e tutti dati dalla medesima direzione ( dietro ). Se si osserva l’intorno del pattern 16, si vede come pattern somministrato dietro al numero 15 e destra al numero 17. Le ipotesi riguardanti le mancate classificazioni saranno espresse all’ interno delle conclusioni del lavoro di tesi. I risultati ottenuti tramite quest’esperimenti, attuati con il robot reale, offrono interessanti spunti per il confronto con i dati ottenuti negli esperimenti precedenti. In tali occasioni non è stato concretizzato l’utilizzo del robot reale. 120 Capitolo 7 Risultati Fig. 7.2 Rappresentazione grafica a video del robot negli esperimenti con attuatore simulato. A sostituzione dell’ attuatore robotico reale venne implementato un attuatore grafico elettronico. Labview venne quindi dotato di simulatore grafico, per mezzo del quale veniva rappresentato un robot in grado di muoversi all’ interno di uno spazio grafico (fig.7.2). A parte questa differenza, che non prevede variazione dal punto di vista delle prestazioni fornite dal ciclo per il trasporto dell’ informazione, la differenza fra i due esperimenti è che fra il primo e il secondo esperimento la rete neurale è stata tarata off-line sulla base dei segnali registrati. Si vedrà in effetti che la differenza di prestazioni fra il sistema prima della taratura e quello dopo la taratura è elevata. Le somministrazioni di pattern direzionali al circuito ibrido, senza la taratura della rete ITSOM ha prodotto i seguenti risultati ( già utilizzati per la stesura di tesi precedente ): 121 Capitolo 7 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Risultati STIMOLO dietro dietro sinistra dietro dietro dietro avanti avanti destra avanti avanti sinistra sinistra sinistra destra sinistra dietro sinistra avanti destra destra destra sinistra destra destra SPOSTAMENTO dietro dietro avanti dietro fermo dietro dietro avanti avanti avanti avanti dietro fermo avanti avanti destra dietro destra fermo avanti fermo dietro dietro dietro avanti CLASSIFICAZIONE corretta corretta non corretta corretta non classificato corretta non corretta corretta non corretta corretta corretta non corretta non classificato non corretta non corretta non corretta corretta non corretta non classificato non corretta non classificato non corretta non corretta non corretta non corretta Tab 7.5 Risultati ottenuti sperimentalmente senza taratura della rete artificiale. In verde sono riportati i risultati corretti, in giallo le non classificazioni ed in rosso le classificazione errate. La tabella riportata qui sopra (tab.7.5) è analoga a quella riferita all’esperimento precedente ( tab 7.1 ) e riporta un numero di campioni pari a 25. È necessario specificare che anche in questo caso si tratta di risultati riferiti alla fase di testing, successiva ad una fase di training identica a quella dell’ esperimento con attuatore robotico reale. La prima grossa differenza che salta all’ occhio dell’osservatore è il marcato aumento del colore rosso. Tale colore indica le classificazioni errate. Andando ad osservare più attentamente si nota come i risultati dell’ esperimento di simulazione si possano considerare 122 Capitolo 7 Risultati appartenenti a due tronconi differenti. Il primo, che va dal campione 1 al 11, con una buona serie di risultati positivi, il secondo troncone, dall’ 12 al 25, con tutta classificazioni errate o non avvenute, con un’ unica eccezione per il campione 17. Volendo osservare la distribuzione delle classificazione per i quattro pattern si ottiene: SUDDIVISIONE DEGLI IMPULSI F B R L Pattern TOTALE AVANTI 5 DIETRO 6 DESTRA 7 SINISTRA 7 corretto 3 5 / / non corretto 1 1 6 6 non classificato 1 / 1 1 Tab. 7.6 Ripartizione degli impulsi, forniti durante l’esperimento senza tarature della rete ITSOM. all’ interno delle tre classi. Vengono inoltre riportati gli impulsi totali per ogni pattern direzionale. riportate le sigle per ogni pattern F ( avanti ), A lato sono B ( dietro), R ( destra ), L ( sinistra ). Dalla tabella soprastante si evince che per due direzioni ( avanti e dietro ) su quattro si sono ottenuti risultati quantomeno accettabili. Infatti nel caso del pattern avanti si assiste ad una corretta classificazione per tre su cinque campioni corrispondenti. Sostanzialmente corretti i risultati ottenuti anche per il pattern dietro, per il quale si è assistita ad una classificazione corretta in cinque campioni su sei. Sono da considerare non accettabili i risultati offerti per i restanti pattern, per i quali non si è assistita a nessuna corretta classificazione (tab.7.6). Prima di trarre alcune conclusioni su quelle che potrebbero essere la motivazioni che hanno portato il circuito a fornire tali prestazioni, è interessante vedere con chiarezza le possibili relazioni che vi 123 Capitolo 7 Risultati sono tra pattern inviati e movimenti effettuati da robot virtuali in riferimento ai campioni classificati non correttamente. F B R L Input pattern Movimento attuato AVANTI dietro/ n.c./ DIETRO n.c. DESTRA avanti/avanti/avanti/n.c./dietro/dietro/avanti SINISTRA avanti/dietro /n.c./avanti/destra/destra/dietro Nr.errati 2 1 7 7 TOTALE = 17 Tab. 7.7 Tabella riportante il movimento compiuto dal robot simulato nel corso di risultati con classificazioni errate. La colonna a destra riporta il numero di stimoli non correttamente elaborati e decodificati tramite il circuito ibrido. La tabella 7.7 riporta i movimenti effettuati dal robot a compimento delle prove con una classificazione. Per quanto riguarda le relazioni possibili non si può dire molto a riguardo dei pattern avanti e dietro, in quanto il campione dei dati è troppo esiguo ( due soli eventi per il primo e uno per il secondo ). Al contrario il pattern sinistra presenta ben sette eventi di classificazione incorretta. Sembra essere molto azzardato pensare che vi sia una particolare relazione tra il pattern sinistra ed altri specifici pattern in quanto gli errori avvenuti si dividono equamente sulle restanti tre classi di movimento possibile più un evento di non classificazione. Sicuramente molto più interessante è osservare gli errori avvenuti con la generazione del comando destra. Pare che vi sia una preferenza a compiere un movimento verso avanti, in quanto in ben quattro casi su sette si è verificato tale movimento. Osservando la distribuzione dei campioni si nota una non completa omogeneità degli stessi. Infatti inizialmente pare vi sia un preponderante occorrere di pattern dietro e avanti, seguiti da destra e sinistra. In particolare è interessante notare come i primi due vengono identificati con una buona accuratezza. Il pattern avanti viene ripetuto 124 Capitolo 7 Risultati e correttamente identificato prima della comparsa della richiesta di pattern destra. Sembrerebbe quindi che la maggiore comparsa di un movimento in avanti sia dovuta o ad una perdita di capacità di generalizzazione della rete biologica o ad una mancata taratura della rete artificiale. Ulteriori approfondimenti saranno espressi in seguito durante la presentazione delle conclusioni di questa trattazione. Precedentemente (tab.7.4a,b) sono state calcolate le percentuali di classificazione del circuito con attuatore reale. Di seguito vengono quindi mostrate quelle dell’esperimento con robot virtuale. a) Pattern AVANTI DIETRO DESTRA SINISTRA F B R L % corretto 60 83,3 0 0 % non corretto % non classificato 20 20 16,7 0 85,7 14,3 85,7 14,3 b) Totale Pattern % corretto 32 % non corretto % non classificato 56 12 Tab. 7.8 Vengono riportate le percentuali riferite alle prestazioni di classificazione riscontrate nel corso dell’esperimento. (a) Tali percentuali sono ripartite tra i quattro differenti pattern. (b) Le percentuali si riferiscono alla prestazione del circuito ibrido considerando l’intero esperimento. Le percentuali delle prestazioni corrette, ottenute con la rete ITSOM non tarata, sono molto inferiori a quelle viste precedentemente (tab.7.4a,b). Infatti in questo caso le classificazioni corrette rappresentano solamente il 32% dei campioni effettuati, mentre nell’esperimento con rete artificiale tarata tale percentuale si assestava intorno al 73,9%. Superiore alla metà il numero dei 125 Capitolo 7 Risultati campioni erroneamente classificati, e quelli che non hanno prodotto alcun movimento del robot virtuale è il 12%. Il “gap” maggiore si è verificato per le classificazioni errate, infatti nell’esperimento senza taratura la percentuale è più di tre volte superiore a quella dell’esperimento con taratura. Osservando le percentuali riportate in tab. 7.8b si potrebbe essere indotti a pensare le identificazioni corrette siano casuali, in quanto la percentuale del 32% potrebbe essere così giustificata. Per validare o meno tale ipotesi si deve osservare la distribuzione delle tre classificazioni lungo lo spazio dei campioni. Nel caso tale distribuzione sia omogenea tale ipotesi sarebbe rafforzata. Come fatto per l’esperimento precedentemente illustrato viene utilizzato l’istogramma delle classificazioni. Istogramma delle classificazioni rete artificiale non tarata corretto c l a s s i 1 non classificato 0,5 non corretto 0 1 3 5 7 9 11 13 15 17 19 21 23 25 campioni Fig. 7.3 Istogramma delle classificazioni per l’esperimento con rete artificiale non tarata. Questo grafico risulta essere molto utile per visualizzare la distribuzione delle classi nel corso dell’ esperimento. 126 Capitolo 7 Risultati Dall’istogramma si osserva come la distribuzione degli errori di classificazione non sia omogenea (fig.7.3). Infatti la seconda metà dei campioni ( dal numero 12 al 25 ) è caratterizzata da un’unica classificazione corretta avvenuta per il campione 17. Tale risultato sembra far cadere l’ipotesi che le identificazioni corrette siano casuali. Infatti è meno probabile che tali classificazioni avvengano casualmente con un’elevata percentuale in un set di campioni. In particolare se ci si riferisce ai campioni che compresi tra il numero 1 e 11 le classificazioni corrette sono 7, rappresentante il 63,6% dei casi all’interno di questo gruppo. Tali classificazioni, se osservate molto attentamente, si scoprono avere molto in comune. Infatti le prime quattro classificazioni corrette sono tutte legate al pattern dietro. Anche la non classificazione del campione n.5 è legata a tale pattern. Unico campione, tra i primi sei dell’ esperimento, non legato al segnale di comando per lo spostamento dietro è il n. 3, e non è stato correttamente identificato. Situazione analoga avviene nel gruppo di campioni successivo che va dal n. 7 al 11. I tre pattern correttamente classificati sono tutti avanti. Il pattern n. 7 era un comando per lo spostamento avanti ma il robot si è mosso all’ indietro ( come abitualmente già aveva fatto ben quattro volte ). Il pattern errato ( n. 9 ) era destra ed il robot si è mosso verso avanti. Il lavoro esposto in questa tesi è la costituzione del circuito ibrido biologico/elettronico con attuatore robotico reale. La scelta fatta di riportare anche i risultati con attuatore robotico in simulazione e senza rete artificiale tarata è stata fatta per far comprendere quale sia stata l’analisi dei risultati precedentemente svolta e l’evoluzione sperimentale attuata. Come sempre accade, è buona norma del lavoro sperimentale, avere quello spirito di osservazione e critica che permette di riconoscere alcune imprecisioni sperimentali e correggerle. In questo modo si scoprono accorgimenti che permettono di ottenere risultati sempre migliori. I miglioramenti che sono stati ottenuti vengono rappresentati nella seguente figura. 127 Capitolo 7 Risultati Confronto delle prestazioni 6 5 corretto 4 3 2 1 0 non corretto n 1 F n o n c o re o n c a l cisf a non classifi cato to to 2 3 4 B 5 6 c o re to 7 L 8 9 1 0 R 1 1 Fig. 7.4 Confronto delle prestazioni dei due esperimenti. Sull’asse delle ascisse sono riportati i pattern. Per ognuno di essi si consideri: l’istogramma a sinistra riferito all’esperimento con robot reale e rete artificiale tarata, l’istogramma a destra riferito all’ esperimento con robot simulato e rete artificiale non tarata. La legenda colorata definisce le serie delle classificazioni. Il confronto visualizzato offre dei risultati molto interessanti (fig.7.4). Entrambi gli esperimenti riportano gli stessi risultati ( per le classi corretto e non classificato ) per il pattern avanti. Nell’ esperimento con rete tarata avanti è stato generato una volta in più, ma tale campione è stato classificato in maniera errata. Identico numero di classificazioni corrette anche per il pattern dietro. La differenza sta nel fatto che nell’esperimento più recente la percentuale 128 Capitolo 7 Risultati riferita a tale direzione è del 100%, mentre è del 83% per quello senza taratura. Chiaramente distanti sono le prestazioni fornite per i pattern destra e sinistra. Il miglioramento dei risultati ottenuti, in particolare per questi ultimi due pattern, è stato ottenuto sicuramente grazie alla corretta taratura della rete neurale artificiale. 129 Capitolo 8 Conclusioni Capitolo 8 Conclusioni. 8.1 CONSIDERAZIONI FINALI. I risultati riportati nel capitolo precedente hanno evidenziato un funzionamento corretto del circuito ibrido biologico/elettronico pari al 73,9% nell’ esperimento con rete artificiale tarata, e pari al 32% nel caso delle prove effettuate precedentemente alla taratura. Pensare che tale aumento delle prestazioni del circuito siano unicamente legate al processo di taratura sarebbe un superficiale errore di analisi dei risultati. Soffermandoci a guardare i dati riferiti all’ ultimo esperimento ( con attuatore robotico reale, tab. 7.4 ) si ha subito la percezione di un esperimento andato a buon fine, con la produzione di risultati corretti. Se oltre a ciò, si osservano anche quelli che sono i miglioramenti delle prestazioni ottenute rispetto ad esperimenti precedenti ( con attuatore robotico simulato, tab. 7.8 ) si ottiene un quadro più che ottimistico riguardanti gli sviluppi futuri di questa tecnologia. In realtà, anche se i risultati sono stati veramente positivi, nel caso di fenomeni complessi come la capacità di apprendimento di una rete di neuroni umani, l’utilizzo di reti artificiali per la decodifica fine e real-time dell’ informazione neurale e la taratura delle reti artificiali non ci si può semplicemente limitare alla visualizzazione di dati percentuali. Considerazioni ben più complesse vanno effettuate per poter meglio chiarire quali sono le reali problematiche ancora esistenti. Partiamo ad analizzare la differenza tra le due classificazioni non positive. Macroscopicamente facilmente distinguibili, in quanto una produce movimento errato e l’altra non ne produce affatto, la ragione di tali comportamenti risiede probabilmente in un malfunzionamento della ITSOM, ovvero è la rete artificiale che non invia alla porta ad infrarossi, il comando di movimento. Si 130 Capitolo 8 Conclusioni pensa che tale comportamento sia dovuto al fatto che l’elaborazione della rete abbia prodotto una serie di z-score differenti da quelli posti all’ interno delle matrici di riferimento costituite durante il training. In questo modo la rete artificiale lancia di default un segnale elettrico senza stimoli, che corrisponde ad un non movimento da parte dell’ attuatore robotico. Completamente differente quanto succede nel caso di una classificazione errata. Infatti in questo caso la produzione degli z-score ha portato a compimento una serie di valori comparabili a quelli di riferimento nelle matrici. In questo caso l’errore può essere stato generato in due maniere differenti, in quanto potrebbe essere dovuto ad una errata elaborazione della rete di neuroni o ad un’errata decodifica da parte della ITSOM. Non si è ancora riusciti con certezza stabilire a quale delle due possibilità bisogna fare riferimento, certo è che entrambe sono ugualmente probabili. La ricerca deve quindi muoversi su due fronti: sia migliorare, più di quanto già fatto, il modello di rete neurale per la decodifica, sia adottare nuovi accorgimenti sperimentali che ottimizzino la capacità di elaborazione dei segnali neurali. Si ritiene che il miglioramento delle prestazioni di elaborazione dei neuroni possano aumentare variando le condizioni sperimentali. Purtroppo effettuare delle prove con i neuroni è molto complesso in quanto sono una coltura cellulare molto sensibile alle variazioni esterne quali temperatura, movimento, illuminazione e terreno di nutritivo. La delicatezza della coltura determina un altro grosso limite sperimentale che è quello del basso numero di prove effettuabili sulla stessa coltura in piastra MEA. Sarebbe scorretto non menzionare l’enormità dei miglioramenti avvenuti in questo campo grazie agli studi effettuati sulle tipologie di stimolo da fornire ( onda quadra ) e la tecnologia a disposizione ( piastre per colture cellulari con micro array sul fondo ). Resta il fatto che spesso si è limitati nel compiere studi statistici sui risultati ottenuti per via dell’ esiguità del numero di dati a disposizione. A tal proposito si ricorda l’impossibilità riscontrata nello studio di relazioni possibili tra 131 Capitolo 8 Conclusioni stimolo e movimento nei casi di classificazione errata (tab 7.3). I risultati offerti nell’ esperimento più recente non hanno permesso di trarre alcuna conclusione a tal riguardo, in quanto gli errori commessi erano distribuiti in maniera abbastanza omogenea tra i vari pattern in input, con una delineata variabilità dei movimenti errati ( se pur con una lieve preponderanza di movimenti verso destra, tab 7.3 ). Questa situazione rappresenta un’elemento positivo ai fini dell’ esperimento, in quanto si è ottenuto un numero di casi errati molto basso. Situazione differente è quella riscontrata nell’ esperimento meno recente. In questo caso il numero di campioni legati ad una errata attuazione robotica è maggiore e rappresenta il 68% dei dati offerti dalla prova (tab.7.8b). Sulle possibili cause di errore e relazioni tra input e output per i campioni non positivi sono state varate più ipotesi riguardanti la distribuzione dei pattern in entrata e la metodologia di training che verranno largamente discusse più in questo capitolo. Tornando a fare riferimento ai risultati offerti dall’esperimento con attuatore reale si è osservato, tramite l’istogramma delle classificazioni, che il 75% delle classificazioni con movimento nella direzione errata erano poste nella parte conclusiva dell’esperimento ( campioni dal 20 al 23, fig.7.1 ). Si giustifica questo comportamento con la perdita di capacità funzionali da parte della rete di neuroni umani. Si è infatti già constatata, tramite prove precedenti, la difficoltà nell’ attuare più di una 20/25 registrazioni causa danneggiamenti alla rete biologica dovuti agli stimoli esterni. In questa frazione di campioni le prestazioni del sistema si abbassano fino al 25%. Questa percentuale è interamente costituita da una sola corretta classificazione avvenuta per il campione 22 (tab.7.1). Tale classificazione è caratterizzata da elevata probabilità di casualità, in quanto cade in uno spazio dei campioni dove le prestazioni del sistema sono molto basse. Se si suppone che una direzione possa essere effettuata casualmente con il 20% di probabilità, ci si rende conto che nei quattro campioni ( dal 20 al 23 ) è lecito aspettarsi che almeno uno sia corretto. Fatta tale supposizione la percentuale 132 Capitolo 8 Conclusioni della prestazione del sistema non deve tenere conto della classificazione n. 22, abbassando le prestazioni totali ottenute dal 73,9% al 69,5%. Altro tipo di considerazioni possono essere fatte riguardanti la non classificazione del campione 2 (fig.7.1). Se nella fase finale le cellule risultano essere sofferenti, nella prima fase sembrano patire il passaggio dalla fase di training a quella di testing. Si suppone che appena terminata la fase di training la rete biologica abbia appreso a riconoscere i diversi pattern, ma presenti delle difficoltà nel riconoscere serie variate degli stessi. Per comprendere ciò di cui si sta parlando bisogna fare riferimento alla strutturazione del training ( vedi il protocollo sperimentale, cap. 6 ). Tale processo viene svolto immediatamente prima della fase di testing. Alla rete biologica vengono inviati 40 stimoli divisi in quattro serie differenti ( una per ogni pattern ). Nel corso del training i neuroni imparano ad elaborare in maniera differenziata e costante i diversi pattern. Come avviene per le reti neurali artificiali, quando si attua un processo di training troppo marcato, la rete impara a riconoscere perfettamente gli esempi dati in training, ma perde la capacità di generalizzazione, che consente di riconoscere i dati appartenenti a classi differenti. Essendo che i pattern in training sono stati forniti rispettando il seguente ordine : 10 stimoli (R), 10 stimoli (L), 10 stimoli (F), 10 stimoli (B), Può essere che al momento dell’ entrata in fase di testing la rete di neuroni umani sia meglio allenata per gli ultimi pattern del training ( F, B ) e abbia meno capacità di generalizzazione e quindi di riconoscimento per pattern R e L . A conferma di questa ipotesi si vede come il pattern del campione 2 (tab.7.1), in input è stato inviato L ma il movimento è stato B, proprio come nel caso del campione precedente e come gli ultimi pattern del training appena effettuato. Ulteriore conferme giungono dall’ esperimento con attuatore simulato. Prendendo atto che il training è stato eseguito in maniera identica a quella dell’ altro esperimento, si nota come le classificazioni corrette siano relative ai pattern F e B soprattutto se effettuate nella prima metà campioni. Gli unici movimenti corretti identificati in tutto l’esperimento sono avanti e dietro, ed in 7 casi su 8 avvengono entro l’undicesimo campione (tab.7.1). All’interno di questa frazione dei campioni 133 Capitolo 8 Conclusioni non mancano le classificazioni errate, anch’esse però caratterizzate sempre da movimenti del robot verso avanti o verso indietro. Come già detto, le prestazioni dell’ esperimento off-line ( senza robot ), sono state quantificate al 32% (tab.7.8b). Si può essere indotti a ipotizzare che tali caratterizzazioni siano casuali. In considerazione del fatto che la casualità di un evento tende a disporsi uniformemente all’ interno dello spazio degli eventi, si è verificato come le classificazioni corrette siano concentrate al 84,5% entro una porzione dello spazio degli eventi pari al 44%. Questo dato fa cadere l’ipotesi di casualità delle identificazioni corrette effettuate. Tale distribuzione è già stata in parte chiarita precedentemente spiegando le complicazioni della rete biologica ad identificare una successione troppo lunga di stimolazioni ed a identificare i primi campioni del testing. A tal proposito si sono osservate le conferme derivanti da ambi gli esperimenti considerati. Bisogna però ammettere che la marcata assenza di classificazioni corrette nella seconda parte dell’esperimento off-line, esula da tale chiarimento. Altre devono essere le cause che portano ad un simile tracollo delle prestazioni per un numero così elevato di campioni ( dal 12 al 25, tab. 7.8 ). Si sottolinea il fatto che tale tracollo non viene osservato nell’esperimento on-line ( con robot reale ). Osservando attentamente la distribuzione dei campioni nell’ esperimento off-line si vede che, al contrario dell’ esperimento on-line, i quattro pattern in input non sono ben alternati. Infatti guardando i campioni di tale esperimento (tab.7.5) è quasi possibile distinguere ad occhio quattro zone d’input : dietro ( dal 1 al 6 ), avanti ( dal 7 al 11 ), sinistra ( dal 12 al 18 ), destra ( dal 20 al 25). Il fatto che i pattern in entrata al circuito non siano stati omogeneamente disposti per tutta la durata dell’ esperimento ha portato la rete biologica a non funzionare correttamente. Tanto più che come pattern di testing iniziali sono stati forniti gli ultimi due pattern del training. In questo modo la rete biologica ha imparato a riconoscere solo quest’ultimi, non sapendo elaborare il segnale corrispondente a destra e sinistra forniti nella seconda parte dei campioni di testing. 134 Capitolo 8 Conclusioni Questa considerazione ha fatto sì che lo stesso errore non venisse ripetuto nell’ esperimento successivo on-line, ottenendo risultati chiaramente migliori. Riassumendo per punti si ha che : • La capacità di apprendimento di una rete di neuroni umani, correttamente allenata, è stata verificata fornendo buone funzionalità per elaborazione di segnali elettrici generati artificialmente. • L’applicazione della rete artificiale neurale ( architettura ITSOM ) ha permesso di arrivare alla creazione di un sistema in grado di utilizzare il segnale in uscita da una piastra di neuroni umani. • Un training troppo insistito aumenta la specificità per l’elaborazione di pattern ma ne fa perdere la capacità di generalizzazione della rete di neuroni umani. • La rete biologica mostra perdita di capacità di elaborazione dopo venti impulsi di testing. • Una distribuzione omogenea dei pattern in input lungo lo spazio dei campioni al circuito è un fattore determinate per la buona riuscita dell’esperimento • La percentuale di corretta classificazione dell’esperimento on-line si è dimostrata leggermente più bassa ( pari a 69,5% ) di quanto non fosse stato inizialmente stimato ( 73,4% ). • La particolare disomogeneità delle classificazione corrette nell’esperimento off-line nega l’ipotesi che tali classificazioni siano avvenute casualmente. • La non classificazione di pattern indica un problema nel funzionamento della rete artificiale ITSOM, causato da un fallito tentavo di paragone degli z-score ottenuti con quelli di riferimento. 135 Capitolo 8 Conclusioni Al termine del capitolo precedente vengono graficamente mostrate (fig. 7.3) le prestazioni ottenute dai due differenti esperimenti. È interessante notare come dopo un primo impatto dove si vedono identiche quantità di classificazioni per due pattern ( avanti, dietro), si vedono differenze nelle prestazioni per i restanti pattern. Dopo aver accuratamente approfondito in questo capitolo risulta chiaro come anche se tali classificazioni sono identiche nel numero sono molto differenti nella motivazione. Nel caso dell’ esperimento on-line si è utilizzata una rete artificiale tarata offrendo risultati corretti e non affetti dall’errore sperimentale di una distribuzione di pattern input non uniforme. D’altra parte, l’esperimento senza taratura della rete, avrebbe probabilmente mostrato risultati ancora peggiori ( anche per i pattern avanti, dietro ) se non si avesse involontariamente utilizzato a proprio favore l’errore sperimentale di una distribuzione di pattern non omogenea, con un buon riconoscimento degli ultimi pattern utilizzati per il training. 9.2 SVILUPPI FUTURI. Gli esperimenti presentati in questa trattazione hanno evidenziato come la strada da percorrere sia giusta. L’utilizzo di reti neurali artificiali sembra aver fornito risultati che con le metodologie classiche di analisi degli spike e burst non sono mai state raggiunte. La capacità di apprendimento della rete di neuroni umani diventa si conferma di esperimento in esperimento. Sicuramente molte sono le variabili sconosciute che entrano in gioco nel campo della neuroscienza, soprattutto nell’area che cerca applicazioni tecnico-scientifiche del materiale neurologico. Gli sviluppi necessari per la comprensione e creazione di nuova tecnologia basata su sistemi ibridi biologici/elettronici devono essere parallelamente svolti su due fronti differenti. Il primo è la ricerca di nuove proprietà del materiale nervoso che ne permettano un utilizzo mirato e una maggior maneggevolezza dello stesso. Infatti la delicatezza del materiale nervoso continua ad essere uno dei limiti più forti nel campo delle 136 Capitolo 8 Conclusioni neurotecnologie, impedendo lunghi campionamenti e pratici usi in laboratorio. Il secondo è il continuo studio per migliorare o progettare nuove architetture di reti artificiali neurali. In questi esperimenti si è visto come esse non abbiano svelato come decodificare l’informazione neurale, ma abbiano mostrato che i segnali elettrici dei neuroni possono essere comunque utilizzati per sviluppare delle tecnologie, superando i limiti imposti dalla classica costruzione di modelli matematici troppo semplificati e non adatti per descrivere questo sistema biologico. 137 Appendice DSP_system Appendice DSP_system. SOFTWARE PER L’ANALISI DEI SEGNALI. L’obiettivo principale delle attività svolte durante il periodo di tesi è stato lo sviluppo del circuito biologico/elettronico e l’analisi dei risultati ottenuti con ulteriore riferimento ad esperimenti precedenti. Oltre a ciò, nell’ambito di collaborazione interna al gruppo LNL, si è partecipato ad attività di laboratorio riguardanti differenti progetti di ricerca. Senza voler entrare nel merito di questi, si ritiene doveroso dare quantomeno una breve descrizione di tali collaborazioni. In particolare ci si è impegnati allo sviluppo di un software per l’analisi dei segnali generati da neuroni umani e raccolte tramite le piastre MEA. Il software sviluppato è stato chiamato Digital Signaling Processing system ( DSP_system ). Architettura del sistema Viene di seguito riportato un diagramma (fig. a) che mostra schematicamente l’organizzazione del sistema sviluppato, esso è interfacciato graficamente per renderlo più gradevole e funzionale all’utente. Il software per poter funzionare necessità dell’istallazione di Matlab su PC e funziona come se fosse un Toolbox di questo programma. Quindi è sufficiente copiare il sistema nella cartella lavoro e lanciare il file “start.m” per fare comparire il primo menu a scelta multipla: 138 Appendice Fig.a DSP_system Menù principale del DSP_system. In questo menù sono riportati i cinque tasti ad esso riferiti. Da questo menù principale (fig.a) si passa dopo avere caricato il file ad altri sottomenù. Selezionando “CARICA IL FILE” compare nella finestra di lavoro di Matlab un elenco dei file che possiamo analizzare che sono stati salvati in precedenza nell’apposita cartella (“CARTELLA_SEGNALI”). Per facilitare la scelta è sufficiente digitare il numero corrispondente al file che intendiamo analizzare e immediatamente ci vengono forniti dei grafici relativi al segnale. A seguito di questa selezione vengono visualizzati due grafici: il primo mostra separatamente l’andamento degli otto canali in uscita dalla rete di neuroni coltivata sui MEA (fig.b), il secondo li sovrappone mettendo in evidenza come varia il loro andamento (fig.c). Di seguito riportiamo un esempio che mostra l’andamento dei segnali quando alla piastra inviamo il “pattern F” denominato “avanti”. Come si osserva dall’immagine ogni canale è indicato con un colore diverso e nella legenda abbiamo l’indicazione di quale canale stiamo registrando. I grafici in ascissa riportano il tempo espresso in secondi di registrazione e in ordinata il potenziale espresso in mV. 139 Appendice DSP_system b) Plot dei segnali uscenti dai MEA(mV/s) 5 1 Channel 0 -5 40 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 2 Channel 2 0 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 3 Channel -5 00 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 4 Channel -5 50 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 -5 50 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 6 Channel 0 -5 50 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 7 Channel 0 -5 0 0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 8 Channel 0 -0.5 1 5 Channel 0 0 0.1 0.2 0.3 0.4 0.5 Time(s) 0.6 0.7 0.8 0.9 1 c) 3 2 1 0 ) V m (l ai t n et o P -1 -2 -3 -4 -5 0 0.1 0.2 0.3 0.4 0.5 Time(s) 0.6 0.7 0.8 0.9 1 Fig. b,c Andamento degli otto segnali registrati. b)visione dell’andamento di ogni singolo canale lungo il tempo. c) visione d’insieme dell’andamento dei segnali registrati. 140 Appendice DSP_system La prima azione che possiamo selezionare dal menù principale è “VISUALIZZZAZIONE PARZIALE”, questa ci consente di spezzare il segnale degli otto canali in finestre temporali dalle dimensioni desiderate in modo da poter effettuare una prima analisi incrociata sui diversi canali nel procedere della registrazione identificando eventuali variazioni. Una volta osservato l’intero segnale possiamo procedere in due direzioni: analizzare le proprietà di un singolo canale oppure comparare i segnali in uscita dei diversi canali. Nel primo caso si sceglie dal menù principale “ANALISI SINGOLO CANALE” e si apre così un sottomenù (fig.d), che riporta le principali analisi che possiamo eseguire sul singolo canale. Fig. d Sottomenù a 6 tasti ottenuto selezionando “analisi di un singolo canale” dal menù principale di fig.a Cliccando “SELEZIONA CANALE” dal menù a scelta multipla (fig.d) viene fornito il numero di canali su cui è possibile effettuare l’analisi. In un secondo tempo viene richiesto su quale canale si vogliono effettuare le analisi elencate nel menù. A questo punto è possibile procedere effettuando l’analisi su tutta la registrazione del canale oppure andare a selezionare una frazione di tempo ( per esempio i primi 400ms). Per fare questo è sufficiente selezionare 141 Appendice DSP_system l’opzione “SELEZIONA INTERVALLO” (fig.d) e nella finestra di lavoro di Matlab verranno richiesti gli estremi dell’intervallo che intendiamo analizzare. Una volta fornito gli estremi, viene visualizzato in dettaglio la frazione del segnale che intendiamo analizzare. Per esempio se selezioniamo il primo canale e l’intervallo 0-400ms otteniamo il grafico (fig.e) riportato nella figura seguente. Plot del segnale 2.5 Segnale 2 1.5 l ai t n et o P 1 0.5 0 0 0.05 0.1 0.15 0.2 Time(s) 0.25 0.3 0.35 0.4 Fig.e Andamento di un singolo canale nel corso della finestra temporale 0400 ms. Una volta selezionato il canale e la frazione di tempo che vogliamo analizzare possiamo procedere con l’analisi vera e propria delle proprietà statistiche del segnale. Pertanto si sceglie dal menù principale “ANALISI COMPARATIVE” (fig.f) e si apre un secondo sottomenù, che riporta le principali analisi che possiamo eseguire comparando i segnali provenienti da due canali. 142 Appendice DSP_system Fig. f Menù a 5 tasti per lo svolgimento di analisi statistiche. Selezionando “SELEZIONA CANALI” dal menù a scelta multipla (fig.f) viene fornito il numero di canali su cui è possibile effettuare l’analisi e viene chiesto nella finestra di lavoro di Matlab di indicare i due canali che s’intendono comparare con le analisi sotto riportate. A questo punto come nel caso precedente è possibile procedere effettuando l’analisi su tutta la registrazione del canale oppure selezionando una frazione di tempo ben definita. Per fare questo è sufficiente selezionare l’opzione “SELEZIONA INTERVALLO” e inserire gli estremi dell’intervallo che intendiamo analizzare, in questo modo viene visualizzata la medesima pozione di segnale per entrambi i canali. Per esempio se selezioniamo il primo e secondo canale e l’intervallo 0-400ms otteniamo il grafico riportato (fig.g). 143 Appendice DSP_system 2.5 Primo canale selezionato 2 1.5 l ai t n et o P 1 0.5 0 -0.5 0 0.1 0.2 0.3 0.4 0.5 Time(s) 0.6 0.7 0.8 0.9 1 3.5 Secondo canale selezionato 3 2.5 l ai t n et o P 2 1.5 1 0.5 0 0 0.1 0.2 0.3 0.4 0.5 Time(s) 0.6 0.7 0.8 0.9 1 Fig.g Andamento dei segnali per i due canali selezionati all’ interno dell’ intervallo desiderato (0-400 ms). Una volta selezionato il canale e la frazione di tempo che vogliamo analizzare possiamo procedere con l’analisi indicate nel sottomenù (fig.f) che sono “coerenza” e “cross-correlazione”. Le analisi statistiche che possiamo effettuare sui singoli segnali (fig.d) sono le seguenti: 1) Selezionando dal sottomenù l’opzione “AUTOCORRELAZIONE” si ottengono a confronto il plot del segnale che stiamo analizzando e l’autocorrelazione del segnale stesso. Di seguito sono riportati i grafici relativi all’autocorrelazione del segnale preso di riferimento. Le unità di 144 Appendice DSP_system misura sono il tempo di ritardo in funzione del coefficiente di correlazione. 2.5 Waveform 2 ) V m ( e d ut i pl m A 1.5 1 0.5 0 0 0.05 0.1 0.15 0.2 Time (s) 0.25 0.3 0.35 0.4 1.2 Autocorrelation 1 0.8 .f f e o c n oi t al er r o C 0.6 0.4 0.2 0 -0.2 -0.4 0 500 1000 1500 2000 2500 Delay fig.h Autocorrelazione del segnale. 2) Il secondo tasto (“PERIODOGRAMMA“) permette il calcolo del periodogramma nell’intervallo selezionato, questo è una stima della densità spettrale. Di seguito è riportato un esempio di periodogramma ottenuto con il DSP system (fig.i). Raw Periodogram 30 20 10 ) el p m a s/ d ar / B d( yt i s n e D l ar t c e p S r e w o P 0 -10 -20 -30 -40 -50 0 0.05 0.1 0.15 0.2 0.25 0.3 Normalized Frequency (×π rad/sample) 0.35 0.4 0.45 0.5 fig.i Periodogramma del segnale registrato. 145 Appendice 3) DSP_system Il terzo tasto permette di eseguire la trasformata di Fourier (“TRASFORMATA DI FOURIER”) del segnale fornendoci un indicazione delle frequenze contenute all’interno del segnale (fig.l). FFT SEGNALE 0.12 0.1 0.08 e d ut i pl m A 0.06 0.04 0.02 0 0 500 1000 1500 2000 2500 Frequency [Hz] 3000 3500 4000 4500 5000 fig.l Trasformata di Fourier del segnale. Le analisi possibili per confrontare i due segnali ( fig.f ) sono le seguenti: 1) Selezionando dal sottomenù l’opzione “COERENZA” si ottiene il confronto delle frequenze dei due segnali che stiamo analizzando. Di seguito è riportato come esempio il grafico relativo alla coerenza (fig.m). Come si osserva in ascissa sono riportate le frequenze mentre in ordinata il coefficiente di correlazione che assume valori compresi tra 0 e 1. 146 Appendice DSP_system Coerenza tra segnali Vaschetta A e Vascheta B 1 0.9 0.8 0.7 0.6 ff e o C n oi t al er r o C 0.5 0.4 0.3 0.2 0.1 0 0 0.05 0.1 0.15 0.2 0.25 Frequency 0.3 0.35 0.4 0.45 0.5 Fig.m Coerenza dei segnali analizzati. La seconda analisi che possiamo eseguire sui due segnali è la crosscorrelazione (selezionando “CROSS-CORRELAZIONE”) di cui di seguito riportiamo un grafico da esempio (fig.n). Cross-Correlazione dei segnali selezionati 0.9 0.8 0.7 0.6 0.5 . ff e o C n oi t al er r o C 0.4 0.3 0.2 0.1 0 -0.1 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 Sample fig.n Cross-correlazione dei segnali. 147 Bibliografia Bibliografia. Adrian, E.D., 1928. The basis of sensation: The action of the sense organs. New York: W. W. Norton & Company. Adrian, E.D., 1932. The Mechanism of Nervous Action: Electrical Studies of the Neurone. Philadelphia: Univ. Pennsylvania Press. Albert, B., Bray, D., Lewis, J., Raff, M., Roberts, K., Watson, J.D., 1994. Molcular Biology of the Cell, 3rd ed. New York: Garland. Akin, T., Najafi, K., Smoke, R.H. and Bradley, R.M., 1994. A micromachined silicon electrode for nerve regeneration applications. IEEE Trans Biomed Eng 41, 305-313 . Bels, B. and Fromherz, P., 2002. Transistor array with an organotypic brain slice: field potential records and synaptic currents. European Journal of Neuroscience 15, 999-1005. Bonifazi, P. and Fromherz, P., 2002. Silicon Chip for Electronic communication between nerve cells by non-invasive interfacing and analog-digital processing. Advanced Material 17. Borkholder, D.A., Bao, J, Maluf, N.I., Perl, E.R. and Kovacs, G.T., 1997. Microelectrode arrays for stimulation of neural slice preparations. J. Neuroscience Methods 7, 61- 66. 148 Bibliografia Bove, M., Martinoia, S., Grattarola, M., Ricci, D., 1996. The neurontransistor junction: Linking equivalent electric circuit models to microscopic descriptions. Thin Solid Films 285, 772-775. Braun, D., and Fromherz, P., 2001. Fast Voltage Transients in Capacitive Silicon-to-Cell Stimulation Detected with a Luminescent Molecular Electronic Probe. Physical Review Letters 13, 86, 2905-2908. Breckenridge, L.J., Wilson, R.J.A., Connolly, P., Curtis, A.S.G., Dow, J.A.T., Blackshaw, S.E. and Wilkinson, C.D.W., 1995. Advantages of using microfabricated extracellular electrodes for in vitro neuronal recording. J Neuroscience Research 42, 266- 276. Brown, E.N., Kass, R.E., Mitra, P.P., 2004. Multiple neural spike train data analysis : state-of-the-art and future challenges. Nature Neuroscience 7, 456-461. Canepari, M, Bove, M., Mueda, E., Cappello, M., Kawana, A., 1997. Experimental analysis of neural dynamics in cultured cortical networks and transitions between different patterns of activity. Biological Cybernetics 77, 153-162. Catterall, W.A., 1988. Structure and function of voltage-sensitivr ion channels. Science 242, 30-61. Chiappalone, M., Novellino, A., Vato, A., Martinoia, S., Vajda, I., van Pelt, J., 2004. Analysis of the bursting behavior in developing neural networks. 2nd Symposium IMEKO, IEEE, SICE. Genova (Italy), June 14-16. 149 Bibliografia Clark, K.L., Cowell, D.F., 1976. Programs, Machines, and Computation. McGraw-Hill, New York. Ditto, S.S.W., 1998. Dynamics based computation, Phys. Rev. Lett. 5, 2156–2159. Egert, U., Schlosshauer, B., Fennrich, S., Nisch, W., Fejtl, M., Knott, T., Müller, T., Hammerle, H., 1988. A novel organotypic long-term culture of the rat hippocampus on substrate-integrated microelectrode arrays. Brain Resource Protoc 2 , 229-242. Ermentrout, B., 1992. Complex Dinamics in WTA Neural Networks with slow inhibition. Neural Networks 5, 403-409. Fromherz, P., Muller, C.O., Weis, R., 1993. Neuron-Transistor: electrical transfer function measured by the Patch-Clamp technique. Phys. Rev. Lett. 71, 4079-4082. Fromherz, P., Schaden, H., 1994. Defined neuronal arborisations by guided outgrowth of leech neurons in culture. Eur J. Neuroscience 6 . Fromherz, P., 2002. Electrical Interfacing of Nerve Cells and Semiconductor Chips. Chemphyschem 3, 276-284. Fromherz, P., 2003. Neuroelectronic Interfacing: Semiconductor Chips with Ion Channels, Nerve Cells, and Brain. Editor R. Waser, WileyVCH Verlag: Berlin. Galli, R., Gritti, A., Bonfanti, L., Vescovi, A.L., 2003. Neural stem cells: an overview. Circ Res. Apr 4; 92(6):598-608. Review. 150 Bibliografia Garcia, P.S., Calabrese, R.L., DeWeerth, S.P., Ditto, S.S.W., 2003. Simple Arithmetic with Firing Rate Encoding in Leech Neurons: Simulation and Experiment. Proceedings of the XXVI Australasian computer science conference 16, Adelaide, 55 – 60. Gritti A., Galli R., Vescovi A.L., 2001. Culture of stem cell of central nervous system, Federoff ed., Humana Press III edition, 173-197. Hebb, D., 1949. The Organization of behaviour. John Wiley. Hertz, J., Krogh, A., Palmer, R., 1991. Introduction to the Theory of Neural Computation. Perseus Books, Cambridge (MA). Hodgkin, A.L., Huxley. A.F., 1939. Action potentials recorded from inside a nerve fiber. Nature 144, 710-711. Hodgkin, A.L., Huxley. A.F., 1952. A quantitative description of membrane current and its applications to conduction and excitation in nerve. J. Physiol (Lond) 117, 500-544. Jenkner, M., Fromherz, P., 1997. Bistability of membrane conductance in cell adhesion observed in a neuron transistor. Phys Rev Lett 79, 47054708. Jenkner, M., Muller, B., Fromherz, P., 2001. Interfacing a silicon chip to pairs of snail neurons connected by electrical synapses. Biological Cybernetics 84, 239- 249. Jimbo, Y., Kawana, A., 1992. Electrical stimulation and recording from cultured neurons using a planar array. Bioelectrochem. Bioeng. 40, 193-204. 151 Bibliografia Jimbo, Y., Robinson, H.P.C., 2000. Propagation of spontaneous synchronized activity in cortical slice cultures recorded by planar electrode arrays. Bioelectrochemistry 5, 107-115. Kohonen, T., 1982. Self-organized formation of topologically correct feature maps. Biological Cybernetics 43, 59-69. Kohonen, T., 1990. The Self-Organizing Map. Proceedings of the IEEE 78, 1464-1480. Kohonen, T., 1991. Self-organizing maps: optimization approaches. In Kohonen, T., Mäkisara, K., Simula, O., and Kangas, J., editors, Artificial Neural Networks. Proceedings of ICANN'91, International Conference on Artificial Neural Networks, volume II, pages 981-990, North-Holland, Amsterdam. Kohonen, T., 1993. Physiological interpretation of the self-organizing map algorithm. Neural Networks 6, 895-905. Kohonen, T., 1995a. The adaptive-subspace SOM (ASSOM) and its use for the implementation of invariant feature detection. In Fogelman-Soulié, F. and Gallinari, P., editors, Proceedings of ICANN'95, International Conference on Artificial Neural Networks, volume 1, pages 3-10. EC2 & Cie, Paris. Kohonen, T., 1995b. Emergence of invariant-feature detectors in selforganization. In Palaniswami, M., Attikiouzel, Y., Marks II, R. J., Fogel, D., and Fukuda, T., editors, Computational intelligence. A dynamic system perspective, pages 17-31. IEEE Press, New York, NY. 152 Bibliografia Kohonen, T., 1995c. Self-Organizing Maps. Springer, Berlin. Kohonen, T., 1996. Emergence of invariant-feature detectors in the adaptive-subspace self-organizing map. Biological Cybernetics 75, 281291. Maher, M.P., Pine, J., Wright, J., Tai, Y.C., 1999. The neurochip: a new multielectrode device for stimulating and recording from cultured neurons. Neuroscience Methods 87, 45-56. Mallat, S.G., 1989. A theory for multiresolution signal decomposition: the wavelet representation, IEEE Trans. Pattern Anal. Mach. Intell. 11, 674–693. Martinez Martinez, P.F.A. 1982. Neuroanatomy: Development and Structure of the Central Nervous System. Philadelphia: Saunders. Newell, A., Simon, H.A., 1976. Computer Science as Empirical Inquiry: Symbols and Search, in Mind Design II, John Haugeland. Nicholls, J.G., Martin, A.R., Wallace, B.G. 1992. From Neuron to Brain: A Cellular and Molecular Approach to the Function of the Nervous System, 3rd ed. Saunderland, M.A.: Sinauer. Parisi, G., 1986. A memory that forgets. J. Phys. A 19, L617-L620. Perkel, D.H., Gerstein, G.L., Moore, G.P., 1967. Neuronal Spike train and stochastic point processes. J. Biophys. 7, 391–418. Pineda, F.J., 1988. Dynamics and Architectures for Neural Computation, Journal of Complexity 4, 216-245. Pitt, W., Mc Culloch, W., 1943. A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biophysics 5, 115-133. 153 Bibliografia Pizzi, R., Sicurello, F., Varini, G., 1998. Development of an inductive self-organizing network for real-time segmentation of diagnostic image. 3rd International Conference of Neural Networks and Expert Systems in Medicine and Healthcare , 44-50, Pisa, 2-4 Settembre, Ifeachor ed. Pizzi, R., de Curtis, M., Dickson, C., 2003a. The Binding Problem: Evidence of Chaotic Attractors in Cortical Fast Oscillations Tested by an Artificial Neural Network. Advances in Soft Computing, J. Kacprzyk ed., Physica Springer Verlag. Pizzi, R., Fantasia, A., Gelain, F., Rossetti, D., Vescovi, A., 2003b. Looking for a quantum processes in networks of human neurons on PCB. Proc. Quantum Mind, Tucson 11-14 aprile. Potter, S.M., 2001. Distributed processing in cultured neuronal networks. In: Nicolelis (Ed.), Progress in Brain Research, M.A.L. Elsevier Science B.V . Reger, B., Fleming, K.M., Sanguineti, V., Alford, S., Mussa- Ivaldi, F.A., 2000. Connecting Brains to Robots: An Artificial Body for Studying the Computational Properties of Neural Tissues. Artificial Life 6, 307-324. Rumelhart, D.E., McClelland, J.L., 1986. Parallel distributed processing. 2 volumi. Cambridge: The MIT Press. Sanger, T.D., 2002. Decoding Neural Spike Trains: Calculating the Probability That a Spike Train and a External Signal Are Related. J. Neurophysiol. 87, 1659-1663. 154 Bibliografia Schatzthauer, R., Fromherz, P., 1998. Neuron-silicon junction with voltage gated ionic currents. European Journal of Neuroscience 10, 1956-1962. School, M., Sprössler, C., Denyer, M., Krause, M., Nakajima, K., Maelicke, A., Knoll, W., Offenhäusser, G., 2000. Ordered networks of rat hippocampal neurons attached to silicon oxide surfaces. Neuroscience Methods 104, 65-75. Schwartz, J.T., 1989. The New Connectionism: Developing Relationships Between Neuro-science and Artificial Intelligence. S. R. Graubard, ed., The Artificial Intelligence Debate: False Starts, Real Foundations (Cambridge, MA: MIT Press). Von der Malsburg, C., 1973. Self-organisation of orientation sensitive cells in the striate cortex. Kybernetik 14, 85 -100. Weis, R., Müller, B., Fromherz, P., 1996. Neuron Adhesion on Silicon Chip probed by an Array of Field-Effect Transistors. Phys.Rev.Lett. 76, 327-330. Willshaw, D. J., Von der Malsburg, C., 1976. How patterned neural connections can be set up by self-organization, Proc. R. Soc. B194, 431-445. Wilson, R.J., Breckenridge, L., Blackshaw, S.E., Connolly, P., Dow, J.A.T., Curtis, A.S.G., and Wilkinson, C.D.W., 1994. Simultaneous multisite recordings and stimulation of single isolated leech neurons using planar extracellular electrode arrays. Neuroscience Methods 53, 101-110. 155 Bibliografia Zeck, G., Fromherz, P., 2001. Noninvasive neuroelectronic interfacing with synaptically connected snail neurons on a semiconductor chip. Proceedings of the National Academy of Sciences 98, 10457-10462. 156