UNIVERSITÀ DEGLI STUDI DI MILANO
Facoltà di Scienze Matematiche, Fisiche e Naturali
Corso di Laurea in Genomica Funzionale e Bioinformatica
Impiego di una rete neurale artificiale per la decodifica fine
in tempo reale dei segnali neurali biologici all'interno di un
sistema robotico ibrido biologico/elettronico.
Relatore:
Prof.ssa Rita PIZZI
Correlatori:
Dott. Giovanni CINO
Tesi di Laurea di:
Roberto ROSSONI
Matr. n. 670380
Anno Accademico 2004/2005
Alla mia famiglia
Indice
Indice
Introduzione
Capitolo 1. Neuroni e cellule staminali
1
1.5 Propagazione del potenziale d’azione lungo la fibra nervosa
1.6 Trasmissione a livello delle sinapsi
1.7 Le cellule staminalI
4
4
7
10
12
14
16
19
Capitolo 2. Interfacce neuroelettroniche
2.1 Robotica biomorfa
2.2 Esperimenti d’interfaccia neuroelettronica effettuati sino al 2000
2.3 Esperimento d’interfaccia neuroelettronica del Prof. Fromherz (2002/03)
2.4 Interfaccia di neuroni-array di microelettrodi ( MEA )
2.5 Utilizzo di MEA per i nostri esperimenti
23
23
24
28
33
34
Capitolo 3. Tecniche classiche per la codifica dell’ informazione neurale
3.1 Il problema della codifica neurale
3.2 Identificazione e caratterizzazione degli eventi di spike
3.2.1 Spike detection
3.2.2 Spike burst detection
3.3 Analisi statistiche classiche per la codifica neurale
3.4 Fasi di un progetto per la codifica di spike train neurali
3.5 Problematiche legate all’utilizzo di tecniche classiche e algoritmi
38
38
40
41
44
46
53
54
Capitolo 4. Introduzione alle reti neurali artificiali
4.1 Intelligenza artificiale classica, non classica e la teoria del connessionismo
4.2 Architettura delle reti neurali
4.3 Reti artificiali che apprendono
4.4 L’apprendimento
4.5 Le regole per l’apprendimento
4.6 Applicazioni generali
58
58
62
71
72
78
80
Capitolo 5. La rete SOM e l’evoluzione ad ITSOM
5.1 Self Organizing Map ( SOM )
5.2 ITSOM ( Inductive Tracing Self Organizing Map )
5.3 Descrizione della rete neurale artificiale utilizzata nell’esperimento
82
82
89
92
1.1 I neuroni: tra biologia ed informatica
1.2 Il neurone biologico
1.3 Il potenziale a riposo di membrana
1.4 Il potenziale d’azione ( PA )
Capitolo 6. Esperimento per la strutturazione di un circuito ibrido
biologico/elettronico
6.1 Trasporto del segnale attraverso il circuito ibrido biologico/elettronico
6.1.1 Generazione del segnale
6.1.2 Elaborazione del segnale da parte della componente biologica,
i neuroni umani
6.1.3 Decodifica del segnale per mezzo di ITSOM
6.1.4 Attuazione del segnale tramite robot
6.2 Protocollo sperimentale
97
98
98
103
105
106
108
I
Indice
Capitolo 7. Risultati
7.1 Risultati sperimentali
113
113
Capitolo 8. Conclusioni
8.1 Considerazioni finali
8.2 Sviluppi futuri
130
130
136
Appendice -DSP_systemSoftware per l’analisi dei segnali
138
138
Bibliografia
148
Ringraziamenti
157
II
Introduzione
Introduzione.
La presente trattazione si colloca all’ interno di un più ampio progetto di
ricerca condotto dal gruppo LNL ( Living Networks Lab ) presso il
Dipartimento di Tecnologie dell’Informazione dell’ Università degli Studi di
Milano. LNL opera nell’ambito delle neuroscienze. In particolare si trattano le
applicazioni tecnologiche derivabili dall’ utilizzo di materiale nervoso ( es.
neuroni umani o di ratto ), direttamente connesso a sistemi elettronici. Il lavoro
di questa tesi è centrato nel mostrare come una rete neurale biologica sia in
grado di apprendere la capacità di classificare pattern d’ingresso, in un circuito
elettrico ad essa interfacciato, attuando una corretta discriminazione tra le
differenti tipologie possibili di input. Lo scopo generale è la strutturazione di
un circuito chiuso all’ interno del quale può essere fatta passare
dell’ informazione. Nel nostro caso l’informazione sarà un comando di
spostamento, generato per mezzo di un software, al fine di far compiere
movimenti ad un robot. Può non essere d’ immediata comprensione
l’originalità dell’ esperimento, in quanto sono diffusi circuiti elettronici in
grado di far muovere a distanza parti meccaniche robotiche ( partendo dalle
automobili elettriche per bambini fino ad arrivare alla sonda spaziale “Spirit”).
I circuiti diffusi per il movimento di parti meccaniche a distanza sono circuiti
di tipo non misto ( unicamente elettronici ), e pertanto artificiali.
Completamente differente è la costituzione di circuiti ibridi ( misti ) con
componenti biologiche ed elettroniche contemporaneamente. In tal caso il
circuito risulta essere non totalmente artificiale poiché possiede una parte di
materiale naturale. Ciò che viene trasmesso tra le varie componenti di un
circuito, sotto differenti forme, si può definire informazione. Di tale
informazione si conosce tutto per quanto riguarda la parte elettronica dei
circuiti, mentre molto diversa è la situazione dell’ informazione legata al
materiale biologico.
1
Introduzione
I pattern forniti alla rete sono segnali elettrici in onda quadra. La scelta a
riguardo della tipologia d’onda utilizzata è stata determinata in maniera tale da
ottimizzare le capacità di apprendimento della rete biologica, tenendo conto di
una serie di parametri che permettono un’attività dei neuroni funzionalmente
simile a quella in vivo, senza comprometterne vitalità e funzionalità. Il segnale
elettrico viene fornito alla rete biologica per mezzo di un’interfacciamento
neuroelettronico permesso da una tecnologia sviluppata nei primi anni ’90: le
piastre MEA ( Multi Electrode Array ). Queste piastre sono caratterizzate, sul
fondo, da un array di microelettrodi sul il quale è possibile far crescere una
coltura cellulare di neuroni. La coltura è costituita da cellule staminali neurali
provenienti da feti naturalmente abortiti. Durante la crescita si assiste alla
“costruzione” della rete biologica con la formazione delle classiche strutture
sinaptiche e dendritiche di collegamento fra le unità cellulari. La rete di
neuroni risulta essere direttamente interfacciata con l’array di microelettrodi,
attraverso il quale è possibile effettuare esperimenti di stimolazione e
registrazione dell’ attività elettrica della rete biologica.
Affermare che una rete biologica sia in grado di apprendere significa aver
implicitamente compreso il sistema di decodifica dell’ informazione contenuta
all’ interno dei segnali elettrici neurali.
La tesi prende in considerazione quelli che sono i metodi tradizionali per lo
studio delle caratteristiche di segnali elettrici prodotti dai neuroni,
considerando le principali analisi statistiche che si effettuano per
l’individuazione e la caratterizzazione di “spike” e “burst”. Gli algoritmi basati
su tali analisi hanno come fondamento un modello matematico semplicistico,
che porta spesso a risultati con accuratezza discutibile. Il quadro della
situazione si complica ulteriormente se a tali algoritmi viene richiesto di
funzionare in modalità “real-time” come è necessario per lo svolgimento dell’
esperimento di robotica effettuato durante il periodo di tesi.
2
Introduzione
Per risolvere l’incapacità degli algoritmi classici, si è applicata un struttura
informatica differente per l’analisi dei segnali : le reti artificiali neurali
( ANN ).
Le “artificial neural networks” costituiscono un importante strumento nel
campo dell’ informatica avanzata, che prende a modello meccanismi biologici.
Utilizzando una rete neurale artificiale con particolare architettura ( ITSOM),
ampiamente descritta all’ interno della tesi, si è decodificato l’insieme dei
segnali provenienti dai neuroni biologici ed è stato possibile inviare questa
decodifica come input ad un attuatore robotico. Fornendo tramite l’array di
microelettrodi quattro differenti segnali elettrici ( corrispondenti ai comandi
per le direzioni avanti, indietro, destra, sinistra ) il robot è stato in grado di
compiere movimenti nelle direzioni stabilite. L’intuizione che rende
interessanti i risultati ottenuti è stata l’applicazione delle reti neurali, che ha
significato utilizzare un mezzo informatico ispirato alle reti di neuroni per
interfacciare i neuroni stessi con altre componenti elettroniche. Con le reti
artificiali si vedrà come nonostante il metodo di decodifica dell’ informazione
rimanga ignoto, sia stato possibile utilizzare segnali elettrici di natura biologica
per l’indirizzamento di devices elettronici.
Per meglio descrivere soluzioni e problematiche a riguardo del progetto
presentato, oltre ai risultati ottenuti da questo, si sono rielaborati i risultati di un
esperimento precedente, il quale venne effettuato prima della taratura delle rete
neurale artificiale e per mezzo di robot simulato.
3
Capitolo 1
Neuroni e cellule staminali
Capitolo 1
Neuroni e cellule staminali
1.1 I neuroni: tra biologia ed informatica.
Il cervello umano è costituito da 1010 neuroni, collegati fra di loro in una rete
molto complessa ed articolata. Ogni neurone è costituito da un corpo centrale
(soma), da un lunga fibra detta assone e da una serie di ramificazioni di varia
grandezza ed estensione dette dendriti ( Nicholls et al. 1992 ). Un neurone
comunica con un altro attraverso dei contatti detti sinapsi ed in questo modo un
singolo neurone può essere collegato fino a circa diecimila altri neuroni. Una
rete di neuroni interconnessi prende il nome di rete neurale. La zona del
cervello che distingue nettamente l’uomo da ogni altro essere animale è la
corteccia cerebrale, una lamina pieghettata, stretta contro il cranio, di spessore
di circa 4.5 mm, che è deputata ai processi mentali.
Un impulso elettrico viaggia di solito lungo l’assone e, nel momento in cui
raggiunge la sinapsi, cioè il collegamento con il dendrite o con il soma di un
altro neurone, provoca la secrezione di particolari sostanze chimiche, dette
neurotrasmettitori ( se ne conoscono oggi circa una trentina di tipi diversi ), che
permettono all’impulso di superare la sinapsi e tornare a propagarsi come
impulso elettrico lungo il secondo neurone. Il neurone si comporta come un
elemento logico binario: acceso (1) se la somma degli impulsi ricevuti
attraverso le varie sinapsi è sufficiente per stimolare la partenza di un impulso
elettrico lungo l’assone e spento (0) nel caso contrario.
La rete neurale opera in parallelo, cioè esegue molte operazioni
contemporaneamente, a differenza dei computer tradizionali che sono
sequenziali, cioè eseguono una operazione alla volta. Questa caratteristica ha
4
Capitolo 1
Neuroni e cellule staminali
suggerito in campo informatico di progettare computer sempre più potenti
basati sul calcolo parallelo.
La memoria può essere considerata un sistema che ha il compito di conservare
le informazioni che provengono dall’ambiente che ci circonda, di organizzarle
e di renderle recuperabili in qualsiasi momento. Ogni persona dispone di una
memoria diversa che riflette le diverse esperienze che ha avuto nel corso della
sua vita. Una prima fondamentale distinzione viene operata fra memoria a
breve termine e memoria a lungo termine. La memoria a breve termine dura
alcuni secondi o minuti, mentre quella a lungo termine può durare ore, giorni o
anni. In una celebre definizione il filosofo latino Seneca paragonò la memoria a
breve termine ad una scritta sulla sabbia spazzata via dalle onde e quella a
lungo termine ad una scritta scavata sulla pietra.
Strettamente associata alla memoria è la funzione del ricordare che significa
associare qualcosa proveniente dalla nostra memoria ad un stimolo sensoriale
esterno. Quando arriva uno stimolo, la rete neurale incomincia una complessa
attività elettrica che la porta ad associare a quello stimolo un determinato
ricordo a breve termine, che solitamente avrà una vita molto precaria. Se
tuttavia entrano in attività gruppi di neuroni associati alla memoria a lungo
termine, allora incominciano ad affluire tutta una serie di ricordi collegati con
lo stimolo iniziale.
La memoria può anche essere distinta in memoria visiva (ci si ricorda di un
viso, della forma di un oggetto, ecc.), uditiva (ci si ricorda una canzone, una
particolare voce, ecc.), spaziale (ci si ricorda un luogo e la strada per arrivarci,
siamo in grado di orientarci, ecc.), emotiva (ci si ricorda di un certo
avvenimento
passato
piacevole
o
doloroso,
ecc.)
e
così
via.
Due tecniche che hanno permesso di conseguire progressi nello studio della
memoria e del ricordo sono la PET (tomografia ad emissione di positroni), e la
risonanza magnetica funzionale ( fMRI ), che consentono di individuare la
zona del cervello che entra in funzione quando ricordiamo qualcosa. Il
cervello, nel momento in cui ricorda un qualsiasi evento passato, consuma
5
Capitolo 1
Neuroni e cellule staminali
zucchero ed ossigeno proprio in quella particolare zona che è coinvolta nel
ricordo. Il metabolismo del cervello viene quindi registrato con la tecnica del
PET ed in questo modo si può ottenere una mappa abbastanza precisa della
nostra memoria. Analogamente la fMRI sfrutta le proprietà magnetiche
dell’ emoglobina per individuare le zone più o meno ossigenate.
Le ricerche di tipo biologico riguardanti il funzionamento del cervello partono
dal presupposto che il cervello possa essere schematizzato come un sistema
cognitivo auto-organizzato in grado di elaborare l’informazione che riceve
dall’esterno. Il suo comportamento è molto complesso, perché non bisogna
pensare ad una semplice legge del tipo che associa ad ogni stimolo ricevuto
una ben determinata risposta, ma invece considerare che lo stimolo mette in
moto nel cervello una complessa dinamica neurale che associa allo stimolo una
rappresentazione particolare, fra le tante archiviate in memoria. Per esempio
basta che sentiamo l’inizio di una canzone per ripercorrere con la mente non
solo tutto il resto del brano, ma anche tutti i ricordi piacevoli o meno che sono
associati a quella canzone. Un semplice stimolo uditivo è in grado di mettere in
moto un certo numero di aree distinte del cervello e di far nascere nella nostra
mente un continuo flusso di ricordi.
Le reti neurali sono state studiate mediante il computer per determinare i
meccanismi che entrano in gioco quando ricordiamo, vediamo, sentiamo, ecc.,
partendo dalla constatazione che i neuroni sono elementi logici a due stati
(spento o acceso, 0 o 1 come un bit). Questi elementi sono poi collegati fra di
loro, ma la forza di questa connessione è ovviamente variabile. Due neuroni
possono avere una forte connessione, cioè se un impulso arriva nel primo
riuscirà quasi sicuramente a passare nel secondo, o viceversa una connessione
molto debole.
Secondo l’approccio biologico la natura della mente umana è strettamente
collegata alle proprietà fisico-chimiche dei neuroni e quindi la rete neurale che
simula il funzionamento del cervello deve comunque tener conto del fatto che
l’uomo è un “computer fatto di carne”.
6
Capitolo 1
Neuroni e cellule staminali
I fautori dell’intelligenza artificiale sostengono invece che ci si può sempre
ricondurre al livello di semplici interazioni fra unità logiche elementari,
essendo il cervello solo un hardware particolare fra i tanti possibili, perché per
un programma è assolutamente inessenziale l’hardware che viene utilizzato, sia
esso costituito da cellule o chip di silicio, come negli ordinari computer.
1.2 Il neurone biologico.
Fig.1.1 Struttura della cellula nervosa e relativa connessione per mezzo di
un bottone sinaptico ad un'altra cellula neurale.
Il neurone rappresenta l’unità strutturale e funzionale del sistema nervoso.
Un tipico neurone possiede un corpo cellulare ( pirenoforo ), neurofibrille,
7
Capitolo 1
Neuroni e cellule staminali
neurotubuli e, come la maggior parte delle cellule un nucleo, mitocondri ed
altri organuli cellulari ( Albert et al. 1994 ). Il neurone (fig. 1.1) è provvisto di
due tipi di prolungamenti cellulari, i dendriti e gli assoni. I dendriti formano di
regola numerose ramificazioni che raccolgono i segnali afferenti (di
eccitazione e di inibizione ) provenienti da altri neuroni ( spesso migliaia ) e
che generano attraverso la membrana cellulare del pirenoforo una somma dei
segnali. L’assone che si origina in corrispondenza del cono di emergenza del
pirenoforo, ha il compito di trasmettere il segnale nervoso efferente ad altri
neuroni o agli organi effettori ( cellule ghiandolari o muscolari ), spesso situati
a notevoli distanze. Nel suo percorso spesso l’assone emana dei rami collaterali
che si suddividono ulteriormente in corrispondenza delle loro porzioni distali
( Martinez Martinez 1982 ). Se, a livello del cono di emergenza, la somma dei
segnali supera un determinato valore soglia, allora si genera un potenziale
d’azione che si propaga lungo l’assone fino ai bottoni sinaptici.
Dall’apparato del Golgi localizzato nel pirenoforo fino alle porzioni terminali
dei dendriti e dell’assone si verifica un trasporto assoplasmatico rapido di
vescicole contenenti proteine, lipidi, zuccheri, sostanze di trasmissione ed altro.
Questo trasporto anterogrado lungo i neurotubuli avviene grazie ad una
proteina simile alla miosina, la chinesina, la cui attività richiede utilizzo di
ATP. In senso retrogrado ( dalla periferia al pirenoforo ) vengono invece
trasportati fattori di crescita nervosa ( NGF, nerve growth factor ). La
membrana plasmatica del pirenoforo continua lungo l’assone come assolemma
e risulta circondata nel SNC da oligodendrociti e nel sistema nervoso periferico
da cellule di Schwann. In alcuni neuroni le cellule di Schwann formano
numerosi strati fosfolipidici concentrici intorno all’assone, il cosiddetto strato
mielinico che funge da isolante per i flussi ionici e risulta interroto lungo
l’assone ogni 1,5 mm da un cosiddetto nodo di Ranvier. Le fibre nervose
mieliniche sono caratterizzate da una maggiore velocità di propagazione dell’
impulso rispetto alle fibre nervose amieliniche. La velocità di propagazione
aumenta inoltre con il diametro della fibra nervosa ( Albert et al. 1994 ).
8
Capitolo 1
Neuroni e cellule staminali
La sinapsi rappresenta la zona di contatto tra l’assone di una cellula nervosa e
un effettore o un altro neurone (fig.1.2). Nei mammiferi in corrispondenza
delle sinapsi avviene ( con poche eccezioni ) una trasmissione chimica e non
elettrica. In seguito all’arrivo del segnale elettrico, a livello della membrana
presinaptica vengono liberate mediante esocitosi delle vescicole contenenti un
neurotrasmettitore ( Nicholls et al. 1992). Questo diffonde attraverso la fessura
sinaptica fino alla membrana post-sinaptica, dove genera nuovamente
cambiamenti elettrici della membrana.
Fig 1.2 Si evidenzia la natura chimica del segnale a livello delle sinapsi.
Questo segnale, originariamente di tipo elettrico, verrà poi commutato
nuovamente in segnale elettrico dopo la trasmissione di neurotrasmettitori
alla membrana postsinaptica.
A seconda del tipo di neurotrasmettitore e del tipo recettoriale inserito nella
membrana post-sinaptica questa viene eccitata o inibita. Poichè la membrana
post-sinaptica non rilascia neurotrasmettitori, a livello della sinapsi la
9
Capitolo 1
Neuroni e cellule staminali
trasmissione del segnale è unidirezionale. Le sinapsi possiedono pertanto una
funzione
valvolare
fondamentale
per
la
trasmissione
ordinata
dell’
informazione, e rappresentano inoltre il luogo in cui la propagazione neuronale
può essere modificata da parte di altri neuroni ( attivazione o inibizione )
( Nicholls et al. 1992, Albert et al. 1994 ).
1.2.1 Il potenziale a riposo di membrana.
Nelle cellule vive la membrana la membrana possiede un potenziale elettrico,
Em, che nelle fibre nervose a riposo viene definito potenziale di membrana a
riposo. Tale potenziale varia, a seconda del tipo cellulare, tra –50 e –100mV
( versante interno della cellula carico negativamente ). Il potenziale si genera a
causa della disomogenea distribuzione degli ioni (fig.1.3) tra liquido
intracellulare ( LIC ) e liquido extracellulare ( LEC ) ( Hodgkin et al. 1939 ).
Fig 1.3 Concentrazioni effettive tipiche e potenziali d’equilibrio dei
principali ioni nel muscolo scheletrico a 37° C.
10
Capitolo 1
Neuroni e cellule staminali
I seguenti fenomeni sono i principali contribuenti alla formazione del
potenziale di riposo:
Mantenimento della distribuzione disomogenea degli ioni: grazie
all’attività della Na+-K+ATPase, ioni Na+ vengono continuamente pompati
fuori dalla cellula, mentre K+ vengono trasportati all’interno, cosicché
nell’ambiente intracellulare la concentrazioni degli ioni K+ risulta circa 35
volte più elevata, mentre quella degli ioni Na+ è circa 20 volte più bassa
rispetto alla concentrazione di questi ioni nell’ambienta extracellulare. Come in
ogni altro tipo di trasporto attivo, anche la Na+-K+ATPase, richiede energia, in
questo caso ATP. In caso di carenza di energia o in seguito all’inibizione della
Na+-K+ATPase, il gradiente ionico sui due versanti della membrana diminuisce
e il potenziale di membrana crolla.
Bassa conduttanza degli ioni Na+ a riposo: in condizioni di riposo,
la membrana plasmatica risulta estremamente poco permeabile agli ioni Na+,
cosicché la differenza di concentrazione di Na+ non può essere prontamente
annullata con la diffusione passiva degli ioni all’interno della cellula.
Elevata conduttanza per gli ioni K+: nella cellula a riposo, la
membrana è discretamente permeabile agli ioni K+ ( circa il 90% della
conduttanza complessiva ). A causa dell’elevata differenza di concentrazione,
gli ioni K+ diffondono per tanto dal LIC al LEC. A causa della loro carica
positiva, anche lo spostamento di un ridotto numero di ioni provoca uno
spostamento di cariche sui due versanti della membrana. Questo potenziale di
diffusione continua fino a quasi compensare il gradiente di concentrazione che
agisce da forza motrice dell’efflusso di ioni K+.
11
Capitolo 1
Neuroni e cellule staminali
1.2.2 Il potenziale d’azione ( PA ).
Fig 1.4 Rappresentazione schematica classica del potenziale d’azione delle
cellule nervose.
Il potenziale d’azione (fig.1.4) è il segnale ( impulso ) che si propaga attraverso
le cellule neurali lungo l’assone ( Adrian 1932, Hodgkin et al. 1939, Nicholls
1992 ). L’eccitazione si genera quando il potenziale di membrana si allontana
dal
suo
valore
riposo
per
assumere
valori
meno
negativi
( predepolarizzazione ). La causa dell’eccitazione può essere l’apertura, a opera
di un neurotrasmettitore, di canali per i cationi situati nella membrana postsinaptica, oppure un’eccitazione proveniente dall’ambiente circostante. Se
durante l’eccitazione il potenziale di membrana si avvicina ad un determinato
valore critico, il cosiddetto potenziale soglia, allora vengono attivati canali per
gli ioni Na+ voltaggio-dipendenti, ovvero la conduttanza agli ioni Na+ aumenta
e tali ioni intraprendono un flusso in entrata alla membrana. Se il potenziale
soglia non viene raggiunto questa eccitazione locale non provoca alcun
12
Capitolo 1
Neuroni e cellule staminali
ulteriore cambiamento. Se Em supera il potenziale soglia, si forma allora il
potenziale d’azione che risponde alla regola tutto-o-nulla, ovvero nel modo
caratteristico per il tipo cellulare e indipendentemente dall’ intensità dello
stimolo che lo ha generato ( Nicholls 1992 ). Inizialmente viene attivato un
numero progressivamente maggiore di canali per gli ioni Na+, e accelerando la
depolarizzazione la conduttanza agli ioni sodici aumenta ulteriormente. In
questo modo Em crolla molto rapidamente ( fase di depolarizzazione ) e
raggiunge temporaneamente persino valori positivi come +20 +30 mV . I
canali per gli ioni Na+ si inattivano molto velocemente ( 0,1 ms ), in funzione
dei quali il potenziale s’inverte e viene a ristabilirsi il potenziale a riposo ( fase
di ripolarizzazione ). In seguito alla depolarizzazione si sono aperti numerosi
canali per gli ioni K+, e la conduttanza per tale ione è aumentata ( abbastanza
lentamente ) di modo da favorire la ripolarizzazione (fig. 1.5).
Fig 1.5 Si riportano le differenti conduttanze ioniche per gli ioni Na+ e K+.
Sono illustrate le differenti velocità di variazione delle conduttanze per i
due differenti ioni.
13
Capitolo 1
Neuroni e cellule staminali
Essendo che spesso la conduttanza agli ioni potassici risulta ancora aumentata
quando la membrana ha già raggiunto il potenziale a riposo, si può verificare
un’iperpolarizzazione (fig.1.6). A tale fenomeno può inoltre contribuire un
maggiore attività della Na+-K+ATPase. Possono generarsi molti PA in breve
tempo, dal momento che la quantità di ioni che fluiscono attraverso la
membrana
è molto bassa. Poco dopo l’inizio di un PA, anche stimoli
estremamente intensi non ne possono innescare un altro, perché nella
membrana depolarizzata i canali per gli ioni Na+ non possono essere attivati
( periodo refrattario ).
Fig 1.6 Attività dei canali per gli ioni Na+ voltaggio dipendente.
1.2.3 Propagazione del potenziale nervoso lungo la fibra
nervosa.
All’inizio della propagazione del potenziale d’azione si assiste ad un breve
afflusso di ioni Na+ all’ interno della fibra nervosa ( Nicholls 1992 ). La
membrana cellulare, inizialmente carica negativamente in corrispondenza del
14
Capitolo 1
Neuroni e cellule staminali
suo versante interno, adesso manifesta una carica opposta ( adesso all’ interno
varia tra +20 e +30 mV ), cosicché si genera una differenza di carica rispetto
alle porzioni adiacenti non ancora eccitate (fig. 1.7). Ciò provoca un
trasferimento elettrotonico passivo di cariche dalle porzioni adiacenti,
generando in tali zone una depolarizzazione. Se in questo modo viene
raggiunto il potenziale di soglia, si origina un nuovo potenziale d’azione,
mentre quello originatosi nella porzione precedente si esaurisce.
Normalmente il PA si propaga in un’unica direzione, poiché la porzione di
fibra nervosa eccitata in precedenza si trova in fase refrattaria. Se nonostante
ciò si verifica un’eccitazione in senso retrogrado ( ad es. in seguito alla
stimolazione della fibra con un elettrodo ) essa termina al più tardi in
corrispondenza della sinapsi più prossima ( funzione valvolare ).
La progressiva generazione di potenziale d’azione nella porzione di fibra di
volta in volta più prossima rigenera sempre il segnale, ma richiede tempo :
nelle fibre amieliniche, caratterizzate da questo tipo di conduzione, la velocità
di conduzione ( θ ) risulta relativamente bassa e corrisponde a 1 m/s. Un valore
molto più elevato di θ si osserva nelle fibre nervose mieliniche, ove può
raggiungere i 90 m/s ( Nicholls 1992 ). Dato che a livello degli internodi queste
fibre risultano isolate dall’ ambiente circostante dalla guaina mielinica, una
depolarizzazione sufficiente per generare un PA può avvenire per distanze
maggiori ( circa 1,5 mm) ovvero in corrispondenza dei nodi di Ranvier, dove la
fibra è priva di mielina ma ricca di canali per gli ioni Na+. In questo senso il
PA si propaga in modo saltatorio da un nodo a quello successivo. La lunghezza
del salto è compensata dal fatto che la corrente di compensazione ( 1-2 nA )
diminuisce all’ aumentare della distanza. Prima che tale corrente raggiunga un
valore “sottosoglia”, il segnale deve pertanto essere rigenerato presso un nodo
di Ranvier.
15
Capitolo 1
Neuroni e cellule staminali
Fig 1.7 schematizzazione della propagazione del PA. Nelle figure 1 a e 1 b
viene riportata la propagazione continua tipica delle fibre amieliniche. La
figura 2 riporta la propagazione saltatoria delle fibre mieliniche.
1.2.4 Trasmissione a livello delle sinapsi.
Le fibre nervose sono connesse tra loro e con cellule sensoriali ed effettori
attraverso le sinapsi. Le sinapsi elettriche sono collegamenti diretti tra neuroni
adiacenti che permettono il passaggio di ioni attraverso canali ( connessoni )
localizzate a livello delle giunzioni serrate( Hodgkins et al. 1939, Nicholls
1992 ). Tali sinapsi provvedono per esempio alla propagazione dell’
eccitazione nella muscolatura liscia, nel miocardio, nella retina e nel SNC a
livello delle cellule epiteliali e tra cellula della glia. Le sinapsi chimiche
provvedono alla conduzione dell’ informazione per mezzo di sostanze
chimiche chiamate neurotrasmettitori. Tali sinapsi non servono soltanto per la
semplice trasmissione del segnale, ma rappresentano anche gli elementi del
sistema nervoso a livello dei quali la trasmissione
dell’ impulso può venire
indirizzata su determinati circuiti, può essere potenziata, inibita ed elaborata
con altre informazioni. In corrispondenza della sinapsi chimica (fig. 1.8), il PA
proveniente dall’ assone libera il neurotrasmettitore contenuto nelle
terminazione presinaptiche ( bottoni terminali ). Tale sostanza diffonde
16
Capitolo 1
Neuroni e cellule staminali
attraverso la stretta fessura sinaptica ( circa 30 nm ) e si lega a livello della
membrana post-sinaptica a determinati recettori di neurone di una cellula
secernente o di una cellula muscolare. A seconda del tipo di neurotrasmettitore
e del tipo di recettore, la membrana può essere eccitata o inibita. La liberazione
del trasmettitore avviene mediante l’esocitosi regolata delle vescicole
sinaptiche. Ogni vescicola contiene un determinato quantum di trasmettitore.
Un certo numero di vescicole è già legato alla membrana ( zona attiva ) ed il
loro contenuto può essere prontamente riversato all’ interno della fessura
sinaptica mediante esocitosi.
Fig 1.8 processo di liberazione del neurotrasmettitore a livello della sinapsi
chimica.
Il segnale per la liberazione del trasmettitore è rappresentato dai potenziali
d’azione e più è alta la loro frequenza e più è grande il numero di vescicole che
libero il proprio contenuto. Un PA provoca, attraverso un aumento della
frequenza d’apertura dei canali per Ca2+ voltaggi-dipendenti situati nella
membrana presinaptica, un aumento della concentrazione citoplasmatica degli
17
Capitolo 1
Neuroni e cellule staminali
ioni Ca2+. Ioni Mg2+ extracellulari impediscono tale processo. Gli ioni Ca2+ si
legano alla sinaptotagmina, innescando in tal modo l’interazione della
sintassina e di SNAP25, localizzati nella membrana presinaptica con la
sinaptobrevina contenuta nelle vescicole sinaptiche. Ciò provoca l’esocitosi
delle vescicole già associate alla membrana ( circa 100 per ogni PA ).
Gli ioni Ca2+ stimolano la proteina cinasi II calcio-calmodulina-dipendente
( CAM-cinasi II ), che attiva a livello della terminazione presinaptica l’enzima
sinapsina ( Nicholls 1992 ). Quest’ultima favorisce l’avvicinamento di ulteriori
vescicole nella zona attiva (fig. 1.9).
Fig
1.9
illustrazione
presinaptica
che
dell’ancoraggio
porta
delle
all’attivazione
vescicole
e
alla
alla
membrana
liberazione
del
neurotrasmettitore.
18
Capitolo 1
Neuroni e cellule staminali
1.3 Le cellule staminali.
Una cellula staminale (fig.1.10) viene comunemente definita come una cellula
che si divide (di solito raramente) dando origine a due cellule diverse tra loro:
una cellula figlia è uguale alla cellula madre ( staminale ) mentre l’altra cellula
figlia è diversa (progenitore) e, anche se può dividersi numerose volte, non può
più farlo indefinitamente ( perdita della staminalità ) e prima o poi tutta la sua
progenie differenzierà in un solo tipo ( cellula staminale unipotente ) o in
diversi tipi ( cellula staminale multipotente ) di cellule differenziate.
Fig.1.10 la parte A illustra la duplicazione delle staminali. Le figure B e C
riportano
rispettivamente
la
duplicazione
di
staminali
unipotenti
e
multipotenti.
Questa definizione è teorica poiché non disponiamo di marcatori molecolari
che ci permettano di distinguere tra loro le due cellule figlie di una cellula
staminale. Possiamo soltanto derivare questa definizione da saggi funzionali
retrospettivi. È oggi possibile ricostituire l’intero sistema ematopoietico di un
topo irradiato letalmente con una singola cellula staminale. Questa procedura è
facilitata dall’impiego di un topo transgenico che esprime in tutte le sue cellule
19
Capitolo 1
Neuroni e cellule staminali
una proteina fluorescente (GFP o green fluorescent protein), così che la cellula
donatrice e tutta la sua progenie saranno facilmente identificabili perché
fluorescenti. Pertanto, se una singola cellula staminale fluorescente (più un
certo quantitativo di progenitori non fluorescenti necessari per mantenere
l’emopoiesi durante il periodo di espansione e colonizzazione midollare da
parte della cellula staminale fluorescente ) viene trapiantata in un topo
letalmente irradiato, il topo ricevente sopravvivrà e tutte ( o quasi ) le sue
cellule del sangue saranno fluorescenti per il resto della sua vita. Inoltre, è
possibile trapiantare con il midollo fluorescente del topo trapiantato un secondo
topo irradiato e ripetere la procedura alcune volte. Questo dimostra che una
singola cellula staminale emopoietica ha la capacità di generare tutti gli
elementi figurati del sangue per tutta la vita di uno o più organismi (almeno nei
roditori). Al contrario, se viene trapiantato un progenitore, questo sarà in grado
di dare origine agli elementi figurati del sangue del topo ricevente per un
periodo limitato di tempo (settimane o pochi mesi), trascorso il quale, tutte la
progenie differenzierà in cellule mature del sangue e poi il midollo andrà in
aplasia.
In base alle conoscenze attuali le cellule staminali vengono divise in due
gruppi principali: cellule staminali embrionali e cellule staminali adulte.
Questa classificazione risulta essere imprecisa in quanto tra le cellule staminali
adulte sono comprese quelle fetali, presenti negli abbozzi degli organi, quelle
neonatali, isolabili dal cordone ombelicale e quelle propriamente adulte,
presenti in molti (o forse tutti) gli organi del nostro organismo (Galli et al.
2003 ).
Le cellule staminali adulte sono presenti in molti e forse in tutti gli organi dei
mammiferi, anche se il loro numero si riduce probabilmente con l’età. In
passato si riteneva che soltanto i tessuti soggetti a continuo ricambio (sangue
ed epiteli) possedessero cellule staminali, necessarie per sostituire con nuove
cellule differenziate le cellule perdute quotidianamente durante tutta la vita
dell’individuo.
Ciò
spiegava
come
questi
tessuti
fossero
soggetti
principalmente a patologie di tipo proliferativo (tumori). Al contrario, i tessuti
20
Capitolo 1
Neuroni e cellule staminali
le cui cellule non si rinnovano (o si rinnovano con estrema lentezza) nella vita
adulta (muscolo scheletrico e cardiaco, tessuto nervoso) erano ritenuti privi di
cellule staminali e quindi prevalentemente soggetti a patologie di tipo
degenerativo.
Le
cose
sono
cambiate
con
la
dimostrazione,
oggi
incontrovertibile, che il sistema nervoso centrale e quello periferico
contengono cellule staminali neurali, capaci di proliferare indefinitamente o
quasi nelle opportune condizioni sperimentali e di generare i principali tipi
cellulari del sistema nervoso quali neuroni e glia. Inoltre, anche il cuore, finora
ritenuto incapace di rigenerazione, probabilmente contiene cellule staminali,
capaci di generare nuovi cardiociti e forse anche cellule muscolari lisce ed
endoteliali.
Le cellule staminali embrionali sono presenti nella massa cellulare interna
( o embrioblasto ) della blastocisti, poco prima dell’impianto nella mucosa
uterina (fig.1.11).
21
Capitolo 1
Fig
1.11
Neuroni e cellule staminali
Dopo
la
gastrulazione
le
cellule
staminali
embrionali
( multipotenti ) diventano adulte ( unipotenti ). Tra i vari tessuti in cui si
riscontrano cellule staminali adulte in rosso si le cellule neurali cerebrali.
Queste cellule possono essere coltivate in opportune condizioni per lunghi
periodi e sono quindi in grado di generare un numero elevatissimo di cellule
figlie le quali mantengono la capacità di differenziare in tutti i tessuti
dell’organismo e per tale motivo sono definite “totipotenti”. Le cellule
staminali embrionali o ES ( dall’inglese: “embryonic stem” cells ) possono
essere geneticamente modificate in vitro mediante sostituzione di un gene sano
con uno mutato o viceversa ( ricombinazione omologa ). Quando iniettate nella
cavità (blastocele) di una blastocisti ospite, le ES colonizzano tutti i tessuti
dell’embrione chimerico ( così definito perché composto dalla mescolanza di
due genotipi diversi ) compresa la linea germinale.
In riferimento agli esperimenti condotti durante la tesi si precisa che le cellule
staminali utilizzate provengono da tessuti di cervelli ottenuti da feti umani
abortiti naturalmente dopo dieci settimane di gestazione. Le cellule staminali
sono state prelevate dal telencefalo e dal diencefalo e differenziate con
apposito protocollo in vitro ( Gritti et al. 2001 ).
22
Capitolo 2
Interfacce neuroelettroniche
Capitolo 2
Interfacce neuroelettroniche
2.1 Robotica biomorfa.
Le ricerche riguardanti campi come la biologia, l’informatica, l’ingegneria,
hanno trovato un comun denominatore. Gli scienziati che si occupano di queste
discipline hanno scoperto un modo di unire gli sforzi, applicando le loro
conoscenze in ambiti di ricerca comuni. Lo studio che ha unito discipline così
apparentemente distanti tra loro, prende il nome di “Biomorphic Robotics”,
un’area di ricerca molto attiva negli ultimi anni. Lo scopo di questa disciplina è
quello di creare delle interfacce che permettano la comunicazione tra organismi
animali ed apparecchiature elettroniche. Quello della robotica biomorfa è un
settore molto aperto ad applicazioni pratiche, dato che, oltre a diverse
università, anche enti privati e governativi cominciano ad organizzare
conferenze e workshop che riguardano queste tematiche.
La NASA, per esempio, nell’agosto 2000, ha organizzato “Workshop on
Biomorphic Robotics” a Pasadena in California. Lo scopo della conferenza era
sia di presentare un visione d’insieme di ciò che s’intende per robotica
biomorfa, che di stabilire una collaborazione tra la NASA e altri istituti di
ricerca, e di definire la maniera per sviluppare sistemi artificiali in grado di
emulare sistemi biologici o per lo meno comunicare con essi.
I maggiori sforzi di chi ricerca in questo campo, sono mirati da un lato a
comprendere come avviene il meccanismo dell’ apprendimento e dell’
adattamento, cercando di formalizzarlo e riprodurlo sul calcolatore, dall’altro a
creare dispositivi in grado sia di interpretare correttamente i segnali elettrici
generati dal cervello di un essere vivente, che di poterne inviare a sua volta,
modificando il comportamento del cervello stesso.
23
Capitolo 2
Interfacce neuroelettroniche
2.2 Esperimenti d’interfaccia neuroelettronica effettuati
sino all’anno 2000.
L’ interfaccia neurone/componente elettronica rappresenta fisicamente il punto
di contatto tra due discipline che insieme porteranno a scoperte sicuramente
stupefacenti. È possibile sia che il circuito elettronico diventi l’accettore di un
apparato biologico, sia che il corpo umano subisca un innesto elettronico;
certo è che in entrambi i sensi di sviluppo l’interesse medico, elettronico e
commerciale è elevatissimo.
I primi esperimenti significativi d’interfacciamento neuroelettronico si sono
svolti all’inizio degli anni novanta, e sfruttavano le elevate dimensioni dei
neuroni di sanguisughe per una maggiore facilità di manipolazione. In questi
esperimenti l’interfaccia avveniva con transistor applicati su piastre di silicio.
Questi esperimenti hanno fatto da apripista nel campo della ricerca
neurofisiologica ma anche per i futuri sistemi ibridi biologico/elettronici,
protesi biolelettroniche, biorobotica e computazione biologica, individuando
quali fossero le due strade da seguire per poter raggiungere risultati importanti.
La prima riguarda il perfezionamento del contatto che avviene tra il neurone e
la piastra di silicio con il transistor. Questa è una visione di tipo microscopico
che punta ad accertare che le proprietà di un fragile elemento come il neurone
non vengano in qualche modo modificate rispetto al reale funzionamento
biologico, falsando così gli esperimenti effettuati.
L’altra visione mira alla costruzione di sistemi composti da una fitta rete
neurale biologica a contatto con una rete elettrica artificiale non invasiva.
Questa tipologia permette studi di apprendimento e memoria da parte delle reti
biologiche. Da notare come in quest’ultimo caso non ci si preoccupa di come
avvengono i contatti tra i neuroni e il materiale elettrico artificiale, bensì
s’intende valutare un segnale elettrico ( in entrata o uscita ) da parte della rete
biologica nel suo complesso ( Egert et al. 1988, Akin et al. 1994, Wilson et al.
24
Capitolo 2
Interfacce neuroelettroniche
1994, Breckenridge et al. 1995, Bove et al. 1996, Weis et al. 1996, Borkholder
et al.1997, Canepari et al. 1997, Jenkner e Fromherz 1997, Schatzthauer e
Fromherz 1998, Maher et al. 1999, Jimbo e Robinson 2000 ).
Nel 1999 il gruppo di ricerca cui fa capo il professor William Ditto presso
l’Università di Atlanta ( Georgia ), ha dato quella che può essere considerata la
prima vera svolta nell’interfaccia computazionale con i neuroni ( Ditto 1998 )
(fig. 2.1).
Ditto riuscì a dimostrare che da una rete composta da soli due
neuroni
interconnessi tra loro è possibile ottenere lo svolgimento di addizioni in modo
corretto. Successivamente, grazie ai risultati offerti da questo esperimento, altri
gruppi di ricerca s’interessarono a questa disciplina e riuscirono a simulare al
computer lo svolgimento di sottrazioni, moltiplicazioni, divisioni e altre
operazioni logiche da parte di una rete neurale ( Garcia et al. 2003, Potter
2001 ).
Esperimenti di maggior complessità vollero testare la capacità di
memorizzazione e di addestramento di una rete neurale. Vennero prelevati dei
neuroni dall’ ippocampo di topo, sfruttando la loro capacità di formare
rapidamente delle sinapsi anche su un supporto di silicio (Fromherz et al.
1993, Fromherz e Schaden 1994, Maher et al. 1999,
Schatzthaeuer et al.
1998 ).
25
Capitolo 2
Interfacce neuroelettroniche
Fig 2.1 Neuroni dell’ ippocampo di topo coltivati su di un chip su supporto
in silicio.
Stimolando la rete neurale con “potenziali d’azione simulati” per mezzo del
circuito elettrico esterno, si spera di osservare dei cambiamenti morfologici
nelle reti di neuroni così coltivate, che possono indicare come i neuroni, nei
cervelli viventi, modificano la disposizione sinaptica in base agli stimoli
elettrici cui sono sottoposti. Questi segnali possono indurre, oltre a
cambiamenti nel numero o nella grandezza delle sinapsi, anche variazioni nella
crescita dendritica, nella formazione di spine dendritiche o nella interazione
con le cellule gliali.
Studiando i fenomeni base di come l’attività elettrica influenza la morfologia
neuronale, e come a sua volta questi cambiamenti influenzano le proprietà
elettriche della rete stessa, si potranno avere anche preziosi parametri per lo
studio delle reti neurali artificiali su computer. Questo permetterà di sviluppare
26
Capitolo 2
Interfacce neuroelettroniche
sistemi di apprendimento artificiali che si avvantaggiano dell’adattamento
intelligente presente nei sistemi biologici ( Pineda 1988 ).
L’elaborazione di reti neurali “miste” potrebbe aprire nuove strade sia nel
campo dell’informatica che in quello delle protesi. Già oggi esiste un orecchio
(coclea) elettronico che registra i suoni, li trasmette a minuscoli elettrodi che
attivano il nervo cocleare di una persona affetta da sordità: negli impianti
effettuati con successo, il cervello deve rielaborare gli impulsi elettrici e
interpretare lo spettro dei suoni digitalizzati attribuendo loro un significato.
Ovviamente
si
è
ancora
lontani
dall’ottimizzazione
necessaria
per
l’applicazione su larga scala, ma si è dimostrato che reti neurali biologiche
opportunamente connesse con apparecchi elettronici possono essere utilizzate
per l’apprendimento, dimostrando un volta per tutte come i neuroni siano
dotati della capacità di associarsi in reti intelligenti e di interfacciarsi con
circuiti artificiali purché questi siano in grado di recepire i loro segnali e
ritrasmetterli alla rete neurale.
La prima creazione di una creatura ibrida costituita da un corpo meccanico
controllato dal cervello di un pesce venne messa a punto nel 2000 tramite una
collaborazione tra due università statunitensi e un italiana ( Northwestern
University of Chicago, Illinois University e Università degli studi di Genova ).
Il robot possiede poche neuroni prelevati dalla Lampreda Marina
( Petromyzon marinus ), un vertebrato primitivo simile alle anguille. Per creare
questo animale artificiale i ricercatori hanno estratto il cervello e la parte della
corteccia con anestesia totale e l’ hanno mantenuta in una soluzione salina
ossigenata e refrigerata; hanno poi isolato un gruppo di poche cellule note con
il nome di “cellule di Muller”. Queste cellule sono responsabili
dell’ interazione tra i segnali provenienti dai sensori e i comandi inviati alle
parti meccaniche, oltre che
aiutare nell’orientamento della Lampreda. I
neuroni tuttavia non sono stati posti all’ interno del corpo meccanico ma sono
stati collegati ad esso per mezzo di cavi. Di fronte ad alcuni stimoli luminosi il
robot ha presentato diversi comportamenti di movimento ( Reger et al. 2000 ).
27
Capitolo 2
Interfacce neuroelettroniche
2.3 Esperimento d’ interfaccia neuroelettronica del
Prof. Fromherz ( 2002/03).
Di particolare rilevanza è l’esperimento condotto dal Professor Peter Fromherz,
neuroscienziato di fama mondiale che opera presso l’istituto di biochimica
“Max Planck” di Monaco di Baviera ( Fromherz 2003 ). I risultati ottenuti
danno l’idea di come in pochi anni si siano fatti passi da gigante nello studio e
nell’ implementazione, tuttavia ancora allo stato embrionale, di interfacce tra
neuroni e chip di silicio.
Il silicio è un materiale adatto a fungere da substrato elettronicamente
conduttivo per due ragioni:
1.
Attualmente è disponibile una tecnologia dei semiconduttori molto
avanzata e ben stabilita che consente di fabbricare dispositivi elettronici
microscopici in silicio.
2.
La crescita su uno strato di biossido di silicio sopprime i processi
elettrochimici che possono portare alla corrosione e al danneggiamento delle
cellule.
Le cellule nervose, che hanno un diametro di 10-100 µm, sono circondate da
una membrana elettricamente isolante. Un sottile strato, spesso circa 5 nm,
separa l’elettrolita intracellulare dall’ ambiente. La corrente elettrica attraverso
la membrana è mediata da specifici canali proteici per il sodio e il potassio
( pompa sodio/potassio) con una conduttanza di circa 10-100 pS. I neuroni e gli
elettroliti sono conduttori di ioni, mentre il silicio è un conduttore di elettroni.
Una volta soppressa la corrente di Faraday all’ interno dell’ interfaccia del
biossido di silicio, l’accoppiamento tra le cellule e il chip può essere raggiunto
solo attraverso la polarizzazione elettrica. Tuttavia, quando una cellula nervosa
cresce su di un supporto solido, non ci si deve aspettare che la membrana
lipidica e il biossido di silicio formino un dielettrico coerente che possa
perfettamente mediare un’interazione capacitiva. Le molecole delle proteine,
che si protendono dalla membrana alla cellula e che si depositano sul substrato,
28
Capitolo 2
Interfacce neuroelettroniche
danno vita a una pellicola elettrolitica tra la cellula ed il chip (fig.2.2): questo
fenomeno disaccoppia elettricamente il chip e la cellula. Si crea allora una
struttura a “sandwich” in cui un sottile strato conduttivo viene separato dagli
ambienti conduttivi di silicio e citoplasma grazie a sottili pellicole isolanti di
biossido di silicio e membrane lipidiche.
Fig. 2.2 Modello di contatto cellula-semiconduttore
La giunzione cellula-semiconduttore ha la natura fisica di un nucleo conduttore
isolato. Le correnti elettriche e la diffusione degli ioni in questa struttura a
“sandwich” governano la stimolazione e la registrazione dell’attività neuronale
sul chip. L’eccitazione di una cellula nervosa, come gia detto nel capitolo
precedente di questa tesi, è dovuta al potenziale d’azione e consiste in una
rapida apertura dei canali sodio con un concomitante flusso di corrente
all’interno della cellula e in una ritardata apertura dei canali per il potassio con
un flusso di corrente verso l’esterno.
Durante un potenziale d’azione, le correnti capacitive e ioniche scorrono
attraverso la membrana del contatto. La corrente è spinta attraverso la
resistenza
del nucleo dando così origine nella giunzione ad un voltaggio
extracellulare Vj(t) dipendente dal tempo. Se sufficientemente forte, questo
stimolo è in grado di influenzare la membrana cellulare, in particolare può
aprire i canali di ioni controllati dal voltaggio, in modo tale da ottenere
29
Capitolo 2
Interfacce neuroelettroniche
eventualmente un potenziale d’azione. L’efficienza dell’accoppiamento
neurone-silicio dipende dalla resistenza della giunzione e dalla corrente
elettrica che attraversa la membrana cellulare collegata alla stessa giunzione,
ma non solo: è importante anche capire quale debba essere la distanza che
separa il chip dalla cellula e quale sia la sua resistenza elettrica. La misurazione
della distanza tra chip e cellula viene fatta attraverso una procedura che viene
denominata FLIC ( fluorescence interference contrast ) che si basa su alcune
proprietà del silicio, tra le quali quella di riflettere la luce (fig.2.3).
Fig. 2.3 Fluorescence interference contrast ( FLIC )
Sono stati fabbricati chip in silicio con piazzole microscopiche di biossido di
silicio ( 2,5x 2,5 µm2, con un’altezza di circa 20 nm ) su cui sono state coltivate
cellule neurali per studiare il gap che divide la cellula dal chip.
Negli esperimenti condotti si è potuto notare che la distanza misurata si attesta
attorno ai 109 nm. Questa “grande” distanza è causata dalle forze entropiche
delle molecole proteiche che sono ancorate alla membrana e sono usate per
isolare il chip in modo da sviluppare la crescita cellulare. Sono stati utilizzati
diversi tipi di cellula e rivestimenti ed il risultato migliore è stato un distanza di
40 nm. Per quanto riguarda invece la resistenza del gap tra cellula e chip, in
base ad alcune misurazioni ed anche alla teoria questa si attesta intorno ai
10Mohm.
30
Capitolo 2
Interfacce neuroelettroniche
È molto affascinate combinare in un singolo esperimento due fondamentali
campi della scienza moderna, la biologia e quella dei semiconduttori,
osservando la diretta interazione degli elementi fondamentali della dinamica
del cervello e dei transistor ( Bels e Fromherz 2002, Fromherz 2002 ).
Un potenziale d’azione si propaga attraverso la membrana cellulare e il gap che
separa la cellula dal chip. Il voltaggio extracellulare Vj(t), che modula la
struttura a banda del semiconduttore, nasce da una sovrapposizione di tutte le
correnti, ioniche e capacitive, presenti nel contatto. La forma e l’ampiezza del
segnale è controllata dall’accumulo e dal rilascio delle conduttanze di ioni
( nella membrana ) e dalla specifica conduttanza nella giunzione.
Monitorando l’attività dei neuroni nelle sanguisughe, lumache e topi, si
possono osservare una certa varietà dei segnali che possono essere compattati
in tre classi (fig. 2.4):
1.
il voltaggio extracellulare è proporzionale alla derivata prima del
potenziale d’azione. Questa risposta di tipo A-type avviene quando tutte le
conduttanze di ioni sono rilasciate nella giunzione e le correnti capacitive sono
controllate.
2.
il voltaggio extracellulare è proporzionale al potenziale d’azione
stesso. Questa risposta di tipo B-type è stata osservata quando una non
specificata conduttanza prevale nel contatto in modo che una corrente ohmica
attraverso la membrana e il gap controlli il voltaggio extracellulare.
31
Capitolo 2
3.
Interfacce neuroelettroniche
il voltaggio extracellulare assomiglia all’inversa della derivata
prima del potenziale d’azione. Il segnale si presenta quando tutte le
conduttanze di ioni pertinenti sono accumulate nella giunzione. Un’intera
classe di segnali ( C-type) è stata osservata per la selettiva accumulazione dei
vari canali di ioni nei neuroni di sanguisughe e topi.
Fig 2.4 Rappresentazione grafica delle tre classi di segnali ottenute.
La stimolazione del neurone attraverso l’interfaccia elettrica senza la presenza
di correnti di Faraday richiede un’alta capacità per area unitaria del chip, per
far modo di iniettare corrente sufficiente nella giunzione. Sono stati costruiti
punti di stimolazione molto efficienti utilizzando il silicio fortemente drogato
con un sottile strato di biossido di silicio.
I neuroni delle sanguisughe possono essere stimolati da un singolo voltaggio
( impulso ) applicato ai punti di stimolazione sotto il neurone. Il meccanismo
della stimolazione, tuttavia, non è ancora chiaro ed alcuni risultati sono ancora
32
Capitolo 2
Interfacce neuroelettroniche
da interpretare. È noto che uno stimolo dà origine ad un voltaggio
extracellulare Vj(t) con velocità esponenziale che si presenta nel gap tra la
membrana ed il chip. Quando si è in presenza di una giunzione B-type, come
sempre accade con i neuroni delle sanguisughe, il voltaggio Vj(t) inietta una
corrente nel neurone che ha come conseguenza la stimolazione del neurone
stesso. Quando invece si è in presenza di una giunzione A-type, la stimolazione
del neurone avviene tramite un voltaggio molto forte e improvviso applicato al
chip.
2.4 Interfaccia neuroni-array di microelettrodi (MEA)
Per comprendere l’attività spazio-temporale nelle reti neurali e le interazioni tra
le differenti aree del cervello la possibilità di effettuare delle registrazioni
“multisito” risulta essere un prerequisito fondamentale ( Maher et al. 1999,
Jimbo e Robinson 2000, Reger et al. 2000, School et al. 2000, Braun e
Fromherz 2001 ).
Per
raggiungere quest’obiettivo nell’effettuazione di studi in vitro,
recentemente si è sviluppata una nuova tecnologia per una più rapida e
migliore registrazione dei segnali elettrici di una rete biologica, le piastre MEA
( Jenkner et al. 2001, Bonifazi e Fromherz 2002 ) (fig. 2.5).
33
Capitolo 2
Interfacce neuroelettroniche
Fig 2.5 vista dall’alto di una piastra MEA composta da 60 microelettrodi.
Queste piastre sono comuni piastre per la crescita di colture cellulari
caratterizzate dalla presenza di un elevato numero di elettrodi per la
registrazione dell’attività elettrofisiologia della rete nella base. I microelettrodi
delle MEA sono in genere più di una sessantina e offrono grandi vantaggi nella
registrazione dell’ impulso elettrico neurale. Infatti le tre caratteristiche
principali delle piastre MEA sono:
1.
Facilitano la crescita delle colture ( nel caso di neuroni, favoriscono la
formazione di reti con relative sinapsi )
2.
Sono una tecnica non invasiva
3.
Attuano la registrazione dell’attività elettrica non di un singolo neurone
ma di tutta la rete presente nella piastra.
La non invasività degli elettrodi in MEA ha permesso di effettuare studi sulla
funzionalità elettrofisiologia di culture cellulari a lungo termine, in quanto le
cellule cresciute su queste piastre, se opportunamente conservate, possono
vivere anche per alcune settimane. Sfortunatamente questo non è il caso delle
cellule neurali le quali risultano essere particolarmente fragili, e nessuno è
ancora riuscito ad effettuare studi in vitro a lungo termine ( Zeck e Fromherz .
2001 ).
2.4.1 Utilizzo di MEA per i nostri esperimenti.
Come vedremo più avanti, anche negli esperimenti trattati in questo lavoro
sono state utilizzate MEA per la registrazione dei segnali elettrici delle colture
neurali (fig. 2.6).
34
Capitolo 2
Interfacce neuroelettroniche
Fig. 2.6 Piastra MEA utilizzata durante gli esperimenti. Come si vede dall’
immagine i cavi elettrici sono interfacciati alla piastra per mezzo di in
placca di rame posta a contatto con i circuiti dei microelettrodi della MEA e
bloccata da quattro morsetti alle estremità.
L’utilizzo di queste piastra ha necessitato di alcuni accorgimenti. In quanto i
MEA, prima di essere utilizzati, dato che vengono assemblati utilizzando
silicone, che è neurotossico,
essi devono poi essere lavati accuratamente
seguendo un preciso protocollo:
•
lavare in alcool 70% la piastra servendosi di un bastoncino di cotone
•
lasciare la piastra per 6 ore sotto l’acqua corrente, possibilmente
distillata
•
lasciare la piastra per 6 ore in alcool 70%
•
lavare con 4 brevi risciacqui la piastra con detergente non saponato e
acido
•
sciacquare con alcool 70%
•
lavare con acqua distillata
•
lasciare in acqua distillata sotto raggi UV “overnight”
•
aspirare l’acqua e lasciare asciugare sotto cappa sterile
35
Capitolo 2
Interfacce neuroelettroniche
Una volta effettuato il lavaggio dal silicone la procedura prevedeva la
piastrazione delle cellule per mezzo di “matrigel”, molecola di adesione
ricavata dal sarcoma di verme. Il matrigel a temperatura ambiente gelifica in
breve tempo ( in frigo a 4° C è liquefatto ) permettendo una corretta adesione
delle cellule alla piastra. I primi tentativi dell’ utilizzo di questa molecola
d’adesione furono fallimentari in quanto il matrigel dopo due giorni
dall’estrazione dal frigo si sollevava dal piano della piastra fino al distacco (fig.
2.7), provocando in questo modo la morte delle cellule pilastrate.
Fig 2.7 L’immagine mostra il sollevamento del matrigel dalla piastra che
porta alla sensazione di frammentazione del gel. Nella parte superiore è
visibile una parte dove è avvenuta la completa rottura del gel.
Per superare questo problema si è deciso di lasciare gelificare il matrigel
“overnight”, e procedere alla piastrazione delle cellule in un secondo momento.
In questo modo l’adesione rimaneva costante per tutti i 25 giorni necessari alla
maturazione cellulare prima dell’effettuazione degli esperimenti.
36
Capitolo 2
Interfacce neuroelettroniche
Fig 2.8 Immagine al microscopio delle cellule correttamente adese
trascorsi 15 giorni dalla piastrazione.
Come si nota dalla figura 2.8 a soli 15 giorni dalla piastrazione già si possone
notare le celule a diretto contatto con i microelettrodi della MEA.
Ogni
elettrodo è connesso attraverso un sottile percorso isolato ad un collegamento
esterno. Di tutti i collegamenti situati nel supporto alcuni fungono da input,
altri da output ed altri ancora hanno il compito di fungere da massa. I MEA
vengono posti dentro ad un box per il controllo della temperatura. Si richiede
infatti il mantenimento costante a 37° C, temperatura che garantisce la
gelificazione del matrigel.
37
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
Capitolo 3
Tecniche
codifica
classiche
dell’
per
la
informazione
neurale.
3.1 Il problema della codifica neurale.
I neurofisiologi generalmente forniscono stimoli e simultaneamente registrano
l’attività neurale da parte della regione cerebrale che si sta studiando. Lo
stimolo può essere di natura fisica molto variabile come la luce, utilizzata per
la stimolazione dei neuroni della retina, o come il suono per stimolare l’attività
elettrica neurale della corteccia auditoria. La questione sperimentale si
concentra sulla relazione esistente tra un possibile stimolo e una risposta,
individuale o di gruppo che sia, in termini di spike prodotti. Inizialmente gli
studi si concentravano sulla risposta che poteva essere fornita da un’unica unità
neuronale ( Hodgkin e Huxley 1952, Catterall 1988 ).
In tempi più recenti, con l’avvento di tecniche che permettono la registrazione
dell’ attività elettrica di una porzione di rete neurale biologica ( ad es. MEA,
vedi cap.2 ), questo tipo d’analisi è stata abbandonata. Infatti in ogni piccola
porzione del cervello animale, migliaia di spike vengono emessi ogni
millisecondo, e si propagano attraverso una complessa rete costituita da
migliaia di connessioni
( Nicholls 1992 ).
La fig. 3.1 aiuta ad immaginare la quantità di segnali che vengono emessi dai
neuroni di un organismo, riportandone solamente una piccola parte.
38
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
Fig 3.1 Pattern spazio-temporale delle pulsazioni in termini di spike, da
parte di 30 neuroni ( A1-E6, plottati lungo l’asse orizzontale ). Il tempo di
registrazione è di soli 4 secondi. Gli spike sono caratterizzati dalle linee
verticali nere.
Essendo certo che gli animali rispondo agli stimoli secondo canoni precisi, e
che le informazioni sono trasmesse per mezzo del sistema nervoso, alle varie
parti del corpo, tramite segnali elettrici come quelli nella figura qui sopra
riportata, ciò che ci si domanda è : qual è l’informazione contenuta all’ interno
dei pattern spazio-temporali? Qual è il codice utilizzato dai neuroni per
trasmettere le informazioni? Come fanno i neuroni che ricevono il segnale a
codificarne il contenuto? Come osservatori esterni al sistema nervoso,
possiamo capire qual è il messaggio contenuto nell’attività
elettrica dei
neuroni?
Le suddette domande indicano il problema della codifica neurale, uno dei temi
più interessanti della neuroscienza. Risposte ben definite alle domande appena
formulate non sono ancora state trovate. Tradizionalmente si è pensato che la
maggior parte, se non tutte, le informazioni rilevanti fossero contenute nel
39
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
tasso medio di “firing” del neurone. Il firing rate è definito solitamente da una
media temporale:
ν = np ( T )/ T
Solitamente il tempo T è posto come T= 1000 ms o T=500 ms, e vengono
contati il numero di spike np( T ) che compaiono all’ interno della finestra
temporale considerata ( Jimbo et al.1992 ). La divisione del numero di spike
per la durate della finestra fornisce il firing rate medio. Il concetto di firing
rate medio è stato ampliamente utilizzato negli studi effettuati nel corso degli
ultimi 80 anni. Ci si può infatti rifare a lavori molto datati come quello
effettuato da Adrian nel 1928 dove veniva mostrato che il firing rate dei
neuroni muscolari era relazionato con la forza applicata dai muscoli ( Adrian
1928 ). Nei decenni seguenti, le misurazioni di firing rate sono diventate uno
strumento standard per la descrizione delle proprietà di tutti i neuroni sensoriali
o corticali. È chiaro, tuttavia, come un metodo basato in media temporale
trascuri tutte le informazioni presumibilmente contenute nella sincronizzazione
esatta dei punti. Nonostante questa enorme approssimazione di un sistema
complesso quale può essere considerato la rete di neuroni biologici, è
sull’analisi della frequenza degli spike che si basano i metodi classici per la
codifica delle informazioni trasmesse attraverso il sistema nervoso.
3.2 Identificazione e classificazione degli eventi di spike.
Nell’ultimo decennio, il progresso nel campo della neuroingegneria ha aperto
nuove possibilità di analisi dell’attività elettrica dei neuroni. Oggigiorno,
durante gli esperimenti di neurofisiologia, non vi è alcuna registrazione di tipo
individuale di spike. Ciò avviene in quanto la registrazione avviene per mezzo
di piastre multielettrodo. Tali piastre danno misurazione del voltaggio
extracellulare tramite ognuno degli elettrodi di registrazione, dai quali si
registra la simultanea attività di un numero imprecisato di neuroni facenti parte
40
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
di una rete biologica. Da questi voltaggi registrati si possono identificare gli
eventi di spike; tale processo di caratterizzazione viene generalmente definito
come “spike sorting”. Lo spike sorting è il processo iniziale obbligatorio per
l’analisi di spike train. Alcuni algoritmi sono stati sviluppati per riuscire ad
identificare e classificare gli eventi di spike registrati durante un esperimento di
neurofisiologia, ma ad oggi non si è ancore riuscito a stabilire quale sia il
migliore. È stata infatti riscontrata una discordanza di output forniti dall’analisi
delle medesime registrazione elettriche. L’impossibilità di far convergere le
soluzioni ad un risultato unico e certo ci dà la dimensione della complessità del
problema della caratterizzazione di spike e dell’estrazione dell’informazione
che si ritiene in essi contenuta. I complessi algoritmi d’elaborazione sono
spesso nascosti all’utente da un’interfaccia utente semplice ed intuitiva
realizzata secondo gli standard Graphical User Interfaces (GUIs), Mouse
Driven Events ed i risultati delle sessioni di analisi sono facilmente
condivisibili in quanto compatibili con i più diffusi strumenti di visualizzazione
ed analisi, quali ad esempio Microsoft Excel o Microcal(™) Origin.
3.2.1 Spike detection.
Gli studi di estrazione dei parametri rilevanti da una popolazione di neuroni
sono contraddistinte da misurazioni a lungo termine ( possono durare minuti
o ore ), le quali producono file nell’ordine dei Gigabyte come risultato di un
unico esperimento. La scarsa maneggevolezza dei dati ottenuti, dovuta alla
dimensione, risulta essere un fattore limitante l’analisi dei segnali ottenuti. Un
esempio classico di algoritmi per la determinazione degli spike ( spike
detection ) all’interno di segnali neurofisiologici è rappresentato da quella
categoria di algoritmi basati sul metodo della soglia picco-picco ( Perkel et al.
1967 ).
Tali algoritmi permettono di seguire le eventuali oscillazioni del segnale, e di
una finestra mobile, dimensionata in modo tale che possa contenere al più uno
41
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
spike: idealmente, la sua durata è pari alla durata degli spikes da individuare; la
finestra viene fatta scorrere sul segnale finché la differenza tra il valore
massimo ed il valore minimo del segnale contenuto nella finestra non supera la
soglia picco-picco ( fig. 3.2 ). Quando questo accade, è segnalato uno spike.
Fig 3.2 individuazione del picco per mezzo di un algoritmo peak-to-peak
threshold. Il rettangolo tratteggiato rappresenta la finestra mobile che
scorre lungo il segnale registrato mache non trova un valore sufficiente per
determinare la presenza di uno spike. Diversamente nel rettangolo
successivo la soglia viene superata e si riscontra uno spike. La soglia viene
di fianco mostraro per mezzo della freccia.
Il valore soglia da utilizzare per la ricerca dei picchi di minimo e di massimo
che contraddistinguono gli spike viene calcolata come un multiplo della
deviazione standard ( STD ) del rumore biologico. In genere si assume che la
soglia sia sette volte superiore ad STD. La finestra mobile scorre lungo il
segnale registrato ed identifica gli spike contenuti in esso. I due parametri
necessari per la determinazione degli spike per mezzo della finestra mobile
sono: la latenza di spike e il valore della soglia picco-picco. Una volta immessi
tali parametri l’algoritmo segue la variabilità biologica del segnale e ne estrae
caratteristiche rilevanti per ulteriori procedure di analisi. Per stimare il grado di
42
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
attività della rete in esame, simultaneamente all’ identificazione dei potenziali
d’azione, viene calcolato il firing rate medio.
Un parametro che viene sempre preso in considerazione quanto si tratta la
rilevazione di spike è lo ISI, Inter Spike Interval ( Chiappalone et al. 2004 ).
L’ inter spike interval è definito come l’intervallo temporale che intercorre tra
due spikes successivi (fig.3.3) e l’istogramma degli inter spike intervals si
costruisce raggruppando gli ISI.
Fig 3.3 ISI, Inter Spike Interval. Intervallo temporale tra due spike
consecutivi ( ta, ta+1 )
L’istogramma ISI (fig.3.5) fornisce una stima statistica della densità di
probabilità di “firing” di una sequenza di spikes rispetto uno spike di
riferimento. Attraverso le ISI può essere osservata l’attività di “bursting” nei
neuroni, dove gli intervalli che intercorrono tra un burst ed il successivo
corrispondono a lunghi intervalli nella distribuzione delle ISI.
43
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
Fig 3.4 ISIH, Inter Spike Interval Histogram, fornisce una stima della
densità di probabilità di bursting dei neuroni.
3.2.2 Spike Burst detection
Oltre all’ormai nota attività di spike, le reti di neuroni corticali mostrano un
comportamento molto importante, a cui si è gia accennato anche nel paragrafo
precedente, a livello neurofisiologico: lo spike burst ( Mallat 1989,
Chiappalone et al. 2004 ).
Il burst ( dall’ inglese scoppio ) può essere definito come un insieme di eventi
spike molto ravvicinati nel tempo, tanto da poter essere considerati un’unica
entità elettrofisiologica di studio (fig.3.5).
44
Capitolo 3
Fig.
3.5
Tecniche classiche per la codifica dell’informazione neurale
Registrazione
di
un
burst.
La
zona
interessata
dal
burst
( evidenziata dal cerchio rosso ) è caratterizzata da un’elevata serie spike
ravvicinati.
Anche nel caso della determinazione dei burst (fig.3.6), l’attività di rilevazione
può avvenire per mezzo di una finestra mobile ( come quella utilizzata per la
rilevazione di singoli spike ) che scorre lungo il segnale elettrofisiologico
registrato. La determinazione da parte dell’ algoritmo può avvenire in due modi
differenti, considerando un burst come una sequenza di pochi spike molto
ampi, o come pacchetti di spike caratterizzati da un livello di attività tenue ma
duraturo nel tempo.
Fig. 3.6 in rosso dall’alto sono riportati: gli spike rilevati dall’algoritmo e il
segnale registrato. In basso in verde troviamo gli ISIH relativi alla
registrazione.
45
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
L’immagine della fig. 3.6 illustra la tipologia dei file registrati dagli algoritimi
per la rilevazione di spike e burst. Tali risultati costituiscono il punto di
partenza per le successive analisi statistiche.
3.3 Analisi statistiche classiche per la codifica neurale.
Lo
studio
della
codifica
dell’
informazione
neurale
è
basata
sull’ implementazione di analisi statistiche che considerano l’ attività
sincronizzata della rete di neuroni come la somma di piccole attività di spike
( Sanger 2002, Chiappalone et al. 2004 ).
Per studiare il livello di sincronizzazione dell’attività della rete e rilevare le
variazioni significative dovute a stimolazione elettriche dall’esterno, sono stati
implementati algoritmi per lo svolgimento di funzioni statistiche classiche . Si
possono infatti trovare algoritmi per lo studio della densità di probabilità di
burst ( ISIH ), della funzione di autocorrelazione per mezzo di JISIH ( joint ISI
histogram ) e della funzione di cross correlazione tramite CISIH ( cross ISI
histogram ) per stimare la sincronizzazione relativa all’ attività di spike. Altra
classica osservazione compiuta è quella di JPSTH ( Joint Peri-Stimulus Time
Histogram ), che mette in risalto la possibile attività sincronizzata di due
neuroni.
Cambiando la scala del tempo, è possibile estrarre informazioni simili
dall’ attività di burst, utilizzando IBIH ( Inter Burst Interval Histogram ), il
cross IBIH e joint IBIH.
Dato uno spike di riferimento, la JISI è un’analisi statistica costruita a partire
da due variabili: l’ISI che precede lo spike di riferimento e l’ISI che lo segue
(fig.3.7), calcolata per tutti gli spikes del treno.
46
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
Fig 3.7 Illustrazione delle variabili in gioco per la trattazione di JISI
•
JISI ( Joint Inter Spike Interval)
Gli intervalli pre-ISI e post-ISI sono rappresentati in un piano cartesiano,
pertanto
il
risultato
della
JISI
è
un
istogramma
tridimensionale.
La formula che permette tale operazione è la seguente:
dove τx e τy indicano l’intervallo post e pre ISI.
47
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
Fig. 3.8 Le due rappresentazioni sono modi differenti per presentare
l’analisi
JISI.
Le
coordinate
(x,y,z)
dell’
istogramma
descrivono
rispettivamente valore di pre-spike, post-spike e frequenza di spike.
Utilizzando la color map, le due dimensioni (x,y) descrivono pre e postspike,la terza dimensione ( frequenza ) è data dal colore rosso.
Per quanto concerne l’interpretazione dei grafici riportati in fig. 3.8 bisogna
dire che: la distribuzione dell’istogramma JISI fornisce una stima statistica
della probabilità che l’occorrenza di uno spike sia legata allo spike precedente
e al successivo. Ciascun punto della JISI è descritto dalle coordinate:
(x, y, z) = (post-ISI, pre-ISI, numero di occorrenze) e quando si verificano dei
raggruppamenti di punti in una zona è molto plausibile che esista una
dipendenza tra le post-ISI e le pre-ISI. Raggruppamenti orizzontali o verticali
sono indice di indipendenza tra gli intervalli pre e post-ISI.
•
CISI ( Conditional Cross Inter Spike Interval )
Con la CISI si cerca di stimare la probabilità che si verifichi attività
caratterizzata da un particolare ISI a partire dall’occorrenza di uno spike nel
neurone di riferimento, un certo intervallo dopo che il neurone condizionante
abbia emesso,a sua volta, uno spike. Pertanto il calcolo dell’istogramma CISI
bisogna avere un file di riferimento ed un file condizionante. Siano: A lo spike
48
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
train di riferimento; B lo spike train condizionante; la relazione della CISI è
espressa dalla:
Dove τx è post-ISI, τy pre(cross)ISI e tb l’istante dell’ occorrenza impulso nel
treno B (fig.3.9).
Fig. 3.9 Nella parte superiore dell’ immagine si riporta il treno dello spike
di
riferimento.
Nella
parte
inferiore
vi
è
il
treno
dell’
impulso
condizionante.
Se i punti formano una banda orizzontale, allora esiste una correlazione tra il
cross-intervallo ed il post-intervallo, rispetto lo spike di riferimento. Bande
verticali di punti, invece, indicano che non esiste alcuna correlazione tra gli
intervalli delle occorrenze rispetto un particolare spike di riferimento. In altre
parole, l’attività dei neuroni di riferimento è indipendente dall’attività dei
neuroni condizionanti.
49
Capitolo 3
•
Tecniche classiche per la codifica dell’informazione neurale
IBIH ( Inter Burst Interval Histogram )
Si è pensato di eseguire, per le sequenze di bursts, lo stesso tipo d’indagine
statistica adottata per gli spike trains. Ovviamente le occorrenze considerate
non sono più i singoli picchi, bensì i pacchetti d’attività; pertanto la finestra
d’esame deve essere dell’ordine delle centinaia di millisecondi ed il periodo
d’esame, cioè la durata massima dell’IBI, deve essere dell’ordine delle decine
di secondi. La formula per il calcolo dell’istogramma IBI è:
Dove t è l’intervallo tra due burst consecutivi ( IBI ) (fig.3.10).
Fig. 3.10 Rappresentazione grafica di un IBI, che rappresenta la distanza
nel tempo tra due eventi di burst consecutivi
50
Capitolo 3
•
Tecniche classiche per la codifica dell’informazione neurale
JBIH ( Joint Burst Interval Histogram )
Questo tipo di elaborazione calcola l’istogramma delle distanze temporali tra
un burst di riferimento e, rispettivamente, quello che lo precede e quello che lo
segue. La formula che permette questa operazione è la seguente:
τx e τy indicano l’intervallo post e pre-IBI (fig.3.11).
Fig. 3.11 rapprentazione degli intervalli considerati nello studio di JIBI.
•
CIBI ( Conditional Cross Inter Burst Interval )
Analogamente alla CISI, con la CIBI si cerca di stimare la probabilità che si
verifichi attività caratterizzata da un particolare IBI a partire dall’occorrenza di
un burst nel neurone di riferimento, un certo intervallo dopo che il neurone
condizionante abbia prodotto,a sua volta, un burst. Pertanto anche per il calcolo
dell’istogramma CIBI bisogna avere un file di riferimento ed un file
condizionante.
51
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
τx, post-IBI; τy pre(cross)-IBI ; t b istante di occorrenza del burst.
•
JPSTH ( Joint Peri-Stimulus Time Histogram )
L’ analisi joint peri-stimulus time histogram è la logica estensione della singleneuron PSTH. Mentre PSTH mostra il numero di spike prodotti da un singolo
neurone per unità di tempo, JPSTH mostra, per mezzo di un istogramma
bidimensionale, la conta del numero di spike al tempu u per un dato neurone 1,
e quella per un dato tempo v per il neurone 2 (fig.3.12).
Fig. 3.12 PST joint histogram. Plot diagonale di due single-neuron PSTH, a
dare JPSTH. I due PSTH sono disegnati in verde sugli assi delle ascisse e
ordinate.
La diagonale mostrata in fig 3.12 fornisce per ogni tempo t il tasso di firing
simultaneo per i due neuroni considerati. Viene spesso utilizzata una
modificazione di JPSTH, chiamata JPSTH normalizzato. Il JPSTH
normalizzato serve per eliminare l’ errore che si può commette osservando
come dipendenti gli eventi di firing di due neuroni ad elevata attività di spike,
che in realtà sono indipendenti l’uno dall’ altro, senonchè casualmente hanno
spike sovrapposti nel tempo. Il JSPTH normalizzato della coppia dei tempi
(u,v) definisce la loro correlazione di Pearson del firing dei neuroni 1al tempo
u, e del neurone 2 al tempo v. Sommando le diagonali di tutti i JSPTH prodotti
52
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
durante l’ intero studio riferito a tutta la rete neurale in esame, si ottiene il
cross-correlogramma normalizzato.
3.4 Fasi di un progetto per la decodifica di spike train
neurali.
Gli algoritmi per la decodifica di spike train sono tecniche matematiche
utilizzate in neuroscienza per studiare come i pattern di spike train, di un
singolo neurone o di un’insieme di essi, rappresentino gli stimoli esterni e
segnali biologici. L’analisi di decodifica si sviluppa generalmente in due fasi:
la fase di codifica e quella di decodifica (fig.3.13). Durante la fase di codifica,
l’attività di spiking neurale è caratterizzata come funzione del segnale
biologico. Al contrario, nelle fase di decodifica, tale relazione viene invertita,
ed il segnale biologico viene stimato a partire dall’ attività neurale.
53
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
Fig. 3.13 Decodifica della posizione tramite l’attività spike di neuroni di
ratto. (a) Analisi di codifica nella quale la relazione tra lo stimolo biologico
(traiettoria del ratto, vedi pannello ”posizione”) e l’attività di spike, viene
stimata come “recettività del campo” da parte di tre neuroni. (b) Analisi di
decodifica nella quale la
“ recettività di campo ” viene utilizzata
dall’algoritmo Bayesiano per predirre la posizione ( linea nera sottile) del
ratto nell’ ambiente tramite una registrazione di dell’ attività di spike del
ratto durante la fase di decodifica. La regioni di confidenza nella
determinazione della posizione è mostrata nel pannello centrale.
Tra i primi studi sviluppati con un approccio di questo tipo vi sono quelli
effettuati con neuroni della corteccia cerebrale di ratto per la decodifica del
segnale legato al movimento (fig.3.13). Algoritmi basati su “ reverse
correlation ” sono stati utilizzati per studiare gruppi di neuroni rappresentanti
l’informazione nei sistemi visivo-motori. Tali algoritmi sono stati pensati per
lo svolgimento della fase di codifica.
Per la seconda fase ( decodifica )
vengono utilizzati algoritmi Bayesiani, i quali devono assegnare il corretto
significato biologico ( nel caso di fig. 3.13 si tratta della traiettoria del ratto )
alla registrazione dell’ attività di spike di un dato gruppo di neuroni.
3.5 Problematiche legate all’utilizzo di tecniche
classiche e algoritmi.
Come si può facilmente intuire, quello della comprensione del meccanismo di
trasmissione dell’ informazione biologica da parte di neuroni umani non è un
problema di facile risoluzione. La registrazione simultanea di spike train
multipli prodotti da un’ elevato numero di neuroni apre un’interessante finestra
sulla concertazione del lavoro che avviene all’ interno di una rete neurale.
Senza lo sviluppo d’innovative metodologie, nel prossimo futuro, le possibilità
di comprendere il suddetto meccanismo di trasmissione risultano essere
fortemente ridotte ( Brown et al. 2004 ).
54
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
Infatti gli attuali metodi d’analisi dei segnali presentano ad oggi una serie di
problematiche tecniche e teoriche che portano all’ ottenimento di risultati non
molto convincenti. A parte alcune eccezioni i risultati ottenuti appaiono
fortemente limitati dall’ incapacità di compiere analisi in grado di considerare
molte unità neurali connesse tra loro contemporaneamente. L’accuratezza dei
risultati ottenuti tramite “spike sorting” sembra essere molto influenzata dall’
accuratezza dei risultati delle registrazioni elettriche ottenute dalle prove
sperimentali. Questa situazione rende precaria l’analisi dei dati, in quanto la
registrazione dell’attività neurale mostra delle differenze significative a
seconda del numero di neuroni implicati nell’analisi, del numero degli elettrodi
di registrazione, della geometria di tali elettrodi e della modalità di connessione
dei neuroni. Diventa chiaro come ad un problema di natura già complessa,
come quello trattato, si vadano ad aggiungere ulteriori variabili che giocano un
ruolo determinante per l’ottenimento di risultati corretti. Le formule applicate
per l’estrapolazione delle caratteristiche dei segnali, nelle analisi statistiche
effettuate, sono deficitarie di queste particolari specifiche. In altre parole è
possibile sostenere che il modello matematico non è sufficientemente accurato,
e che il suo livello di astrazione è troppo elevato. La delicatezza dei segnali
elettrici risulta essere ancora più affascinate ( e al tempo stesso problematica
per chi ne affronta lo studio ) se si considera l’elevatissimo livello di
articolazione dell’ informazione trasportata. Basti pensare all’innumerevole
quantità di movimenti possibili ad ogni singola parte del corpo umano, e che
per ognuno di essi vi deve essere una differente produzione e/o interpretazione
degli spike train.
Successiva, ancora più dura, ma certamente interessante è la sfida che alcuni
gruppi all’ avanguardia nel mondo hanno intrapreso occupandosi
della
costruzione di sistemi prostetici artificiali, caratterizzati da un interfacciamento
diretto macchina-cervello. La prima grande complicazione da affrontare
rispetto agli studi classici sinora qui trattati, riguarda la necessità di una
corretta elaborazione dei dati in tempo reale. La quantità di dati con la quale si
deve trattare risulta essere molto elevata. In tutti i metodi presentati in questo
capitolo per l’analisi dei segnali neurali questa variabile non è mai stata
55
Capitolo 3
Tecniche classiche per la codifica dell’informazione neurale
considerata. Le due fasi espresse nel paragrafo precedente ( fase di codifica e
di decodifica ) vengono infatti svolte in maniera distanziata nel tempo. Dalla
fase di codifica si cercano di estrapolare quelle che sono le basi matematiche
che poi l’algoritmo, scritto in un secondo tempo, dovrà utilizzare come
fondamento per la propria implementazione. Affinché i risultati ottenuti nella
fasi di codifica possano essere considerati attendibili, si ha la necessità di
svolgere un certo numero di registrazioni prolungate nel tempo. In questo
modo i file generati durante le registrazioni sono di elevate dimensioni ( non
inferiori al Gb ). Una macchina che deve essere in grado di compiere le proprie
funzioni in tempo reale non può considerare accettabili tempi di elaborazione
superiori al secondo.
Riassumendo si può affermare che l’algoritmo
necessario per un simile esperimento è un algoritmo in grado di svolgere
ambedue le fasi ( codifica e decodifica ) in un tempo inferiore ad un secondo,
basandosi su modelli matematici che ad oggi nessuno sembra in grado di
elaborare, e con la capacità di variare in tempo reale alcuni dei propri parametri
di decodifica a seconda dei risultati di codifica ottenuti in continuo durante
l’acquisizione del segnale dalle cellule neurali. È inutile dire che algoritmi con
simili caratteristiche non esistono e forse non potranno mai esistere, a causa
dell’ enorme complessità computazionale del problema.
56
Capitolo 4
Introduzione alle reti neurali artificiali
Capitolo 4
Introduzione alle reti neurali
artificiali
4.1 Intelligenza artificiale classica, non classica e la
teoria del connessionismo.
La filosofia delle reti neurali, ispirandosi ai sistemi biologici visti nel capitolo
precedente, considera un numero elevato di processori che hanno una capacità
computazionale elementare, i neuroni artificiali o nodi, connessi ad altre unità
dello stesso tipo (di qui il termine connessionismo che designa questo
approccio) ( Pitt e McCulloch 1943 ).
Ad ogni connessione è assegnato un peso, cioè può essere più o meno debole in
modo tale che un neurone possa influenzarne un altro in funzione della “forza”
della connessione fra i due, proprio come nei sistemi neurali biologici in cui un
neurone (pre-sinaptico) influenza un altro neurone (post-sinaptico) in funzione
del potenziale post-sinaptico della sinapsi fra l’assone del neurone presinaptico e il dendrite del neurone post-sinaptico. Ma più che sulla
contrapposizione fra computer seriale e connessionismo è bene soffermarsi
sulla contrapposizione fra intelligenza artificiale (IA) classica, legata
storicamente alla logica dei calcolatori seriali e l’IA subsimbolica legata
all’approccio connessionista ed alla computazione neurale ( Clark e Cowell
(1976) ).
L'IA classica si occupa della simulazione dei processi cognitivi superiori
adottando un approccio di elaborazione simbolica. In base alla famosa ipotesi
del sistema simbolico fisico per il comportamento intelligente è necessario e
58
Capitolo 4
Introduzione alle reti neurali artificiali
sufficiente un sistema di occorrenze di simboli collegate in modo fisico e
processi che operano su tale struttura simbolica; necessario perché un sistema
che esibisce intelligenza generale mostrerà ad una successiva analisi di essere
un sistema simbolico fisico; sufficiente perché ogni sistema simbolico fisico
può essere organizzato per produrre intelligenza ( Newell e Simon 1976 ).
Lo sviluppo dei sistemi intelligenti, di conseguenza, in questo approccio segue
la filosofia computazionale tipica dei calcolatori digitali. Anche il calcolatore,
infatti, è fatto di dati e di istruzioni per manipolare dati, dove sia i dati che le
istruzioni sono simboli. Il comportamento intelligente può essere tradotto in un
algoritmo opportuno e riprodotto attraverso il computer.
Tale approccio metodologico ha portato allo sviluppo di sistemi in grado di
risolvere teoremi, in quanto si pensava che questa fosse l’essenza del
comportamento intelligente, mentre si ritenevano meno degni di attenzione
processi quali possono per esempio essere le azioni di movimento del corpo in
risposta ad una serie di stimoli.
In realtà un bambino di un anno riconosce oggetti odori e sapori in base ai
quali compie movimenti in modo più veloce ed accurato del più evoluto
programma di IA implementato nel più veloce supercomputer. Questa evidenza
sottolinea da una parte che i compiti di processamento delle immagini visive
non sono banali, dall’altra rinforza la convinzione che il cervello umano sia di
gran lunga superiore ai sistemi intelligenti artificiali e che debba tale
superiorità alle caratteristiche della sua struttura interna. Tale struttura,
permette al sistema biologico di avere diverse proprietà significativamente
diverse da quelle dei sistemi artificiali ( Hertz, Krogh e Palmer 1991 ):
•
parallelismo;
•
robustezza e tolleranza agli errori. Le cellule nervose nel cervello muoiono
ogni giorno senza avere effetti significativi sulla performance totale del
sistema;
59
Capitolo 4
•
Introduzione alle reti neurali artificiali
flessibilità. La struttura si può facilmente adeguare a un nuovo ambiente
attraverso l’apprendimento (non deve essere programmata in Pascal,
Fortran o C);
•
capacità di trattare informazioni confuse, probabilistiche, indefinite o
inconsistenti;
•
struttura piccola, compatta e che dissipa veramente poca energia.
La simulazione della struttura dei sistemi neurali biologici potrebbe portare allo
uno sviluppo di sistemi artificiali che conservino le caratteristiche del
comportamento intelligente dei sistemi biologici. Ciò rappresenta un
cambiamento di prospettiva piuttosto radicale rispetto alla computazione
convenzionale. Il processo di calcolo nella computazione neurale è inteso come
“metafora del cervello” in quanto tenta di modellarne la struttura, non più come
“metafora del computer” dei sistemi artificiali classici, che focalizzavano
l’attenzione su un processo, tradotto in un algoritmo opportuno e realizzato
secondo la logica dei computer digitali. In altre parole il connessionismo
utilizza il computer come strumento che consente di simulare i fenomeni tipici
dei sistemi neurali biologici, e il calcolatore in questo modo diviene anche uno
strumento di ricerca ma soprattutto una fonte di ispirazione per sviluppare
teorie e modelli della mente ( Parisi 1986 ).
Si è più volte ripetuto che le reti neurali si ispirano ai sistemi neurali biologici.
Questo però non significa certamente avere la presunzione di costruire il
cervello artificiale. Tanto più che le caratteristiche delle reti neurali biologiche
riprese dalla computazione neurale artificiale sono un’esigua minoranza. Tom
Schwartz nel 1989, a questo proposito, nota che i neuroni artificiali sono solo
un’approssimazione dei neuroni biologici in quanto riproducono solo tre dei
circa 150 processi che sono tipici dei neuroni del cervello umano ( Schwartz
1989 ).
60
Capitolo 4
Introduzione alle reti neurali artificiali
Pertanto è bene sottolineare che la computazione neurale ha a che fare con le
macchine, non con il cervello. In altre parole l’obiettivo è quello di costruire
macchine ispirate a sistemi biologici che riproducano comportamenti
intelligenti e non quello, come si è detto, di ricostruire artificialmente un
cervello biologico. L’obiettivo di costruire tali macchine, d’altra parte, può
essere guidato da diversi scopi: un approccio, che si potrebbe definire
ingegneristico, è interessato alla macchina in sé in funzione delle applicazioni
potenzialmente utili a scopo applicativo; un secondo approccio, che si potrebbe
definire scientifico, è interessato alle macchine per le informazioni che possono
trarne allo scopo di saperne di più riguardo ai sistemi intelligenti in generale e
quindi anche riguardo ai sistemi biologici.
La computazione neurale è detta anche subsimbolica: ciò vuol dire che il
simbolo non è presente in modo esplicito in tali sistemi. Non esiste un
algoritmo che traduca la realtà percepita, per esempio attraverso una
telecamera, in un insieme di simboli che denotino gli oggetti percepiti
nemmeno un insieme di manipolazioni possibili di tali simboli, come per
esempio una serie di regole di produzione. La conoscenza nei sistemi neurali è
distribuita: non è presente da qualche parte in modo esplicito come simbolo o
insieme di simboli, ma il risultato dell’interazione di un numero elevato di
neuroni attraverso le connessioni fra essi.
Tali concetti verranno ripresi più avanti e risulteranno più chiari allorché si
introdurrà la struttura di una rete neurale. Per ora basti ricordare due aspetti
della computazione neurale:
1. si contrappone alla computazione digitale classica dei calcolatori di tipo
Von Neumann dal punto di vista strutturale. I sistemi neurali sono
caratterizzati da un parallelismo massiccio e la conoscenza è distribuita
all’interno di tali sistemi. I computer digitali, invece, centralizzano le
risorse computazionali deputandole ad un singolo processore (CPU) e
le operazioni devono essere eseguite in modo seriale;
61
Capitolo 4
Introduzione alle reti neurali artificiali
2. all’interno dell’IA si situa in una dimensione parallela a quella della
progettazione di sistemi simbolici. Non è necessariamente una
posizione alternativa, ma un modo diverso di affrontare il problema
della costruzione di sistemi intelligenti: simulare la struttura (il
cervello) diviene funzionale alla produzione di macchine intelligenti,
laddove l’IA simbolica focalizzava l’attenzione più sulla simulazione
del processo.
Infine è opportuno ricordare che la computazione neurale si serve, per la
costruzione di modelli dei processi di percezione, memorizzazione e
apprendimento, di un nuovo paradigma - il paradigma connessionista - che
presuppone l’equivalenza fra il comportamento dinamico di un qualunque
sistema a quello di una rete di unità interconnesse, in grado di attivarsi in
presenza di segnali d’ingresso. Queste reti, come già detto, sono ispirate ai
sistemi neurali biologici. Pertanto è opportuno partire da una descrizione delle
proprietà delle reti neurali biologiche e, soprattutto, dei loro componenti
elementari: i neuroni.
4.2 Architettura delle reti neurali.
Un neurone artificiale, che all’interno del connessionismo prende il nome di
processing element (PE), è l’unità computazionale atomica di una rete neurale
(fig.4.1). Esso simula diverse funzioni di base del neurone biologico: valuta
l’intensità di ogni input, somma i diversi input e confronta il risultato con una
soglia opportuna. Infine determina quale sia il valore dell’output. Diversi stadi
del processo verranno di seguito discussi uno ad uno. La raffigurazione
schematica di un PE è illustrata nella seguente figura.
62
Capitolo 4
Introduzione alle reti neurali artificiali
Fig 4.1 Un singolo PE (Processing Element, nodo o neurone artificiale. Si
osservi che a diversi ingressi (i1, i2, ..., in) corrisponde un’unica uscita.
Un neurone biologico, come si è detto, riceve diversi ingressi attraverso i
dendriti. Così anche il neurone artificiale (PE o anche nodo) riceve diversi
valori in ingresso (i1, i2,..., in). Tutti gli ingressi vengono sommati ed il risultato
costituisce il valore computato dal PE. Se tale valore supera una certa soglia
(fig.4.2), il neurone produce un segnale di output, o potenziale, altrimenti
rimane silente.
Fig 4.2 Un PE con la soglia. L’uscita viene comparata con la soglia q per
produrre il Potenziale P.
63
Capitolo 4
Introduzione alle reti neurali artificiali
Come si vede dalla figura 2.2, l’uscita U sarà data da :
U= i1 + i2 + ... + in
Tale caratteristica del PE, quella cioè di sommare algebricamente il valore dei
suoi ingressi, rappresenta la prima funzione implementata dal neurone
artificiale: la funzione somma.
Comparando l’uscita U con un opportuno valore di soglia θ, il potenziale P
sarà:
P=U - θ
Fig. 4.3 Esempio di somma pesata. Ogni ingresso i contribuisce alla
somma in funzione del relativo peso w. Il valore della soglia θ è 1. Con i
valori assegnati agli ingressi ed ai relativi pesi così come si vede in figura,
il risultato della somma pesata sarà 1.75, mentre il potenziale di uscita,
comparato con la soglia θ sarà 0.75. Si osservi che l’ingresso I3, pur
essendo di valore superiore agli altri due ingressi, ha un effetto inibitorio
sulla somma totale per effetto del suo peso w3=-1.
Ad ogni ingresso deve essere assegnato un peso, cioè un valore numerico che
modula l’impatto che ha tale ingresso sulla somma totale per determinare il
potenziale del PE. In altre parole ogni ingresso contribuisce in modo maggiore
o minore a determinare il superamento del valore di soglia e l’innesco del
potenziale. Anche questa proprietà si ispira ad una caratteristica dei neuroni
64
Capitolo 4
Introduzione alle reti neurali artificiali
biologici. La caratteristica in questione è propria delle sinapsi che l’assone di
un neurone crea con il dendrite di un altro neurone.
Dal punto di vista del neurone post-sinaptico, gli ingressi, costituiti dal
potenziale di altri neuroni i cui assoni creano sinapsi sui suoi dendriti, vengono
modulati proprio da tali sinapsi: alcuni di essi avranno un effetto maggiore
sulla somma totale, altri addirittura avranno carattere inibitorio, cioè avranno
l’effetto di abbassare il valore della somma totale degli ingressi e, di
conseguenza, di diminuire la probabilità che essa superi il valore di soglia e si
inneschi un potenziale. Questa proprietà dei sistemi biologici viene modellata
nei sistemi connessionisti con il concetto matematico di peso. Il peso di una
connessione è un valore numerico per il quale moltiplicare il valore
dell’ingresso. In questo modo l’ingresso avrà un effetto maggiore o minore
sulla somma totale degli ingressi in funzione dell’entità del peso (fig.4.3). La
somma degli ingressi diventerà ora la somma pesata degli ingressi.
Formalmente, per la definizione di somma pesata, la diventa:
U= i1 *w1 +i2 *w2 + ... + in*wn
Matematicamente si può pensare all’ingresso e al peso corrispondente come a
vettori del tipo I = (i1, i2,..., in) e W = (w1, w2,..., wn). Il segnale d’ingresso
totale, quello che si è chiamato la somma degli ingressi, sarà il prodotto scalare
di questi due vettori (I•W). Si moltiplica cioè ogni componente del vettore i
con il componente corrispondente del vettore w e si sommano tutti i prodotti
(Ingresso1 = i1*w1, Ingresso2=i2*w2 e così via, poi si sommano Ingresso1 +
Ingresso2 + ... + ingresson). Il risultato sarà uno scalare, la somma pesata degli
ingressi; ogni ingresso partecipa alla somma in modo proporzionale all’entità
del peso.
65
Capitolo 4
Introduzione alle reti neurali artificiali
Un esempio pratico chiarirà ancor meglio il meccanismo. La figura 4.3 illustra
una situazione in cui sono assegnati dei valori numerici agli ingressi, ai relativi
pesi e alla soglia θ. Il PE incomincia la computazione facendo la somma pesata
degli ingressi ik (k=1,...,n): In base alla definizione di somma pesata ogni
ingresso ik deve essere moltiplicato per il relativo peso wk e i diversi valori
pesati devono poi essere sommati. Il PE di figura 2.3 ha tre ingressi: per
l’ingresso i1 il valore pesato sarà:
i1 *w1 = 1.5 * 0.5 = 0.75
per l’ingresso i2 tale valore sarà:
i2 *w2 = 1 * 3 = 3
allo stesso modo per l’ingresso i3 sarà:
i3 *w3 = 2 * (-1) = -2
La somma dei tre valori pesati sarà:
0.75+ 3 - 2 =1.75
Tale valore (1.75) supera il valore di soglia, che è stato fissato a 1, quindi il
potenziale del neurone, per la (2) sarà: 1.75 - 1 = 0.75. Si osservi che l’ingresso
i3, pur avendo in origine un valore più elevato rispetto ad i2, per effetto del peso
dà un contributo negativo (inibitorio) alla somma totale. Se la soglia fosse stata
uguale a 2, la somma non avrebbe superato tale soglia ed il potenziale sarebbe
stato nullo, proprio per il contributo determinante del peso w3 che ha conferito
all’ingresso i3 un carattere inibitorio.
66
Capitolo 4
Introduzione alle reti neurali artificiali
Si introdurrà ora un’ altra proprietà del neurone artificiale ispirata ancora una
volta ad una proprietà del neurone biologico. Si è detto che il neurone
biologico, a livello del soma, somma tutti i potenziali post-sinaptici dei
dendriti. In realtà tale somma non è proprio la somma algebrica dei valori di
tali potenziali; diversi fattori, fra cui la resistenza passiva della membrana del
neurone, fanno sì che il risultato della somma di tali valori non sia l’esatta
somma algebrica, ma una funzione, di solito non lineare, di tale somma. In
altre parole il neurone artificiale somma gli ingressi pesati e poi modifica il
risultato in base ad una determinata funzione f (fig.4.4). Tale funzione è detta
funzione di trasferimento e, applicata all’uscita del PE determina il suo
potenziale effettivo.
Fig. 4.4 Il potenziale P del PE è una funzione f della somma pesata degli
ingressi ik comparata con la soglia θ.
Esistono diversi tipi di funzioni di trasferimento applicate ai PE delle reti
neurali artificiali.
a) funzione a gradino. Se il valore in ingresso alla funzione x è maggiore di zero
il valore restituito f(x) è 1; se x è minore di zero, f(x) è uguale a -1.
67
Capitolo 4
Introduzione alle reti neurali artificiali
Formalmente:
La funzione a gradino può assumere valori bipolari (-1, 1), come quella
descritta sopra, oppure valori binari (0, 1). In quest’ultimo caso se x è maggiore
o uguale a zero f(x) assume valore 1, mentre se x è minore di zero, f(x) assume
valore 0.
b) funzione lineare con saturazione. Se il valore di x è compreso fra 0 e 1, f(x)
diventa una funzione lineare e restituisce proprio il valore di x. D’altra parte la
funzione appiattisce i valori per x<0, per cui f(x)=0, e per x>1, per cui f(x)=1.
Formalmente:
b) funzione sigmoide. Se il valore di x è 0, il valore restituito da f(x) è 0.5. Con
l’aumentare del valore di x, f(x) tende asintoticamente a 1, mentre col
diminuire di x, f(x) tende asintoticamente a 0.
68
Capitolo 4
Introduzione alle reti neurali artificiali
Formalmente:
La funzione sigmoide è continua e derivabile. Per questo viene usata nei
modelli di rete neurale nei quali l’algoritmo di apprendimento richiede
l’intervento di formule in cui compaiano derivate.
e) funzione segno. Questo tipo di funzione ha una curva uguale alla precedente,
ma passa per l’origine, e la f(x) può assumere anche valori negativi. Essa infatti
restituisce valori compresi fra -1 e 1: con l’aumentare della x sull’asse positivo
(x>0) la f(x) aumenta in modo asintotico e tende ad 1, mentre con l’aumentare
della x sull’asse negativo (x<0) la f(x) tende in modo asintotico a -1. Per x=0,
f(x) è nulla. Formalmente:
Dopo aver descritto le proprietà di un PE, anche chiamato nodo, si passerà ora
a descrivere l’architettura vera e propria di una rete neurale. Ciò significa da
una parte illustrare fisicamente l’architettura di una rete neurale artificiale,
dall’altra stabilire il ruolo di ogni singolo PE all’interno di tale struttura. Si
supponga di avere diversi ingressi e diversi nodi in modo tale che ciascun
ingresso sia connesso a tutti i nodi.
69
Capitolo 4
Introduzione alle reti neurali artificiali
Fig. 4.5 Struttura fondamentale di una rete neurale. Ogni ingresso ik
(k=1,..., n) è connesso con tutti i nodi di uscita oh (h=1,..., m); I pesi wnm
determinano quanto ogni ingresso influisca sull’uscita di ogni nodo (PE).
Ogni ingresso ik (k=1,..., n) è connesso con tutti i nodi di uscita oh (h=1,..., m);
ogni nodo oh possiede tutte le proprietà descritte precedentemente e svolge la
sua attività parallelamente a quella degli altri nodi. Presentando un pattern in
ingresso si avranno dei valori per le uscite che dipendono sia dai valori in
ingresso, sia dai pesi della rete. In generale un peso determinerà quanto
l’ingresso relativo è in grado di influenzare un particolare nodo (fig.4.5).
L’insieme dei nodi, della struttura di fig. 4.5 prende il nome di strato. Le reti
neurali possono essere anche a più strati. In una certa misura ogni strato
aggiunto alla rete ne aumenta la capacità computazionale.
Gli ingressi I sono valori numerici che vengono valutati dai pesi delle
connessioni con il primo strato di nodi H ( detto anche strato hidden o
nascosto). Qui ogni nodo esegue la computazione ed eventualmente produce un
potenziale che, a sua volta, si propaga verso i nodi dello strato di uscita O. Il
potenziale prodotto dai nodi di uscita O costituisce l’uscita computata dalla rete
neurale.
70
Capitolo 4
Introduzione alle reti neurali artificiali
In generale quando si parla di architettura di una rete neurale si fa riferimento
al modo in cui sono connessi i diversi nodo l’uno con l’altro. L’architettura per
strati è tipica delle reti neurali feed-forward. Tali reti sono caratterizzate dal
fatto che l’attivazione dei nodi d’ingresso si propaga in avanti verso quelli
dello strato (o degli strati) nascosto e da questi verso quelli dello strato di
uscita.
Se nella rete ci fossero delle connessioni di ritorno (retroazione)
avremmo delle strutture di tipo recurrent (o feedback); si tratta di reti
dinamiche le cui uscite, opportunamente modificate, vengono retroazionate agli
ingressi causando una sequenza di valori di uscita fino al raggiungimento della
stabilità.
Cambiando il modo in cui sono connessi i nodi l’uno all’altro, si cambia
l’architettura della rete. Ciò non ha solo conseguenze di ordine pratico in
quanto muta la capacità computazionale della rete, ma ha anche importanti
conseguenze di ordine teorico che coinvolgono il concetto di apprendimento.
4.3 Reti artificiali che apprendono.
Uno dei concetti fondamentali per computazione neurale è quello di
apprendimento. Fino ad ora si è parlato di reti neurali dal punto di vista delle
unità computazionali elementari, i PE o nodi, e dal punto di vista
dell’architettura, il modo cioè in cui tali unità sono connesse fra loro all’interno
di una struttura. Ora è necessario vedere in che modo una rete neurale apprende
ad emettere risposte appropriate in relazione a determinati pattern d’ingresso,
incominciando a definire il concetto stesso di apprendimento in ordine alla
computazione neurale.
L’apprendimento
potrebbe
essere
definito
come
la
modifica
del
comportamento in conseguenza dell’interazione con l’ambiente e il risultato
dell’esperienza che determina l’emergere di nuovi pattern di risposta agli
stimoli esterni. Volendo adattare tale definizione ad una rete neurale, è
necessario definire innanzi tutto cosa si intende per interazione con l’ambiente,
71
Capitolo 4
Introduzione alle reti neurali artificiali
stimoli esterni e pattern di risposta di una rete neurale. Poi bisogna descrivere
in che modo la rete neurale accumula esperienza. Saranno questi gli argomenti
dei paragrafi che seguono.
4.3.1 L’apprendimento.
La capacità sorprendente di apprendere propria dei sistemi neurali biologici
risiede nella loro grande plasticità a livello microstrutturale ( Hebb 1949 ). Le
sinapsi modificano le loro proprietà in relazione a particolari stimoli esterni per
far sì che il sistema neurale nel suo complesso produca risposte adeguate a
determinati stimolo ambientali. Questa è la caratteristica a cui si ispirano i
sistemi neurali artificiali che apprendono. In altre parole concetti come
interazione con l’ambiente, stimoli e pattern di risposta trovano i loro
corrispondenti all’interno della computazione neurale. Dire che una rete
interagisce
con
l’ambiente
significa
sostanzialmente
affermare
che
dall’ambiente riceve gli stimoli attraverso i suoi ingressi ( input ), e risponde
attraverso la produzione di un pattern di uscita ( output ). La risposta della rete
neurale deve essere modificata in modo da diventare il più appropriata
possibile al pattern d’ingresso in quel momento. Questo viene ottenuto
variando il valore dei pesi delle connessioni in modo che in presenza di un
determinato pattern in ingresso alla rete si abbia una risposta corrispondente.
La forma della risposta della rete, il pattern di uscita, può essere decisa a priori.
In questo caso si parla di apprendimento supervisionato: l’operatore umano
decide che in corrispondenza di un determinato pattern vi debba essere una
determinata risposta. Altrimenti, se la forma della risposta non è nota a priori,
si parla di apprendimento non supervisionato. La differenza fra i due tipi di
apprendimento sta nell’algoritmo che si adotta per far apprendere la rete.
72
Capitolo 4
Introduzione alle reti neurali artificiali
L’algoritmo di apprendimento specifica in che modo vengono modificati i pesi
in modo tale da far sì che la rete apprenda. Successivamente sono illustrati i
principi di funzionamento generali delle due classi di algoritmi di cui si parlava
sopra: gli algoritmi con supervisione e quelli senza supervisione.
La logica su cui si fonda l’algoritmo per l’apprendimento supervisionato è
quella di modificare i pesi delle connessioni in modo tale che, dato un pattern
d’ingresso alla rete, il pattern d’uscita corrisponda ad una forma già definita a
priori. Il più celebre di questi algoritmi è senz’altro
chiamato
Back-propagation ( Rumelhart e McClelland 1986 ).
Gli algoritmi di apprendimento non supervisionato seguono una logica
sostanzialmente diversa. La forma dell’output non è conosciuta a priori e
l’aggiustamento dei pesi della rete neurale avviene in base ad alcune
valutazioni della qualità del pattern d’ingresso da parte delle funzioni
dell’algoritmo stesso. Per esempio un pattern può avere più elementi attivi,
diversi da zero, di un altro: i pesi della rete verranno modificati in modo tale
che presentando in ingresso il primo dei due pattern si avrà una certa risposta,
mentre presentando il secondo se ne avrà un’altra in base al criterio della
numerosità degli elementi attivi.
Il seguente esempio potrebbe essere molto utile per chiarire il concetto di
pattern d’ingresso e di pattern di uscita corrispondente all’interno delle due
categorie di algoritmi. Nella fig. 4.6 è illustrata una rete neurale che processa
73
Capitolo 4
Introduzione alle reti neurali artificiali
Fig. 4.6 Esempio di rete neurale che processa un pattern in ingresso I e
computa un’uscita O. I nodi d’ingresso corrispondono ai pixel di una retina
artificiale di 4×5 elementi. I nodi ombreggiati hanno valore 1, quelli
bianchi hanno valore 0. Ogni nodo d’ingresso è connesso a tutti i nodi
nascosti H (per motivi di leggibilità sono raffigurate solo le connessioni di
un nodo d’ingresso). Ogni nodo nascosto è connesso con i due nodi di
uscita. Ad ogni connessione è associato un peso. La modifica dei pesi
operata dall’algoritmo d’apprendimento fa sì che la rete apprenda le
associazioni ingresso-uscita.
un pattern d’ingresso I costituito da una retina artificiale di 4×5 pixel. Come si
può osservare, il pattern di sinistra rappresenta una ‘F’ mentre quello di destra
una ‘L’. I pixel ombreggiati avranno valore uno, mentre gli altri avranno valore
zero. L’insieme dei valori binari zero ed uno costituiscono gli ingressi alla rete
ed ogni ingresso è connesso a tutti i nodi dello strato nascosto H ( per motivi di
leggibilità in figura 4.6 sono raffigurate solo le connessioni di un ingresso ).
L’uscita della rete è costituita da due nodi.
74
Capitolo 4
Introduzione alle reti neurali artificiali
Ora si supponga che il compito della rete debba essere quello di classificare
l’immagine in ingresso: se l’immagine raffigura una ‘F’ (pattern di sinistra) il
valore del nodo di uscita di destra deve essere uno e quello del nodo di sinistra
zero; viceversa se in ingresso vi è il pattern corrispondente all’immagine ‘L’
(pattern di destra). I pesi della rete neurale all’inizio avranno valori casuali, in
quanto risulterebbe assai arduo definirli in modo manuale. La risposta della
rete neurale, pertanto, sarà casuale: applicando in ingresso una immagine o
l’altra si avranno risposte casuali, cioè il valore dei nodi non sarà quello
desiderato. Per far sì che tale valore sia effettivamente quello desiderato si deve
applicare alla rete un algoritmo di apprendimento che modifichi i pesi della rete
in modo che la sua risposta sia coerente con il pattern di ingresso, nel modo
descritto sopra. Di seguito sarà descritto schematicamente il significato
dell’applicazione di un algoritmo di apprendimento supervisionato e non
supervisionato.
1. Apprendimento con supervisione significa sostanzialmente che alla rete è
necessario fornire degli esempi e che la modifica dei pesi avviene in base al
confronto fra uscita effettiva della rete (sbagliata, all’inizio) e uscita desiderata.
La modifica dei pesi fa sì che l’uscita corretta e quella desiderata convergano.
Riguardo all’esempio di fig 4.6, il procedimento schematico potrebbe essere il
seguente: si presenta alla rete il pattern di sinistra e si calcola l’uscita. Poiché ai
pesi viene dato valore casuale, anche l’uscita sarà casuale. Si confronta tale
uscita con quella desiderata (valore 1 al nodo di sinistra, 0 a quello di destra) e
in base alla differenza uscita effettiva/uscita desiderata si modificano i pesi
della rete. Poi si presenta il pattern di destra e si compie la stessa operazione di
confronto e modifica dei pesi, sennonché in questo caso l’uscita desiderata è
diversa (valore 0 al nodo di sinistra, 1 a quello di destra) e la modifica dei pesi
verrà operata in questo senso. Ripetendo tale operazione un numero elevato di
volte la rete incomincia a restituire risposte sempre più simili a quelle
desiderate; la struttura dei pesi cambia in modo che presentando il pattern
d’ingresso di sinistra si attiva il nodo di uscita sinistro, mentre presentando il
75
Capitolo 4
Introduzione alle reti neurali artificiali
pattern di destra, sempre alla rete con la stessa struttura di pesi, si attiva il nodo
di destra. Questa caratteristica prende il nome di superimposizione. In questo
modo si costruisce la capacità della rete neurale di raggiungere una struttura
interna tale che la stessa struttura reagisca in modo diverso a pattern di ingresso
diversi, fornendo uscite consistenti con tali pattern. In questo caso, ciò avviene
in base all’associazione ingresso-uscita decisa dal supervisore. Su questo
argomento si ritornerà in modo più diffuso in seguito.
2. Apprendimento senza supervisione significa che l’algoritmo di apprendimento
è in grado di identificare differenze fra i pattern di ingresso basandosi
solamente su caratteristiche fisiche di tali pattern. Per esempio, considerando
sempre la fig. 4.6, la matrice di pixel di sinistra è diversa da quella di destra sia
da un punto di vista quantitativo (i pixel attivati nella matrice di sinistra sono
tre in più che in quella di destra), che da un punto di vista qualitativo (per
esempio la disposizione spaziale dei pixel attivati è diversa). Basandosi
sull’uno o sull’altro tipo di proprietà del pattern d’ingresso o su entrambi,
l’algoritmo modifica i pesi in modo da enfatizzare le differenze fra i pattern a
livello dell’uscita. Pertanto, ad apprendimento ultimato, presentando il pattern
di sinistra si attiverà uno dei due nodi, mentre presentando in ingresso il pattern
di destra si attiverà quello opposto. La differenza fondamentale dall’algoritmo
di apprendimento supervisionato è che non è necessario sapere a priori la forma
dell’uscita e quindi non è necessario un confronto uscita effettiva - uscita
corretta. La conseguenza, nell’esempio di fig 4.6, è che non è possibile stabilire
a priori quale dei due nodi di uscita risponderà a ciascuno dei pattern
d’ingresso. In altre parole può darsi che alla fine di un apprendimento non
supervisionato sia il nodo di destra a rispondere al pattern di sinistra e
viceversa.
76
Capitolo 4
Introduzione alle reti neurali artificiali
Fig. 4.7 Presentando alla rete, addestrata con i pattern a sinistra e centrale
all’apprendimento dell’associazione ingresso-uscita raffigurata, un nuovo
pattern che non partecipava all’apprendimento (a destra) l’uscita della rete
sarà coerente con le caratteristiche del nuovo pattern in relazione a quelle
dei pattern di addestramento. In questo il pattern di richiamo possiede
caratteristiche comuni ad entrambi i pattern di addestramento, con una
affinità leggermente maggiore per il pattern ‘L’.
Si è accennato al concetto di superimposizione come la proprietà di una rete
neurale di raggiungere, dopo l’apprendimento, una configurazione dei pesi
stabile in modo tale che presentando pattern diversi in ingresso alla stessa rete
essa fornisca risposte diverse per ognuno di questi pattern, coerenti con gli
esempi forniti nella fase di apprendimento.
Un altro concetto fondamentale della computazione neurale è quello di
generalizzazione. Per illustrarlo si richiamerà l’esempio di fig.4.6. Cosa
succederebbe se alla rete neurale che ha appreso ad associare gli ingressi e le
uscite nel modo di fig. 4.6 si presentasse un altro pattern d’ingresso, ad
esempio corrispondente ad una ‘C’, come illustrato in figura 4.7? La risposta
più plausibile è che la rete fornisca un a risposta a metà fra quella alla ‘F’ e
quella alla ‘L’. La spiegazione deriva dal fatto che in fase di apprendimento, la
77
Capitolo 4
Introduzione alle reti neurali artificiali
struttura interna della rete, ovvero il valore dei pesi, si è modificata in modo da
ricercare i tratti distintivi delle due matrici utilizzate per l’apprendimento.
Osservando la fig. 4.7, il pattern che raffigura la ‘C’ presenta caratteristiche
intermedie fra quello che raffigura la ‘F’ e quello che raffigura la ‘L’: la
differenza fra la ‘F’ e la ‘L’ nella matrice di pixel è principalmente nel fatto
che i pixel della prima riga della matrice ‘F’ sono attivi (=1) mentre quelli della
matrice ‘L’ non lo sono (=0); viceversa per i pixel dell’ultima riga. Nel pattern
relativo alla ‘C’, invece, sono attivi sia i pixel della prima riga che quelli
dell’ultima. La rete neurale, quindi, processerà le caratteristiche del nuovo
pattern e fornirà una risposta intermedia fra quelle relative ai pattern usati per
l’apprendimento, con una leggera propensione per l’uscita relativa al pattern
‘L’ che per quella relativa al pattern ‘F’ (0.6 contro 0.4) perché con esso è
maggiore l’affinità.
I pattern utilizzati nella fase di apprendimento sono chiamati pattern di
addestramento ( training set ). Quando si presenta un pattern nuovo alla rete e
la fase di apprendimento è finita, come in questo caso, tale pattern prende il
nome di pattern di richiamo ( testing set ). Il pattern di richiamo viene
processato in base alle stesse proprietà dei pattern di addestramento per cui la
rete ha appreso ad associare tali pattern ad una specifica uscita. La capacità
della rete di riconoscere anche i pattern di richiamo prende il nome di
generalizzazione.
4.3.2 Le regole per l’apprendimento.
Vengono di seguito illustrate quelle che sono considerate le due regole
principali per l’aggiornamneto dei pesi all’interno di una rete neurale
artificiale. L’apprendimento della rete si esprime attraverso la seguente formula
di aggiornamento dei pesi
wij(t)=wij (t-1) + .wij
78
Capitolo 4
Introduzione alle reti neurali artificiali
dove t il passo attuale e .wij è la variazione dei pesi che può essere ottenuta
attraverso diverse leggi.
La regola più usata per aggiustare i pesi di un neurone è la Delta rule o regola
di Widrow - Hoff .
Sia x = (x1 ,…,xn ) l’ingresso fornito al neurone. Se y’ ed y sono,
rispettivamente, l’uscita desiderata e l’uscita neurale,l’errore è dato da
d = y’-y
La delta rule stabilisce che la variazione del generico peso wi . è:
∆wi = η δ xi
dove η è un numero reale compreso tra 0 e 1 detto learning rate . Il learning
rate determina la velocità di apprendimento del neurone. La delta rule modifica
in maniera proporzionale all’errore solo i pesi delle connessioni che hanno
contribuito all’errore (cioè che hanno xi diverso da 0). Al contrario, se xi =0, wi
non viene modificato poiché non si sa se ha contribuito all’errore. Il nuovo
valore dei pesi è quindi:
wi = wi + ∆wi
Un’altra legge comunemente usate è la Legge di Hebb, legge di origine
biologica. Siano xi e yi due nodi, allora la variazione dei pesi avverrà secondo
la seguente legge:
∆ wij= xiyj
ossia lo stimolo fornito da un neurone ad un altro attraverso l’assone, rinforza
la connessione ( ossia il peso ). Il peso della sinapsi sarà variato dal prodotto
degli stati dei due neuroni: aumentando il peso se i due neuroni hanno valori
concordi, diminuendolo in caso di valori discordi.
79
Capitolo 4
Introduzione alle reti neurali artificiali
4.4 Applicazioni generali.
Dal punto di vista del tipo di utilizzo possiamo distinguere tre categorie
basilari:
•
memorie associative;
•
simulatori di funzioni matematiche complesse (e non conosciute);
•
classificatori.
Le memorie associative possono apprendere associazioni tra patterns (insieme
complesso di dati come un insieme di pixels di una immagine) in modo che la
presentazione di un pattern A dia come output il pattern B anche se il pattern A
è impreciso o parziale (resistenza al rumore). Esiste anche la possibilità di
utilizzare la memoria associativa per fornire in uscita il pattern completo in
risposta ad un pattern parziale in input.
Le reti sono inoltre in grado di comprendere la funzione che lega output con
input in base a degli esempi forniti in fase di apprendimento. Dopo la fase di
apprendimento, viene fornito un output in risposta ad un input anche diverso da
quelli usati negli esempi di addestramento. Ne consegue una capacità della rete
di interpolazione ed estrapolazione sui dati del training set. Tale capacità è
facilmente verificabile addestrando una rete con una sequenza di dati
input/output proveniente da una funzione nota e risulta, invece, utile proprio
per il trattamento e la previsione di fenomeni di cui non sia chiaro
matematicamente il legame tra input e output. In ogni caso la rete si comporta
come una "black box", poiché non svela in termini leggibili la funzione di
trasferimento che è contenuta al suo interno. Di questo tipo fa parte la rete a
retropropagazione dell’ errore o “error back propagation”.
Le reti neurali permettono di classificare dati in specifiche categorie in base a
caratteristiche di similitudine. In questo ultimo tipo di rete esiste il concetto di
apprendimento non supervisionato o "autoorganizzante", nel quale i dati di
80
Capitolo 4
Introduzione alle reti neurali artificiali
input vengono distribuiti su categorie non predefinite ( Kohonen 1993,
Kohonen 1995c ).
L’algoritmo di apprendimento di una rete neurale dipende essenzialmente dal
tipo di utilizzo della stessa, così come l’architettura dei collegamenti. Le reti
multistrato
supervisionate
prevedono
ad
esempio
l’algoritmo
a
retropropagazione dell’errore.
81
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
Capitolo 5
La rete SOM e l’evoluzione ad
ITSOM.
5.1 SELF ORGANIZING MAP (SOM)
La Self-Organizing Map (SOM) è una tra le più importanti architetture di reti
neurali ( Kohonen 1982 ). È stata sviluppata principalmente da Teuvo Kohonen
tra il 1979 e il 1982, in parte sulla base di studi svolti precedentemente ( Von
der Malsburg 1973, Willshaw e Von der Malsburg 1976 ).
Nelle SOM viene definito, come elemento caratteristico, uno strato, detto strato
di Kohonen, costituito da neuroni artificiali disposti spazialmente in modo
ordinato.
Possono
teoricamente
considerarsi
strati
di
Kohonen
monodimensionali, bidimensionali, tridimensionali, e anche a più di tre
dimensioni. La dimensionalità tipica per lo strato di Kohonen è di due
dimensioni, e a questa ci si riferirà nel seguito, se non altrimenti specificato.
Tale strato di processing elements ( PE o neuroni artificiali ) si evolve durante
l’apprendimento, come vedremo, specializzando le posizioni dei singoli PE
come indicatori delle caratteristiche statistiche importanti degli stimoli di
ingresso. Questo processo di organizzazione spaziale delle caratteristiche di
dati di ingresso è chiamato anche “Feature Mapping”. Le SOM realizzano il
feature mapping con una tecnica di apprendimento non supervisionato, da cui il
nome che indica l’auto-organizzazione ( Kohonen 1990, Kohonen 1991,
Kohonen 1993 ).
Una
delle
più
importanti
applicazioni
è
proprio,
in
generale,
la
82
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
rappresentazione in una mappa, solitamente bidimensionale, delle topologie
associate ai dati di ingresso definiti in spazi con elevata dimensionalità e,
quindi, l’applicazione in problemi di raggruppamento dei dati (data
clustering).
Come molte architetture di reti neurali, anche le SOM hanno basi biologiche
che ispirano il modello proposto. Una prima analogia tra il sistema biologico e
quello artificiale delle SOM è a livello di funzionamento macroscopico del
cervello. Nel cervello umano, durante la crescita, avviene una suddivisione in
aree specializzate per stimoli di ingresso. In modo analogo nelle SOM, durante
l’apprendimento, si ha la creazione di una mappa nello strato di Kohonen
divisa in regioni, ciascuna delle quali risponde a una particolare regione dello
spazio di ingresso.
Un’ulteriore analogia si ha a livello più microscopico, ovvero a livello di
tessuto nervoso laminare. Si può osservare, infatti, come in un tale tipo di
tessuto, sotto l’azione di uno stimolo, i neuroni manifestano attività in modo
coordinato. Un gruppo di neuroni contigui si organizza in una “bolla” ad alta
attività, ben delimitandosi da tutti gli altri neuroni a bassa attività. Questo
fenomeno di formazione di bolle viene modellato nella rete di Kohonen, come
vedremo, con un meccanismo di aggiornamento dei pesi esteso al vicinato del
PE vincitore.
Le SOM sono costituite da due strati (fig. 5.1): uno strato unidimensionale di
ingresso, con un PE per ognuna delle N componenti dell’ingresso X=(x1, x2,
…, xN) e uno strato, tipicamente bidimensionale, detto di Kohonen, costituito
da M = MR · MC PE disposti in una griglia bidimensionale di MC PE per riga e
MR PE per colonna. Il generico PE dello strato di Kohonen, verrà indicato con
PEr, con r = 1, 2, …, M. Lo strato di ingresso è completamente connesso allo
strato di Kohonen: ogni PE dello strato di Kohonen ha in ingresso tutti i PE
dello strato di ingresso.
83
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
Fig. 5.1 Illustrazione dei due strati che compongono la rete di Kohonen. In
particolare si nota la struttura bidimensionale dello strato di Kohonen e la
sua completa connessione con la strato di ingresso.
Al generico PE dello strato di Kohonen è associato un vettore di pesi relativi ai
collegamenti dai PE di ingresso. Il vettore associato al generico PEr dello strato
di Kohonen sarà indicato con il vettore Wr = (wr1, wr2, …, wrN).
L’ingresso della rete è costituito da valori definiti nell’insieme dei reali, senza
particolari limitazioni. Tuttavia, nella pratica, è spesso conveniente presentare
allo strato di ingresso vettori normalizzati. I PE dello strato di ingresso hanno
l’unica funzione di strato di buffer: non effettuano nessuna modifica
sull’ingresso che gli viene presentato.
Dallo strato di Kohonen viene estratta l’informazione d’uscita. In questo strato
i PE vengono fatti funzionare in competizione. Nel funzionamento base ad ogni
presentazione di un ingresso un PE viene eletto come vincitore.
L’informazione di uscita è in questo caso la posizione del PE nella griglia, ed è
quindi una informazione a valori discreti. L’operazione effettuata tra ingresso e
uscita è anche chiamata quantizzazione vettoriale. Lo strato di Kohonen non è
comunque semplicemente definibile come strato di uscita. Esso è soprattutto lo
strato cuore della rete in cui l’algoritmo competitivo opera.
84
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
La prima operazione a cui la rete viene sottoposta è l’inizializzazione. Le
variabili fondamentali da inizializzare sono i vettori dei pesi. Per essi è
sufficiente scegliere piccoli valori casuali, facendo inoltre in modo che non ci
siano PE con uguali vettori.
La fase successiva consiste nell’apprendimento da parte della rete dei valori di
un insieme di ingresso ( training set ). Durante questa fase i vettori di ingresso
vengono presentati alla rete in modo casuale o ciclico fino al raggiungimento di
uno stato di equilibrio. L’apprendimento nelle SOM è di tipo non
supervisionato ( Kohonen 1991, Kohonen 1995b ).
Non esiste dunque alcun supervisore che durante l’apprendimento proponga il
target corretto per l’ingresso presentato: l’algoritmo usato fa sì che la rete sia in
grado di correggere i pesi dopo la presentazione di ogni ingresso autoorganizzandosi. In particolare, il meccanismo è il seguente: detto X il vettore
d’ingresso presentato durante un ciclo generico d’apprendimento, viene
calcolato quale PE tra i generici PEr dello strato di Kohonen ha vettore dei pesi
Wr più vicino ad esso. Tale PE, eletto come vincitore, verrà indicato con PES.
La vicinanza dei vettori può essere misurata in diversi modi. Un primo modo è
quello di misurarla in termini di prodotto scalare Cr dei vettori dei pesi Wr
associati ai PE dello strato di Kohonen con il vettore di ingresso X, eleggendo
come vincitore PES il PE per il quale il prodotto scalare ha valore massimo
(Cs):
Un altro modo per calcolare la vicinanza è tramite la distanza euclidea Dr tra i
vettori dei pesi Wr associati ai PE dello strato di Kohonen con il vettore di
85
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
ingresso X, eleggendo come vincitore PES il PE per il quale la distanza
euclidea è minima (Ds):
D’altra parte si può dimostrare che, se i vettori di ingresso e dei pesi sono
normalizzati, i due modi sopra descritti sono equivalenti, ovvero il vettore dei
pesi con minima distanza euclidea dal vettore di ingresso coincide con il
vettore dei pesi a massimo prodotto vettoriale con esso ( Kohonen 1991 ).
La SOM prevede a questo punto un meccanismo cosiddetto di inibizione
laterale, che e' presente anche in natura sotto forma di trasformazioni chimiche
a livello sinaptico. Nella regione corticale del cervello, infatti, neuroni
fisicamente vicini ad un neurone attivo mostrano legami più forti, mentre ad
una certa distanza da questo iniziano a mostrare legami inibitori. In questa
architettura, ciascun elemento riceve sia stimoli eccitatori da parte degli
elementi adiacenti ( la cosiddetta neighborhood ), sia stimoli inibitori da parte
degli elementi più lontani, secondo la cosiddetta forma "a cappello messicano"
(fig.5.2).
Fig 5.2 Classica forma “ a cappello messicano” che descrive la probabilità
di vittoria di un neurone, appartenente allo strato competitivo della SOM,
in funzione della distanza rispetto al neurone vincente.
86
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
L'esistenza della neighborhood e' utile per non polarizzare la rete su pochi
neuroni vincenti. In tal modo vengono attivati solo gli elementi con distanza al
di sotto di un certo valore, in casi restrittivi solo l'unità con minima distanza.
Basandoci sulla distanza euclidea d, definita nello strato di Kohonen, tra il
generico PEr e il PEs eletto vincitore. In sostanza si definisce una funzione h(d)
che descrive l’entità con cui il generico PEr. subirà l’aggiornamento ∆W(d) del
relativo vettore dei pesi Wr. L’aggiornamento sarà del tipo:
La funzione h(d), tipicamente, ha valori positivi, con massimo per d = 0, ed è
decrescente all’aumentare di d. Dunque ad ogni aggiornamento i vettori dei
pesi dei PE vengono spostati verso l’ingresso presentato, con una intensità
decrescente all’aumentare della distanza dal PE eletto come vincitore per
quell’ingresso. Lo strato di Kohonen è quindi una matrice di PE che vengono
fatti funzionare in competizione e che tende, ciclo dopo ciclo, a far sì che i
vettori associati a questi PE si assimilino ai differenti pattern di ingresso.
La SOM effettua così una quantizzazione vettoriale, ossia una mappatura da
uno spazio a molte dimensioni in uno spazio con numero minore di dimensioni,
conservando la topologia di partenza. In altre parole viene effettuata una forma
di clustering di tipo Nearest Neighbor (NN), in cui ogni elemento dello strato
competititvo viene a rappresentare la classe di appartenenza degli elementi di
input. La classificazione NN classifica un pattern a seconda del più piccolo
valore ottenuto fra tutte le distanze da un insieme di pattern di riferimento.
Questo metodo è utile per separare classi rappresentabili da segmenti di
iperpiani ( Kohonen 1995a ).
87
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
Per questo motivo la SOM classifica bene pattern topologicamente ben
distribuiti, ma si trova in maggiore difficoltà nel caso di distribuzioni non
lineari. Inoltre appare evidente l'importanza della configurazione iniziale dei
pesi, che deve essere il più possibile simile alla topologia di input.
L'equazione di aggiornamento dei pesi mostra che minore è il valore della
dimensione del vicinato, minore è il numero di PE il cui vettore dei pesi viene
spostato significativamente durante un ciclo di apprendimento. In questo modo
è maggiore la possibilità per i PE di differenziarsi, ovvero è maggiore il
numero di gradi di libertà che ha la rete per auto-organizzarsi e ordinare i dati
di ingresso nella mappa di Kohonen. Maggiori sono i gradi di libertà con cui
una rete può adattarsi a un dato ingresso, maggiori dettagli possono essere
appresi e codificati e maggiore risulta, comunque, la complessità di questo
processo di apprendimento.
Una volta che la rete ha appreso, essa può essere utilizzata per fornire risposte
in uscita in corrispondenza ad ingressi presentati. Come già accennato, l’uscita
viene estratta dallo strato di Kohonen, addestrato durante la fase precedente di
learning. Il valore di uscita è sostanzialmente la posizione del PE vincitore.
Questa può essere indicata con un vettore di M componenti, tante quanti sono i
PE dello strato di Kohonen: U = (u1, u2, …, uM), avente tutte le componenti a
valore zero, tranne quella del PE vincitore (PEs):
In alternativa, in certi casi può essere utile usare come valore di uscita, il
vettore dei pesi del PE vincitore: Ws = (ws1, ws2, …, wsN), che è fisso una volta
che la rete è stata addestrata.
Nell’algoritmo base l’apprendimento prevede che ad ogni presentazione di un
nuovo ingresso vengano coinvolti il PE vincitore e i PE del vicinato. Accade
quindi che a fine apprendimento i PE rappresentino con maggiore dettaglio
quelle regioni dello spazio di ingresso per le quali sono state date maggiori
informazioni durante l’apprendimento, ovvero per le quali sono stati forniti
valori in ingresso con maggiore frequenza. Questo fenomeno è normalmente
un effetto indesiderato. Per contrastare questo inconveniente è stato proposto
88
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
un meccanismo, detto di coscienza durante l’apprendimento ( Kohonen 1995a,
Kohonen 1995c, Kohonen 1996 ). Il principio di base del meccanismo è quello
di considerare, per l’elezione del PE vincitore, le distanze tra vettore dei pesi
del PE e vettore di ingresso opportunamente modificate. Queste vengono
aumentate se il PE sta vincendo con frequenza superiore alla frequenza di
vittoria uniformemente distribuita (1/M), vengono invece diminuite nel caso
opposto. Tale correzione ha come effetto quello di far diminuire le differenze
nelle frequenze di vittoria dei PE, dovute a ingressi presi con probabilità non
uniforme nello spazio di ingresso ( Kohonen 1991 ).
5.2 ITSOM ( Inductive Tracing Self Organizing Map )
La SOM ha dei limiti, tra cui quello della difficoltà di risalire all’input una
volta generata la classificazione ( Ermentrout 1992 ).
Per ovviare a questo inconveniente è stata sviluppata l’architettura ITSOM.
Osservando la sequenza temporale dei neuroni vincenti di una SOM si nota che
questa tende a ripetersi creando una serie temporale costituente attrattori caotici
o precisi cicli limite, e che questi caratterizzano univocamente l’elemento di
input che li ha prodotti. Di fatto la regola di apprendimento fa sì che il peso
vincitore rappresenti un’approssimazione del valore dell’input ( Pizzi et al.
1998 ).
All’ interno dell’ architettura ITSOM, ad ogni epoca il nuovo peso vincitore,
insieme al peso che ha vinto nell’epoca precedente, va a costituire
un’approssimazione del second’ordine del valore di input, e così via.
E’ quindi possibile ricavare il valore dell’input confrontando le configurazioni
caratteristiche di ciascun input con le configurazioni proprie di vettori di cui è
noto il valore ( Ermentrout 1992, Pizzi et al. 1998 ).
89
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
Viene così effettuato un vero e proprio processo di induzione, perché una volta
prodotta una quantizzazione vettoriale molti-a-pochi dall’input sullo strato dei
pesi, si opera un passaggio pochi-a-molti da configurazioni note di neuroni
vincenti alla totalità degli input. Questa forma di induzione (fig.5.3) è molto
più fine di quella ricavabile risalendo dall’unico neurone vincente di una rete
SOM portata a convergenza agli input ad esso corrispondenti, perchè i neuroni
dello strato competitivo sono troppo pochi per fornire una classificazione
significativa. Altro è
far riferimento ad un insieme di neuroni, la cui
configurazione può assumere un’altissima varietà di forme, dalle quali si potrà
discriminare le diverse caratteristiche dell’input.
Fig. 5.3 Architettura di una ITSOM.
Va sottolineato che la caratteristica di questa rete è che non necessita di essere
portata a convergenza, perchè le configurazioni di neuroni vincenti
raggiungono la stabilità necessaria entro poche decine di epoche. Si è verificato
che per ottenere i migliori risultati la rete non deve polarizzare su troppo pochi
neuroni ma nemmeno disperdersi su tutto lo strato. L’algoritmo verificato
ottimale per riconoscere le configurazioni create dalla rete si basa sul metodo
dello z-score. I punteggi cumulativi relativi a ciascun input vengono
normalizzati secondo la distribuzione della variabile standardizzata z data da
90
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
Dove µ e’ la media dei punteggi sui vari neuroni dello strato dei pesi e σ lo
scarto quadratico medio.
Fissata una soglia 0 < τ ≤ 1, che costituisce quindi uno dei parametri di questo
tipo di rete, si pone poi
z = 1, se z > 0
z = 0, se x ≤ 0
In tal modo ogni configurazione di neuroni vincenti è rappresentata da un
numero binario formato da uni e da zeri, tanti quanti sono i pesi dello strato di
output. È poi immediato confrontare tra loro questi numeri binari.
Altri metodi di discriminazione delle configurazioni vincenti sono possibili,
tenendo conto che e’ necessario “fuzzificare” la loro composizione numerica,
in quanto descrivono attrattori caotici che sono costituiti da un nucleo ripetitivo
con molte variazioni simili nel proprio intorno.
Il meccanismo della SOM e’ stato scritto tenendo conto dei meccanismi
neurofisiologici di mappatura degli stimoli sensoriali sulla neocorteccia: risulta
infatti che input simili sono mappati su luoghi vicini della corteccia in modo
ordinato e conservativo della topologia ( Kohonen 1996 ).
Sia la SOM che le altre reti neurali artificiali fondano il processo di
apprendimento sulla ripetizione ciclica dello stimolo di input. Anche nel
cervello esiste la prova dell’esistenza di circuiti riverberanti che rinforzano
l’impressione dell’informazione di input sulla mappa corticale. Sembra tuttavia
91
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
improbabile che tali “loop” si possano ripetere per migliaia di volte alla ricerca
di un bersaglio fisso, anche perchè riesce difficile immaginare che il cervello
possa andare in seguito a riconoscere solo l’ultimo neurone attivato come
quello più importante ( Pizzi et al. 1998 ).
Appare invece più ragionevole pensare che l’attività di riverbero si esaurisca
spontaneamente con l’esaurirsi della scarica elettrica di attivazione, e che le
mappe corticali siano costituite da una costellazione di neuroni attivati, la
cosiddetta
traccia
mestica
che
servirà
successivamente
al
recupero
dell’informazione. Per questo motivo il meccanismo della ITSOM sembra più
fisiologicamente giustificato. Anche il meccanismo induttivo che apprende un
numero molto alto di nuove informazioni sfruttando la traccia mestica di un
nucleo di informazioni preesistenti sembra ragionevole e confermato da
esperimenti neurofisiologici. Il fatto che l’apprendimento non sia un processo
completamente supervisionato ( basato su esempi ), ma nemmeno del tutto non
supervisionato, ed abbisogni quindi di almeno un insieme di punti di
riferimento noti, sembra confermato sia dall’esperienza quotidiana che da
numerosi studi ( Ermentrout 1992, Pizzi et al. 1998, Reger et al. 2000, Pizzi et
al. 2003a, Pizzi et al. 2003b ).
5.3 Descrizione della rete neurale artificiale utilizzata
nell’esperimento.
Di seguito si descrive l’architettura neurale artificiale adottata nell’esperimento
che è oggetto della presente tesi e che verrà descritto nei capitoli successivi.
La rete è scritta in linguaggio C. Suo obbiettivo è la classificazione dei segnali
provenienti dai neuroni in una delle quattro direzioni che verranno indicate
all’ attuatore robotico : Su, Giù, Destra e Sinistra. Nel caso il robot debba
muoversi nella direzione di un ostacolo, ci si limita a non farlo muovere.
La rete è stata scritta considerando il susseguirsi di due fasi :
92
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
1. fase di Training : si accettano solo i segnali di addestramento per permettere
la generazione degli z-score di riferimento utilizzati poi per la classificazione;
2. fase di Testing : si ricevono segnali direzionali che dovranno essere
classificati grazie agli z-score creati nella prima fase.
Si sono definiti dei parametri fondamentali che incidono profondamente sul
comportamento della rete :
• NI: si tratta del numero di neuroni costituenti lo strato di input;
• NY: `e il numero di neuroni dello strato di Kohonen;
• STREAM: indica la dimensione totale del file contenente i campioni da
analizzare intesa come il numero di campioni presenti;
• PAUSA: fornisce al programma il numero di epoche per campionamento;
• EPSILON e ALPHA: rispettivamente tasso di apprendimento e di
dimenticanza della rete;
• DELTA: valore della soglia utilizzata nel calcolo degli z-score;
La rete è una ITSOM, l’architettura descritta più sopra, adattata al particolare
compito che deve svolgere. Lo strato di input è composto da cinquecento
neuroni, mentre lo stato competitivo, o di Kohonen, ne comprende dodici. Tale
numero di neuroni sullo strato di output è stato determinato come ottimale
grazie ad un precedente esperimento di taratura della rete artificiale, effettuato
dal gruppo di ricerca Living Network Lab.
Inserita in un’applicazione LabView sotto forma di DLL Windows 32, la rete
resta in attesa di una notifica da parte del programma che gestisce le risposte
dei neuroni. Esso registra gli output delle cellule in appositi file binari il cui
nome indica chiaramente la fase in cui ci si trova e che segnale contiene.
L’utilizzo di file binari è legata al fatto che nel linguaggio C tali file
consentono un accesso più immediato ai valori in esso contenuti rispetto ad un
93
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
file di testo. La gestione delle stringhe risulta onerosa in termini di prestazioni
e di complessità del codice.
Per ogni file di segnali, contenente 32000 valori, viene inviata alla DLL una
matrice bidimensionale composta da 8 colonne e 4000 righe il cui tipo
numerico è “double”. Essa non viene analizzata in un’unica volta, ma si divide
il numero totale di valori per il numero di z-score di riferimento da generare
( o generati se siamo in fase di testing ) per ogni direzione per ogni
campionamento. Tale nuovo valore viene diviso per il numero di neuroni sullo
strato di input ottenendo il numero di campionamenti necessari per processare
tutti i dati. Tramite test empirici si è scelto di generare otto z-score di
riferimento per ogni direzione. In pratica ogni neurone ha, per ogni
campionamento, 8 valori di 1 e 0 che indicano il suo stato di vincente o
perdente risultante dall’elaborazione di quella parte dei dati di input.
Reiterando questo processo per tutti e otto i campionamenti si ottengono gli
otto z-score necessari per la corretta definizione di un pattern. Esiste una
matrice tridimensionale per ogni direzione, e in essa si memorizzano tutti gli
z-score di riferimento. Ne viene di seguito illustrata la struttura (fig.5.4).
Fig. 5.4 Struttura della matrice di z-score. Nel caso dell’ utilizzo di questa
tesi ne esistono quattro differenti, ognuna contenente i pattern relativi ad
una specifica direzione.
94
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
Ognuna delle parti in cui viene diviso il numero di valori nel file viene
sottoposta all’elaborazione della rete. Per ogni campionamento si determina il
neurone vincente in base alla distanza minima sopra descritta, quindi si
provvede a punire o premiare tale neurone mediante la modifica dei pesi. La
premiazione del vincente si compie spostando il valore del peso della
connessione verso il valore della media degli input di una percentuale, di tale
distanza, determinata dal tasso di apprendimento ε. Si tiene conto delle vittorie
di ogni neurone e se ne definisce un numero oltre il quale è meglio
scoraggiarne di ulteriori. In questo caso e in caso di neurone perdente, si attua
una punizione mediante un lieve allontanamento del peso dal valore medio
degli input, questa volta grazie ad una percentuale indicata dal tasso di
dimenticanza α .
Questa fase viene ripetuta per un dato numero di epoche al fine di generare la
serie temporale di vittorie e approssimazioni necessarie alla creazione di
z-score significativi. Questi ultimi vengono poi calcolati mediante l’algoritmo
descritto nel paragrafo precedente e si arriva a rappresentare con sequenze di 1
e 0 le configurazioni dei neuroni vincenti per ogni campionamento.
La differenza tra le fasi di Training e Testing è data dal fatto che, nella prima,
non si procede a classificare gli z-score generati, ma li si memorizzano in
un’apposita matrice, avendo così i riferimenti rappresentanti le configurazioni
dei neuroni vincenti in relazione ai diversi pattern di training ricevuti in input.
Tutto questo non avviene nella fase di Testing, dove si procede alla
classificazione: una volta generati gli z-score si procede a confrontarli con
quelli memorizzati nella prima fase, e non appena si riscontra la medesima
configurazione in entrambi gli z-score si classifica quel segnale di test come
segnale indicante quella direzione.
La rete è un’ applicazione che viene gestita tramite Lab-View. Si tratta di un
ambiente di sviluppo grafico con funzionalità incorporate per l’acquisizione,
l’analisi delle misure e la presentazione dei dati, che garantisce la flessibilità di
un potente linguaggio senza la complessità a dei tradizionali “tool” di sviluppo.
95
Capitolo 5
La rete SOM e l’evoluzione ad ITSOM
LabView offre avanzate capacità di acquisizione, analisi e presentazione in un
unico ambiente.
I segnali direzionali vengono generati da un’applicazione che può essere
considerata server (fig.5.5). Essa genera i segnali direzionali, li invia al
controller che li converte in segnali elettrici atti a stimolare i neuroni, quindi,
mediante la scheda di acquisizione, riceve i segnali di ritorno dalle cellule e li
memorizza in file binari.
Fig. 5.5 Interfaccia grafica del software per la generazione di segnali
elettrici.
Una volta che il file binario è pronto viene inviata una notifica che attiva
l’applicazione in cui è inclusa la DLL. Quando la si riceve, l’applicazione
procede nell’aprire il file, estrarre i dati e generare tutti i valori di tipo “double”
che vengono poi usati per riempire la matrice destinata alla DLL. LabView
mette a disposizione elementi grafici equivalenti alle diverse strutture tipiche di
un programma C.
96
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
Capitolo 6
Esperimento
per
la
strutturazione di un circuito
ibrido biologico/elettronico.
Scopo dell’esperimento ed oggetto di questa tesi è testare un sistema di
decodifica dei segnali neurali biologici attraverso una rete neurale artificiale
( ANN ). A questo scopo è necessario inviare stimoli sensoriali simulati ad una
rete di neuroni biologici, e verificare poi, attraverso la decodifica da parte della
ANN, che i neuroni biologici abbiano correttamente appreso gli stimoli a loro
indirizzati, il che avviene quando a stimoli uguali rispondono con segnali
uguali.
Un attuatore robotico connesso alla ANN evidenzierà il risultato della
decodifica.
All’ interno di questo capitolo si focalizzerà l’attenzione su quanto svolto
durante il laboratorio nel corso della strutturazione di un circuito chiuso all’
interno del quale può essere fatta passare un’ informazione. Nel nostro caso
l’informazione sarà un comando di spostamento, generato per mezzo di un
software, al fine di far compiere movimenti ad un robot. Può non essere
d’ immediata comprensione l’originalità dell’ esperimento, in quanto esistono
già circuiti elettronici in grado di far muovere a distanza parti meccaniche
robotiche ( partendo dalle automobili elettriche per bambini fino ad arrivare
alla sonda spaziale “Spirit”). I circuiti diffusi per il movimento di parti
meccaniche a distanza sono circuiti di tipo non misto ( unicamente elettronici ),
97
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
e pertanto artificiali. Completamente differente è la costituzione di circuiti
ibridi
(
misti
)
con
componenti
biologiche
ed
elettroniche
contemporaneamente. In tal caso il circuito risulta essere non totalmente
artificiale poiché possiede una parte di materiale naturale. Ciò che viene
trasmesso, sotto differenti forme, tra le varie componenti di un circuito la si
può definire informazione. Di tale informazione si conosce tutto per quanto
riguarda la parte elettronica dei circuiti, mentre molto diversa è la situazione
dell’ informazione legata al materiale biologico ( vedi le problematiche esposte
nel capitolo 3 ).
L’informazione che passa all’ interno del circuito ibrido costituto durante
l’esperimento è definita da
quattro differenti comandi di spostamento
indirizzati al terminale mobile ( robot ). Tale circuito compie la generazione di
un segnale di tipo elettronico, che funge da input al circuito neuronale
biologico, che a sua volta dirige i suoi segnali verso il circuito elettronico,
guidando un robot.
6.1 TRASPORTO DEL SEGNALE ATTRAVERSO IL
CIRCUITO IBRIDO BIOLOGICO/ELETTRONICO.
Il trasporto del segnale attraverso il circuito ibrido e le relative componenti
vengono presentate seguendo l’ordine del passaggio dell’ informazione,
partendo dalla generazione per arrivare all’ attuazione robotica del movimento.
6.1.1 GENERAZIONE DEL SEGNALE.
La generazione del segnale avviene per mezzo di un controller hardware
implementato dal gruppo LNL (fig.6.1), in grado di generare segnali elettrici
desiderati con determinate caratteristiche tecniche. Il segnale elettrico prodotto
98
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
in questa fase deve possedere corretti requisiti che ne permettano l’utilizzo per
la stimolazione dell’attività della rete biologica di neuroni. Per questo motivo il
segnale generato deve essere caratterizzato da una frequenza d’onda inferiore a
1 Hz, essere un segnale elettrico a corrente alternata per evitare la lisi cellulare
e con un voltaggio pari a 300 mV. Particolare interessante è la tipologia
dell’onda utilizzata per le stimolazione neurali: l’onda quadra. Tale modalità è
stata definita da differenti studi come l’onda più adatta per lo svolgimento di
esperimenti per la stimolazione di neuroni.
Fig. 6.1 Controller implementato dal gruppo LNL. Vi sono numerati gli otto
canali per la stimolazione.
Una volta definito quelle che sono le caratteristiche generali del segnale
elettrico occorre fare ulteriori specifiche per meglio caratterizzare il segnale in
entrata nelle piastre cellulari.. Infatti i pattern d’informazione sono stimoli
elettrici in funzione del tempo. Pertanto le stimolazioni elettriche passanti gli
otto canali della scheda non si differenziano in base all’intensità del segnale
( costante a 300 mV), bensì in base al proprio andamento temporale. In fig. 6.2
vengono riportati tre differenti stimolazioni in onda quadra.
99
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
a)
b)
c)
1s
Fig. 6.2 Tre esempi di onda quadra. (a) Nel primo caso abbiamo due stimoli
della durata di 2 s intervallati da un secondo di pausa e seguiti da uno
stimolo di alrtri 2 s. (b) Nel secondo caso abbiamo 2 s di pausa e due
secondi di stimolo intervallati da un altro secondo di pausa, poi 4 s senza
stimolo. (c) in questo caso si ha uno stimolo di 1 s dopo 1 s di pausa,
seguito da 3,5 s di pausa, stimolo di 1 s e 2s. di pausa.
Il controller (fig.6.1) invia i pattern elettrici in onda quadra per mezzo di otto
canali elettrici collegati alla piastra MEA ( vedi capitolo 2 ) . I quattro pattern
si differenziano in maniera da avere una differente composizione degli
andamenti temporali delle onde nel tempo.
Si è studiato un particolare metodo di rappresentazione dei pattern in questione.
Si prendano in considerazione una griglia composta da 8 x 8 bit . Ogni bit è
caratterizzato da una durata temporale di 300 ms. Si considera il bit “vuoto”
( bianco ) quando non vi è lo stimolo e pieno ( pallino nero ) quando vi è stata
la stimolazione. Tale rappresentazione è utilizzabile in quanto non si
necessitano ulteriori specifiche sulle caratteristiche dello stimolo posto sempre
a 300 mV. Se il controller non invia alcuno stimolo lungo gli otto canali la
griglia presenterà tutti i bit vuoti (fig.6.3).
100
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
a)
b)
Fig 6.3 (a) rappresentazione per mezzo di una griglia 8 x 8 bit. Nell’
immagine presentata non vi è alcuno stimolo. (b) onde corrispondenti alla
mancanza di stimolazione. Come si può notare sono otto segnali “nulli”,
senza stimolo.
Se invece avvengono una serie di eventi di stimolazione ci si trova davanti a
situazioni come quella di seguito illustrata (fig. 6.4).
Fig. 6.4 Rappresentazione della griglia 8 x 8 bit dove si è avuta
stimolazione
tramite tre canali sugli otto possibili. A fianco vengono
riportate
onde
le
caratteristiche
che
hanno
generato
il
pattern
rappresentato nella griglia. I canali privi di stimoli sono stati omessi.
101
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
Gli esempi riportati nelle fig. 6.3 e 6.4 sono atti a far comprendere meglio il
rapporto tra la rappresentazione del pattern per mezzo della griglia 8 x 8 bit e le
stimolazioni che effettivamente vengono trasmesse alla piastra di neuroni.
I pattern elettrici vengono inviati alla rete biologica in maniera ripetuta, di
modo che abbia luogo l’apprendimento e le connessioni di neuroni
raggiungano una struttura stabile che differenzi adeguatamente le sue risposte
in base alle 4 combinazioni di onde quadre
inviategli in input. Come
sottolineato in precedenza i pattern da inviare alle cellule devono descrivere
comandi per lo spostamento di un’ unità robotica posta come terminale del
circuito. I pattern generati vengono classificati con DESTRA (R), SINISTRA
(L), AVANTI (F). RETRO (B) ( fig. 6.5 ).
Fig. 6.5 Rappresentazione dei quattro pattern sperimentali per mezzo della
griglia 8 x 8 bit. Sopra le griglie sono riportate le corrispondenti
classificazioni (Right, Left, Forward, Back).
Essendo ormai chiaro che ogni bit della griglia corrisponda a 300 ms, si evince
come lo stimolo inviato alla piastra abbia una durata complessiva di 2.4 s.una
102
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
volt a inviato lo stimolo, l’informazione passa a livello della piastra di neuroni
biologici, cui aspetta la fase successiva alla generazione dei segnali.
6.1.2 ELABORAZIONE DEL SEGNALE DA PARTE
DELLA COMPONENTE BIOLOGICA, I NEURONI
UMANI.
Successivamente alla generazione del segnale avviene ciò che in apertura di
questo capitolo era stato anticipato. Una volta entrato all’ interno della piastra
di neuroni, l’informazione si trasforma. da segnale elettronicamente generato
( e quindi artificiale ) a segnale elaborato biologicamente da una rete di neuroni
umani. Il meccanismo di funzionamento riportato dall’ impiego della
registrazione per mezzo di MEA sono ampiamente descritti all’ interno del
capitolo 2 di questa trattazione. Come detto nel paragrafo precedente, gli
elettrodi del microarray in piastra sono in grado di funzionare sia in modalità
per l’invio di un segnale elettrico che in modalità di ricezione. Tramite
un’ analisi al microscopio vengono scelti i neuroni che presentano adesione
certa alla superficie esterna di neuroni della rete biologica. L’utilizzo di soli
otto elettrodi dei sessantaquattro che costituiscono l’array della MEA utilizzata
non costituisce una limitazione tecnica per l’esperimento. Infatti uno dei
principi su cui si basano le registrazioni con MEA è che non è importante
andare a verificare l’attività elettrica di ogni neurone in coltura, bensì è
importante registrare il funzionamento della rete nel complesso. È chiaramente
consigliabile che stimoli e registrazioni avvengano comunque tramite elettrodi
ben connessi alla rete biologica per poter ottenere dati con maggior
accuratezza.
103
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
Fig. 6.6 La freccia gialla indica il controller dal quale si vedono chiaramente
dipartire gli otto canali (freccia blu). All’ interno del box giallo (freccia
rossa) vi è la piastra con i neuroni umani. Il box serve a mantenere
l’ambiente termostatato a 37°C per meglio preservare le cellule.
I pattern d’ingresso hanno una durata costante di 2.4 s per tutte e quattro le
direzioni considerate. Una volta inviato lo stimolo gli elettrodi passano
istantaneamente in modalità di registrazione. Tale attività di acquisizione del
segnale viene mantenuta per 400 ms. La scelta del tempo di registrazione è un
parametro ricavato dal gruppo di ricerca LNL mediante l’ esperimento
precedente al lavoro di questa tesi, durante il quale vennero effettuate delle
prove per stabilire quale fossero i migliori parametri da impostare per
l’ottimizzazione della rete neurale artificiale, in quanto sarà tale rete a dover
elaborare i segnali in uscita dalla piastra.
I segnali registrati vengono inviati, attraverso i medesimi otto canali di
connessione (fig.6.4), alla scheda di acquisizione. Dalla scheda di acquisizione
si assiste all’ apertura di due applicazioni che lavorano contemporaneamente.
La prima è l’applicazione di registrazione dei segnali, la seconda è
l’applicazione d’invio immediato del segnale in uscita dalla piastra verso la
104
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
rete neurale artificiale ITSOM ( descritta nel capitolo 5 ). La registrazione dei
segnali non serve all’attuazione dell’ esperimento di tesi.
Ad ogni modo si è deciso di conservare le registrazioni effettuate per una
maggior completezza della documentazione sperimentale.
6.1.3 DECODIFICA DEL SEGNALE PER MEZZO DI
ITSOM.
Il segnale in uscita dalla rete neurale biologica viene passato alla rete neurale
ITSOM ( Inductive Tracing Self Organizing Map ). L’attività e le
caratteristiche tecniche, quali numero di neuroni sui vari strati, numero di
epoche, tasso d’apprendimento e di dimenticanza sono state ampiamente
descritte nel capitolo 6 di questa trattazione. In parte verranno riprese per
meglio descrivere come viene elaborata l’informazione proveniente dai neuroni
umani.
La registrazione effettuata dalla scheda di acquisizione ha una
frequenza di 10 KHz, ovvero si registra l’attività elettrica diecimila volte al
secondo. Essendo i canali di registrazione 8 ed il tempo di acquisizione della
risposta pari a 400 ms, ci si trova a dover decodificare un set di 32000
campioni. Questi campioni vengono introdotti all’ interno una matrice
composta da 8 colonne e 4000 righe. I valori elettrici vengono convertiti in
valori binari ( vedi cap.5 ). La quantità di dati è troppo elevata per poter essere
computata correttamente dalla rete, la quale presenta solo 500 neuroni sullo
strato input. Si suddividono i dati in otto campionamenti differenti. Ogni
processo di campionamento darà origine ad uno z-score di riferimento. Una
volta generati gli otto z-score in grado di descrivere accuratamente il pattern in
questione, la rete neurale funziona in maniera differenziata in base che ci si
trovi in fase di “training” o in fase di “testing”. Nel caso si stia effettuando il
training gli z-score vengono memorizzati e conservati, allo scopo di fungere da
riferimento per la fase di testing con pattern ignoti. Al contrario se si sta
effettuando la fase di testing, gli otto z-score ottenuti sono confrontati con
105
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
quelli di riferimento salvati all’ interno delle matrici ( una per ogni pattern ), in
maniera che venga definita la direzione del comando tramite confronto. Ciò è
possibile in quanto ci si basa sul fatto che gli z-score di due medesimi pattern
presentano una elevata similarità rispetto ai valori z-score delle matrici di
pattern differenti.
6.1.4 ATTUAZIONE DEL SEGNALE TRAMITE
ROBOT.
A seconda che ci si trovi in fase di training o di testing il segnale in uscita dalla
rete neurale artificiale compie due percorsi differenti. Infatti a seguito della
fase di training non si ha una vera e propria uscita del segnale, in quanto la
serie degli z-score viene utilizzata come riferimento per la successiva fase di
test, a conclusione della quale si arriva all’attuazione robotica del segnale. A
questo punto si utilizza una struttura “case of”. Questa struttura è una classica
costruzione algoritmica che permette di assegnare dei valori interi a processi
elaborati. Infatti viene assegnato un valore intero differente per ogni direzione
decodificata dalla rete ITSOM:
•
1 = DIETRO
•
2 = AVANTI
•
3 = DESTRA
•
4 = SNISTRA
A seconda dell’assegnazione di numero intero che viene effettuata, la rete
neurale artificiale genera una particolare segnalazione elettrica. Anche in
questo caso si tratta di segnali elettrici in onda quadra (fig.6.7). Queste
106
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
differenti segnalazioni vengono inviate per mezzo di una connessione elettrica
alla scheda di acquisizione Personal DAQ 6052E prodotta da National
Instrument. Questa scheda è in grado di ricevere in input il segnale elettrico
uscente dalla rete ITSOM, convertirlo in un dato digitale che verrà poi
opportunamente convertito in un comando che un apposito device ad infrarossi
invierà al robot.
Fig. 6.7 Segnali in uscita dalla rete neurale artificiale inviati alla scheda d
conversione Personal DAQ.
Il robot utilizzato per l’esperimento possiede una porta per la ricezione dei
segnali infrarossi ed è quindi in grado di essere manovrato a distanza dal
sistema hardware implementato dal gruppo LNL.
107
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
6.2 PROTOCOLLO SPERIMENTALE.
Viene ora riportato il protocollo sperimentale per lo svolgimento dell’ attività
di laboratorio. Tale protocollo è suddiviso in due parti differenti, la prima
durante la quale avviene la fase di apprendimento per la rete biologica e il
training per la rete artificiale. Durante la seconda parte invece avviene la fase
di testing per la decodifica di pattern ignoti.
PROTOCOLLO ESPERIMENTO ROBOTICO
Attrezzatura:
Software di gestione dell’ esperimento
1 piastra MEA ( staminali umane )
Controller
8 cavi elettrici per connessione NI 6052E-MEA
Scheda di acquisizione Personal DAQ
Cavo elettrico per connessione output ITSOM/telecomando robot.
schema di connessione degli elementi:
108
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
1) scelta del pattern
2) invio del segnale generato per mezzo del controller alla rete
neurale biologica
3) uscita del segnale dalla piastra MEA
4) compilazione della matrice dei dati in valori binari
5) trasferimento della matrice elaborata alla rete neurale artificiale
6) uscita del segnale decodificato da ITSOM
7) invio del segnale I.R. di movimento al robot
PRIMA FASE: TRAINING
Pattern R
8 bit x 8 bit
Ogni bit ha la durata di 300 ms a 300 mV
Durata stimolo: 300 x 8 = 2400 ms = 2.4 s
■
■
■
■ ■ ■ ■ ■
■ ■ ■ ■ ■
■
■
■
■
■
■
■
■
■
■
■ ■
■ ■
■
Dopo la stimolazione seguono 1 s di pausa, durante la quale viene
attivata la registrazione e l’ascolto da parte della rete neurale artificiale.
L’ascolto della rete neurale avviene durante la prima fazione successiva
allo stimolo pari a 400 ms.
109
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
Il pattern viene somministrato 10 volte:
4.8 x 10 = 48 s
Pattern L, Pattern F, Pattern B : come sopra.
Alla fine del training di ciascun pattern si fa una pausa di 5 secondi.
■
■ ■
■ ■ ■
■ ■ ■ ■
■
■
■
■
■
■ ■
■ ■ ■
■ ■ ■ ■
■
■
■
■
■
■ ■
■ ■
■
■
■
■
■
■ ■ ■ ■
■ ■ ■
■ ■
■
■
■
■
■
■
■
■
■
■
■
■ ■ ■ ■
■ ■ ■ ■
■ ■
■
■
■
■
■ ■ ■ ■ ■
■ ■ ■ ■ ■
■
■
■
• 10 secondi di pausa prima di passare alla fase di testing
110
Capitolo 6
Strutturazione di un circuito ibrido biologico/elettronico
SECONDA FASE: TESTING
Sono predisposti a video 4 bottoni (uno per ogni pattern ).
Schiacciando il bottone R si provoca la stimolazione del pattern R per 2.4 s e
subito si entra in registrazione.
Lo stesso per gli altri bottoni.
L’esperimento prevede che si schiaccino vari bottoni in ordine sparso.
Dopo premuto un bottone, la rete neurale artificiale acquisisce il segnale per 400
ms e comincia a lavorare, fino ad inviare il segnale alla scheda di acquisizione
DAQ. La scheda Personal DAQ invia il segnale all’ attuatore robotico .
Ripetere l’operazione premendo nuovamente un tasto.
111
La differenza maggiore tra le due fasi dell’ esperimento è che durante il testing
il robot (fig.6.8) è acceso e connesso al circuito, nella fase di training il robot è
off-line, in quanto non connesso al circuito. Ciò avviene in quanto durante la
fase di training si intende allenare la rete biologica a meglio definire i differenti
impulsi in entrata, e la rete artificiale per generare gli z-score di riferimento
necessari per il riconoscimento dei pattern durante la fase di testing.
Fig. 6.8 Attuatore robotico in grado di muoversi comandato a distanza
tramite raggi infrarossi.
112
Capitolo 7
Risultati
Capitolo 7
Risultati
7.1 RISULTATI SPERIMENTALI.
In questa parte della presente trattazione si analizzeranno i risultati ottenuti
dall’ esperimento descritto nel capitolo precedente. Ovviamente quanto verrà
ora proposto si riferisce unicamente alla fase di testing, in quanto la fase di
training serve per ottimizzare la funzionalità del circuito ibrido costituito.
Come già menzionato precedentemente (cap.6), si sono somministrati alcuni
pattern direzionali scelti casualmente dell’ operatore. Ogni volta che un segnale
veniva generato si annotava
quale fosse la risposta data dal movimento
dell’attuatore robotico. I risultati ottenuti dall’esperimento sono stati
classificati in tre modi differenti, corretto nel caso il pattern in input
corrisponda al movimento del robot, non corretto nel caso la direzione
intrapresa dal robot sia differente da quella descritta dallo stimolo generato e
non classificato nel caso il robot successivamente ad uno stimolo sia rimasto
immobile.
Risulta evidente come vista la tipologia della classificazione dei risultati, i
pattern eseguibili dal robot sono cinque ( le quattro direzioni più la non
classificazione ) mentre i pattern direzionali in input siano quattro. Come
vedremo in seguito, da un punto di vista di decodifica del segnale, attuato dalla
rete neurale artificiale, il fatto che un pattern sia caratterizzato erroneamente
piuttosto che non caratterizzato ha un significato molto differente.
Nel corso dell’ esperimento sono stati forniti al circuito un numero di pattern
pari a 23. Questo numero di prove effettuate è stato concordato in base ad
esperienze pregresse del gruppo di ricerca che hanno definito una forte calo di
113
Capitolo 7
Risultati
attività da parte delle cellule neurali umane dopo i primi venti stimoli di
testing.
Nella seguente tabella vengono riportati i risultati riferiti all’ esperimento con il
robot reale.
nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
STIMOLO
dietro
sinistra
avanti
avanti
sinistra
sinistra
destra
sinistra
dietro
dietro
avanti
dietro
avanti
sinistra
dietro
destra
destra
destra
sinistra
avanti
avanti
destra
sinistra
SPOSTAMENTO
dietro
dietro
avanti
avanti
sinistra
sinistra
destra
sinistra
dietro
dietro
fermo
dietro
avanti
sinistra
dietro
fermo
destra
destra
sinistra
destra
destra
destra
destra
CLASSIFICAZIONE
corretta
non corretta
corretta
corretta
corretta
corretta
corretta
corretta
corretta
corretta
non classificato
corretta
corretta
corretta
corretta
non classificato
corretta
corretta
corretta
non corretta
non corretta
corretta
non corretta
Tab 7.1 Risultati ottenuti sperimentalmente. In verde sono riportati i
risultati corretti, in giallo le non classificazioni ed in rosso le classificazione
errate.
Come si può intuire dalla tabella 7.1, il circuito costituito sembra funzionare in
maniera corretta, al di sopra delle aspettative. Infatti sono ben 17 su 28 le
classificazioni corrette, solo 3 quelle non corrette e 2 sole quelle non avvenute.
114
Capitolo 7
Risultati
Di seguito si riporta un’ulteriore modalità di rappresentazione dei dati che può
essere utile per estrapolarne un’ interessante discussione.
SUDDIVISIONE DEGLI IMPULSI
F
B
R
L
Pattern
AVANTI
DIETRO
DESTRA
SINISTRA
TOTALE
6
5
7
5
corretto
3
5
5
4
non corretto
2
/
2
/
non classificato
1
/
/
1
Tab. 7.2 Ripartizione degli impulsi forniti durante l’esperimento all’ interno
delle tre classi. Vengono inoltre riportati gli impulsi totali per ogni pattern
direzionale.
A lato sono riportate le sigle per ogni pattern F ( avanti),
B ( dietro), R ( destra ), L ( sinistra ).
Dalla tabella 7.2 risulta evidente come il numero totale degli impulsi per ogni
pattern non sia sempre uguale. Infatti, come già detto più volte, gli impulsi
venivano lanciati come input per il circuito in maniera del tutto casuale.
Chiaramente si è cercato di non fornire quantità di pattern troppo differenti per
non falsare l’analisi funzionale circuitale. La prima cosa evidente è che il
pattern direzionale dietro è stato correttamente individuato nel 100% dei casi.
In particolare è stato identificato per ben cinque generazioni del pattern
corrispondente. Cinque sono anche le corrette identificazioni del pattern destra,
ma il numero di volte in cui è stato generato un segnale indicante lo
spostamento a destra è stato di due unità superiore. In particolare si osserva
come nel caso di errata attuazione del segnale R da parte del robot, non è mai
avvenuta una mancata classificazione. Ciò non avviene nel caso del pattern
avanti, dove si hanno 2 risultati su 6 non correttamente classificati e uno non
classificato. Diversamente dagli altri il pattern sinistra presenta un’ unica
eccezione alle classificazioni non corrette, con la quale il robot non si è mosso
dando così origine ad una non classificazione.
115
Capitolo 7
Risultati
Una completa esposizione dei risultati richiede che venga mostrato in che
modo è avvenuta un’errata classificazione per ogni tipo di pattern (tab.7.3). In
questo modo si possono osservare se l’attuazione errata di un dato pattern tende
essere correlata con l’attuazione di un altro in particolare.
F
R
L
Input pattern
AVANTI
DESTRA
SINISTRA
Movimento attuato
n.c./ destra/ destra
n.c.
dietro / destra
Nr.errati
3
1
2
TOTALE = 6
Tab. 7.3 Tabella riportante il movimento compiuto dal robot nel corso di
risultati con classificazioni errate. La colonna a destra riporta il numero di
stimoli non correttamente elaborati e decodificati tramite il circuito ibrido.
Come si può vedere il numero di campioni errati è piuttosto basso ( pari a 6 ).
Unico caso di movimento errato ripetuto per un medesimo pattern lo si
riscontra con la generazione del segnale per il movimento in avanti. Infatti per
ben due volte su tre, quando il pattern avanti è stato classificato erroneamente
si è assistito ad un movimento verso destra. Nell’altra classificazione errata di
questo pattern il robot è rimasto immobile. Per gli altri due pattern che hanno
riportato classificazioni errate il movimento compiuto dall’attuatore è sempre
stato differente. Per il segnale a sinistra si sono avuti due movimenti errati, uno
a destra e uno all’indietro. Nel caso errato per il pattern destra si è ottenuta la
non classificazione del segnale.
A questo punto vengono mostrate le percentuali riferite alle prestazioni del
circuito ibrido costituito (tab.7.4a,b). Oltre che sul totale degli stimoli
effettuati, è necessario considerare le prestazioni del sistema in maniera
differenziata per ognuno dei quattro pattern.
116
Capitolo 7
Risultati
a)
F
B
R
L
Pattern
AVANTI
DIETRO
DESTRA
SINISTRA
% corretto
50
100
71,4
80
% non corretto
33,3
0
28,6
0
% non classificato
16,4
0
0
20
b)
Totale Pattern
% corretto
73,9
% non corretto
17,4
% non classificato
8,7
Tab. 7.4 Vengono riportate le percentuali riferite alle prestazioni di
classificazione riscontrate nel corso dell’esperimento. (a) Tali percentuali
sono ripartite tra i quattro differenti pattern. (b) Le percentuali si
riferiscono
alla
prestazione
del
circuito
ibrido
considerando
l’intero
esperimento.
I dati riferiti alle prestazioni sono molto positivi. Infatti se si osservano le
percentuali riportate nella tabella 7.4b si vede come la rete abbia funzionato
correttamente per quasi tre casi su quattro. Solamente in un terzo dei casi di
classificazione errata, l’attuatore non è riuscito ad individuare nessuno dei
quattro pattern pattern possibili rimanendo fermo. I due pattern meglio
riconosciuti sono dietro e sinistra. Infatti per questi due segnali si può scartare
con certezza la casualità dell’identificazione. Le percentuali d’ identificazione
legate a questi due pattern ( rispettivamente 100% e 80% ) indicano un’ottima
capacità di apprendimento sviluppata dalla rete biologica e ottima capacità di
decodifica della rete ITSOM. Le percentuali riferite a questi due pattern sono
maggiormente confrontabili in quanto sono riferite ad un identico numero di
generazione dei segnali ( cinque per pattern ). Va però sottolineato come tali
due direzioni corrispondano al minor numero di prove effettuate sul circuito
117
Capitolo 7
Risultati
ibrido. Da questo punto di vista il pattern maggiormente testato è stato destra,
sono infatti sette le prove effettuate con la somministrazione del suo segnale
corrispondente (tab.7.1). La percentuale della prestazione riferita a questo
pattern è molto elevata ( 80% ), e anche questo caso non si può parlare di
casualità
dell’ identificazione. Considerando il 20% come percentuale di
riferimento per una identificazione casuale ( ricordo
che le possibilità di
classificazione sono quattro, date dai pattern, più il caso di default della non
identificazione ), non si può parlare di casualità per un fenomeno con una
percentuale quattro volte superiore. Differenti sono le prestazioni riguardanti il
pattern avanti. Questa direzione è stata correttamente caratterizzata per il 50%
dei casi. Basandoci su quanto appena detto a riguardo della percentuale di
casualità al 20% si nota come il valore riferito al pattern sia comunque positivo
poiché superiore al doppio. Bisogna comunque tenere conto che per questa
direzione l’identificazione sembra avere carattere maggiormente
di tipo
“random”.
Il problema del basso numero di campioni eseguiti ( 23 prove ), come
precedentemente detto, è legato alla bassa vitalità della rete di neuroni umani
quando viene sottoposta agli stimoli generati dal controller. A questi ventitre
stimoli di testing vanno sommati i 40 precedenti stimoli ( 10 per ogni direzione
) necessari per il training delle reti.
È per tanto lecito
aspettarsi delle
prestazioni migliori nello spazio dei campionamenti sia distante dall’inizio e
dalla fine della fase sperimentale.
118
Capitolo 7
Risultati
Istogramma delle classificazioni
rete artificiale tarata
1
corretto
c
l
a
s
s
i
non
classificato
non
corretto
0,5
0
1
3
5
7
9 11 13 15 17 19 21 23
campioni
Fig. 7.1 Istogramma delle classificazioni per l’esperimento con rete
artificiale tarata. Questo grafico risulta essere molto utile per visualizzare
la distribuzione delle classi nel corso dell’ esperimento.
Per mezzo dell’ istogramma rappresentato in figura 7.1 si può verificare se vi è
la costituzione di particolari aree, all’interno dello spazio dei campioni, dove la
classificazione presentata
è caratterizzata da prestazioni più basse.
Effettivamente si nota come la classificazione degli ultimi campioni sia stata
meno efficiente. Il 75% delle classificazioni errate avvenute si riscontrano
negli ultimi quattro campioni, i n. 20, 21 e 23. Questo risultato ci riporta alle
anticipazioni fatte a riguardo del calo di attività della rete biologica. Infatti
l’area nella quale vi sono le tre classificazioni errate ha inizio al ventesimo
pattern di testing generato, che sommato ai 40 stimoli per il training
costituiscono
il
sessantesimo
pattern
inviato
alla
piastra
cellulare.
Particolarmente interessante può essere il risultato corretto d’identificazione
del campione n. 22 (fig.7.1). Considerando il fatto che cade in una zona a bassa
119
Capitolo 7
Risultati
efficienza del sistema, e che il pattern destra non risulta essere quello meglio
caratterizzato, vi è un’elevata probabilità che tale identificazione sia stata
casuale. Se per la zona descritta dagli ultimi campionamenti si parla di
abbattimento delle prestazioni della rete di neuroni umani,
certamente di
differente natura deve essere l’errata identificazione del pattern numero 2. Tra
le varie possibilità vi sono: l’errore casuale ( possibilità mai da scartare ), una
bassa affinità per il riconoscimento di questo pattern ( tesi non supportata dai
dati raccolti con 80% delle identificazioni corrette per il segnale di comando
sinistra ) oppure una difficoltà della rete biologica nel passaggio dalla fase di
training alla fase di testing.
Oltre alle due zone con errate classificazioni, dal grafico di fig. 7.1 si evince la
posizione dei due campioni non classificati con i quali non è stato attuato
alcun tipo di movimento da parte del robot. Le due non classificazioni cadono
nella zona centrale dello spazio dei campioni, verificandosi allo stimolo
numero 11 e numero 16. Innumerevoli sono le variabili che possono portare a
questo tipo di risultato. Per poter ipotizzare quali siano le cause di tale non
classificazione si pensa sia importante analizzare i pattern dell’ intorno. Se si
osservano i pattern dell’ intorno al campione 11, si nota come i pattern numero
9, 10, 12 siano stati correttamente identificati e tutti dati dalla medesima
direzione ( dietro ). Se si osserva l’intorno del pattern 16, si vede come pattern
somministrato dietro al numero 15 e destra al numero 17. Le ipotesi
riguardanti le mancate classificazioni
saranno espresse all’ interno delle
conclusioni del lavoro di tesi.
I risultati ottenuti tramite quest’esperimenti, attuati con il robot reale, offrono
interessanti spunti per il confronto con i dati ottenuti negli esperimenti
precedenti. In tali occasioni non è stato concretizzato l’utilizzo del robot reale.
120
Capitolo 7
Risultati
Fig. 7.2 Rappresentazione grafica a video del robot negli esperimenti con
attuatore simulato.
A sostituzione dell’ attuatore robotico reale venne implementato un attuatore
grafico elettronico. Labview venne quindi dotato di simulatore grafico, per
mezzo del quale veniva rappresentato un robot in grado di muoversi all’ interno
di uno spazio grafico (fig.7.2). A parte questa differenza, che non prevede
variazione dal punto di vista delle prestazioni fornite dal ciclo per il trasporto
dell’ informazione, la differenza fra i due esperimenti è che fra il primo e il
secondo esperimento la rete neurale è stata tarata off-line sulla base dei segnali
registrati. Si vedrà in effetti che la differenza di prestazioni fra il sistema prima
della taratura e quello dopo la taratura è elevata.
Le somministrazioni di pattern direzionali al circuito ibrido, senza la taratura
della rete ITSOM ha prodotto i seguenti risultati ( già utilizzati per la stesura di
tesi precedente ):
121
Capitolo 7
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Risultati
STIMOLO
dietro
dietro
sinistra
dietro
dietro
dietro
avanti
avanti
destra
avanti
avanti
sinistra
sinistra
sinistra
destra
sinistra
dietro
sinistra
avanti
destra
destra
destra
sinistra
destra
destra
SPOSTAMENTO
dietro
dietro
avanti
dietro
fermo
dietro
dietro
avanti
avanti
avanti
avanti
dietro
fermo
avanti
avanti
destra
dietro
destra
fermo
avanti
fermo
dietro
dietro
dietro
avanti
CLASSIFICAZIONE
corretta
corretta
non corretta
corretta
non classificato
corretta
non corretta
corretta
non corretta
corretta
corretta
non corretta
non classificato
non corretta
non corretta
non corretta
corretta
non corretta
non classificato
non corretta
non classificato
non corretta
non corretta
non corretta
non corretta
Tab 7.5 Risultati ottenuti sperimentalmente senza taratura della rete
artificiale. In verde sono riportati i risultati corretti, in giallo le non
classificazioni ed in rosso le classificazione errate.
La tabella riportata qui sopra (tab.7.5) è analoga a quella riferita
all’esperimento precedente ( tab 7.1 ) e riporta un numero di campioni pari a
25. È necessario specificare che anche in questo caso si tratta di risultati riferiti
alla fase di testing, successiva ad una fase di training identica a quella dell’
esperimento con attuatore robotico reale. La prima grossa differenza che salta
all’ occhio dell’osservatore è il marcato aumento del colore rosso. Tale colore
indica le classificazioni errate. Andando ad osservare più attentamente si nota
come i risultati dell’ esperimento di simulazione si possano considerare
122
Capitolo 7
Risultati
appartenenti a due tronconi differenti. Il primo, che va dal campione 1 al 11,
con una buona serie di risultati positivi, il secondo troncone, dall’ 12 al 25, con
tutta classificazioni errate o non avvenute, con un’ unica eccezione per il
campione 17.
Volendo osservare la distribuzione delle classificazione per i quattro pattern si
ottiene:
SUDDIVISIONE DEGLI IMPULSI
F
B
R
L
Pattern TOTALE
AVANTI
5
DIETRO
6
DESTRA
7
SINISTRA
7
corretto
3
5
/
/
non corretto
1
1
6
6
non classificato
1
/
1
1
Tab. 7.6 Ripartizione degli impulsi, forniti durante l’esperimento senza
tarature della rete ITSOM. all’ interno delle tre classi. Vengono inoltre
riportati gli impulsi totali per ogni pattern direzionale.
riportate le sigle per ogni pattern F ( avanti ),
A lato sono
B ( dietro), R ( destra ),
L ( sinistra ).
Dalla tabella soprastante si evince che per due direzioni ( avanti e dietro ) su
quattro si sono ottenuti risultati quantomeno accettabili. Infatti nel caso del
pattern avanti si assiste ad una corretta classificazione per tre
su cinque
campioni corrispondenti. Sostanzialmente corretti i risultati ottenuti anche per
il pattern dietro, per il quale si è assistita ad una classificazione corretta in
cinque campioni su sei. Sono da considerare non accettabili i risultati offerti
per i restanti pattern, per i quali non si è assistita a nessuna corretta
classificazione (tab.7.6). Prima di trarre alcune conclusioni su quelle che
potrebbero essere la motivazioni che hanno portato il circuito a fornire tali
prestazioni, è interessante vedere con chiarezza le possibili relazioni che vi
123
Capitolo 7
Risultati
sono tra pattern inviati e movimenti effettuati da robot virtuali in riferimento ai
campioni classificati non correttamente.
F
B
R
L
Input pattern
Movimento attuato
AVANTI
dietro/ n.c./
DIETRO
n.c.
DESTRA
avanti/avanti/avanti/n.c./dietro/dietro/avanti
SINISTRA avanti/dietro /n.c./avanti/destra/destra/dietro
Nr.errati
2
1
7
7
TOTALE = 17
Tab. 7.7 Tabella riportante il movimento compiuto dal robot simulato nel
corso di risultati con classificazioni errate. La colonna a destra riporta il
numero di stimoli non correttamente elaborati e decodificati tramite il
circuito ibrido.
La tabella 7.7 riporta i movimenti effettuati dal robot a compimento delle prove
con una classificazione. Per quanto riguarda le relazioni possibili non si può
dire molto a riguardo dei pattern avanti e dietro, in quanto il campione dei dati
è troppo esiguo ( due soli eventi per il primo e uno per il secondo ). Al
contrario il pattern sinistra presenta ben sette eventi di classificazione
incorretta. Sembra essere molto azzardato pensare che vi sia una particolare
relazione tra il pattern sinistra ed altri specifici pattern in quanto gli errori
avvenuti si dividono equamente sulle restanti tre classi di movimento possibile
più un evento di non classificazione. Sicuramente molto più interessante è
osservare gli errori avvenuti con la generazione del comando destra. Pare che
vi sia una preferenza a compiere un movimento verso avanti, in quanto in ben
quattro casi su sette si è verificato tale movimento. Osservando la distribuzione
dei campioni si nota una non completa omogeneità degli stessi. Infatti
inizialmente pare vi sia un preponderante occorrere di pattern dietro e avanti,
seguiti da destra e sinistra. In particolare è interessante notare come i primi due
vengono identificati con una buona accuratezza. Il pattern avanti viene ripetuto
124
Capitolo 7
Risultati
e correttamente identificato prima della comparsa della richiesta di pattern
destra. Sembrerebbe quindi che la maggiore comparsa di un movimento in
avanti sia dovuta o ad una perdita di capacità di generalizzazione della rete
biologica o ad una mancata taratura della rete artificiale. Ulteriori
approfondimenti saranno espressi in seguito durante la presentazione delle
conclusioni di questa trattazione.
Precedentemente
(tab.7.4a,b)
sono
state
calcolate
le
percentuali
di
classificazione del circuito con attuatore reale. Di seguito vengono quindi
mostrate quelle dell’esperimento con robot virtuale.
a)
Pattern
AVANTI
DIETRO
DESTRA
SINISTRA
F
B
R
L
% corretto
60
83,3
0
0
% non corretto % non classificato
20
20
16,7
0
85,7
14,3
85,7
14,3
b)
Totale Pattern
% corretto
32
% non corretto % non classificato
56
12
Tab. 7.8 Vengono riportate le percentuali riferite alle prestazioni di
classificazione riscontrate nel corso dell’esperimento. (a) Tali percentuali
sono ripartite tra i quattro differenti pattern. (b) Le percentuali si
riferiscono
alla
prestazione
del
circuito
ibrido
considerando
l’intero
esperimento.
Le percentuali delle prestazioni corrette, ottenute con la rete ITSOM non tarata,
sono molto inferiori a quelle viste precedentemente (tab.7.4a,b). Infatti in
questo caso le classificazioni corrette rappresentano solamente il 32% dei
campioni effettuati, mentre nell’esperimento con rete artificiale tarata tale
percentuale si assestava intorno al 73,9%. Superiore alla metà il numero dei
125
Capitolo 7
Risultati
campioni erroneamente classificati, e quelli che non hanno prodotto alcun
movimento del robot virtuale è il 12%. Il “gap” maggiore si è verificato per le
classificazioni errate, infatti nell’esperimento senza taratura la percentuale è
più di tre volte superiore a quella dell’esperimento con taratura. Osservando le
percentuali riportate in tab. 7.8b si potrebbe essere indotti a pensare le
identificazioni corrette siano casuali, in quanto la percentuale del 32% potrebbe
essere così giustificata. Per validare o meno tale ipotesi si deve osservare la
distribuzione delle tre classificazioni lungo lo spazio dei campioni. Nel caso
tale distribuzione sia omogenea tale ipotesi sarebbe rafforzata. Come fatto per
l’esperimento precedentemente illustrato viene utilizzato l’istogramma delle
classificazioni.
Istogramma delle classificazioni
rete artificiale non tarata
corretto
c
l
a
s
s
i
1
non
classificato
0,5
non
corretto
0
1
3
5
7
9 11 13 15 17 19 21 23 25
campioni
Fig. 7.3 Istogramma delle classificazioni per l’esperimento con rete
artificiale non tarata. Questo grafico risulta essere molto utile per
visualizzare la distribuzione delle classi nel corso dell’ esperimento.
126
Capitolo 7
Risultati
Dall’istogramma si osserva come la distribuzione degli errori di classificazione
non sia omogenea (fig.7.3). Infatti la seconda metà dei campioni ( dal numero
12 al 25 ) è caratterizzata da un’unica classificazione corretta avvenuta per il
campione 17. Tale risultato sembra far cadere l’ipotesi che le identificazioni
corrette siano casuali. Infatti è meno probabile che tali classificazioni
avvengano casualmente con un’elevata percentuale in un set di campioni. In
particolare se ci si riferisce ai campioni che compresi tra il numero 1 e 11 le
classificazioni corrette sono 7, rappresentante il 63,6% dei casi all’interno di
questo gruppo. Tali classificazioni, se osservate molto attentamente, si
scoprono avere molto in comune. Infatti le prime quattro classificazioni
corrette sono tutte legate al pattern dietro. Anche la non classificazione del
campione n.5 è legata a tale pattern. Unico campione, tra i primi sei dell’
esperimento, non legato al segnale di comando per lo spostamento dietro è il
n. 3, e non è stato correttamente identificato. Situazione analoga avviene nel
gruppo di campioni successivo che va dal n. 7 al 11. I tre pattern correttamente
classificati sono tutti avanti. Il pattern n. 7 era un comando per lo spostamento
avanti ma il robot si è mosso all’ indietro ( come abitualmente già aveva fatto
ben quattro volte ). Il pattern errato ( n. 9 ) era destra ed il robot si è mosso
verso avanti.
Il lavoro esposto in questa tesi è la costituzione del circuito ibrido
biologico/elettronico con attuatore robotico reale. La scelta fatta di riportare
anche i risultati con attuatore robotico in simulazione e senza rete artificiale
tarata è stata fatta per far comprendere quale sia stata l’analisi dei risultati
precedentemente svolta e l’evoluzione sperimentale attuata. Come sempre
accade, è buona norma del lavoro sperimentale, avere quello spirito di
osservazione e critica che permette di riconoscere alcune imprecisioni
sperimentali e
correggerle. In questo modo si scoprono accorgimenti che
permettono di ottenere risultati sempre migliori.
I miglioramenti che sono stati ottenuti vengono rappresentati nella seguente
figura.
127
Capitolo 7
Risultati
Confronto delle prestazioni
6
5
corretto
4
3
2
1
0
non
corretto
n
1
F
n
o
n
c
o
re
o
n
c
a
l
cisf
a
non
classifi
cato
to
to
2
3
4
B
5
6
c
o
re
to
7
L
8
9
1
0
R
1
1
Fig. 7.4 Confronto delle prestazioni dei due esperimenti. Sull’asse delle
ascisse
sono
riportati
i
pattern.
Per
ognuno
di
essi
si
consideri:
l’istogramma a sinistra riferito all’esperimento con robot reale e rete
artificiale tarata, l’istogramma a destra riferito all’ esperimento con robot
simulato e rete artificiale non tarata. La legenda colorata definisce le serie
delle classificazioni.
Il confronto visualizzato offre dei risultati molto interessanti (fig.7.4). Entrambi
gli esperimenti riportano gli stessi risultati ( per le classi corretto e non
classificato ) per il pattern avanti. Nell’ esperimento con rete tarata avanti è
stato generato una volta in più, ma tale campione è stato classificato in maniera
errata. Identico numero di classificazioni corrette anche per il pattern dietro.
La differenza sta nel fatto che nell’esperimento più recente la percentuale
128
Capitolo 7
Risultati
riferita a tale direzione è del 100%, mentre è del 83% per quello senza taratura.
Chiaramente distanti sono le prestazioni fornite per i pattern destra e sinistra.
Il miglioramento dei risultati ottenuti, in particolare per questi ultimi due
pattern, è stato ottenuto sicuramente grazie alla corretta taratura della rete
neurale artificiale.
129
Capitolo 8
Conclusioni
Capitolo 8
Conclusioni.
8.1 CONSIDERAZIONI FINALI.
I risultati riportati nel capitolo precedente hanno evidenziato un funzionamento
corretto del circuito ibrido biologico/elettronico pari al 73,9% nell’
esperimento con rete artificiale tarata, e pari al 32% nel caso delle prove
effettuate precedentemente alla taratura. Pensare che tale aumento delle
prestazioni del circuito siano unicamente legate al processo di taratura sarebbe
un superficiale errore di analisi dei risultati. Soffermandoci a guardare i dati
riferiti all’ ultimo esperimento ( con attuatore robotico reale, tab. 7.4 ) si ha
subito la percezione di un esperimento andato a buon fine, con la produzione di
risultati corretti. Se oltre a ciò, si osservano anche quelli che sono i
miglioramenti delle prestazioni ottenute rispetto ad esperimenti precedenti
( con attuatore robotico simulato, tab. 7.8 ) si ottiene un quadro più che
ottimistico riguardanti gli sviluppi futuri di questa tecnologia. In realtà, anche
se i risultati sono stati veramente positivi, nel caso di fenomeni complessi come
la capacità di apprendimento di una rete di neuroni umani, l’utilizzo di reti
artificiali per la decodifica fine e real-time dell’ informazione neurale e la
taratura delle reti artificiali non ci si può semplicemente limitare alla
visualizzazione di dati percentuali. Considerazioni ben più complesse vanno
effettuate per poter meglio chiarire quali sono le reali problematiche ancora
esistenti.
Partiamo ad analizzare la differenza tra le due classificazioni non positive.
Macroscopicamente facilmente distinguibili, in quanto una produce movimento
errato e l’altra non ne produce affatto, la ragione di tali comportamenti risiede
probabilmente in un malfunzionamento della ITSOM, ovvero è la rete
artificiale che non invia alla porta ad infrarossi, il comando di movimento. Si
130
Capitolo 8
Conclusioni
pensa che tale comportamento sia dovuto al fatto che l’elaborazione della rete
abbia prodotto una serie di z-score differenti da quelli posti all’ interno delle
matrici di riferimento costituite durante il training. In questo modo la rete
artificiale lancia di default un segnale elettrico senza stimoli, che corrisponde
ad un non movimento da parte dell’ attuatore robotico. Completamente
differente quanto succede nel caso di una classificazione errata. Infatti in
questo caso la produzione degli z-score ha portato a compimento una serie di
valori comparabili a quelli di riferimento nelle matrici. In questo caso l’errore
può essere stato generato in due maniere differenti, in quanto potrebbe essere
dovuto ad una errata elaborazione della rete di neuroni o ad
un’errata
decodifica da parte della ITSOM. Non si è ancora riusciti con certezza stabilire
a quale delle due possibilità bisogna fare riferimento, certo è che entrambe
sono ugualmente probabili.
La ricerca deve quindi muoversi su due fronti: sia migliorare, più di quanto già
fatto,
il modello di rete neurale per la decodifica, sia
adottare nuovi
accorgimenti sperimentali che ottimizzino la capacità di elaborazione dei
segnali neurali. Si ritiene che il miglioramento delle prestazioni di elaborazione
dei neuroni possano aumentare variando le condizioni sperimentali. Purtroppo
effettuare delle prove con i neuroni è molto complesso in quanto sono una
coltura cellulare molto sensibile alle variazioni esterne quali temperatura,
movimento, illuminazione e terreno di nutritivo.
La delicatezza della coltura determina un altro grosso limite sperimentale che è
quello del basso numero di prove effettuabili sulla stessa coltura in piastra
MEA. Sarebbe scorretto non menzionare l’enormità dei miglioramenti avvenuti
in questo campo grazie agli studi effettuati sulle tipologie di stimolo da fornire
( onda quadra ) e la tecnologia a disposizione ( piastre per colture cellulari con
micro array sul fondo ).
Resta il fatto che spesso si è limitati nel compiere studi statistici sui risultati
ottenuti per via dell’ esiguità del numero di dati a disposizione. A tal proposito
si ricorda l’impossibilità riscontrata nello studio di relazioni possibili tra
131
Capitolo 8
Conclusioni
stimolo e movimento nei casi di classificazione errata (tab 7.3). I risultati
offerti nell’ esperimento più recente non hanno permesso di trarre alcuna
conclusione a tal riguardo, in quanto gli errori commessi erano distribuiti in
maniera abbastanza omogenea tra i vari pattern in input, con una delineata
variabilità dei movimenti errati ( se pur con una lieve preponderanza di
movimenti verso destra, tab 7.3 ). Questa situazione rappresenta un’elemento
positivo ai fini dell’ esperimento, in quanto si è ottenuto un numero di casi
errati molto basso. Situazione differente è quella riscontrata nell’ esperimento
meno recente. In questo caso il numero di campioni legati ad una errata
attuazione robotica è maggiore e rappresenta il 68% dei dati offerti dalla prova
(tab.7.8b). Sulle possibili cause di errore e relazioni tra input e output per i
campioni non positivi sono state varate più ipotesi riguardanti la distribuzione
dei pattern in entrata e la metodologia di training che verranno largamente
discusse più in questo capitolo.
Tornando a fare riferimento ai risultati offerti dall’esperimento con attuatore
reale si è osservato, tramite l’istogramma delle classificazioni, che il 75% delle
classificazioni con movimento nella direzione errata erano poste nella parte
conclusiva dell’esperimento ( campioni dal 20 al 23, fig.7.1 ). Si giustifica
questo comportamento con la perdita di capacità funzionali da parte della rete
di neuroni umani. Si è infatti già constatata, tramite prove precedenti, la
difficoltà nell’ attuare più di una 20/25 registrazioni causa danneggiamenti alla
rete biologica dovuti agli stimoli esterni.
In questa frazione di campioni le prestazioni del sistema si abbassano fino al
25%. Questa percentuale è interamente costituita da una sola corretta
classificazione avvenuta per il campione 22 (tab.7.1). Tale classificazione è
caratterizzata da elevata probabilità di casualità, in quanto cade in uno spazio
dei campioni dove le prestazioni del sistema sono molto basse. Se si suppone
che una direzione possa essere effettuata casualmente con il
20% di
probabilità, ci si rende conto che nei quattro campioni ( dal 20 al 23 ) è lecito
aspettarsi che almeno uno sia corretto. Fatta tale supposizione la percentuale
132
Capitolo 8
Conclusioni
della prestazione del sistema non deve tenere conto della classificazione n. 22,
abbassando le prestazioni totali ottenute dal 73,9% al 69,5%.
Altro tipo di considerazioni possono essere fatte riguardanti la non
classificazione del campione 2 (fig.7.1). Se nella fase finale le cellule risultano
essere sofferenti, nella prima fase sembrano patire il passaggio dalla fase di
training a quella di testing. Si suppone che appena terminata la fase di training
la rete biologica abbia appreso a riconoscere i diversi pattern, ma presenti delle
difficoltà nel riconoscere serie variate degli stessi. Per comprendere ciò di cui
si sta parlando bisogna fare riferimento alla strutturazione del training ( vedi il
protocollo sperimentale, cap. 6 ). Tale processo viene svolto immediatamente
prima della fase di testing. Alla rete biologica vengono inviati 40 stimoli divisi
in quattro serie differenti ( una per ogni pattern ). Nel corso del training i
neuroni imparano ad elaborare in maniera differenziata e costante i diversi
pattern. Come avviene per le reti neurali artificiali, quando si attua un processo
di training troppo marcato, la rete impara a riconoscere perfettamente gli
esempi dati in training, ma perde la capacità di generalizzazione, che consente
di riconoscere i dati appartenenti a classi differenti. Essendo che i pattern in
training sono stati forniti rispettando il seguente ordine : 10 stimoli (R), 10
stimoli (L), 10 stimoli (F), 10 stimoli (B), Può essere che al momento dell’
entrata in fase di testing la rete di neuroni umani sia meglio allenata per gli
ultimi pattern del training ( F, B ) e abbia meno capacità di generalizzazione e
quindi di riconoscimento per pattern R e L . A conferma di questa ipotesi si
vede come il pattern del campione 2 (tab.7.1), in input è stato inviato L ma il
movimento è stato B, proprio come nel caso del campione precedente e come
gli ultimi pattern del training appena effettuato. Ulteriore conferme giungono
dall’ esperimento con attuatore simulato. Prendendo atto che il training è stato
eseguito in maniera identica a quella dell’ altro esperimento, si nota come le
classificazioni corrette siano relative ai pattern F e B soprattutto se effettuate
nella prima metà campioni. Gli unici movimenti corretti identificati in tutto
l’esperimento sono avanti e dietro, ed in 7 casi su 8 avvengono entro
l’undicesimo campione (tab.7.1). All’interno di questa frazione dei campioni
133
Capitolo 8
Conclusioni
non mancano le classificazioni errate, anch’esse però caratterizzate sempre da
movimenti del robot verso avanti o verso indietro.
Come già detto, le prestazioni dell’ esperimento off-line ( senza robot ), sono
state quantificate al 32% (tab.7.8b). Si può essere indotti a ipotizzare che tali
caratterizzazioni siano casuali. In considerazione del fatto che la casualità di un
evento tende a disporsi uniformemente all’ interno dello spazio degli eventi, si
è verificato come le classificazioni corrette siano concentrate al 84,5% entro
una porzione dello spazio degli eventi pari al 44%. Questo dato fa cadere
l’ipotesi di casualità delle identificazioni corrette effettuate.
Tale distribuzione è già stata in parte chiarita precedentemente spiegando le
complicazioni della rete biologica ad identificare una successione troppo lunga
di stimolazioni ed a identificare i primi campioni del testing. A tal proposito si
sono osservate le conferme derivanti da ambi gli esperimenti considerati.
Bisogna però ammettere che la marcata assenza di classificazioni corrette nella
seconda parte dell’esperimento off-line, esula da tale chiarimento. Altre
devono essere le cause che portano ad un simile tracollo delle prestazioni per
un numero così elevato di campioni ( dal 12 al 25, tab. 7.8 ). Si sottolinea il
fatto che tale tracollo non viene osservato nell’esperimento on-line ( con robot
reale ). Osservando attentamente la distribuzione dei campioni nell’
esperimento off-line si vede che, al contrario dell’ esperimento on-line, i
quattro pattern in input non sono ben alternati. Infatti guardando i campioni di
tale esperimento (tab.7.5) è quasi possibile distinguere ad occhio quattro zone
d’input : dietro ( dal 1 al 6 ), avanti ( dal 7 al 11 ), sinistra ( dal 12 al 18 ),
destra ( dal 20 al 25). Il fatto che i pattern in entrata al circuito non siano stati
omogeneamente disposti per tutta la durata dell’ esperimento ha portato la
rete biologica a non funzionare correttamente. Tanto più che come pattern di
testing iniziali sono stati forniti gli ultimi due pattern del training. In questo
modo la rete biologica ha imparato a riconoscere solo quest’ultimi, non
sapendo elaborare il segnale corrispondente a destra e sinistra forniti nella
seconda parte dei campioni di testing.
134
Capitolo 8
Conclusioni
Questa considerazione ha fatto sì che lo stesso errore non venisse ripetuto
nell’ esperimento successivo on-line, ottenendo risultati chiaramente migliori.
Riassumendo per punti si ha che :
•
La capacità di apprendimento di una rete di neuroni umani,
correttamente allenata, è stata verificata fornendo buone funzionalità
per elaborazione di segnali elettrici generati artificialmente.
•
L’applicazione della rete artificiale neurale ( architettura ITSOM ) ha
permesso di arrivare alla creazione di un sistema in grado di utilizzare il
segnale in uscita da una piastra di neuroni umani.
•
Un training troppo insistito aumenta la specificità per l’elaborazione di
pattern ma ne fa perdere la capacità di generalizzazione della rete di
neuroni umani.
•
La rete biologica mostra perdita di capacità di elaborazione dopo venti
impulsi di testing.
•
Una distribuzione omogenea dei pattern in input lungo lo spazio dei
campioni al circuito è un fattore determinate per la buona riuscita
dell’esperimento
•
La percentuale di corretta classificazione dell’esperimento on-line si è
dimostrata leggermente più bassa ( pari a 69,5% ) di quanto non fosse
stato inizialmente stimato ( 73,4% ).
•
La
particolare
disomogeneità
delle
classificazione
corrette
nell’esperimento off-line nega l’ipotesi che tali classificazioni siano
avvenute casualmente.
•
La non classificazione di pattern indica un problema nel funzionamento
della rete artificiale ITSOM, causato da un fallito tentavo di paragone
degli z-score ottenuti con quelli di riferimento.
135
Capitolo 8
Conclusioni
Al termine del capitolo precedente vengono graficamente mostrate (fig. 7.3) le
prestazioni ottenute dai due differenti esperimenti. È interessante notare come
dopo un primo impatto dove si vedono identiche quantità di classificazioni per
due pattern ( avanti, dietro), si vedono differenze nelle prestazioni per i restanti
pattern. Dopo aver accuratamente approfondito in questo capitolo risulta
chiaro come anche se tali classificazioni sono identiche nel numero sono molto
differenti nella motivazione. Nel caso dell’ esperimento on-line si è utilizzata
una rete artificiale tarata offrendo risultati corretti e non affetti dall’errore
sperimentale di una distribuzione di pattern input non uniforme. D’altra parte,
l’esperimento senza taratura della rete, avrebbe probabilmente mostrato
risultati ancora peggiori ( anche per i pattern avanti, dietro ) se non si avesse
involontariamente utilizzato a proprio favore l’errore sperimentale di una
distribuzione di pattern non omogenea, con un buon riconoscimento degli
ultimi pattern utilizzati per il training.
9.2 SVILUPPI FUTURI.
Gli esperimenti presentati in questa trattazione hanno evidenziato come la
strada da percorrere sia giusta. L’utilizzo di reti neurali artificiali sembra aver
fornito risultati che con le metodologie classiche di analisi degli spike e burst
non sono mai state raggiunte. La capacità di apprendimento della rete di
neuroni umani diventa si conferma di esperimento in esperimento. Sicuramente
molte sono le variabili sconosciute che entrano in gioco nel campo della
neuroscienza, soprattutto nell’area che cerca applicazioni tecnico-scientifiche
del materiale neurologico. Gli sviluppi necessari per la comprensione e
creazione di nuova tecnologia basata su sistemi ibridi biologici/elettronici
devono essere parallelamente svolti su due fronti differenti. Il primo è la
ricerca di nuove proprietà del materiale nervoso che ne permettano un utilizzo
mirato e una maggior maneggevolezza dello stesso. Infatti la delicatezza del
materiale nervoso continua ad essere uno dei limiti più forti nel campo delle
136
Capitolo 8
Conclusioni
neurotecnologie, impedendo lunghi campionamenti e pratici usi in laboratorio.
Il secondo è il continuo studio per migliorare o progettare nuove architetture di
reti artificiali neurali. In questi esperimenti si è visto come esse non abbiano
svelato come decodificare l’informazione neurale, ma abbiano mostrato che i
segnali elettrici dei neuroni possono essere comunque utilizzati per sviluppare
delle tecnologie, superando i limiti imposti dalla classica costruzione di
modelli matematici troppo semplificati e non adatti per descrivere questo
sistema biologico.
137
Appendice
DSP_system
Appendice
DSP_system.
SOFTWARE PER L’ANALISI DEI SEGNALI.
L’obiettivo principale delle attività svolte durante il periodo di tesi è stato lo
sviluppo del circuito biologico/elettronico e l’analisi dei risultati ottenuti con
ulteriore riferimento ad esperimenti precedenti. Oltre a ciò, nell’ambito di
collaborazione interna al gruppo LNL, si è partecipato ad attività di laboratorio
riguardanti differenti progetti di ricerca. Senza voler entrare nel merito di
questi, si ritiene doveroso dare quantomeno una breve descrizione di tali
collaborazioni. In particolare ci si è impegnati allo sviluppo di un software per
l’analisi dei segnali generati da neuroni umani e raccolte tramite le piastre
MEA. Il software sviluppato è stato chiamato Digital Signaling Processing
system ( DSP_system ).
Architettura del sistema
Viene di seguito riportato un diagramma (fig. a) che mostra schematicamente
l’organizzazione del sistema sviluppato, esso è interfacciato graficamente per
renderlo più gradevole e funzionale all’utente. Il software per poter funzionare
necessità dell’istallazione di Matlab su PC e funziona come se fosse un
Toolbox di questo programma. Quindi è sufficiente copiare il sistema nella
cartella lavoro e lanciare il file “start.m” per fare comparire il primo menu a
scelta multipla:
138
Appendice
Fig.a
DSP_system
Menù principale del DSP_system. In questo menù sono riportati i
cinque tasti ad esso riferiti.
Da questo menù principale (fig.a) si passa dopo avere caricato il file ad altri
sottomenù. Selezionando “CARICA IL FILE” compare nella finestra di lavoro di
Matlab un elenco dei file che possiamo analizzare che sono stati salvati in
precedenza nell’apposita cartella (“CARTELLA_SEGNALI”). Per facilitare la
scelta è sufficiente digitare il numero corrispondente al file che intendiamo
analizzare e immediatamente ci vengono forniti dei grafici relativi al segnale.
A seguito di questa selezione vengono visualizzati due grafici: il primo mostra
separatamente l’andamento degli otto canali in uscita dalla rete di neuroni
coltivata sui MEA (fig.b), il secondo li sovrappone mettendo in evidenza come
varia il loro andamento (fig.c). Di seguito riportiamo un esempio che mostra
l’andamento dei segnali quando alla piastra inviamo il “pattern F” denominato
“avanti”.
Come si osserva dall’immagine ogni canale è indicato con un colore diverso e
nella legenda abbiamo l’indicazione di quale canale stiamo registrando. I
grafici in ascissa riportano il tempo espresso in secondi di registrazione e in
ordinata il potenziale espresso in mV.
139
Appendice
DSP_system
b)
Plot dei segnali uscenti dai MEA(mV/s)
5
1 Channel
0
-5
40
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
2 Channel
2
0
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
3 Channel
-5
00
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
4 Channel
-5
50
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
-5
50
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
6 Channel
0
-5
50
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
7 Channel
0
-5
0
0.5
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
8 Channel
0
-0.5
1
5 Channel
0
0
0.1
0.2
0.3
0.4
0.5
Time(s)
0.6
0.7
0.8
0.9
1
c)
3
2
1
0
)
V
m
(l
ai
t
n
et
o
P
-1
-2
-3
-4
-5
0
0.1
0.2
0.3
0.4
0.5
Time(s)
0.6
0.7
0.8
0.9
1
Fig. b,c Andamento degli otto segnali registrati. b)visione dell’andamento
di ogni singolo canale lungo il tempo. c) visione d’insieme dell’andamento
dei segnali registrati.
140
Appendice
DSP_system
La prima azione che possiamo selezionare dal menù principale è
“VISUALIZZZAZIONE PARZIALE”, questa ci consente di spezzare il segnale
degli otto canali in finestre temporali dalle dimensioni desiderate in modo da
poter effettuare una prima analisi incrociata sui diversi canali nel procedere
della registrazione identificando eventuali variazioni.
Una volta osservato l’intero segnale possiamo procedere in due direzioni:
analizzare le proprietà di un singolo canale oppure comparare i segnali in uscita
dei diversi canali. Nel primo caso si sceglie dal menù principale “ANALISI
SINGOLO CANALE” e si apre così un sottomenù (fig.d), che riporta le principali
analisi che possiamo eseguire sul singolo canale.
Fig. d Sottomenù a 6 tasti ottenuto selezionando “analisi di un singolo
canale” dal menù principale di fig.a
Cliccando “SELEZIONA CANALE” dal menù a scelta multipla (fig.d) viene
fornito il numero di canali su cui è possibile effettuare l’analisi. In un secondo
tempo viene richiesto su quale canale si vogliono effettuare le analisi elencate
nel menù. A questo punto è possibile procedere effettuando l’analisi su tutta la
registrazione del canale oppure andare a selezionare una frazione di tempo
( per esempio i primi 400ms). Per fare questo è sufficiente selezionare
141
Appendice
DSP_system
l’opzione “SELEZIONA INTERVALLO” (fig.d) e nella finestra di lavoro di
Matlab verranno richiesti gli estremi dell’intervallo che intendiamo analizzare.
Una volta fornito gli estremi, viene visualizzato in dettaglio la frazione del
segnale che intendiamo analizzare.
Per esempio se selezioniamo il primo canale e l’intervallo 0-400ms otteniamo
il grafico (fig.e) riportato nella figura seguente.
Plot del segnale
2.5
Segnale
2
1.5
l
ai
t
n
et
o
P
1
0.5
0
0
0.05
0.1
0.15
0.2
Time(s)
0.25
0.3
0.35
0.4
Fig.e Andamento di un singolo canale nel corso della finestra temporale 0400 ms.
Una volta selezionato il canale e la frazione di tempo che vogliamo analizzare
possiamo procedere con l’analisi vera e propria delle proprietà statistiche del
segnale.
Pertanto si sceglie dal menù principale “ANALISI COMPARATIVE” (fig.f) e si
apre un secondo sottomenù, che riporta le principali analisi che possiamo
eseguire comparando i segnali provenienti da due canali.
142
Appendice
DSP_system
Fig. f Menù a 5 tasti per lo svolgimento di analisi statistiche.
Selezionando “SELEZIONA CANALI” dal menù a scelta multipla (fig.f) viene
fornito il numero di canali su cui è possibile effettuare l’analisi e viene chiesto
nella finestra di lavoro di Matlab di indicare i due canali che s’intendono
comparare con le analisi sotto riportate. A questo punto come nel caso
precedente è possibile procedere effettuando l’analisi su tutta la registrazione
del canale oppure selezionando una frazione di tempo ben definita. Per fare
questo è sufficiente selezionare l’opzione “SELEZIONA INTERVALLO” e
inserire gli estremi dell’intervallo che intendiamo analizzare, in questo modo
viene visualizzata la medesima pozione di segnale per entrambi i canali.
Per esempio se selezioniamo il primo e secondo canale e l’intervallo 0-400ms
otteniamo il grafico riportato (fig.g).
143
Appendice
DSP_system
2.5
Primo canale selezionato
2
1.5
l
ai
t
n
et
o
P
1
0.5
0
-0.5
0
0.1
0.2
0.3
0.4
0.5
Time(s)
0.6
0.7
0.8
0.9
1
3.5
Secondo canale selezionato
3
2.5
l
ai
t
n
et
o
P
2
1.5
1
0.5
0
0
0.1
0.2
0.3
0.4
0.5
Time(s)
0.6
0.7
0.8
0.9
1
Fig.g Andamento dei segnali per i due canali selezionati all’ interno dell’
intervallo desiderato (0-400 ms).
Una volta selezionato il canale e la frazione di tempo che vogliamo analizzare
possiamo procedere con l’analisi indicate nel sottomenù (fig.f) che sono
“coerenza” e “cross-correlazione”.
Le analisi statistiche che possiamo effettuare sui singoli segnali (fig.d) sono le
seguenti:
1)
Selezionando dal sottomenù l’opzione “AUTOCORRELAZIONE” si
ottengono a confronto il plot del segnale che stiamo analizzando e
l’autocorrelazione del segnale stesso. Di seguito sono riportati i grafici
relativi all’autocorrelazione del segnale preso di riferimento. Le unità di
144
Appendice
DSP_system
misura sono il tempo di ritardo in funzione del coefficiente di
correlazione.
2.5
Waveform
2
)
V
m
(
e
d
ut
i
pl
m
A
1.5
1
0.5
0
0
0.05
0.1
0.15
0.2
Time (s)
0.25
0.3
0.35
0.4
1.2
Autocorrelation
1
0.8
.f
f
e
o
c
n
oi
t
al
er
r
o
C
0.6
0.4
0.2
0
-0.2
-0.4
0
500
1000
1500
2000
2500
Delay
fig.h Autocorrelazione del segnale.
2)
Il secondo tasto (“PERIODOGRAMMA“) permette il calcolo del
periodogramma nell’intervallo selezionato, questo è una stima della
densità spettrale. Di seguito è riportato un esempio di periodogramma
ottenuto con il DSP system (fig.i).
Raw Periodogram
30
20
10
)
el
p
m
a
s/
d
ar
/
B
d(
yt
i
s
n
e
D
l
ar
t
c
e
p
S
r
e
w
o
P
0
-10
-20
-30
-40
-50
0
0.05
0.1
0.15
0.2
0.25
0.3
Normalized Frequency (×π rad/sample)
0.35
0.4
0.45
0.5
fig.i Periodogramma del segnale registrato.
145
Appendice
3)
DSP_system
Il terzo tasto permette di eseguire la trasformata di Fourier
(“TRASFORMATA DI FOURIER”) del segnale fornendoci un indicazione
delle frequenze contenute all’interno del segnale (fig.l).
FFT SEGNALE
0.12
0.1
0.08
e
d
ut
i
pl
m
A
0.06
0.04
0.02
0
0
500
1000
1500
2000
2500
Frequency [Hz]
3000
3500
4000
4500
5000
fig.l Trasformata di Fourier del segnale.
Le analisi possibili per confrontare i due segnali ( fig.f ) sono le seguenti:
1)
Selezionando dal sottomenù l’opzione “COERENZA” si ottiene il confronto
delle frequenze dei due segnali che stiamo analizzando. Di seguito è
riportato come esempio il grafico relativo alla coerenza (fig.m). Come si
osserva in ascissa sono riportate le frequenze mentre in ordinata il
coefficiente di correlazione che assume valori compresi tra 0 e 1.
146
Appendice
DSP_system
Coerenza tra segnali Vaschetta A e Vascheta B
1
0.9
0.8
0.7
0.6
ff
e
o
C
n
oi
t
al
er
r
o
C
0.5
0.4
0.3
0.2
0.1
0
0
0.05
0.1
0.15
0.2
0.25
Frequency
0.3
0.35
0.4
0.45
0.5
Fig.m Coerenza dei segnali analizzati.
La seconda analisi che possiamo eseguire sui due segnali è la crosscorrelazione (selezionando “CROSS-CORRELAZIONE”) di cui di seguito
riportiamo un grafico da esempio (fig.n).
Cross-Correlazione dei segnali selezionati
0.9
0.8
0.7
0.6
0.5
.
ff
e
o
C
n
oi
t
al
er
r
o
C
0.4
0.3
0.2
0.1
0
-0.1
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
Sample
fig.n Cross-correlazione dei segnali.
147
Bibliografia
Bibliografia.
Adrian, E.D., 1928. The basis of sensation: The action of the sense organs.
New York: W. W. Norton & Company.
Adrian, E.D., 1932. The Mechanism of Nervous Action: Electrical Studies
of the Neurone. Philadelphia: Univ. Pennsylvania Press.
Albert, B.,
Bray, D.,
Lewis, J., Raff, M., Roberts, K., Watson, J.D.,
1994. Molcular Biology of the Cell, 3rd ed. New York: Garland.
Akin, T., Najafi, K., Smoke, R.H. and Bradley, R.M., 1994. A
micromachined silicon electrode for nerve regeneration applications.
IEEE Trans Biomed Eng 41, 305-313 .
Bels, B. and Fromherz, P., 2002. Transistor array with an organotypic brain
slice: field potential records and synaptic currents. European Journal of
Neuroscience 15, 999-1005.
Bonifazi,
P. and Fromherz, P., 2002. Silicon Chip for Electronic
communication between nerve cells by non-invasive interfacing and
analog-digital processing. Advanced Material 17.
Borkholder, D.A., Bao, J, Maluf, N.I., Perl, E.R. and Kovacs, G.T., 1997.
Microelectrode arrays for stimulation of neural slice preparations.
J. Neuroscience Methods 7, 61- 66.
148
Bibliografia
Bove, M., Martinoia, S., Grattarola, M., Ricci, D., 1996. The neurontransistor junction: Linking equivalent electric circuit models to
microscopic descriptions. Thin Solid Films 285, 772-775.
Braun, D., and Fromherz, P., 2001. Fast Voltage Transients in Capacitive
Silicon-to-Cell Stimulation Detected with a Luminescent Molecular
Electronic Probe. Physical Review Letters 13, 86, 2905-2908.
Breckenridge, L.J., Wilson, R.J.A., Connolly, P., Curtis, A.S.G., Dow,
J.A.T., Blackshaw, S.E. and Wilkinson, C.D.W., 1995. Advantages of
using microfabricated extracellular electrodes for in vitro neuronal
recording. J Neuroscience Research 42, 266- 276.
Brown, E.N., Kass, R.E., Mitra, P.P., 2004. Multiple neural spike train
data
analysis :
state-of-the-art
and
future
challenges.
Nature
Neuroscience 7, 456-461.
Canepari, M, Bove, M., Mueda, E., Cappello, M., Kawana, A., 1997.
Experimental analysis of neural dynamics in cultured cortical networks
and transitions between different patterns of activity. Biological
Cybernetics 77, 153-162.
Catterall, W.A., 1988. Structure and function of voltage-sensitivr ion
channels. Science 242, 30-61.
Chiappalone, M., Novellino, A., Vato, A., Martinoia, S., Vajda, I., van
Pelt, J., 2004. Analysis of the bursting behavior in developing neural
networks. 2nd Symposium IMEKO, IEEE, SICE. Genova (Italy), June
14-16.
149
Bibliografia
Clark, K.L., Cowell, D.F., 1976. Programs, Machines, and Computation.
McGraw-Hill, New York.
Ditto, S.S.W., 1998. Dynamics based computation, Phys. Rev. Lett. 5,
2156–2159.
Egert, U., Schlosshauer, B., Fennrich, S., Nisch, W., Fejtl, M., Knott, T.,
Müller, T., Hammerle, H., 1988. A novel organotypic long-term culture
of the rat hippocampus on substrate-integrated microelectrode arrays.
Brain Resource Protoc 2 , 229-242.
Ermentrout, B., 1992. Complex Dinamics in WTA Neural Networks with
slow inhibition. Neural Networks 5, 403-409.
Fromherz, P., Muller, C.O., Weis, R., 1993. Neuron-Transistor: electrical
transfer function measured by the Patch-Clamp technique. Phys. Rev.
Lett. 71, 4079-4082.
Fromherz, P., Schaden, H., 1994. Defined neuronal arborisations by guided
outgrowth of leech neurons in culture. Eur J. Neuroscience 6 .
Fromherz, P., 2002. Electrical Interfacing of Nerve Cells and
Semiconductor Chips. Chemphyschem 3, 276-284.
Fromherz, P., 2003. Neuroelectronic Interfacing: Semiconductor Chips
with Ion Channels, Nerve Cells, and Brain. Editor R. Waser, WileyVCH Verlag: Berlin.
Galli, R., Gritti, A., Bonfanti, L., Vescovi, A.L., 2003. Neural stem cells:
an overview. Circ Res. Apr 4; 92(6):598-608. Review.
150
Bibliografia
Garcia, P.S.,
Calabrese, R.L.,
DeWeerth, S.P.,
Ditto, S.S.W., 2003.
Simple Arithmetic with Firing Rate Encoding in Leech Neurons:
Simulation and Experiment. Proceedings of the XXVI Australasian
computer science conference 16, Adelaide, 55 – 60.
Gritti A., Galli R., Vescovi A.L., 2001. Culture of stem cell of central
nervous system, Federoff ed., Humana Press III edition, 173-197.
Hebb, D., 1949. The Organization of behaviour. John Wiley.
Hertz, J., Krogh, A., Palmer, R., 1991. Introduction to the Theory of
Neural Computation. Perseus Books, Cambridge (MA).
Hodgkin, A.L., Huxley. A.F., 1939. Action potentials recorded from
inside a nerve fiber. Nature 144, 710-711.
Hodgkin, A.L., Huxley. A.F., 1952. A quantitative description of
membrane current and its applications to conduction and excitation in
nerve. J. Physiol (Lond) 117, 500-544.
Jenkner, M., Fromherz, P., 1997. Bistability of membrane conductance in
cell adhesion observed in a neuron transistor. Phys Rev Lett 79, 47054708.
Jenkner, M., Muller, B., Fromherz, P., 2001. Interfacing a silicon chip to
pairs of snail neurons connected by electrical synapses. Biological
Cybernetics 84, 239- 249.
Jimbo, Y., Kawana, A., 1992. Electrical stimulation and recording from
cultured neurons using a planar array. Bioelectrochem. Bioeng. 40,
193-204.
151
Bibliografia
Jimbo, Y., Robinson, H.P.C., 2000. Propagation of spontaneous
synchronized activity in cortical slice cultures recorded by planar
electrode arrays. Bioelectrochemistry 5, 107-115.
Kohonen, T., 1982. Self-organized formation of topologically correct
feature maps. Biological Cybernetics 43, 59-69.
Kohonen, T., 1990. The Self-Organizing Map. Proceedings of the IEEE 78,
1464-1480.
Kohonen, T., 1991. Self-organizing maps: optimization approaches. In
Kohonen, T., Mäkisara, K., Simula, O., and Kangas, J., editors,
Artificial Neural Networks. Proceedings of ICANN'91, International
Conference on Artificial Neural Networks, volume II, pages 981-990,
North-Holland, Amsterdam.
Kohonen, T., 1993. Physiological interpretation of the self-organizing map
algorithm. Neural Networks 6, 895-905.
Kohonen, T., 1995a. The adaptive-subspace SOM (ASSOM) and its use for
the implementation of invariant feature detection. In Fogelman-Soulié,
F. and Gallinari, P., editors, Proceedings of ICANN'95, International
Conference on Artificial Neural Networks, volume 1, pages 3-10. EC2
& Cie, Paris.
Kohonen, T., 1995b. Emergence of invariant-feature detectors in selforganization. In Palaniswami, M., Attikiouzel, Y., Marks II, R. J.,
Fogel, D., and Fukuda, T., editors, Computational intelligence. A
dynamic system perspective, pages 17-31. IEEE Press, New York, NY.
152
Bibliografia
Kohonen, T., 1995c. Self-Organizing Maps. Springer, Berlin.
Kohonen, T., 1996. Emergence of invariant-feature detectors in the
adaptive-subspace self-organizing map. Biological Cybernetics 75, 281291.
Maher, M.P., Pine, J., Wright, J., Tai, Y.C., 1999. The neurochip: a new
multielectrode device for stimulating and recording from cultured
neurons. Neuroscience Methods 87, 45-56.
Mallat, S.G., 1989. A theory for multiresolution signal decomposition: the
wavelet representation, IEEE Trans. Pattern Anal. Mach. Intell. 11,
674–693.
Martinez Martinez, P.F.A. 1982. Neuroanatomy: Development and
Structure of the Central Nervous System. Philadelphia: Saunders.
Newell, A., Simon, H.A., 1976. Computer Science as Empirical Inquiry:
Symbols and Search, in Mind Design II, John Haugeland.
Nicholls, J.G., Martin, A.R., Wallace, B.G. 1992. From Neuron to Brain:
A Cellular and Molecular Approach to the Function of the Nervous
System, 3rd ed. Saunderland, M.A.: Sinauer.
Parisi, G., 1986. A memory that forgets. J. Phys. A 19, L617-L620.
Perkel, D.H., Gerstein, G.L., Moore, G.P., 1967. Neuronal Spike train and
stochastic point processes. J. Biophys. 7, 391–418.
Pineda, F.J., 1988. Dynamics and Architectures for Neural Computation,
Journal of Complexity 4, 216-245.
Pitt, W., Mc Culloch, W., 1943. A logical calculus of the ideas immanent
in nervous activity. Bulletin of Mathematical Biophysics 5, 115-133.
153
Bibliografia
Pizzi, R., Sicurello, F., Varini, G., 1998. Development of an inductive
self-organizing network for real-time segmentation of diagnostic image.
3rd International Conference of Neural Networks and Expert Systems
in Medicine and Healthcare , 44-50, Pisa, 2-4 Settembre, Ifeachor ed.
Pizzi, R., de Curtis, M., Dickson, C., 2003a. The Binding Problem:
Evidence of Chaotic Attractors in Cortical Fast Oscillations Tested by
an Artificial Neural Network. Advances in Soft Computing, J.
Kacprzyk ed., Physica Springer Verlag.
Pizzi, R., Fantasia, A.,
Gelain, F., Rossetti, D., Vescovi, A., 2003b.
Looking for a quantum processes in networks of human neurons on
PCB. Proc. Quantum Mind, Tucson 11-14 aprile.
Potter, S.M., 2001. Distributed processing in cultured neuronal networks.
In: Nicolelis (Ed.), Progress in Brain Research, M.A.L. Elsevier
Science B.V .
Reger, B., Fleming, K.M., Sanguineti, V., Alford, S., Mussa- Ivaldi,
F.A., 2000. Connecting Brains to Robots: An Artificial Body for
Studying the Computational Properties of Neural Tissues. Artificial
Life 6, 307-324.
Rumelhart, D.E., McClelland, J.L., 1986. Parallel distributed processing. 2
volumi. Cambridge: The MIT Press.
Sanger, T.D.,
2002. Decoding Neural Spike Trains: Calculating the
Probability That a Spike Train and a External Signal Are Related. J.
Neurophysiol. 87, 1659-1663.
154
Bibliografia
Schatzthauer,
R.,
Fromherz, P., 1998. Neuron-silicon junction with
voltage gated ionic currents. European Journal of Neuroscience 10,
1956-1962.
School, M., Sprössler, C., Denyer, M., Krause, M., Nakajima, K.,
Maelicke, A., Knoll, W., Offenhäusser, G., 2000. Ordered networks of
rat hippocampal neurons attached to silicon oxide surfaces.
Neuroscience Methods 104, 65-75.
Schwartz, J.T., 1989. The New Connectionism: Developing Relationships
Between Neuro-science and Artificial Intelligence. S. R. Graubard, ed.,
The Artificial Intelligence Debate: False Starts, Real Foundations
(Cambridge, MA: MIT Press).
Von der Malsburg, C., 1973. Self-organisation of orientation sensitive cells
in the striate cortex. Kybernetik 14, 85 -100.
Weis, R., Müller, B., Fromherz, P., 1996. Neuron Adhesion on Silicon
Chip probed by an Array of Field-Effect Transistors. Phys.Rev.Lett. 76,
327-330.
Willshaw, D. J., Von der Malsburg, C.,
1976. How patterned neural
connections can be set up by self-organization, Proc. R. Soc. B194,
431-445.
Wilson, R.J., Breckenridge, L., Blackshaw, S.E., Connolly, P., Dow,
J.A.T., Curtis, A.S.G., and Wilkinson, C.D.W., 1994. Simultaneous
multisite recordings and stimulation of single isolated leech neurons
using planar extracellular electrode arrays. Neuroscience Methods 53,
101-110.
155
Bibliografia
Zeck, G., Fromherz, P., 2001. Noninvasive neuroelectronic interfacing
with synaptically connected snail neurons on a semiconductor chip.
Proceedings of the National Academy of Sciences 98, 10457-10462.
156