I nostri esperim..

annuncio pubblicitario

L’esperimento robotico:apprendimento
Capitolo 6
Capitolo 6:
L’esperimento robotico:
apprendimento
6.1 Il materiale biologico e la preparazione dei MEA
Il materiale biologico usato per il nostro esperimento di robotica su MEAs ha visto
protagoniste le cellule staminali neurali umane. Come già accennato le cellule staminali si
prestano perfettamente a questo tipo di esperimento, in quanto mostrano un alta capacità di
adattamento e quindi sono capaci di differenziare e maturare sui MEAs. Inoltre, sono perfette
da utilizzare in quanto avendo la capacità di proliferare esponenzialmente, non richiedono
dissezioni multiple. Le staminali in forma di neurosfere, cresciute in 3D in FGF2+EGF sono
state dissociate meccanicamente per essere piastrate in 2D su matrigel (composto
essenzialmente da laminina, collagene IV, proteoglicani, entactina and nidogeno) su MEAs
dopo 24 ore, come singole cellule.
I MEAs, prima di essere utilizzati, dato che vengono assemblati utilizzando silicone, che è
neurotossico, devono essere lavati accuratamente seguendo un preciso protocollo di seguito
mostrato dopo l’immagine del MEA utilizzato:
Figura 1 La piastra (MEA) dove giacciono le cellule
Protocollo lavaggio




lavare in alcool 70% la piastra servendosi di un bastoncino di cotone
lasciare la piastra per 6 ore sotto l’acqua corrente, possibilmente distillata
lasciare la piastra per 6 ore in alcool 70%
lavare con 4 brevi risciacqui la piastra con detergente non saponato e acido
105
Capitolo 6




L’esperimento robotico:apprendimento
sciacquare con alcool 70%
lavare con acqua distillata
lasciare in acqua distillata sotto raggi UV “overnight”
aspirare l’acqua e lasciare asciugare sotto cappa sterile
Una volta terminato il processo di lavaggio, è possibile fare aderire il matrigel che dovrà
gelificare sul MEA.
Questo passaggio, ha comportato non pochi problemi. Normalmente il matrigel, che è una
molecola di adesione ricavata dal sarcoma di verme, e che si trova allo stato liquido a 4 gradi,
gelifica a 37 gradi su plastica o su vetro in soli 20 minuti. Per i nostri MEAs, abbiamo avuto
dei problemi, in quanto il matrigel, gelificava dopo 20 minuti, ma si staccava dal MEA dopo
2-3 giorni, causando ovviamente la morte delle cellule adese.
Figura 2: distaccamento del matrigel
Dopo non pochi tentativi, si è deciso di lasciare il matrigel “overnight” sui MEAs e questa
tecnica ha risolto i problemi di adesione, lasciando stabile il matrigel per i 25 giorni utili per
la maturazione cellulare.
Dopo l’incubazione “overnight” per la gelificazione del matrigel, le cellule staminali singole
sono state piastrate in numero 50000 su ogni MEA in FGF2, GDNF, BDNF, CTNF per 10
giorni, più controlloFCS2% per altri 15 giorni al termine dei quali è possibile effettuare le
registrazioni, ovvero l’esperimento di apprendimento.
Alla piastrazione dunque le cellule sono adese al matrigel che poggia sugli elettrodi del MEA.
106
Capitolo 6
L’esperimento robotico:apprendimento
figura 3: cellule al 15gg di coltura su MEA
Un’ interessante considerazione arriva dall’osservazione al microscopio del MEA, al 15 gg
quando sono ben visibili delle zone senza più matrigel dove le cellule poggiano direttamente
sugli elettrodi che formano il circuito del MEA.
Ogni elettrodo è connesso attraverso un sottile percorso isolato ad un collegamento esterno.
[Pizzi&Altri]. Di tutti i collegamenti situati nel supporto alcuni fungono da input, altri da
output ed altri ancora hanno il compito di fungere da massa. I MEA vengono posti dentro ad
un box per il controllo della temperatura. Questo avviene con una sonda termometrica, posta
all’interno del suddetto box, connessa ad un circuito elettronico di controllo che provvede ad
alimentare alcune resistenze, anch’esse situate all’interno dell’alloggiamento delle vaschette
delle cellule, al fine di mantenere, appunto, la temperatura costante a 37° C, queste resistenze
sono realizzate in carbone alimentare in corrente continua. Al fine di ottenere una buona
schermatura da disturbi di natura elettromagnetica l’intero contenitore, realizzato in
plexiglass, è rivestito con una rete d’ottone con maglia da 1mm.
107
L’esperimento robotico:apprendimento
Capitolo 6
figura 4: il” box” termocontrollato
Ovviamente il “box” termoregolato non risolve il problema dell’ossigeno e della anidride
carbonica che dovrebbero essere mantenuti ai livelli ottimali (ossigeno 20%, anidride
carbonica 5%) per permettere alle cellule una migliore sopravvivenza.
Per poter ovviare a questo problema, non è stato possibile effettuare le registrazioni
mantenendo le cellule in incubatore, e quindi insieme al box termoregolato è stato utilizzato
un BUFFER TYRODE che permette di mantenere il ph e i livelli di glucosio necessari alle
cellule. Questo particolare BUFFER (250ml soluzione madre contenente NaCl e KCl, 0,5 ml
di CaCl2 1M, 0,5 ml di MgCl2 1M e 1,5 gr di glucosio, per un ph 7.4 finale) è stato aggiunto
al medium di coltura poco prima delle registrazioni. L’aggiunta del Tyrode è stata testata
mantenere le cellule stabili, ovvero senza scatenare la formazioni di vescicole apoptotiche, per
al massimo due ore, tempo comunque sufficiente per terminare le registrazioni.
Tutto il sistema, alloggiamento, vaschette e circuito di preamplificazione, è connesso a terra.
E’ da notare che a causa degli strumenti messi a disposizione per questi esperimenti, non è
stato possibile collocare le cellule esattamente nei punti desiderati; in sostanza, le architetture
elettriche realizzate hanno costituito una sorta di letto sul quale sono state depositate le cellule
che hanno potuto, così, creare collegamenti tra loro al di là di quelli elettrici.
Grazie a questi tipi di supporti è stato possibile stimolare le cellule e registrate i loro segnali in
output.
6.2 Hardware, stimoli e registrazioni
In una serie di esperimenti precedenti, in corso da tre anni, abbiamo potuto verificare che
cellule staminali neurali umane adulte stimolate con pattern digitali reagiscono in modo
organizzato, mostrando reazioni differenziate a stimoli differenziati e reazioni simili a stimoli
simili (vedi tesi triennale: Reti neurali ibride biologiche-elettroniche: sperimentazione ed
analisi, http://www.redazionionline.it/pizzi/default.asp).
108
Capitolo 6
L’esperimento robotico:apprendimento
Questa volta lo scopo dell’esperimento è di riuscire a far muovere un robot simulato a video
grazie ai segnali di risposta delle cellule.
figura 5: interfaccia video con robottino virtuale
L’esperimento è stato svolto prima con cellule staminali neurali non differenziate e poi
cellule neurali mature. Il comportamento delle cellule indifferenziate si è rivelato casuale
perciò le considerazioni che seguono si riferiscono alle risposte delle cellule differenziate
mature.
I movimenti sono resi possibili grazie alla decodifica, da parte di una rete neurale artificiale,
dei segnali emessi dai neuroni. Le cellule prima di riuscire a comandare il robot hanno dovuto
apprendere come fare a spostare tale dispositivo simulato. L’esperimento prevede due fasi:
training e testing.
Nella fase di training le cellule sono state sottoposte per diverse volte a stimoli sensoriali
simulati da pattern digitali che hanno permesso loro di riconoscere questi segnali nella fase
successiva dell’esperimento. In particolare sono quattro i pattern che le cellule devono
apprendere e riconoscere nella fase di testing. Ogni diverso stimolo indica lo spostamento del
robot simulato in una diversa direzione. Nella vaschetta contenente le cellule sono stati
attivati otto canali utili per riprodurre la stimolazione sensoriale indicante lo spostamento. Per
esempio il pattern che indica lo spostamento a destra è stato così riprodotto:
109
Capitolo 6
L’esperimento robotico:apprendimento
figura 6: patter destra
Questo pattern è costituito da 8 bit per 8 bit. Ogni bit ha la durata di 300 ms a 300 mV. Le
cellule sono state quindi stimolate per 2.4 secondi. La stimolazione è stata seguita da un
secondo di pausa. Durante questa pausa è stata attivata la registrazione da parte della rete
neurale artificiale che decodificherà i segnali delle cellule naturali nella fase successiva
all’apprendimento. Il pattern indicante uno spostamento è stato somministrato 10 volte per
permettere alla rete neurale naturale di rafforzare alcuni legami e non altri in modo tale da
ricordare la configurazione dei pattern successivamente. Finito di somministrare il primo
pattern sono stati dati in input, in maniera analoga, gli altri pattern indicanti gli altri tre
spostamenti possibili:
figura 7: altri pattern
110
L’esperimento robotico:apprendimento
Capitolo 6
Una volta finita la fase di training si è passati alla fase successiva: il testing. A video sono
stati predisposti quattro bottoni.
figura 8: i bottoni
Premendo uno dei quattro bottoni si è inviata alla rete neurale naturale una stimolazione
corrispondente a uno dei 4 pattern sopra descritti; tale stimolazione dura 2.4 secondi e
successivamente si è registrata la risposta delle cellule nervose. L’esperimento ha previsto che
si premessero i bottoni in ordine sparso. Stimolando le cellule con dei pattern di bit uguali a
quelli inviati nella fase di training, ma in ordine casuale, esse produrranno un segnale che
viene acquisito dalla rete neurale la quale classifica tali risposte sulla base di quanto ricevuto
nella fase di training. Dopo la classificazione è stato visualizzato un segnale video che
decodifica con un movimento il segnale dei neuroni.
Ma vediamo meglio che tipo di stimolo ricevono le cellule:
In base ad esperimenti presenti in letteratura (vedi capitolo precedente) e in base agli
esperimenti che quotidianamente si conducono in vivo e in vitro tramite perfusione e patchclamp, sia in campo medico che di ricerca, le stimolazioni dovrebbero avvenire in onda
quadra, con frequenze inferiori ad 1Hz, dell’ordine di grandezza dei mV e a distanza di
almeno 15 minuti l’uno dall’altro. Inoltre la risposta è da considerare valida entro i primi 150
ms.
Mediando tra questi valori trovati in letteratura e i valori di input usati per i nostri passati
esperimenti abbiamo scelto di mandare alle cellule neurali questo tipo di stimolo:
111
Capitolo 6
L’esperimento robotico:apprendimento
Figura 9: stimoli in input, onda quadra
I pattern generati entrano nella circuito di stimolazione dove vengono convertiti a livelli di
tensione di circa 35 mV (da 30 a 100 mV).
Un apposito circuito situato nel preamplificatore genera i segnali alternati idonei ad essere
inviati alle cellule. La scelta di un segnale alternato è dovuta ad evitare fenomeni di elettrolisi
all’interno delle colture delle cellule.
Appena tutti i pattern sono stati inviati il computer, tramite la scheda di acquisizione, deve
apprendere i segnali uscenti dalla coltura dei neuroni. Il tempo di acquisizione deve essere
inferiore a cinque secondi. Tale tempo comunque dovrà potere essere variato, anche durante
la fase sperimentale, per trovare il migliore valore per una corretta elaborazione dei segnali
ricevuti.
I segnali uscenti dalla scheda di acquisizione sono elaborati dalla rete neurale artificiale al
fine di ottenere in uscita i quattro bit che verranno utilizzati per comandare i movimenti del
robot. Per semplificare l’esperimento utilizziamo solamente quattro movimenti del robot;
avanti, indietro, destra e sinistra. Per evitare il malfunzionamento del robot si deve evitare la
sovrapposizione dei comandi. I segnali in uscita devono essere come nell’esempio riportato in
figura 10.
112
Capitolo 6
L’esperimento robotico:apprendimento
figura 10: comandi al robot virtuale
La durata minima del comando deve essere di almeno un secondo, la massima non ha limiti
ma dipende dallo spazio disponibile per i movimenti del robot.
La velocità media di spostamento in avanti del robot di circa 80 cm/s mentre per lo
spostamento destra e sinistra sono necessari comandi della durata di un secondo, un tempo
maggiore fa ruotare il robot su se stesso.
La distanza tra un comando e l’altro deve essere uguale o maggiore di 5 ms.
I tempi di attivazione di ogni singolo comando dovrebbero essere variabili in modo da
trovare sperimentalmente la migliore performance.
I segnali di pilotaggio del trasmettitore infrarossi che comanda il robot possono pervenire
dalle uscite I/O dalla stessa scheda Personal DAQ che pilota la stimolazione o, in alternativa,
dalla porta parallela del computer.
In figura 11 è riportato lo schema utilizzato per il test nell’esperimento:
113
Capitolo 6
L’esperimento robotico:apprendimento
Figura 11: schema generale esperimento
Le cellule ricevono degli stimoli elettrici grazie ad otto cavi connessi alla piastra dove
risiedono. Tale segnali vengono inviati dalla scheda di acquisizione alle cellule. Le loro
risposte vengono raccolte sempre dagli stessi cavetti che si occupano di simulare le
stimolazioni sensoriali. Nell’immagine sotto riportata si può vedere la “scatola” che contiene
il controller collegato, tramite otto cavetti, alla piastra contenente le cellule nervose contenuta
in una scatola di maglie di ottone. Di seguito viene riportata una descrizione più dettagliata
dell’hardware, in particolare su come viene trattato il segnale elettrico generato dalla scheda
di acquisizione che si trova sul computer di gestione.
114
Capitolo 6
L’esperimento robotico:apprendimento
Figura 12: controller usato nell'esperimento
Dagli elettrodi posti a contatto con le cellule viene prelevato, tramite una cavo schermato, il
segnale elettrico da misurare. Il segnale entra in un amplificatore ad alta impedenza
d’ingresso per una prima amplificazione, successivamente passa attraverso due filtri Notch,
accordati sulla frequenza di 50 Hz, al fine di eliminare l’eventuale presenza di disturbi
generati dalla rete elettrica. Dopo i filtri il segnale subisce un’ulteriore amplificazione e
tramite accoppiatori isolati viene trasferito alla scheda di acquisizione installata a bordo del
computer di gestione e registrazione dove una scheda di acquisizione si occupa di ricevere tali
segnali e di generarne altri per stimolare le cellule nervose.
La scheda di acquisizione (NI 6052E DAQ) utilizzata negli esperimenti è costruita dalla Soc.
National Instruments ed ha le seguenti caratteristiche tecniche:
- velocità di 333 kS/s a 16 - bit;
- 16 input analogici;
- 2 output analogici;
- 8 linee di I/O digitali.
Il segnale della stimolazione è un segnale alternato a bassa tensione (mediamente 30 ÷ 100
mV) che può essere preimpostato nel circuito preamplificatore. Nell’esperimento qui trattato
sono stati impostati 100mV con un segnale in onda quadra.
115
L’esperimento robotico:apprendimento
Capitolo 6
Figura 13 : vista dall’alto del controller
Tutto il circuito elettronico è completamente isolato e racchiuso in uno spesso contenitore
metallico il cui corpo viene connesso con un contenitore a terra. Al fine di evitare che
eventuali segnali spuri possano influenzare il sistema di amplificazione si è provveduto ad
isolare completamente tutto il circuito elettronico della sezione di preamplificazione.
I segnali analogici entranti (acquisizione) e uscenti (dopo l’amplificazione) sono
completamente isolati tramite circuiti elettronici che impediscono di fatto qualsiasi
accoppiamento tra circuiti interni ed esterni. Anche i segnali digitali di controllo sono
completamente disaccoppiati dal circuito interno tramite fotoaccoppiatori. In questa maniera
gli elettrodi connessi alle cellule non vengono a contatto in nessun modo con l’esterno.
Quattro batterie ricaricabili a Ioni di Litio provvedono ad alimentare tutti i circuiti elettronici
al fine di garantire una tensione “pulita”.
6.3 La rete neurale artificiale
Le risposte delle cellule devono essere classificate. La rete neurale artificiale utilizzata è
stata una ITSOM (Inductive Tracing Self - Organizing Map), derivata dalla SOM, rete
autoorganizzante ampiamente descritta nella tesi triennale (Reti neurali ibride biologicheelettroniche: sperimentazione ed analisi, http://www.redazionionline.it/pizzi/default.asp),
[Cammarata97]. Nel caso di input strettamente non lineari e tempo varianti le prestazioni
delle SOM sono limitate. Il motivo è che se la non linearità della topologia di input è troppo
accentuata lo strato di output non è in grado di dipanarsi a sufficienza su questa forma di
topologia. La seconda ragione riguarda la difficoltà di pervenire ad una convergenza certa
(non essendoci la possibilità di stabilire un errore della rete per ciascuna epoca), e dal numero
ridotto dei neuroni dello strato competitivo.
Un altro problema delle SOM è la mancanza di esplicitazione dell’output. Una volta
classificato l’input è necessario creare una procedura in grado di estrapolarne il significato;
questo può risultare particolarmente dannoso per le applicazioni in tempo reale. Sulla base di
queste osservazioni sono state costruite le ITSOM la cui architettura viene sotto descritta.
116
Capitolo 6
L’esperimento robotico:apprendimento
Osservando la sequenza temporale dei neuroni vincenti di una SOM si nota che questa tende
a ripetersi creando una serie temporale, costituente attrattori caotici o precisi cicli limite, e che
questi caratterizzano univocamente l’elemento di input che gli ha prodotti. La regola di
apprendimento delle ITSOM fa sì che il peso vincitore rappresenti un’approssimazione del
valore d’input. Ad ogni epoca il nuovo peso vincitore,insieme al peso che ha vinto nell’epoca
precedente, va a costruire un’approssimazione del secondo ordine del valore di input e così
via. È quindi possibile ricavare il valore dell’input confrontando le configurazioni
caratteristiche di ciascun input con le configurazioni proprie dei bit del middambolo, di cui è
noto il valore.
Figura 14: Architettura di una ITSOM
Viene così effettuato un vero e proprio processo di induzione, perché una volta prodotta una
quantizzazione vettoriale molti a pochi dall’input sullo strato dei pesi, si opera un passaggio
pochi a molti da configurazioni di neuroni note alla totalità degli input. Tale rete non necessita
di essere portata a convergenza perché le configurazioni di neuroni vincenti raggiungono la
stabilità entro poche decine di epoche. Per ottenere migliori risultati la rete non deve
polarizzare su troppi pochi neuroni ma nemmeno disperdersi su tutto lo strato. L’algoritmo
ottimale per riconoscere le configurazioni create dalla rete si basa sul metodo degli z – score. I
punteggi cumulativi relativi a ciascun input vengono normalizzati secondo la distribuzione
della variabile standardizzata z data da:
Viene poi fissata una soglia compresa fra 0 e 1, che indichiamo con τ, che diventa un
parametro per questo tipo di rete ponendo poi:
Così facendo ogni configurazione dei neuroni vincenti è rappresentata da un numero
composto da zeri e uni tanti quanti sono i pesi dello strato di output. Diventa poi immediato
confrontare tra loro questi numeri binari. Il meccanismo delle SOM è stato scritto tenendo
conto di quanto avviene sulla neurocorteccia; risulta infatti che input simili siano mappati su
117
Capitolo 6
L’esperimento robotico:apprendimento
luoghi vicini della corteccia in modo ordinato e conservando la topologia. Sia le SOM che le
altre reti neurali artificiali apprendono grazie alla ripetizione ciclica dello stimolo di input.
Anche nel cervello esiste la prova dell’esistenza di circuiti in grado di rinforzare l’impressione
dell’informazione di input. Sembra però improbabile che la medesima configurazione di input
possa attivare un unico bersaglio è più ragionevole pensare che le mappe corticali siano
costituite da un insieme di neuroni attivati, la cosiddetta traccia mnestica che servirà per il
recupero successivo dell’informazione. Per questo motivo il meccanismo delle ITSOM
sembra essere più vicino a quanto accade sulla neurocorteccia. Anche l’idea che
l’apprendimento di nuove informazioni avvenga utilizzando la traccia mnestica di un insieme
di informazioni preesistenti sembra essere confermato da esperimenti. Il fatto che
l’apprendimento non sia un processo completamente basato su esempi ma nemmeno
completamente non supervisionato e necessiti di punti noti sembra essere confermato da
diversi studi.[Pizzi]
La nostra rete ITSOM funziona nel modo sotto descritto.
Essa deve innanzitutto memorizzare i quattro stati indicanti lo spostamento del robot
simulato, acquisendo i segnali di risposta delle cellule nella fase di training. La rete acquisisce
tali informazioni attraverso una matrice di valori (10000 x 8) decimali in virgola mobile
(double per il linguaggio C). Una volta iniziata la fase di training la rete scarta tutti i file di
addestramento precedenti al decimo. Arrivato il decimo file di training indicante lo
spostamento la rete inizia a generare gli z – score che serviranno per il confronto nella fase
successiva dell’esperimento: il testing. La rete acquisisce 80.000 valori che vengono suddivisi
in 8 campionamenti.
In ognuno dei 8 campionamenti la rete dapprima inizializza alcune strutture che permettono
di stabilire chi è il vincitore fra tutti i neuroni dello strato competitivo calcolando la distanza
minima fra pesi e l’input. Una volta stabiliti i vincitori bisogna modificare i pesi della rete.in
tre modi:
• Se il neurone è la prima volta che vince si applica la seguente regola:
• Se il neurone ha già vinto una volta allora viene punito e viene
azzerato il contatore che tiene traccia delle volte che vince:
• Se il neurone non è fra quelli vincenti allora viene punito:
ε e α sono delle opportune costanti comprese tra 0 e 1. In particolare ε indica il tasso di
apprendimento e indica quanto vengono premiati i neuroni vincenti, ovvero quanto i pesi
delle connessioni dei neuroni vincenti vengono avvicinati alla media delle unità di input.
-- W inew rappresenta il nuovo valore del peso;
-- W iold rappresenta il valore del peso prima del nuovo assegnamento.
Fase di training
In questa fase si generano gli stati base che serviranno per il confronto nella successiva fase
di testing.

generazione ed invio dei segnali, tramite scheda di acquisizione, ai neuroni
118
Capitolo 6





L’esperimento robotico:apprendimento
i neuroni ricevono le stimolazioni e producono un output che viene accolto dalla
scheda
l’applicazione server registra le risposte dei neuroni in appositi file
viene segnalata la presenza di un file alla ITSOM,
la rete genera gli z-score di riferimento.
E così in ciclo.
Fase di testing
La fase di testing prevede i seguenti passaggi:





nell’applicazione server sono presenti i tasti delle quattro direzioni, premendone uno si
genera il segnale che viene inviato ai neuroni
i neuroni ricevono lo stimolo e producono una risposta che viene accolta dalla scheda
di acquisizione
viene segnalata la presernz di un file pronto alla applicazione dedicata, la quale ne
estrae i contenuti e la passa alla rete neurale
la rete elabora i dati ricevuti e cerca di classificare il segnle, quindi passa il risultato
alla applicazione grafica che visualizza l’eventuale movimento.
E così in ciclo.
In testing, quindi, la rete capisce che i dati in ingresso non corrispondono più a “movimenti
da memorizzare” ma sono valori che devono essere classificati, quindi devono essere
confrontati con le quattro configurazioni binarie memorizzate in training.
Le risposte delle cellule sia nella fase di training che nella fase di testing sono stati
memorizzati su file.
Prima del confronto, naturalmente, i valori devono essere trasformati in z – score con una
procedura analoga a quanto descritta sopra. Si passa poi a confrontare questi z – score con
quelli memorizzati nel training se esiste una corrispondenza allora la rete classifica di
conseguenza, altrimenti designa come non classificati i segnali che non è riuscita a
riconoscere.
Prima di eseguire l’esperimento la rete è stata tarata con i seguenti valori:
• 500 numero di neuroni che costituiscono lo strato di input
• 20 neuroni nello strato di competitivo
• 10 epoche;
• Tasso si apprendimento 003 . 0 = ε ;
• Tasso di dimenticanza 001 . 0 = α
• Delta=0, valore della soglia utilizzato per calcolare gli z - score
Tale configurazione non si è poi rivelata essere ottimale perchè la rete non è riuscita a
classificare tutti i segnali di risposta delle cellule nella fase di testing. Nella tabella sottostante
sono stati riportati, nella prima colonna il tipo di pattern inviati alla cellule; per esempio il
pattern B è stato inviato 6 volte alle cellule nervose. Nella seconda colonna sono riportate le
classificazioni della rete che è riuscita a classificare solo alcuni pattern corrispondenti allo
stato “Giù” e “Su” indicati in rosso.
119
Capitolo 6
L’esperimento robotico:apprendimento
6.4 Risultati
Non ci si aspettava che la rete riuscisse a classificare tutti i segnali che i neuroni emettevano
in quanto non era mai stata testata con dei segnali generati da cellule nervose. Dopo
l’esperimento è stato possibile registrare su file le risposte dei neuroni. La rete è riuscita a
classificare 22 dei 25 stimoli inviati in maniera casuale nella fase di testing. La rete è riuscita
a riconoscere correttamente sempre le direzioni “su” e “giù”. È stato però possibile modificare
alcuni parametri della rete per poter generare degli z-score differenti per ciascuno stato.
I lavori intrapresi dopo l’esperimento consistono nel variare i seguenti parametri:
• Campioni su cui lavorare;
• Neuroni dello strato competitivo;
• Numero di epoche;
120
L’esperimento robotico:apprendimento
Capitolo 6
• Tasso di apprendimento: ε
Di seguito vengono riportati i grafici che rappresentano come hanno risposto le cellule ai
decimi stimoli di training, i segnali sono stati prelevati dagli otto canali in uscita dalla
vaschetta contenente le cellule nervose, ogni segnale rappresenta un canale. Sulle ascisse sono
riportate le frazioni di secondo e sulle ordinate la potenza espressa in mV:
Figura 15: Risposta delle cellule alla stimolazione del “pattern giù”
Figura 16: Risposta delle cellule alla stimolazione del “pattern su”
121
Capitolo 6
L’esperimento robotico:apprendimento
Nel grafico sopra si può notare che il canale indicato con il colore blu ha un comportamento
molto distaccato dagli altri canali, nell’analisi successiva per trovare la corretta
configurazione di rete si è provato anche ad eliminare questo canale per cercare di capire
quanto influiva sulle prestazioni di classificazioni della rete:
Figura 17: Risposta delle cellule alla stimolazione del “pattern sinistra”
Figura 18: Risposta delle cellule alla stimolazione del “pattern destra”
122
Capitolo 6
L’esperimento robotico:apprendimento
Si è diviso un segnale in più parti e poi si è cercato di capire l’informazione che ogni
spezzone di segnale contiene. Le parti del segnale che abbiamo analizzato sono le seguenti:
o L’intero segnale
o I primi 400ms;
o La parte del segnale che va dai 400ms sino alla fine del segnale
o La porzione che va dai 400ms ai 800ms
Dai grafici si può notare come il segnale si stabilizzi dopo i primi 400ms. E’ necessario capire
se l’informazione è contenuta nella prima porzione del segnale oppure nella parte finale dove
il segnale si stabilizza. Considerare la prima parte del segnale significa lavorare su 32.000
valori. Il segnale intero è composto da 80.000 valori per un totale di un secondo. Essendo
400ms il 40% di 1s si ricava che a 400ms corrispondono 32.000 valori. Dopo aver diviso il
segnale in diversi campioni si è passato a modificare il parametro successivo: il tasso di
apprendimento ( ε). Dopo aver provato con diversi valori si è scelta la configurazione
migliore di ε per poi passare a cambiare gli altri parametri. Si è variato il numero di epoche
usando il tasso di apprendimento ritenuto migliore nel test precedente e successivamente a
variare sono stati il numero di neuroni utilizzati nello strato competitivo usando l’ ε e il
numero di epoche che rendevano migliori le prestazioni della rete.
Dai diversi test effettuati sulle diverse porzioni del segnale risulta che nei primi 400ms delle
risposte delle cellule è contenuta abbastanza informazione per cui ha senso registrare tale
risposte e classificare i successivi segnali considerando solo la parte iniziale del segnale.
Considerando l’intero segnale, infatti, si rischia di ridurre le informazioni contenute nei primi
400 ms. La configurazione ottimale è risultata essere quella in cui vengono presi in
considerazione solo i primo 400ms con i seguenti parametri:
• 01 . 0 = ε ,
• 50 epoche
• 12 neuroni sullo strato competitivo.
È necessario ovviamente, capire perché non tutti i segnali vengono classificati, se il
problema deriva dalla ricerca di una ulteriore configurazione di rete ottimale con una più
approfondita analisi; oppure è il segnale di stimolazione può essere reso più efficace, o se ci
sono stati dei problemi a livello hardware o dei problemi con i neuroni e la loro adesione alla
piastra, o semplicemente il trasformare i dati in configurazioni z – score non è la soluzione
ottimale per cercare di trarre informazioni dai segnali che le cellule danno in output.
Va inoltre ricordato che nell’esperimento con le cellule indifferenziate la loro reazione alle
stimolazioni ha dato risultati completamente random (su 15 test sono stati indovinati solo una
configurazione indicante lo spostamento di su, una per lo spostamento sinistro, ed uno per lo
spostamento inferiore), mentre le cellule differenziate su 23 test hanno risposto correttamente
a quattro spostamenti inferiori su quattro impartiti ed a quattro spostamenti superiori su
cinque impartiti. Le risposte “su” “destra” e “su” “sinistra” sono state invece riconosciute, in
11 casi su 13, da classificazioni dello stato di “su” e “giù”. È importante notare che lo stato di
“su” e “giù” sono stati gli ultimi pattern somministrati in training: questo potrebbe far pensare
che le cellule li abbiano memorizzati meglio prediligendo poi la loro scelta. Si conclude
quindi che i neuroni generati da cellule staminali neurali adulte reagiscono in modo
organizzato a stimoli simulati differenziati. Il passo successivo consiste nell’utilizzare la
classificazione della rete per far muovere un robot in grado di spostarsi in diverse direzioni.
123
Capitolo 6
L’esperimento robotico:apprendimento
Test TTX
E’ importante ricordare che alla fine delle registrazioni è stata effettuata un’ultima
rilevazione di segnali su cellule trattate con TTX, la tetrodotossina. Questo è un veleno (è un
alcaloide) che si rinviene in certi pesci delle famiglie Tetrodontidae (pesci palla), Diodontidae
e Molidae. La tossina è localizzata nelle gonadi maschili e femminili, nel fegato e
nell’intestino. È presente però anche nella pelle mentre la muscolatura ne è quasi priva.
Molte sono le descrizioni dei sintomi causati dalla TTX: Nei casi più gravi la morte
sopravviene per paralisi respiratoria dopo qualche diecina di minuti dall’esposizione. Anche
nei casi meno gravi i primi a comparire sono i disturbi nervosi. Questi sintomi sono dovuti
alla proprietà che ha la tetrodotossina di bloccare selettivamente il trasporto degli ioni sodio
attraverso la membrana plasmatica; ciò si traduce in una profonda modificazione
dell’eccitabilità e nel blocco della conduzione dell’ impulso nervoso. Per questo la
tetrodotossina appartiene al gruppo delle neurotossine.
Dopo l’aggiunta della TTX, i segnali di output sono cambiati, in quanto i valori, in orrdinate,
dei voltaggi, si sono dimezzati rispetto ai valori plottati nel grafico che mostra gli outpur dei
neuroni, prima della somministrazione della droga:
figura 19: output delle cellule prima della somministrazione della TTX
124
Capitolo 6
L’esperimento robotico:apprendimento
figura 20: output delle cellule dopo due minuti di esposizione alla TTX
figura 21: output delle cellule dopo quattro minuti di esposizione alla TTX
La presenza di rumore piuttosto intenso, dovuto all’impedenza sugli elettrodi dovuta
all’ossidazione provocata dal liquido di cultura, impedisce di evidenziare un abbattimento
marcato dell’attività elettrica. Anche in questo modo, tuttavia, si può notare che l’attività
elettrica di ciascun canale si riduce di circa la metà in ampiezza , mentre la frequenza
diminuisce visibilmente.
125
L’esperimento robotico:apprendimento
Capitolo 6
Test MTT
E’, inoltre, importante mostrate che alla fine delle misurazioni, è stato effettuato il test di
vitalità MTT test sulle cellule piastrate sui MEAs, e i valori di assobarbanza media rilevati, in
base al grafico dello standard (vedi capitolo VEGF), hanno mostrato che le cellule vive sui
MEAs erano ancora circa 20.000 (valore assorbanza 0,35).
ASSORBANZA
STANDARD
0,55
0,5
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
2500
5000
10000
20000
40000
80000
CONCENTRAZIONE (cell#)
figura 22: numero di cellule vive dopo l’esperimenti di apprendimento in base allo standard MTT
6.5 Discussione
Il nostro lavoro è partito dall'idea di testare il protocollo neurale artificiale adattandolo ai
neuroni naturali.
Per fare questo, per prima cosa si è ricreata una configurazione neurale simile alla rete di
Hopfield (scelta per la sua somiglianza alle reti neuronali biologiche), ossia una rete di
neuroni completamente interconnessi in cui canali di input ed output coincidono. E’ stata
inviata una stimolazione a tutti gli input, lasciando poi qualche millisecondo di tempo alla rete
per ritornare allo stato non eccitato e giungere all'equilibrio dinamico, infine si sono letti gli
output dagli stessi canali. La stimolazione è avvenuta in parallelo su tutti i canali, e si è
diversificata per ogni canale in base ad una sequenza temporale di impulsi, che vanno a
simulare una particolare scarica di spikes ad una certa frequenza, secondo un protocollo non
dissimile al codice Morse.
La lettura delle reazioni dei neuroni è avvenuta poi secondo lo stesso criterio,
concordemente al protocollo neurale artificiale: ciascun canale emetterà una serie di spikes a
frequenza differenziata, caratterizzati da ampiezze più o meno alte dei voltaggi rilevati.
Questo è ragionevole non solo perchè segue il protocollo neurale artificiale, ma perchè input
ed output sono costituiti dallo stesso tipo di informazione , codificato in segnali elettrici.
La rete neurale ha ricevuto molte informazioni diverse, ma è stata in grado di memorizzarle
tutta nella sua struttura complessiva e di recuperarle poi ad una ad una se opportunamente
stimolata. Il modello neurale artificiale che giustifica questa affermazione è formalizzato
126
Capitolo 6
L’esperimento robotico:apprendimento
matematicamente, ma i risultati raggiunti con i nostro esperimenti sembrano affermare che
tale modello è corretto anche per le reti neurali naturali.
Per decodificare queste risposte è stata utilizzata di nuovo una rete neurale artificiale, che
ricevendo questa codifica in input ha cercato di interpretare il suo andamento dinamico
andando a leggere la successione temporale delle ampiezze dei segnali rilevati. Funzionando
come una scatola nera, la rete artificiale è risucita così a decodificare l'informazione nascosta
in questa sequenza utilizzando i valori in ampiezza dei voltaggi , rinormalizzandoli in modo
da cogliere l'andamento temporale degli spikes all'interno dei segnali.
Di fatto quindi, nonostante il codice utilizzato dai neuroni si pensa essere espresso in forma
di sole frequenze, è stato grazie al succedersi di ampiezze diverse che la rete neurale è riuscita
a distinguere il succedersi degli spikes all'interno dei segnali e, nonostante la variabilità tipica
dei segnali naturali, ad identificarne il ritmo che codificava i diversi stimoli ripetuti.
(Per semplificare: un segnale del tipo 0.001 0.003 0.002 -0.001 0.35 0.36 0.37 0.12 0.01 ecc.
rappresenta di fatto uno spike lungo 3 campioni, oppure tre spikes, a seconda della velocità di
campionamento, e una rete artificiale è in grado di capire il suo andamento rappresentandolo
come 0 0 0 0 1 1 1 0 0)
127