L’esperimento robotico:apprendimento Capitolo 6 Capitolo 6: L’esperimento robotico: apprendimento 6.1 Il materiale biologico e la preparazione dei MEA Il materiale biologico usato per il nostro esperimento di robotica su MEAs ha visto protagoniste le cellule staminali neurali umane. Come già accennato le cellule staminali si prestano perfettamente a questo tipo di esperimento, in quanto mostrano un alta capacità di adattamento e quindi sono capaci di differenziare e maturare sui MEAs. Inoltre, sono perfette da utilizzare in quanto avendo la capacità di proliferare esponenzialmente, non richiedono dissezioni multiple. Le staminali in forma di neurosfere, cresciute in 3D in FGF2+EGF sono state dissociate meccanicamente per essere piastrate in 2D su matrigel (composto essenzialmente da laminina, collagene IV, proteoglicani, entactina and nidogeno) su MEAs dopo 24 ore, come singole cellule. I MEAs, prima di essere utilizzati, dato che vengono assemblati utilizzando silicone, che è neurotossico, devono essere lavati accuratamente seguendo un preciso protocollo di seguito mostrato dopo l’immagine del MEA utilizzato: Figura 1 La piastra (MEA) dove giacciono le cellule Protocollo lavaggio lavare in alcool 70% la piastra servendosi di un bastoncino di cotone lasciare la piastra per 6 ore sotto l’acqua corrente, possibilmente distillata lasciare la piastra per 6 ore in alcool 70% lavare con 4 brevi risciacqui la piastra con detergente non saponato e acido 105 Capitolo 6 L’esperimento robotico:apprendimento sciacquare con alcool 70% lavare con acqua distillata lasciare in acqua distillata sotto raggi UV “overnight” aspirare l’acqua e lasciare asciugare sotto cappa sterile Una volta terminato il processo di lavaggio, è possibile fare aderire il matrigel che dovrà gelificare sul MEA. Questo passaggio, ha comportato non pochi problemi. Normalmente il matrigel, che è una molecola di adesione ricavata dal sarcoma di verme, e che si trova allo stato liquido a 4 gradi, gelifica a 37 gradi su plastica o su vetro in soli 20 minuti. Per i nostri MEAs, abbiamo avuto dei problemi, in quanto il matrigel, gelificava dopo 20 minuti, ma si staccava dal MEA dopo 2-3 giorni, causando ovviamente la morte delle cellule adese. Figura 2: distaccamento del matrigel Dopo non pochi tentativi, si è deciso di lasciare il matrigel “overnight” sui MEAs e questa tecnica ha risolto i problemi di adesione, lasciando stabile il matrigel per i 25 giorni utili per la maturazione cellulare. Dopo l’incubazione “overnight” per la gelificazione del matrigel, le cellule staminali singole sono state piastrate in numero 50000 su ogni MEA in FGF2, GDNF, BDNF, CTNF per 10 giorni, più controlloFCS2% per altri 15 giorni al termine dei quali è possibile effettuare le registrazioni, ovvero l’esperimento di apprendimento. Alla piastrazione dunque le cellule sono adese al matrigel che poggia sugli elettrodi del MEA. 106 Capitolo 6 L’esperimento robotico:apprendimento figura 3: cellule al 15gg di coltura su MEA Un’ interessante considerazione arriva dall’osservazione al microscopio del MEA, al 15 gg quando sono ben visibili delle zone senza più matrigel dove le cellule poggiano direttamente sugli elettrodi che formano il circuito del MEA. Ogni elettrodo è connesso attraverso un sottile percorso isolato ad un collegamento esterno. [Pizzi&Altri]. Di tutti i collegamenti situati nel supporto alcuni fungono da input, altri da output ed altri ancora hanno il compito di fungere da massa. I MEA vengono posti dentro ad un box per il controllo della temperatura. Questo avviene con una sonda termometrica, posta all’interno del suddetto box, connessa ad un circuito elettronico di controllo che provvede ad alimentare alcune resistenze, anch’esse situate all’interno dell’alloggiamento delle vaschette delle cellule, al fine di mantenere, appunto, la temperatura costante a 37° C, queste resistenze sono realizzate in carbone alimentare in corrente continua. Al fine di ottenere una buona schermatura da disturbi di natura elettromagnetica l’intero contenitore, realizzato in plexiglass, è rivestito con una rete d’ottone con maglia da 1mm. 107 L’esperimento robotico:apprendimento Capitolo 6 figura 4: il” box” termocontrollato Ovviamente il “box” termoregolato non risolve il problema dell’ossigeno e della anidride carbonica che dovrebbero essere mantenuti ai livelli ottimali (ossigeno 20%, anidride carbonica 5%) per permettere alle cellule una migliore sopravvivenza. Per poter ovviare a questo problema, non è stato possibile effettuare le registrazioni mantenendo le cellule in incubatore, e quindi insieme al box termoregolato è stato utilizzato un BUFFER TYRODE che permette di mantenere il ph e i livelli di glucosio necessari alle cellule. Questo particolare BUFFER (250ml soluzione madre contenente NaCl e KCl, 0,5 ml di CaCl2 1M, 0,5 ml di MgCl2 1M e 1,5 gr di glucosio, per un ph 7.4 finale) è stato aggiunto al medium di coltura poco prima delle registrazioni. L’aggiunta del Tyrode è stata testata mantenere le cellule stabili, ovvero senza scatenare la formazioni di vescicole apoptotiche, per al massimo due ore, tempo comunque sufficiente per terminare le registrazioni. Tutto il sistema, alloggiamento, vaschette e circuito di preamplificazione, è connesso a terra. E’ da notare che a causa degli strumenti messi a disposizione per questi esperimenti, non è stato possibile collocare le cellule esattamente nei punti desiderati; in sostanza, le architetture elettriche realizzate hanno costituito una sorta di letto sul quale sono state depositate le cellule che hanno potuto, così, creare collegamenti tra loro al di là di quelli elettrici. Grazie a questi tipi di supporti è stato possibile stimolare le cellule e registrate i loro segnali in output. 6.2 Hardware, stimoli e registrazioni In una serie di esperimenti precedenti, in corso da tre anni, abbiamo potuto verificare che cellule staminali neurali umane adulte stimolate con pattern digitali reagiscono in modo organizzato, mostrando reazioni differenziate a stimoli differenziati e reazioni simili a stimoli simili (vedi tesi triennale: Reti neurali ibride biologiche-elettroniche: sperimentazione ed analisi, http://www.redazionionline.it/pizzi/default.asp). 108 Capitolo 6 L’esperimento robotico:apprendimento Questa volta lo scopo dell’esperimento è di riuscire a far muovere un robot simulato a video grazie ai segnali di risposta delle cellule. figura 5: interfaccia video con robottino virtuale L’esperimento è stato svolto prima con cellule staminali neurali non differenziate e poi cellule neurali mature. Il comportamento delle cellule indifferenziate si è rivelato casuale perciò le considerazioni che seguono si riferiscono alle risposte delle cellule differenziate mature. I movimenti sono resi possibili grazie alla decodifica, da parte di una rete neurale artificiale, dei segnali emessi dai neuroni. Le cellule prima di riuscire a comandare il robot hanno dovuto apprendere come fare a spostare tale dispositivo simulato. L’esperimento prevede due fasi: training e testing. Nella fase di training le cellule sono state sottoposte per diverse volte a stimoli sensoriali simulati da pattern digitali che hanno permesso loro di riconoscere questi segnali nella fase successiva dell’esperimento. In particolare sono quattro i pattern che le cellule devono apprendere e riconoscere nella fase di testing. Ogni diverso stimolo indica lo spostamento del robot simulato in una diversa direzione. Nella vaschetta contenente le cellule sono stati attivati otto canali utili per riprodurre la stimolazione sensoriale indicante lo spostamento. Per esempio il pattern che indica lo spostamento a destra è stato così riprodotto: 109 Capitolo 6 L’esperimento robotico:apprendimento figura 6: patter destra Questo pattern è costituito da 8 bit per 8 bit. Ogni bit ha la durata di 300 ms a 300 mV. Le cellule sono state quindi stimolate per 2.4 secondi. La stimolazione è stata seguita da un secondo di pausa. Durante questa pausa è stata attivata la registrazione da parte della rete neurale artificiale che decodificherà i segnali delle cellule naturali nella fase successiva all’apprendimento. Il pattern indicante uno spostamento è stato somministrato 10 volte per permettere alla rete neurale naturale di rafforzare alcuni legami e non altri in modo tale da ricordare la configurazione dei pattern successivamente. Finito di somministrare il primo pattern sono stati dati in input, in maniera analoga, gli altri pattern indicanti gli altri tre spostamenti possibili: figura 7: altri pattern 110 L’esperimento robotico:apprendimento Capitolo 6 Una volta finita la fase di training si è passati alla fase successiva: il testing. A video sono stati predisposti quattro bottoni. figura 8: i bottoni Premendo uno dei quattro bottoni si è inviata alla rete neurale naturale una stimolazione corrispondente a uno dei 4 pattern sopra descritti; tale stimolazione dura 2.4 secondi e successivamente si è registrata la risposta delle cellule nervose. L’esperimento ha previsto che si premessero i bottoni in ordine sparso. Stimolando le cellule con dei pattern di bit uguali a quelli inviati nella fase di training, ma in ordine casuale, esse produrranno un segnale che viene acquisito dalla rete neurale la quale classifica tali risposte sulla base di quanto ricevuto nella fase di training. Dopo la classificazione è stato visualizzato un segnale video che decodifica con un movimento il segnale dei neuroni. Ma vediamo meglio che tipo di stimolo ricevono le cellule: In base ad esperimenti presenti in letteratura (vedi capitolo precedente) e in base agli esperimenti che quotidianamente si conducono in vivo e in vitro tramite perfusione e patchclamp, sia in campo medico che di ricerca, le stimolazioni dovrebbero avvenire in onda quadra, con frequenze inferiori ad 1Hz, dell’ordine di grandezza dei mV e a distanza di almeno 15 minuti l’uno dall’altro. Inoltre la risposta è da considerare valida entro i primi 150 ms. Mediando tra questi valori trovati in letteratura e i valori di input usati per i nostri passati esperimenti abbiamo scelto di mandare alle cellule neurali questo tipo di stimolo: 111 Capitolo 6 L’esperimento robotico:apprendimento Figura 9: stimoli in input, onda quadra I pattern generati entrano nella circuito di stimolazione dove vengono convertiti a livelli di tensione di circa 35 mV (da 30 a 100 mV). Un apposito circuito situato nel preamplificatore genera i segnali alternati idonei ad essere inviati alle cellule. La scelta di un segnale alternato è dovuta ad evitare fenomeni di elettrolisi all’interno delle colture delle cellule. Appena tutti i pattern sono stati inviati il computer, tramite la scheda di acquisizione, deve apprendere i segnali uscenti dalla coltura dei neuroni. Il tempo di acquisizione deve essere inferiore a cinque secondi. Tale tempo comunque dovrà potere essere variato, anche durante la fase sperimentale, per trovare il migliore valore per una corretta elaborazione dei segnali ricevuti. I segnali uscenti dalla scheda di acquisizione sono elaborati dalla rete neurale artificiale al fine di ottenere in uscita i quattro bit che verranno utilizzati per comandare i movimenti del robot. Per semplificare l’esperimento utilizziamo solamente quattro movimenti del robot; avanti, indietro, destra e sinistra. Per evitare il malfunzionamento del robot si deve evitare la sovrapposizione dei comandi. I segnali in uscita devono essere come nell’esempio riportato in figura 10. 112 Capitolo 6 L’esperimento robotico:apprendimento figura 10: comandi al robot virtuale La durata minima del comando deve essere di almeno un secondo, la massima non ha limiti ma dipende dallo spazio disponibile per i movimenti del robot. La velocità media di spostamento in avanti del robot di circa 80 cm/s mentre per lo spostamento destra e sinistra sono necessari comandi della durata di un secondo, un tempo maggiore fa ruotare il robot su se stesso. La distanza tra un comando e l’altro deve essere uguale o maggiore di 5 ms. I tempi di attivazione di ogni singolo comando dovrebbero essere variabili in modo da trovare sperimentalmente la migliore performance. I segnali di pilotaggio del trasmettitore infrarossi che comanda il robot possono pervenire dalle uscite I/O dalla stessa scheda Personal DAQ che pilota la stimolazione o, in alternativa, dalla porta parallela del computer. In figura 11 è riportato lo schema utilizzato per il test nell’esperimento: 113 Capitolo 6 L’esperimento robotico:apprendimento Figura 11: schema generale esperimento Le cellule ricevono degli stimoli elettrici grazie ad otto cavi connessi alla piastra dove risiedono. Tale segnali vengono inviati dalla scheda di acquisizione alle cellule. Le loro risposte vengono raccolte sempre dagli stessi cavetti che si occupano di simulare le stimolazioni sensoriali. Nell’immagine sotto riportata si può vedere la “scatola” che contiene il controller collegato, tramite otto cavetti, alla piastra contenente le cellule nervose contenuta in una scatola di maglie di ottone. Di seguito viene riportata una descrizione più dettagliata dell’hardware, in particolare su come viene trattato il segnale elettrico generato dalla scheda di acquisizione che si trova sul computer di gestione. 114 Capitolo 6 L’esperimento robotico:apprendimento Figura 12: controller usato nell'esperimento Dagli elettrodi posti a contatto con le cellule viene prelevato, tramite una cavo schermato, il segnale elettrico da misurare. Il segnale entra in un amplificatore ad alta impedenza d’ingresso per una prima amplificazione, successivamente passa attraverso due filtri Notch, accordati sulla frequenza di 50 Hz, al fine di eliminare l’eventuale presenza di disturbi generati dalla rete elettrica. Dopo i filtri il segnale subisce un’ulteriore amplificazione e tramite accoppiatori isolati viene trasferito alla scheda di acquisizione installata a bordo del computer di gestione e registrazione dove una scheda di acquisizione si occupa di ricevere tali segnali e di generarne altri per stimolare le cellule nervose. La scheda di acquisizione (NI 6052E DAQ) utilizzata negli esperimenti è costruita dalla Soc. National Instruments ed ha le seguenti caratteristiche tecniche: - velocità di 333 kS/s a 16 - bit; - 16 input analogici; - 2 output analogici; - 8 linee di I/O digitali. Il segnale della stimolazione è un segnale alternato a bassa tensione (mediamente 30 ÷ 100 mV) che può essere preimpostato nel circuito preamplificatore. Nell’esperimento qui trattato sono stati impostati 100mV con un segnale in onda quadra. 115 L’esperimento robotico:apprendimento Capitolo 6 Figura 13 : vista dall’alto del controller Tutto il circuito elettronico è completamente isolato e racchiuso in uno spesso contenitore metallico il cui corpo viene connesso con un contenitore a terra. Al fine di evitare che eventuali segnali spuri possano influenzare il sistema di amplificazione si è provveduto ad isolare completamente tutto il circuito elettronico della sezione di preamplificazione. I segnali analogici entranti (acquisizione) e uscenti (dopo l’amplificazione) sono completamente isolati tramite circuiti elettronici che impediscono di fatto qualsiasi accoppiamento tra circuiti interni ed esterni. Anche i segnali digitali di controllo sono completamente disaccoppiati dal circuito interno tramite fotoaccoppiatori. In questa maniera gli elettrodi connessi alle cellule non vengono a contatto in nessun modo con l’esterno. Quattro batterie ricaricabili a Ioni di Litio provvedono ad alimentare tutti i circuiti elettronici al fine di garantire una tensione “pulita”. 6.3 La rete neurale artificiale Le risposte delle cellule devono essere classificate. La rete neurale artificiale utilizzata è stata una ITSOM (Inductive Tracing Self - Organizing Map), derivata dalla SOM, rete autoorganizzante ampiamente descritta nella tesi triennale (Reti neurali ibride biologicheelettroniche: sperimentazione ed analisi, http://www.redazionionline.it/pizzi/default.asp), [Cammarata97]. Nel caso di input strettamente non lineari e tempo varianti le prestazioni delle SOM sono limitate. Il motivo è che se la non linearità della topologia di input è troppo accentuata lo strato di output non è in grado di dipanarsi a sufficienza su questa forma di topologia. La seconda ragione riguarda la difficoltà di pervenire ad una convergenza certa (non essendoci la possibilità di stabilire un errore della rete per ciascuna epoca), e dal numero ridotto dei neuroni dello strato competitivo. Un altro problema delle SOM è la mancanza di esplicitazione dell’output. Una volta classificato l’input è necessario creare una procedura in grado di estrapolarne il significato; questo può risultare particolarmente dannoso per le applicazioni in tempo reale. Sulla base di queste osservazioni sono state costruite le ITSOM la cui architettura viene sotto descritta. 116 Capitolo 6 L’esperimento robotico:apprendimento Osservando la sequenza temporale dei neuroni vincenti di una SOM si nota che questa tende a ripetersi creando una serie temporale, costituente attrattori caotici o precisi cicli limite, e che questi caratterizzano univocamente l’elemento di input che gli ha prodotti. La regola di apprendimento delle ITSOM fa sì che il peso vincitore rappresenti un’approssimazione del valore d’input. Ad ogni epoca il nuovo peso vincitore,insieme al peso che ha vinto nell’epoca precedente, va a costruire un’approssimazione del secondo ordine del valore di input e così via. È quindi possibile ricavare il valore dell’input confrontando le configurazioni caratteristiche di ciascun input con le configurazioni proprie dei bit del middambolo, di cui è noto il valore. Figura 14: Architettura di una ITSOM Viene così effettuato un vero e proprio processo di induzione, perché una volta prodotta una quantizzazione vettoriale molti a pochi dall’input sullo strato dei pesi, si opera un passaggio pochi a molti da configurazioni di neuroni note alla totalità degli input. Tale rete non necessita di essere portata a convergenza perché le configurazioni di neuroni vincenti raggiungono la stabilità entro poche decine di epoche. Per ottenere migliori risultati la rete non deve polarizzare su troppi pochi neuroni ma nemmeno disperdersi su tutto lo strato. L’algoritmo ottimale per riconoscere le configurazioni create dalla rete si basa sul metodo degli z – score. I punteggi cumulativi relativi a ciascun input vengono normalizzati secondo la distribuzione della variabile standardizzata z data da: Viene poi fissata una soglia compresa fra 0 e 1, che indichiamo con τ, che diventa un parametro per questo tipo di rete ponendo poi: Così facendo ogni configurazione dei neuroni vincenti è rappresentata da un numero composto da zeri e uni tanti quanti sono i pesi dello strato di output. Diventa poi immediato confrontare tra loro questi numeri binari. Il meccanismo delle SOM è stato scritto tenendo conto di quanto avviene sulla neurocorteccia; risulta infatti che input simili siano mappati su 117 Capitolo 6 L’esperimento robotico:apprendimento luoghi vicini della corteccia in modo ordinato e conservando la topologia. Sia le SOM che le altre reti neurali artificiali apprendono grazie alla ripetizione ciclica dello stimolo di input. Anche nel cervello esiste la prova dell’esistenza di circuiti in grado di rinforzare l’impressione dell’informazione di input. Sembra però improbabile che la medesima configurazione di input possa attivare un unico bersaglio è più ragionevole pensare che le mappe corticali siano costituite da un insieme di neuroni attivati, la cosiddetta traccia mnestica che servirà per il recupero successivo dell’informazione. Per questo motivo il meccanismo delle ITSOM sembra essere più vicino a quanto accade sulla neurocorteccia. Anche l’idea che l’apprendimento di nuove informazioni avvenga utilizzando la traccia mnestica di un insieme di informazioni preesistenti sembra essere confermato da esperimenti. Il fatto che l’apprendimento non sia un processo completamente basato su esempi ma nemmeno completamente non supervisionato e necessiti di punti noti sembra essere confermato da diversi studi.[Pizzi] La nostra rete ITSOM funziona nel modo sotto descritto. Essa deve innanzitutto memorizzare i quattro stati indicanti lo spostamento del robot simulato, acquisendo i segnali di risposta delle cellule nella fase di training. La rete acquisisce tali informazioni attraverso una matrice di valori (10000 x 8) decimali in virgola mobile (double per il linguaggio C). Una volta iniziata la fase di training la rete scarta tutti i file di addestramento precedenti al decimo. Arrivato il decimo file di training indicante lo spostamento la rete inizia a generare gli z – score che serviranno per il confronto nella fase successiva dell’esperimento: il testing. La rete acquisisce 80.000 valori che vengono suddivisi in 8 campionamenti. In ognuno dei 8 campionamenti la rete dapprima inizializza alcune strutture che permettono di stabilire chi è il vincitore fra tutti i neuroni dello strato competitivo calcolando la distanza minima fra pesi e l’input. Una volta stabiliti i vincitori bisogna modificare i pesi della rete.in tre modi: • Se il neurone è la prima volta che vince si applica la seguente regola: • Se il neurone ha già vinto una volta allora viene punito e viene azzerato il contatore che tiene traccia delle volte che vince: • Se il neurone non è fra quelli vincenti allora viene punito: ε e α sono delle opportune costanti comprese tra 0 e 1. In particolare ε indica il tasso di apprendimento e indica quanto vengono premiati i neuroni vincenti, ovvero quanto i pesi delle connessioni dei neuroni vincenti vengono avvicinati alla media delle unità di input. -- W inew rappresenta il nuovo valore del peso; -- W iold rappresenta il valore del peso prima del nuovo assegnamento. Fase di training In questa fase si generano gli stati base che serviranno per il confronto nella successiva fase di testing. generazione ed invio dei segnali, tramite scheda di acquisizione, ai neuroni 118 Capitolo 6 L’esperimento robotico:apprendimento i neuroni ricevono le stimolazioni e producono un output che viene accolto dalla scheda l’applicazione server registra le risposte dei neuroni in appositi file viene segnalata la presenza di un file alla ITSOM, la rete genera gli z-score di riferimento. E così in ciclo. Fase di testing La fase di testing prevede i seguenti passaggi: nell’applicazione server sono presenti i tasti delle quattro direzioni, premendone uno si genera il segnale che viene inviato ai neuroni i neuroni ricevono lo stimolo e producono una risposta che viene accolta dalla scheda di acquisizione viene segnalata la presernz di un file pronto alla applicazione dedicata, la quale ne estrae i contenuti e la passa alla rete neurale la rete elabora i dati ricevuti e cerca di classificare il segnle, quindi passa il risultato alla applicazione grafica che visualizza l’eventuale movimento. E così in ciclo. In testing, quindi, la rete capisce che i dati in ingresso non corrispondono più a “movimenti da memorizzare” ma sono valori che devono essere classificati, quindi devono essere confrontati con le quattro configurazioni binarie memorizzate in training. Le risposte delle cellule sia nella fase di training che nella fase di testing sono stati memorizzati su file. Prima del confronto, naturalmente, i valori devono essere trasformati in z – score con una procedura analoga a quanto descritta sopra. Si passa poi a confrontare questi z – score con quelli memorizzati nel training se esiste una corrispondenza allora la rete classifica di conseguenza, altrimenti designa come non classificati i segnali che non è riuscita a riconoscere. Prima di eseguire l’esperimento la rete è stata tarata con i seguenti valori: • 500 numero di neuroni che costituiscono lo strato di input • 20 neuroni nello strato di competitivo • 10 epoche; • Tasso si apprendimento 003 . 0 = ε ; • Tasso di dimenticanza 001 . 0 = α • Delta=0, valore della soglia utilizzato per calcolare gli z - score Tale configurazione non si è poi rivelata essere ottimale perchè la rete non è riuscita a classificare tutti i segnali di risposta delle cellule nella fase di testing. Nella tabella sottostante sono stati riportati, nella prima colonna il tipo di pattern inviati alla cellule; per esempio il pattern B è stato inviato 6 volte alle cellule nervose. Nella seconda colonna sono riportate le classificazioni della rete che è riuscita a classificare solo alcuni pattern corrispondenti allo stato “Giù” e “Su” indicati in rosso. 119 Capitolo 6 L’esperimento robotico:apprendimento 6.4 Risultati Non ci si aspettava che la rete riuscisse a classificare tutti i segnali che i neuroni emettevano in quanto non era mai stata testata con dei segnali generati da cellule nervose. Dopo l’esperimento è stato possibile registrare su file le risposte dei neuroni. La rete è riuscita a classificare 22 dei 25 stimoli inviati in maniera casuale nella fase di testing. La rete è riuscita a riconoscere correttamente sempre le direzioni “su” e “giù”. È stato però possibile modificare alcuni parametri della rete per poter generare degli z-score differenti per ciascuno stato. I lavori intrapresi dopo l’esperimento consistono nel variare i seguenti parametri: • Campioni su cui lavorare; • Neuroni dello strato competitivo; • Numero di epoche; 120 L’esperimento robotico:apprendimento Capitolo 6 • Tasso di apprendimento: ε Di seguito vengono riportati i grafici che rappresentano come hanno risposto le cellule ai decimi stimoli di training, i segnali sono stati prelevati dagli otto canali in uscita dalla vaschetta contenente le cellule nervose, ogni segnale rappresenta un canale. Sulle ascisse sono riportate le frazioni di secondo e sulle ordinate la potenza espressa in mV: Figura 15: Risposta delle cellule alla stimolazione del “pattern giù” Figura 16: Risposta delle cellule alla stimolazione del “pattern su” 121 Capitolo 6 L’esperimento robotico:apprendimento Nel grafico sopra si può notare che il canale indicato con il colore blu ha un comportamento molto distaccato dagli altri canali, nell’analisi successiva per trovare la corretta configurazione di rete si è provato anche ad eliminare questo canale per cercare di capire quanto influiva sulle prestazioni di classificazioni della rete: Figura 17: Risposta delle cellule alla stimolazione del “pattern sinistra” Figura 18: Risposta delle cellule alla stimolazione del “pattern destra” 122 Capitolo 6 L’esperimento robotico:apprendimento Si è diviso un segnale in più parti e poi si è cercato di capire l’informazione che ogni spezzone di segnale contiene. Le parti del segnale che abbiamo analizzato sono le seguenti: o L’intero segnale o I primi 400ms; o La parte del segnale che va dai 400ms sino alla fine del segnale o La porzione che va dai 400ms ai 800ms Dai grafici si può notare come il segnale si stabilizzi dopo i primi 400ms. E’ necessario capire se l’informazione è contenuta nella prima porzione del segnale oppure nella parte finale dove il segnale si stabilizza. Considerare la prima parte del segnale significa lavorare su 32.000 valori. Il segnale intero è composto da 80.000 valori per un totale di un secondo. Essendo 400ms il 40% di 1s si ricava che a 400ms corrispondono 32.000 valori. Dopo aver diviso il segnale in diversi campioni si è passato a modificare il parametro successivo: il tasso di apprendimento ( ε). Dopo aver provato con diversi valori si è scelta la configurazione migliore di ε per poi passare a cambiare gli altri parametri. Si è variato il numero di epoche usando il tasso di apprendimento ritenuto migliore nel test precedente e successivamente a variare sono stati il numero di neuroni utilizzati nello strato competitivo usando l’ ε e il numero di epoche che rendevano migliori le prestazioni della rete. Dai diversi test effettuati sulle diverse porzioni del segnale risulta che nei primi 400ms delle risposte delle cellule è contenuta abbastanza informazione per cui ha senso registrare tale risposte e classificare i successivi segnali considerando solo la parte iniziale del segnale. Considerando l’intero segnale, infatti, si rischia di ridurre le informazioni contenute nei primi 400 ms. La configurazione ottimale è risultata essere quella in cui vengono presi in considerazione solo i primo 400ms con i seguenti parametri: • 01 . 0 = ε , • 50 epoche • 12 neuroni sullo strato competitivo. È necessario ovviamente, capire perché non tutti i segnali vengono classificati, se il problema deriva dalla ricerca di una ulteriore configurazione di rete ottimale con una più approfondita analisi; oppure è il segnale di stimolazione può essere reso più efficace, o se ci sono stati dei problemi a livello hardware o dei problemi con i neuroni e la loro adesione alla piastra, o semplicemente il trasformare i dati in configurazioni z – score non è la soluzione ottimale per cercare di trarre informazioni dai segnali che le cellule danno in output. Va inoltre ricordato che nell’esperimento con le cellule indifferenziate la loro reazione alle stimolazioni ha dato risultati completamente random (su 15 test sono stati indovinati solo una configurazione indicante lo spostamento di su, una per lo spostamento sinistro, ed uno per lo spostamento inferiore), mentre le cellule differenziate su 23 test hanno risposto correttamente a quattro spostamenti inferiori su quattro impartiti ed a quattro spostamenti superiori su cinque impartiti. Le risposte “su” “destra” e “su” “sinistra” sono state invece riconosciute, in 11 casi su 13, da classificazioni dello stato di “su” e “giù”. È importante notare che lo stato di “su” e “giù” sono stati gli ultimi pattern somministrati in training: questo potrebbe far pensare che le cellule li abbiano memorizzati meglio prediligendo poi la loro scelta. Si conclude quindi che i neuroni generati da cellule staminali neurali adulte reagiscono in modo organizzato a stimoli simulati differenziati. Il passo successivo consiste nell’utilizzare la classificazione della rete per far muovere un robot in grado di spostarsi in diverse direzioni. 123 Capitolo 6 L’esperimento robotico:apprendimento Test TTX E’ importante ricordare che alla fine delle registrazioni è stata effettuata un’ultima rilevazione di segnali su cellule trattate con TTX, la tetrodotossina. Questo è un veleno (è un alcaloide) che si rinviene in certi pesci delle famiglie Tetrodontidae (pesci palla), Diodontidae e Molidae. La tossina è localizzata nelle gonadi maschili e femminili, nel fegato e nell’intestino. È presente però anche nella pelle mentre la muscolatura ne è quasi priva. Molte sono le descrizioni dei sintomi causati dalla TTX: Nei casi più gravi la morte sopravviene per paralisi respiratoria dopo qualche diecina di minuti dall’esposizione. Anche nei casi meno gravi i primi a comparire sono i disturbi nervosi. Questi sintomi sono dovuti alla proprietà che ha la tetrodotossina di bloccare selettivamente il trasporto degli ioni sodio attraverso la membrana plasmatica; ciò si traduce in una profonda modificazione dell’eccitabilità e nel blocco della conduzione dell’ impulso nervoso. Per questo la tetrodotossina appartiene al gruppo delle neurotossine. Dopo l’aggiunta della TTX, i segnali di output sono cambiati, in quanto i valori, in orrdinate, dei voltaggi, si sono dimezzati rispetto ai valori plottati nel grafico che mostra gli outpur dei neuroni, prima della somministrazione della droga: figura 19: output delle cellule prima della somministrazione della TTX 124 Capitolo 6 L’esperimento robotico:apprendimento figura 20: output delle cellule dopo due minuti di esposizione alla TTX figura 21: output delle cellule dopo quattro minuti di esposizione alla TTX La presenza di rumore piuttosto intenso, dovuto all’impedenza sugli elettrodi dovuta all’ossidazione provocata dal liquido di cultura, impedisce di evidenziare un abbattimento marcato dell’attività elettrica. Anche in questo modo, tuttavia, si può notare che l’attività elettrica di ciascun canale si riduce di circa la metà in ampiezza , mentre la frequenza diminuisce visibilmente. 125 L’esperimento robotico:apprendimento Capitolo 6 Test MTT E’, inoltre, importante mostrate che alla fine delle misurazioni, è stato effettuato il test di vitalità MTT test sulle cellule piastrate sui MEAs, e i valori di assobarbanza media rilevati, in base al grafico dello standard (vedi capitolo VEGF), hanno mostrato che le cellule vive sui MEAs erano ancora circa 20.000 (valore assorbanza 0,35). ASSORBANZA STANDARD 0,55 0,5 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 2500 5000 10000 20000 40000 80000 CONCENTRAZIONE (cell#) figura 22: numero di cellule vive dopo l’esperimenti di apprendimento in base allo standard MTT 6.5 Discussione Il nostro lavoro è partito dall'idea di testare il protocollo neurale artificiale adattandolo ai neuroni naturali. Per fare questo, per prima cosa si è ricreata una configurazione neurale simile alla rete di Hopfield (scelta per la sua somiglianza alle reti neuronali biologiche), ossia una rete di neuroni completamente interconnessi in cui canali di input ed output coincidono. E’ stata inviata una stimolazione a tutti gli input, lasciando poi qualche millisecondo di tempo alla rete per ritornare allo stato non eccitato e giungere all'equilibrio dinamico, infine si sono letti gli output dagli stessi canali. La stimolazione è avvenuta in parallelo su tutti i canali, e si è diversificata per ogni canale in base ad una sequenza temporale di impulsi, che vanno a simulare una particolare scarica di spikes ad una certa frequenza, secondo un protocollo non dissimile al codice Morse. La lettura delle reazioni dei neuroni è avvenuta poi secondo lo stesso criterio, concordemente al protocollo neurale artificiale: ciascun canale emetterà una serie di spikes a frequenza differenziata, caratterizzati da ampiezze più o meno alte dei voltaggi rilevati. Questo è ragionevole non solo perchè segue il protocollo neurale artificiale, ma perchè input ed output sono costituiti dallo stesso tipo di informazione , codificato in segnali elettrici. La rete neurale ha ricevuto molte informazioni diverse, ma è stata in grado di memorizzarle tutta nella sua struttura complessiva e di recuperarle poi ad una ad una se opportunamente stimolata. Il modello neurale artificiale che giustifica questa affermazione è formalizzato 126 Capitolo 6 L’esperimento robotico:apprendimento matematicamente, ma i risultati raggiunti con i nostro esperimenti sembrano affermare che tale modello è corretto anche per le reti neurali naturali. Per decodificare queste risposte è stata utilizzata di nuovo una rete neurale artificiale, che ricevendo questa codifica in input ha cercato di interpretare il suo andamento dinamico andando a leggere la successione temporale delle ampiezze dei segnali rilevati. Funzionando come una scatola nera, la rete artificiale è risucita così a decodificare l'informazione nascosta in questa sequenza utilizzando i valori in ampiezza dei voltaggi , rinormalizzandoli in modo da cogliere l'andamento temporale degli spikes all'interno dei segnali. Di fatto quindi, nonostante il codice utilizzato dai neuroni si pensa essere espresso in forma di sole frequenze, è stato grazie al succedersi di ampiezze diverse che la rete neurale è riuscita a distinguere il succedersi degli spikes all'interno dei segnali e, nonostante la variabilità tipica dei segnali naturali, ad identificarne il ritmo che codificava i diversi stimoli ripetuti. (Per semplificare: un segnale del tipo 0.001 0.003 0.002 -0.001 0.35 0.36 0.37 0.12 0.01 ecc. rappresenta di fatto uno spike lungo 3 campioni, oppure tre spikes, a seconda della velocità di campionamento, e una rete artificiale è in grado di capire il suo andamento rappresentandolo come 0 0 0 0 1 1 1 0 0) 127