Robust online learning in neuromorphic systems - ETH E

DISS. ETH NO. 21337
Robust online learning in neuromorphic
systems with spike-based, distributed
synapses
A dissertation submitted to
ETH ZURICH
for the degree of
Doctor of Sciences
presented by
Fabio Stefanini
Institute of Neuroinformatics
Laurea di Dottore in Fisica
Università degli Studi di Roma “La Sapienza”
born April, 19th, 1983
citizen of Italy
accepted on the recommendation of
Prof. Dr. Rodney Douglas, examiner
Prof. Dr. Giacomo Indiveri, co-examiner
Prof. Dr. Stefano Fusi, co-examiner
2013
Abstract
Neuromorphic Very Large Scale Integration (VLSI) hardware offers a low-power and compact
electronic substrate for implementing distributed plastic synapses for artificial systems. However,
the technology used for constructing analog neuromorphic circuits has limited resolution and
high intrinsic variability, leading to large circuit mismatch. Consequently, neuromorphic synapse
circuits are imprecise and thus the mapping of pre-defined models onto neural processing systems
built with such components is practically unfeasible. This problem of variability can be avoided
by off-loading learning to ad-hoc digital resources external to the synapse but this work-around
introduces communication bottlenecks and so compromises compactness and power efficiency.
Here I propose a more direct solution using a system composed of aggregated classifiers and
distributed, stochastic learning to exploit the intrinsic variability and mismatch of the substrate.
The system consists of a feed-forward neural network with one hidden layer of randomly connected
neurons with fixed weights and a pool of binary classifiers with stochastic learning. To demonstrate
the system, I developed software procedures to configure the hardware classifier and used them
to test its ability to learn to identify a target class. The method follows earlier works where
the neuron circuit parameters are first configured to obtain the desired behavior and then the
plastic synapses are characterized by imposing determined pre- and post- synaptic mean activities.
The classifier is then included in a simulated environment to compare the complete system to
theoretical and computational models. In particular, a well-known dataset consisting of images of
hand-written digits has been used as benchmark to demonstrate with experimental results that
by aggregating the responses of imprecise classifiers trained with the feed-forward network it is
possible to achieve a performance which is comparable to state-of-the-art. The intrinsic noise
present in the neuromorphic hardware and the type of distributed plastic synapses used result in
an effective combination of classifiers, as described by recent machine learning techniques. This
work is a crucial step towards enabling online learning through synaptic plasticity on imprecise
hardware, thus providing a novel, resource efficient substrate for machine learning. It demonstrates
how a “bottom-up” approach that exploits the properties of the substrate to obtain a functioning
neuromorphic system can elegantly overcome the complications due to the calibration of imprecise
circuits with limited configurability, thus extending the valuability and feasibility of analog VLSI
techniques. The biological plausibility of the system links to relevant issues in neuroscience, such
as the role of intrinsic variability in probabilistic computation in the brain, and suggests possible
design strategies for future emerging technologies.
v
Classification in VLSI
Compendio
Hardware neuromorfo costruito con tecnologia VLSI offre un substrato compatto di tipo low-power
per l’implementazione di sinapsi plastiche distribuite in sistemi artificiali. Il tipo di tecnologia
correntemente utilizzata per realizzare circuiti neuromorfi presenta tuttavia una bassa risoluzione
e un’alta variabilità intrinseca, quindi una grande disomogeneità circuitale, cioè mismatch. Per
questo motivo i circuiti neuromorfi che realizzano le sinapsi sono imprecisi e una mappatura
di modelli prestabiliti su sistemi costruiti a partire da tali componenti diventa una soluzione
praticamente impercorribile. Il problema della variabilità può essere evitato dedicando risorse
specializzate ai meccanismi di apprendimento, separate dal blocco di circuiti neuro-sinaptici,
tuttavia questa opzione introduce colli di bottiglia di comunicazione e compromette compattezza
circuitale e efficienza energetica. La mia proposta consiste in una soluzione più diretta che usa
un sistema composto da classificatori aggregati e apprendimento stocastico distribuito al fine di
sfruttare la variabilità intrinseca e il mismatch del substrato. Il sistema consiste in una rete neurale
di tipo feed-forward con un livello intermedio di neuroni connessi a random, con pesi sinaptici fissi,
e un insieme di classificatori binari con apprendimento stocastico. Per dimostrare la funzionalità
del sistema, ho sviluppato le procedure software necessarie per la configurazione dei classificatori
hardware e le ho usati per testare le loro capacità di apprendimento nell’identificare una data
classe di stimoli. Questo metodo segue precedenti lavori in cui prima i parameteri circuitali del
neurone vengono configurati per ottenere il comportamento desiderato e successivamente una
caratterizzazione delle sinapsi plastiche viene ottenuta imponendo determinate attività pre- e postsinaptiche. Il singolo classificatore è stato poi inserito in una simulazione per confrontare il sistema
di classificazione completo con i risultati stimati dalla teoria e dai modelli. In particolare, un set di
dati di caratteri scritti a mano comunemente usato in computer science è stato usato come punto
di riferimento per dimostrare, con risultati sperimentali, che è possibile ottenere una performance
di classificazione confrontabile con lo stato dell’arte tramite una combinazione di risposte di
classificatori imprecisi addestrati con la rete feed-forward. La presenza del rumore intrinseco
dell’hardware neuromorfo e il tipo di sinapsi impiegate comportano un’efficace combinazione di
classificatori, come si trova in certe recenti descrizioni di tecniche di machine learning. Questo
lavoro rappresenta un passo in avanti rispetto alla possibilità di realizzare sistemi di apprendimento
online sfruttando plasticità sinaptica su hardware con basso fattore di precisione e quindi propone
un substrato nuovo, efficiente in termini di utilizzo di risorse, per machine learning. Il lavoro
dimostra come un approccio “dal basso” che sfrutti le proprietà del substrato per ottenere
un sistema neuromorfo funzionante può superare in maniera elegante le complicazioni dovute
alle accurate calibrazioni di hardware impreciso e con limitate possibilità di configurazione e
perciò estente la validità e la praticabilità del VLSI analogico. La plausibilità biologica del
sistema impiegato si collega a interessanti approfondimenti nelle neuroscienze e suggerisce possibili
strategie di design per le future tecnologie emergenti.
vi