ANALISI DATI PER UN`INTERFACCIA CERVELLO

annuncio pubblicitario
UNIVERSITÀ DEL SALENTO
FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE, NATURALI
CORSO DI LAUREA IN FISICA
TESI DI LAUREA SPECIALISTICA
ANALISI DATI PER UN’INTERFACCIA
CERVELLO-COMPUTER
Relatore:
Ch.mo Dott. GIORGIO DE NUNZIO
Correlatore:
Ch.ma Dott.ssa MARINA DONATIVI
Laureando:
ROBERTO DEMITRI
Anno Accademico 2010-2011
SOMMARIO
INTRODUZIONE.................................................................................................................................................... 5
1
INTERFACCE CERVELLO-COMPUTER ..................................................................................................... 7
1.1
1.1.1
1.2
1.3
1.3.1
1.4
2
I SEGNALI ELETTROENCEFALOGRAFICI .............................................................................................. 18
2.1
2.1.1
2.2
2.2.1
2.2.2
2.3
2.3.1
2.3.2
2.3.3
2.3.4
2.3.5
2.3.6
2.4
2.5
2.6
3
CENNI DI NEUROFISIOLOGIA ................................................................................................................... 18
La corteccia cerebrale .................................................................................................................. 20
LA FISICA DEI SEGNALI EEG ................................................................................................................... 21
Il problema diretto ....................................................................................................................... 22
Il problema inverso ....................................................................................................................... 26
ACQUISIZIONE DEL SEGNALE EEG ........................................................................................................... 28
Gli elettrodi ................................................................................................................................... 29
Montaggio degli elettrodi............................................................................................................. 30
Amplificazione .............................................................................................................................. 32
AC-Coupler .................................................................................................................................... 35
Filtri .............................................................................................................................................. 35
Campionamento ........................................................................................................................... 36
TRACCIATO EEG ................................................................................................................................... 37
I POTENZIALI EVOCATI EVENTO-CORRELATI (ERP) .................................................................................. 39
POTENZIALI UTILI PER SISTEMI BCI ........................................................................................................ 40
ANALISI DEI DATI EEG ............................................................................................................................ 45
3.1
3.2
3.2.1
3.2.2
3.2.3
3.2.4
3.3
3.3.1
3.3.2
3.4
3.5
3.5.1
4
CHE COS’È UN SISTEMA BCI...................................................................................................................... 7
Schema a blocchi di un sistema BCI ............................................................................................... 8
UN PO’ DI STORIA .................................................................................................................................... 9
CLASSIFICAZIONE DELLE TECNICHE PER BCI ............................................................................................ 12
BCI dipendente e BCI indipendente .............................................................................................. 15
BCI PER “UNSPOKEN SPEECH” ............................................................................................................... 15
CLASSIFICAZIONE DEGLI ARTEFATTI ....................................................................................................... 46
METODO ICA ....................................................................................................................................... 48
Ambiguità nel modello ICA ........................................................................................................... 49
Indipendenza e incorrelazione..................................................................................................... 50
Nongaussianità delle componenti indipendenti .......................................................................... 51
Esempio di rimozione artefatti con ICA ....................................................................................... 53
ANALISI NEL DOMINIO DELLE FREQUENZE................................................................................................ 54
Trasformata di Fourier ................................................................................................................ 55
Trasformata di Wavelet ............................................................................................................... 58
FILTRAGGIO SPAZIALE ........................................................................................................................... 59
CLASSIFICATORE LINEARE ...................................................................................................................... 63
Test del classificatore ................................................................................................................... 64
ESPERIMENTI............................................................................................................................................ 67
4.1
4.1.1
4.2
4.2.1
4.2.2
4.2.3
4.2.4
4.2.5
4.3
4.4
4.5
4.6
MATERIALI E METODI ............................................................................................................................ 67
BCI 2000: presentazione degli stimoli ......................................................................................... 70
ANALISI DEI DATI – PREPROCESSING ....................................................................................................... 77
Cambiare la frequenza di campionamento ................................................................................. 79
Filtro passa banda ........................................................................................................................ 80
Estrazione delle Epoche ............................................................................................................... 81
Cambio del riferimento ................................................................................................................ 83
Rimozione degli artefatti tramite l’algoritmo ICA ...................................................................... 84
ANALISI DEI DATI – COMMON SPATIAL PATTERNS (CSP) ......................................................................... 87
RISULTATI ............................................................................................................................................ 90
CONCLUSIONI ....................................................................................................................................... 93
PROSPETTIVE FUTURE ........................................................................................................................... 95
BIBLIOGRAFIA.................................................................................................................................................... 97
INTRODUZIONE
La capacità di comunicare e controllare l'ambiente attraverso la mente è un argomento portato
all’attenzione della gente dai film più strani e fantastici di registi come David Cronenberg e
Bryan Singer. La scienza, dal canto suo, ha lavorato più velocemente di quanto si pensasse e,
ai giorni nostri, la capacità di controllare dispositivi e di comunicare attraverso la mente non è
più fantascienza. Le interfacce tra mente e computer si sono sviluppate molto rapidamente
negli ultimi 25 anni, facendo passi da gigante.
La realizzazione di interfacce Cervello-Computer è un area di ricerca in rapida crescita nel
campo delle neuroscienze e della bioingegneria. Un sistema di questo tipo legge segnali
elettrici cerebrali (EEG) o altre manifestazioni dell’attività cerebrale e li trasforma in segnali
digitali che un elaboratore processa e converte in azioni.
È stato dimostrato che si verificano attivazioni neurali nella corteccia motoria anche durante i
movimenti immaginati dei muscoli; queste attivazioni posso essere sfruttate per controllare
protesi in situazioni di incapacità di uso degli arti (soggetti paraplegici). Attivazioni neurali
nella corteccia motoria avvengono anche durante la ripetizione mentale di vocali o parole. Si
può dunque immaginare di sfruttare queste potenzialità relative al linguaggio per controllare,
ad esempio, un sintetizzatore vocale. In questo modo è possibile concepire un metodo di
comunicazione alternativo per individui affetti da gravi patologie quali SLA o paralisi totale.
La Tesi tratta delle tecniche di analisi dati utili per la realizzazione di un sistema di interfaccia
cervello-computer non invasiva, in particolare volta al pilotaggio di un sintetizzatore vocale
per soggetti impossibilitati a servirsi del normale apparato di fonazione. Dopo un'introduzione
generale all'argomento, la Tesi si sofferma sulla natura e sul trattamento dei segnali
elettroencefalografici, dal preprocessing per la rimozione di rumore ed artefatti, fino alle
tecniche di classificazione per il riconoscimento di pattern specifici.
Nella Tesi si descrive il segnale EEG, mixing di sorgenti situate in varie regioni del cervello,
e le difficoltà e le tecniche connesse con l’individuazione del segnale desiderato (relativo al
linguaggio), miscelato per esempio all’attività della corteccia visiva o all’attività muscolare.
L’applicazione di opportuni filtri spaziali può essere utile per risolvere il problema, agendo in
modo che i segnali di interesse siano esaltati dal filtro mentre i disturbi siano attenuati. In
particolare, l’applicazione di filtri spaziali può essere di ausilio per la classificazione di
segnali EEG appartenenti ad eventi diversi (nel caso di nostro interesse, l’articolazione di
vocali differenti), poiché i filtri operano in maniera tale da evidenziare le differenze tra
segnali di classe diversa.
5
Struttura della Tesi
Viene di seguito riassunta la struttura della Tesi, con brevi cenni su quanto sarà trattato nei
diversi capitoli.
Il primo capitolo offre una panoramica generale sui sistemi BCI: è illustrato brevemente il
percorso storico, presentate le varie tecniche esistenti e sono riportate alcune informazioni
bibliografiche sui recenti lavori riguardanti BCI nel campo della comunicazione.
Nel secondo capitolo sono descritte le caratteristiche principali del segnale elettrico
corticale e le metodologie di acquisizione tramite elettroencefalogramma. Sono delineati i
meccanismi coinvolti nella generazione e propagazione del segnale elettrico nella corteccia.
Sono poi descritte le caratteristiche più importanti del segnale EEG mettendo in evidenza
come i meccanismi alla base dell’attività elettrica corticale si riflettano nei tracciati EEG.
Il terzo capitolo tratta dell’elaborazione informatica dei segnali, dal preprocessing per
l’eliminazione del rumore fino alla classificazione dei pattern encefalografici. Sono discusse
in dettaglio le tecniche di analisi, l’algoritmo ICA (Independent Component Analysis) per la
rimozione degli artefatti, la trasformata di Fourier per l’analisi nel dominio della frequenza e
gli algoritmi di Common Spatial Patterns per l’estrazione delle caratteristiche salienti del
segnale elettroencefalografico. Il capitolo si conclude con qualche cenno sul classificatore
lineare (LDA) e sulle metodologie usate per testarne l’efficacia.
Il quarto capitolo è dedicato alla parte sperimentale, svolta in collaborazione con il CRIL
(Centro di Ricerca Interdisciplinare sul Linguaggio) dell'Università del Salento, e riporta i
primi risultati ottenuti nella realizzazione di un sistema BCI per il riconoscimento automatico
di vocali, limitato al momento alla discriminazione tra /a/ e /i/. Si descrivono gli esperimenti
realizzati, riportando dettagliatamente la procedura seguita in ogni singola fase relativa al
preprocessing, alla fase di estrazione delle caratteristiche salienti (feature discriminanti tra le
vocali /a/ e /i/) e quindi alla classificazione dei pattern encefalografici. Il capitolo termina con
le conclusioni e le prospettive future.
Seguono i Ringraziamenti e la Bibliografia essenziale.
6
1 INTERFACCE CERVELLO-COMPUTER
Di seguito sarà presentato in dettaglio che cosa si intende per interfaccia cervello-computer.
Nel corso del testo sarà utilizzato l'acronimo BCI per abbreviare la dicitura in lingua inglese
Brain-Computer Interface.
1.1 Che cos’è un sistema BCI
Con l’acronimo BCI si identifica un sistema capace, attraverso un dispositivo e un protocollo
di comunicazione, di connettere direttamente il sistema nervoso cerebrale e una macchina.
Un dispositivo BCI fornisce al cervello un canale di controllo e di comunicazione alternativo
che non prevede l’uso dell’apparato muscolare. È stato dimostrato, infatti, che si verificano
attivazioni neurali nella corteccia motoria durante i movimenti immaginati degli arti: queste
attivazioni sono sfruttabili, tramite i sistemi BCI, per controllare i movimenti di neuro-protesi.
I sistemi BCI rappresentano una promettente opportunità per coloro che hanno gravi disabilità
nell’apparato motorio, quali individui affetti da SLA o da paralisi totale.
Bisogna altresì sottolineare che le applicazioni BCI non si limitano strettamente al campo
medico ma sono presenti in svariati altri ambiti (ad esempio, operazioni di polizia o militari),
il che contribuisce a spiegare l’impulso che in tutto il mondo questi studi stanno ricevendo
(anche in termini di finanziamenti).
Per rendere possibile la connessione diretta tra sistema nervoso cerebrale e una macchina è
necessario che il dispositivo possa “registrare” l’attività mentale di un individuo, e a tale
proposito vi sono varie tecniche di misura.
La maggior parte di questi dispositivi effettua registrazioni dell'attività del cervello prodotta
dallo scambio di segnali elettrici tra i neuroni del sistema nervoso umano. Alcuni metodi di
registrazione, chiamati MEG (magnetoencefalografia), rilevano i campi magnetici generati
dalle correnti elettriche nel cervello; altri utilizzano la risonanza magnetica funzionale, fMRI,
e altri ancora usano la spettroscopia nel vicino infrarosso, NIRS, per visualizzare l'attività
della circolazione sanguigna del cervello.
I dispositivi MEG o fMRI sono voluminosi e costosi, limitando così le loro applicazioni in
ambienti specializzati. I NIRS sono relativamente più piccoli e meno costosi, si basano sulla
risposta dinamica del flusso sanguigno che attraversa il cervello e i tessuti vicini, fatto che
rende il processo di analisi molto lungo e non adatto ad applicazioni in tempo reale come si
pretende in un sistema BCI. Per questi ed altri motivi, le ricerche sulle BCI si sono focalizzate
sui segnali bioelettrici registrati attraverso metodi di elettroencefalografia (EEG) e di
7
elettrocorticografia (ECoG). Vista la facile reperibilità e il semplice utilizzo del metodo EEG,
la maggior parte delle ricerche si sono indirizzate verso l'analisi e l'approfondimento di questa
tecnica di registrazione.
I segnali registrati sono inizialmente ripuliti da artefatti che interferiscono con il segnale, quali
attività oculare o attività muscolare.
Successivamente a questa fase, segue l'analisi e la “traduzione”, dove vengono estratte le
caratteristiche di interesse del segnale per essere tradotte in comandi e informazioni di
controllo per dispositivi hardware o software. Ognuna di queste fasi può essere a sua volta
scomposta in varie sotto-fasi.
1.1.1 Schema a blocchi di un sistema BCI
Un sistema BCI può essere suddiviso in differenti parti (Figura 1): (1) acquisizione del
segnale,(2) signal processing (pre-elaborazione, estrazione di feature e algoritmo di
traduzione), (3) interfaccia di output.
Queste parti sono di seguito dettagliate:
1. L’acquisizione del segnale è usualmente realizzata attraverso l’EEG invasivo e/o non
invasivo, registrando potenziali evocati o spontanei (di cui si parlerà nei prossimi
capitoli).
2. Il blocco signal processing può essere suddiviso in tre sottoblocchi:
a. la parte di pre-elaborazione che, attraverso l’utilizzo di circuiti analogici,
amplifica il segnale EEG, lo filtra e lo digitalizza;
b. il blocco di estrazione delle feature, che consiste in una o più procedure di
elaborazione del segnale come: filtraggio spaziale, analisi spettrale o tempofrequenza, etc. che estraggono (i.e. misurano/calcolano) le caratteristiche del
segnale che contiene il messaggio (o comando) da comunicare all’esterno;
c. il blocco di classificazione, in grado di interpretare le caratteristiche estratte dal
segnale, in maniera discriminante verso altri possibili messaggi, per creare il
comando vero e proprio da inviare poi all’interfaccia di output. Spesso il
classificatore comprende anche algoritmi di adattamento al singolo soggetto; in
particolare, possono essere implementati tre differenti livelli di adattamento:
un primo livello con il quale il sistema si adatta alle caratteristiche del segnale
misurato; un secondo livello per l’adattamento alla variabilità a breve e a lungo
termine del segnale EEG; un terzo livello per aggiustare la capacità di
accomodamento del cervello durante l’utilizzo del sistema. Quest’ultimo
adattamento è necessario in quanto, essendo la BCI un sistema di
8
comunicazione alternativo alle normali vie di comunicazione, come queste
necessita di una retroazione, un feedback, che vada ad influenzare il
comportamento stesso del cervello nei riguardi della BCI aumentandone
l’efficienza. Il biofeedback è quindi un’informazione data al soggetto con lo
scopo di aiutare lo stesso a migliorare l’azione di controllo che sta svolgendo.
3. L’interfaccia di output si occupa di controllare qualsiasi applicazione, da una semplice
carrozzina elettrica alle più complesse neuroprotesi
Figura 1 Schema a blocchi di un sistema BCI
1.2 Un po’ di storia
Il via all’indagine dei segnali provenienti dall’attività cerebrale fu dato dallo scienziato Hans
Berger il quale, nel 1929, scoprì l'esistenza di una differenza di potenziale tra due elettrodi
posti sullo scalpo; la costruzione del primo elettroencefalogramma ha permesso la scoperta
dell'esistenza di una correlazione tra la differenza di potenziale misurata ai capi dei due
elettrodi e l'attività cerebrale.
La prima apparizione dell’espressione “interfaccia cervello-computer”,nella letteratura
scientifica, risale invece agli anni '70, a seguito della pubblicazione di alcuni documenti [1]
[2] relativi ad una ricerca condotta dal DARPA1presso l’Università della California di Los
Angeles.
1
Agenzia del Dipartimento della Difesa degli Stati Uniti responsabile dello sviluppo di tecnologie per uso
militare.
9
Sempre in questo periodo, Fetz e i suoi colleghi [3] hanno dimostrato, attraverso l’uso del
biofeedback, che le scimmie possono rapidamente imparare a controllare la loro attività
neuronale in corrispondenza della corteccia motoria primaria se opportunamente
ricompensate (per esempio con del cibo).
Nel 1980 Georgopoulos alla Johns Hopkins University trovò una relazione matematica tra la
risposta elettrica di singoli neuroni della corteccia motoria nelle scimmie macacus rhesus e la
direzione nella quale gli animali muovevano le braccia. Trovò inoltre che diversi gruppi di
neuroni sparsi in differenti aree del cervello controllavano i comandi motori, ma non riuscì a
registrare simultaneamente la loro risposta elettrica a causa delle limitazione tecniche imposte
dal suo equipaggiamento [4].
A metà degli anni '90 c’è stato un rapido sviluppo in campo BCI. Parecchi gruppi sono riusciti
a catturare segnali complessi della parte motoria del cervello sfruttando registrazioni di
ensambles neuronali (gruppi di neuroni) per il pilotaggio di dispositivi esterni.
In questo periodo, Philip Kennedy e colleghi hanno realizzato la prima interfaccia cervello
computer impiantando un elettrodo neurotrofico conico2 in una scimmia.
Nel 1999, un gruppo di ricercatori capeggiati da Yang Dan presso l’Università di Berkeley
della California hanno decodificato l’attività neurale per riprodurre le immagini viste dai gatti
usando una serie di elettrodi impiantati. I ricercatori si sono concentrati su 117 cellule
cerebrali di una zona del talamo (la parte che decodifica i segnali provenienti dalla retina). I
gatti hanno visto otto filmati e, dopo la registrazione della la loro attività neuronale, sono state
ricostruite alcune immagini con l’uso di opportuni filtri matematici (Figura 2) [5].
Figura 2 Le immagini originali (in alto), ovvero i frame del filmato a cui i gatti anno assistito, e le immagini
ricostruite (in basso) attraverso i segnali prelevati dal talamo.
2
Elettrodo avente la forma di un cono di vetro, lungo meno di un millimetro; il termine neurotrofico si riferisce
all’azione esercita sul sistema nervoso, poiché stimola la crescita neuronale intorno e dentro l’elettrodo,
favorendo così il contatto.
10
Miguel Nicolelis è stato uno dei maggiori sostenitori dell’indagine dei segnali neuronali con
l’utilizzo di multielettrodi; secondo quanto sosteneva, indagando su una superficie più ampia
del cervello si può ottenere un’informazione neurale che riduce l’estrema variabilità del
segnale ricavato da un singolo elettrodo, che può rendere difficile la gestione di un dispositivo
BCI.
Dopo i primi studi condotti negli anni '90, Nicolelis e i suoi colleghi hanno sviluppato delle
BCI capaci di decodificare l’attività cerebrale di alcune scimmie gufo e usarla per riprodurre i
movimenti della scimmia attraverso un braccio robotico. Le scimmie gufo hanno dimostrato
di essere soggetti ideali per questo tipo di esperimenti mostrando grande abilità del
raggiungere, afferrare e manipolare degli oggetti attraverso un braccio robotico. Nel 2000 il
gruppo è riuscito a costruire un sistema BCI che riproduceva in tempo reale, con il braccio
meccanico, i movimenti della scimmia gufo, mentre la scimmia muoveva un joystick o
prendeva del cibo. Questo tipo d’interfaccia gestita in tempo reale avrebbe potuto consentire
il controllo di un robot in remoto tramite un protocollo internet. Il sistema si limitava a
riprodurre i movimenti eseguiti dalle scimmie, ma queste, mentre eseguivano i movimenti,
non vedevano e dunque non tenevano in considerazione il movimento del braccio, non
ricevendo quindi da esso alcuna informazione di feedback (BCI ad anello aperto).
Negli esperimenti successivi di Nicolelis sono state impiegate delle scimmie rhesus poiché
ritenute migliori modelli di riferimento per la neurofisiologia umana rispetto alle scimmie
gufo. In questi esperimenti le scimmie rhesus sono state addestrate preliminarmente a
raggiungere ed afferrare oggetti su uno schermo di un computer attraverso l’uso di un
joystick, mentre i movimenti corrispondenti del braccio robotico sono stati nascosti (vedi
Figura 3). Successivamente è stato mostrato loro il robot ed esse hanno imparato a
controllarlo osservando i suoi movimenti. La BCI ha utilizzato la velocità giusta (grazie
all’addestramento preliminare) per controllare i movimenti di raggiungimento degli oggetti,
così come la giusta forza della presa [6].
11
Figura 3 Schema dell’esperimento di Nicolelis (fase di addestramento)
Dopo gli esperimenti di Nicolelis, in altri laboratori sono stati sviluppati BCI e algoritmi per
la decodifica del segnale neurale. Tra questi, i più famosi ricercatori sono stati John
Donoghue della Brown University, Andrew Schwartz dell’Università di Pittsburgh, e Richard
Andersen di Caltech. Questi scienziati sono stati in grado di produrre BCI con le registrazioni
di segnali prelevati da un numero inferiore di neuroni rispetto agli esperimenti di Nicolelis
(15-30 neuroni rispetto a 50-200 neuroni) [7]. Il gruppo di Donoghue ha realizzato un BCI per
addestrare delle scimmie rhesus a raggiungere ed afferrare oggetti su uno schermo di un
computer senza l’uso del joystick (BCI ad anello chiuso) [8]. Il gruppo di Schwartz ha invece
dimostrato che una scimmia si può nutrire attraverso un braccio robotico controllato da
segnali provenienti dal suo cervello [9].
I risultati ottenuti con la sperimentazione sulle scimmie rhesus hanno portato inevitabilmente
l’impiego di queste tecniche anche sull’uomo; infatti già nel 1998 Philip Kennedy realizzò in
un uomo il primo impianto cerebrale per simulare dei movimenti; il paziente, Johnny Ray,
affetto da paralisi totale riuscì a controllare un cursore sullo schermo di un computer [10].
Nel 2005 Matt Nagle, un paziente tetraplegico, è diventato la prima persona a controllare una
mano artificiale utilizzando una BCI. L’impianto di una serie di 96 elettrodi nella corteccia
motoria ha permesso a Nagle di controllare il braccio robotico semplicemente pensando di
spostare la sua mano, riuscendo anche a spostare un cursore su computer, accedere le luci in
una stanza o accendere l’apparecchio televisivo [11].
1.3 Classificazione delle tecniche per BCI
Secondo dove prelevano i segnali neurali, i sistemi BCI possono essere classificati come
(Figura 4):
12
-
Non invasivi (EEG): l’EEG ottiene i segnali elettrici direttamente dal cuoio capelluto,
è il metodo di registrazione più diffuso grazie alla sua innocuità per il soggetto e ai
suoi requisiti tecnici.
-
Invasivi: Le BCI invasive recuperano il segnale di singolo neurone attraverso
microelettrodi impiantati negli strati corticali.
-
Parzialmente invasivi: usano segnali elettrocorticografici (ECoG) provenienti da
sensori posizionati sulla superficie corticale, sopra o sotto la dura madre3.
I metodi di prelievo del segnale, appartenenti a queste ultime due classi, richiedono
naturalmente l’impianto neurologico.
I sistemi basati sul segnale EEG hanno reso possibile, a individui con gravi disabilità motorie,
inclusi individui affetti da SLA o con gravi danni alla colonna vertebrale, il controllo di
cursore, in due dimensioni, sullo schermo di un computer[12]. Inoltre, queste tecnologie, sono
state usate da individui sani per il pilotaggio di robot manipolanti vari oggetti. Quindi le
interfacce BCI non invasive, hanno un alto potenziale nel campo delle arto-protesi [13]. I
dispositivi basati sui segnali EEG, tuttavia, sono fondamentalmente limitati dal contenuto
informativo del segnale, che non racchiude informazioni riguardanti alcune componenti del
movimento, quali posizione e velocità [13]; inoltre le registrazioni di tali segnali sono
soggette ad interferenza da parte delle attività elettromiografiche della muscolatura cranica.
Le BCI invasive possono acquisire i segnali con maggiore contenuto informativo e consentire
elevate prestazioni [14]. Ad esempio, individui affetti da paralisi totale possono essere in
grado di comunicare attraverso messaggi digitati spostando i cursori di una tastiera dopo aver
subito l’impianto di elettrodi che favoriscono la crescita di fibre nervose mieliniche [10]. Con
l’aiuto di una serie di 96 microelettrodi che registrano i segnali dalla corteccia motoria
primaria, alcuni pazienti tetraplegici sono stati in grado si eseguire un controllo di base su un
arto robotico, come per esempio l’apertura e chiusura di una mano, anche anni dopo la lesione
del midollo spinale [11].
Recentemente, si è visto come l’ECoG sia un ottimo strumento per rilevare segnali di ingresso
per sistemi BCI. A differenza dei segnali EEG, gli ECoG sono in grado di rilevare segnali a
frequenza maggiore (banda gamma) che sono il prodotto di piccole attività corticali e sono
correlati allo scarico dei potenziali d’azione dei neuroni (vedi §2.1). Poiché non sono
3
La dura madre (o pachimeninge) è la parte più esterna e più spessa delle meningi
13
incorporati nel parenchima cerebrale, gli elettrodi ECoG infliggono meno danni alla corteccia
e anche l’effetto di deterioramento del segnale è inferiore al metodo invasivo4; i segnali ECoG
sono stati utilizzati per il controllo di dispositivi in 2D a un livello di prestazioni simili a
quelli ottenuto con il metodo invasivo [15]. In conclusione, anche se quest’approccio non è
stato ancora utilizzato in individui con disabilità motorie, risulta essere più sicuro di quello
invasivo e con maggior contenuto informativo rispetto al metodo EEG.
Anche se il metodo invasivo e il metodo parzialmente invasivo hanno un grande potenziale
nel recupero funzionale di individui con disabilità motorie, i rischi attuali e le limitazioni
associate all’impianto non ne consentono un uso diffuso. Una delle principali carenze della
tecnologia attuale è associata alla perdita di affidabilità del segnale nel tempo. Infatti, il nostro
organismo, in risposta ai danni causati dalla penetrazione del microelettrodo nella corteccia
inizia un processo reattivo che altera l’impedenza iniziale del microelettrodo [16]. Danni
neurali e vascolari presso la locazione del microelettrodo possono anche portare lo sviluppo di
infezioni. Come risultato, la durata dell’impianto nel tempo si misura in mesi, e in genere non
dura più di un anno senza perdere qualità del segnale in maniera significativa. Inoltre, il
movimento del microelettrodo impiantato nel parenchima cerebrale, spesso causato da
variazioni di volume del cervello o da attività fisica, può influenzare la produzione del
segnale.
Figura 4 Classificazione dei metodi usati per il prelievo del segnale neurale [17].
4
L’effetto di deterioramento del segnale è dovuto ai processi di cicatrizzazione: minore è il danno inflitto alla
corteccia, minore è il contributo dei processi di cicatrizzazione al deterioramento del segnale
14
1.3.1 BCI dipendente e BCI indipendente
In letteratura [18] si trova un’ulteriore suddivisione, che distingue tra BCI dipendente e
indipendente. La BCI dipendente, pur non utilizzando le normali “vie di uscita” dell’encefalo
(controllo diretto muscolare o verbale) per trasportare il messaggio (o comando), ha però
bisogno dell’attività sensoriale per generare i segnali cerebrali necessari al controllo: è il caso,
ad esempio, dell’SSVEP (vedi §2.6) nella quale il soggetto viene stimolato mediante luci o
scacchiere intermittenti. Al contrario la BCI indipendente non ha bisogno di quest’attività in
quanto il cervello genera autonomamente il segnale che trasporta il messaggio da interpretare
(per esempio la motor imagery). Questo secondo caso può a prima vista sembrare il più
conveniente, ma necessita di un lungo addestramento del soggetto che, se superficiale, può
minare il corretto funzionamento dell’intero sistema.
1.4 BCI per “Unspoken Speech”
Le tipiche forme di comunicazione tra gli umani comportano il trasporto di informazione
verbale e visuale, molto spesso attraverso linguaggio vocale o gesti fisici. Individui affetti da
SLA o paralisi non possono comunicare in tal modo: alcune BCI sono state quindi sviluppate
per assicurare un metodo di comunicazione alternativo per questi individui.
Per esempio, nel 2007 è stato sviluppato un sistema di comunicazione del tipo “sì o no”
misurando l’afflusso di sangue al cervello attraverso la spettroscopia infrarossa. Tuttavia, la
lenta risposta (30s) della misura dell’afflusso di sangue al cervello fa sì che il sistema non
abbia nessuna correlazione con i normali metodi di comunicazione.
In quest’ambito, l’elettroencefalografia sta dimostrando di essere un utile strumento di
comunicazione, utilizzabile per il riconoscimento del parlato. Una risposta neuronale a
svariati stimoli chiamata potenziale P300 è stata ampiamente studiata come controller BCI.
Nel 2008 il P300 è stato utilizzato su pazienti affetti da SLA, ai quali è stata fatta osservare
una matrice lampeggiante di lettere, permettendo loro di esprimersi. Tuttavia, dato che il P300
non è una risposta volitiva (cioè richiede uno stimolo esterno), esso ha poca correlazione con i
normali metodi di comunicazione. Per esempio, nello studio presentato in [19] è descritto
come un paziente completamente paralizzato possa imparare ad utilizzare una BCI basata sui
segnali EEG per la comunicazione verbale. Ciò ha richiesto un processo di apprendimento che
è durato diversi mesi, con tempi medi di produzione di ciascuna lettera di circa un minuto.
15
Lo scopo dei nostri studi è stato quello di sviluppare un quadro di una comunicazione BCI che
impieghi un sistema di controllo più naturale, utilizzando l’attività neurale associata alla
produzione del linguaggio.
Con il termine Unspoken Speech, ossia “linguaggio non-parlato”, si intende dunque l’azione,
da parte di un soggetto, di pensare una data parola senza che ci sia movimento di muscoli
articolatori e senza emettere alcun suono udibile.
È stato dimostrato che si verificano attivazioni neurali nella corteccia motoria durante i
movimenti immaginati degli arti; queste attivazioni, come già visto, possono essere sfruttate
per controllare protesi; inoltre, è stato dimostrato che le attivazioni neurali nella corteccia
motoria avvengono durante la ripetizione mentale di vocali.
Abbiamo dunque cercato di sfruttare queste potenzialità relative al linguaggio per porre le
basi per un sistema di controllo di un sintetizzatore vocale.
In letteratura si distinguono sostanzialmente due tipi di approcci che cercano di ‘catturare’ il
segnale connesso con il parlato. Il primo sfrutta i segnali muscolari connessi alla laringe e ai
muscoli oro-facciali, attraverso la registrazione del segnale elettromiografico (EMG) [20][21];
il secondo sfrutta direttamente il segnale cerebrale connesso a specifici compiti cognitivi
attraverso l’uso del sistema EEG [22].
Dopo i primi successi iniziali [23] dei sistemi BCI implementati con i segnali EMG, sono
emerse una serie di problematiche che ne hanno evidenziato alcuni limiti importanti quali, ad
esempio, la variabilità della performance in termini di accuratezza del sistema dovuta al
posizionamento degli elettrodi. Il problema è stato evidenziato non solo tra diversi soggetti,
ma anche in più sessioni sperimentali dello stesso soggetto. Inoltre, essendo tale metodo
basato sui segnali muscolari, la sintesi del segnale EMG risulta fallimentare in soggetti
paraplegici che hanno perso l’uso della muscolatura laringale ed oro-facciale, nonostante
conservino intatta l’attività neurofisiologica e di pensiero.
Pertanto, sulla base della letteratura presa in esame, l’approccio più idoneo sembra essere
quello di decodificare il segnale EEG prodotto dalla corteccia cerebrale mentre un soggetto
pensa di produrre un suono. I primi tentativi in questa direzione risalgono a 1997 quando
Suppes et al.[24] resero nota la possibilità di rilevare i pattern neurali connessi all’atto di
pensare un set di parole ben definito attraverso registrazioni EEG. Successivamente, il gruppo
di ricerca di Tanja Schultz a Karlsruhe, in Germania [25] e altri gruppi di ricerca [26][27],
16
hanno sviluppato diversi protocolli sperimentali mirati a catturare il segnale cerebrale
connesso all’atto di pensiero di parole, ottenendo, tuttavia, per ora scarsi risultati.
Anche il prototipo BCI che la Tesi descrive segue quest’approccio. E’ però opportuno,
preliminarmente alla trattazione del sistema, introdurre alcune informazioni sulla natura e
sulle caratteristiche fisiche dei segnali EEG.
17
2 I SEGNALI ELETTROENCEFALOGRAFICI
Come già detto nel Capitolo 1, data la non invasività del metodo elettroencefalografico, la sua
facile reperibilità e il semplice utilizzo, la maggior parte delle ricerche sui sistemi BCI sono
state recentemente indirizzate verso l'analisi e l'approfondimento di questa tecnica di
registrazione.
I segnali EEG sono originati dal sommarsi di un gran numero di eventi a basso voltaggio
dell’attività elettrochimica del cervello. L’energia elettrica viaggia attraverso i tessuti
conduttivi e i fluidi cerebrali, le ossa, e la cute del cuoio capelluto, fino ad arrivare agli
elettrodi di misura che, posti sulla superficie del cranio, a contatto con la pelle, rilevano
differenze di potenziale dell’ordine di pochi µV o decine di µV.
Questi segnali possono essere rappresentati come sovrapposizione di numerose forme d’onda
generate dall’attività neurale, e portano con sé l’informazione sull’attività elettrica della zona
del cervello sottostante e vicina agli elettrodi.
2.1 Cenni di neurofisiologia
Riportiamo di seguito delle informazioni presenti in letteratura [28] per capire come
avvengono i processi di produzione dei segnali elettrici neurali e quali sono le aree del
cervello interessate.
Il neurone è il tipo cellulare che compone, insieme alle cellule gliali, il tessuto nervoso.
Grazie alle sue peculiari proprietà fisiologiche, è in grado di ricevere, integrare e trasmettere
impulsi nervosi.
Nel neurone si possono identificare quattro aree morfologiche: il nucleo (o soma), i dendriti,
l’assone e i terminali pre-sinaptici (Figura 5). I dendriti rappresentano gli “ingressi” del
neurone mentre l’assone è l’uscita. I segnali elettrici trasmessi lungo l’assone (potenziali
d’azione o spike) sono impulsivi con un’ampiezza di circa 100 mV e con una durata di circa
1 ms. Il segnale si propaga a una velocità che varia da 1 a 100 m/s. L’alta velocità di
conduzione è dovuta alla guaina mielinica.
Infine la sinapsi (o giunzione sinaptica o bottone sinaptico), dal greco "connettere", è una
struttura altamente specializzata che consente la comunicazione tra i neuroni. Attraverso la
trasmissione sinaptica, l'impulso nervoso può viaggiare da un neurone all’altro.
18
Figura 5 Schema di un neurone
Gli impulsi nervosi trasmessi dai neuroni sono di natura chimica ed elettrica. Il neurone a
riposo è polarizzato con una d.d.p. di -70 mV (potenziale di membrana a riposo).
Il flusso di cariche elettriche si trasmette poiché la membrana cellulare del neurone subisce
una modifica della propria carica elettrica: dalla situazione a riposo, la membrana assume una
carica elettrica positiva. Ciò provoca una reazione a catena e la conseguente trasmissione
dell'impulso nervoso.
La concentrazione di carica negativa (anioni proteici) è maggiore all’interno del neurone. Se,
in conseguenza di ciò che avviene sulle sinapsi, il neurone si depolarizza a valori maggiori di
circa -50mV, è generato un potenziale d’azione.
Il treno di impulsi viaggia lungo l’assone e raggiunge la regione terminale.
Gli impulsi stimolano il rilascio di neurotrasmettitori (il segnale d’uscita) e questo processo è
chiamato trasmissione sinaptica.
L’ampiezza del segnale d’uscita è determinata dall’ampiezza della depolarizzazione che, a sua
volta, dipende dal numero e dalla frequenza degli impulsi.
I neurotrasmettitori sono sostanze chimiche e ormoni, ognuno dei quali contiene un preciso
messaggio da trasmettere e possiede un ruolo specifico nella funzione cerebrale e nel
comportamento.
19
2.1.1 La corteccia cerebrale
La corteccia cerebrale (o materia grigia) è il luogo in cui risiedono i corpi cellulari dei
neuroni.
Nell'essere umano la corteccia cerebrale presenta delle circonvoluzioni. È, infatti,
notevolmente ripiegata al fine di poter contenere un’ampia superficie (pari a circa 0.5 m2)
limitando il volume del cervello. Le pieghe più profonde prendono il nome di scissure. Nella
corteccia umana ci sono quattro scissure, due laterali e due centrali, che rappresentano i punti
di riferimento principali della corteccia umana. Attraverso queste scissure possiamo
individuare quattro lobi (Figura 6):
il lobo frontale
il lobo parietale
il lobo temporale
il lobo occipitale.
La parte anteriore del lobo frontale è denominata corteccia prefrontale. Nei mammiferi il
90% della corteccia cerebrale prende il nome di neocorteccia. Si tratta della parte di corteccia
più recente dal punto di vista evolutivo ed è caratterizzata da 6 strati. Il 10% rimanente è dato
dalla corteccia olfattiva e dall'ippocampo. Queste due parti sono definite anche
paleocorteccia per la loro origine più antica. È sicuramente degno di nota il fatto che nella
maggior parte dei pesci, dei rettili e degli uccelli la corteccia olfattiva occupi quasi del tutto la
corteccia cerebrale. Ogni lobo è sede di funzioni localizzate individuabili nella superficie
cerebrale e denominate aree corticali.
È possibile individuare 12 distinte regioni corticali e le loro principali funzioni:
corteccia prefrontale: emozioni e risoluzione di problemi
corteccia motoria associativa: coordinazione dei movimenti complessi
corteccia motoria primaria: inizio movimenti volontari
corteccia somatosensitiva primaria: riconoscimento informazioni sensitive
corteccia sensitiva associativa: elaborazione informazioni sensitive
corteccia visiva associativa: elaborazione delle informazioni visive
corteccia visiva: riconoscimento di stimoli visivi semplici
area di Wernicke: comprensione del linguaggio
corteccia uditiva associativa: elaborazione delle informazioni uditive
corteccia uditiva: riconoscimento delle qualità dei suoni (volume, tono)
20
corteccia inferotemporale: elaborazioni legate alla memoria
area di Broca: produzione del linguaggio
Il concetto di localizzazione delle funzioni non significa che una funzione sia svolta
esclusivamente da una determinata area, dato che la maggior parte delle funzioni sono
espletate da neuroni di regioni cerebrali diverse. Semplicemente, certe aree hanno una più
stretta relazione con determinate funzioni rispetto ad altre.
Dunque ogni area è deputata a svolgere principalmente una certa funzione. Aree diverse sono
connesse tra loro attraverso le cortecce associative. Esse ricevono informazioni dalle aree
sensoriali e fanno sì che abbiano luogo le funzioni cerebrali più elevate come la percezione, il
pensiero, il linguaggio, la memoria e il comportamento emozionale.
Figura 6 Anatomia dell’encefalo.
2.2 La Fisica dei segnali EEG
L’attivazione elettrica dei neuroni è rappresentata dal potenziale d’azione, che è la differenza
di potenziale tra l’interno e l’esterno della cellula: lo scambio di ioni provoca una rapida
variazione del potenziale della durata complessiva di qualche millisecondo.
L’ampiezza del potenziale raggiunge decine di mV. Ogni neurone produce questo tipo di
potenziale durante la sua attività, tuttavia un gruppo di neuroni che effettua uno stesso
compito non lavora necessariamente in fase, e quindi ciò che è registrato da un
elettroencefalografo è solo l’attività dei neuroni che in quell’istante producono una somma
non nulla dei loro potenziali d’azione. Il problema bioelettromagnetico consiste nel costruire
un modello fisico che descriva l’attività elettrica del cervello.
21
Una volta descritte le sorgenti del campo e dello spazio, si possono risolvere le equazioni di
Maxwell per ricavare un espressione analitica o numerica per il potenziale registrato
nell’EEG.
La soluzione del problema diretto (date le sorgenti, trovare il potenziale, Figura 7) è
necessaria per l’impostazione di quello inverso, ovvero, date le misure dello scalpo, fornire un
mappa di attivazione cerebrale, che è spesso utile durante la realizzazioni di sistemi BCI, per
capire quali zone del cervello sono interessate (ovvero hanno un maggiore attivazione)
durante lo svolgimento di diversi compiti.
Figura 7 Schema rappresentativo del problema diretto (a) dove, partendo dalle sorgenti, si calcola una mappa
del potenziale; inverso (b) ovvero partendo dalle misure di potenziale si localizzano le sorgenti all’interno del
volume cerebrale.
2.2.1 Il problema diretto
Potendo rappresentare una qualsiasi distribuzione di sorgenti di campo elettromagnetico come
un’espansione in termini di multipoli, il primo ordine dell’espansione per una densità di
22
corrente sarà rappresentato dal dipolo di corrente , che può essere rappresentato da un
vettore che punta nella direzione della corrente.
Ogni neurone piramidale presente nella corteccia è rappresentato da un dipolo di corrente
variabile in modulo nel tempo ma con direzione fissata, parallela a quella dell’assone.
Come mostrato in Figura 8, i neuroni piramidali sono disposti parallelamente e i loro campi
elettromagnetici si possono sommare se attivati simultaneamente, mentre i neuroni non
piramidali sono disposti radialmente e i loro campi elettromagnetici non possono essere
registrati dall’esterno in quanto tendono a dare somma nulla.
Figura 8 La figura mostra il modo in cui si sommano i campi elettromagnetici prodotti da neuroni piramidali
(sinistra) e neuroni non-piramidali (destra).
Si usa suddividere idealmente il tessuto cerebrale in n elementi di volume sufficientemente
piccolo vi e rappresentare la sorgente dei segnali EEG come somma vettoriale dei dipoli
varia istante per
contenuti all’interno di ciascun elemento di volume. Il dipolo somma istante in modulo e direzione, a causa della complessità delle strutture e dei processi cerebrali.
La densità di corrente sarà rappresentata da:
, (2.1)
23
Dove rappresenta la posizione dell’elemento vi in un opportuno sistema di riferimento. La
funzione δ(x) di Dirac permetterà di discretizzare correttamente il problema, ossia di passare
da un volume continuo ad un volume suddiviso in elementi discreti.
La densità di corrente è diversa da zero solo all’interno del volume Ω che rappresenta la
testa, e la distribuzione di potenziale da essa generata sulla superficie di Ω dà luogo all’EEG.
Formalmente ogni è funzione del tempo ma, come spiegato in seguito, per la descrizione
del problema si utilizza un’approssimazione quasi-statica delle equazioni di Maxwell, e
quindi d’ora in avanti con e si intende e , dove t0 è l’istante di tempo in cui
si vuole stimare il potenziale.
Definite le sorgenti, è utile ricavare l’espressione del potenziale elettrico in un mezzo
omogeneo e infinito di conducibilità costante e isotropa σ. In questo modo è possibile studiare
la dipendenza di V dalla posizione dei dipoli.
Come primo passo si definisce all’interno dello spazio infinito la conducibilità σ in una
regione Ω, che potremo assumere sferica, in cui è diversa da zero.
A questo punto si considera la quarta equazione di Maxwell:
+
∇×
1 (2.2)
In cui è costituita da due componenti: le sorgenti reali e le correnti indotte dai campi
generati da ! :
+ ! (2.3)
Normalmente le frequenze di interesse nell’EEG sono inferiori a 1 kHz; in questo range di
frequenze è possibile trascurare gli effetti capacitivi delle membrane cellulari, e quindi
trascurare il tempo che impiegano le cariche per distribuirsi sui bordi delle membrane dei vari
tessuti.
Per capire l’ordine di grandezza di questi tempi caratteristici si può notare che considerando
l’equazione di continuità della densità di corrente, e combinandola con la legge di Gauss in
una regione di conducibilità costante, si trova che la densità di carica decresce
esponenzialmente nel tempo
&
" ∝ $ %'
(2.4)
con τ = ε/σ; per il tessuto medio presente nell’encefalo (cranio compreso) si ottiene un valore
di τ ~ 1.8 ×10-9s. Siccome le frequenze di interesse in elettroencefalografia sono tali che
ωτ << 1, è possibile considerare valida l’approssimazione quasi statica.
24
L’approssimazione implica la continuità della corrente attraverso le superfici. Eliminando il
termine di derivata temporale del campo elettrico nella (2.2) e prendendo la divergenza di
entrambi i membri si ottiene:
0 ∇* + ! +
∇∙∇×
(2.5)
L’approssimazione quasi statica consente di eliminare il termine del potenziale vettore
dall’espressione del campo elettrico in funzione dei potenziali di campo, e quindi di utilizzare
la semplice relazione:
∇,
(2.6)
Inserendola nella (2.5) si ottiene l’equazione differenziale alle derivate parziali che descrive
completamente il problema:
∇ ∙ σ∇, ∇ ∙ ./Ω
(2.7)
Questa è un’equazione del secondo ordine, e la soluzione analitica o numerica per i diversi
modelli di Ω (il modello relativo al volume della testa, che per esempio in prima
approssimazione può essere considerato una sfera) fornirà la soluzione del problema
elettromagnetico diretto.
Ricaviamo, per semplicità, l’espressione del potenziale elettrico nello spazio infinito di
conducibilità costante σ in cui abbiamo scritto le equazioni precedenti.
In questo spazio, avendo identificato σ come una costante, l’equazione (2.7) diventa:
1, e, inserendo l’espressione di , si ottiene:
1
∇ ∙ σ
(2.8)
1, 2 ∙ ∑ ∇
4 .
(2.9)
1
7 49
|
|
(2.10)
Utilizzando la relazione
∇ 5
ed imponendo le condizioni al contorno V(∞) = 0 si ottiene
1
∙ ,: |
|;
49!
2
(2.11)
La dipendenza dalla distanza 1/r è caratteristica del dipolo; la complessità dei vari modelli di
Ω modificherà l’espressione del potenziale, tuttavia la dipendenza con l’inverso del quadrato
della distanza sarà comunque conservata.
25
2.2.2 Il problema inverso
Il problema inverso consiste nel risalire alla distribuzione di corrente che ha generato le
misure sullo scalpo, date quest’ultime. Tra i diversi approcci che portano alla soluzione del
problema inverso, vi sono i metodi derivanti da una regolarizzazione classica di tipo Tikhonov
[29] che generano una distribuzione spaziale di possibili sorgenti. Per questo motivo sono noti
anche come metodi distribuiti.
Dal punto di vista fisico, sono effettuate misure di una data distribuzione di potenziale sulla
superficie di un volume Ω. A partire da queste misure si vorrebbe ottenere la distribuzione
spaziale delle sorgenti che ha generato il potenziale misurato. Poiché il numero delle
incognite è infinito, nella pratica è opportuno discretizzare il volume Ω che corrisponde alla
corteccia cerebrale. Questo vincolo geometrico/fisiologico permette di restringere lo spazio
delle possibili soluzioni ad un numero finito di punti m. Questo numero rappresenta le
possibili posizioni all’interno di Ω in cui possono essere presenti dipoli di corrente. Per una
corretta modellizzazione della corteccia cerebrale, il numero m deve essere maggiore di due o
tre ordini di grandezza rispetto a nε (numero di elettrodi).
Il problema è costituito da un numero di incognite superiore al numero di equazioni, per cui è
necessaria una regolarizzazione per raggiungere una soluzione approssimata.
In primo luogo consideriamo la relazione lineare tra il potenziale misurato e le sorgenti,
questa relazione può essere espressa in forma algebrica come:
⋅ J
,<
(2.12)
dove, ∈ ℝℰ , rappresenta il vettore delle misure di potenziale elettrico, ∈ ℝB è il vettore
∈ ℝℰ ×B , detta Lead field matrix, è la matrice rettangolare che
contenente le sorgenti, e <
rappresenta la relazione tra il potenziale sugli elettrodi e le sorgenti.
La regolarizzazione del problema passa attraverso la minimizzazione di un funzionale
quadratico. Essa fornirà una stima della distribuzione delle sorgenti C che si cercherà quanto
più possibile simile a quella reale. Si definisce a questo scopo il funzionale D*C, E+:
⋅ F + EFCF
D*C, E+ F, <
(2.13)
Il primo termine di f mantiene minimo lo scarto quadratico delle misure V dall’incognita C
attraverso la relazione (2.12), mentre il secondo termine rende minima l’energia della
soluzione. Il parametro λ deve essere stimato in maniera indipendente e il suo valore
condiziona la qualità delle soluzioni. Con qualche semplice passaggio di analisi multivariata è
possibile ottenere la soluzione:
26
M
,H/G
I<
J <
+ EKL <
J
C G
(2.14)
Dove l’apice + indica la pseudo inversa di Moore Penrose5 Questa soluzione tuttavia è poco
utilizzabile nella pratica, poiché la dimensione della matrici in gioco fanno sì che il calcolo
effettivo della soluzione espressa in questo modo comporti un enorme dispendio di tempo di
calcolo e di memoria.
che
Tuttavia è possibile dimostrare tramite decomposizione a valori singolari della matrice <
è equivalente a:
la matrice G
<
J I<
<
J + EKL
G
M
(2.15)
<
J sono nε × nε, riducendo il numero di elementi fino a sei
dove questa volta l’identità K e <
ordini di grandezza.
Questa soluzione è nota come norma minima, a causa del secondo termine del funzionale f
che tiene minima la norma delle soluzioni. Tuttavia è stato dimostrato che le soluzioni
ottenute con questo metodo sono incapaci di localizzare sorgenti profonde.
Per ovviare a questo problema il funzionale (2.13) può essere generalizzato introducendo la
nello spazio delle C. La matrice simmetrica e definita positiva N
ha lo scopo di
norma N
fornire un modo per pesare le soluzioni:
⋅ F + ECJ N
C
D*C, E+ F, <
(2.16)
con soluzione:
,H/G
N
% <
J I<
N
% <
J + EKL
C G
M
(2.17)
K si ottiene la (2.15). Pesando gli elementi diagonali con la norma delle
Ponendo N
colonne della Lead field matrix, è possibile compensare l’effetto dell’andamento 1/r2 del
potenziale:
OO%
N
P
<O H/Q 1, … , S
(2.18)
In questo modo nella soluzione sorgenti lontane dagli elettrodi hanno un peso più grande di
quelle superficiali.
La modellizzazione dell’attività corticale elettrica con dei dipoli equivalenti non è sempre
affidabile e accurata nella stima della soluzione del problema inverso. Data la scarsa
risoluzione spaziale che caratterizza l’EEG convenzionale, il problema inverso risulta essere
5
Generalizzazione della matrice inversa per una matrice A non quadrata con A+ = (ATA)-1AT
27
un problema con infinite soluzioni, cioè si possono trovare infinite distribuzioni di cariche
dipolari che spiegano un certo campo superficiale misurato con alcune decine di elettrodi. Ad
esempio, una tipica distribuzione elettrica prodotta dall’attività di un’area corticale all’interno
di un solco cerebrale può essere dovuta ad un singolo dipolo tangente, ma anche a due dipoli
disposti radialmente e opposti come orientamento (Figura 9).
È anche possibile che i dipoli che meglio approssimano i pattern spaziali dell’EEG, non
abbiano nessuna relazione con le sorgenti autentiche che le generano: ciò accade in genere per
i tessuti profondi, quando le sorgenti che occupano la superficie corticale ricoprono vaste aree
che vanno da pochi a centinaia di centimetri quadrati.
Figura 9 Distribuzione del campo elettrico (in alto) prodotto da due aree corticali con orientamento radiale (a
sinistra) e tangente (a destra). La freccia indica l’orientazione del dipolo rispetto all’elettrodo che rileva il
campo elettrico.
2.3 Acquisizione del segnale EEG
La registrazione del segnale EEG avviene in maniera non invasiva attraverso l’uso di piccoli
elettrodi usualmente costituiti da placche di Ag rivestite elettroliticamente da AgCl. Tali
elettrodi vengono posti sul cuoio capelluto a contatto con la pelle (opportunamente sgrassata).
A volte, per evitare che gli elettrodi si stacchino o per maggiore comodità, essi sono sostituiti
da una cuffia elasticizzata con elettrodi già posizionati.
Il potenziale rilevato va generalmente da pochi a 150 µV, per cui si rende necessario
l’impiego di amplificatori di alto guadagno e particolarmente insensibili al rumore.
In Figura 10 è possibile osservare uno schema a blocchi per un sistema di acquisizione EEG.
28
Figura 10 Schema a blocchi di un sistema di acquisizione dei segnali EEG
2.3.1 Gli elettrodi
Gli elettrodi sono dei conduttori metallici attraversi i quali i potenziali prelevati dallo scalpo
sono trasferiti agli amplificatori per la successiva registrazione.
È necessario un elemento conduttore come pasta conduttrice o fluido fisiologico per trasferire
i potenziali fisiologici agli elettrodi EEG.
L’interfaccia pelle-elettrolita-elettrodo forma il primo e, sotto molto punti di vista, il più
importante collegamento per una fedele acquisizione del potenziale rilevato dallo scalpo.
Quando un elettrodo è messo a contatto con l’elettrolita, avvengono delle variazioni
elettrochimiche nell’immediata vicinanza dell’elettrodo stesso con migrazione ionica dalla
superficie dell’elettrodo nella soluzione e viceversa.
Queste migrazioni avvengono con diverse velocità e il risultato è una distribuzione locale di
carica descrivibile come un doppio strato elettrico nel quale c’è predominanza di una carica
sulla superficie metallica e della carica opposta sulla superficie dell’elettrolita ad esso
adiacente.
Il comportamento elettrico di questo doppio strato è assimilabile a quello di un condensatore e
di un resistore connessi in parallelo tra loro e ad una batteria.
I valori di questi componenti non sono costanti e dipendono da variabili come il tipo di
metallo dell’elettrodo, la natura, concentrazione e temperatura dell’elettrolita, nonché la
frequenza e la densità della corrente che fluisce in essi. L’interfaccia pelle-elettrolita presenta
anch’essa una superficie avente elementi capacitivi e resistivi.
29
Una conseguenza del doppio strato elettrico è la differenza di potenziale nota come potenziale
di mezza-cella che esiste tra un elettrodo e l’elettrolita con cui esso viene a contatto.
Differenze di ampiezza di questi potenziali (potenziali di polarizzazione) possono verificarsi a
causa di impurità nella sostanza metallica o a causa della contaminazione della superficie.
Essendo i potenziali di polarizzazione dello stesso ordine di grandezza dei potenziali esistenti
nel cervello, e bene minimizzarli usando elettrodi di buona qualità e ben puliti.
2.3.2 Montaggio degli elettrodi
Al fine di garantire la copertura di tutte le aree corticali, durante l’acquisizione dei segnali
EEG, gli elettrodi vengono applicati sullo scalpo secondo il posizionamento standard
chiamato "sistema internazionale 10-20" [30].
Questo sistema descrive l’esatta posizione di ogni elettrodo, consentendo una buona copertura
di tutta la superficie encefalica e garantendo che gli elettrodi siano sempre posizionati sopra le
stesse aree (riproducibilità della configurazione degli elettrodi). Le posizioni dei sensori sono
misurate su delle linee, utilizzando come punto di partenza precise localizzazioni anatomiche.
10% oppure 20% si riferisce alla distanza tra due punti di riferimento cranici (Figura 11):
I: inion, prominenza alla base dell'osso occipitale
N: nasion, attaccatura superiore del naso
Questa distanza di solito va da 30 a 36 cm con grande variabilità interpersonale.
Vengono collocati da 10 a 20 elettrodi e una massa, lungo cinque linee:
-
P1 longitudinale esterna (Figura 11a- linea gialla)
-
P2 longitudinale interna di destra(Figura 11b – linea blu)
-
Longitudinale centrale (Figura 11b – linea viola)
-
P1 longitudinale esterna (Figura 11a - linea gialla)
-
P2 longitudinale interna di sinistra (Figura 11b – linea verde)
La linea trasversa T4-C4-Cz-C3-T3, risultante delle precedenti, (Figura 11b – linea rossa) è
denominata
“montaggio P3”,
ed
anch'essa
segue
la
regola
del
10-20%.
Gli elettrodi fronto-polari sono collocati al 10% (3-4 cm) della distanza I-N, sopra le
sopracciglia, i frontali vengono collocati sulla stessa linea dei fronto-polari, più sopra del
20%, poi vengono i centrali (+ 20%), infine i parietali (+ 20%) e gli occipitali (+ 20%); con
questi si arriva al 90% della distanza nasion-inion, ad una distanza del 10% dall'inion.
Come si vede in figura, alla posizione che ogni elettrodo occupa sullo scalpo fa riferimento
una sigla. Le sigle che individuano la posizione di un elettrodo sono formate da una/due
lettere, che permettono di identificare la regione della corteccia esplorata (FP: fronto-polare;
30
F: frontale; C: centrale; P: parietale; T: temporale; O: occipitale) e da un numero (o una z) che
identifica l’emisfero (numeri dispari: sinistra; numeri pari: destra; z: linea mediana).
P3
P1
P2
P2
Figura 11 Posizionamento elettrodi nel “Sistema Internazionale 10-20”
Come vedremo nel prossimo paragrafo, i segnali cerebrali prelevati sullo scalpo vengono
inviati, mediante gli elettrodi, ad amplificatori, ognuno dei quali ha due ingressi, uno
invertente (–) e l’altro non invertente (+).Pertanto gli elettrodi vengono utilizzati a coppie (un
elettrodo di riferimento e uno per il prelievo del segnale).
Esistono quattro tipi di prelievo:
•
unipolare (o monopolare)
•
bipolare
•
di media referenziale
•
laplaciano
Nel primo tipo (Figura 12a), per ogni coppia di elettrodi, uno è posto su un’area
elettricamente attiva ed è collegato al morsetto (+) dell’amplificatore, l’altro su un’area
relativamente inattiva (che coincide con il punto di massa utilizzato dall’amplificatore) ed è
un ingresso comune per tutti gli amplificatori (è collegato al morsetto (–)).
31
Il prelievo unipolare, che è in genere il più utilizzato, consente la registrazione di segnali
generati nelle strutture più profonde del cervello.
Nel prelievo bipolare (Figura 12b) entrambi gli elettrodi di ogni coppia sono posti su regioni
dello scalpo considerate elettricamente “attive”: il segnale registrato è quello proveniente
dagli strati esterni della corteccia cerebrale, in quanto i potenziali generati da sorgenti più
profonde vengono considerati di modo comune dall’amplificatore differenziale. In generale la
registrazione bipolare dà risultati più localizzati di quella unipolare ed è per questo più
diffusa.
Altri due metodi, il montaggio di media referenziale e il montaggio kaplaciano, sono usati
meno frequentemente; nel primo, tutti i segnali EEG amplificati dal dispositivo sono sommati
e la loro media è utilizzata come riferimento di massa comune per ogni canale; il secondo
invece misura la differenza di potenziale tra un elettrodo e la media (pesata con la distanza)
dei potenziali degli elettrodi circostanti (elettrodi di surrounding).
Figura 12 Le due più diffuse tipologie di montaggio degli elettrodi: il cavo A corrisponde all’elettrodo per
l’acquisizione, il cavo R rappresenta l’elettrodo di riferimento e G quello di massa.
2.3.3 Amplificazione
Questo stadio serve per amplificare i segnali elettrici provenienti dagli elettrodi, usualmente
piuttosto deboli (decine di µV).
In questo processo è utilizzato un particolare tipo di amplificatore detto amplificatore per
strumentazione (Figura 13). Esso è realizzato sul modello di un amplificatore differenziale
(Figura 14) e presenta le seguenti caratteristiche:
-
amplificazione con ingresso differenziale
-
guadagno elevato e noto con precisione
32
-
elevata impedenza di ingresso
-
bassissima tensione e corrente di offset
-
stabile in temperatura
-
buona risposta in frequenza
La sua elevata sensibilità lo rende naturalmente soggetto al rumore.
Figura 13 Amplificatore per strumentazione
Il circuito in figura si ottiene dalla configurazione differenziale aggiungendo due circuiti
inseguitori di tensione all’ingresso, il compito degli inseguitori di tensione è disaccoppiare la
sorgente del segnale con il resto del circuito evitando problemi di adattamento di impedenza.
Per mostrare il principio di funzionamento di un amplificatore per strumentazione, faremo
quindi riferimento, per semplicità, proprio ad un amplificatore differenziale quale quello
contenuto in un amplificatore operazionale.
Un amplificatore differenziale è progettato per fornire in uscita un segnale pari alla differenza
amplificata dei segnali ai suoi ingressi (Figura 14).
Figura 14 Amplificatore differenziale.
In riferimento alla figura, v1 e v2 sono le tensioni applicate ai due ingressi + e – (ingresso noninvertente e ingresso invertente rispettivamente), e v0 è la tensione in uscita:
T UV T T (2.19)
33
Dove Ad è il guadagno differenziale. Questo dispositivo è utilizzato per amplificare (ed
eventualmente misurare) la differenza di potenziale tra due punti di un circuito (nel nostro
caso tra due punti dello scalpo). L’amplificatore differenziale, e soprattutto quello
espressamente progettato per la strumentazione, è utilizzato per la misurazione di segnali di
debole entità.
Le interferenze elettromagnetiche che si propagano nello spazio, come quelle dovute alla
circolazione della corrente alternata di alimentazione o provenienti da vari dispositivi
elettronici in funzione, influenzano in maniera uguale i segnali catturati dagli elettrodi
(distanti uno dall’altro pochi centimetri) e quindi l’amplificatore elimina gli effetti di disturbi
comuni ai due ingressi. Infatti, se tra v1 e massa, e tra v2 e massa, vengono iniettati due segnali
di uguale tensione, ad esempio due onde sinusoidali a 50Hz con la stessa fase e ampiezza,
qualsiasi sia il valore del guadagno differenziale, la tensione in uscita, secondo la (2.19), è 0.
Questa particolare caratteristica permette di migliorare la qualità del segnale amplificato
eliminando le interferenze elettromagnetiche comuni ai due ingressi. Il segnale di modo
comune, ossia comune ai due ingressi, è definito come:
,WB T +T
2
(2.20)
L’insensibilità dell’amplificatore alla componente comune ai due ingressi, viene definita
come rapporto di reiezione di modo comune, noto con l’acronimo di CMRR (Common Mode
Rejection Ratio) dato dalla seguente formula espressa anche in forma logaritmica:
\
YZ[[ \ ]
(2.21)
^_
UV
YZ[[V` 20 log d
d
UWB
(2.22)
Dove Ad e Acm sono rispettivamente l’amplificazione di modo differenziale e di modo comune.
Il CMRR è inversamente proporzionale all’amplificazione di modo comune, quindi minore è
l’amplificazione dei segnali comuni ai due ingressi e minore è il livello di interferenza sul
segnale di interesse.
Le considerazioni fatte in precedenza valgono per un sistema ideale; nel caso in un sistema
reale, le formule restano invariate, ma sono soggette a fattori di dipendenza dai materiali e dai
metodi di costruzione dei componenti, che limitano i valori del CMRR effettivamente
ottenibili.
Un CMRRdB molto alto è un parametro fondamentale per la scelta di un amplificatore per la
realizzazione di una BCI.
34
2.3.4 AC-Coupler
In quasi tutti i moderni sistemi per la registrazione dei segnali elettroencefalografici, subito
dopo l’amplificazione per strumentazione troviamo un filtro passa alto con una frequenza di
taglio di circa 0,3Hz (variabile a seconda delle configurazioni); questo filtro elimina la
possibile componente continua (o quasi continua) portata nel segnale dalla polarizzazione
degli elettrodi (realizzando quindi un accoppiamento AC, ossia in corrente alternata).
Eliminando la componente continua del segnale, si evita che venga via via amplificata negli
stadi successivi. Gli amplificatori per strumentazione integrati dispongono di un ingresso di
riferimento che permette, ad un circuito di feedback, di eliminare la componente continua in
uscita dall’amplificatore sottraendola dal segnale di ingresso.
Come accenneremo nel Capitolo 3, diverse tecniche di trattamento dati richiedono che non vi
sia nei segnali alcuna componente continua, di modo che ciascun segnale abbia media nulla.
2.3.5 Filtri
Dopo questa fase iniziale di amplificazione, i segnali attraversano un filtro passa basso
(frequenza di taglio a circa 100Hz, modificabile secondo l’uso) per eliminare le frequenze
indesiderate al di sopra delle frequenze EEG. In alcuni dispositivi è integrato un filtro notch, o
elimina banda, che, se impostato ad una frequenza centrale di 50/60Hz, riduce i disturbi
provenienti dalla corrente alternata delle linee elettriche di alimentazione.
I filtri passa basso sono utilizzati anche per evitare effetti di aliasing nella fase di
campionamento del segnale (paragrafo seguente). L'aliasing è un effetto indesiderato che si
verifica quando nel segnale da campionare (§2.3.6) sono presenti frequenze superiori alla
metà della frequenza di campionamento. Infatti il teorema di Nyquist stabilisce che è possibile
campionare senza errori un segnale avente larghezza di banda finita B utilizzando una
frequenza di campionamento almeno due volte superiore alla larghezza di banda del segnale
(frequenza di Nyquist). Nell'eventualità di componenti a frequenze superiori a quella di
Nyquist si avrà il così detto effetto di aliasing, nel quale le frequenze che superano la banda
massima danno luogo a segnali ricostruiti erroneamente (Figura 15).
35
Figura 15 Aliasing
2.3.6 Campionamento
L'ultimo processo che deve attraversare un segnale analogico per essere elaborato da un
computer è il campionamento, effettuato da un convertitore analogico/digitale (ADC). Ad una
determinata frequenza (sampling rate), i segnali in ingresso all'ADC vengono letti e
quantizzati ad un dato numero di bit, formando una sequenza discreta di valori estratti dal
segnale continuo in ingresso, facilmente interpretabile da un computer o da un
microcontrollore (processore con ridotte funzionalità e prestazioni). Come detto nel paragrafo
precedente, bisogna evitare effetti indesiderati come l’aliasing, rispettando la regola che
impone una frequenza minima di campionamento due volte superiore alla larghezza di banda
del segnale da campionare (nel caso di un segnale EEG la larghezza di banda è circa 40Hz).
In genere, però, si preferisce utilizzare un rapporto tra frequenza di campionamento e
larghezza di banda di 4:1 [31]. Quindi se per esempio intendiamo analizzare una banda con
frequenza massima di 32Hz, avremo bisogno di un campionamento a 32 × 4 = 128 campioni
al secondo. La qualità del segnale digitalizzato dipende principalmente dalla risoluzione di
quantizzazione (cioè dal numero di bit utilizzati per rappresentare un valore di tensione) e
dalla frequenza di campionamento come descritto in precedenza. Per spiegare come la
quantizzazione influisce sulla qualità, esporremo un esempio. Poniamo che i segnali EEG
amplificati arrivino al convertitore analogico/digitale con livelli di tensione tra 0 e 5V;con una
quantizzazione a n = 8 bit avremo una risoluzione del segnale pari a:
.eHfgh.H/$ i/j$k../j
$eeH 5,
m n 20ST
2
2
(2.23)
Questo sta a indicare che, con i dati sopra riportati, avremo un valore discreto ogni 20mV
rilevati. Se aumentiamo la quantizzazione a 16 o a 24 bit noteremo che la risoluzione totale
aumenterà; dividendo la tensione in ingresso per216 o 224,otteniamo:
.eHfgh.H/$i16p. 5,
n 76,
2q
(2.24)
36
.eHfgh.H/$i24p. 5,
n 0,3,
2s
(2.25)
Quindi maggiore è la quantizzazione (bit adoperati), migliore è la risoluzione. Ricordando che
le tensioni rilevate dagli elettrodi sono dell'ordine di alcune decine di µV, e tenendo presente
che i segnali che arrivano al convertitore ADC sono già amplificati, 16 bit possono essere
considerati più che sufficienti: se, ad esempio, il segnale viene amplificato 1000 volte, con
una risoluzione di 16 bit otteniamo un valore discreto ogni 0,07µV del segnale originale.
Nella scelta del valore di quantizzazione bisogna inoltre tener conto del possibile rumore
introdotto con essa: come spiegato in Linnenbank [32] il campionamento introduce rumore,
che può essere approssimato da un rumore gaussiano. Nella progettazione di un ADC per
segnali biologici bisogna tener conto del rapporto segnale-rumore a basse frequenze. In [32],
è proposto un metodo per calcolare il numero di bit necessari per una buona quantizzazione
sostanzialmente priva errori:
log u
,vwxy
,vwxy
| + 1 ≥ ~€{ ≥ log u
|
,z{y,vB{
3 ⋅ ,z{y,vB{
(2.26)
dove Vrange è il valore di tensione massimo all'ingresso del convertitore e Vnoise,rms è il valore
rms di tensione del rumore dell'amplificatore.
Dopo il campionamento, il segnale è trasmesso ad un computer o ad un altro dispositivo
hardware/software per l'elaborazione.
2.4 Tracciato EEG
In generale, il comportamento dinamico dell’attività elettrica cerebrale può essere diviso in
due principali categorie: i potenziali spontanei EEG, di cui parliamo in questo paragrafo, e i
potenziali evocati o potenziali evento correlati, che saranno discussi nel prossimo.
I potenziali spontanei EEG hanno una natura oscillatoria. In generale, nell'uomo in buona
salute, l'ampiezza dei potenziali elettrici registrati sullo scalpo varia da 20 a 100 µV, e viene
distinta in bassa (< 30µV), media (30-70µV) e alta (>70µV). Le oscillazioni EEG hanno
frequenze che variano da 1 a circa 60 Hz. Circa il 90 % del segnale EEG sembra altamente
casuale. Questi segmenti spesso non sono riconducibili a particolari stati mentali, sono
difficilmente interpretabili e di solito sono considerati attività di fondo o rumore.
L’attività elettrica corticale presenta oscillazioni diversamente caratterizzate da ampiezza e
frequenza e indicate con il termine di ritmi. L’ampiezza del segnale EEG dipende soprattutto
dal grado di sincronia col quale i neuroni corticali interagiscono, L’eccitazione asincrona di
un gruppo di neuroni genera un segnale EEG irregolare e con oscillazioni di bassa ampiezza.
37
Un’eccitazione sincrona, invece, produce un segnale di grande ampiezza dovuto alla somma
dei singoli contributi elettrici. I tracciati EEG sono caratterizzati da fluttuazioni di voltaggio
spontanee associabili a diversi stati mentali, di livelli di coscienza o disturbi patologici [33]. I
ritmi con alta frequenza e bassa ampiezza riflettono attività cerebrali associate allo stato di
sogno o di allerta, mentre ritmi con bassa frequenza e maggiore ampiezza si registrano
durante lo stato di sonno profondo. Infatti, quando la corteccia è attivamente occupata nel
processamento di informazioni, o nella generazione di input sensoriali come avviene nello
stato di allerta, il livello di attività neuronale è relativamente alto ma anche asincrono, perché
ogni singolo neurone, o piccolo gruppo di neuroni, è occupato in uno specifico aspetto
dell’attività mentale e si attiva rapidamente ma con poca sincronia rispetto ai neuroni
adiacenti. Durante lo stato di sonno profondo, invece, un gran numero di neuroni corticali,
non essendo occupati in un’intensa elaborazione di informazioni, viene eccitato in fase,
generando una risposta altamente sincrona e producendo così un segnale EEG dotato di
maggiore ampiezza.
Le oscillazioni appartengono a caratteristiche bande di frequenza (Tabella 1), hanno
specifiche distribuzioni spaziali, e sono associate a differenti stati cerebro-funzionali. I ritmi
dell’EEG sono classificati in ritmo δ, θ, α, β, µ e γ. Il ritmo delta (δ) ha oscillazioni a
frequenze inferiori a 4Hz; tipicamente non è presente in condizioni fisiologiche normali ed è
pertanto associato a stati patologici. Il ritmo theta (θ) presenta oscillazioni nella banda 4-7Hz
ed è presente durante gli stati di sonno profondo. Il ritmo alfa (α) è caratterizzato da
oscillazioni nella banda 8-13Hz, ha un’ampiezza media di 30µV e viene registrato in un
soggetto sveglio ad occhi chiusi; viene tipicamente correlato a stati di rilassamento mentale. Il
ritmo beta (β) è molto veloce, con frequenza 14-30Hz. Ha ampiezza piccola (1-20µV) ed è
associato a livelli di coscienza come l’attenzione e la concentrazione. Il ritmo mu (µ), 812Hz,è presente solo in alcuni soggetti e solamente in stato di veglia e/o quando il soggetto
non si sta concentrando su alcuna attività motoria o sensoriale. Infine, il ritmo gamma (γ) ha
frequenza superiore a 30Hz e piccola ampiezza; è legato a stati di elaborazione attiva delle
informazioni della corteccia ed è tipicamente osservato durante il movimento delle dita.
38
Tipo
Freq. (Hz)
Delta
inferiori a 4
Theta
Ampiezza (µV)
Locazione
Stato mentale
fino a 200
tutto l’encefalo
stato patologico
da 4 a 7
fino a 100
temporale/parietale
sonno profondo
Alfa
da 8 a 13
30
occipitale/parietale
rilassamento
Beta
da14 a 30
1-20
parietale frontale
concentrazione
Mu
da 8 a 12
fino a 80
corteccia motoria
veglia
Gamma
superiori a 30
fino a 10
tutto l’encefalo
elaborazione delle
informazioni
Tabella 1I ritmi cerebrali e loro caratteristiche.
2.5 I potenziali evocati evento-correlati (ERP)
L’EEG, come visto, esprime l’attività elettrica spontanea, cioè non dovuta ad un particolare
evento; è possibile registrare attività cerebrale anche in risposta ad uno stimolo esterno, che
attivi il talamo e i circuiti corticali. Questo tipo di attività è detta potenziale evocato: a
qualsiasi stimolazione sensoriale esterna, il cervello risponde con un’onda specifica,
caratterizzata da una particolare latenza, ampiezza e polarità.
Figura 16 Esempio di ERP
Un dato potenziale evocato compare ad intervalli di tempo approssimativamente costanti dalla
presentazione dello stimolo e, poiché l’ampiezza di una singola risposta è piccola rispetto alle
fluttuazioni dell’ampiezza dell’intero EEG, dal tracciato viene estratta la risposta media di
una serie di risposte singole (averaging), in modo da elidere le fluttuazioni casuali dell’EEG.
Le variazioni del potenziale che non sono sincronizzate con lo stimolo, cioè, si cancellano,
mentre quelle sincronizzate si sommano (a ovvia condizione che siano in fase).
39
L’onda evocata media si evidenzia così, nettamente, sullo sfondo di attività elettrica continua
e si caratterizza, da un punto di vista morfologico, come un picco che può avere polarità
positiva o negativa (P o N). La Figura 16 mostra un esempio di potenziale evocato. Si noti
che, per convenzione, l’asse del potenziale è invertito rispetto all’uso comune, a causa della
modalità di visualizzazione dei vecchi dispositivi galvanometrici.
I potenziale evocati si distinguono in due tipi fondamentali:
-
Stimolo-correlati, dipendono dalle caratteristiche fisiche dello stimolo. La loro latenza è
nell’ambito temporale della percezione.
-
Evento-correlati o ERPs, la loro generazione è funzione del contesto psicologico
(evento) in cui avviene la stimolazione. La loro latenza è nell’ambito temporale dei
fenomeni attentivi o della cognizione.
I potenziali evocati sono quindi modificazioni elettriche che avvengono nel sistema nervoso
centrale a seguito di uno stimolo esterno: in questo senso i potenziali evocati, quali gli acustici
o visivi, rappresentano la risposta obbligata ad uno stimolo particolare, e le loro caratteristiche
identificative (latenza e ampiezza) dipendono dalle caratteristiche fisiche dello stimolo
applicato (tono e intensità per quelli uditivi, contrasto, luminosità e frequenza spaziale per
quelli visivi).
I potenziali evento-correlati, diversamente da quelli stimolo-correlati, sono dipendenti dal
contenuto informativo dello stimolo: compaiono solo quando il soggetto presta attenzione allo
stimolo e quando a questo è stato attribuito un “significato”.
2.6 Potenziali utili per sistemi BCI
Di seguito sono illustrati brevemente i segnali più utilizzati per la realizzazione di sistemi BCI
con una loro breve spiegazione e tipologia di registrazione [34]:
•
P300;
•
SCP (slow cortical potential);
•
VEP (visual evoked potential);
•
SSVEP (steady state visual evoked potential);
•
ritmi µ e β;
•
frequenza dei potenziali d’azione dei neuroni corticali.
L’onda P300 è un potenziale evocato evento-correlato che si verifica quando l’attenzione del
soggetto è catturata da uno stimolo con valenza cognitiva. Il segnale ha una forma d’onda
caratterizzata dalla presenza di un picco positivo (P) dopo una latenza di circa 300ms dalla
40
presentazione dello stimolo, e da questo prende il nome (Figura 17). La latenza della P300
esprime il tempo impiegato dal soggetto per completare il pieno riconoscimento dello stimolo
atteso. L’ampiezza, invece, è funzione della quantità d’informazione da esso trasmessa al
soggetto [35]. Risulta quindi molto utile come indice di concentrazione in quanto la P300 è
presente solo in quei casi in cui l’individuo è consapevole dello stimolo ricevuto.
La P300 può essere misurata sia in modo invasivo che non invasivo ed è preponderante nella
zona parietale dell’encefalo (elettrodi in posizione mediale da nasion ad inion, è rilevato in
prevalenza su Cz nel sistema 10-20).
Figura 17 L’onda P300
Slow Cortical Potential (Figura 18): costituiscono le basse frequenze del segnale
elettroencefalografico. Questi potenziali hanno una latenza che varia tra i 5 ed i 10 secondi e
sono caratteristici dei movimenti complessi che necessitano un coinvolgimento della corteccia
cerebrale. L’uomo è in grado di controllare questi potenziali che quindi possono essere
utilizzati come segnali di controllo in ambiente BCI [36]. L’utilizzo di questo tipo di segnali è
però raro poiché necessita di un addestramento abbastanza lungo; la velocità di risposta del
sistema finale è relativamente contenuta.
41
Figura 18 Slow CorticalPotential.
Il potenziale evocato visivo (Visual Evoked Potential, VEP) è causato da una stimolazione del
campo visivo del soggetto e riflette i meccanismi elettrofisiologici alla base del processo di
elaborazione dell’informazione visiva a livello cerebrale. È di solito misurato non
invasivamente con elettrodi in zona occipitale. Gli stimoli maggiormente utilizzati sono dei
flash luminosi ad una certa frequenza o delle scacchiere in cui i quadri bianchi e neri sono
continuamente invertiti.
Nel caso di pazienti affetti da patologie che provochino una notevole attività muscolare in
zona cervicale (spasmi muscolari dovuti a crisi epilettiche, movimenti involontari della
testa…), l’utilizzo dell’elettroencefalogramma per la registrazione di segnali in regione
occipitale risulta impossibile; una soluzione è l’utilizzo di uno strip di elettrodi epidurali in
modo da evitare la registrazione di EMG involontario che andrebbe a sporcare in modo
considerevole il segnale [37].
Steady State Visual Evoked Potential o SSVEP (Figura 19) sono potenziali evocati, molto
simile ai VEP già discussi, generati tramite stimolazione visiva. Come richiamato dal nome,
questi potenziali sono di tipo steady-state, cioè il potenziale generato da una stimolazione
visiva con frequenza superiore ai 3 Hz ed inferiore ai 75 Hz si mantiene nel tempo (nel caso
di normale VEP il segnale è transiente con latenza di circa 125ms [38]). Nel caso di
potenziale steady-state, la stimolazione provoca la generazione di una risposta periodica a
livello corticale a frequenza multipla intera del segnale di stimolazione. Il metodo di
registrazione è del tutto simile a quello utilizzato per i normali potenziali evocati visivi.
42
Figura 19 Spettro di ampiezza di SSVEP in risposta ad una stimolazione visiva a 7Hz a)Spettro su un singolo
trial b) Spettro Mediato su 40 trial
I ritmi µ (Figura 20a) sono delle particolari frequenze tra 8 e 12 Hz presenti nella regione
sensoriale primaria e nella corteccia motoria e premotoria. Questi ritmi, già visti nel §2.4,
sono presenti solo in alcuni soggetti e solamente in stato di veglia e/o quando il soggetto non
si sta concentrando su alcuna attività motoria o sensoriale. I ritmi µ sono associati a frequenze
tra 18-26 Hz mentre i ritmi β spesso sono armoniche dei primi.
Il movimento e la semplice preparazione all’atto motorio provocano una diminuzione dei
ritmi µ e β in particolare nella zona contro-laterale. L’abbassamento dei due ritmi è detto ERD
(event-related desynchronization) mentre la relativa controparte a movimento eseguito è
denominata ERS (event-related synchronization). ERD e ERS possono essere molto utili in
ambito BCI come segnali di comando in quanto possono essere facilmente registrati tramite
un normale EEG e, soprattutto, in quanto presenti anche quando il movimento non viene
eseguito ma solo “pensato” o visualizzato: il cosiddetto motor imagery [18].
Negli ultimi anni si è dimostrato che alcuni animali (in particolare gli scimpanzé) riescono a
controllare la frequenza di “sparo” (Figura 20b) di neuroni corticali per imparare ad
utilizzare un braccio robotico. Lo stesso principio e l’utilizzo di elettrodi intracorticali (un
metodo invasivo) permettono ad un disabile di muovere un cursore su un video per la
selezione di lettere o icone. L’utilizzo di questi segnali, come per il caso dei potenziali SCP,
43
necessita, però, di un lungo addestramento e, a causa sia del basso bit-rate sia dell’invasività
degli elettrodi, viene poco utilizzato [18].
Figura 20 a) Ritmo µ per il controllo del movimento di un cursore b) Attività dei neuroni corticali.
44
3 ANALISI DEI DATI EEG
Una volta acquisito, il segnale EEG è pronto per la sua prima elaborazione, che consisterà
nell’identificare e, se possibile, eliminare, differenti tipi di artefatti.
Questi artefatti sono configurazioni anomale dei segnali responsabili di analisi errate e di
riduzione dell’usabilità di un sistema BCI, soprattutto se vengono utilizzati sistemi di
identificazione automatica. Il riconoscimento e l’eliminazione in tempo reale di artefatti in un
tracciato EEG è un compito molto complesso ma essenziale per lo sviluppo di un sistema
pratico e funzionale.
Gli artefatti possono essere definiti come eventi legati ad un’attività elettrica che viene
rilevata dall’EEG, ma che non deriva dall’attività cerebrale e da cui non è facilmente
distinguibile.
Essenzialmente i metodi per la rimozioni degli artefatti possono essere classificati in due tipi:
-
Metodi di reiezione che consistono nello scartare parte del tracciato EEG contaminato
dagli artefatti, basandosi su individuazioni automatiche o visuali. Il successo di questi
metodi è legato, prima di tutto, alla qualità del metodo di individuazione dell'artefatto, e
dipende dal tipo di applicazione. Per una BCI possono essere metodi adeguati, ma per
un’applicazione per un paziente affetto da epilessia, le scariche dovute alle crisi
epilettiche potrebbero essere scartate come artefatti, portando ad una perdita
considerevole di dati sulla patologia.
-
Metodi di sottrazione basati sull'assunzione che il tracciato EEG sia una combinazione
lineare (o non lineare) del segnale EEG originale e dei segnali generati da fonti di
disturbo, quali il movimento degli occhi e altri movimenti muscolari. L'utilizzo di un
elettrooculogramma, EOG, permette di rilevare il potenziale prodotto dal movimento
oculare. Se all'EEG registrato è sottratto il segnale EOG, con appropriati pesi a seconda
dei canali analizzati, esiste la possibilità ottenere una parziale eliminazione
dell'artefatto. Questo metodo non e però esente da errori.
Finita la fase di preprocessing, l’ultima parte di una BCI è dedicata all'analisi, all'estrazione
delle caratteristiche di interesse atte a discriminare il segnale, alla sua classificazione (e.g.
mano destra vs mano sinistra, oppure nel nostro caso vocale /a/ vs vocale /i/), all’invio di un
comando opportuno verso l’attuatore (dispositivo di feedback). A seconda del tipo di
caratteristica da estrarre, vengono utilizzati metodi matematici differenti. Ad esempio se si
desidera estrarre informazioni sulla frequenza del segnale, si utilizza la trasformata di
45
Fourier(§3.3); se si desidera estrarre informazioni relative alla distribuzione spaziale sullo
scalpo del segnale EEG, si applicanoalgoritmi di Common SpatialPatterns (di cui tratterà il
§3.4).
3.1 Classificazione degli Artefatti
Gli artefatti possono essere classificati in tre categorie:
-
Attività transitorie: consistono in picchi di grande ampiezza, rilevabili testando
l’ampiezza picco-picco. Possono essere dovuti ad attività muscolare, movimenti, attività
elettrocardiografica, ad una cattiva connessione degli elettrodi e alla loro impedenza.
Gli artefatti dovuti ad attività muscolare possono essere ridotti o eliminati chiedendo al
soggetto di rilassarsi. Per movimenti, si intendono del corpo, della testa e dei cavi degli
elettrodi che possono essere causa degli artefatti anche quando gli elettrodi sono ben
collegati.
-
Rumore periodico: le fonti del rumore periodico sono suddivisibili in due gruppi,
artefatti esogeni e artefatti endogeni. Gli artefatti endogeni sono dovuti a sorgenti di
interferenze che si trovano fuori dal soggetto. La fonte principale è costituita dalla
corrente di rete, ovvero un segnale a 50/60 Hz. Questi artefatti sono tipicamente rilevati
da elettrodi con alta impedenza, o da lunghi cavi, i quali fungono da antenna, rilevando
il rumore dall’ambiente circostante. Altresì, tali artefatti possono essere introdotti da
cavi non schermati. L’utilizzo dei cavi ben schermati e di una stanza ben isolata per
effettuare la registrazione, può ridurli notevolmente. Un metodo valido è anche
l’utilizzo di un filtro passa-basso a media mobile. Se indichiamo con M la lunghezza
del filtro e con H[f] la risposta in frequenza, l’espressione di questo filtro è data da:
‚Dƒ e./9DZ
, 0 0
Ze./9D
(3.1)
Figura 21 Artefatti non fisiologici: a sinistra interferenza proveniente dalla linea di alimentazione, a destra
disturbo legato al movimento del sensore
46
Gli artefatti più gravi sono dovuti al battito delle palpebre e ai movimenti oculari. Il
movimento oculare e delle ciglia causa un aumento di potenziale tra la cornea e la retina di
circa 100mV [39]; questo disturbo affligge principalmente i segnali provenienti dagli elettrodi
in posizione frontale Fp1; Fp2; F3; F4; F7; F8, ed è riconoscibile dalla presenza, nel tracciato
EEG, di spike caratterizzati da bassa frequenza e notevole ampiezza. Nella Figura 22 si può
notare un tracciato EEG privo di artefatti oculari, registrato nella posizione frontale Fp1e lo
spettro di frequenze corrispondente.
Figura 22 Tracciato EEG privo di artefatti oculari.
La Figura 23 mostra invece l'artefatto causato dal battito delle palpebre. Come si può notare,
le basse frequenze nello spettro vanno in saturazione; un battito di palpebre infatti può essere
interpretato come una pulsazione a bassissima frequenza.
Figura 23 Tracciato EEG con un artefatto oculare.
Nella Figura 24 infine si nota come il battito delle palpebre può notevolmente influenzare
anche le posizioni degli elettrodi vicini (F7, F8, F3 e F4).
In alcune situazioni questi artefatti vengono eliminati con un esame visuale del tracciato
registrato. In Nakamura [40] vengono presentati alcuni semplici criteri per il riconoscimento
di artefatti, che possono essere d'aiuto per un’identificazione automatica. Alcuni di questi
criteri sono i seguenti:
-
elevate ampiezze nelle onde delta (0.5-4Hz) nelle posizioni Fp1 e Fp2;
-
similitudini nei segnali registrati nelle posizioni Fp1 e Fp2;
47
-
rapidi cali nelle ampiezze delle onde delta rilevate posteriormente (le ampiezze delle
onde delta in Fp1 e Fp2 sono più alte rispetto agli altri canali rilevati).
Figura 24 Tracciati EEG influenzati da artefatti
3.2 Metodo ICA
L'analisi delle componenti indipendenti (Independent Component Analysis, ICA) è un metodo
che permette di separare e rimuovere una vasta gamma di artefatti dai dati di un EEG con una
decomposizione lineare. Questo metodo si basa su alcune assunzioni:
-
I segnali temporali registrati sullo scalpo sono combinazioni spazialmente stabili delle
attività cerebrali e delle sorgenti degli artefatti;
-
Il ritardo di propagazione tra la sorgente e l'elettrodo è nullo.
Una volta estratte le sorgenti indipendenti dai dati acquisiti, viene derivato il segnale EEG
corretto, eliminando le sorgenti degli artefatti.
Per definire rigorosamente la ICA, possiamo usare il modello delle variabili latenti statistiche
[41]. Si supponga di osservare n combinazioni lineari „ , … . . , „ di n componenti
(statisticamente) indipendenti:
„O iO e + iO e +. . . iO e H/Q 1, … , /
(3.2)
Se si considera ogni campione del segnale „O come la realizzazione di una variabile
aleatoria„O anziché un vero e proprio segnale temporale, possiamo eliminare la dipendenza da
t ed alleggerire la notazione; stessa cosa vale per e. Senza perdita di generalità, possiamo
48
assumere che sia le variabili di miscela che le componenti indipendenti (le sorgenti) abbiano
media zero: se questo non fosse vero, allora le variabili osservabili xi possono sempre essere
centrate sottraendo la media del campione, il che rende il modello a media nulla. D’altra
parte, ricordiamo che nell’apparato di misura l’accoppiamento tra amplificatori e filtri è
realizzato in AC, il che tendenzialmente dà automaticamente segnali a media nulla.
È conveniente utilizzare la notazione matriciale invece delle somme, come nell'equazione
precedente:
„ Ue
(3.3)
A volte abbiamo bisogno delle colonne della matrice A; denotiamole con iO .In tal modo, il
modello può anche essere scritto così:
„ i e
(3.4)
Il modello statistico in (3.2) è chiamato analisi delle componenti indipendenti, o modello ICA.
Il modello ICA è un modello generativo, il che significa che descrive come i dati osservati
sono generati da un processo di miscelazione delle componenti si. Le componenti
indipendenti sono variabili latenti, ossia non possono essere osservate direttamente. Anche la
matrice di mixing si presume essere sconosciuta. Tutto ciò che osserviamo è il vettore casuale
„, e noi dobbiamo stimare sia A che e a partire da esso.
Assumiamo che le distribuzioni a cui appartengono le variabili casuali non siano note (se
fossero note, il problema sarebbe notevolmente semplificato). Per semplicità, poniamo che la
sconosciuta matrice di mixing sia quadrata. Allora, dopo la stima della matrice A possiamo
calcolare la sua inversa, detta W e ottenere le componenti indipendenti:
e N„
(3.5)
La tecnica ICA è strettamente legata al metodo di separazione alla cieca delle fonti (BSS,
Blind Source Separation). “Cieca” significa che si conosce molto poco, o nulla, sulla matrice
di mescolamento. L’ICA è dunque un metodo, forse il più utilizzato nelle diverse varianti, per
l’esecuzione di separazione cieca delle fonti.
3.2.1 Ambiguità nel modello ICA
Nel modello ICA della (3.3), è facile individuare le seguenti ambiguità, che non possono
essere eliminate:
1. Non siamo in grado di determinare le varianze delle singole componenti indipendenti.
49
La ragione è che, essendo sia e che A sconosciute, un fattore moltiplicativo αi in una delle
sorgenti si può essere compensato dividendo la corrispondente colonna i di A per il
medesimo scalare αi:
„ 5
1
i 7 e † † (3.6)
Quindi è lecito e conviene fissare l’entità delle componenti indipendenti, in quanto variabili
casuali, assumendo che ciascuna abbia varianza unitaria: ‡e } 1. Allora la matrice A sarà
opportunamente riadattata.
2. Non esiste un ordine univoco delle componenti indipendenti.
La ragione è che, essendo sia e che A sconosciute, possiamo liberamente modificare l’ordine
dei termini nella somma in (3.4), e chiamare uno qualsiasi dei componenti il primo.
Formalmente una matrice di permutazione P e la sua inversa possono essere inserite nel
modello nel seguente modo: „ U‰ % ‰. Gli elementi di ‰e sono le variabili originali eO ma in
un ordine diverso. La matrice U‰% è la nuova matrice di mescolamento che deve essere
ricavata.
3.2.2 Indipendenza e incorrelazione
Variabili statisticamente indipendenti soddisfano la seguente proprietà:
‡j„ℎ‹} ‡j„} ‡ℎ‹}
(3.7)
dove j„ e ℎ‹ sono due funzioni integrabili di x e y rispettivamente.
Due variabili casuali ‹ e‹ si dicono invece incorrelate se la loro covarianza è nulla:
‡‹ , ‹ } ‡‹ } ‡‹ } 0
(3.8)
Se le variabili sono indipendenti, esse sono incorrelate: questo segue direttamente
dall’equazione (3.7), prendendo j„ ‹ e ℎ‹ ‹ . Si può dimostrare che (tranne nel
caso di variabili aleatorie aventi entrambe distribuzione gaussiana) non vale il viceversa,
quindi la condizione di indipendenza statistica è più forte della condizione di incorrelazione.
Poiché l’indipendenza implica l’incorrelazione, molti metodi ICA vincolano la procedura di
stima in modo che dia sempre le stime non correlate delle componenti indipendenti. Questo
riduce il numero di parametri liberi e semplifica il problema.
50
Scarica