UNIVERSITÀ DEGLI STUDI DI TORINO FACOLTÀ DI SCIENZE MFN Laurea Magistrale in Fisica Biomedica A.A. 2008-2009 RICERCA AUTOMATICA DI NODULI IN CT POLMONARI Candidato: Serena Valzano Relatore: Prof.Cristiana Peroni Corelatore: Dott. Piergiorgio Cerello Indice 1 Sistemi Computer Assisted Detection 4 1.1 Storia del CAD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Funzionamento del CAD . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2.1 Preprocessamento e Segmentazione . . . . . . . . . . . . . . . 6 1.2.2 Classificazione delle ROI . . . . . . . . . . . . . . . . . . . . . 7 1.2.3 Estrazione delle features dalla ROI . . . . . . . . . . . . . . . 7 1.2.4 Classificazione delle ROI . . . . . . . . . . . . . . . . . . . . . 7 Prestazioni del CAD . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.3.1 Curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.3.2 Curva FROC . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Alcuni esempi di CAD . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.4.1 CAD per il cancro alla mammella . . . . . . . . . . . . . . . . 12 1.4.2 CAD per il cancro al colon . . . . . . . . . . . . . . . . . . . 13 1.3 1.4 2 CAD polmonare 2.1 16 MAGIC-5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.1.1 Database di MAGIC-5 . . . . . . . . . . . . . . . . . . . . . . 18 2.2 Caratteristiche di un sistema CAD polmonare . . . . . . . . . . . . . 20 2.3 Algortmo di segmentazione . . . . . . . . . . . . . . . . . . . . . . . 21 2.3.1 Region Growing 3D . . . . . . . . . . . . . . . . . . . . . . 22 2.3.2 Wavefront algorithm . . . . . . . . . . . . . . . . . . . . . 23 2.3.3 Ciclo di ottimizzazione della soglia . . . . . . . . . . . . 25 2.3.4 Closing 3D . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 Identificazione candidati noduli: metodo ROI Hunter . . . . . . . . . 27 2.4.1 VBNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.4.2 RG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Riduzione dei falsi positivi . . . . . . . . . . . . . . . . . . . . . . . . 28 2.5.1 VBNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.5.2 RG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.4 2.5 2 3 Channeler Ant Model 3.1 3.2 3.3 3.4 33 Gli insetti sociali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 3.1.1 Modellizzazione delle formiche . . . . . . . . . . . . . . . 34 3.1.2 Ottimizzazione del percorso . . . . . . . . . . . . . . . . 34 Channeler Ant Model . . . . . . . . . . . . . . . . . . . . . . . . 35 3.2.1 Membri della colonia . . . . . . . . . . . . . . . . . . . . . . . 36 3.2.2 Regole di movimento . . . . . . . . . . . . . . . . . . . . . . . 37 3.2.3 Regole di rilascio di feromone . . . . . . . . . . . . . . . . . . 38 3.2.4 Ciclo di vita: riproduzione e morte . . . . . . . . . . . . . . . 39 3.2.5 Comportamenti anomali . . . . . . . . . . . . . . . . . . . 39 3.2.6 Implementazione del modello . . . . . . . . . . . . . . . . . . 40 Analisi del modello . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.3.1 Immagini artificiali . . . . . . . . . . . . . . . . . . . . . . . . 42 3.3.2 Parametri di ottimizzazione . . . . . . . . . . . . . . . . . . . 43 Osservazioni sull’algoritmo CAM . . . . . . . . . . . . . . . . . . . . 44 3.4.1 47 Segmentazione dell’oggetto . . . . . . . . . . . . . . . . . . . 4 Analisi 49 4.1 Considerazioni iniziali . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.2 Mappa di feromone . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.3 Estrazione delle features . . . . . . . . . . . . . . . . . . . . . . . 53 4.4 Analisi della posizione delle ROI . . . . . . . . . . . . . . . . . 53 4.4.1 Correzione dell’algoritmo . . . . . . . . . . . . . . . . . . . . 56 4.4.2 Match . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.4.3 ANODE09 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.4.4 LIDC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.4.5 GStest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 Classificazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.5 Bibliografia 64 3 Capitolo 1 Tumore al polmone Il cancro al polmone rappresenta la prima causa di morte nei paesi industrializzati. E’ una neoplasia che può colpire sia uomini che donne: i morti per tumore al polmone sono più di un milione ogni anno e la possibilità di sopravvivenza è bassa rispetto alla maggior parte di altri tipi di tumori. Il picco d’incidenza maggiore si ha negli uomini con età compresa tra i 55 e i 65 anni, ma sono sempre più frequenti i casi di tumori che insorgono intorno ai 35 anni. In Italia è la neoplasia più diffusa, basti pensare che ogni anno vengono colpite 35000 persone circa (in parte da tumore maligno e in parte benigno) tra uomini e donne. Il numero di nuovi casi è in crescita costante, e questo è dovuto ad un precedente aumento dell’industrializzazione, dell’abitudine al fumo, la presenza di polveri sottili; ciò fa ipotizzare che nei prossimi anni ci sarà un aumento del numero di tumori polmonari diagnosticati. 1.1 Il polmone Il polmone è l’organo responsabile della respirazione. Si divide in due parti: destro e sinitro; entrambi si trovano nella cavità toracica ai lati del cuore e hanno la capicità di contrarsi e rilassarsi seguendo i movimenti della gabbia toracica. Il polmone destro, più pesante, è diviso in tre parti ( superiore, medio e inferiore ), mentre il polmone sinitro, più leggero, è diviso solo in due parti (inferiore e superiore). I polmoni sono ricoperti da un tessuto spugnoso ed elastico che si adatta ai movimenti respiratori; sono separati dal mediastino ed uniti dalla trachea. Il mediastino è una regione compresa tra lo sterno e le vertebre toraciche, al cui interno si trovano altri organi (timo, cuore, trachea ,bronchi, esofago), oltre a vasi sanguigni, strutture linfatiche e formazioni nervose. La trachea è un tubo cilindrico sostenuto da anelli cartilaginei; superiormente sfocia nella laringe, inferiormemte, tra la quarta e la quinta vertebra, si biforca poi in due bronchi primari, uno di destra e uno di sinistra. Ciascun bronco penetra all’interno del suo corrispettivo polmone dando origine a numerose diramazioni che prendono il nome di bronchioli. Questi a loro volta subiscono varie divisioni, fino a raggiungere, nella parte terminale, delle sacche d’aria 4 1.2 Epidemologia del tumore al polmone 5 chiamate alveoli. Questi sono responsabili della respirazione, ossia dello scambio di ossigeno e anidride carbonica tra atmosfera e sangue. Le pareti degli alveoli sono prive di tessuto muscolare, quindi il polmone non può contrarsi ma è costretto a subire passivamente i movimenti della respirazione. Mentre il compito degli alveoli è quello della respirazione, il ruolo dei bronchi e delle vie aeree superiori (naso, faringe, laringe e trachea) è quello di protegerre l’organismo da materiali estranei e gli alveoli da flussi d’aria freddi o secchi. A livello macroscopico, i polmoni sono ricoperti dalla pleura, una membrana sierosa costituita da due foglietti: uno parietale che riveste tutta la cavità toracica e uno viscerale interno che aderisce alla parete polmonare esterna. Tra questi due foglietti scorre un liquido, detto liquido pleurico che consente lo scorrimento tra i due foglietti ed inoltre li mantiene uniti. I polmoni si trovano in un ambiente umido e per questo motivo sono facilmente attaccabili da microrganismi; infatti le malattie respiratorie sono spesso dovute ad infezioni virali o batteriche. Figura 1.1: Struttura dei polmoni 1.2 Epidemologia del tumore al polmone Con il termine carcinoma del polmone si fa riferimento ad una categoria diagnostica che comprende l’insieme di neoplasie maligne che originano dai tessuti epiteliali dei bronchi e del parenchima polmonare. Il 95% dei tumori maligni è rappresentato dal carcinoma del polmone mentre altre patologie come sarcomi e linfomi sono in percentuale minore; meno del 5% delle neoplasie polmonari è rappresentato da tumori benigni o con un basso grado di malignità. Un’ulteriore distinzione si fa tra neoplasie primitive e secondarie; le prime originano dalle strutture polmonari, le seconde sono rappresentate da metastasi di neoplasie che originano da altri organi come rene, fegato, mammella ecc. Il carcinoma del polmone è la neoplasia con il maggior tasso d’incidenza e di mortalità nel mondo, con la massima frequenza negli Stati Uniti 1.3 Cause del tumore al polmone 6 e in Europa. In Italia nell’anno 2004 sono decedute 32840 persone per tumore al polmone. Figura 1.2: Studio dell’incidenza e della mortalitá in Italia tra il 1998-2002 Da uno studio è risultato che tra il 1998 e il 2002 questa malattia è la terza neoplasia diagnosticata per gli uomini, la quarta per le donne; mentre è la prima causa di morte per gli uomini, la seconda, dopo il cancro alla mammella, per le donne. Un’importante informazione che ci suggerisce questo studio (osservando la fig ??) è che confrontando i dati di incidenza con quelli di mortalità per uno stesso luogo, il carcinoma del polmone ha un bassissimo indice di sopravvivenza sia per gli uomini che per le donne [1, 2]. 1.3 1.3.1 Cause del tumore al polmone Fumo Il fumo di tabacco è considerato la causa principale per lo sviluppo del carcinoma del polmone; da uno studio [3] è risultato responsabile di circa il 90% dei tumori polmonari mortali nei paesi sviluppati. In particolare, negli Stati Uniti, il fumo è responsabile dello sviluppo dell’87% di casi di neoplasie polmonare, con un’incidenza che aumenta considerevolmente se le prime esposizioni avvengono tra i 18 e i 25 1.3.2 Radon 7 anni. Il fumo contiene circa 60 cancerogeni certi, inclusi i radioisotopi provenienti dal decadimento del radon 1 , il benzopirene. Inoltre la nicotina presente è in grado di abbassare la risposta immunitaria, diminuendo la capacità di vigilare dei linfociti T e NK (natural killer). Il fumo non rappresenta solo un fattore di rischio, ma anche un importante elemento che è in grado di influenzare la prognosi; questo è dimostrato dal fatto che soggetti non fumatori ma con carcinoma del polmone hanno una maggiore percentuale di sopravvivenza (circa 5 anni) rispetto ai fumatori. Dal fumo si possono distinguere due componenti: una mainstream (flusso principale) e una sidestream (flusso laterale); la prima ad alte temperature è quella generata da processi di inspirazione attiva, la seconda, a basse temperature, è il risultato della combustione spontanea (fumo passivo). Recenti studi hanno dimostrato come quest’ultima (85%) è più nociva rispetto alla prima. All’atto pratico però, data la notevole diluizione nell’aria che il fumo passivo subisce prima di essere inalato, l’aumento percentuale di rischio di contrarre patologie a cui è esposto chi la assume resta inferiore rispetto al fumatore attivo [4]. 1.3.2 Radon Il radon è un gas nobile radioattivo, inodore, incolore ed estramamente volatile; esso appartiene alla catena di decadimento radioattivo che ha inizio dall’Uranio. Dal momento che l’uranio è distribuito su tutta la crosta terrestre, anche il radon è presente ovunque. E’ un gas pericoloso, perché se inalato, può danneggiare i tessuti dell’apparato respiratorio, e indurre mutazioni a carico del DNA. Dal punto di vista radioprotezionistico l’interesse maggiore è per il radon in aria; esso viene misurato in numero di dintegrazioni al secondo in m3 di aria. Esiste sicuramente una correlazione tra il radon e il rischio di formazione di cancro al polmone: dipende dalla dose, ossia dalla quantità di gas presente [5]. Dalla figura ??, possiamo osservare come il contributo del radon è di gran lunga maggiore rispetto ad altre sorgenti di radiazioni, in Italia come nel mondo. Figura 1.3: Distribuzione di Radon nella crosta terrestre 1 Elemento chimico, rappresentato dal simbolo Rn; è un gas nobile radioattivo, molto pericoloso per la salute umana, se inalato. 1.3.3 Inquinamento atmosferico 1.3.3 8 Inquinamento atmosferico Non ci sono ancora dei dati definitivi ma lo smog e l’inquinamento atmosferico, che sono prodotti dalla combustione dei derivati del petrolio e dalla loro lavorazione (che comporta l’uso di metalli come nichel e cromo), sono considerati possibili fattori di richio nella patogenesi del cancro al polmone. 1.3.4 Amianto L’amianto ha un ruolo fondamentale, insieme al fumo di tabacco, per lo sviluppo di carcinoma del polmone. In Italia, la correlazione tra esposizione all’amianto e tumore al polmone è stata registrata per la prima volta nel 1995; lo studio [6] ha dimostrato che la sola esposizione all’amianto è in grado di aumentare il rischio di malattia; quindi accoppiando l’esposizione all’amianto e il fumo il rischio di ammalarsi aumenta maggiormente. Figura 1.4: Distribuzione di Amianto nella crosta terrestre 1.3.5 Virus La capacità oncogena dei virus è stata dimostrata nel modello animale, benché anche recenti studi [7] suggeriscono il ruolo importante del papillomavirus nella patogenesi del carcinoma del polmone nell’uomo. Questi virus possono alterare il ciclo cellulare e bloccare i processi di apoptosi (suicidio delle cellule), promuovendo un anomalo controllo della respirazione e sviluppo di neoplasie. 1.3.6 Predisposizione genetica Esiste una predisposizione genetica per il tumore al polmone; nella maggior parte dei casi, la malattia è causata da alterazioni (mutazioni) del DNA che si sviluppano casualmente nel corso della vita a livello delle cellule del nostro organismo. Una piccola parte di queste anomalie può essere ereditata sin dalla nascita: con il passare degli anni si possono accumulare altre mutazioni che determinano un maggiore rischio, che gli specialisti chiamano predisposizione poligenica. In Italia oggi esistono istituti di ricerca con competenze specifiche verso la decifrazione del genoma umano; per esempio l’Istituto Nazionale dei Tumori e l’Istituto Mario Negri di Milano stanno 1.4 Tipi di tumori al polmone 9 effettuando uno studio multicentrico [8] per evidenziare il ruolo della predisposizione genetica al tumore al polmone. La ricerca consiste nell’analisi di pazienti non fumatori che hanno sviluppato questo tipo di neoplasia con età inferiore ai 60 anni e di soggetti sani ( in genere parenti di primo grado). Per tali studi sono necessari numerosi campioni , perché l’obiettivo è quello di identificare fattori genetici che siano poi adattabili sull’intera popolazione. I risultati preliminari dei test genetici sui familiari dei pazienti malati rivelano l’esistenza di una mutazione del DNA in grado di innescare una neoplasia. La formazione di qualsiasi tumore si ha quando in media sono presenti 3 o 7 mutazioni; questo autorizza a pensare che la malattia si possa presentare con certezza ed induce ad una maggiore cautela e prevenzione. Le persone a rischio possono adottare uno stile di vita corretto, evitando di esporsi a fattori di rischio (come il fumo sia attivo che passivo), e sottoponendosi a controlli periodici. L’identificazione delle vie biochimiche responsabili della suscettibilità o della resistenza al tumore al polmone consentirà non solo di allestire kit diagnostici per la valutazione del rischio, ma anche di sviluppare nuove terapie personalizzate con farmaci basati su specifici bersagli molecolari. 1.4 Tipi di tumori al polmone L’esposizione a fattori di rischio induce modifiche delle cellule dell’epitelio dei bronchi, soprattutto quelli del primo, secondo e terzo ordine dove originano i tumori [9]. Di questi la maggioranza (90-95%) sono considerati tumori maligni di origine epiteliale (detti carcinomi), mentre solo il 5% sono carcinoidi bronchiali e il 2-5% tumori mesenchimali . L’Organizzazione Mondiale della Sanità classifica i tumori polmonari in quattro tipi istologici. Ma ai fini terapeutici sono state invece individuate due grandi categorie: tumore a piccole cellule (SCLC) e tumori non a piccole cellule (NSCLC). Quest’ultimi si possono, a loro volta, suddividere in sottogruppi come: carcinoma a cellule squamose o carcinoma epidermoide, adenocarcinoma polmonare, carcinoma bronchioalveolare e altri. Nella tabella 1.1 [10, 11] si può osservare la frequenza dell’insorgere dei vari tipi di tumori polmonari. 1.4.1 Carcinoma squamocellulare Il carcinoma squamocellulare è caratterizzato dalla presenza di cheratinizzazione (formazione di uno strato che da all’epidermide una funzione di difesa contro agenti esterni) ben visibile per la presenza di elementi cellulari fusiformi, prive di nuclei (vedi fig.??). La combinazione e l’intensa proliferazione di questi elementi intorno ad un punto porta alla formazione di perle cornee, identificabili come zone concentriche. Nella figura ?? è possibile osservare la presenza di spine che fuoriescono dalla membrana cellulare e formano ponti tra le cellule. Si tratta di desmosomi che con la 1.4.1 Carcinoma squamocellulare Figura 1.5: Suddivisione dei tumori polmonari per tipi istologici Figura 1.6: Immagine di carcinoma squamocellulare 10 1.4.2 Adenocarcinoma 11 cheratinizzazione dimostrano la conversione dell’epitelio cilindrico bronchiale in un epitelio molto simile a quello della cute. La presenza di spine intracellulari è necessaria per lo studio di lesioni bronchiali sospette. La presenza di perle cornee, spine ed elementi squamosi descrivono una forma di neoplasia ben differenziata; viceversa, l’assenza di perle cornee, la presenza di figure miotiche atipiche 2 e di elementi cel- lulari giganti ed immaturi descrivono un tipo di neoplasia scarsamente differenziata con un grado maggiore d’invasività. 1.4.2 Adenocarcinoma L’adenocarcinoma è una neoplasia di origine epiteliale in cui si puó osservare un certo grado di differenzazione verso l’epitelio ghiandolare, caratterizzato dalla presenza di strutture acinose e papillari e dalla produzione di mucina 3 . Nell’immagine ?? le cellule che formano la struttura ghiandolare assumono una colorazione molto chiara per la presenza di mucina nel citosol. In questo caso si parla di adenocarcinoma a cellule chiare . Figura 1.7: Immagine di adenocarcinoma Nella rappresentazione ?? si focalizza l’attenzione sulla formazione di strutture ghiandolari che dimostrano la differenzazione del tumore; man mano che questo diventa sempre più indifferenziato alle strutture ghiandolari si sostituiscono strutture papillari, che danno al tessuto un apetto più compatto. Con la progressiva perdita dellla differenzazione il tumore assume un aspetto più solido, con elementi cellulari atipici, difficili da caratterizzare. 1.4.3 Carcinoma bronchioalveolare Il carcinoma bronchioalveolare è considerato una variante dell’adenocarcinoma, anche se ha una caratterizzazione anatomico - patologica differente. Si distingue in muciparo e non muciparo; la differenza consiste nella forma cellulare e nell’evoluzione. Il tipo muciparo è costituito da cellule cilindriche e tende a dif2 3 Cellule che si riproducono per divisione La mucina è una glicoproteina presente nei secreti mucosi del tratto respiratori e gastro- intestinale; la glicosilazione della mucina aumenta la viscosità e questo crea una specie di velo di protezione sull’epitelio considerato. La viscosità tende ad umentare perché la parte idrofila della glicoproteina, attira molta acqua e aumenta le interazioni con essa. 1.4.4 Carcinoma a grandi cellule 12 Figura 1.8: Immagine di carcinoma bronchialveolare fondersi per via aerogena; il tipo non muciparo è costituito da cellule che tendono a formare noduli confinati e possono essere asportati chirurgicamente. 1.4.4 Carcinoma a grandi cellule Il carcinoma a grandi cellule, definisce un tipo di neoplasia polmonare che non è identificabile nei carcinomi squamocellulari e negli adenocarcinomi. Come si può osservare dalla figura ??, questi tumori sono costituiti da elementi pleomorfi ( batteri che modificano la propria morfologia ) con nuclei di dimensioni variabili dai quali si possono distinguere i nucleoli. Figura 1.9: Immagine di carcinoma a grandi cellule 1.4.5 Carcinoma a piccole cellule Il carcinoma a piccole cellule rappresenta l’estremo di una categoria di neoplasie che ha origine da cellule neuroendocrine. Figura 1.10: Immagine di carcinoma a piccole cellule 1.5 Classificazione TNM 13 Questo tipo di tumore è caratterizzato da cellule tondeggianti (come si può osservare dalla figura ?? ) con scarso citoplasma e membrana cellulare ben definita; queste cellule si organizzano a formare una struttura molto compatta, con zone di necrosi e con un fattore che dimostra il basso grado di differenziabilitò e l’elevata malignità, propriamente detta conta miotica. 1.5 Classificazione TNM Per la classificazione del tumore al polmone, o di altre neoplasie, si usa il sistema TNM; nella figura riportata di seguito si può osservare la classificazione (fig.??): Figura 1.11: Classificazione del tumore polmonare sul sistema TNM Il parametro T indica la dimensione del tumore primitivo, può valere 1,2,3,4 (corrispondenti a dimensione crescente), può essere anche in situ, talmente piccolo da non intaccare linfonodi o altri organi; il paramentro N indica la posizione di eventuali linfonodi presenti, e può valere 0 (se sono del tutto indenni) o 1,2,3 (indicando la gravità del tumore in ordine crescente); il parametro M indica la presenza di metastasi a distanza, può valere 0 (nessuna metastasi) o 1 (presenza di metastasi). I tumori con metastasi (fascia colore bordeaux), qualunque sia la loro dimensione e indipendentemente dalla presenza o meno di linfonodi, sono considerati casi non operabili, con un livello di sopravvivenza molto bassa [12]. 1.6 Terapia La terapia dipende principalmente dalla natura cellulare del tumore, dallo stadio della malattia e dalle condizioni del paziente. I trattamenti si basano, normalmente, sulla chirurgia, chemioterapia e radioterapia. Nel caso di carcinoma a piccole cellule, la malattia è più aggressiva e per questo motivo si ricorre a chemioterapia e radioterapia. La chemioterapia si basa sull’utilizzo di sostanze chimiche e farmaci in grado di uccidere le cellule; è usata sia per la cura di malattie infettive, in cui vengono uccisi gli agenti patogeni, sia per tumori, in cui vengono uccise cellule tumorali. La maggior parte dei chemioterapici tumorali, uccide le cellule tumorali interferendo con la sintesi del DNA e quindi con la capacità di una cellula di crescere e riprodursi. 1.7 Prevenzione e screening 14 La radioterapia è un tipo di terapia oncologica basata sull’uso di radiazioni ad alta energia (raggi X,α, β e γ), in grado di distruggere le cellule tumorali. Le radiazioni danneggiano il DNA, impedendo la riproduzione delle cellule e causandone la morte; agiscono soprattutto su cellule tumorali perché esse si riproducono più attivamente, ma anche su quelle normali che hanno una velocità di riproduzione più elevata. Le radiazioni possono provenire dall’esterno del corpo, per esempio da acceleratori di elettroni, oppure da materiali radioattivi che si collocano direttamente all’interno del tumore, come i mezzi di contrasto. Questa terapie sono generalmente usate per ridurre le dimensioni del tumore prima dell’intervento chirurgico oppure per eliminare cellule tumorali rimaste dopo l’intervento. Negli ultimi anni è stata introdotta una forma di radioterapia che, invece di utilizzare raggi X, utilizza fasci di particelle pesanti, detti adroni, tra i quali gli ioni carbonio ed i protoni. Grazie a particolari proprietà fisiche di queste particelle, l’adroterapia è un trattamento puù preciso, perché consente di colpire il tumore in modo selettivo e quindi salvare i tessuti sani che lo circondano; esso è anche più efficace perché è in grado di uccidere cellule di tumori che sono particolarmente resistenti alle radiazioni convenzionali. L’adroterapia è un trattamento che, per ora, viene sviluppato solo in pochi centri nel mondo, perché richiede l’ultilizzo di macchinari molto sofisticati e costosi. Attualmente in Italia, l’unico centro in grado di sviluppare protonoterapia (per patologie oculari) si trova a Catania (centro CATANA, presso i Laboratori Nazionali del Sud dell’Istututo Nazionale di Fisca Nucleare) dove medici e fisici sanitari effettuano dei trattamenti circa ogni 5 settimane. Anche a Pavia è stato completato il primo centro di adroterapia, il CNAO (Centro Nazionale di Adroterapia Oncologica), che può trattare pazienti sia con protoni, sia con ioni, in particolare, lo ione carbonio. 1.7 Prevenzione e screening Per una buona prevenzione del cancro al polmone, considerando i fattori di rischio, la prima cosa da fare sarebbe eliminare il fumo (per i soggetti fumatori) o evitare l’esposizione ad esso (per i soggetti non fumatori); per il radon, l’amianto e l’inquinamento atmosferico, altri importanti fattori di rischio, sarebbe necessario il controllo dell’ambiente in cui viviamo, da parte dell’ ARPA (Agenzie Regionali per la Protezione Ambientale); questa sarebbe un tipo di prevenzione primaria. La prevenzione secondaria coincide con lo screening: un programma di controllo, organizzato su larga scala, in cui un certo numero di persone che appartengono ad una categoria a rischio vengono sottoposti ad un test diagnostico, anche se non hanno nessun tipo di disturbo; lo scopo è quello di scoprire la malattia molto precocemente, in fase asintomatica, per ridurre il grado di mortalità. Gli esami a cui vengono 1.7 Prevenzione e screening 15 sottoposti i pazienti, per questo tipo di test, sono la semplice radiografia del torace,la Tomografia Assiale Computerizzata a spirale (TAC) o la Positron Emission Tomography (PET). La Tomografia Assiale Computerizzata è l’esame che viene effettuato per la diagnosi di tumori, perché permette di ottenere immagini di organi interni come se fossero esaminati a fette, con uno spessore di 0.5 ÷ 5mm; la differenza di una TAC tradizionale rispetto ad una TAC a spirale è che lo strumento ruota attorno al paziente, come se lo avvolgesse in una spirale. La Positron Emission Tomography (PET) utilizza una camera particolare per registrare i raggi gamma che si formano dall’urto (fenomeno propriamente detto annichilazione 4 ) di un elettrone con un positrone; principalmente questa tecnica serve per misurare il metabolismo cellulare delle cellule tumorali, permettendo di valutare il grado di aggressività del tumore, la presenza e la distribuione di metastasi a distanza, l’effetto dei trattamenti chemio o radioterapici (o di entrambi se il paziente è stato sottposto ad entrambe le terapie) e la possibilità di riformazione del tumore o di morte della cellula cancerogena. Negli ultimi anni sono stati pubblicati importanti studi su questo tipo di prevenzione; il primo studio ha dimostrato che la TAC a spirale è lo strumento più adatto a identificare precocemente alterazioni del tessuto polmonare; alla fine è stato evidenziato un aumento della sopravvivenza [13]. Il secondo studio ha dimostrato che lo screening con la TAC a spirale non diminuisce la mortalità ma prolunga la sopravvivenza, cioè la durata della vita dal momento della diagnosi(che viene anticipata) alla morte [14]. Alla luce di questi risultati, che non sono conclusivi, si stanno effettuando nuove ricerca che daranno un risultato sicuro. In Italia nel 2007 è stato pubblicato uno studio [15] , condotto dall’Istituto Europeo di Oncologia di Milano sul programma Cosmos (Continuos Observation of Smoker Subjects), uno screening su 5200 soggetti fumatori, utilizzando la TAC a spirale e la PET che facilitano il procedimento diagnostico di noduli in modo non invasivo. Nei primi due anni di ricerca sono stati identificati 89 tumori polmonari molto piccoli (dimensione media è stata di 14 millimetri). Il 90% dei tumori scoperti è risultato operabile. Globalmente il 70% si trovavano nello stadio con migliore prognosi, con un livello di sopravvivenza tra il 80% e il 90%. I risultati ottenuti finora portano alla conclusione che nonostante lo screening non raggiunga il 100% dei tumori in fase iniziale, riduce però del 90% quelli in stadio avanzato, i più pericolosi, che sono la maggior parte dei tumori diagnosticati senza controllo. Questo studio ha ancora 3 anni in cui ci si propone di ottenere un calo significativo del numero di tumori riscontrati e uno screening di massa, ovvero che coinvolgerà 20mila soggetti entro uno o due anni. 4 + − e e → 2γ con Eγ = 512keV , se e+ è a riposo 1.7 Prevenzione e screening 16 Figura 1.12: Risultati dello studio dell’Istituto Europeo di Oncologia di Milano Come si può vedere dai grafici (figura ??), lo screening aumenta le diagnosi del 30% (da 33 casi attesi si passa a 42 riconosciuti). Si può quindi concludere che, con l’avvento delle nuove tecnologie e dei nuovi sistemi di diagnosi computerizzata, ci si aspettano dei risultati ancora più sorprendenti, che migliorino il campo della diagnostica. Capitolo 2 Sistemi Computer Assisted Detection Un sistema Computer Assisted Detection (CAD) è un sistema per la rivelazione automatizzata di strutture patologiche in immagini medico-diagnosticge. Ricopre un ruole importante, come strumento di supporto alla diagnosi, collaborando con il medico nella distinzione tra strutture anatomiche e lesioni tumorali. Attraverso l’integrazione tra il giudizio umano e quello del mezzo informatico, il radiologo può prevenire ad una maggiore accuratezza della diagnosi, riuscendo a rilevare anche noduli di piccole dimensioni, che possono facilmente sfuggire all’occhio umano. CAD è l’acronimo di Computer Assisted Detection e non Computer Aided Diagnosis: il sistema, infatti, non ha i requisiti sufficienti per effettuare una vera e propria diagnosi, ovvero discernere se un paziente è sano o malato, ma permette semplicement di localizzare le regioni sospette, da sottoporre all’attenzione del medico. Sono sistemi che ricevono in ingresso esami diagnostici (come mammografia, CT polmonari e, ultimamente anche coloscopie); dopo averle processate in più stadi in maniera più o meno automatizzata, formiscono in uscita una lista di regioni potenzialmente patologiche. Un sistema CAD può rivestire un ruolo sostanziale i supporto in programmi di screening di massa della popolazione ad alto rischio o nella diagnosi clinica. In particolare può essere utilizzato come: • primo lettore, in caso di screening della popolazione. E’ un vantaggio per il radiologo perché in grado di analizzare automaticamente immagini e focalizzare l’attenzione del medico su particolari scansioni che più probabilmente evidenziano patologie, garantendo la possibilità di un intervento puù tempestico ed efficace; • secondo lettore, nella tradizionale pratica clinica, fornendo al medico, una seconda opinione nella rilevazione di neoplasie. In questo modo garantisce uno 17 2.1 Storia del CAD 18 standard più elevato, divenendo un utile supporto per la definizione di una diagnosi più accurata e la conseguente applicazione di interventi terapeutici appropriati. E’ in grado di contrastare errori medici legati all’insufficente esperienza, alla stanchezza o all’aspetto gravoso e ripetitivo del lavoro di analisi. E’ frequente, infatti, una classificazione non corretta a causa dello scarso contrasto tra tessuti sani e patologici e la similarità di caratteristiche anatomiche-patologiche. Da qui l’importanza della doppia lettura, fornita dal CAD, che accosta all’esperienza del medico accosta una lettura più rapida e attenta, meno legata alla soggetività. 2.1 Storia del CAD Il campo della medicina che ha ricevuto il massimo contributo dall’introduzione di sistemi di diagnosi computerizzata è la radiologia. Sino a 20-25 anni fa un radiologo aveva a disposizione le lastre (foto in negativo degli organi) che poneva su uno strumento, chiamato diafanoscopio, su cui osservava attentamente i dettagli dell’immagine alla ricerca di particolari anomalie, e ne ricavava un referto. Con l’avvento della TAC (Tomografia Assiale Computerizzata), il numero di immagini da analizzare aumentò notevolmente e di conseguenza aumentarono i tempi di refertazione. Con il passare degli anni il contesto clinico cambiò; in certi settori oncologici si scoprı̀ il valore della diagnosi precoce implementate attraverso i programmi di screening. Negli anni novanta iniziò la diffusione su larga scala di strumenti che producono direttamente un’immagine digitale; il numero delle immagini crebbe notevolmente. Un post-processing del radiologo, di un esame complesso, come la colonoscopia virtuale o CT, può richiedere anche un’ora. La visione delle immagini al computer richiede più lavoro al radiologo, perché alcuni dettagli, come un nodulo di 1 millimetro, possono sfuggire, e questo è uno dei limiti dell’occhio umano. E’ in questo scenario che si introducono i sistemi di diagnosi computerizzata, che funzionano come un secondo osservatore che non ha nessun legame con l’esperienza e la sensibilità ma direttamente con la struttura matematica e anatomica dell’immagine. I sistemi CAD utilizzano algoritmi per acquisire, elaborare e classificare immagini tramite reti neurali. E’ utile distinguere tra: • Rivelazione computerizzata in cui il computer assiste il radiologo nell’individuare un’anomalia, per esempio nel caso dello screening mammografico (detection); • Diagnosi computerizzata in cui il computer assiste il radiologo nel caratterizzare, in una classe patologica, un’anomalia già individuata, come ad esempio l’identificazione di una lesione come benigna o maligna (caratterizzazione). 2.2 Funzionamento del CAD 19 I sistemi CAD attualmente trovano applicazioni commerciali principalmente nella rilevazione e diagnosi del cancro della mammella e del colon. 2.2 Funzionamento del CAD Un sistema CAD è costituito semplicemente (come si può vedere dall’immagine 4.21 ) da un computer sul quale vengono analizzate le immagini. Le fasi principali del funzionamento di un CAD sono: • Preprocessamento dell’immagine: riduzione del rumore; • Segmentazione; • Individuazione delle Region Of Interest (ROI) candidate a contenere il tessuto patologico; • estrazioni delle features (parametri caratteristici) dalle ROI; • Classificazione delle ROI in tessuto probabilmente sano o probabilmente malato, in base al valore delle features. Figura 2.1: Struttura di una stazione CAD 2.2.1 Preprocessamento e Segmentazione Sono stadi fondamentali per l’analisi successiva delle immagini. Il preprocessamento è finalizzato alla pulizia dell’immagine dal rumore; la segmentazione delimita il volume dell’organo che successivamente viene sottoposta alla ricerca delle patologie. Questo processo oltre ad abbreviare il tempo di elaborazione degli stadi successivi, riduce il numero di falsi positivi, portando l’algoritmo di ricerca delle neoplasie ad operare solo sul tessuto d’interesse. 2.2.2 Classificazione delle ROI 2.2.2 20 Classificazione delle ROI Questa fase è finalizzata alla ricerca delle zone potenzialmente malate, ovvero zone che, per le loro caratteristiche morfologiche e particolare conformazione anatomica, potrebbe presentare parologie. Questa fase comporta l’eslusione delel regini sane, che non saranno oggetto di ulteriori analisi. 2.2.3 Estrazione delle features dalla ROI L’estrazione di quantità, dette features (parametri caratteristici) fornisce attributi utili a caratterizzare in maniera peculiare il contenuto di una determinata ROI, permettendo al successivo stadio di classificazione di discernere tra pattern malati e sani. La scelta opportuna delle features è fondamentale per il corretto funzionamento del CAD e la conseguente accuratezza diagnostica. Le features da adottare, variano in relazione alla patologia indagata e dall’organo in esame: ad esempio, nel caso specifico di noduli polmonari è fondamentale tener conto della loro forma. Accanto a dimensione, densità, posizione e regolarità del bordo, è importante l’eccentricità, parametro indicativo dell’allungamento di una regione. Una forte eccentricità è, spesso, indicativa dell’assenza di patologie, data la forma compatta e sferica e irregolare di molte lesioni. E’ importante minimizzare il numero delle features necessarie per distinguere le lesioni tumorali dalle normali strutture anatomiche. 2.2.4 Classificazione delle ROI Sulla base dell’analisi delle features, e con l’ausilio di reti neurali, distingue le regioni di interesse in sane e malate. Per questa fase si ricorre all’impiego di reti neurali o di altri classificatori che vengono addestrati mediante l’utilizzo di set di immagini di cui non si conosce lo stati di normalità patologica. In seguito all’addestramento, i classificatori divengono in grado di analizare le immagini, successivamente loro formite, applicando e generalizzando quanto acquisito. La classificazione può essere: • supervisionata, se l’insieme delle classi è definito a priori, e il classificatore stabilice a quale di queste appartiene ciascun pattern (mediante analisi delle features; • non supervisionata, se è il classificatore a dover individuare le classi presenti nei dati. La classificazione supervisionata è basata, fondamentalmente, sull’analisi delle densità di probabilità (stimate o note a priori ) dei valori delle features, per le diverse classi, determinando quella più probabile. Una classificazione supervisionata è caratterizzata da una fase di addestamento 2.2.4 Classificazione delle ROI 21 (training), per la quale si utilizza un set significativo di campioni di classe nota. E’ fondamentale, per il corretto funzionamento dell’intero sistema, che questo set sia costituito da un numero sufficiente di campioni rappresentativi di tutte le classi. Analogamente per la fase di verifica (validation) del metodo di riconoscimento e il controllo della generalizzazione dei risultati, ci si avvale di un piccolo insieme (validation-set) di campioni di classe nota, di caratteristiche analoghe ai precedenti. Infine, per esaminare del metodo (testing) su esempi reali e valutarne i possibili errori è fornito al classificatore un set di test le cui classi non sono note. In un metodo supervisionato, ciascun campione (pattern) sarà rappresentato da un vettore di features. L’insieme di questi vettori degli oggetti di una classe è detto cluster. Ogni oggetto avrà un solo vettore di features, per cui esso corrisponderà ad un punto nello spazio delle features, e ad ogni cluster sarà associata la distrubuzione dei punti corrispondenti a tutti gli oggetti di una classe nello spazio medesimo. Le classi possono essere: • separabili, se esiste una curva 1 (chiusa o aperta), che percorrendola in una direzione qualsiasi, tutti e soli gli elementi si trovano ad una lato della curva (vedi figura 1.2a,c); • non separabili, se quanto detto prima non accade (vedi figura 1.2 b). Figura 2.2: Esempio di classi: a,c) separabili; b) non separabili. Tra i più significativi metodi di classificzione correntemente conosciuti risalta il luogo chiave assunto dalle reti neuronali (o neurali) artificiali, cosı̀ denominate perchè basate sulla simulazione, sia pure grandemente semplificata, del funzionamento di un neurone celebrale nel corso delle attività tipiche del cervello, quali percezioni di immagini, riconoscimento di forme, ecc. Una rete neurale rappresenta, essenzialmente, un modello biofisico-informatico di elaborazione delle informazioni. L’approccio di questi sistemi rispecchia, a livello concettuale, la complessa struttura organizzativa delle cellule neuronali fittamente interconnesse e tali da variare la loro configurazione in risposta agli stimoli esterni. Una rete neurale è composta da un certo numero di nodi, o neuroni, di ingrasso, costituenti le unità di elaborazione, collegati a numerosi nodi interni, organizzati in più livelli (strati). Ciascun nodo d’ingresso riceve i segnali esterni e li elabora, trasmettendo poi il risultato ai nodi successivi ai quali è connesso. 1 Nello spazio a più dimensioni si parlerà di superfici e ipersuperfici 2.2.4 Classificazione delle ROI 22 Figura 2.3: Esempio di neurone artificiale Ad ogni collegamento interneuronale è associato un valore (peso), dal quale dipende il comportamento della rete. Ogni neurone è caratterizzato da un stato di attivazione, determinato dai valori degli ingressi e dai pesi delle connessioni corrispondenti tramite una funzione di attivazione. Ogni nodo può essere concettualmente interpretato come un circuito costituito da un sommatore e un filtro. Il sommatore effettua una somma pesata degli input s1 , s2 ,...., sn (segnali di ingresso, o output dei nueroni precedenti), e fornisce il risultato della somma Pi come input del filtro. Il filtro è costituito da una funzione che, sulla base del valore di Pi , decide il valore di uscita Si . Tipicamente una rete è formata da tre strati di neuroni: • strato di ingresso, finalizzato alla trattazione dei segnali di ingresso in modo tale da adeguarli alle richieste dei neuroni; • strato nascosto, finalizzato all’elaborazione del segnale; • strato di uscita, raccoglie i risultati e li adatta alle richieste del blocco successivo della rete. Queste reti artificiali possono essere anche molto complesse e coinvolgere migliaia di neuroni e decide di migliaia di connessioni. Figura 2.4: Esempio di neurone multistrato 2.3 Prestazioni del CAD 2.3 23 Prestazioni del CAD Data l’importanza di un sistema CAD in termini di screening o come strumento di supporto nella tradizionale pratica clinica, è essenziale riuscire a pervenire ad alti livelli di qualità che ne garantiscono la funzionalità. Ad influire sulle prestazioni del sistema informatico intervengono due importanti fattori: sensibilità e specificità. Per sensibilità si intende il rapporto tra il numero di ROI in cui è stata, correttamente, riscontrata una patologia tumorale (NCAD ) e il numero totale di lesioni in cui la patologia tumorale è certa,per esempio tramite la biopsia (Ntot ); questo parametro, in altre aprole, indica l’efficenza del sistema: NCAD (2.1) Ntot Per specificità si intende il rapporto tra il numero di ROI classificate come sane = e il numero totale di ROI, fornite dallo stato di preprocessamento, in cui è certa l’assenza di patologie tumorali: Sp = NCADnegative Ntotnegative (2.2) Queste due grandezze sono fra loro indipendenti e, pertanto, può essere studiata la loro correlazione. Alcune volte possono essere utilizzate anche grandezze che derivano da quelle fondamentali: in particolare, al posto della specificità si può considerare (1-Sp) che corrisponde alla frazione di falsi positivi: 1 − Sp = (Ntotnegative − NCADnegative Ntotnegative (2.3) Ad un sistema CAD si chiede: • alta sensibilità in modo da rilevare tutte le possibili lesioni garantendo la possibilità di un intervento tempestivo; • alta specificità che assicuri un numero minimo di falsi positivi, ovvero escluda la malattia dove realmente esistente. Questo per evitare allarmismi inutili e dispendiosi approfondimenti diagnostici. Questi parametri possono subire un notevol incremento percentuale nel caso in cui la lettura delle immgini venga effettuata da più radiologi in maniera indipendente. L’affiancamento al radiologo di un sistema di diagnosi computerizzata è efficace solo se questo sistema è caratterizzato da un’alta efficenza nella classificazione. 2.3.1 Curva ROC La curva ROC (Receiver Operating Chatacteristics) è il grafico della valutazione dell’efficenza del sistema CAD; sul diagramma vengono riportati (come possiamo 2.3.2 Curva FROC 24 vedere dalla figura 1.5) i valori di (1-Specificità) sull’asse delle ascisse e quelli di sensibilità sulle ordinate; i valori di questi due parametri si spostano con il variare della soglia, che è scelta in modo da soddisfare le diverse esigenze diagnostiche. Figura 2.5: Esempio di curva ROC La linea diagonale rappresenta le prestazioni di un sistema senza alcuna capacità di classificare; l’accuratezza aumenta se ci si avvicina verso l’angolo in alto a sinistra, mentre il valore dell’area sotto la curva è l’indicatore delle prestazioni complessive del sistema (un’area con valore pari a 1 indica un test perfetto, 0.5 un test casuale). 2.3.2 Curva FROC L’analisi della curva ROC non basta per valutare le prestazione del sistema diagnostico, viene introdotta un’altra curva, detta FROC (Free Response Operating Characteristics) in cui la sensibilità del sistema è correlata al numero dei falsi posotivi per paziente o per un seti di dati. Consentono di stabilire il punto operativi di un sistema CAD, che è in genere il miglior compromeso tra sensibilità e specificità. I valori di specificità e sensibilità al punto operativo servono anche come criterio di valitazione dei sistemi CAD e consentono, entro certi limiti, un confronto tra le diverse tecnologie. Come si può vedere dalla figura 1.6 , questa curva riporta sulle ascisse il numero medio di falsi positivi per immagine, ottenuti dall’analisi del campione, e sulle ordinate la sensibilità. Questa curva è utile per confrontare direttamente il numero di falsi positivi ad un dato valore di sensibilità; infatti mentre la specificità dipende dalle prestazioni dell’algoritmo di preprocessamento che individua da regioni di interesse da classificare, il numero FP/image è un indicatore assoluto. Un algoritmo preprocessamento molto selettivo rende più difficile la fase di classificazione, portando a valori di specificità relativamente inferiori; al contrario, un preprocessamento poco selettivo facilita la 2.4 Alcuni esempi di CAD 25 Figura 2.6: Esempio di curva FROC classificazione ed il raggungimento di alti valori di specificità che non necessariamente corrispondono ad un valore ottimale (cioè minimo) di FP/image. Le prestazioni dell’algoritmo saranno definite in termini di sensibilità e FP/image al termine della fase di preprocessamento e delle curve ROC e FROC ottenute nella fase di classificazione delle regioni di interesse. 2.4 Alcuni esempi di CAD Attualmente i sistemi CAD che sono stati sviluppati e sono disponibili sul mercato, riguardano principalmente il tumore alla mammella e al colon. 2.4.1 CAD per il cancro alla mammella I sistemi CAD sono usati da un numero crescente di radiologi come ausilio nel refertare una mammografia.. Di seguito si riportano alcuni esempi di CAD mammografici: • ImageChecker della R2 Technology è la prima applicazione commerciale applicata ad immagini radiologiche basata sull’uso di reti neurali. Nata da accordi con la General Eletric (GE) finalizzati alla realizzazione di un mammografo digitale con il supporto del CAD, nel 1998 è stato approvato dalla FDA (Food and Drugs Admnistration). Per quanto riguarda le prestazioni, l’ImageChecker garantisce una sensibilità pari al 98,5% per le microcalcficazioni e dell’86% per la rilevazione delle masse. Utilizza uno scanner per l’acquisizione di immagini con una risoluzione spaziale di 50µm ed una profondità di 12bit;inoltre il sistema permette l’archiviazione delle immagini digitalizzate e dei risultati del CAD in PACS (Picture Archiving and Communications System) tramite DICOM (Digital Imaging Cominucations in Medicine) e HL7 (Healty Level 7), che sono dei protocolli standard di comunicazione in ambiente sanitario [16]. 2.4.2 CAD per il cancro al colon 26 • IMM della CADVision Medical Technologies LTD. è di produzione israeliana. La CADVision lo ha presentato nel 2002 ricevendo per il suo software il marchio CE (European regulatory approval) e attende di ottenere la certificazione FDA. Il sistema offre stumenti per migliorare la visualizzazione dell’immagine ed evidenziare i dettagli caratteristici delle lesioni, auto-detection di quest’ultime e una classificazione e quantificazione del grado di sospetto delle lesioni. Il CAD IMM, usando particolari algoritmi, valuta le strutture presenti nella mammella marcando quelle sospette ed effettuando contemporaneamente una classificazione delle anomalie, ordinandole in base al loro grado di malignità. L’attuale validazione clinica del sistema è stata fatta su un database di 541 lesioni (309 maligne, 232 benigne) refertati da 3 radiologi ed ha fornito una sensibilità tra l’85% e il 99% e una specificità del 72%. • Second Look [18] è un sistema canadese prodotto dalla CADx Medical System, approvato da parte della FDA nel 2002 per l’uso nei programmi di screening mammografico su pellicola e per la mammografia diagnostica. Questo CAD opera in tre passi: prima digitalizza le mammografie, poi una rete neurale le analizza per produrre alla fine un output stampato, dove sono evidenziate le regioni di interesse. Per la ricerca delle microcalcificazioni vengono sfruttate le trasformate wavelet 2 , mentre per le masse si utilizza un filto con differenze gaussiane. Alla fine dell’analisi si ha uno stampato in cui un indicatore ovale indica le lesioni massive, mentre uno rettangolare per i cluster di microcalcificazioni. • MAMMEX TR realizzato dalla Scanis, in collaborazione con le Università della California e di Stanford è stato presentato nel 2002 ed ha ottenuto l’approvazione della FDA nel 2007. Per la digitalizzazione e le analisi delle lastre viene usato uno scanner con risoluzione spaziale di 45µm e 12bit di range dinamico. A differenza degli altri sistemi CAD, non utilizza reti neurali ma algoritmi basati su regole formulate in base ai criteri decisionali normalmente usati dai radiologi [19]. 2.4.2 CAD per il cancro al colon Un’azienda torinesa[20], im3D, che si occupa dell’imaging medico in collaborazione con l’IRCC (Istitute for Cancer Research and Treatment) e l’ISI Foundation (Institute for Scientific Interchange), un progetto di ricerca per lo sviluppo di soluzioni di immagini mediche nella diagnosi precoce delle malattie tumorali, ha progettato e realizzato CAD-COLON, un sistema di diagnosi estremamente preciso, capace di 2 Rappresentazione di un segnale mediante l’uso di una forma d’onda oscillante di lunghezza finita. 2.4.2 CAD per il cancro al colon 27 elaborare i dati forniti dalla TAC dell’addome e del bacino del paziente, identificando le zone sospette su un modello tridimensionale del colon, in grado di supportare i medici nell’attività di prevenzione e diagnosi precoce del tumore al colon. Nelle sperimentazioni effettuate si è rilevata una sensibilità media del 98,2% nell’individuazione di polipi o tumori di misura clinicamente significativa; il tumore al colon in molti casi si sviluppa sotto forma di polipo e nel tempo può evolvere in forme maligne. CAD-COLON è l’integrazione, in un unico sistema, di due componenti: elevata accuratezza della prestazione diagnostica del CAD e la capacità di elaborazione di una grande quantità di immagini, tipica della coloscopia virtuale (VC). Il risultato è un sistema diagnostico ad elevate prestazioni che supporta il radiologo nella sua attività di diagnosi, migliorando i tempi di lettura e l’efficacia nell’individuare, evidenziare e classificare lesioni sospette. Questa nuova tecnologia aiuta il radiologo nella diagnosi precoce dei polipi, favorendo la loro identificazione quando ancora sono di piccole dimensioni e facilmente asportabili, ovvero molti anni prima che si trasformino in un tumore. L’esame ha una durata di 15 minuti e, al termine, il sistema produce un documento finale riassuntivo che può essere o aggiornato, o stampato o archiviato elettronicamente, in base alle esigenze del medico radiologo. Le aree di applicazione di uno strumento cosı̀ innovativo sono diverse: • esame non invasivo per pazienti che siano risultati positivi all’esame occulto delle feci (FBOT); • test di prevenzione nei pazienti a rischio (anamnesi familiare del cancro al colon); • strumento per attività di follow-up per i giovani radiologi; • supporto all’indagine endoscopica per l’attività di asportazione o alternativa nel caso in cui l’indagine endoscopica risulti impraticabile per motivi di malformazioni od occlusioni. Figura 2.7: Esempio dell’interfaccia del CAD-COLON CAD-COLON viene considerata la grande evoluzione della Colonoscopia Virtuale, in quanto risolve tutti i limiti che sinora ne hanno frenato l’applicazione, come il tempo impiegato dal radiologo nell’analisi di moltissime immagini (spesso più di mille 2.4.2 CAD per il cancro al colon 28 per paziente) e il calo del livello di attenzione del radiologo, che è fisiologicamente inevitabile dopo un certo numero di letture e può incidere sulla precisione. CADCOLON svolge autonomamente quest’attività, leggendo e analizzando i dati della colonoscopia ed evidenziando tutte le aree sospette; in questo modo, favorisce il radiologo che può concentrarsi maggiormente sulle diagnosi con dei tempi di lettura ridotti e livelli di sensibilità e di attenzione molto elevati. Medigicsiht PLC [21] è un’azienda leader nel settore dello sviluppo di sistemi CAD e software per l’analisi di immagini mediche, ha sviluppato i risultati su un nuovo studio [?] che ha dimostrato l’elevata sensibilità di un CAD nella rilevazione di tumori colonrettali in CT multi-strati di colonografia, ColonCAD. I risultati hanno dimostrato che quando radiologi, esperti o poco esperti, leggono una colonografia usando il CAD la sensibilità aumenta. Lo studio, condotto a Pechino, in Cina, include 60 pazienti, precedentemente analizzati, affetti da tumore al colon. I dati dei pazienti sono stati rivisti, prima senza il CAD e successivamente con il supporto del CAD, da quattro radiologi (due esperti e due non esperti), che non conoscevano la patologia e i risultati della colonografia. I risultati mostrano che la sensibilità dei radiologi esperti aumenta dall’80% al 97% e quella dei non esperti dal 73% al 90%. Medicsight ha richiesto l’approvazione all’FDA per questo prodotto, ColonCAD, un algoritmo avanzato per l’analisi di CT del colon e per evidenziare automaticamente le zone sospette che possono essere indicatori di malattia. Capitolo 3 CAD polmonare La diagnosi precoce delle neoplasie rappresenta il miglior metodo per ottenere una riduzione della mortalità. Come è stato discusso nel capitolo precedente, i programmi di screening, volti al controllo sistematico della popolazione asintomatica selezionata secondo criteri epidemologici e statistici, sono sempre più incoraggiati. Nel caso specifico della neoplasia polmonare è stato dimostrato che la rivelazione precoce con resezione chirurgica può migliorare la prognosi in modo significativo: la sopravvivenza complessiva a cinque anni risulta del 14%, ma è pari al 67% per tumori diagnosticati nello stadio operabile, che però non danno sintomi [23]. I risultati sperimentali di screening basati su radiografia del torace ed esame citologico 1 dei bronchi, non sono sufficenti a dimostrare la riduzione del grado di mortalità, anche a causa della bassa sensibilità della radiografia del torace nel rilievo di micronoduli. Il metodo migliore per rivelare noduli dimesionalmente inferiori ai 5 mm di diametro è la Tomografia Computerizzata (CT), in particolare con tecnologia a spirale, che permette di ottenere scan di CT con fette di spessore inferiore a 1 mm. Tra gli studi che hanno confrontato l’efficacia della CT spirale con la radiografia al torace c’è ELCAP (1999) ha eseguito uno screening su 1000 soggetti a rischio; i risultati hanno evidenziato una maggiore positività della CT, che individua tumori in stadio iniziale con una resecabilità globale pari al 96%. Tuttavia i protocolli standard della CT del torace prevedono elevate dosi di radiazione al paziente ed il conseguente rischio di induzione di danno da radiazione, li rende poco proponibili in un programma di screening esteso a tutta la popolazione. Diversi studi hanno dimostrato che una riduzione della dose nella CT non provoca una riduzione della sensibilità neanche per micronoduli; le potenzialità offerte dalla CT spirale a bassa dose hanno rinnovato l’interesse nella possibilità di effettuare programmi di screening della neoplasia polmonare. Il numeo di immagini da analizzare in questi programmi con CT è molto elevato; in particolare utilizzando CT spirale multi-slice si ricostruiscono fino a 500 immagini per paziente. Poiché i tumori non rivelati costituiscono un 1 Osservazione al microscopio delle cellule. 29 3.1 MAGIC-5 30 problema nell’analisi, in Giappone è stato adottato il metodo della doppia lettura indipendente, che però raddoppia la richiesta di tempo del radiologo [23]. Proprio per questo motivo molti progetti di ricerca hanno di recente iniziato a sviluppare sistemi CAD anche in questo campo. Di seguito vengono riportati esempi di sistemi CAD sviluppati da due gruppi di ricerca di Pisa e Bari; entrambi hanno lavorato sulla rivelazione automatica di noduli polmonari in CT a bassa dose tramite un sistema di diagnosi computerizzata; il CAD sviluppato dal gruppo di Pisa prende il nome di Voxel Based Neural Approach (VBNA), quello di Bari Region Growing Voxel Plateaux (RGVP). 3.1 MAGIC-5 Medical Application on a Grid Infrastructure Connection è un progetto, dell’Istituto Nazionale di Fisica Nucleare, che mira a sviluppare un piano di ricerca per lo studio dei modelli e di algoritmi per l’analisi di immagini biomediche, facendo uso dei servizi di rete. I due obiettivi principali sono: 1. Sostenere la diagnosi del radiologo, fornendo algoritmi un grado di rilevare automaticamente strutture patologiche; 2. Migliorare la velocità di calcolo, l’accessibilità ai dati e la condividione di un database di immagini distribuite. L’analisi di immagini biomediche per mezzo di sistemi automatici, come già discusso in precedenza, riceve un intersse crescente da parte della comunità scientifica. Questo progetto mira a sviluppare e migliorare i sistemi automatici per la diagnosi assistita al seno, del polmone e le patologie del cervello, basati sia su paradigmi fisici-computazionali sia su analisi statistiche-epidemologiche. Questa ricerca mira, appunto, a studiare e sviluppare paradigmi computazionali per il tratatmento di un enorme quantità di dati, sfruttando l’esperienza acquisita nel campo della fisica sperimentale, dove sono utilizzati schemi di riconoscimento e tecniche di classificazione. Uno degli obiettivi principali è l’utilizzo di sistemi distribuiti (GRID) per l’analisi dei dati. In realtà, le immagini mediche rappresentano una base di dati intrinsicamente distribuita, registrati nei diversi centri. I servizi di rete consentono un’analisi interattiva con ogni del sistema. I temi principale del programma di ricerca sono: • Sviluppo di modelli e algoritmi: algoritmi per la segmentazione mammografica, polmonare e di immagini del cervello, con caratterizzazione e classificazione delle regioni sospette; 3.1.1 Database di MAGIC-5 31 • Applicazioni in campo medico: analisi automatica di immagini distribuite in un programma di screening, diagnosi precoce di neoplasie polmonari in CT a spirale, e fusione di immagini di Risonanza Magnetica Nucleare (RNM) e SPECT/PET per l’analisi di anomalie del cervello; • GRID: sviuppo di un sistema di lavoro per l’analisi interattiva di dati distribuiti nelle Università e negli Ospedali, coinvolti nel progetto. In questo modo è possibile utilizzare un database distribuito per la formazione o sperimentazione degli algoritmi, analizzarli ed eseguirli quando richiesto dal CAD (on demand). 3.1.1 Database di MAGIC-5 L’attività di ricerca nel campo dell’analisi di immagini mediche attualmente portata avanti nel contesto di MAGIC-5 è stata iniziata nel 1998 dal progetto CALMA. Nel corso degli anni ha condotto allo sviluppo di prototipi di CAD mammografico e polmonare, attualmente in fase di validazione e perfezionamento [24]. Tutto lo sviluppo degli algoritmi si basa sulla disponibilità di un database di immagini digitali (o digitalizzate) a cui sia associato il cosidetto ground truth, che nel caso delle mammografie è costituito dalla biopsia per i positivi e dal follow-up per i negativi, mentre nel caso di CT polmonari, vista l’assenza di criteri derivanti da ulteriori approfondimenti diagnostici (come esami boptici, istologici o citologici), che in questo particolare esame diagnostico solitamente non vengono effettuati prima che l’eventuale nodulo sospetto abbia raggiunto grandi dimensioni, i criteri saranno concordati con i radiologi in conformità con i protocolli internazionali. Per questo motivo, sia per le mammografie che per le CT polmonari, sono stati creati dei database (DB) di ragguardevoli dimensioni ( circa 4000 mammografie, circa 160 scansioni da CT polmonare per un totale di circa 48000 immagini di singole slices), utilizzati per o sviluppo, il test e la validazione degli algoritmi. La loro qualità e le loro dimensioni sono tali da poterne fare dei punt di riferimento utilizzati dalla comunità internazionale. Un database completo e affidabile di CT del torace costituisce uno strumento di lavoro indispensabile sia per la realizzazione e l’ottimizzazione di algoritmi di queste immagini, sia per il loro test. La particolare necessità di poter disporre di un tale strumento da part di sviluppatori di software e sistemi CAD nel campo della diagnosi precoce delle neoplasie polmonari è giustificata dalle peculiarità proprire della ricerca. In particolare, le peculiari caratteristiche del percorso diagnostico rendono fndamentale la fase di determinazione radiologica della presenza di regioni sospette e la valutazione della loro dimensione nelle CT di follow-up, e rendono quindi molto importante la fase di annotazione e refertazione delle scansioni che possono costituire 3.1.1 Database di MAGIC-5 32 un database di riferimento. Nella maggior parte dei casi non si ha a disposizione una verità bioptica, istologica o citologica; è per questo che è ancora aperto un dibattito internazionale relativo alla determinazione di un gold standard per i database di riferimento e dei percordi da intraprendere per garantire la massima affidabilità ai dati [25]. A livello internazionale, attualmente gli unici database pubblici di CT polmonari sono quello reso disponibile dal consorzio LIDC [26] e quello proposto per la competizione ANODE09 [27]. Il Lung Image database Consortium (LIDC) è un progetto che coinvolge quattro tra le più importanti università americane, sotto la guida del National Cancer Istitute (NCI) con lo scopo di sviluppare delle linee guida nella raccolta, nella valutazione di CT polmonari e nella costruzione di un database di immagini relative, nella diagnosi del cancro al polmone. Esso mette a disposizione, gratuitamente immagini per la valutazione di un sistema CAD e per l’addestramento di radiologi alle prime armi. Le CT a disposizione ora sono 85, disoomogenee sia per i parametri di acquisizione che per quelli di costruzione, e sono accompagnate dalle refertazioni di quattro radiologi. La competizione ANODE09 consiste nella proposta di validare sistemi CAD su database di 50 CT polmonari provenienti dallo studio olandese, Nelson study, omogenee sia per i parametri di acquisizione che per quelli di ricostruzione, di cui non si conosce la refertazione. Sono inoltre disponibili 5 CT annotate di prova. Per quanto riguarda l’Italia, nell’ambito della collaborazione MAGIC-5, la raccolta e la refertazione di CT polmonari, sia provenineti dal progetto di screening ITALUNGCT 2 che cliniche, ha costituito una delle attività di ricerca degli scorsi anni. At- tualmente il database consta in totale di 160 CT a bassa dose ed alta risoluzione, omogenee sia per i parametri di acquisizione che per quelli di ricostruzione, fra le quali sono state selezionate 50 CT provenienti dal progetto ITALUNG-CT che attualmente costituiscono il cosidetto database Gold Standard che costituisce lo strumento mediante il quale vengono effettuati i confronti delle prestazioni dei vari algoritmi di analisi sviluppati nell’ambito della collaborazione. Le CT sono suddivise in slice di spessore di 1mm, in accordo con il protocollo di bassa dose, il numero di slice per scan è di di 300 con una matrice 512 × 512, la grandezza di un pixel va da 0.53 a 0.74 mm e,infine, 12 bit di livelli di grigio nell’Unità Hounsfield (HU). Ogni immagine viene convertita in formato DICOM (Digital Imaging and Communications in Medicine). In accordo con il protocollo dello screening di ITALUNG-CT, i radiologi evidenziano noduli con un diametro maggiore di 5 mm, perché potrebbe indicare la presenza di tumore, quando si esegue una diagnosi precoce della malattia. Una volta identificati, i noduli vengono tenuti sotto controllo da un follow-up di esa2 ITALUNG-CT è un progetto che si propone di dare un contributo a livello europeo sullo scree- ning del tumore al polmone e ha in corso l’analisi di 3.000 soggetti tra le città di Pisa, Firenze e Pistoia. 3.2 Caratteristiche di un sistema CAD polmonare 33 mi di CT spirale, in cui vengono anche analizzati i noduli con diametro compreso tra 3 e 5 mm di formazione recente; mentre quelli che hanno un diametro maggiore di 8 e 10 mm sono destinati ad esami più accurati come PET e biopsia. Alcuni esempi di noduli interni, rivelati in questo studio, sono riportati in figura 2.1; possono avere gli stessi valori di intensità di vasi sanguigni e delle pareti aeree collegate tra loro nella CT. Figura 3.1: Esempi di piccoli noduli polmonari interni 3.2 Caratteristiche di un sistema CAD polmonare Gli oggetti che un CAD polmonare deve essere in grado di riconoscere automaticamente sono costituiti da noduli e micronoduli (diametro inferiore a 3 ÷ 5 mm) polmonari, che nelle proiezioni 2D, relative alle singole fette, appaiono molto simili alle sezioni di strutture anatomiche non patologiche, quali ad esempio vasi sanguigni e bronchi. Le strutture patologiche si possono distinguere in tre categorie, che dipendono dalla loro posizione nel polmone: • noduli interni: contenuti completamente nel parenchima polmonare; • noduli sub-pleurici: originati nel parenchima polmonare, ma adiacenti o connessi alla pleura; • noduli pleurici: originati dalla pleura e cresciuti nel parenchima polmonare. La procedura di indentificazione di noduli nelle tre categorie richiede un’analisi dedicata a causa della loro diversa posizione e forma (figura 2.2). In figura 2.3 è riportato un esempio di immagine polmonare ottenuta con CT spirale a bassa dose, contenente un nodulo sospetto. Come è stato già ampiamente discusso, i parametri che definiscono le prestazioni di un sistema CAD sono la sensibilità e il numero di falsi positivi per scan. In generale, affinché un CAD per rivelazione automatica dei noduli polmonari, abbia buone prestazioni deve comprendere un algoritmo ad alta sensibilità per la ricerca dei noduli candidati ed un efficiente modulo per la riduzione del numero di falsi positivi. Un 3.3 Algortmo di segmentazione 34 Figura 3.2: Esempi di piccoli noduli polmonari: a)nodulo interno b) nodulo sub-pleurico c) nodulo pleurico Figura 3.3: Esempio di immagine polmonare da CT spirale, in cui la freccia indica il nodulo sospetto problema di fondamentale importanza nella realizzazione di un CAD per la rivelazione di noduli è la selezione iniziale delle immagini che potenzialmente corrispondono ai noduli; tale selezione non si può basare solo su una soglia densitometrica (densità del voxel), ma deve tener conto anche delle proprietà geometriche dei noduli (tipicamente la sfericità). Infatti alcuni noduli possono presentarsi con valori densitometrici inferiori alle aspettative o molto simili a quelli dei vasi sanguigni e bronchi. Il CAD polmonare, cosı̀ come gli altri CAD descritti, consta di alcuni passaggi fondamentali: • Segmentazione del parenchima polmonare; • Individuazione di una lista di regioni di interesse, fatto nell’ambito della collaborazione di MAGIC-5 da tre algoritmi differenti (dei quali si parlerà nei paragrafi seguenti); • Individuazione dei falsi positivi tramite una classificazione neurale, che associa ad ogni ROI una probabilità di rappresentare un nodulo rilevante. 3.3 Algortmo di segmentazione Il processo di segmentazione è un passo fondamentale del sistema CAD: seleziona i tessuti polmonari nelle fette di CT, in modo da migliorare la fase di individuazione 3.3.1 Region Growing 3D 35 dei noduli, diminuendo il numero di falsi positivi, aumentando l’effecienza come se l’algoritmo di ricerca dei noduli viene applicato solo dove si possono trovare realmente i noduli. Esistono diversi metodi di segmentazione come: a) knowledgebased tecniques, b) threshold metod, c) region growing, d) mathematical morphology, e) active countour/shape models, f) cluster analysis metod. Il CAD progettato dalla collaborazione MAGIC-5, utilizza un algoritmo automatico di segmentazione, in tre dimensioni per assicurare la coerenza tra due fette adiacenti. Il metodo di segmentazione consta di diversi passaggi: 1. Analisi dell’istogramma dei valori di grigio per l’individuazione di una soglia θ0 ; 2. Region Growing 3D per la segmentazione dell’intero sistema respiratorio; 3. Wavefront algorithm per la ricostruzione dell’albero bronchiale esterno e dei singoli polmoni per differenza; 4. Ciclo di ottimizzazione della soglia per la correzione di eventuali fusioni polmonari; 5. Closing 3D su ciascun polmone per l’eliminazione dei buchi lasciati dai vasi e l’inclusione dei noduli interni e pleurici. Le strutture circostanti sono, al contrario, definite da una densità maggiore e risultano di conseguenza più chiare. E’ elevato, dunque, il contrasto tra il tessuto parenchimale del polmone, che vogliamo delimitare, e i tessuti confinanti. Per distinguere il tessuto polmonare dalle altre strutture si ricorre all’analisi dell’istogramma dei livelli di grigio (noto anche come “istogramma delle intensità”) di una slice “centrale”della scansione, che mostra la distribuzione dei valori di grigio presenti nell’immagine. Si analizza una fetta “centrale” perché in essa le sezioni polmonari sono sufficientemente ampie da rappresentare in maniera significativa le intensità dei grigi tipici del parenchima. Si ha un tipico andamento bimodale, ossia caratterizzato da due picchi principali: il primo include il parenchima polmonare, i bronchi principali e l’aria circostante, il secondo i vasi, i muscoli ed eventuali noduli. Proprio sulla base di tale distribuzione bimodale è facile determinare una soglia, θ0 che separi le zone chiare da quelle scure. Questa soglia è scelta automaticamente attraverso l’applicazione dell’algoritmo isodata, sviluppato da Ridler E Calvard [28]. 3.3.1 Region Growing 3D Alla fase di individuazione della soglia “grossolana”, θ0 , segue la segmentazione del sistema respiratorio, basato sull’applicazione della tecnica di Region Growing (RG). Questa tecnica, di tipo iterativo, è finalizzata all’individuazione e all’accrescimento 3.3.2 Wavefront algorithm 36 di una regione connessa, i cui voxel soddisfino ad un determinato criterio selettivo (condizione di inclusione). L’algoritmo si sviluppa attraverso la selezione, automatizzata, di un punto dell’immagine detto seed point iniziale, che soddisfi una determinata condizione di inclusione. Successivamente effettua un’analisi dei punti vicini al seed point scelto: se anche questi soddisfano il medesimo criterio selettivo, verranno inclusi nella regione di accrescimento.Ognuno dei punti ”cresciuti”, diverrà esso stesso seed point (corrente) e sarà, quindi, sottoposto ad un’analisi dell’intorno. Il ciclo si ripete in maniera iterativa fino a quando non verranno più rilevati voxel che possano essere inclusi nello regione di crescita (condizione di arresto). Il criterio di selezione a cui si è fatto ricorso per la segmentazione del parenchima polmonare è il Double Threshold (doppia soglia), basato sulla crescita dei voxel di intensità compresa tra due soglie predefinite, minima e massima. La soglia minima è fissata a –3000 HU, assicurandosi cosı̀ di essere in intensità ben più basse di quelle relative al dominio polmonare; la massima è quella restituita dall’algoritmo isodata visto nel paragrafo precedente. Con questa fase di sviluppo dell’algoritmo è possibile ricostruire l’intero sistema respiratorio, seppure in maniera grossolana (figura 2.4).Per le regole di inclusioni possono essere usati diversi metodi: • Simple Bottom Threshold/Simple Top Threshold (SBT/STT) se l’intensità I è più alta/bassa di un certo valore di soglia θ0 , il voxel è incluso nella region growing I ≥ θ (SBT) I ≤ θ (STT); • Mean Bottom Threshold/Mean Top Threshold (MBT/MTT) se la media dell’intensità I dei 26 voxel vicini è più alta/bassa di un certo valore di soglia θ , il voxel è incluso nella region growing. < I >≥ θ (MBT) < I >≤ θ (MTT). 3.3.2 Wavefront algorithm Dopo aver segmentato il parenchima polmonare e le vie respiratorie mediante RG, il passo successivo è l’eliminazione della trachea e dei bronchi extra-polmonari fino all’ingresso del polmone, nella regione ilare. Questa regione, detta ilus polmonis, è zone di ingresso di vasi, bronchi e nervi all’interno del parenchima polmonare, e si presenta come una regione difficile da segmentare. Nonostante siano stati stabiliti dei protocolli [29] sul comportamento di un segmentatore polmonare in questa zona, i risultati non sono molto accurati, evidenziando un’incoerenza tra fette successive, in alcune delle quali una parte dei bronchi viene inglobata nel volume segmentato, 3.3.2 Wavefront algorithm 37 Figura 3.4: Maschera binaria in 3D del sistema respiratorio in altre ne è esclusa. La rimozione della struttura bronchiale esterna ha il vantaggio di ridurre il volume restituito dal segmentatore, diminuendo cosı̀ i tempi di calcolo dei successivi stadi di ricerca dei noduli ed il numero di falsi positivi. L’algoritmo utilizzato è una variante del region growing, che combina i principi fondamentali della tecnica tradizionale con un modello di simulazione di un fronte d’onda. La tecnica si basa sulla propagazione, a partire da un seed point, scelto sulla sommità della trachea, di un fronte d’onda, definito come luogo dei voxel che si trovano alla medesima distanza dal seed. Accanto all’inclusione dei punti soddisfacenti alla regola di inclusione, l’algoritmo registra la distanza di ciasc punto incrementato dal seed point iniziale. Si crea una distance map (mappa della distanza) che permette di seguire la ricostruzione dell’albero bronchiale esterno. Attraverso, poi, l’inclusione di opportune condizioni di blocco è possibile bloccare la crescita in prossimità della regione ilare. Al fine di evidenziare la regione di ingresso dei bronchi nel parenchima si sviluppa un approccio basato sull’analisi dei profili di crescita, ovvero del volume del fronte donda in funzione della relativa iterazione. Il fronte d’onda simulato dall’algoritmo si propaga dalla trachea lungo la struttura tubolare, approssimativamente uniforme, del bronco principale; non appena il bronco entra nel polmone, di analoga densità, il fronte d’onda registra un’esplosione (brusco aumento del volume), espandendosi quadraticamente. Questa condizone è rapportata al fatto che il numero di voxel inclusi nel volume aumenta per via dell’inclusione dei punti del parenchima. In tal modo, attraverso la rilevazione dell’esplosione è possibile identificare la regione ilare e bloccare la crescita dei bronchi in corrispondenza della stessa. Ciò a cui si arriva è l’estrazione della struttura bronchiale esterna, dalla trachea fino al suo in gresso nel parenchima (vedi figura 2.5). Dopo segue l’operazione di differenza tra la matrice dell’intero sistema respiratorio 3.3.3 Ciclo di ottimizzazione della soglia 38 Figura 3.5: estrazione della trachea e bronchi esterni e quella della sola trachea-bronchi esterni: è da questa operazione che si giunge alla ricostruzione dei soli polmoni (vedi figura 2.6). Figura 3.6: Operazione di differenza, ottenendo solo i polmoni 3.3.3 Ciclo di ottimizzazione della soglia Nell’analisi delle immagini delle CT assiali, si nota un’apparente fusione delle die sezioni polmonari in un singolo oggetto (vedi figura ?? dovuta al fatto che la giunzione che separa i due polmoni è pesso molto sottile e di debole contrasto. Ciò comporta una serie di problemi in fase di segmentazione del parenchima. Ad esempio, se si ha un contrasto debole, una segmentazione basata sull’analisi della distribuzione dei livelli di grigio può non separare le due parti: in questo caso i polmoni vengono erroneamente considerati come un unico oggetto. Si parla, in questo caso, di “fusione” polmonare. Una errata classificazione degli oggetti legata a queste situazioni, può essere causa di un malfunzionamento dell’algoritmo di segmentazione. Per ovviare a questo problema è introdotta una tecnica basata sull’aggiustamento del valore di soglia massima utilizzato per il region growing, che viene abbassato gradualmente a partire dal valore grossolano iniziale, fino a quando non si verifica più la fusione dei due polmoni. 3.3.4 Closing 3D 39 Figura 3.7: Problema della fusione polmonare 3.3.4 Closing 3D I due polmoni cresciuti mediante l’algoritmo di region growing, vengono salvati in due matrici diverse, poichè è sul singolo polmone che verrà applicato il successivo stadio dell’algoritmo, quello di chiusura. A questo livello di sviluppo, il sistema è stato in grado di delimitare il volume polmonare senza però includere, in quanto non soddisfano la regola di inclusione, le varie tipologie di noduli e i vasi interni. Per poter includere nel volume segmentato queste strutture dense di piccola dimensione, è stata impiegata un fase di chiusura morfologica, (closing), tridimensionale. La necessità di inserire i vasi interni è dettata dalla possibilità di avere noduli a contatto vascolare. Questo è un passaggio importante anche perchè permette una corretta trattazione dei noduli pleurici, che per la loro densità e posizione tendono ad essere lasciati fuori dal volume segmentato. Il closing si basa sull’applicazione consecutiva dell’operazione di dilatazione e di erosione. In fase di dilatazione il parenchima, espandendosi, ingloba in sé i noduli pleurici e le cavità prodotte dall’ingresso ritorna alle sue dimensioni originali. Effettuando una differenza tra la matrice originaria e quella risultante dall’applicazione del closing 3D, è poi possibile isolare tutto quello che non è tessuto polmonare o bronchiale, ovvero i noduli pleurici e interni, le concavità legate alla peculiare forma del polmone, le diramazioni interne dell’albero vascolare e naturalmente una certa quantità di rumore. L’algoritmo di segmentazione restituisce una lista di regioni di interesse, candidate alla classificazione, con le relative informazioni statistiche (posizione, volume, sfericià ecc.). 3.4 Identificazione candidati noduli: metodo ROI Hunter 40 Figura 3.8: Problema della fusione polmonare 3.4 Identificazione candidati noduli: metodo ROI Hunter Dopo il primo step della segmentazione, si passa all’identificazione dei candidati noduli. Partendo da qui, all’interno della collaborazione MAGIC-5 sono stati progettati tre sistemi CAD: VBNA, RGVP, V-ANTS (il quale sarà ampiamente presentato nel capitolo successivo, e sul quale si basa questo lavoro di tesi), dei gruppi di ricerca di Pisa, Bari e Torino rispettivamente. 3.4.1 VBNA Il passaggio della rivelazione dei candidati noduli viene effettuata nel volume individuato dalla fase di segmentazione. I noduli polmonari sono simili a oggetti sferici con un profilo Gaussiano e la matrice in 3D di dati è filtrata tramite una funzione zdot (detta filter function) che distingue oggetti sferici da oggetti che hanno forma planare o allungata. In particolare, zdot è definita tramite gli autovalori di una matrice Hessiana: ( |λ2 | 3 |λ1 | zdot (λ1 , λ2 , λ3 ) = 0 seλ1 , λ2 , λ3 < 0 seλ1 , λ2 , λ3 > 0 dove λ1 ,λ2 ,λ3 sono gli autovalori della matrice Hessiana di ogni voxel, ordinati in modo che |λ1 | ≥|λ2 | ≥|λ3 |. Lo scopo è ottenere un valore di sensibilità ottimale (molto vicino al 100%); per questo la funzione zdot è la combinazione di valori di appianamento (smoothing) gaussiani in scala diversa: σmin = σ1 ,. . . . . .,σmax = σN . 3.4.2 RG 41 Entro il range [σ1 ,σN ] i valori di appianamento sono calcolati come σi = ri−1 σ1 con i = 2, ..., N − 1 dove r = (σN /σ1 )1/N −1 . Il valore finale del filtro zmax assegnato ad ogni voxel è definito come il massimo valore di zdot ottenuto dai differenti valori di scala, moltiplicata per il relativo fattore di scala: zmax = maxi[1,...,N ] σi2 zdot (σi ) Questo filtro viene implementato sulle CT con il risultato di generare un numero elevato di falsi positivi (FP). 3.4.2 RG Per il sistema CAD RG, il processo di individuazione, consiste nella rivelazione dei candidati noduli all’interno dei un working volume. Questo è implementato dall’algoritmo RG con delle regole di inclusione scelte in base alla combinazione di MBT e SBT. La soglia viene scelta per massimizzare la sensibilità ( o l’efficienza) definita come il rapporto tra la frazione di noduli selezionata rispetto al numero totale di noduli diagnosticati dal radiologo. Figura 3.9: Working Volume Per valutare l’efficenza si definiscono false positives (FP) i possibili noduli che soddisfano la diagnosi del ragiologo, secondo queste condizioni: dove {(Xrad , Yrad , Zrad ), Rrad } sono le coordinate del centro e il raggio del cerchio individuato dal radiologo, e {(X, Y, Z), R} sono le coordinate individuate dal CAD. Tutti gli altri candidati sono considerati falsi positivi. 3.5 Riduzione dei falsi positivi L’ultimo passaggio di un sistema CAD polmonare è la riduzione del numero di falsi positivi ottenuti, per la maggior parte incroci tra i vasi sanguigni come si può vedere in figura ??. 3.5.1 VBNA 3.5.1 42 VBNA Per ridurre il numero di FP/imagine è stata sviluppata una procedura chiamata Multi-Scale Voxel-Based Neural Approach (VBNA), dal quale rende il nome il CAD. Una ROI è definita come un insieme di voxel ν, che formano una sfera di raggio intorno ai 5 pixel, identificato dal filtro e con un valore d’intensità Iν al di sopra di una soglia t, definita come: 1 (3.1) t = max Iν − ( max Iν − min Iν) νsf era νsf era 3 νsf era Per non avere nella ROI solo i voxel che appartengono alle strutture calcificate che possono essere presenti nella sfera, si considerano i voxel che hanno un valore di intensità Iν ≥ 200HU . Nella figura 2.10, è riportato un esempio di ROI corrispondente ad un nodulo interno di diametro 5.5 mm. Figura 3.10: Slice consecutive che contengono un nodulo interno di diametro pari a 5.5 mm e la corrispondente ROI. Si considera un possibile nodulo, se il voxel identificato attraverso il filtro, rimane all’interno della sfera centrata nel nodulo avente un diametro pari alle dimensioni del nodulo. Figura 3.11: Idea base del VBNA: ciascun voxel è caratterizzato da un vettore di caratteristiche costituite dai valori d’intensità dei voxel vicini e degli autovalori della matrice del gradiente Hessiano. L’idea base di questo classificatore per la riduzione dei falsi positivi è associare a ciascun voxel un vettore di caratteristiche costituito dai valori di intensità dei voxel vicini in 3D e i tre autovalori della matrice del Gradiente definito come: 3.5.2 RG 43 X G=[ ∂xi I∂xj I] (3.2) con i, j = 1, 2, 3, I(x1 , x2 , x3 ) funzione intensità e la sommatoria sull’area dei voxel vicini (come si può vedere dalla figura 2.11 e i tre autovalori della matrice Hessiana definita come: H = [∂x2 I] i,j (3.3) Infine i vettori delle caratteristiche vengono classificate tramite una rete neurale a tre strati feed-forward back-propagation, che è addestrato e testato per assegnare a ogni voxel un valore che lo identifica come appartenente ad un nodulo o a tessuto normale. 3.5.2 RG Per la riduzione dei falsi positivi del sistema CAD RG, si eseguono due passaggi: • Filtro rule Based: si effettuano due tagli sul volume; • Rete Neurale feed-forward:con i candidati noduli rimanenti, tramite una procedura di validazione di tipo leave one out, si addestra una rete neurale feedforward con uno strato di neuroni nascosti. Le caratteristiche di input sono: • Volume, V ; • Rotonditá, R = V /Vs , dove Vs é il volume della sfera piú piccola contenente la regione segmentata; • Raggio, r definito come la distanza media tra il centro del nodulo e i punti del bordo. La tecnica di validazione leave-one-nodule-out é usata per analizzare il piú alto numero possibile di true positive durante la fase di test. Region Growing è una tecnica di analisi di immagini che consiste nella ricerca di regioni di pixel connesse che soddisfano alcune regole di inclusione. I punti fondamentali dell’algoritmo sono: • Scelta di un seed point e analisi di punti vicini; • Se i punti vicini soddisfano le regole di inclusione, vengono inclusi nella region growing, altrimenti vengono esclusi; • Tutti i punti inclusi ad un certo punto diventano seed point per i passaggi successivi; 3.5.2 RG 44 • Questo procedimento continua sin quando un punto non soddisfa le regole di inclusione. Il problema principale di questo algoritmo è la scelta corretta del seed point che può essere effettuata automaticamente: il primo voxel che soddisfa la regola di inclusione è scelto come punto di partenza dell’algoritmo; la regione segmentata è rimossa dall’immagine e aggiunta alla lista di regioni di interesse; si ricomincia con la ricerca di un nuovo seed point. Per le regole di inclusioni possono essere usati diversi metodi: • Simple Bottom Threshold/Simple Top Threshold (SBT/STT) se l’intensitá I é piú alta/bassa di un certo valore di soglia θ, il voxel é incluso nella region growing I ≥ θ (SBT) I ≤ θ (STT); • Mean Bottom Threshold/Mean Top Threshold (MBT/MTT) se la media dell’intensitá I dei 26 voxel vicini é piú alta/bassa di un certo valore di soglia θ , il voxel é incluso nella region growing. < I >≥ θ (MBT) < I >≤ θ (MTT) Nella figura 2.12 riportata di seguito, vengono sintetizzati i passaggi fondamentali di un sistema CAD. 3.5.2 RG 45 Figura 3.12: Passaggi fondamentali del sistema CAD Capitolo 4 Channeler Ant Model Gli Ant Colony Models sono simulazioni computazionali di agenti virtuali che utilizzano delle regole di comportamento per progettare strategie di cooperazione o competizione tramite colonie di formiche: il fenomeno di un comportamento globale e autonomo rispetto allo scopo, può quindi essere sfruttato per risolvere problemi complessi. Questo modello ha avuto delle soddisfacenti applicazioni, dalle tecniche di ottimizzazione [30, 31] alla robottistica [32]. Negli anni Novanta è iniziato l’uso di colonie di formiche nell’analisi di immagini e segmentazione di oggetti (di solito affrontate con algoritmi classici come region growing, modelli di forme e bordo, algoritmi di genetica ecc.). Alcune soluzioni sono state sviluppate per l’analisi, la segmentazione e lo studio della soglia di immagini in due dimensioni, ma poche sono state utilizzate in un ambiente a tre dimensioni. Il modello proposto, chiamato Channeler Ant Model (CAM) è sviluppato in tre dimensioni, poiché tutte le attività svolte da una formica, come la forzatura, l’alimentazione, la costruzione del nido e altro, si verificano in un ambiente 3D. E’ una soluzione elegante che dipende da pochi parametri ed offre eccellenti prestazioni su immagini con dinamiche e livelli di rumore differenti e apre numerose possibilità di svolgere ulteriori ricerche. Il campo di applicazione di questo modello, proposto in questo lavoro di tesi, è lo sviluppo di un algoritmo per la ricerca automatica di noduli polmonari in Tomografie Computerizzate (CT). 4.1 Gli insetti sociali Tra il 1960 e il 1970 sono stati studiati vari insetti sociali; i membri di una colonia di insetti, per la maggior parte del tempo, comunicano attraverso la percezione gustativa e olfattiva di sostanze chimiche rilasciate da altri individui. Sono degli esseri altruisti, caratteristica definita da alcuni geni, che assicura l’evoluzione e la sopravvivenza della specie. I ricercatori hanno dimostrato che la divisione in caste che esiste in gran parte delle specie di formiche non è dovuta ai geni o al cibo, ma a 46 4.1.1 Modellizzazione delle formiche 47 fattori ambientali. Tra tutti gli insetti sociali esistenti, le specie di maggior successo sono quelle che rispettano le seguenti regole: • Gli individui adulti devono prendersi cura dei figli più piccoli; • Due o più generazioni di insetti vivono nello stesso nido; • I membri della colonia sono divisi in almeno due caste, quella riproduttiva e quella lavorativa, che è sterile. Tra tutte le specie quelle che rispettano meglio queste regole sono le formiche; la loro capacità di sopravvivenza si basa su un incredibile capacità di lavoro e sacrificio per l’evoluzione della colonia. 4.1.1 Modellizzazione delle formiche In [30] Bonabeau definisce la differenza tra la modellizzazione e la progettazione di un modello biologico, ad esempio tra il vero comportamento della formica e gli aspetti del sistema naturale. Secondo gli autori, quando si parla di modellizzazione, si cerca di capire ciò che accade in una colonia di formiche e, realmente, in che modo appare il suo comportamento. Ogni aspetto del modello deve essere supportato da una motivazione biologica; molti comportamenti della colonia, come l’ottimizzazione del percorso, la divisione dei compiti, l’organizzazione della fine della colonia, possono essere modellizzati. Gli insetti sociali costituiscono un super-organismo composto da molti individui indipendenti, dotati di componenti sensoriali che si diffondono nell’ambiente e in grado di rispondere a stimoli esterni sulla base di informazioni locali che possono provenire sia dallo stesso ambiente sia da colonie vicine. La percezione della colonia è la somma delle percezioni dei singoli membri, mentre il comportamento della colonia è la somma di tutte le interazioni tra le formiche e l’ambiente, e tra loro stesse. Uno dei compiti più complessi eseguito dalle formiche è la costruzione del nido. Inizialmente si era pensato che le formiche fossero antropomorfe 1 : secondo questa ipotesi, le formiche sarebbero in grado di ottimizzare le proprie decisioni e cosı̀ la complessità del nido sarebbe il risultato del complesso comportamento degli individui. L’osservazione della colonia, però, ha dimostrato che le formiche non sono antropomorfe, e che la sorprendente complessità del nido è la conseguenza di una varietà di stimoli, ai quali sono sottoposte. 4.1.2 Ottimizzazione del percorso La selezione del percorso delle formiche è stata studiata da Deneubourg e altri, in particolare sulla formica argentina. La configurazione di questo esperimento è molto 1 Aventi caratteristiche umane. 4.2 Channeler Ant Model 48 semplice: il formicaio è separato dalla fonte di cibo da due percorsi uguali (come si può vedere dalla figura 3.1). All’inizio, a causa di fluttuazioni casuali, le formiche privilegiano un percorso rispetto all’altro, depositando una maggiore quantità di feromone e creando una scala preferenziale che attira più formiche sul percorso scelto. Figura 4.1: Esperimento delle formiche applicato a due percorsi con uguale lunghezza. Si crea quindi una mappa di feromone che può essere generalizzata secondo delle regole, elencate di seguito: • Ciascuna formica deposita una certa quantità di feromone; cosı̀ la quantità totale in un percorso è proporzionale al numero di formiche che lo hanno attraversato; • I percorsi vengono indicati con A e B; Ai e Bi sono il numero di formiche che ha usato A o B rispettivamente, dopo che i formiche hanno attraversato il percorso, con Ai + Bi = i; • La (i + 1) formica sceglierà il tratto A con probabilità data da: PA = (k + Ai )n = 1 − PB (k + Ai )n + (k + Bi )n (4.1) dove n rappresenta il grado di non-linearità della funzione scelta; quando n è grande, il ramo con più alta densità di feromone avrà un’alta probabilità di essere scelto. Il grado di attrazione di un ramo non visitato è rappresentato, invece, da k. Lo stesso modello può essere utilizzato per un ponte con percorsi di diverse lunghezze. Le formiche scelgono il tratto più corto: quando una formica ritorna con il cibo sul ramo più lungo, il ramo più corto sarà già stato visitato più volte (a seconda del rapporto tra la lunghezza dei due percorsi), avendo cosı̀ accumulato più feromone e attirando, quindi, più formiche. La mappa creata può essere osservata in figura 3.2. 4.2 Channeler Ant Model Il movimento di colonie di formiche in un immagine 3D potrebbe essere utilizzato, ogni volta che devono essere identificate e ricostruite strutture complesse, con ramificazioni di dimensioni e intensità diverse: viene quindi proposto un modello generale, validato su immagini con proprietà note (differente rapporto segnale/rumore 4.2.1 Membri della colonia 49 Figura 4.2: Bridge Experiment con due percorsi di lunghezza differenti. e intensità variabile). Lo sviluppo del modello Channeler Ant Model (CAM) è nato dall’idea di ricercare noduli sospetti in CT polmonari: nell’analisi di CT, questo modello si usa per segmentare l’albero bronchiale e vascolare per poi rimuoverlo e ricercare strutture nodulari nell’immagine con un filtro dedicato, anch’esso basato sul CAM. 4.2.1 Membri della colonia Il comportamento delle formiche è descritto da quattro tipi di regole: • regole di movimento; • regole di rilascio di feromone; • regole di riproduzione/morte; • comportamenti delle formiche in risposta ad anomalie. Le formiche esplorano l’ambiente spaziale 3D secondo le proprietà (come posizione e intensità) degli elementi di volume discreti (voxel); il loro ciclo di vita è definito da passi, durante i quali le formiche si muovono da un voxel a uno dei vicini. Cosı̀ al tempo t una formica k si trova nel voxel vi ; dopo un ciclo di vita (al tempo t + 1) si muoverà in vj . Un voxel ha 26 vicini di primo ordine, in accordo con la legge di Moore [34]. Nella colonia vivono due tipi di individui: regina e operaie. La regina agisce come un osservatore: svolge compiti connessi al coordinamento della colonia, decide quando una formica muore e quando nasce. Le operaie sono responsabili della costruzione del nido (per esempio la segmentazione di un oggetto, nel nostro caso dell’albero bronchiale e vascolare): si muovono nell’ambiente e depositano feromone in accordo con le regole del modello. Pertanto, sono possibili i seguenti compiti: • Regina: dal punto di vista della regina lo scopo finale dell’algoritmo non è interessante; il punto importante è la supervisione dell’evoluzione dell’algoritmo. La regina ha una visione globale dell’intero ambiente ma non può interferire o 4.2.2 Regole di movimento 50 cambiare in alcun modo il lavoro delle formiche, oppure la scelta della direzione ecc. Praticamente, la regina può essere vista come la figura più importante, che verifica il rispetto delle regole evolutive della colonia; • Operaie: agiscono localmente; una singola formica percepisce solo le proprietà dell’ambiente locale, in una determinata unità di tempo, e segue delle regole di comportamento. La formica non è a conoscenza dello stato dell’evoluzione della colonia o dello scopo: si concentra completamente sui suoi compiti ignorando i comportamenti che potrebbero insorgere nell’evoluzione della colonia. L’ambiente è definito dall’intensità del voxel dell’immagine, che può essere visto come la quantità di cibo disponibile: pertanto, l’intensità del voxel dovrebbe progressivamente diminuire, quando il numero di visite aumenta. Questo meccanismo, richiesto per evolvere la colonia ed esplorare l’ambiente: ogni volta che viene raggiunto il numero massimo di visite in un voxel (NV ) e la quantità massima di feromone (Tmax ), il voxel non è più disponibile come destinazione. 4.2.2 Regole di movimento La casualità è un fattore importante nell’organizzazione della colonia; può assicurare un buon equilibrio tra la scelta di un percorso ben definito e la probabilità di trovare dei percorsi migliori, provocando l’esplorazione di nuove regioni. Come in natura, nell’algoritmo CAM la scelta della destinazione, inizialmente, è casuale; tuttavia tiene conto della conoscenza dell’ambiente totale della colonia, data dalla quantità di feromone già rilasciata in una data posizione (σj ). Una grande quantità di feromone in un voxel deve corrispondere ad un valore di probabilità alta. Le formiche si muovono di un passo per ogni ciclo di vita; pertanto, una formica k, locata nel voxel vi al tempo t, deve scegliere la direzione, secondo le seguenti regole: • solo n = 26 sono le possibili destinazioni; • per ogni voxel vi vicino, si calcola la probabilità Pij , fondamentale per la scelta della destinazione; • se una formica è rilevata in vj , Pij viene posta uguale a 0; • ad ogni candidato è assegnata una probabilità attraverso un algoritmo casuale(roulette wheel ) che rappresenta la scelta come possibile destinazione: W (σj ) Pij (vi → vj ) = P26 n=1 W (σn ) (4.2) dove W (σj ) dipende dalla quantità di feromone nel voxel vj e il denominatore è un fattore di normalizzazione. 4.2.3 Regole di rilascio di feromone 51 Il termine W (σj ) dipende dalla sensibilità osmotropica β (più è alta, più grande è l’influenza del feromone sulla scelta della destinazione) e dal sensore di capacità δ (se la concentrazione del feromone è molto alta, determinerà l’abbassamento della capacità di rilevamento del feromone)[33]: W (σj ) = σj 1+ 1 + δ · σj !β (4.3) E’ scelto un numero casuale nell’intervallo [0,1] che determina quale voxel è effettivamente una possibile destinazione. 4.2.3 Regole di rilascio di feromone In accordo con le regole biologiche, dopo il movimento nel voxel di destinazione, la formica k deposita una quantità di feromone T definita come segue: T = η + ∆ph · Hf ac (4.4) dove η è la minima quantità di feromone depositata dalla formica, Hf ac è una costante che controlla la quantità differenziale di feromone che sarà effettivamente depositata (∆ph ), che è una funzione dipendente dall’intensità dei voxel: ∆ph = Ψ(I) (4.5) La scelta della regola di deposizione, effettuata prima di avviare l’evoluzione della colonia, è molto importante in quanto è legato al tipo di segmentazione che le formiche devono svolgere. Una formica, muovendosi da un voxel vi in vj con intensità I(vi ) e I(vj ) rispettivamente, può ad esempio rilasciare ∆ph secondo le seguenti regole: • Regola I: ∆ph = const · I(vi ) • Regola II: ∆ph = const · |I(vi ) − I(vj )| Pn0 I(vl ) • Regola III: ∆ph = const · l=1 0 n dove n0 è il numero totale di voxel vicini al punto di partenza: quindi n0 = n + 1 = 27 dal momento che, come è stato detto in precedenza, vengono presi in considerazione solo i 26 voxel vicini. La Regola I, in cui la formica rilascia una quantità di feromone proporzionale all’intensità del voxel, è usata per la segmentazione di oggetti su uno sfondo (per esempio il caso di CT polmonare); la Regola II può essere usata per l’individuazione del bordo (per esempio, la ricerca della pleura nelle CT polmonari), mentre la Regola III smorza le fluttuazioni di intensità e può, pertanto, essere usata per segmentare oggetti in un ambiente molto rumoroso. Dopo la deposizione di feromone, sle formiche si muovono verso il voxel di destinazione selezionato. 4.2.4 Ciclo di vita: riproduzione e morte 4.2.4 52 Ciclo di vita: riproduzione e morte Le formiche vivono per un tempo finito, come tutti gli esseri viventi. Il ciclo di vita è regolato da un parametro chiamato energia, che è assegnato alla nascita da un valore di partenza: ε0 = 1 + α (4.6) Ad ogni passo la variazione di energia per una formica k tiene conto delle proprietà dell’ambiente, definite dalla quantità di feromone depositata ∆kph per ogni ciclo e dalla media della quantità di feromone per ogni passo che la colonia ha depositato dall’inizio dell’evoluzione, usato come fattore di normalizzazione (< ∆ph >): la figura 3.3 mostra che la media, usata per la normalizzazione, converge ad un fattore costante ed è molto più stabile rispetto alla media per ciclo. Figura 4.3: Quantità media di feromone rilasciata in funzione del numero di cicli: la linea piena rappresenta i cicli, mentre la linea tratteggiata la media. La media di quantità rilasciata è molto più stabile, come se la colonia si evolve ed è quindi adatto per essere utilizzata come fattore di normalizzazione. Al tempo t + 1 l’energia sarà: εkt+1 = εkt + α · 4.2.5 ∆kph < ∆ph > −1 (4.7) Comportamenti anomali Le formiche possono deviare la loro direzione, assicurando sempre l’obiettivo finale, attraverso i cosidetti comortamenti devianti, che si hanno quando il voxel ha raggiunto il numero massimo di visite oppure quando la quantità massima di feromone. 4.2.6 Implementazione del modello 53 In questo modello i comportamenti anomali possibili sono i seguenti (descritti anche dalla figura 3.4): • Cattura: una formica muore quando sceglie un voxel il cui numero di visite ricevute è superiore alla soglia o la cui quantità di feromone è sopra il limite; • Raggiungimento del confine: una formica muore, quando raggiunge il bordo dell’ambiente in 3D; • Salto: se una formica è completamente circondata da altre formiche, può saltare nella direzione in cui andrebbe se non ci fossero altre formiche intorno. Figura 4.4: Comportamento devianti: a) Eliminazione; b) Salto; c) Raggiungimento del confine; d) Cattura. 4.2.6 Implementazione del modello Channeler Ant Model, il cui diagramma di flusso è mostrato in figura ??, è usato per la ricostruzione dell’albero bronchiale e vascolare su CT tridimensionali. L’output del modello CAM non è un’immagine segmentata, ma piuttosto una mappa di feromone, che può essere considerata come un’effettiva pre-elaborazione del volume in 3D per la segmentazione reale. L’input dell’algoritmo sono: 1. Immagine iniziale; 2. Nv : numero massimo di visite in ciscun voxel; 3. NA : numero iniziale di formiche nella colonia; 4.2.6 Implementazione del modello 54 4. vAH : posizione del fomicaio (per esempio, il voxel dove la colonia inizia la costruzione del nido); 5. Tmax : massima quantità di feromone consentita in un voxel. L’output è: 1. Mappa di feromone, cioè una matrice in 3D che memorizza la quantità di feromone rilasciato dalle formiche in ogni voxel vi dell’immagine originale. Figura 4.5: Diagramma di flusso del Channeler Ant Model Il modello è sviluppato come segue: • Inizialmente, al tempo t = 0, tutti i voxel sono raggiungibili e non contengono feromone: non è disponibile nessuna informazione sull’evoluzione della colonia; • Viene scelta la posizione del formicaio, che appartiene alla struttura che deve essere segmentata ed N0 = 26, sono le formiche che si muovono in ogni direzione con un valore di energia predefinito (α); • Le formiche si muovono nell’ambiente secondo le regole descritte in precedenza, depositando feromone; • La regola di selezione di feromone è scelta con lo scopo di segmentare regioni con un alto valore d’intensità, quindi considerando la regola I: ∆ph = const · (I(vi ) − I0 ), dove I(vi ) è l’intensità del voxel dove si trova la formica e I0 l’intensità minima dell’immagine; 4.3 Analisi del modello 55 • Il ciclo finisce quando tutte le formiche della colonia hanno effettuato uno spostamento; • Quando il ciclo è completato, il valore di energia viene aggiornato e comparato con i valori di soglia εD e εR ; • La colonia si evolve fino a quando sono vive le formiche, oppure fin quando il numero di cicli predefinito è completato; • Quando l’evoluzione della colonia si ferma, la mappa di feromone ottenuta viene memorizzata e analizzata. 4.3 Analisi del modello 4.3.1 Immagini artificiali L’ attività della colonia, sviluppata attraverso l’algoritmo CAM, è visualizzabile attraverso la mappa di feromone del volume analizzato in 3D che, è successivamente usata come punto di partenza per la segmentazione di strutture. Per valutare le prestazioni del modello, è importante studiare i risultati su un insieme di immagini di oggetti 3D generati artificialmente; si possono dividere in tre gruppi differenti, con complessità crescente, data dalla loro forma e le proprietà note (quali la distribuzione dell’intensità, livello di fondo): • Classe A: oggetti con intensità omogenea (I = I0 ) e livello di fondo nullo; • Classe B : oggetti con intensità eterogenea estratta da una gaussiana con media µl e deviazione standard σl , e livello di fondo nullo; • Classe C : oggetti con intensità eterogenea estratta come per oggetti di classe B e fondo di rumore estratto da una gaussiana con media µnoise e devianzione standard σnoise . Figura 4.6: Forme di oggetti artificiali usate per la validazione del modello: a) toroide; b) nodo; c) autostrada; d) yoyo; e) scala; f) ponte a 1 braccio; g) ponte a due bracci. 4.3.2 Parametri di ottimizzazione 56 Le forme implementate sono selezionate per l’analisi del comportamento del modello in differenti condizioni: come si può vedere dalla figura 3.6 l’autostrada che le formiche realmente percorrono in 3D; l’analisi di canalizzazzione di una scala, di un nodo, di una toroide 2 e di uno yoyo, oggetti che cambiano continuamente orientazione; il ponte definisce la reazione della colonia ad una struttura con rami sottili. Inoltre, analizzando un oggetto in 2D (come per esempio uno snake che si può osserevare nella figura 3.7), si dimostra che le performance del modello in 2D e in 3D sono comparabili, come ci si aspettava. Figura 4.7: Snake utilizzato nella validazione del modello. 4.3.2 Parametri di ottimizzazione L’evoluzione della colonia è una funzione che tiene conto di diversi paramentri, descritti di seguito: • Una formica calcola la quantità di feromone da rilasciare nel voxel tramite l’equazione 3.3 contenente due parametri β e δ. Sulla base di uno studio [35] , questi due parametri sono fissati a β = 3.5 e δ = 0.2; • Una formica deposita una certa quantità di feromone nel voxel secondo l’equazione 3.4. La quantità minima di feromone, che una formica lascia dietro di sé e che assicura solo che un voxel è stato visitato, deve essere un valore piccolo (η): esso è definito in modo che sia sempre trascurabile rispetto alla quantità di feromone che si ha in zone con intensità maggiore di zero; si fissa η = 0.01. • La formica aggiorna l’energia secondo le equazioni 3.6 e 3.7: α è una costante che assicura che ogni formica faccia almeno un piccolo movimento prima di morire; • Il fattore di scala, Hf ac , determina quanto velocemente l’energia di una formica aumenta o diminuisce, decidendo quanto rapidamente avvengono riproduzione 2 Toroide o toro è una superficie a forma di ciambella; può essere ottenuta facendo ruotare una circonferenza intorno ad un asse di rotazione appartenente allo stesso piano, ma disgiunto da esso. 4.4 Osservazioni sull’algoritmo CAM 57 e morte ed è definito in termini di proprietà locali dell’ambiente. Un problema è la necessità di trovare un equilibrio soddisfacente tra due differenti effetti: la capacità di esplorare volumi liberi di feromone e la minimizzazione del cosidetto tunnelling, che consente alle formiche di raggiungere volumi di intensità elevata, non connessi a quello in cui si trovano inizialmente. Per esempio, nel caso della toroide, le bobine dell’oggetto sono cosı̀ vicine che, a meno che i parametri del modello siano correttamente sintonizzati, possono essere raggiunti dalle formiche che attraversano un volume vuoto (con bassa intensità). Il numero medio di passi che una formica può fare, in una regione libera di feromone, è dato da: (εR − εD ) (4.8) α se si trascura il fattore ∆ph /∆ph . Per minimizzare il tunnelling, Nsteps deve Nsteps = essere basso. Inizialmente, in questo studio i valori di εD , εR e valgono 1.0, 1.3, 0.2 rispettivamente. La limitazione del numero di visite che un voxel può ricevere (NV ), introdotto affinché la colonia si sposti lungo le strutture segmentate, non è considerato un parametro del modello. Il limite superiore definisce la velocità con cui la struttura è segmentata, non la capacità delle formiche di segmentarla. Il limite inferiore deve tener conto che il numero di visite che un voxel può ricevere è relativo anche all’analisi dei vicini: poiché la scelta della destinazione si basa sulla probabilità, NV deve essere grande per consentire un numero statisticamente significativo di mosse in tutti i voxel vicini di qualsiasi punto visitato. In altre parole, NV deve essere inversamente proporzionale all’intensità media dei volumi circostanti, in modo che in un area con intensità bassa sia consentito un numero di visite elevato. Per esempio con NV compreso tra l’intervallo [40-120], un generico spostamento da vi a vj avviene circa 1,5 (4,5) volte in regioni ad alta (bassa) intensità, che si rivela essere sufficiente per una segmentazione soddisfacente. Per ogni immagine data, l’intensità media dell’intorno di ogni voxel va da un valore medio minimo < I >min ad una valore medio massimo < I >max , ed il numero massimo di visite per un voxel è normalizzato come segue: NV = 40 + 80 4.4 < I > − < I >max < I >min − < I >max (4.9) Osservazioni sull’algoritmo CAM L’algoritmo CAM è stato sviluppato, inizialmente, su oggetti artificiali in 3D appartenenti alle tre classi A, B, C. La scelta di simulare le proprietà degli oggetti (intensità e fondo) è fatta per validare le prestazioni l’algoritmo in funzione del- 4.4 Osservazioni sull’algoritmo CAM 58 l’intensità degli oggetti (media e deviazione standard) e fluttuazione del fondo (per esempio, il rumore). Ogni volta che la colonia completa il ciclo di vita, la mappa di feromone è disponibile per l’analisi, insieme alla mappa del numero di visite ricevute da ogni voxel: la figura ?? mostra alcuni esempi di fette di oggetti in 2D di forma differente, presi dalla classe C. Figura 4.8: Modello CAM applicato ad oggetti di classe C. a) fetta in 2D dell’immagine originale; b) mappa delle visite nei voxel; c) mappa di feromone. Dalla prima riga: autostrada, toroide, yoyo, ponte a 2 bracci e snake. L’evoluzione della popolazione è un indicatore interessante del loro comportamento dinamico durante l’esplorazione dell’immagine: la figura ?? mostra l’evoluzione di un insieme di oggetti appartenenti alla classe C. Comunque, quando il formicaio si trova lungo una delle strutture più sottili, il picco compare più tardi, perché la crescita della popolazione è impedita fin quando non si raggiungono strutture più spesse dell’oggetto. La durata della vita della popolazione dipende dalla forma, dalla complessità e dalla posizione del formicaio. Una tendenza media può essere 4.4 Osservazioni sull’algoritmo CAM 59 vista se gli stessi oggetti di classe A, classe B e classe C vengono messi a confronto: l’estinzione è leggermente più veloce per gli oggetti con intensità uniforme (classe A), mentre ci vuole un pò di più (circa il 10% in più di cicli), quando l’intensità non è uniforme (classe B ) e un altro 5-10% in più quando viene aggiunto un rumore di tipo gaussiano (classe C ). Inoltre, il numero medio di formiche nella colonia aumenta del 10-15% quando si aggiunge il rumore. I risultati ottenuti sono differenti rispetto a quelli che ci si aspettava dalle regole del modello. La media della colonia della popolazione dipende, essenzialmente, dai livelli di feromone, che a sua volta dipende dall’intensità dei voxel: il cambio da intensità uniforme a variabile causa un aumento più lento della popolazione, e pertanto richiede un numero elevato di cicli per completare la segmentazione. L’aggiunta del rumore di fondo aumenta la vita media delle formiche, poiché piccole quantità di feromone possono essere rilasciate anche al di fuori dell’oggetto e questo provoca una diminuizione dell’energia più lenta, trasformandosi in un valore di vita media delle formiche elevato. L’evoluzione della colonia è anche funzione della posizione del formicaio: dipendono dalle proprietà locali dell’oggetto, il numero di formiche nella colonia mostra differenti tipologie, come si può vedere dalla figura 3.9. Figura 4.9: Evoluzione della colonia: la variazione della popolazione per la segmentazione della toroide e del ponte ad un braccio in funzione del numero di cicli. Il modello standard ha un andamento triangolare, ad eccezione del ponte ad un braccio, dove la locazione del formicaio, lungo il ponte sottile, limita lo sviluppo della popolazione fino a quando non si raggiunge la parte più spessa. Il picco della popolazione è raggiunto quando vengono esplorati i bracci sottili delle strutture. Quando il formicaio si trova sul ponte sottile che collega le due braccia, la popolazione raggiunge un plateau corrispondente al ponte di esplorazione e aumenta, nuovamente, quando le formiche raggiungono le braccia. 4.4.1 Segmentazione dell’oggetto 4.4.1 60 Segmentazione dell’oggetto Come già osservato, la colonia di formiche si evolve fino all’estinzione, generando una mappa di feromone che permette la conoscenza globale dell’ambiente. Al fine di valutare le prestazioni dell’algoritmo CAM per quanto riguarda la segmentazione dell’oggetto, deve essere considerata una definizione di quando il voxel è considerato parte dell’oggetto. Si sceglie di usare una condizione di inclusione che, applicata alla mappa di feromone, genera un’immagine binaria: quando un voxel contiene una certa quantità di feromone, predefinita da una soglia (P hth ), è classificato come segmentato. Pertanto, i risultati dipendono dalla soglia e, in pricipio, dalla forma e dalla classe di appartenenza. L’analisi seguente mostrerà che CAM fornisce risultati uniformi, per forme e proprietà dell’immagine diverse, nonché la possibilità di definie una soglia comune per l’analisi della mappa di feromone, che lo rende adeguato per l’analisi di strutture complesse. Per quantificare le prestazioni del modello nella segmentazione vengono definiti i seguenti parametri: • Sensibilità: S = NR /NO rapporto tra il numero di voxel correttamente segmentati e il numero di voxel dell’oggetto originale; • Livello di Esplorazione: E = NV /NO rapporto tra il numero di voxel segmentati e il numero di voxel dell’oggetto originale; • Contaminazione: C = NC /NO rapporto tra il numero di voxel segmentati che non appartengono all’oggetto originale e il numero i voxel dell’oggetto originale. In accordo con le definizioni appena descritte si ha: C = (NV − NR )/NO = E − S (4.10) S, E e C sono funzioni del valore di soglia con cui viene analizzata la mappa di feromone: come si può vedere dalla figura 3.10 la prestazione del modello è indipendente dalla forma dell’oggetto; quindi CAM è un modello abbastanza generale per segmentare oggetti di forme diverse. Il comportamento dell’algoritmo CAM in funzione del rumore in una data intensità media, mostra che è possibile definire una serie di valori di soglia di feromone per i quali la segmentazione è pienamente soddisfacente, a meno che i livelli di rumore sono molti elevati. Inoltre il livello di feromone rispetto al numero di visite per voxel, sono correlate in modo diverso per l’oggetto e per lo sfondo: pertanto, nel caso in cui i valori di rumore sono elevati, sarebbe possibile definire una regola ancora più efficace per la selezione dei voxel. 4.4.1 Segmentazione dell’oggetto 61 Figura 4.10: Studio della contaminazione in funzione della sensibilità su oggetti di forme diverse. Figura 4.11: Correlazione tra la Sensibilità e la Contaminazione per l’oggeto autostrada di classe C a differenti livelli di rumore, per l’algoritmo CAM con una semplice analisi della soglia della mappa di feromone e un algoritmo semplice per la soglia sull’intensità dell’immagine. Capitolo 5 Analisi L’algoritmo CAM è stato sviluppato per essere usato su un sistema di rivelazione automatica di noduli polmonari in CT. In particolare, l’algoritmo CAM è responsabile della parte riguardante la segmentazione dell’albero bronchiale e vascolare nel polmone, per rimuoverlo dall’immagine originale e, nella ricerca di noduli, ridurre il numero di falsi positivi. Come già accennato in precedenza, i database utilizzati per l’applicazione dell’algoritmo su CT polmonari sono riportati in tabella ??. A ciascun caso è associata una refertazione da uno o più radiologi. E’ un file in cui vengono indicati rispettivamente: il numero del nodulo, le coordinate del centro (x,y,z), il raggio e la rilevanza (1, indica nodulo rilevante e 2, nodulo non rilevante). Su ogni database è stato applicato l’algoritmo CAM seguendo i passaggi riportati nei paragrafi successivi. Figura 5.1: Refertazione del radiologo 5.1 Considerazioni iniziali Lanciando l’algoritmo CAM per la ricostruzione dell’albero bronchiale e vascolare si vede che è molto più complesso rispetto alla ricostruzione di oggetti artificiali, poiché le CT sono immagini più grandi, con elevato rumore e con distribuzioni d’intesità molto eterogenee. La segmentazione del polmone è fatta grazie all’ausilio dell’algoritmo di RG (descritto in precedenza), dove l’output è l’immagine dei polmoni, destro e sinistro. La figura 4.2 mostra la fetta di un’immagine originale di CT con 62 5.1 Considerazioni iniziali 63 la relativa segmentazione in 2D. Mentre l’immagine 4.3, non è altro che l’insieme di tutte le segmentazioni in 2D. Figura 5.2: 3 esempi di una slice di CT con la rispettiva segmentazione: a) Immagine originale; b) Immagine segmentata. Figura 5.3: Differenti punti di vista di un volume in 3D segmentato. Le formiche vengono lanciate, partendo da un punto (situato solitamente nell’ilius pulmonis); eseguendo la segmentazione su un certo numero di CT, si nota che uno dei problemi è dovuto alle strutture molto eterogenee, presenti nell’immagine; questo può essere visto anche dalla figura 4.4 in cui, la colonia di formiche si concentra maggiormente in zone dove non c’è niente da ricostruire. Figura 5.4: Primo problema: a) slice della CT originale; b) numero di visite per voxel; c) mappa di feromone Quest’effetto è una diretta conseguenza del fatto che il numero massimo di formiche generate ad ogni riproduzione, G, è considerato costante per tutta la durata della colonia. Quando le formiche occupano grandi aree, come albero bronchiale oppure 5.2 Mappa di feromone 64 vene (che fanno parte dell’albero vascolare), dove ci sono già state, possono dare vita al massimo a 26 altre formiche: la zona è cosı̀ ricostruita e la colonia si muove verso altre destinazioni. Sfortunatamente però, questo diventa un problema quando le formiche raggiungono strutture molto sottili, come i capillari, che hanno un diametro pari a circa due voxel (1mm circa). Quando le formiche raggiungono un valore di energia pari a quello di riproduzione e creano una prole che è data da : Nof f spring = G − Nneigh , dove G = 26 e Nneigh è il numero di voxel vicini pronti ad ospitare una formica, ovvero non occupao da altre formiche. Un altro problema può essere osservato nella figura ??: la colonia può ricostruire anche parte della pleura. In questo modo la formica include nella mappa di feromone i noduli che sono attaccati alla pleura polmonare. Il processo di segmentazione inizia nelle vicinanze del punto in cui i bronchi entrano nei polmoni e si estendono su tutta l’immagine 3D. 5.2 Mappa di feromone Anche se non è facile definire le prestazioni quantitative dell’algoritmo CAM applicato alle CT polmonari, è comunque interessante valutare il comportamento da un punto di vista qualitativo. Analizzando una CT, il formicaio si trova alla radice dell’albero bronchiale e vascolare, e l’ambiente della colonia è definito dai voxel accettati nella regione di segmentazione del volume polmonare. htemp inputs.fAveInt Entries Mean RMS 300 3057 -406.1 82.81 250 200 150 100 50 0 -600 -400 -200 0 200 400 inputs.fAveInt Figura 5.5: Istogramma dell’intensità media. I polmoni, destro e sinistro, sono analizzati separatamente, dal momento che per definizione sono topologicamente disconnessi. La regola di rilascio di feromone è definita in modo tale che la sua diffusione sia proporzionale alla differenza tra l’intensità del voxel e l’intensità minima del volume polmonare. La maggior parte dei voxel giace sul fondo, perchè non viene visitato dalle formiche, e non contiene feromone. Per alcuni di questi, l’intensità può avere un valore elevato: 5.2 Mappa di feromone 65 questi voxel sono i candidati come appartenenti ad un nodulo, che spesso non è connesso con l’albero bronchiale e vascolare. Dopo il ripristino dei voxel con un valore di feromone sopra soglia, l’immagine originale si trasforma in immagine, propriamente detta sottratta, in cui il nodulo da rivelare è più facile da individuare senza falsi risultati. Figura 5.6: Immagine originale; numero di visite; immagine sottrata. L’immagine sottratta diviene l’oggetto iniziale nella fase che cerca i candidati noduli e li classifica. Una volta che l’albero bronchiale e vascolare sono rimossi, inizia la ricerca dei noduli; anche questo passo è fatto dalle formiche. Il processo è semplice: la regina scansiona tutta l’immagine sottratta; se viene trovato un voxel con alta intensità, si inserisce un formicaio e comincia la segmentazione; dopo, all’estinzione della colonia, l’oggetto viene memorizzato e rimosso dall’immagine. La regina va avanti fin quando non vengono trovati altri oggetti. La prima analisi dei noduli e di altri artefatti si fa in base alla grandezza, e più precisamente al numero di voxel che l’oggetto contiene, ma questa non è una condizione sufficiente perchè, piccoli noduli possono essere confusi con sezioni di capillari in 2D che le formiche non sono in grado di ricostruire; ecco perchè molti sistemi CAD escludono piccoli candidati noduli che hanno una grandezza inferiore ai 5mm. Un problema, riguardante le dimensioni, è relativo anche alle strutture che hanno una forma allungata, che sono capillari non riconosciuti a causa dei limiti dell’algoritmo CAM. Anche se queste strutture non sono noduli, diventano dei validi candidati quando viene presa in considerazione solo la dimensione. Cosi devono essere considerate altre caratteristiche come Volume V , espresso in numero di voxel, Sfericità S, definita come il rapporto tra V , volume dell’oggetto, e VS , volume di una sfera più piccola che contiene l’oggetto intero, entrambi misurati in voxel, Eccentricità 1 . 1 Eccentricità, e, è un parametro numerico che si può associare ad una sezione conica; nel caso di un’ellisse può essere una misura intuitiva di quanto il suo aspetto si discosta da una circonferenza. 5.3 Estrazione delle features 66 Il risultato di questa prima analisi è una lista di regioni di interesse individuate dal CAD, indicate in un file nella stessa modalità di scrittura usata dai radiologi nella refertazione (mostrata in figura 4.7). Figura 5.7: Scrittura delle ROI individuate dal CAD: coordinate, raggio, sfericità e volume 5.3 Estrazione delle features Dopo aver ottenuto la lista di CAD findings per ogni CT, attraverso un codice vengono analizzate per poi individuarne le varie caratteristiche. Come detto in precedenza le proprietà considerate sono: • volume; • intensità media e intensità massima; • sfericità; • eccentricità; • ellitticità. Dalle refertazioni del radiologo e le refertazioni del CAD si ottengono i falsi positivi, ossia quelle regioni che il CAD individua ma che non sono ritenuti noduli, dal radiologo, e le regioni che sono indicate da entrambi (CAD e radiologo). Il risultato si può osservare nelle figure 4.8 e 4.9, in cui vengono riportate tutte le regioni di interesse, sulla base di alcune caratteristiche. Il risultato riassuntivo di questo primo passo di analisi, per ogni database, è mostrato nella tabella 4.1, dove è indicato il numero di regioni di interesse individuate dal CAD e dal radiologo, e il numero di falsi positivi (FP). Sulla base di questi primi risultati, l’analisi ci ha portato a soffermarci sulla posizione di queste regioni. 5.4 Analisi della posizione delle ROI Il primo passo, dopo aver ottenuto un elevato numero di regioni di interesse, è stato l’analisi della posizione, in quanto le parti principali dell’algoritmo sono due: Infatti le circonferenze hanno eccentricità nulla (e = 0), quindi le ellissi più simili hanno valori bassi, mentre quelle via via più allungate hanno valori progressivamente maggiori (sempre inferiori a 1) 5.4 Analisi della posizione delle ROI hsize Volumen (mm^3) Entries 3 hImax Int. max 38 Mean 74.53 RMS 210.2 Entries 3 67 hIAve Average Int. 38 Mean -19.11 RMS 96.24 Entries 3 hIStd Int St. Des. 38 Mean -216.4 RMS 75.66 Entries 9 Sphericity 38 Mean 114.9 RMS 78.89 hEfer Entries 3 38 Mean 0.6058 RMS 0.3713 8 2.5 2.5 2.5 2 2 2 1.5 1.5 1.5 1 1 1 0.5 0.5 0.5 2.5 7 6 2 5 1.5 4 3 1 2 0.5 1 0 0 200 400 600 800 100012001400160018002000 0 -600 hSizeEfer Size vs Sphericity Entries 1 Mean x -200 0 200 400 0 -600 600 hEllip Ellipticity 38 Entries 2.842 Mean y 0.6747 0.9 -400 4 -400 -200 0 200 400 hElli3 Ellipticity3p 38 Mean 0.5294 RMS 0.3431 0 -600 600 Entries 8 -400 -200 0 200 400 hEccen Eccentricity 38 Mean 0.8103 RMS 0.6828 0 0 600 Entries 4 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Eccentricity3p 38 Mean 0.823 RMS 0.1401 1 hEcce3 Entries 3 38 Mean 0.6507 RMS 0.2856 3.9971.8 RMS x RMS y 0.3323 3.5 7 3.5 0.8 1.6 0.7 1.4 3 6 3 0.6 1.2 2.5 5 2.5 0.5 1 2 4 2 0.4 0.8 1.5 3 1.5 0.3 0.6 1 2 1 0.2 0.4 2.5 2 1.5 1 0.5 0.1 0 0 0.2 5 10 15 20 25 0 30 0.5 0 0 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.5 0 0 0.5 1 1 1.5 2 2.5 3 3.5 4 4.5 0 0 5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Figura 5.8: Risultato della funzione checkROIsHistoMG() sul database ANODE09: regioni individuate sia dal CAD che dal radiologo. Volumen (mm^3) 100 hImaxFP Int. max hsizeFP Entries Entries 2076 Mean 41.93 RMS 79.83 60 hIAveFP Average Int. 2076 Mean -142.4 RMS 80.34 Entries 90 2076 Sphericity hEferFP Entries 2076 Entries -301.3 Mean 75.41 Mean 0.1436 RMS 59.66 RMS 17.71 RMS 0.1716 80 50 hIStdFP Int St. Des. Mean 600 300 500 250 400 200 300 150 200 100 2076 70 80 60 40 50 60 30 40 40 30 20 20 20 10 100 50 10 0 0 200 400 600 800 100012001400160018002000 0 -600 hSizeEferFP Size vs Sphericity Entries 1 -400 -200 0 Ellipticity 600 Entries 2076 Mean y 0.1451 400 hEllipFP Mean x 4.6735 0.9 200 Mean RMS 400 RMS y 0.1721 -400 -200 0 200 400 600 hElli3FP Ellipticity3p 2076 Entries 0.09667 0.1306 0 -600 -400 -200 0 200 0.5939 RMS 0.6421 400 600 hEccenFP Eccentricity 2076 Mean 500 4.5 3.4 RMS x 0 -600 Entries Mean 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Eccentricity3p 2076 0.6395 RMS Entries 160 0.118 1 hEcce3FP 2076 Mean 0.2205 RMS 0.2515 90 140 350 0.8 4 0.7 3.5 300 0.6 3 250 80 120 400 70 60 100 50 80 300 0.5 2.5 0.4 2 0.3 1.5 0.2 1 0.1 0.5 200 40 60 200 150 30 40 100 0 0 5 10 15 20 25 30 0 20 100 50 0 0 20 10 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Figura 5.9: Risultato della funzione checkROIsHistoMG() sul database ANODE09: distribuzione dei falsi positivi. Database CTs ROIs Match CAD ROIs FP/image LIDC 85 39 30(76.9%) 40595 483 ANODE09 5 39 38(97.4%) 3100 612 GStest 20 39 37(94.9%) 23638 1180 Tabella 5.1: Tabella 5.4 Analisi della posizione delle ROI 68 la segmentazione del bordo e quella dell’albero bronchiale e vascolare (fatto dalle formiche). Ogni ROI è individuata dalle coordinate (x, y, z) e dal raggio, ed è stata calcolata la distanza dal bordo (o cage) che ha coordinate (x0 ,y0 ,z0 ) e la distanza dal centro del volume polmonare (xcenter ,ycenter , zcenter ). Ottenute dal semplice calcolo della distanza matematica: DistF romCage = DistF romCenter = p (x − x0 )2 + (y − y0 )2 + (z − z0 )2 p (x − xcenter )2 + (y − ycenter )2 + (z − zcenter )2 (5.1) (5.2) Dal calcolo di queste distanze si ottiene la distribuzine della posizione delle ROI, come di può vedere dalle figure riportate di seguito: htemp Entries 3057 Mean 156.4 RMS 43.86 inputs.fDistFromCentre3D 100 80 60 40 20 0 50 100 150 200 250 300 inputs.fDistFromCentre3D Figura 5.10: Distribuzione delle regioni di interesse in base alla distanza dal centro. Nella figure è riportato un esempio di distribuzione di ROI (per il database ANODE09), calcolate tramite l’equazioni 4.1 e 4.2. Da questo grafico, si può agire in due modi differenti: • Se la maggior parte di ROI si trova verso il centro, allora si cerca una modifica nell’algoritmo CAM, nell’ottimizzazione di alcuni parametri, come l’energia α; • Se vi sono molte ROI sullo zero, allora si cerca di migliorare il bordo, ovvero l’algoritmo di segmentazione. 5.4.1 Correzione dell’algoritmo 69 htemp Entries 3057 Mean 26.73 RMS 17.31 inputs.fDistFromCage3D 400 350 300 250 200 150 100 50 0 0 20 40 60 80 inputs.fDistFromCage3D Figura 5.11: Distribuzione delle regioni di interesse in base alla distanza dal bordo. 5.4.1 Correzione dell’algoritmo La prima correzione fatta sull’algoritmo è la modifica del parametro α che regola la variazaione di energia e quindi aumenta la vita alle formiche. Partendo dall’equazione ε0 = 1 + α la correzione è la seguente: α= (M axIntensity − M inIntensity) (AverageIntensity − M inIntensity) (5.3) Questa correzione ha permesso alle formiche di arrivare maggiormente in rofondità nell’albero brochiale e vascolare. 5.4.2 Match Partendo dall’analisi delle distanze, è stata introdotta una funzione di match, per valutare i risultati del CAD; inizialmente, l’analisi si basava sulla distanza tra i baricentri delle ROI del CAD rapportate al raggio dei ROI del radiologo; successivamente, questa funzione è stata modificata, tenendo conto della sovrapposizione dei voxel di ciascuna ROI del CAD con quelle del radiologo. Nella figura 4.12, la regione in rosso è quella individuata dal CAD mentre il cerchio è il referto del radiologo; come si può osservare la ROI del CAD comprende un maggior numero di voxel. 5.4.2 Match Figura 5.12: Esempio di un nodulo indicato dal radiologo e dal CAD. 70 5.4.3 ANODE09 71 Sulla base di queste premesse, le distribuzioni ottenute sono riportate di seguito, per ciascun database. 5.4.3 ANODE09 Il database ANODE09 è costituito da 5 CT con 39 casi, individuati dal radiologo. Eseguendo l’analisi delle ROI trovate dal CAD quelle del radiologo, si ottengono i seguenti risultati: dfccrad3d_S Distance from Centre vs Distance from Cage (RAD) 3D all (type 1) 300 Entries 39 Mean x 1 22.7 300 Entries 38 Mean x 2 22.1 Mean y 181.7 Mean y 182.9 0.9 RMS x 13.69 RMS x 13.341.8 RMS y 34.06 250 dfccrad3dmatch_S Distance from Centre vs Distance from Cage (RAD) 3D matched (type 1) RMS y 33.68 250 0.8 150 1 100 0 40 60 80 100 0.8 0.7 0.6 150 0.5 0.4 0.3 0.2 50 0.2 0 0 0 50 100 150 200 0.1 0 0 0 50 100 Figura 5.13: Anode09: distribuzione delle ROI significative (tipo 1) del radiologo. Il primo riquadro indica tutte le ROI, il secondo quelle individuate anche dal CAD e il terzo le ROI che il il CAD non ndividua. 5.4.4 LIDC Il database LIDC è costituito da 85 CT con 149 casi, individuati dal radiologo. Eseguendo l’analisi delle ROI trovate dal CAD quelle del radiologo, si ottengono i seguenti risultati: 5.4.5 GStest Il database GStest è costituito da 20 CT con 39 casi, individuati dal radiologo. Eseguendo l’analisi delle ROI trovate dal CAD quelle del radiologo, si ottengono i seguenti risultati: 0 0.4 0.1 20 00.9 RMS y 100 50 0 RMS x 0.6 0.2 0 -20 250 0.8 0.3 50 Mean y 136.2 1.2 0.4 100 1 Mean x 45.621 200 0.6 0.5 Entries 300 1.4 200 150 dfccrad3dnotmatch_S 1.6 0.7 200 Distance from Centre vs Distance from Cage (RAD) 3D Not matched (type 1) 150 200 5.4.5 GStest 72 Distance from Centre vs Distance from Cage (RAD) 3D all (type 2 and 3) dfccrad3d_NS Entries 300 Distance from Centre vs Distance from Cage (RAD) 3D matched (type 2 and 3) 31 1 Mean x 15.05 300 Mean y 185.9 RMS x 13.540.9 RMS y 45.59 250 0.8 0.7 0.7 200 200 0.6 0.5 0.6 150 0.6 0.5 0.4 100 150 0.4 100 100 0.3 0.2 0.3 0.2 0.2 50 50 0.1 0 -20 0.1 0 0 20 40 60 80 0.5 0.4 0.3 50 RMS y 30.77 250 0.8 0.7 150 13 Mean x 16.521 RMS x 10.270.9 0.8 200 Entries 300 Mean y 173.1 0.9 11.82 RMS y 40.54 250 dfccrad3dnotmatch_NS Distance from Centre vs Distance from Cage (RAD) 3D Not matched (type 2 and 3) 18 Mean x 13.991 Mean y 178.5 RMS x dfccrad3dmatch_NS Entries 0 100 0.1 0 0 50 100 150 0 200 0 0 50 100 150 200 Figura 5.14: Anode09: distribuzione delle ROI non significative (tipo 2 e 3) del radiologo. Il primo riquadro indica tutte le ROI, il secondo quelle individuate anche dal CAD e il terzo le ROI che il il CAD non ndividua. dfcccad3d Entries 3057 Mean x 26.77 Mean y 156.2 10 RMS x 17.3 RMS y 43.56 Distance from Centre vs Distance from Cage (CAD) 3D all 300 250 dfcccad3dmatch_S Entries 38 1 Mean x 22.86 Mean y 178 0.9 RMS x 13.84 RMS y 36.92 Distance from Centre vs Distance from Cage (CAD) 3D matched (type 1) 300 250 0.8 8 200 0.7 200 0.6 6 150 150 4 100 50 0.5 0.4 100 2 50 0 0 0.3 0.2 0.1 0 0 50 100 150 200 dfcccad3dmatch_NS Distance from Centre vs Distance from Cage (CAD) 3D matched (type 2 and 3) Entries Mean x Mean y RMS x RMS y 300 250 18 1 15.72 168.3 0.9 10.59 45.64 0.8 0.7 200 0 50 100 150 200 0 dfcccad3dnotmatch Distance from Centre vs Distance from Cage (CAD) 3D not matched Entries Mean x Mean y RMS x RMS y 300 250 3001 26.88 155.9 10 17.34 43.54 8 200 0.6 6 150 0.5 150 0.4 100 0.3 0.2 50 4 100 2 50 0.1 0 0 50 100 150 200 0 0 0 50 100 150 Figura 5.15: Anode09: distribuzione delle ROI significative (tipo1) e non significative (tipo 2 e 3) individuate dal CAD. 200 0 5.4.5 GStest 73 Distance from Centre vs Distance from Cage (RAD) 3D all (type 1) Distance from Centre vs Distance from Cage (RAD) 3D matched (type 1) 300 Entries 148 Mean x 17.18 Mean y 250 2 14.64 RMS y 37.13 300 1.8 158 RMS x Distance from Centre vs Distance from Cage (RAD) 3D Not matched (type 1) dfccrad3dnotmatch_S dfccrad3dmatch_S dfccrad3d_S 250 1.6 Entries 100 Mean x 15.46 Mean y 159.2 RMS x 12.54 RMS y 40.12 3 2.5 300 250 Entries 48 Mean x 20.76 Mean y 155.5 RMS x 17.72 RMS y 29.78 2 1.8 1.6 1.4 200 1.4 200 2 200 1.2 150 1 1.2 150 1.5 150 1 0.8 100 0.8 100 1 100 0.6 0.6 0.4 50 0.4 50 0.5 50 0.2 0 -20 0 0 20 40 60 80 0.2 0 100 0 0 50 100 150 0 200 0 0 50 100 150 200 Figura 5.16: LIDC: distribuzione delle ROI significative (tipo 1) del radiologo. Il primo riquadro indica tutte le ROI, il secondo quelle individuate anche dal CAD e il terzo le ROI che il il CAD non ndividua. Distance from Centre vs Distance from Cage (RAD) 3D all (type 2 and 3) 300 250 Distance from Centre vs Distance from Cage (RAD) 3D Not matched (type 2 and 3) Distance from Centre vs Distance from Cage (RAD) 3D matched (type 2 and 3) dfccrad3d_NS Entries 1620 Mean x 6.548 Mean y 151 RMS x 12.11 RMS y 38.72 dfccrad3dnotmatch_NS dfccrad3dmatch_NS 10 300 6 9 250 8 300 413 Entries 1207 Mean x 7.987 Mean x 6.056 Mean y 155.9 Mean y 149.3 RMS x 11.47 RMS x 12.29 RMS y 38.82 RMS y 38.55 Entries 5 250 8 7 6 7 200 200 4 200 5 6 150 5 150 3 150 100 2 100 4 4 3 100 3 2 2 50 50 1 50 1 1 0 -20 0 0 20 40 60 80 100 0 0 0 50 100 150 200 0 0 0 50 100 Figura 5.17: LIDC: distribuzione delle ROI non significative (tipo 2 e 3) del radiologo. Il primo riquadro indica tutte le ROI, il secondo quelle individuate anche dal CAD e il terzo le ROI che il il CAD non ndividua. 150 200 5.4.5 GStest 74 Distance from Centre vs Distance from Cage (CAD) 3D all Distance from Centre vs Distance from Cage (CAD) 3D matched (type 1) dfcccad3d Entries 45520 Mean x 19.99 Mean y 133.2 14.37 RMS x RMS y 38.74 300 250 dfcccad3dmatch_S Entries 100 Mean x 16.15 Mean y 158.8 12.78 RMS x RMS y 40.43 300 100 250 80 200 2 1.8 1.6 1.4 200 1.2 60 150 150 100 50 1 0.8 40 100 20 50 0 0 0.6 0.4 0.2 0 0 50 100 150 200 dfcccad3dmatch_NS Entries 413 Mean x 9.032 Mean y 155.5 10.38 RMS x RMS y 39.01 250 50 100 150 200 0 Distance from Centre vs Distance from Cage (CAD) 3D not matched Distance from Centre vs Distance from Cage (CAD) 3D matched (type 2 and 3) 300 0 7 dfcccad3dnotmatch Entries 45116 Mean x 20.08 Mean y 133 14.36 RMS x RMS y 38.68 300 6 250 100 80 5 200 200 4 60 150 150 3 40 100 100 2 50 0 0 50 100 150 200 1 50 0 0 20 0 50 100 150 200 0 Figura 5.18: LIDC: distribuzione delle ROI significative (tipo1) e non significative (tipo 2 e 3) individuate dal CAD. Distance from Centre vs Distance from Cage (RAD) 3D all (type 1) Distance from Centre vs Distance from Cage (RAD) 3D matched (type 1) dfccrad3d_S 300 Entries 1 dfccrad3dnotmatch_S 300 Entries 38 1 33 250 Mean x 17.81 0.8 Mean y 177.5 250 0.7 0.6 150 0.5 0.4 100 0 80 100 0.4 0.3 0.2 0.2 50 0.1 60 0.5 100 50 40 150 0.3 0.2 20 0.6 0.4 0.3 50 0.7 200 0.6 100 0.8 RMS y 38.48 200 0.5 RMS x 13.02 0.8 RMS y 37.56 0.7 150 0.9 169 RMS x 22.26 RMS y 37.79 200 0.1 0 0 0 50 100 150 200 0.1 0 0 0 50 100 Figura 5.19: GStest: distribuzione delle ROI significative (tipo 1) del radiologo. Il primo riquadro indica tutte le ROI, il secondo quelle individuate anche dal CAD e il terzo le ROI che il il CAD non ndividua. 5 0.9 Mean y RMS x 21.28 0 1 Entries 0.9 Mean y 170.2 0 -20 300 Mean x 17.62 Mean x 17.64 250 Distance from Centre vs Distance from Cage (RAD) 3D Not matched (type 1) dfccrad3dmatch_S 150 200 5.4.5 GStest 75 Distance from Centre vs Distance from Cage (RAD) 3D all (type 2 and 3) Distance from Centre vs Distance from Cage (RAD) 3D matched (type 2 and 3) dfccrad3d_NS 300 Entries 250 Distance from Centre vs Distance from Cage (RAD) 3D Not matched (type 2 and 3) dfccrad3dmatch_NS 3 300 80 Entries Mean x 7.221 Mean x 10.45 Mean y 182.4 Mean y 179.1 RMS x 12.16 RMS y 2.5 250 dfccrad3dnotmatch_NS 300 2 Entries 152 Mean x 3.628 1.8 Mean y 186.1 250 RMS x 13.74 2.5 RMS x 8.834 1.6 RMS y 31.69 29.71 3 72 RMS y 26.86 1.4 200 200 2 200 2 150 1.5 100 1 1.2 150 1.5 150 1 0.8 100 100 1 0.6 0.4 50 0.5 50 50 0.5 0.2 0 -20 0 0 20 40 60 80 0 100 0 0 50 100 150 0 200 0 0 50 100 150 200 Figura 5.20: GStest: distribuzione delle ROI non significative (tipo 2 e 3) del radiologo. Il primo riquadro indica tutte le ROI, il secondo quelle individuate anche dal CAD e il terzo le ROI che il il CAD non ndividua. Distance from Centre vs Distance from Cage (CAD) 3D all Distance from Centre vs Distance from Cage (CAD) 3D matched (type 1) dfcccad3d Entries 26205 Mean x 23.6 Mean y 154.3 16.02 RMS x RMS y 42.02 300 250 300 250 40 200 2 dfcccad3dmatch_S Entries 33 Mean x 19.75 Mean y 168.5 RMS x 20.15 RMS y 36.83 50 1.8 1.6 1.4 200 1.2 30 150 150 20 100 50 1 0.8 100 10 50 0 0 0.6 0.4 0.2 0 0 50 100 150 200 dfcccad3dmatch_NS Entries Mean x Mean y RMS x RMS y 250 50 100 150 200 0 Distance from Centre vs Distance from Cage (CAD) 3D not matched Distance from Centre vs Distance from Cage (CAD) 3D matched (type 2 and 3) 300 0 3 80 11.33 178.8 12.89 31.47 300 2.5 250 200 2 200 150 1.5 150 100 1 100 dfcccad3dnotmatch Entries Mean x Mean y RMS x RMS y 26092 23.64 154.2 16.01 42.03 50 40 30 20 50 0 0.5 0 50 100 150 200 0 10 50 0 0 50 100 150 Figura 5.21: GStest: distribuzione delle ROI significative (tipo1) e non significative (tipo 2 e 3) individuate dal CAD. 200 0 5.5 Classificazione 5.5 76 Classificazione Lo sviluppo dell’algoritmo CAM, per la ricerca di noduli polmonari, presentato in questo lavoro di tesi, è stato incentrato sulla fase di preprocessamento dele regioni di interesse e sulla fase di classificazione. Quest’ultima fase, è caratterizzata dall’implementazione e dall’addestramento di una rete neurale, è stata sviluppata sulla base dei nuovi risultati ottenuti, in particolare sulla scelta delle features. Infatti, è stata introdotta un’altra caratteristica, come la distanza dal bordo, in quanto si è visto essere di elevata importanza. Di seguito sono riportati i risultati ottenuti sui tre database. Bibliografia [1] I tumori in Italia, rapporto 2006. Associazione Italiana dei registri tumori (AIRTUM), febbraio 2006. [2] Tumore del polmone: annullate le differenze tra giovani uomini e donne, rapporto 2006. Associazione Italiana dei registri tumori (AIRTUM), febbraio 2006. [3] Peto R., Lopez AD., Borehan J, et al. Mortality from smoking in developed countries 1950-2000:indirect estimates from National Vital Statistics, Oxford University Press, 2006. [4] Nordquist LT, Simon GR., Cantor A. et al (agosto 2004) Improved survival in never-smokers vs current smokers with primary adenocarcinoma of the Lung, 126(2): 347-351. [5] http://www.cqa.polimi.it/attività/ambiente/, Il Radon. Politecnico di Milano. [6] http://www.culcasg.org/. Articolo sull’incidenza e mortalità del carcinoma del polmone. Siti Alliance for Lung Cancer Disease, Cuneo. [7] Cheng YW, Chiou HL., Shew GT., The association of human papillomavirus 16/18 infection with lung cancer among nonsmoking Tawanese women. Cancer Research 61(7):2799-2803. [8] http://www.molecularlab.it/news. Tumore al polmone c’è chi è predisposto. Uno studio multicentrico cerca di individuare le cause genetiche in malati che non fumano. [9] Robbins e Contran, Le basi patologiche delle malattie - Volume 2,7a edizione Torino-Milano, Elsevier Masson, 2008. [10] Travis LB, Devessa SS (gennaio 1995). Lung Cancer. Cancer 75:191-202. [11] Bryant, Cerfolio (luglio 2007). Differences in epidemology, histology and survival between cigarette, smokers and never-smokers who develop non-small cell lung cancer. Chest 132:185-92. 77 BIBLIOGRAFIA 78 [12] De Vita, Hellman, Lawrence, De Vita, Hellman and Rosenberg’s Cancer: Priciples Pratice of Oncology. 8a ed.Lippincott Williams Wilkins,2008. [13] http://content.nejm.org/ The NEW ENGLAND JOURNAL of MEDICINE. [14] http://jama.ama-assn.org/ The Journal of American Medical Association. [15] http://www.ieo.it/ Lo studio Cosmos. [16] http://www.r2tech.com/ ImageChecker. [17] [18] Taft R., Taylor A., Potential improvement in Breast Cancer Detection with a Novel Computer Aided Detection System Applied Radiology, 30:25-28,2001. [19] http://www.scanis.com/ MAMMEX TR. [20] http://www.i-m3d.com [21] http://www.medicsigh.com/ [22] Abstact SSM10-06: Colorectal Cancers: Effects of Cumputer-Aided-Detection in Multirow Detector CT-Colonography [December 3,3-50 PMCST]. [23] M. N. Gurcan et al., Med.Phys. 29(11)2002 pp.2552-2558. [24] Pubblicazione su WWW del DB Mammografico e Polmonare. [25] Armato et al., Acad. Radiol., vol.14,pagg.1455-1463,2007. [26] S.F.McNitt-Gray et al., Acad. Radiol., vol.14,pagg.1464-1474,2007. [27] http://anode09.isi.uu.nl/. [28] T. W. RIDLER and S. CALVARD, Picture thresholding using an iterative selection method’. IEEE Trans. on Systems, Man, and Cybernetics, 1978. SMC-8(8): p. 630-632. [29] SLUIMER et al., ‘Toward Automated Segmentation of the Pathological Lung in CT’. IEEE Transactions on medical imaging, vol. 24, no. 8. August 2005. [30] Bonabeau E., Dorigo M., Theraulz G., Swarm Intelligence, From Natural to Artificial System. Oxford University Press, Oxford, 1999. [31] Dorigo M., Maniezzo V., Colorni A. The Ant System: Optimization by a colony of cooperating agents. IEEE Trans. Syst. Man Cybern. B, 26:29-41, 1996. [32] http://www.swarm-bots.org. BIBLIOGRAFIA 79 [33] Chialvo D., Millonas M., How swarms build cognitive maps. the Biology and Technology of Intelligent Autonomous Agents, 144:139-450, 1995. [34] Moore E.F. Gedanken experiments on sequential machines. Automata studies, 1956. [35] Ramos V. e Almeida F. Artificial ant colonies in digital images habitats a mass behaviour effect study on pattern recognition. In Proceedings of ANTS 200-2nd Intenational Workshop on Ant Algorithms (From Ant Colonies to Artificial Ants), pages 39-43. Belgium, 2000.