Prof.ssa Anna Tramontano@. Dipartimento di Scienze Biochimiche “A. Rossi Fanelli”, Sapienza Università di Roma. Analisi per l’identificazione dei siti di riconoscimento tra antigeni ed anticorpi Gli anticorpi riconoscono i loro antigeni1 stabilendo con essi interazioni energeticamente favorevoli. Quando l’antigene e’ una proteina, il sito di riconoscimento può essere rappresentato da un segmento continuo nella struttura primaria dell’antigene, ma molto più spesso è formato da segmenti non contigui sulla struttura primaria che sono vicini nella struttura tridimensionale (epitopi conformazionali ). L’identificazione della posizione di un epitopo della proteina, cioè la possibilita’ di farne il mapping, è di notevole importanza poichè permette lo sviluppo di strumenti diagnostici o biotecnologici e di vaccini ricombinanti2. [email protected] una molecola, generalmente estranea all’organismo, in grado di stimolare una risposta immunitaria 2 la vaccinazione consiste nella somministrazione di un antigene che generi immunità verso un organismo patogeno. I vaccini possono consistere nella somministrazione dell’agente patogeno inattivato, per esempio con il calore, o attenuato, cioè a bassa virulenza. Un vaccino ricombinante e’ una proteina dell’agente patogeno che viene prodotta in laboratorio inserendo il gene corrispondente in un organismo diverso @ 1 16 In collaborazione con il CASPUR e’ stato sviluppato mepsMAP -“mapping epitopes on protein surface: Mining Annotated Proteins”-, un’applicazione web per l’identificazione dei siti di riconoscimento tra antigeni ed anticorpi. Il servizio e’ stato progettato per rispondere alla seguente domanda: quali regioni di una proteina di struttura nota oppure di un modello di proteina somigliano a peptidi dal punto di vista strutturale, in modo che il peptide possa riprodurre l’effetto dell’antigene dal punto di vista del sistema immunitario? Il software e’ stato implementato come una Service Oriented Architecture (SOA), composta da un database ed un insieme di web services (WSs)3. Il database contiene tutti gli identificativi PDB (Protein Data Bank) di proteine di struttura nota con una annotazione biologica4. Questa risorsa è essenziale per fornire un link automatico tra sequenza di una proteina con una determinata annotazione e la sua struttura. Nella fase di pre-processing vengono utilizzati 4 WSs: • Download PDB per scaricare automaticamente una struttura PDB corrispondente ad un determinato identificativo; • Naccess per selezionare tutti gli amino acidi di superficie di una proteina target che abbiano una superficie accessibile al solvente maggiore di 40 Å2 (5); • Cβ distances per calcolare le distanze tra gli atomi Cβ 6 di ogni coppia di amino acidi di superficie. • Epitope generator è il WS fondamentale per la ricerca: partendo dalla matrice delle distanze tra Cβ in una proteina, costruisce il grafo della lista di adiacenze degli aminoacidi di superficie. Inoltre effettua la ricerca di pattern di lunghezza fissata o di pattern specifici con un numero massimo di mismatch consentiti. L’interfaccia web permette all’utente di cercare gli “epitopi conformazionali” sulla superficie delle proteine in analisi; la sottomissione delle proteine è anche possibile facendo l’uploading di una lista di PDB files. Mediante la “Ricerca Avanzata” e’ possibile selezionare automaticamente la lista di proteine target sulla base di una query sul database per una data annotazione delle proteine. In Figura 1 viene riportato l’esempio di output avendo eseguito la ricerca secondo la descrizione “human coli”. É possibile visualizzare sul web ogni epitopo trovato nel contesto della struttura proteica. Il sistema è stato ottimizzato per offrire le migliori prestazioni, mantenendo comunque un alto grado di usabilità, grazie all’interfaccia web. I risultati vengono mostrati graficamente ciccando su ogni epitopo rilevato. La soluzione di problemi biologici complessi, quale quella della predizione degli epitopi conformazionali, è raggiungibile attraverso lo sviluppo di “strumenti” computazionali che colleghino, organizzino e immagazzinino l’informazione di database distribuiti sul web in vari formati. Lo sviluppo di architetture software ad alte prestazioni orientate ai servizi, nella biologia computazionale, permette il raggiungimento di obiettivi impensabili fino a pochi anni fa. Bibliografia Carrabino D., D’Onorio De Meo P., Sanna N., Castrignano` T., Orsini M., Floris M. and Tramontano A. “The mepsMAP server. Mapping epitopes on protein surface: Mining Annotated Proteins”. IEEE Transactions on Nanobioscience , 2007 June, Volume 6, Issue 2, Page(s): 155-161. Castrignanò T., D’Onorio De Meo P., Carrabino D., Orsini M., Floris M. and Tramontano A. “The MEPS server for identifying protein conformational epitopes”. BMC Bioinformatics 2007, *8*(Suppl 1):S6 (8 March 2007). Castrignano` T., D’Onorio De Meo P., Cozzetto D., Talamo I.G. and Tramontano A. “The PMDB Protein Model Database”. Nucleic Acids Res. 2006 Jan 1;34(Database issue):D306-9. l’applicazione è disponibile alla URL: http://www.caspur.it/mepsMAP insieme di informazioni che descrivono le caratteristiche funzionali della sequenza biologica depositata, per esempio, in una banca dati 1 Å = 10-10 cm 6 Le proteine sono formate da unità di base dette aminoacidi. Un aminoacido e’ a sua volta composta da un atomo centrale di carbonio, detto carbonio alfa, a cui sono legati un gruppo amminico, un gruppo carbossilico, un atomo di idrogeno e un gruppo variabile, chiamato catena laterale, che conferisce le specifiche proprietà chimiche a ciascun aminoacido. Il primo atomo della catena laterale e’ sempre un carbonio, detto carbonio beta, per tutti gli aminoacidi che formano le proteine con l’unica eccezione dell’aminoacido glicina la cui catena laterale e’ un atomo di idrogeno. La posizione del carbonio beta di un aminoacido, quindi, da informazioni circa la posizione della sua catena laterale nello spazio. 3 4 5 17