Analisi per l`identificazione dei siti di riconoscimento tra antigeni ed

Prof.ssa Anna Tramontano@. Dipartimento di Scienze Biochimiche “A. Rossi Fanelli”, Sapienza Università di Roma.
Analisi per l’identificazione dei siti di
riconoscimento tra antigeni ed anticorpi
Gli anticorpi riconoscono i loro antigeni1 stabilendo con essi
interazioni energeticamente favorevoli. Quando l’antigene
e’ una proteina, il sito di riconoscimento può essere rappresentato da un segmento continuo nella struttura primaria
dell’antigene, ma molto più spesso è formato da segmenti non
contigui sulla struttura primaria che sono vicini nella struttura tridimensionale (epitopi conformazionali ). L’identificazione
della posizione di un epitopo della proteina, cioè la possibilita’
di farne il mapping, è di notevole importanza poichè permette
lo sviluppo di strumenti diagnostici o biotecnologici e di vaccini ricombinanti2.
[email protected]
una molecola, generalmente estranea all’organismo, in grado di stimolare una risposta immunitaria
2
la vaccinazione consiste nella somministrazione di un antigene che generi immunità verso un organismo patogeno. I vaccini possono consistere
nella somministrazione dell’agente patogeno inattivato, per esempio con il calore, o attenuato, cioè a bassa virulenza. Un vaccino ricombinante e’ una
proteina dell’agente patogeno che viene prodotta in laboratorio inserendo il gene corrispondente in un organismo diverso
@
1
16
In collaborazione con il CASPUR e’ stato sviluppato mepsMAP
-“mapping epitopes on protein surface: Mining Annotated
Proteins”-, un’applicazione web per l’identificazione dei siti
di riconoscimento tra antigeni ed anticorpi. Il servizio e’
stato progettato per rispondere alla seguente domanda: quali
regioni di una proteina di struttura nota oppure di un modello
di proteina somigliano a peptidi dal punto di vista strutturale,
in modo che il peptide possa riprodurre l’effetto dell’antigene
dal punto di vista del sistema immunitario?
Il software e’ stato implementato come una Service Oriented
Architecture (SOA), composta da un database ed un insieme
di web services (WSs)3. Il database contiene tutti gli identificativi PDB (Protein Data Bank) di proteine di struttura nota con
una annotazione biologica4. Questa risorsa è essenziale per
fornire un link automatico tra sequenza di una proteina con
una determinata annotazione e la sua struttura. Nella fase di
pre-processing vengono utilizzati 4 WSs:
• Download PDB per scaricare automaticamente una
struttura PDB corrispondente ad un determinato
identificativo;
• Naccess per selezionare tutti gli amino acidi di superficie di una proteina target che abbiano una superficie
accessibile al solvente maggiore di 40 Å2 (5);
• Cβ distances per calcolare le distanze tra gli atomi Cβ 6
di ogni coppia di amino acidi di superficie.
• Epitope generator è il WS fondamentale per la ricerca:
partendo dalla matrice delle distanze tra Cβ in una
proteina, costruisce il grafo della lista di adiacenze degli
aminoacidi di superficie. Inoltre effettua la ricerca di
pattern di lunghezza fissata o di pattern specifici con un numero massimo di mismatch consentiti.
L’interfaccia web permette all’utente di cercare gli “epitopi
conformazionali” sulla superficie delle proteine in analisi; la
sottomissione delle proteine è anche possibile facendo l’uploading di una lista di PDB files. Mediante la “Ricerca Avanzata”
e’ possibile selezionare automaticamente la lista di proteine
target sulla base di una query sul database per una data annotazione delle proteine. In Figura 1 viene riportato l’esempio
di output avendo eseguito la ricerca secondo la descrizione
“human coli”. É possibile visualizzare sul web ogni epitopo
trovato nel contesto della struttura proteica.
Il sistema è stato ottimizzato per offrire le migliori prestazioni, mantenendo comunque un alto grado di usabilità, grazie
all’interfaccia web. I risultati vengono mostrati graficamente
ciccando su ogni epitopo rilevato.
La soluzione di problemi biologici complessi, quale quella
della predizione degli epitopi conformazionali, è raggiungibile
attraverso lo sviluppo di “strumenti” computazionali che
colleghino, organizzino e immagazzinino l’informazione di
database distribuiti sul web in vari formati. Lo sviluppo di
architetture software ad alte prestazioni orientate ai servizi,
nella biologia computazionale, permette il raggiungimento di
obiettivi impensabili fino a pochi anni fa.
Bibliografia
Carrabino D., D’Onorio De Meo P., Sanna N., Castrignano` T., Orsini M., Floris M. and Tramontano A. “The mepsMAP server. Mapping epitopes on protein surface: Mining Annotated Proteins”. IEEE Transactions on Nanobioscience , 2007 June, Volume 6, Issue
2, Page(s): 155-161.
Castrignanò T., D’Onorio De Meo P., Carrabino D., Orsini M., Floris M. and Tramontano A. “The MEPS server for identifying protein
conformational epitopes”. BMC Bioinformatics 2007, *8*(Suppl 1):S6 (8 March 2007).
Castrignano` T., D’Onorio De Meo P., Cozzetto D., Talamo I.G. and Tramontano A. “The PMDB Protein Model Database”. Nucleic
Acids Res. 2006 Jan 1;34(Database issue):D306-9.
l’applicazione è disponibile alla URL: http://www.caspur.it/mepsMAP
insieme di informazioni che descrivono le caratteristiche funzionali della sequenza biologica depositata, per esempio, in una banca dati
1 Å = 10-10 cm
6
Le proteine sono formate da unità di base dette aminoacidi. Un aminoacido e’ a sua volta composta da un atomo centrale di carbonio, detto carbonio
alfa, a cui sono legati un gruppo amminico, un gruppo carbossilico, un atomo di idrogeno e un gruppo variabile, chiamato catena laterale, che
conferisce le specifiche proprietà chimiche a ciascun aminoacido. Il primo atomo della catena laterale e’ sempre un carbonio, detto carbonio beta, per
tutti gli aminoacidi che formano le proteine con l’unica eccezione dell’aminoacido glicina la cui catena laterale e’ un atomo di idrogeno. La posizione del
carbonio beta di un aminoacido, quindi, da informazioni circa la posizione della sua catena laterale nello spazio.
3
4
5
17