OLIGOSACCARIDI IN GLICOPROTEINE Una delle più importanti modificazioni post-traslazionali è la glicosilazione che consiste nella formazione del legame di monosaccaridi o oligosaccaridi ad una proteina attraverso un legame glicosidico. Ad esempio l’80% delle proteine del plasma sono glicosilate. La complessità della glicosilazione proviene anche dal fatto che non è sotto diretto controllo genetico, ma è controllata dalla presenza di numerosi enzimi «glicosiltrasferasi», monosaccaridi e loro precursori. Mono ed oligosaccaridi possono essere collocati diverse posizioni nella struttura primaria delle proteine, ma solo su specifici amminoacidi. I più comuni sono asparagina, treonina e serina. I legami degli oligosaccaridi con la catena peptidica sono definiti: N-glicosidici quando si tratta di asparagina O-glicosidici quando si tratta di treonina e serina Legame N-glicosidico Legame O-glicosidico Solo alcuni monosaccaridi sono coinvolti nei legami N- ed Oglicosidici: N-glicosidici: N-acetilglucosammina O-glicosidici: N-acetilgalattosammina, galattosio, mannosio, xilosio, e L-arabinosio N-linked oligosaccaridi. Negli oligosaccaridi legati ad Asn, la catena laterale ammidica dell’asparagina è legata ad un residuo di N-acetil glucosammina, ma è necessaria una particolare sequenza amminoacidica dopo il residuo Asn: -Asn-X-Ser/Thr-, La presenza del residuo di Ser/Thr nella terza posizione è essenziale per il legame dello zucchero: la formazione di un legame idrogeno tra il gruppo carbonilico della catena laterale di Asn ed il gruppo ossidrile di Ser/Thr diminuisce la costante di dissociazione del gruppo ammidico e quindi facilita il legame con il residuo saccaridico. In funzione della composizione delle ramificazioni 1→3 ed 1→6, gli oligosaccaridi legati ad un residuo di Asn sono classificati in tre gruppi: a) complesso, b) ibrido e c) ricco in mannosio. O-linked oligosaccaridi Oligosaccaridi legati ad una proteina attraverso un legame Oglicosidico sono chiamati O-glicani. Non è richiesta una specifica sequenza di amminoacidi, sebbene residui di serina o treonina che formano cluster o sono vicini ad una prolina hanno tendenza più alta a dare legami O-glicosidici. O-glicani sono presenti nei gruppi sanguigni. Dal 1901 sono stati scoperti più di 200 gruppi sanguigni (antigeni). Alcuni di questi antigeni sono proteina-dipendenti (MNSs., RH, Duffy, Kell, ecc.) altri sono carboidrati-dipendenti. (ABO, Lewis, Ii, P, T, Th, Tn, ecc.). Questi antigeni sono portati sia da glicoproteine che da glicolipidi e sono anche presenti in tessuti e superfici cellulari diverse dai globuli rossi. Struttura di una proteina modificata con glicosilazione. Le catene oligosaccaridiche sono rappresentate con atomi a “spazio pieno” e la catena polipeptidica con un nastro arancione. Il residuo Asn è in azzurro. Le due sequenze oligosaccaridiche iniziano con due residui di Nacetilglucosammina ciascuna (in giallo) ed hanno altri tipi di residui saccaridici (in violetto). gC è una glicoproteina virale espressa sulla superficie. Può legare proteine del sistema immunitario per proteggere il virus dalla loro azione. Lysophospholipid Binding Protein: Gioca un ruolo complementare con l’Albumina per eliminare la lisofosfaditilcolina Capacità informazionale di un codice a base di carboidrati Tenendo presente il codice proteico ed il codice genetico, consideriamo un codice basato sui carboidrati per vedere che tipo e quantità di informazione può contenere. I carboidrati contengono un potenziale di informazione, anche in sequenze corte, molti ordini di grandezza superiore a quello di altri biopolimeri. Ragioni: - composizione possibilità di più di una posizione di legame anomeria ramificazioni Questa capacità è sfruttata nei processi di riconoscimento cellulare o riconoscimento molecolare (recettori, lectine, anticorpi, apteni) Elementi che definiscono la struttura di un polisaccaride 1) Composizione 2) Sequenza 3) Tipo di concatenamento 4) Anomeria ( o ) Caratteristiche di una sequenza saccaridica riconosciuta da una proteina: - lunghezza fino a 6 unità saccaridiche (spesso 1-4) - identità dei monosaccaridi: epimeri - configurazione anomerica ( o ) - sequenza lineare (struttura primaria) - dimensioni dell’anello (furanosidico o piranosidico) - posizione del legame sull’anello - schema di ramificazione - gruppi sostituenti non-saccaridici - fosfato, fosfonato - solfato, solfonato - alchile, acile, acetale, altri Versante delle proteine proprietà rilevanti del sito di legame: - numero di unità monosaccaridiche che entrano nel sito - struttura tridimensionale dell’oligosaccaride - dettagli di ogni unità saccaridica (legame, anomeria, dimesioni d’anello) - possibilità di accettare strutture diverse (specificità) Quanti tipi di composti saccaridici a basso peso possono incontrare le proteine con attività di legame verso i saccaridi? Proviamo ad effettuare un calcolo semplice Consideriamo un trisaccaride composto da uno dei più comuni 20 monomeri (es. glucosio, mannosio, galattosio, fruttosio, N-acetilglucosammina, Nacetilgalattosammina, fucosio, arabinosio, xilosio, ribosio, acido glucuronico, acido galatturonico, acido mannuronico, acido iduronico, acido sialico, KDO, KDN). Il numero di possibili trisaccaridi non sostituiti sarà: [(permutazioni della sequenza) x anomeria x dimensioni d’anello x legami] 203 x 23 x 23 x 12 (la media dei possibili isomeri di legame è 12 per 3 saccaridi) ovvero >6,000,000 strutture lineari (e 3,000,000 ramificate) Il totale porta a 9 x 106 potenziali trisaccaridi in paragone con i soli 8000 tripeptidi composti da monomeri presi da una libreria ancora una volta di 20 elementi. La differenza è 3 ordini di grandezza. Per generalizzare si deve tener conto anche delle ramificazioni e delle sostituzioni con gruppi non saccaridici. (per semplificare, facendo un esempio di una libreria di 3 monosaccaridi): Strutture = En x 2nr x 2na x 4n-1 En rappresenta le permutazioni di sequenza che includono la ripetizione dello stesso monomero (per 3 monosaccaridi 33 = 27), dove E è la libreria di zuccheri (3 nell’esempio), e n è la lunghezza dell’oligomero (3). Il secondo termine, 2nr, tiene conto delle dimensioni d’anello (forma piranosio o furanosio) (23 = 8). Il terzo termine, 2na, tiene conto dell’anomeria ( o ) (23 = 8). Il quarto termine, 4n-1, tiene conto del legame glicosidico: dove 4 sono i gruppi ossidrile potenziali disponibili al legame con il monosaccaride precedente: 42 = 16 (per pentosi sarebbe 32 = 9, per questo è stata assunta la media di 12). In definitiva il numero corretto di permutazioni in un trisaccaride lineare con una libreria di 3 monosaccaridi esosi è: 27 x 8 x 8 x 16 = 27648. Effetto delle ramificazioni In trisaccaridi ramificati gli zuccheri A e B sono entrambi glicosidi del residuo C: Dove l’asterisco indica l’estremità riducente di continuazione di catena (aglicone) La formula che tiene conto del numero di strutture ramificate possibili è simile a quella delle strutture lineari: Strutture = En x 2nr x 2na x 6n-2 ma l’ultimo termine tiene conto delle possibilità delle combinazioni della ramificazione sul residuo C che sono 6 (2-3, 2-4, 2-6, 3-4, 3-6, 4-6). Eseguendo il calcolo: 27 x 8 x 8 x 6 = 10368 Fino ad ora quindi abbiamo: 27648 strutture lineari + 10368 strutture ramificate → totale 38016 possibile strutture. Non abbiamo tenuto conto della possibilità di oligomeri non riducenti (tipo trealosio) Gli oligosaccaridi parlano con le proteine che li riconoscono attraverso un linguaggio strutturale sofisticato ed il DNA potrebbe essere visto come una “macchina del linguaggio” che codifica da una parte per lectine ed anticorpi e dall’altra per gli enzimi (glicosil trasferasi) che costruiscono gli oligosaccaridi. Effetto delle sostituzioni con gruppi non saccaridici Avendo a disposizione circa 38000 strutture trisaccaridiche, se uno dei 10 ossidrili liberi è sostituito con un gruppo solfato si ottengono 380000 diversi trimeri, ma la sostituzione potrebbe essere con un gruppo fosfato, acetile, metossile, ecc., che aumento di un ordine di grandezza le possibilità per ciascuno dei diversi sostituenti. Ci sono 45 possibilità di sostituzioni doppie: (dove n=10 e i=2) Quindi con 38000 possibili trimeri si ottengono circa 1,7 milioni di possibili trimeri di-sostituiti Se invece i 2 sostituenti sono diversi: Abbiamo 90 possibili sostituzioni con un potenziale di circa 3,5 milioni di strutture. Se usassimo un codice di 20 lettere per i trisaccaridi si otterrebbero 90 x 106 strutture mono-sostituite e circa 109 strutture di-sostituite. Esempi di attività biologica di sistemi proteina-carboidrato: - selectine: mediatori della risposta infiammatoria - fattori NOD: sistemi di riconoscimento tra legumi e batteri fissatori di azoto - gradienti di glicosilazione sono recepiti da lectine durante i processi di impollinazione nelle piante - frammenti oligosaccaridici della parete cellulare delle piante stimolano i loro meccanismi di difesa - saccaridi N-legati contenenti un glucosio terminale sono importanti in sistemi capaci di riconoscere se una proteina è ripiegata correttamente - l’eparina (un glicosoamminoglicano solfato) è coinvolta nell’interazione con l’antitrombina III della cascata di coagulazione del sangue - l’eparina è pure coinvolta in interazioni con fattori di crescita Tutti questi esempi sono anche campi molto attivi di ricerca anche a livello industriale (→ €).