Layout.qxd 17-10-2005 14:27 Pagina V Indice Prefazione XIII Protein Data Bank: una nota degli autori XIV Nota all’edizione italiana XV Ringraziamenti XVI CAPITOLO 1 Dalla sequenza alla struttura 1.0 Visione d’insieme: funzione e architettura delle proteine 2 Le proteine sono le macromolecole più versatili della cellula Quattro sono i livelli di struttura delle proteine 1.1 Gli amminoacidi 4 Le caratteristiche chimiche delle catene laterali degli amminoacidi hanno conseguenze importanti per le modalità con cui esse partecipano al folding e alle funzioni delle proteine 1.2 I geni e le proteine 6 Esiste una relazione lineare tra la sequenza di basi del DNA di un gene e la sequenza amminoacidica della proteina da esso codificata L’organizzazione del codice genetico riflette il raggruppamento chimico degli amminoacidi 1.3 Il legame peptidico 8 Le proteine sono polimeri lineari di amminoacidi connessi da legami ammidici Le proprietà del legame peptidico hanno importanti effetti sulla stabilità e sulla flessibilità delle catene polipeptidiche in acqua 1.4 I legami che stabilizzano le proteine ripiegate 10 Le proteine ripiegate sono stabilizzate prevalentemente da interazioni deboli non covalenti Le proprietà dell’acqua di formare legami a idrogeno hanno conseguenze importanti sulla stabilità delle proteine 1.5 Importanza e fattori determinanti della struttura secondaria 12 Le proteine ripiegate hanno segmenti a conformazione regolare La disposizione di elementi costituenti la struttura secondaria fornisce un modo conveniente per classificare i tipi di fold Vincoli sterici definiscono i possibili tipi di struttura secondaria L’elemento di struttura secondaria più semplice è il beta turn 1.6 Proprietà delle alfa eliche 14 Le alfa eliche sono strutture cilindriche versatili stabilizzate da una rete di legami a idrogeno dello scheletro Le alfa eliche possono essere amfipatiche, con un lato polare e uno non polare Le eliche del collagene e della poliprolina hanno proprietà speciali 1.7 Proprietà dei foglietti beta 16 I foglietti beta sono strutture estese che talvolta formano barili I foglietti beta amfipatici si trovano sulla superficie delle proteine © 88-08-17896-X Indice V Layout.qxd 17-10-2005 14:27 Pagina VI 1.8 Predizione della struttura secondaria 18 Alcuni amminoacidi ricorrono più comunemente nelle alfa eliche, altri nei foglietti beta 1.9 Il folding 20 La struttura ripiegata di una proteina è determinata direttamente dalla sua struttura primaria La competizione tra interazioni interne e interazioni con l’acqua guida il folding delle proteine La previsione computazionale del folding non è ancora affidabile Le proteine di membrana con eliche si possono ripiegare attraverso la condensazione di elementi di struttura secondaria preformati nel doppio strato 1.10 La struttura terziaria 22 La condensazione di elementi multipli di struttura secondaria porta alla struttura terziaria Le molecole d’acqua legate sulla superficie di una proteina ripiegata costituiscono una parte importante della struttura La struttura terziaria è stabilizzata dal raggruppamento efficiente degli atomi nella parte interna della proteina 1.11 Struttura delle proteine di membrana 24 I principi che stanno alla base delle strutture delle proteine integrali di membrana sono gli stessi noti per le proteine solubili in acqua e portano alla formazione degli stessi elementi di struttura secondaria 1.12 Stabilità delle proteine: interazioni deboli e flessibilità 26 La proteina ripiegata è un compromesso termodinamico La struttura delle proteine può essere alterata da una varietà di agenti La stabilità marginale della struttura terziaria di una proteina permette alle proteine di essere flessibili 1.13 Stabilità delle proteine: modificazioni post-traduzionali 28 I legami covalenti possono aggiungere stabilità alla struttura terziaria Le modificazioni post-traduzionali possono alterare sia la struttura terziaria sia la stabilità di una proteina 1.14 I domini delle proteine 30 Le proteine globulari sono costituite da domini strutturali I domini hanno cuori idrofobici Le proteine multidominio probabilmente si sono evolute dalla fusione dei geni che un tempo codificavano per proteine separate 1.15 L’universo delle strutture proteiche 32 Il numero dei fold proteici è vasto ma limitato Le strutture delle proteine sono modulari e le proteine possono essere raggruppate in famiglie sulla base dei domini che esse contengono La natura modulare della struttura delle proteine permette inserzioni e delezioni nella sequenza 1.16 I motivi nelle proteine 34 I motivi nelle proteine possono essere definiti dalla loro sequenza primaria o dalla disposizione degli elementi di struttura secondaria L’identificazione dei motivi a partire dalla sequenza non è semplice 1.17 I domini alfa e i domini beta 36 I domini proteici si possono classificare secondo i loro elementi di struttura secondaria Due motivi comuni dei domini alfa sono i fasci di quattro eliche e il fold globinico I domini beta contengono filamenti collegati in due modi diversi I foglietti beta antiparalleli possono formare barili e sandwich 1.18 I domini alfa/beta, alfa + beta e con legami incrociati 38 Nei domini alfa/beta ciascun filamento di un foglietto beta parallelo di solito è collegato al successivo da un’alfa elica VI Indice © 88-08-17896-X Layout.qxd 17-10-2005 14:27 Pagina VII Le famiglie più importanti di domini alfa/beta sono due: i barili e i twist I domini alfa + beta hanno motivi con alfa eliche indipendenti impaccati contro un foglietto beta Gli ioni metallici e i ponti disolfuro formano legami incrociati in domini irregolari 1.19 La struttura quaternaria: principi generali 40 Molte proteine sono costituite da più di una catena polipeptidica Tutte le interazioni intermolecolari specifiche dipendono dalla complementarità 1.20 La struttura quaternaria: interfacce intermolecolari 42 Tutti i tipi di interazioni che stabilizzano le proteine contribuiscono alla formazione di interfacce intermolecolari Interazioni quaternarie non appropriate possono avere straordinarie conseguenze funzionali 1.21 La struttura quaternaria: geometria 44 Le associazioni di proteine costituite da subunità identiche di solito sono simmetriche 1.22 Flessibilità delle proteine 46 Le proteine sono molecole flessibili Le fluttuazioni conformazionali nelle strutture dei domini tendono a essere locali I movimenti delle proteine coinvolgono sia gruppi di atomi non legati sia gruppi di atomi legati covalentemente Cambiamenti conformazionali indotti possono causare ampi movimenti di catene laterali, loop o domini CAPITOLO 2 Dalla struttura alla funzione 2.0 Visione d’insieme: le basi strutturali della funzione delle proteine 50 Esistono molti livelli di funzione nelle proteine Esistono quattro funzioni biochimiche fondamentali delle proteine 2.1 Riconoscimento, complementarità e siti attivi 52 Alcune funzioni delle proteine, come il riconoscimento cellulare e la catalisi, dipendono dalla complementarità Il riconoscimento molecolare dipende da microambienti specializzati che derivano dalla struttura terziaria della proteina Microambienti specializzati nel contesto di siti di legame contribuiscono alla catalisi 2.2 Flessibilità e funzione delle proteine 54 La flessibilità della struttura terziaria permette alle proteine di adattarsi ai loro ligandi La flessibilità delle proteine è essenziale per la funzione biochimica Il grado di flessibilità varia nelle proteine con funzioni differenti 2.3 Localizzazione dei siti di legame 56 I siti di legame per le macromolecole sulla superficie di una proteina possono essere concavi, convessi o piatti I siti di legame per piccoli ligandi sono fenditure, tasche o cavità I siti catalitici spesso si trovano alle interfacce di domini e subunità 2.4 Natura dei siti di legame 58 I siti di legame generalmente presentano una quantità di superficie idrofobica esposta superiore alla media I siti di legame per piccole molecole sono in genere concavi e parzialmente idrofobici Le interazioni deboli possono portare a un facile scambio di partner Anche la rimozione di acqua guida eventi di legame I contributi all’affinità di legame talvolta possono essere distinti dai contributi alla specificità di legame © 88-08-17896-X Indice VII Layout.qxd 17-10-2005 14:27 Pagina VIII 2.5 Proprietà funzionali delle proteine strutturali 60 Le proteine come intelaiatura, raccordo e impalcatura Alcune proteine strutturali formano unicamente associazioni stabili Alcune proteine catalitiche hanno anche un ruolo strutturale Alcune proteine strutturali servono da impalcature 2.6 Catalisi: visione d’insieme 62 I catalizzatori accelerano la velocità di una reazione chimica senza variarne l’equilibrio complessivo La catalisi di solito richiede più di un fattore La catalisi abbassa la barriera dell’energia di attivazione di una reazione 2.7 Geometria del sito attivo 64 I gruppi reattivi nei siti attivi degli enzimi sono posizionati in modo ottimale per interagire con il substrato 2.8 Prossimità e destabilizzazione dello stato fondamentale 66 Alcuni siti attivi promuovono principalmente la prossimità Alcuni siti attivi destabilizzano gli stati fondamentali 2.9 Stabilizzazione degli stati di transizione ed esclusione dell’acqua 68 Alcuni siti attivi stabilizzano principalmente gli stati di transizione Molti siti attivi devono proteggere i loro substrati dall’acqua, ma allo stesso tempo devono essere accessibili 2.10 Reazioni redox 70 Un numero relativamente piccolo di reazioni chimiche rende conto della maggior parte delle trasformazioni biologiche Le reazioni di ossidazione/riduzione coinvolgono il trasferimento di elettroni e spesso richiedono cofattori specifici 2.11 Addizione/eliminazione, idrolisi e decarbossilazione 72 Le reazioni di addizione aggiungono atomi o gruppi chimici a doppi legami, mentre le reazioni di eliminazione li rimuovono per formare doppi legami Esteri, ammidi e acetali sono scissi dalla reazione con l’acqua; la loro formazione richiede la rimozione di acqua La perdita di biossido di carbonio è una strategia comune per rimuovere un singolo atomo di carbonio da una molecola 2.12 Chimica del sito attivo 74 I siti attivi favoriscono la catalisi acido-base 2.13 Cofattori 76 Molti siti attivi usano cofattori per favorire la catalisi 2.14 Reazioni a più stadi 78 Alcuni siti attivi si servono di meccanismi a più stadi 2.15 Enzimi multifunzionali 80 Alcuni enzimi possono catalizzare più di una reazione Alcuni enzimi bifunzionali hanno un solo sito attivo Alcuni enzimi bifunzionali contengono due siti attivi 2.16 Enzimi multifunzionali con tunnel 82 Alcuni enzimi bifunzionali trasferiscono intermedi instabili attraverso un tunnel che connette i siti attivi Gli enzimi trifunzionali possono trasportare intermedi lungo distanze notevoli Alcuni enzimi hanno anche funzioni non enzimatiche CAPITOLO 3 Controllo della funzione delle proteine 3.0 Visione d’insieme: meccanismi di regolazione 86 Nelle cellule viventi la funzione delle proteine è regolata in modo preciso VIII Indice © 88-08-17896-X Layout.qxd 17-10-2005 14:27 Pagina IX Le proteine possono essere indirizzate verso specifici compartimenti e complessi L’attività proteica può essere regolata dal legame di un effettore e da modificazioni covalenti L’attività proteica può essere regolata dalla quantità e dalla vita media di una proteina Una proteina singola può essere soggetta a molte influenze regolatorie 3.1 Domini di interazione fra proteine 88 Il flusso di informazioni all’interno della cellula è regolato e integrato dall’uso combinatorio di piccoli domini proteici che riconoscono ligandi specifici 3.2 Regolazione tramite localizzazione 90 La funzione delle proteine nella cellula dipende dal loro contesto Sono noti diversi modi di indirizzamento delle proteine nella cellula 3.3 Controllo da parte del pH e dell’ambiente redox 92 La funzione delle proteine è modulata dall’ambiente in cui la proteina opera Modificazioni dell’ambiente redox possono avere effetti notevoli sulla struttura e sulla funzione di una proteina Variazioni di pH possono alterare drasticamente la struttura e la funzione di una proteina 3.4 Ligandi effettori: legame competitivo e cooperatività 94 La funzione delle proteine può essere controllata da ligandi effettori che si legano competitivamente ai siti opportuni o ai siti attivi Il legame cooperativo da parte di ligandi effettori amplifica i loro effetti 3.5 Ligandi effettori: cambiamenti conformazionali e allosteria 96 Le molecole effettori possono causare cambiamenti conformazionali in siti distanti L’ATCasi è un enzima allosterico con il sito regolatorio e il sito attivo su due subunità differenti La perdita di funzione non implica necessariamente distruzione del sito attivo o del sito di legame per i ligandi Il legame al DNA di proteine regolatrici di geni è spesso controllato da variazioni conformazionali indotte dal ligando 3.6 Interruttori proteici basati sull’idrolisi di nucleotidi 98 I cambiamenti conformazionali guidati dal legame e dall’idrolisi di nucleotidi sono alla base delle proprietà di interruttore e di motore delle proteine Tutte le proteine interruttore controllate da nucleotidi presentano qualche caratteristica strutturale e funzionale comune 3.7 Interruttori GTPasici: piccole proteine G di segnale 100 Il ciclo di idrolisi e di scambio dei nucleotidi nelle proteine G è modulato dal legame di altre proteine 3.8 Interruttori GTPasici: trasmissione del segnale mediante GTPasi eterotrimeriche 102 Le proteine G eterotrimeriche trasmettono e amplificano i segnali extracellulari da un recettore a un percorso di segnale intracellulare 3.9 Interruttori GTPasici: sintesi proteica 104 EF-Tu è attivato dal legame con il ribosoma, che gli segnala di rilasciare il tRNA legato 3.10 Interruttori e proteine motorie 106 La miosina e la chinesina sono interruttori nucleotidici dipendenti da ATP che si muovono rispettivamente lungo i filamenti di actina e i microtubuli 3.11 Regolazione mediante degradazione 108 La funzione di una proteina può essere controllata mediante il suo tempo di vita medio Le proteine sono indirizzate verso i proteosomi per la degradazione 3.12 Controllo della funzione delle proteine mediante fosforilazione 110 La funzione delle proteine può essere controllata da modificazioni covalenti © 88-08-17896-X Indice IX Layout.qxd 17-10-2005 14:27 Pagina X La fosforilazione è il più importante meccanismo di modifica covalente per il controllo della funzione delle proteine 3.13 Regolazione delle protein chinasi di segnale: meccanismo di attivazione 112 Anche le protein chinasi sono regolate mediante fosforilazione Le chinasi Src attivano e inibiscono se stesse 3.14 Regolazione delle protein chinasi di segnale: attivazione di Cdk 114 La ciclina agisce come un ligando effettore per le chinasi ciclina-dipendenti 3.15 Sistemi di segnale a due componenti nei batteri 116 I trasportatori di segnale a due componenti utilizzano un piccolo cambiamento conformazionale regolato dal legame covalente di un gruppo fosfato 3.16 Controllo mediante proteolisi: attivazione di precursori 118 La proteolisi limitata può attivare enzimi Gli ormoni polipeptidici sono prodotti mediante proteolisi limitata 3.17 Splicing di proteine: autoproteolisi mediante inteine 120 Alcune proteine contengono inteine che si separano per autoproteolisi Il meccanismo di autocatalisi è simile per le inteine da organismi unicellulari e per la proteina Hedgehog di metazoi 3.18 Glicosilazione 122 La glicosilazione può cambiare le proprietà di una proteina e fornire siti di riconoscimento 3.19 Indirizzamento delle proteine mediante modificazioni lipidiche 124 L’attacco covalente di lipidi dirige le proteine verso le membrane e verso altre proteine Le GTPasi che dirigono il traffico delle membrane intracellulari sono reversibilmente associate alle membrane interne della cellula 3.20 Metilazione, N -acetilazione, sumoilazione e nitrosilazione 126 Processi biologici fondamentali possono essere regolati da altre modificazioni post-traduzionali di proteine CAPITOLO 4 Dalla sequenza alla funzione 4.0 Aspetti generali: dalla sequenza alla funzione nell’epoca della genomica 130 La genomica sta apportando un contributo crescente allo studio della struttura e della funzione delle proteine 4.1 Allineamenti di sequenza e confronti 132 Il confronto di sequenze fornisce una misura del grado di parentela tra i geni L’allineamento è il primo passo nel determinare se due sequenze sono tra loro simili Allineamenti multipli e alberi filogenetici 4.2 Descrizione delle proteine 134 I dati strutturali possono coadiuvare il confronto di sequenze nella ricerca di proteine correlate La sequenza, i motivi e i modelli strutturali possono identificare le proteine aventi funzioni biochimiche simili I profili di una famiglia di proteine possono essere generati tramite allineamento multiplo di elementi della famiglia per la quale siano note strutture rappresentative 4.3 Come derivare la funzione dalla sequenza 136 Le informazioni di sequenza sono in crescita esponenziale In alcuni casi la funzione può essere dedotta dalla sequenza X Indice © 88-08-17896-X Layout.qxd 17-10-2005 14:27 Pagina XI 4.4 Strumenti sperimentali per lo studio della funzione proteica 138 La funzione genica può essere talvolta stabilita sperimentalmente in assenza di informazioni circa la struttura della proteina o di omologia di sequenza 4.5 Evoluzione divergente ed evoluzione convergente 140 L’evoluzione ha portato a un numero relativamente limitato di fold proteici e di meccanismi catalitici Proteine che differiscono in sequenza e struttura possono essersi avvicinate convergendo verso un sito attivo, un meccanismo catalitico e una funzione biochimica simili Proteine con bassa similarità di sequenza ma dotate di una struttura complessiva e di un sito attivo molto simili sono probabilmente omologhe A volte è difficile distinguere tra evoluzione convergente ed evoluzione divergente L’evoluzione divergente può produrre proteine somiglianti per sequenza e struttura ma con funzioni differenti 4.6 La struttura dalla sequenza: modelli per omologia 142 La struttura può essere ricavata a partire da una sequenza facendo riferimento al fold e alla struttura di proteine note La modellazione per omologia viene usata per dedurre la struttura di una sequenza facendo riferimento alla struttura di un omologo vicino 4.7 La struttura dalla sequenza: modellazione per profili e metodo Rosetta 144 La modellazione per profili cerca di prevedere la struttura tridimensionale a partire da una sequenza anche se non sono note proteine con sequenza omologa Il metodo Rosetta tenta di predire la struttura proteica dalla sequenza senza alcun aiuto da parte di sequenze omologhe o di altre strutture 4.8 Derivare la funzione dalla struttura: superfamiglie di proteine 146 I membri di una stessa famiglia strutturale spesso possiedono funzioni biochimiche correlate Le quattro superfamiglie di proteasi a serina rappresentano un esempio di evoluzione convergente Famiglie proteiche strettamente correlate possono avere funzioni biochimiche e biologiche completamente differenti 4.9 Strategie per identificare siti di legame 148 I siti di legame possono a volte essere individuati nelle strutture tridimensionali attraverso metodi puramente computazionali I metodi sperimentali per la localizzazione dei siti di legame sono a oggi più accurati dei metodi computazionali 4.10 Strategie per identificare residui catalitici 150 La mutagenesi sito-specifica può identificare i residui coinvolti nei legami o nella catalisi I residui del sito attivo in una struttura possono a volte essere riconosciuti con metodi di analisi computazionale dalla loro geometria I programmi di ricerca delle interazioni (docking) modellano il legame dei ligandi 4.11 La struttura a barile TIM: una struttura con differenti funzioni 152 La conoscenza della struttura di una proteina non rende necessariamente possibile prevedere le sue funzioni biochimiche o cellulari 4.12 Enzimi PLP: differenti strutture con un’unica funzione 154 Una funzione biochimica e un meccanismo catalitico di una proteina non predicono necessariamente la sua struttura tridimensionale 4.13 Moonlighting: proteine con più di una funzione 156 Negli organismi multicellulari le proteine multifunzionali aiutano a espandere il numero delle funzioni proteiche che possono essere ottenute partendo da genomi relativamente piccoli 4.14 Sequenze camaleonte: una sequenza con più di una struttura 158 Alcune sequenze amminoacidiche possono assumere strutture secondarie differenti in diversi contesti strutturali © 88-08-17896-X Indice XI Layout.qxd 17-10-2005 14:27 Pagina XII 4.15 Prioni, amiloidi e serpine: strutture proteiche metastabili 160 Una singola sequenza può adottare più di una struttura stabile 4.16 Funzioni per geni non caratterizzati: la galattonato deidratasi 162 Determinare la funzione biochimica dalla sequenza e dalla struttura risulta tanto più accurato quanto più membri di famiglie proteiche vengono identificati L’allineamento basato sulla conservazione dei residui che svolgono la medesima azione chimica nel sito attivo può identificare più membri della famiglia rispetto al solo confronto di sequenza Le informazioni della genetica e della biologia cellulare, per organismi modello ben studiati, possono aiutare a identificare il substrato di un enzima «sconosciuto» e l’effettiva reazione catalizzata 4.17 Cominciare dall’inizio: un prodotto genico di funzione ignota 164 La funzione non può sempre essere determinata a partire dalla sequenza, anche con l’aiuto di informazioni strutturali e intuizioni chimiche CAPITOLO 5 Determinazione della struttura 5.1 Interpretazione dell’informazione strutturale 168 Le strutture proteiche determinate sperimentalmente sono il risultato dell’interpretazione di diversi tipi di dati Sia l’accuratezza sia la precisione di una struttura possono variare Il contenuto di informazione di una struttura è determinato dalla sua risoluzione 5.2 Determinazione delle strutture con cristallografia a raggi X e RMN 170 La cristallografia di proteine richiede la raccolta dei raggi X diffusi da un cristallo macromolecolare La spettroscopia RMN determina le distanze internucleari misurando le perturbazioni tra le risonanze assegnate agli atomi della proteina in soluzione 5.3 Qualità e rappresentazione delle strutture cristallografiche e RMN 172 La qualità di una struttura completa dipende largamente dalla quantità di dati raccolti Differenti convenzioni nella rappresentazione delle strutture proteiche sono utili per scopi differenti Glossario 174 Bibliografia 181 Indice analitico 192 XII Indice © 88-08-17896-X