Lezione in PDF

BIOMOLECOLE – STRUTTURA E FUNZIONE
Lo studio delle relazioni tra struttura e funzione nelle biomolecole è uno degli aspetti più importanti per la
comprensione del funzionamento dei processi biologici
“La parola proteina, che ti propongo... vorrei
derivasse da proteios, perche sembra essere la
sostanza primitiva o principale della nutrizione
animale che le piante preparano per gli
erbivori,e che quest’ultimi forniscono ai
carnivori”.
J. J. Berzelius, lettera a G. J. Mulder, 1838
Tutti gli organismi viventi sono formati da cellule e, nonostante varino in termini di
forma, dimensione e aspetto, gran parte della materia che le costituisce è di natura
macromolecolare (biopolimeri) composta principalmente da carbonio, idrogeno, azoto
e ossigeno. Questi quattro elementi insieme costituiscono circa il 99% della massa
della maggioranza delle cellule. La chimica dei viventi è organizzata intorno all’atomo
di carbonio che da solo costituisce più della metà del peso secco della cellula. Il
carbonio, grazie alla sua capacità di formare quattro legami covalenti ed essere in
grado, per la sua dimensione, di formare doppi e tripli legami, ha la possibilità di
realizzare con altri atomi di carbonio catene più o meno lunghe, lineari o ramificate,
oppure chiuse ad anello. L’esistenza praticamente illimitata di molecole diverse
rendono questo elemento fondamentale per l’esistenza della vita. Le complesse
funzioni biologiche richieste di un organismo necessitano di strutture molecolari
altrettanto complesse diverse per dimensione, forma e composizione, che nessun altro
elemento chimico all’infuori del carbonio è in grado di realizzare. È quindi possibile
l’esistenza di macromolecole con le caratteristiche necessarie per sostenere, ad
esempio, l’azione meccanica della cellulosa nelle piante o la possibilità di
immagazzinare l’informazione genetica.
La conoscenza e la comprensione della chimica di queste biomolecole è quindi
necessaria per capire il funzionamento non solo della cellula ma di tutto l’organismo
vivente. Dal punto di vista strutturale e funzionale e della composizione chimica, i
biopolimeri vengono generalmente divisi in tre classi principali: proteine, polisaccaridi
e acidi nucleici. Queste macromolecole si formano a partire da precursori
relativamente semplici con peso molecolare inferiore o uguale a 500 e contengono un
gran numero di monomeri e presentando un peso molecolare elevato che va da 5000
fino a più di 1 milione per le proteine, di milioni per i polisaccaridi e fino ad alcuni
miliardi per gli acidi nucleici.
Un’altra classe di biomolecole di notevole importanza biologica è quella dei lipidi, i
quali svolgono diversi ruoli all’interno delle cellule: servono come molecole fornitrici e
di riserva di energia e come componenti strutturali delle membrane cellulari. Le
singole molecole lipidiche sono relativamente piccole (con pesi molecolari che vanno
da 750 a 1500), ma possono associarsi attraverso legami non covalenti per formare
strutture molto estese come le membrane cellulari.
1
Figura 1 - Struttura di un
generico
amminoacido.
Il
gruppo R legato al carbonio è
diverso in ogni amminoacido
Quello che tutte le macromolecole biologiche e gli
assemblaggi lipidici hanno in comune è che essi adottano
strutture tridimensionali definite che sono la chiave delle
loro
funzioni.
La
struttura
tridimensionale
della
macromolecola
può essere descritta in termini di
configurazione e conformazione. La prima corrisponde alla
disposizione spaziale permanente degli atomi ed è
determinata dalla presenza di doppi legami (isomeria
geometrica) o di centri chirali attorno ai quali sono disposti i
gruppi sostituenti (stereoisomeria). Due isomeri non
possono convertirsi tra
loro senza la rottura di
uno o più legami.
La
conformazione
rappresenta invece la
disposizione
spaziale
che
i
vari
gruppi
possono assumere per
rotazione
interna
ai
legami semplici senza la
rottura
di
alcun
1
legame .
Tutte le
macromolecole
biologiche
sono
caratterizzate
da
sequenze specifiche di
monomeri
(struttura
primaria)
che
determinano
la
loro
struttura e funzione.
La
relazione
tra
struttura e funzione
particolarmente
evidente nelle proteine
che sono molecole formate da amminoacidi, composti
bifunzionali contenenti un gruppo amminico (-NH2) e
un gruppo carbossilico (-COOH) legati allo stesso
atomo di carbonio e che differiscono l’uno dall’altro
per la catena laterale (fig.1). Sequenze diverse di
amminoacidi generano strutture che possono avere
compiti molto diverse come attività catalitica (enzimi),
protezione
immunologica
(anticorpi),
trasporto,
funzione
strutturale,
coordinamento
dell’attività
Figura 2 - Struttura dei 20 amminoacidi presenti nelle proteine. Nello
schema ad anello, che non rappresenta nessuna proteina reale, gli
amminoacidi sono posti l’uno accanto all’altro in base alle proprietà
chimiche delle catene laterali – (R. F. Doolittle - Le proteine - Le Scienze n° 208
(1985))
Figura
3
–
Strutture
dei
due
enantiomeri di un amminoacido con il
carbonio
asimmetrico.
Le
due
strutture
sono
l'una
l'immagine
speculare dell'altra
1
Vedi lezione Treccani: Dai gruppi funzionali ai polimeri
2
neuronale, controllo genetico ecc.. Le proteine sono le macromolecole biologiche più
abbondanti nelle cellule e sono sempre formate dalla stessa serie di 20 amminoacidi
sia che appartengano alle specie batteriche che agli organismi superiori (fig.2). A
differenza di polimero sintetico come il polietilene o il
nylon che presentano proprietà limitate, le proteine
sono molto più versatili perché presentano unità
monometriche con catene laterali diverse per
struttura, dimensione e carica. Queste possono
essere idrocarburiche, come nel caso della valina,
leucina ed isoleucina, possono presentare un gruppo
basico come nella lisina, arginina e istidina o
possono
contenere un gruppo carbossilico come
nell’acido aspartico e glutammico. A causa della
Figura 4 - Reazione di condensazione disposizione
tetraedrica del carbonio, tutti gli
tra due amminoacidi con la formazione
di un dipeptide e l'eliminazione di una amminoacidi, ad eccezione del più semplice, la
molecola d'acqua
glicina, posseggono un carbonio asimmetrico. Dei
due possibili stereoisomeri che si trovano nelle proteine idrolizzate solo uno due
enantiomeri, quello definito L, è presente e la configurazione è la stessa per tutti gli
amminoacidi (fig. 3).
Le molecole di amminoacidi nelle proteine sono
legate
insieme
attraverso
reazioni
di
condensazione con eliminazione di una molecola
d’acqua e la formazione del legame chiamato
peptididico (fig. 4).
Potendo un amminoacido legarsi ad altri 19, il
Figura 5 – Forme limiti di risonanza numero delle combinazioni cresce rapidamente
per il legame peptidico
all’aumentare delle dimensioni della catena.
Comunque, lo studio degli archivi di sequenze
proteiche mostra chiaramente che i residui
amminoacidici non sono presenti con uguale
frequenza
nelle
proteine
e
le
sequenze
rappresentano solo una piccola parte di tutte le
possibili combinazioni. Ad esempio, il triptofano e
la cisteina sono residui rari nelle proteine, meno
del 2% di tutti i residui, mentre l’alanina, glicina e
leucina sono presenti con una frequenza dal 7 al
9%.
Tra tutte le conformazioni che una proteina che
contiene centinaia di atomi può assumere, solo
una (o poche) sono quelle che predominano nelle condizioni biologiche. Quando una
proteina è in uno di questi stati conformazionali funzionali è detta nativa. Esistono una
serie di vincoli che determinano la conformazione delle proteine. Il primo deriva dal
fatto che il legame peptidico formato tra i gruppi carbonilico e amminico non può
ruotare liberamente.
Questo può essere giustificato assumendo che il legame peptidico possa essere
descritto come un ibrido di risonanza delle due formule limiti I e II mostrate in fig. 5.
3
Figura 6 - Legame peptidico. i due
carboni alfa sono separati da tre legami
che sono coplanari
Dalla teoria della risonanza deriva che la molecola reale non corrisponde né alla
formula limite I né a II, ma è una combinazione delle caratteristiche di entrambe. Così
il legame C-N avrà nella realtà un non trascurabile carattere di doppio legame e una
struttura più o meno planare, con angoli vicini a 120°, necessaria per permettere la
coniugazione del doppietto elettronico. Studi cristallografici ai raggi X confermano che
la lunghezza del legame peptidico è intermedio (1,33 Å) tra quello aspettato per un
semplice legame C-N (1.45 Å) e quello di un doppio legame C=N (1.25 Å).
L'accentuato carattere di doppio legame tra C e N impedisce la libera rotazione
intorno a questo legame e porta i sei atomi del gruppo peptidico ad essere coplanari
(fig.6).
Lo scheletro della catena polipetidica si può quindi considerare come una serie di
piani rigidi in cui i piani consecutivi hanno in comune un legame Cα–C o N–Cα in grado
esibire mobilità rotazionale. Come risultato della restrizione rotazionale sono possibili
due conformazioni, quella trans o quella cis. Per motivi sterici la configurazione trans è
preferita di un fattore 103, tranne quando l’ultimo amminoacido della catena è una
prolina. In tal caso, a causa della natura ciclica del residuo che determina una minore
repulsione sterica tra i lati della catena, la differenza energetica tra configurazione cis
e trans è solo di un fattore 4.
La
conformazione
della
proteina
è
determinata dai due angoli diedri, Φ e Ψ,
che riflettono le rotazioni intorno a
ciascuno dei due legami (N—C per Φ e
C —C per Ψ) che si ripetono lungo lo
scheletro della molecola e che possono
assumere solo alcuni valori (fig.7). Anche
se in linea di principio Φ e Ψ possono
assumere qualsiasi valore compreso tra 180° e + 180°, molti non sono permessi
per motivi di impedimento sterico tra gli atomi dello scheletro e le catene laterali. Le
conformazioni stericamente proibite sono quelle per cui la distanza interatomica di
un’interazione non covalente è inferiore alla corrispondente somma di raggi di van der
Waals.
In base ai raggi atomici degli
elementi della catena, sono
possibili soltanto valori di Φ
e Ψ che cadono in alcune
zone del cosiddetto grafico
di Ramachandran (fig.8), dal
nome del fisico indiano G.N.
Ramachandran che alla fine
anni ’60, per primo calcolò
le
regioni
stericamente
Figura 8 - Grafico di Rachamandran per due residue di L-alanina. Le permesse, e in cui gli angoli
zone verdi rappresentano conformazioni con valori di Φ e Ψ
Ψ sono riportati in funzione
permessi in cui non si hanno interazioni steriche
di Φ.
Figura 7 - La rotazioni dei legami N-C e C -C
descrivono
due
angoli
diedri,
chiamati
rispettivamente Φ e Ψ
4
Le zone in verde scuro sono quelle largamente permesse, mentre le zone in verde
chiaro indicano le conformazioni, comunque possibili, che hanno distanze di van der
Waals al limite inferiore dell’accettabilità. Solo il 25-30 % del diagramma è occupato
da zone stericamente permesse.
Nelle proteine i legami covalenti limitano le forme che queste possono assumere, ma
sono le interazioni non covalenti che determinano le conformazioni stabili e al tempo
stesso flessibili che permettono ad esse di svolgere le loro funzioni biologiche.
Sono le proprietà delle catene laterali le principali responsabili del ripiegamento di una
catena polipeptidica. Le interazioni di una
catena laterale con un'altra e con le
molecole presenti nel mezzo circostante
possono determinare il ripiegamento della
proteina in una conformazione stabile.
Queste interazioni sono molto più deboli dei
legami covalenti (l’energia è ad esempio
dell’ordine dei 350 kJ/mole per i legami CC) e possono variare da 0,1 a 30 kJ/mole. I
più importanti sono: il legame idrogeno, le
interazioni ioniche, le forze di van der Waals
e le interazioni idrofobiche2 (fig.9).
Analizzando il contributo delle interazioni
alla stabilità delle proteine, si osserva che
quelle predominanti sono le interazioni
idrofobiche. Le molecole di acqua formano
Figura 9 - Interazioni deboli presenti nella tra loro numerosi legami idrogeno. La
proteina
presenza di una molecola rompe i legami
idrogeno e le molecole d’acqua tendono a circondare la struttura idrofobica
riarrangiandosi in un guscio di molecole molto più ordinato unite da legami idrogeno
chiamato strato di solvatazione. Poiché il numero di modi con cui le molecole d’acqua
formano legami idrogeno sulla superficie di un gruppo non polare è inferiore a quello
che farebbero in sua assenza si ha una diminuzione sfavorevole di entropia del
sistema. La conseguenza è che la catena polipeptidica tende ad avvolgersi in modo
tale da esporre in superficie le catene laterali polari e posizionando all’interno quelle
non polari in modo da ridurre la dimensione dello strato di solvatazione, poiché meno
molecole d’acqua sono ordinate intorno alle molecole apolari. Questo determina un
aumento di entropia che costituisce la forza termodinamica principale alla
stabilizzazione della proteina.
Le strutture delle proteine sono estremamente complesse, ma alcuni elementi si
trovano frequentemente. Questi elementi rappresentano la cosiddetta struttura
secondaria delle proteine. Con il termine di struttura secondaria si intendono le
disposizioni regolari della catena polipeptidica principale, che vengono classificate
senza fare riferimento al tipo di catena laterale degli amminoacidi o con altri segmenti
della proteina.
2
Vedi lezione Treccani: Le forze intermolecolari
5
Esse sono stabilizzate da legami
idrogeno fra il gruppo amminico e il
gruppo
carbonilico
della
catena
principale. La regolarità di una
struttura si ha quando ogni angolo φ e
ψ rimane invariato all’interno del
segmento di proteina.
Si possono distinguere tre tipi
principali di strutture secondarie:
elica , foglietto β e reverse turn.
I segmenti di catena polipeptidica che
non sono in
elica, foglietto β o turn
Figura 10 - Struttura secondaria elica di una proteina
assumono la conformazione chiamata
loop o random coil, struttura non ripetitiva né regolare, spesso priva di legami
idrogeno tra gli aminoacidi che la compongono. Circa il 70-80 % degli aminoacidi delle
Struttura secondaria alfa elica di una proteina
proteine
globulari assume la conformazione regolare tipica di uno dei tre tipi di
struttura secondaria.
L’ elica è la struttura secondaria più adottata dalla catena polipeptidica delle
proteine: circa il 32-38 % degli aminoacidi delle proteine globulari di struttura
tridimensionale nota assume questa conformazione (fig. 10).
Essa fu descritta per la prima volta nel 1951 da Linus Pauling e Robert Corey
(California Institute of Technology), i quali proposero una struttura stabile basata su
gli angoli e sulle distanze di legame calcolate sperimentalmente sulla base dell’analisi
cristallografica per gli amminoacidi e i peptidi. La prova sperimentale dell’esistenza di
queste strutture si ebbe con la determinazione della struttura tridimensionale delle
mioglobina (John Kendrew, 1960) e dell’emoglobina (Max Perutz, 1961), due proteine
che presentano eliche come elementi di struttura secondaria.
L’α elica presenta un avvolgimento destrorso ed è caratterizzata da un angolo φ = 57° ed un angolo ψ = -47°, che corrispondono alla posizione nel quadrante in basso a
sinistra del plot di Ramachandran. Ogni giro d’elica contiene 3,6 residui ed ogni
amminoacido si estende per 1,5 Å lungo la catena determinando un passo dell’elica
pari a 5,4 Å (fig. 10B).
La struttura è stabilizzata da legami idrogeno che si
formano tra l’atomo di idrogeno legato all’atomo di azoto
di un legame peptidico e l’atomo di ossigeno carbonilico
del quarto amminoacido successivo (fig.10A) e ciascun
legame peptidico, tranne quelli vicino all’estremità
dell’elica, partecipa alla formazione di legami idrogeno. Le
catene laterali degli aminoacidi che appartengono ad un’α
Figura 11 - Struttura della elica destrorsa sono rivolte verso l’esterno e verso
prolina
l’estremità
N-terminale
dell’elica
così
da
evitare
interferenze steriche con la catena polipeptidica principale e tra le catene laterali
stesse. La sequenza amminoacidica influenza la capacità di formare delle eliche. Ciò
dipende dalle proprietà del residuo R dell’amminoacido che influenzano i valori
caratteristici degli angoli Φ e Ψ. Ad esempio, residui con gruppi carichi sono
fortemente influenzati dal pH dell’ambiente. A pH 7, i gruppi carbossilici del
6
glutammato adiacenti si respingono così come i residui carichi positivamente
dell’arginina, destabilizzando la formazione dell’elica. Altro esempio è la presenza della
prolina (fig.11) che presenta un atomo di azoto del gruppo amminico che fa parte di
un anello rigido e che non rende possibile la rotazione del legame N-Ca introducendo
un ripiegamento che destabilizza l’elica. Inoltre, non avendo l’idrogeno sul gruppo
amminico, non può formare il legame H con altri residui.
Nel 1951 Pauling e Corey ipotizzarono anche l’esistenza di un’altra struttura
secondaria: la conformazione . Essa è formata in media da 5 a 10 aminoacidi, con la
catena polipeptidica quasi completamente estesa. Le catene polipeptidiche sono
disposte l’una accanto all’altra in modo tale che si possano formare legami idrogeno
tra i gruppi CO di un filamento e i gruppi NH del filamento β adiacente e viceversa,
formando una struttura che presenta una serie di pieghettature e che è detta foglietto
β. Le catene laterali degli aminoacidi che compongono il foglietto β seguono lo stesso
andamento, per cui puntano alternativamente sopra e sotto il foglietto β.
Le catene polipeptidi che possono interagire
fra loro a formare i foglietti β in due modi
diversi:parallele o antiparallele a seconda che
abbiano lo stesso orientamento o un
orientamento opposto del legame NH-CO (fig.
12). Gli angoli diedri (φ, ψ) della catena
polipeptidica in conformazione foglietto β
cadono nella zona permessa del grafico di
Ramachandran corrispondente al quadrante in
alto a sinistra: φ=-139°, ψ=135° (parallelo)
e φ=-119°, ψ=113° (antiparallelo).
I reverse turn sono ripiegamenti che
collegano due filamenti β antiparalleli
Figura 12 - Struttura secondaria β elica. a) adiacenti. In questo caso sono due gli
foglietto ripiegato antiparallelo; b) foglietto
amminoacidi non coinvolti nei legami idrogeno
ripiegato parallelo
tra i filamenti β in quanto si forma un legame
idrogeno tra il gruppo CO dell’aminoacido 1 e il gruppo NH dell’amminoacido 4. Questo
tipo di ripiegamento si osserva nelle proteine globulari, che presentano una struttura
ripiegata e compatta.
Le regioni loop o random coil sono costituite da zone della catena polipeptidica che
non assumono alcun tipo di struttura secondaria nel senso che le coppie (φ, ψ) degli
amminoacidi che li compongono presentano valori diversi e non costanti ed hanno la
funzione di collegare elementi di struttura secondaria.
La disposizione spaziale degli atomi di una proteina è definita come struttura terziaria
e si distingue da quella secondaria in quanto questa riguarda la disposizione dei
residui amminoacidici adiacenti nella sequenza polipeptidica. La struttura terziaria
quindi, prende in considerazione delle interazioni a lungo raggio nella sequenza
primaria della proteina, che possono essere legami deboli e talvolta legami covalenti
come ponti disolfuro.
Per proteine globulari di 140 o meno residui, la struttura tridimensionale ha una forma
sferica compatta formata da motivi di struttura secondaria con poche irregolarità
strutturali. Per proteine più grandi la struttura terziaria può essere organizzata in più
7
unità strutturali chiamate domini. I diversi domini della proteina, interagiscono tra loro
con minori interazioni rispetto a quelli tra gli elementi strutturali secondari all’interno
del dominio. In molti casi un dominio di una proteina mantiene la sua struttura
terziaria anche se viene separato mediante una scissione idrolitica dal resto della
catena polipeptidica.
Molte proteine sono formate da più catene polipeptidiche e le interazioni tra queste
catene ne definiscono la struttura quaternaria. Queste strutture possono essere
dovute a proteine con diverse o uguali subunità. Ad esempio emoglobina è un
tetramero formato da due differenti subunità denominate alfa e beta, mentre la
proteasi
HIV
è
un
omodimero (fig.13).
Le
subunità
sono
mantenute insieme da un
gran numero interazioni
non
covalenti
che
nonostante
siano
individualmente
deboli
determinano
una
notevole
stabilità.
La
struttura quaternaria è
mostrata da proteine che
Figura 13 - Strutture quaternarie. A Proteasi HIV; B Emoglobina
svolgono
funzioni
catalitiche con la formazione di siti
catalitici o di legame con il
substrato all’interfaccia tra le
subunità. Un ulteriore vantaggio
di
queste
strutture
è
che
l’interazione della proteina con il
substrato o con i leganti causa
cambi conformazionali all’interno
della
struttura
ed
offre
la
possibilità di regolare l’attività
biologica. Questa è la base delle
cosiddetta regolazione allosterica
negli enzimi3.
Le proteine vengono sintetizzate
nelle cellule sui ribosomi come
Figura 14 – Nell’esperimento di Anfinsen, la ribonucleasi sequenza lineari di amminoacidi.
viene denaturata con urea e mercaptolo per ridurre e Successivamente
queste
si
scindere i ponti disolfuro. La rinaturazione ristabilisce i ponti
avvolgono (folding) per assumere
disolfuro e riporta la struttura nel suo stato nativo
la loro conformazione nativa che è
quella funzionale. La struttura tridimensionale della proteina è determinata dalle
interazioni tra i residui amminoacidici, quindi dalla sua struttura primaria. Queste
3
In una proteina allosterica il legame con un ligando a livello di uno specifico sito di legame modifica le proprietà di un
altro sito sulla stessa molecola proteica attraverso una modificazione conformazionale
8
interazioni sono distrutte dall’azione della temperature, in soluzioni alcaline o acide o
per addizione di sostanze come alcol o urea. Questo processo, che determina la
perdita della struttura terziaria e dell’attività della proteina è detto denaturazione.
Molte proteine, dopo essere state denaturate, sono in grado di ripiegarsi
spontaneamente nella propria conformazione nativa riacquistando la loro attività
biologica. L’esperimento di C. Anfinsen (1957) sulla ribonucleasi A (RNasi) ha
dimostrato che questa proteina se denaturata e ridotta riassume la sua conformazione
nativa e riforma i corretti 4 punti disolfuro quando viene rimosso il denaturante e il
riducente (fig.14). Il ruolo di tale proteina è quello di catalizzare l’idrolisi delle
molecole di RNA a livello dei legami fosfodiestere e pertanto la sua attività si misura in
base alla capacità di idrolizzare le molecole di RNA.
Questo risultato indica che la sequenza
peptidica
contiene
tutta
l’informazione
necessaria
perché
la
proteina
possa
avvolgersi nella sua struttura tridimensionale
dello stato nativo. Dal punto di vista
termodinamico
lo
stato
nativo
nelle
condizioni fisiologiche costituisce un minimo
dell’Energia Libera di Gibbs.
Ma una volta che la proteina è sintetizzata
come fa a ripiegarsi nella conformazione
nativa, dato che l’esplorazione casuale di
tutte le possibili conformazioni fino a
raggiungere quella corretta non è possibile?
Figura 15
- L’asse verticale rappresenta
l‟energia libera interna di ogni specifica Infatti,
ammettendo
soltanto
10
conformazione
mentre
l’asse
orizzontali
possibili per ogni residuo
rappresenta il numero di conformazioni (quindi conformazioni
l’entropia conformazionale). La forma ad imbuto amminoacidico,
una sequenza di 100
descrive la progressiva riduzione dello spazio
presenta
un
numero
di
conformazionale. Inizialmente sono presenti amminoacidi
100
molte strutture che diminuiscono fino ad
conformazioni possibili paria a 10
e se per
arrivare alla proteina nello stato nativo che è
caratterizzata
da
un
unico
sottostato ogni cambio di conformazione è necessario
conformazionale.
un tempo pari a circa 10-13 s, il tempo totale
per provare tutte le conformazioni sarebbe pari a 10 87 s (l’età dell’Universo è stimata
in 20 miliardi di anni che corrispondono a 6.1017 s)! Questo problema è noto come
paradosso di Levinthal (1968). Dato che i tempi di folding vanno da qualche secondo
ad alcuni minuti, è evidente che l’evoluzione ha trovato una soluzione efficace a
questo procedimento. Le cellule d’Escherichia coli, ad esempio, sintetizzano una
molecola proteica di 100 amminoacidi in circa 5 secondi alla temperatura di 37°C.
Le proteine si ripiegano seguendo vie dirette senza ricercare casualmente la
conformazione nativa tra le molte possibili. Sono stati proposti diversi modelli per
spiegare questo processo. Il primo, detto gerarchico, prevede che le proteine
inizialmente diano luogo a strutture secondarie (α eliche, foglietti β) seguite da
interazioni a lungo raggio tra queste che portano alla formazione di domini ed infine
alla conformazione nativa (fig. 15). Nel secondo modello, detto globulo fuso (molten
globule) il ripiegamento iniziale della proteina è favorito dalla formazione di uno stato
compatto dovuto a interazioni idrofobiche tra residui non polari (collasso idrofobico). Il
molten globule ha molte delle strutture secondarie dello stato maturo ma è meno
9
compatto e le interazioni all'interno della proteina non sono forti in quanto molte
catene amminoacidi non hanno ancora assunto una giusta conformazione. È probabile
che la maggior parte delle proteine si ripieghi attraverso un processo che segue i due
modelli, attraverso conformazioni intermedie diverse il cui numero tende a diminuire
via via che il processo di avvolgimento tende verso la struttura finale nativa.
L’andamento termodinamico del processo di ripiegamento può essere rappresentato
come un imbuto il cui restringimento
rappresenta una diminuzione delle specie a
diversa conformazione. Le depressioni lungo
le parti esterne dell’imbuto rappresentano
conformazioni transitorie che persistono fino
a che mediante attivazione termica casuale
viene superata la barriera energetica con
decadimento in conformazione ad energia
minore.
Figura 16 - I chaperoni si presentano forma di Molte proteine per avvolgersi hanno bisogno
capsule e sono in grado di fornire un ambiente
della presenza di altre proteine dette
sicuro per il giusto ripiegamento della proteina.
Una volta che la proteina ha assunto la corretta chaperoni molecolari, che interagiscono con
struttura viene rilasciata
la
proteina
parzialmente
ripiegata
facilitandone il corretto ripiegamento impedendo l’associazione scorretta di zone
idrofobiche (fig. 16).
La comprensione dei meccanismi molecolari, che sono
alla base del folding delle proteine rappresenta un
importantissimo obiettivo in quanto esso fornirebbe la
possibilità di curare molte patologie associate ai
processi di avvolgimento in una forma sbagliata della
proteina (misfolding).
Ad esempio nella fibrosi cistica è presente un difetto
nella proteina transmembrana che agisce come un
canale degli ioni cloro nelle cellule epiteliali (1480
amminoacidi) che non si avvolge correttamente a
causa di una mutazione con la delezione di un
amminoacido
(Phe
508).
Essa
determina
principalmente la produzione di secrezioni molto ricche
in sodio e cloro; il muco è denso e vischioso e tende ad
ostruire i dotti nei quali viene a trovarsi.
In questi ultimi anni, grazie all’utilizzo di potenti
Figura 17 - Alcuni esempi di strutture computer, si sono sviluppati dei metodi computazionali
di proteine analizzate mediante il aventi lo scopo di predire la struttura tridimensionale di
metodo Rosetta.
una proteina partendo dalla sola conoscenza della sua
A: fattore di trascrizione MarA legato
al DNA;
sequenza amminoacidica e di comprendere come
B: batteriocina AS-48;
avviene il ripiegamento nelle strutture native.
C: Secondo dominio del MutS.
A sinistra sono riportate le struttura Tra questi, c’è ad esempio l’algoritmo sviluppato dal
determinate mediante i raggi x, gruppo di David Baker chiamato Rosetta, con grande
mentre a destra le strutture previste
capacità predittiva. Esso divide la sequenza primaria
teoricamente
in gruppi di alcuni residui (da 3 a 9) ed effettua una
10
ricerca su frammenti di strutture proteiche note presenti in un database e provenienti
da strutture cristalline, generando così per ogni frammento una serie di strutture
possibili. Vengono poi analizzate tutte le combinazioni e le varie conformazioni
valutate con varie funzioni di scoring in modo da trovare quella a più bassa energia.
Questo metodo offre un valido aiuto nella ricerca sulle possibili strutture locali
restringendo notevolmente il numero di conformazioni da analizzare. Questo metodo
di previsione ha partecipato con grande successo ad una competizione chiamata CASP
(Critical Assessment of Methods for Protein Structure Prediction), nella quale team di
ricercatori da tutto il mondo cercano di prevedere le strutture di proteine la cui
struttura è stata recentemente determinata sperimentalmente, ma che non è ancora
stata resa pubblica. In fig. 17 sono riportate alcune strutture previste da Rosetta
confrontate con quelle risolte sperimentalmente mediante analisi ai raggi X.
11