Molecole biologiche

Molecole biologiche
Macromolecole:
Proteine e Acidi nucleici
catene polimeriche di
aminoacidi e nucleotidi
formate da 103 a 106 atomi, con una massa molecolare
compresa tra 103 a 1012 amu (1 amu è circa la massa di un
atomo di idrogeno).
Il loro comportamento è determinato da

Solvente (acqua, pH)

Flessibilità (perché sono catene lunghe)

Tempi caratteristici
Scale di tempi e di distanze
•
•
•
•
•
•
Movimenti locali:
fluttuazioni e vibrazioni atomiche
movimenti delle catene laterali
1 ÷ 500 pm
10-15 ÷ 10-1 s
Movimenti di corpo rigido:
movimento delle eliche
100 ÷ 1000 pm
10-9 ÷ 1 s
Movimenti su larga scala:
transizioni elica - coil
dissociazione/associazione
folding e unfolding
500 ÷ 50000 pm
10-7 ÷ 104 s!
I polipeptidi: catene molecolari
Un polipeptide (proteina) consiste in una lunga catena di
aminoacidi:
Proteine: proprietà strutturali
Molecole lineari formate da sequenze
di 20 diversi tipi di aminoacidi (Natomi =
40 ÷ 103 e più…).
Gli aminoacidi sono costituiti da un
gruppo peptidico e una catena laterale
(side chain)
I gradi di libertà rotazionali dei legami
peptidici rendono il backbone molto
flessibile
I legami peptidici formano il backbone
della proteina
Livelli di struttura
Primaria: la specifica
sequenza degli aminoacidi
Secondaria: motivi conformazionali locali:
α-eliche e β-sheets
Terziaria: la vera struttura 3D
Quaternaria: organizzazione
spaziale delle sub-unità molecolari
in un complesso proteico
Esempio: triose phosphate isomerase
Rappresentazione all-atom,
colorata a seconda del tipo di
atomo
Rappresentazione semplificata
che descrive il backbone colorato
per tipo di struttura secondaria
Superficie esterna accessibile al
solvente, colorata a seconda del
tipi (acido - rosso, basico - blu,
polare - verde, nonpolare –
bianco) di residuo
DNA (cenno)
Fino a circa 2 108 paia di nucleotidi (4+1 tipi),
ognuno di circa 20 atomi.
Un backbone abbastanza rigido formato da
pentosio e fosfato alternati.
Chiralità (⇒ attività ottica) dei legami della
catena, che si attorciglia spontaneamente.
Legami a idrogeno tra coppie di polimeri:
struttura a doppia elica.
Limiti delle tecniche sperimentali
risoluzione spaziale
misure ad alta risoluzione di strutture molecolari sono
possibili solo per sistemi relativamente rigidi
risoluzione energetica
misura delle energie di interazione e deformazione
molecolare difficoltosa (i moti lenti di grande ampiezza sono
spesso associati a energie piccolissime)
risoluzione temporale
i primissimi eventi dei processi biologici sono veloci, quindi
di difficile misurazione
Limiti delle tecniche computazionali
Sistemi biomolecolari troppo complessi per una descrizione che
contenga tutta la meccanica quantistica. Si usa invece la
meccanica classica con funzioni empiriche per descrivere le
interazioni tra gli atomi del un sistema molecolare
Simulazione del comportamento di un sistema molecolare su un
computer: anche con queste semplificazioni, solo un numero
limitato di atomi (di solito 103÷107 atomi, ≪NA≃6·1023), per un
limitato periodo di tempo (1÷10 ns) può essere simulato. Questo
permette di studiare solo sistemi piccoli, per fenomeni veloci
(tempi di rilassamento brevi)
Campionatura limitata dello spazio delle conformazioni (un
concetto statistico!) di una macromolecola: necessario l'utilizzo
dei dati sperimentali per restringersi alla regione interessante
Importanza della complementarietà dell'approccio teoricosperimentale!
Complementarità di tecniche
computazionali e sperimentali
L’utilizzo complementare di tecniche di tipo
sperimentale e di tipo computazionale è
attualmente l’approccio ottimale per lo studio della
dinamica delle macromolecole e di molti processi
biologici relativi
in particolare gli aspetti strutturali del problema,
ovvero lo studio della conformazione, o variazione di
conformazione, di una molecola biologica in
relazione alla sua attività
Alcune Applicazioni
Conoscere, comprendere, spiegare i meccanismi che portano alla
struttura nativa a risoluzione atomica della molecola per
comprendere, spiegare, ed eventualmente anche modificare, la
sua attività biologica.
Alcune applicazioni
Monitorare i cambiamenti strutturali indotti su peptidi o
proteine da parte di membrane biologiche
Alcune applicazioni
Effettuare mutazioni puntiformi, che possono fornire
indicazioni utili per il riconoscimento del sito attivo o di strutture
indispensabili all'attività della molecola o dirette ad una certa
funzione.
Alcune Applicazioni
Studiare le variazioni
conformazionali provocate
dall’interazione della proteina
con uno o più ligandi.
Attivazione o inattivazione di
sezione necessaria a
compiere la propria funzione
biologica
Alcune applicazioni
Applicazioni farmacologiche: viene
fornita un’indicazione specifica, o
quanto meno restrittiva, della
struttura opportuna in funzione del
bersaglio del farmaco.
In questo campo, la costruzione di
strutture calibrate permette di
ridurre la ricerca ad un ristretto
raggio d’azione.
Alcune applicazioni
Comprendere il processo di folding delle proteine, ovvero il
meccanismo di ripiegamento con cui esse raggiungono la
conformazione nativa biologicamente attiva.
Protein folding
A dispetto della loro complessità, la maggior parte delle
proteine reali si ripiegano (“foldano”) ad un unico stato nativo
mediante un “rapido” e “sicuro” processo di folding
A causa di ciò, in genere si dice che lo stato nativo di una
proteina è codificato nella sua sequenza primaria.
Capire come ciò sia possibile è un problema
multidisciplinare
(coinvolge dati biologici, biochimici, fisici, e richiede tecniche
informatiche, statistiche, biotecnologiche) e multiscala (il processo di
folding coinvolge movimenti strutturali che coprono scale temporali
molto diverse).
Lo stato nativo non è lo stato in cui la proteina nasce!
Obiettivi principali
1) L’analisi e la comprensione dei fenomeni fisici essenziali alla
base del folding:
questo potrebbe permettere, in principio, la costruzione, su base
chimico-fisica, di efficienti algoritmi per la predizione di strutture
2) La predizione dello stato nativo a partire dalla sequenza degli
aminoacidi di una proteina:
protein modeling
Meccanica molecolare (MM)
alias dinamica molecolare (MD)
Le simulazioni MD generano informazioni a livello
microscopico (posizioni, velocità degli atomi). Per
convertire queste informazioni in osservabili
macroscopiche (pressione, energia, capacità
termica, ecc.) c'è bisogno di
Termodinamica + Meccanica Statistica
Meccanica molecolare
o dinamica molecolare (MD)
Permette di simulare al computer le strutture ed alcune
proprietà dinamiche e termodinamiche dei materiali.
Applicabile solo a molecole/solidi/liquidi nello stato
elettronico fondamentale.
Descrive l’evoluzione temporale dei sistemi complessi
secondo la legge di Newton:
Fj = mj aj
Inizialmente la MM si applica in vacuo ma oggigiorno è
possibile trattare anche gli effetti del solvente.
20
Altri campi di applicazione della MD
Si può utilizzare per simulare al computer il moto degli
atomi e comprendere meccanismi intimi di
•piccole molecole, sia organiche che inorganiche
•reazioni chimiche
•transizioni di fase
•solidi ad altissime pressioni, fratture
•liquidi e miscugli di liquidi (es. liquidi ionici)
•liquidi in geometrie confinate
•lubrificazione
•....
Assunzioni fondamentali della MD
•
Nucleo ed elettroni sono «ammassati» in una sola particella, che
rappresenta l'atomo j-esimo nel punto rj.
•
L'energia si conserva a livello microscopico. Quindi le forze
Fj = –∇jV(r1, r2, r3, ...)
•
•
•
sono scrivibili come i gradienti di un'energia potenziale totale V
Le interazioni tra gli atomi che contribuiscono all'energia
potenziale sono parametrizzate da forme analitiche più o meno
semplici, come potenziali di molle o coulombiani o altri potenziali
classici (esempi più tardi). Questa è un'approssimazione poco
controllata!
L'equazione del moto si integra con algoritmi dove il tempo è
“discretizzato” a passettini.
Oppure le forze Fj si possono usare per cercare la
configurazione piu stabile (minimo dell'energia V)
Energia
Le interazioni determinano la distribuzione spaziale degli atomi e le
energie relative che rendono più o meno stabili determinate
configurazioni. Le forze sono appunto date da − i gradienti di V
Energia =
energia delle interazioni di legame
+
energia delle interazioni di non legame
Force field:
insieme delle equazioni (e
dei
parametri)
che
descrivono come varia
l'energia quando gli atomi
si spostano.
Energia di legame
Esempio di parametrizzazione
del campo di forze:
Energia di allungamento
(stretching) dei legami
+
Energia di piegamento
(bending) degli angoli tra
coppie di legami
+
Energia di torsione degli
angoli diedri
bending
stretching
torsion
Termini di legame: stretching
Energia di stretching: potenziale armonico (molle-legame)
V stretch = ∑
bonds
ks
2
r −r 0 
ks = costante elastica,
r = |rj – rj'| = lunghezza istantanea del legame,
r0 = distanza di equilibrio
2
Termini di legame: bending
Energia di bending: potenziale armonico
V bend =
∑
angles
kθ
2
2
 θ−θ 0 
kθ = rigidità della molla-angolo,
θ = arccos((rj – rj')·(rj – rj”)/(|rj – rj'| |rj – rj”|)) = angolo
istantaneo tra i 2 legami,
θ0 = angolo di equilibrio
Termini di legame: torsione
Energia torsionale:
V t=
∑
torsions
kφ
2
 φ −φ0
2
oppure
V t=
∑
torsions
A[1−cos  n φ−φ0  ]
termine armonico (per torsioni rigide di piccola ampiezza)
+
termine sinusoidale (per torsioni “soffici” a 360°): modella la
presenza di barriere steriche attraversabili;
A = ampiezza curva,
n = tipo di simmetria e periodicità,
ϕ0 = angolo torsionale d'equilibrio
Interazioni a lunga distanza
•
Atomi non legati covalentemente, ad es. atomi della
stessa molecola ma separati tra loro da almeno due
legami covalenti, oppure atomi di molecole diverse
•
In buona approssimazione l'energia di “non-legame”
dipende dalle distanze reciproche tra tutte le coppie di
atomi non legati
•
Esempi principali di interazioni di non-legame: le forze
di Van der Waals e quelle elettrostatiche
•
Sono forze “a lungo raggio”: energie e forze decadono
con leggi di potenza a grande distanza tra le coppie di
atomi
Interazioni di Van der Waals
Una forza attrattiva (a lunga
distanza E ∝ –r-6), dovuta a
fluttuazioni nella distribuzione di
carica delle nuvole elettroniche.
A piccola distanza questa attrazione
di VdW (che divergerebbe a –∞,
facendo collassare la simulazione) è
bilanciata,
e
dominata
dalla
repulsione dovuta al sovrapporsi
delle nubi elettroniche (piccola
distanza E ∝ +r-12). Repulsione e
attrazione vanno a zero a distanza
interatomica infinita.
Bilanciamento ad una distanza
intermedia ottimale r*.
r*
Le interazioni di Van der Waals
e gli effetti di repulsione
vengono spesso modellizzati
usando il potenziale di
Lennard-Jones
Interazioni elettrostatiche
Potenziale di Coulomb: rappresenta l’interazione elettrostatica tra
una coppia di atomi carichi
1
V Coulomb r 1 , r 2 ,... , r N =
4 0  r
qj qj'
∑ ∣r −r ∣
j j '
j
j'
Interazioni di questo tipo dipendono
• dalla carica atomica qj presente sugli atomi non-legati
• dalla distanza tra atomi non-legati
• dalla natura del dielettrico interposto (può essere sia il solvente
che una parte della molecola stessa). Di solito si assegna un
valore costante allo schermo εr del dielettrico (tra 1 e 5); si
utilizzano valori linearmente dipendenti dalla distanza per
simulare effetti dovuti al solvente
Che ce ne facciamo delle Fj?
Cerchiamo il minimo dell'energia
configurazione più stabile.
potenziale,
cioè la
Oppure integriamo l'equazione di Newton e vediamo come la
materia si muove.
Minimizzazione energia libera:
guida il folding delle proteine
Ipotesi termodinamica di Anfinsen
Le proteine funzionali assumono spontaneamente
un'unica struttura tridimensionale, determinata dalla loro
struttura primaria (sequenza)
Questa struttura nativa è il minimo stabile dell'energia
libera ed un percorso ragionevolmente “liscio” porta dallo
stato unfolded alla struttura nativa.
Lo stato nativo è il minimo assoluto dell’energia libera F
della proteina.
Ricerca minimo energetico
Conformazione energeticamente preferita
minimo globale dell'energia potenziale
equilibrio stabile
stato più popolato a bassa T
... ma...
F=U–TS

L'energia libera F non coincide con l'energia U

È necessario tenere conto anche di termini entropici

Nei calcoli talvolta si usano delle energie potenziali
“efficaci” che tengono conto anche dell'entropia
Algoritmi di minimizzazione
Fanno discendere l'energia verso il minimo più vicino
Algoritmi principali:
lento ma robusto, senza complicazioni
• Simplex:
strutture di partenza rozze e ad elevata energia
descent: veloce, lavora bene
• Steepest
minimo quando il gradiente è grande
dà
lontano dal
lavora bene solo vicino al minimo;
• Newton-Raphson:
meno steps per convergere
⇒ meglio usare diversi minimizzatori a turno
Un rischio tipico della minimizzazione
I minimi locali: partendo da configurazioni a casaccio la minimizzazione
del potenziale rischia di intrappolarsi in configurazioni molto diverse dal
vero minimo
minimo
assoluto
configurazione
iniziale rischiosa
Un rischio reale: alcune malattie
(Alzheimer, BSE, Parkinson) sono
legate a misfolding di proteine!
Violazione dell'ergodicità: la proteina non
esplora tutto lo spazio delle configurazioni
Dinamica molecolare (MD)
Permette lo studio di processi dinamici complessi che
avvengono nei sistemi biologici. Può anche tornare utile a
trovare minimi globali (simulated annealing). Descrive allo
stesso tempo sia le vibrazioni locali che le transizioni
conformazionali, ad esempio:
stabilità delle proteine
variazioni conformazionali
folding proteico
trasporto ionico
Obiettivo della DM
Calcolare la traiettoria di un sistema molecolare
cioè
la configurazione molecolare in funzione del tempo,
cioè
come variano nel tempo le posizioni (e dunque anche le
velocità e le accelerazioni) di tutti gli atomi della/e molecola/e.
In realtà si parte proprio dalle accelerazioni:
a j = Fj / m j
Traiettoria
La traiettoria è generata da integrazioni simultanee dell’equazione del
moto di Newton
per tutti gli atomi del sistema,
a =F /m
j
j
j
nota la forza Fj esercitata dal sistema su ciascun atomo.
La forza è uguale alla derivata dell'energia potenziale:
Fj = – ∂V/∂rj
quindi
d2rj /dt2 = – mj-1 ∂V/∂rj
che collega la derivata dell'energia potenziale alle variazioni di
posizione in funzione del tempo
Ingredienti
•
le posizioni iniziali rj degli atomi (coordinate atomiche):
si ricavano ad es. da strutture sperimentali (cristallografia
raggi X, NMR ecc.) o ottenute con modeling;
•
le velocità iniziali vj spesso si ottengono dalla
distribuzione delle velocità caratteristica di una data
temperatura;
•
le accelerazioni aj lungo tutta la traiettoria sono
determinate dalle derivate dell'energia potenziale totale V
Distribuzione iniziale di velocità vi

Riscaldamento lento alla temperatura di simulazione

Riequilibrazione dell’energia tra gli atomi

Temperatura di simulazione desiderata

Lunga integrazione → energia libera del sistema
Algoritmi di integrazione
Non c'è soluzione analitica all'equazione del moto, data la
sua forma complessa (l'energia potenziale è funzione delle
3N coordinate atomiche di tutti gli atomi del sistema) ⇒
soluzione numerica ⇒ algoritmi numerici (es. velocity-Verlet e
Runge-Kutta).
Caratteristiche comuni fondamentali degli algoritmi di
integrazione:
●
deve valere la conservazione dell'energia e del momento
●
devono essere computazionalmente efficienti
●
●
devono permettere un tempo di integrazione il più lungo
possibile
si possono fare simulazioni a energia fissata (ensemble
microcanonico) oppure a temperatura fissata (ensemble
canonico)
Accuratezza metodo
L'accuratezza della simulazione è limitata da
●
qualità del force-field (= capacità di riprodurre i risultati
sperimentali)
●
simulazione dell'ambiente circostante
●
scelta della configurazione di partenza
●
lunghezza del periodo di tempo di equilibrazione
●
lunghezza del tempo di simulazione
●
(alcuni ns)
eventuale importanza di effetti quantistici (mecc. classica →
no livelli vibrazionali discreti, no spettroscopia!)
Un “esperimento” al computer
Evoluzione di proprietà locali (nucleasi dello stafilococco)
Un “esperimento” al computer
2.5 nm
Carbonio
Idrogeno
Azoto
Fluoro
Una simulazione di liquidi ionici: [bmim]+ [Ntf2]− a 300 K
Un “esperimento” al computer
Dynameomics: un pacchetto per analizzare le traiettorie della MD
Un “esperimento” al computer
(movie)
Simulazione MD di un peptide in solvente acquoso
Un “esperimento” al computer
(movie)
Simulazione “parallel tempering” o “replica exchange” MD del folding:
AK-peptide (sequenza AAAAKAAAAKAAAAKAAAAY) in solvente
acquoso (non mostrato ma simulato).
A=Alanina, K=Lisina, Y=Tirosina
Un “esperimento” al computer
(movie)
Simulazione replica-exchange MD del folding:
trp-cage miniprotein (sequenza NLYIQWLKDGGPSSGRPPPS) in
solvente acquoso (non mostrato ma simulato). È mostrata una
singola replica (di 40) che arriva alla struttura nativa ripiegata in circa
30-40 ns di tempo di simulazione