Macromolecole Biologiche
Metodi di simulazione
Macromolecole Biologiche
Dinamica molecolare
Tecnica di simulazione che permette lo studio del moto e delle proprietà di un
sistema di particelle.
• Moti localizzati (da 0.01 a 5 Å, da 10-15 a 10-1 s)
- fluttuazioni atomiche
- movimenti di catene laterali
- movimenti di loop
• Moti a corpo rigido (da 1 a 10 Å, da 10-9 a 1 s)
- movimenti di eliche
- movimenti di domini
- movimenti di subunità
• Moti su larga scala (> 5 Å, da 10-7 a 10-3 s)
- transizioni eliche-coil
- associazione/dissociazione
- folding/unfolding
Macromolecole Biologiche
Dinamica molecolare
A T ambiente si dimostra che vale l’approssimazione della meccanica classica,
purchè i moti abbiano tempi caratteristici del ps (10-12 s) o siano più lunghi.
Una molecola biologica viene approssimata ad un network di sfere (particelle
di Lennard-Jones) con carica puntiforme al loro centro, collegate da molle
(legami covalenti).
Le particelle si trovano in un campo di energia potenziale che si modifica in
funzione delle posizioni raggiunte dagli atomi del sistema.
Macromolecole Biologiche
Dinamica molecolare
Le simulazioni di dinamica molecolare permettono lo studio di complessi
processi dinamici che hanno luogo nei sistemi biologici. Per esempio:
• Stabilità delle proteine
• Cambi conformazionali
• Folding delle proteine
• Riconoscimento molecolare: proteine, DNA, membrane, complessi
• Trasporto ionico in sistemi biologici
e permette di effettuare studi di
• Drug design
• Determinazione di strutture 3D di macromolecole biologiche
Macromolecole Biologiche
Dinamica molecolare
Per simulare la dinamica di una macromolecola sono necessarie:
- descrizione della struttura: coordinate iniziali
(file PDB a cui si aggiungono gli atomi di H)
- funzione energia potenziale
Scopo della simulazione è risolvere le equazioni del moto per un sistema di N
atomi: la soluzione, cioè le coordinate del sistema in funzione del tempo,
rappresenta le traiettorie degli atomi che compongono la molecola.
Le simulazioni di dinamica molecolare si basano sulla seconda legge di
Newton:
→
Fi = mi→
ai
i = 1, …, N (numero atomi del sistema)
Dalla conoscenza delle forze che agiscono su ciascun atomo è possibile
determinare l’accelerazione di ciascun atomo del sistema.
Macromolecole Biologiche
Dinamica molecolare
L’integrazione delle equazioni del moto consente di ottenere una traiettoria che
descrive la variazione nel tempo delle posizioni, velocità ed accelerazioni delle
particelle. Le simulazioni di dinamica molecolare sono in genere calcolate
sulla scala dei ns (10-9 s).
→
→
Fi = miai
→
i = 1, …, N (numero atomi del sistema)
→
Fi = mi dvi/d t =
→
mi d2ri/d t2
→
→
inoltre Fi = - dV/d ri dove V = energia potenziale
Per moti uniformemente accelerati (a = costante):
ma
→
ai = dvi/dt
→
⇒
vi(t) = ait + vi(t0)
→
→
→
→
→
⇒
→
→
→
vi = dri/dt
quindi
→
→
→
ri(t) = vit + ri(t0)
→
→
→
ri(t) = ait2 + vi(t0)t + ri(t0) dove ai = - (1/mi) dV/d ri
Macromolecole Biologiche
Dinamica molecolare
Per calcolare una traiettoria è quindi necessario conoscere le posizioni iniziali
degli atomi, una iniziale distribuzione delle velocità e l’accelerazione
(determinata come gradiente di una funzione di energia potenziale).
Le equazioni del moto sono deterministiche, nel senso che le posizioni e le
velocità al tempo t = t0 determinano le posizioni e le velocità al generico tempo t.
Le posizioni iniziali si possono ottenere da strutture sperimentali risolte con le
metodologie della diffrazione di raggi X su monocristalli o mediante risonanza
magnetico-nucleare (NMR).
La distribuzione delle velocità iniziali sono derivate da una distribuzione
Maxwelliana random corrispondente alla T desiderata:
→
p(vi) =
mi
2πKBT
→
exp [-mivi2/2KBT]
Macromolecole Biologiche
Dinamica molecolare
mi
→
p(vi) =
2πKBT
→
exp [-mivi2/2KBT]
→
→
p(vi) = probabilità che l’atomo i-esimo abbia velocità vi alla temperatura T.
L’iniziale distribuzione random delle velocità viene scelta in modo tale che non
ci sia momento totale della quantità di moto, cioè:
→
N
P = Σi=1 mivi = 0
→
Macromolecole Biologiche
Funzione Energia Potenziale
Per calcoli di dinamica molecolare su sistemi biologici vengono utilizzate
funzioni energia potenziale empiriche capaci di riprodurre le proprietà fisiche
del sistema fornendo un buon compromesso fra accuratezza ed efficienza
computazionale.
Limitazioni: tali funzioni energia potenziale non possono riprodurre drastici
cambi nella struttura elettronica degli atomi del sistema. Per esempio non
possono essere modellati eventi come la formazione o la rottura di legami
covalenti (in questo caso occorre un approccio quanto-meccanico).
L’energia potenziale del sistema è funzione delle posizioni atomiche (R, in
coordinate cartesiane) di tutti gli atomi che compongono il sistema. Essa è
definita come la somma di termini interno (o “di legame”) ed esterni (o “di
non-legame”):
V(R) = Vlegame+ Vnon-legame
Macromolecole Biologiche
Funzione Energia Potenziale
I termini “di legame” risultano dalla somma:
Vlegame= Vbond-stretch+ Vangle-bend+ Vtorsions
Macromolecole Biologiche
Funzione Energia Potenziale
Vbond-stretch: potenziale armonico che rappresenta l’interazione tra coppie di
atomi separati da un legame covalente (coppie 1,2).
1
2
Vbond-stretch= Σcoppie 1,2 Kl(l − l0)2
l0= lunghezza ideale di legame
Kl = costante che determina la forza del legame
l0 e Kl dipendono dai tipi di atomi legati covalentemente
Macromolecole Biologiche
Funzione Energia Potenziale
Vbond-stretch: potenziale armonico che associato all’alterazione degli angoli di
legame attorno al valore ideale θ0.
Vbond-bend= ΣangoliKθ(θ − θ0)2
θ0= angolo ideale fra 3 atomi legati covalentemente
Kθ = costante che determina la forza del legame
θ0 e Kθ dipendono dai tipi di atomi legati covalentemente
Macromolecole Biologiche
Funzione Energia Potenziale
Vtorsions: potenziale (periodico) associato all’angolo di torsione che modella la
presenza di barriere steriche fra atomi separati da 3 legami covalenti (coppie
1,4).
1
2 3
4
Vtorsions= Σcoppie 1,4Kφ(1 − cos(nφ))2
φ0= angolo diedro
n = coefficiente di simmetria (=1,2,3)
Kφ = costante di proporzionalità
Macromolecole Biologiche
Funzione Energia Potenziale
I termini “di non legame” risultano dalla somma:
Vnon-legame= Vvan-der-Waals+ Velettrostatico
Vvan-der-Waals= Σcoppie[(Aik/rik12) – [(Bik/rik6)]
non legate
Aik e Bik= costanti dipendenti dagli
atomi
rik = distanza degli atomi
Velettrostatico= Σcoppie qiqk/Drik
non legate
qi e qk= cariche elettriche degli atomi
D = costante dielettrica del mezzo
Macromolecole Biologiche
Funzione Energia Potenziale
Per velocizzare il calcolo del potenziale, si possono introdurre dei cutoff per le
interazioni di non legame (per esempio, cutoff di 12 Å per le interazioni di
Coulomb).
Manca un termine esplicito per le interazioni di legame a idrogeno.
Per una dinamica realistica bisognerebbe esplicitare il solvente (una o due shell
di idratazione della macromolecola), che scherma parzialmente le cariche qi e
qj.
Macromolecole Biologiche
Solvente
- Trattamento “implicito”: le molecole d’acqua non sono incluse nella
simulazione ma viene utilizzata una costante dielettrica “efficace” dipendente
dalla distanza.
- Trattamento “esplicito”: le molecole d’acqua non sono incluse nella
simulazione. Occorre introdurre condizioni di bordo per:
• evitare che le molecole d’acqua diffondano lontano
dalla proteina durante la simulazione
• poter usare un numero limitato di molecole d’acqua
Macromolecole Biologiche
Dinamica molecolare
L’integrazione delle equazioni del moto non è banale, perché il moto degli
atomi modifica i valori delle energie potenziali di interazione e quindi delle
forze agenti sugli atomi stessi.
L’integrazione delle equazioni del moto viene fatta per intervalli di tempo
molto piccoli (1 fs = 10-15 s) in modo tale da mantenere costanti le quantità
fisiche rilevanti.
La lunghezza totale di una simulazione è dell’ordine dei ns (10-9 s) .
Gli algoritmi matematici utilizzati per l’integrazione sono:
- Leap frog
- Verlet
Macromolecole Biologiche
Dinamica molecolare
Minimizzazione dell’energia
Prima di iniziare la dinamica, può essere utile minimizzare l’energia, per
eliminare distorsioni strutturali che potrebbero portare ad energie troppo
elevate e a non convergenza.
La configurazione stabile di una molecola è quella di minima energia
(gradiente del potenziale = 0 rispetto alle posizioni degli atomi).
L’energia del sistema ha un minimo in quei punti nello spazio delle
configurazioni in cui le forze che agiscono sugli atomi sono bilanciate.
Macromolecole Biologiche
Dinamica molecolare
Configurazione iniziale del sistema (t = 0):
Struttura cristallografica, NMR, o modello teorico costruito
per omologia (si aggiungono gli atomi di H).
Scegliere una configurazione iniziale prossima a quella da
simulare. Prima di iniziare la simulazione è utile
minimizzare l’energia della struttura (rimozione di forti
interazioni di van der Waals che potrebbero portare a locali
distorsioni della struttura ed a simulazioni instabili.
Se necessario, si aggiungono le molecole d’acqua e si compie
una nuova minimizzazione della struttura.
Si assegnano a ciascun atomo le velocità iniziali a bassa T,
e le equazioni del moto sono integrate per fare evolvere il
sistema nel tempo.
Periodicamente vengono assegnate nuove velocità a T
gradatamente più elevate e viene ripetuta la simulazione
di dinamica molecolare. La procedura è ciclizzata fino a
che non si raggiunge la T desiderata.
Durante la dinamica vengono monitorate le proprietà del
sistema per verificare che esse siano stabili rispetto al tempo.
Se la T cresce o decresce significativamente, le velocità
vengono riscalate in modo che le T torni ai valori iniziali.
Simulazione di dinamica molecolare per il tempo che si
desidera (ps - ns). Analisi dei risultati (traiettorie, .. ecc).
Macromolecole Biologiche
Analisi dei risultati
Una volta che il sistema ha raggiunto l’equilibrio, è possibile calcolare alcune
proprietà del sistema, osservando l’evoluzione temporale delle sue coordinate
e velocità:
- analisi delle traiettorie;
- analisi delle energie medie (potenziale, cinetica, totale);
- calcolo della velocità del centro di massa;
- calcolo del raggio di girazione:
RG =
Σi mi (ri – rcm)2
Σi mi
ri – rcm = distanza fra l’atomo i ed il centro di massa
- monitoraggio nel tempo di specifici legami, angoli di legame, angoli diedri,
distanze fra atomi, per osservare cambiamenti nella struttura;
Macromolecole Biologiche
Analisi dei risultati
- calcolo della “root mean squared deviation” (rmsd) di atomi della molecola
rispetto ad una struttura di riferimento (non necessariamente quella a t = 0):
1
N
rmsd (r1, r2) =
Σi (r1,i – r2,i)2
r1 = (x1,1, ….., x1,N)
r2 = (x2,1, ….., x2,N)
- calcolo delle fluttuazioni di rmsd
rmsdifluct =
1
Nf
Σf (rif – riave)2
- andamento del plot di Ramachandran nel tempo
(variazione della struttura secondaria).