Macromolecole Biologiche Metodi di simulazione Macromolecole Biologiche Dinamica molecolare Tecnica di simulazione che permette lo studio del moto e delle proprietà di un sistema di particelle. • Moti localizzati (da 0.01 a 5 Å, da 10-15 a 10-1 s) - fluttuazioni atomiche - movimenti di catene laterali - movimenti di loop • Moti a corpo rigido (da 1 a 10 Å, da 10-9 a 1 s) - movimenti di eliche - movimenti di domini - movimenti di subunità • Moti su larga scala (> 5 Å, da 10-7 a 10-3 s) - transizioni eliche-coil - associazione/dissociazione - folding/unfolding Macromolecole Biologiche Dinamica molecolare A T ambiente si dimostra che vale l’approssimazione della meccanica classica, purchè i moti abbiano tempi caratteristici del ps (10-12 s) o siano più lunghi. Una molecola biologica viene approssimata ad un network di sfere (particelle di Lennard-Jones) con carica puntiforme al loro centro, collegate da molle (legami covalenti). Le particelle si trovano in un campo di energia potenziale che si modifica in funzione delle posizioni raggiunte dagli atomi del sistema. Macromolecole Biologiche Dinamica molecolare Le simulazioni di dinamica molecolare permettono lo studio di complessi processi dinamici che hanno luogo nei sistemi biologici. Per esempio: • Stabilità delle proteine • Cambi conformazionali • Folding delle proteine • Riconoscimento molecolare: proteine, DNA, membrane, complessi • Trasporto ionico in sistemi biologici e permette di effettuare studi di • Drug design • Determinazione di strutture 3D di macromolecole biologiche Macromolecole Biologiche Dinamica molecolare Per simulare la dinamica di una macromolecola sono necessarie: - descrizione della struttura: coordinate iniziali (file PDB a cui si aggiungono gli atomi di H) - funzione energia potenziale Scopo della simulazione è risolvere le equazioni del moto per un sistema di N atomi: la soluzione, cioè le coordinate del sistema in funzione del tempo, rappresenta le traiettorie degli atomi che compongono la molecola. Le simulazioni di dinamica molecolare si basano sulla seconda legge di Newton: → Fi = mi→ ai i = 1, …, N (numero atomi del sistema) Dalla conoscenza delle forze che agiscono su ciascun atomo è possibile determinare l’accelerazione di ciascun atomo del sistema. Macromolecole Biologiche Dinamica molecolare L’integrazione delle equazioni del moto consente di ottenere una traiettoria che descrive la variazione nel tempo delle posizioni, velocità ed accelerazioni delle particelle. Le simulazioni di dinamica molecolare sono in genere calcolate sulla scala dei ns (10-9 s). → → Fi = miai → i = 1, …, N (numero atomi del sistema) → Fi = mi dvi/d t = → mi d2ri/d t2 → → inoltre Fi = - dV/d ri dove V = energia potenziale Per moti uniformemente accelerati (a = costante): ma → ai = dvi/dt → ⇒ vi(t) = ait + vi(t0) → → → → → ⇒ → → → vi = dri/dt quindi → → → ri(t) = vit + ri(t0) → → → ri(t) = ait2 + vi(t0)t + ri(t0) dove ai = - (1/mi) dV/d ri Macromolecole Biologiche Dinamica molecolare Per calcolare una traiettoria è quindi necessario conoscere le posizioni iniziali degli atomi, una iniziale distribuzione delle velocità e l’accelerazione (determinata come gradiente di una funzione di energia potenziale). Le equazioni del moto sono deterministiche, nel senso che le posizioni e le velocità al tempo t = t0 determinano le posizioni e le velocità al generico tempo t. Le posizioni iniziali si possono ottenere da strutture sperimentali risolte con le metodologie della diffrazione di raggi X su monocristalli o mediante risonanza magnetico-nucleare (NMR). La distribuzione delle velocità iniziali sono derivate da una distribuzione Maxwelliana random corrispondente alla T desiderata: → p(vi) = mi 2πKBT → exp [-mivi2/2KBT] Macromolecole Biologiche Dinamica molecolare mi → p(vi) = 2πKBT → exp [-mivi2/2KBT] → → p(vi) = probabilità che l’atomo i-esimo abbia velocità vi alla temperatura T. L’iniziale distribuzione random delle velocità viene scelta in modo tale che non ci sia momento totale della quantità di moto, cioè: → N P = Σi=1 mivi = 0 → Macromolecole Biologiche Funzione Energia Potenziale Per calcoli di dinamica molecolare su sistemi biologici vengono utilizzate funzioni energia potenziale empiriche capaci di riprodurre le proprietà fisiche del sistema fornendo un buon compromesso fra accuratezza ed efficienza computazionale. Limitazioni: tali funzioni energia potenziale non possono riprodurre drastici cambi nella struttura elettronica degli atomi del sistema. Per esempio non possono essere modellati eventi come la formazione o la rottura di legami covalenti (in questo caso occorre un approccio quanto-meccanico). L’energia potenziale del sistema è funzione delle posizioni atomiche (R, in coordinate cartesiane) di tutti gli atomi che compongono il sistema. Essa è definita come la somma di termini interno (o “di legame”) ed esterni (o “di non-legame”): V(R) = Vlegame+ Vnon-legame Macromolecole Biologiche Funzione Energia Potenziale I termini “di legame” risultano dalla somma: Vlegame= Vbond-stretch+ Vangle-bend+ Vtorsions Macromolecole Biologiche Funzione Energia Potenziale Vbond-stretch: potenziale armonico che rappresenta l’interazione tra coppie di atomi separati da un legame covalente (coppie 1,2). 1 2 Vbond-stretch= Σcoppie 1,2 Kl(l − l0)2 l0= lunghezza ideale di legame Kl = costante che determina la forza del legame l0 e Kl dipendono dai tipi di atomi legati covalentemente Macromolecole Biologiche Funzione Energia Potenziale Vbond-stretch: potenziale armonico che associato all’alterazione degli angoli di legame attorno al valore ideale θ0. Vbond-bend= ΣangoliKθ(θ − θ0)2 θ0= angolo ideale fra 3 atomi legati covalentemente Kθ = costante che determina la forza del legame θ0 e Kθ dipendono dai tipi di atomi legati covalentemente Macromolecole Biologiche Funzione Energia Potenziale Vtorsions: potenziale (periodico) associato all’angolo di torsione che modella la presenza di barriere steriche fra atomi separati da 3 legami covalenti (coppie 1,4). 1 2 3 4 Vtorsions= Σcoppie 1,4Kφ(1 − cos(nφ))2 φ0= angolo diedro n = coefficiente di simmetria (=1,2,3) Kφ = costante di proporzionalità Macromolecole Biologiche Funzione Energia Potenziale I termini “di non legame” risultano dalla somma: Vnon-legame= Vvan-der-Waals+ Velettrostatico Vvan-der-Waals= Σcoppie[(Aik/rik12) – [(Bik/rik6)] non legate Aik e Bik= costanti dipendenti dagli atomi rik = distanza degli atomi Velettrostatico= Σcoppie qiqk/Drik non legate qi e qk= cariche elettriche degli atomi D = costante dielettrica del mezzo Macromolecole Biologiche Funzione Energia Potenziale Per velocizzare il calcolo del potenziale, si possono introdurre dei cutoff per le interazioni di non legame (per esempio, cutoff di 12 Å per le interazioni di Coulomb). Manca un termine esplicito per le interazioni di legame a idrogeno. Per una dinamica realistica bisognerebbe esplicitare il solvente (una o due shell di idratazione della macromolecola), che scherma parzialmente le cariche qi e qj. Macromolecole Biologiche Solvente - Trattamento “implicito”: le molecole d’acqua non sono incluse nella simulazione ma viene utilizzata una costante dielettrica “efficace” dipendente dalla distanza. - Trattamento “esplicito”: le molecole d’acqua non sono incluse nella simulazione. Occorre introdurre condizioni di bordo per: • evitare che le molecole d’acqua diffondano lontano dalla proteina durante la simulazione • poter usare un numero limitato di molecole d’acqua Macromolecole Biologiche Dinamica molecolare L’integrazione delle equazioni del moto non è banale, perché il moto degli atomi modifica i valori delle energie potenziali di interazione e quindi delle forze agenti sugli atomi stessi. L’integrazione delle equazioni del moto viene fatta per intervalli di tempo molto piccoli (1 fs = 10-15 s) in modo tale da mantenere costanti le quantità fisiche rilevanti. La lunghezza totale di una simulazione è dell’ordine dei ns (10-9 s) . Gli algoritmi matematici utilizzati per l’integrazione sono: - Leap frog - Verlet Macromolecole Biologiche Dinamica molecolare Minimizzazione dell’energia Prima di iniziare la dinamica, può essere utile minimizzare l’energia, per eliminare distorsioni strutturali che potrebbero portare ad energie troppo elevate e a non convergenza. La configurazione stabile di una molecola è quella di minima energia (gradiente del potenziale = 0 rispetto alle posizioni degli atomi). L’energia del sistema ha un minimo in quei punti nello spazio delle configurazioni in cui le forze che agiscono sugli atomi sono bilanciate. Macromolecole Biologiche Dinamica molecolare Configurazione iniziale del sistema (t = 0): Struttura cristallografica, NMR, o modello teorico costruito per omologia (si aggiungono gli atomi di H). Scegliere una configurazione iniziale prossima a quella da simulare. Prima di iniziare la simulazione è utile minimizzare l’energia della struttura (rimozione di forti interazioni di van der Waals che potrebbero portare a locali distorsioni della struttura ed a simulazioni instabili. Se necessario, si aggiungono le molecole d’acqua e si compie una nuova minimizzazione della struttura. Si assegnano a ciascun atomo le velocità iniziali a bassa T, e le equazioni del moto sono integrate per fare evolvere il sistema nel tempo. Periodicamente vengono assegnate nuove velocità a T gradatamente più elevate e viene ripetuta la simulazione di dinamica molecolare. La procedura è ciclizzata fino a che non si raggiunge la T desiderata. Durante la dinamica vengono monitorate le proprietà del sistema per verificare che esse siano stabili rispetto al tempo. Se la T cresce o decresce significativamente, le velocità vengono riscalate in modo che le T torni ai valori iniziali. Simulazione di dinamica molecolare per il tempo che si desidera (ps - ns). Analisi dei risultati (traiettorie, .. ecc). Macromolecole Biologiche Analisi dei risultati Una volta che il sistema ha raggiunto l’equilibrio, è possibile calcolare alcune proprietà del sistema, osservando l’evoluzione temporale delle sue coordinate e velocità: - analisi delle traiettorie; - analisi delle energie medie (potenziale, cinetica, totale); - calcolo della velocità del centro di massa; - calcolo del raggio di girazione: RG = Σi mi (ri – rcm)2 Σi mi ri – rcm = distanza fra l’atomo i ed il centro di massa - monitoraggio nel tempo di specifici legami, angoli di legame, angoli diedri, distanze fra atomi, per osservare cambiamenti nella struttura; Macromolecole Biologiche Analisi dei risultati - calcolo della “root mean squared deviation” (rmsd) di atomi della molecola rispetto ad una struttura di riferimento (non necessariamente quella a t = 0): 1 N rmsd (r1, r2) = Σi (r1,i – r2,i)2 r1 = (x1,1, ….., x1,N) r2 = (x2,1, ….., x2,N) - calcolo delle fluttuazioni di rmsd rmsdifluct = 1 Nf Σf (rif – riave)2 - andamento del plot di Ramachandran nel tempo (variazione della struttura secondaria).