MOLECULAR DYNAMICS Vediamo quali sono gli “ingredienti” per effettuare una dinamica molecolare: • Spazio conformazionale (PES): Gli atomi costituenti la proteina possiedono una Epot che dipende solo dalle coordinate dei suoi atomi. All’energia potenziale è associata una funzione che descrive una superficie, detta PES (Potential Energy Surface), caratterizzata da elevata dimensionalità [(3N-6)+1] e rappresentabile solo quando le dimensioni sono N<3. La PES rappresenta lo spazio conformazionale della proteina e non è piatto, ma viene rappresentato col modello ad imbuto, in cui l’energia libera fornisce la profondità dell’imbuto mentre la larghezza dell’imbuto stesso è rappresentata dall’entropia. La topologia della PES è caratterizzata da punti critici di energia: - Minimi --> la molecola è stabile - Massimi --> situazione di forte instabilità - Punto di sella (saddlepoint) --> unisce due minimi attraverso il percorso di minima energia Di tutte le configurazioni possibili saremo interessati solo a quelle (conformeri) in cui l’energia di configurazione è minima. A temperatura (T) ambiente alcune configurazioni saranno più popolate di altre e ciò lo posso prevedere tramite l’equazione di Boltzmann: ni = nt e- E/KT Δ • Calcolo dell’energia: calcolare l’energia vuol dire calcolare proprietà geometriche, spettroscopiche, energia d’interazione in processi chimici, costanti cinetiche, simulazione di processi dinamici. I metodi per il calcolo dell’energia sono: - Metodi quantomeccanici --> Utilizzano i principi della meccanica quantistica che tengono conto di posizione e velocità di nuclei ed elettroni. Metodi classici --> Utilizzano la teoria della meccanica classica in cui gli elettroni non vengono considerati in modo esplicito, ma solo i nuclei. I metodi classici sono: Meccanica molecolare : Cerca di descrivere le molecole tramite le leggi della fisica classica. La meccanica molecolare trova la propria estrinsecazione nel force field, cioè un potenziale che descrive le caratteristiche energetiche della molecola. Applicando il campo di forze è possibile calcolare l’Epot di una data molecola che possiede una certa conformazione considerando la somma di singoli contributi energetici dati dal legame chimico covalente ed interazioni di non legame: ETOT = ECOV + ENONCOV Dove: ECOV = ESTR + EBEND + ETORS ESTR = ESTRETCHING = funzione per l’allungamento di un legame tra due atomi EBEND = EBENDING = energia necessaria per deformare un angolo formato da tre atomi ABC quando ci sia un legame tra A e B e tra B e C ETORS = ETORSION = energia di torsione attorno ad un legame per formare un nuovo angolo diedro. ENONCOV = EEL + EVdW EEL = energia elettrostatica, calcolata utilizzando il potenziale di Coulomb EVdW = termine legato alle forze di Van der Waals, calcolato col potenziale di LennardJones. Dinamica Molecolare: nella dinamica molecolare si adopera il force field al fine di valutare il comportamento dinamico di una molecola, dunque si vede come si muovono gli atomi in un determinato tempo. La proteina deve esplorare il bacino di attrazione del minimo globale o di altri minimi. Se T≠ 0 si parla di energia cinetica e di energia potenziale: ETOT = EK + EPOT Dove: EK = Energia cinetica = ½ mv2 = 3/2 KBT Fornendo energia alla molecola, questa si muoverà lungo la PES, descrivendo una traiettoria. Considerando il sistema proteina: abbiamo tante particelle che compongono il sistema le particelle interagiscono e la forza che agisce su un atomo cambia ad ogni δt perchè gli atomi si muovono e cambiano posizione. Se le condizioni iniziali del moto a cui è sottoposta la particella sono note, possono essere scritte le leggi del moto. Quindi ad un certo istante t si sa come calcolare l’EPOT, ma nel t successivo la configurazione è un po’ cambiata perchè ci sono delle forze che agiscono sull’atomo. La legge che governa il moto dei vari atomi è: F = ma Lo scopo è risolvere l’equazione del moto per ricavare la posizione r(t) e la velocità v(t). Visto che ad ogni istante tutto cambia, non è possibile integrare l’equazione del moto ma si segue l’evoluzione della traiettoria ad ogni δt. In che modo? La traiettoria è continua ma si procede per intervalli discretizzati. Applicando la regola del trapezio, più piccolo è il trapezio meglio approssimo l’integrale della curva. Quindi, riassumendo, ad ogni passo vengono calcolati: Forze come derivate di energia potenziale rispetto alle coordinate atomiche --> Fi(t) = -∂EPOT/∂T Aggiornamento delle velocità e delle coordinate atomiche mediante le forze precedentemente ottenute. Una dinamica molecolare può essere condotta in differenti ensembles. Con questo termine si suole indicare l’idealizzazione di un gran numero di copie del sistema considerate all’istante, ognuna delle quali rappresenta un possibile stato in cui il sistema reale potrebbe essere. Nella molecola le particelle calde dovranno cedere energia cinetica alle particelle fredde e allora compariranno delle forze: c’è un travaso da una parte all’altra di energia cinetica e potenziale. Si può lavorare in: NVE ensemble (microcanonical ensemble) --> E’ un sistema isolato in cui il numero di particelle, velocità ed energia totale vengono conservati. NVE corrisponde ad un processo adiabatico in cui non c’è scambio di calore. Sfortunatamente, il microcanonical ensemble non corrisponde alle condizioni alle quali avviene la maggior parte degli esperimenti. Infatti, se lavoro ad ETOT costante, l’energia cinetica istantanea varia e cambia la T istantanea. Non ha senso portare la proteina in condizioni di alta T; se per caso siamo andati in un punto in cui le forze sono grandi e la PES s’impenna, le velocità aggiornate saranno grandi e vado a finire in un regime ad alta T. NVT ensemble (canonical ensemble) --> Abbandonata l’idea di lavorare ad energia costante per i motivi esposti precedentemente, si decide di lavorare a temperatura costante: in questo modo l’energia cinetica sarà costante ma varierà l’energia potenziale, con la conseguenza che l’energia totale cambia. Questo è l’approccio più fisiologico in quanto questo non è un sistema isolato; per mantenere costante la T bisogna invocare un sistema di scambio di calore tra il mio sistema e l’universo (bagno termostatico). Se l’aumento della T è molto grande, il sistema impiegherà molto più tempo a ritermalizzarsi: ciò vuol dire che la mia proteina rischia di stare per troppo tempo ad alta T. per mantenere costante la T bisogna accoppiare il sistema proteina con un bagno termostatico esterno, la cui T è circa costante ed è controllata da un termostato. L’ensemble NVT è fondamentale nello studio di protein unfolding che richiede un controllo preciso della T. NPT ensemble --> In questo caso P e T vengono mantenuti costanti. Una volta scelto l’ensemble opportuno, è necessario decidere se effettuare la dinamica in solvente esplicito o implicito: Solvente esplicito --> Vengono aggiunte molecole d’acqua al sistema (solvation box) e la distanza che intercorre tra gli atomi della proteina e lo spigolo della box dovrebbe essere compreso tra gli 8 e i 10 A. In caso di proteine con cariche nette vengono aggiunti controioni per neutralizzare il sistema. Solvente implicito --> Consiste nell’inclusione di una costante elettrostatica nel termine elettrostatico dell’energia potenziale (costante dielettrica efficiente). Le molecole di solvente sono implicitamente considerate modificando opportunamente le interazioni tra i nuclei come se essi subissero l'effetto ``medio'' cioe' statistico della presenza di un gran numero di molecole di solvente. In questo caso il costo computazionale è notevolmente ridotto rispetto alla trattazione con solvente esplicito. A questo punto avviene una fase di minimizzazione energetica. Questa fase è necessaria per eliminare quelli che vengono definiti come atom clashes. Solitamente si effettuano alcuni cicli di steepest descent o steepest descent+conjugate gradients ed il sistema viene portato alla temperatura desiderata. Dopo la minimizzazione avviene uno step di equilibrazione del sistema, in cui si cerca di mantenere il sistema stesso alla temperatura desiderata. In questa fase la temperatura viene costantemente monitorata e se avvengono variazioni di un tot K (ad es. ±10K) rispetto alla T preimpostata, le velocità vengono scalate per consentire la ritermalizzazione alla T voluta. Successivamente alla fase di equilibrazione (della durata di circa 20ps) possono prendere via i cicli produttivi (production runs). Dall’analisi della traiettoria (o dalle traiettorie) ottenute da un esperimento di dinamica molecolare si ottengono importanti informazioni: RMSD: Come già visto precedentemente,rappresenta la vicinanza, in termini strutturali, alla struttura nativa. Viene solitamente considerato l’RMSD dei C Una distanza compresa tra 3 e 4A rispetto alla struttura iniziale è generalmente usata come indicatore del raggiungimento del folding. α Cambiamento della SASA: il processo di folding è tipicamente accompagnato da un decremento significativo della SASA (Solvent Accessible Surface Area). La SASA dunque – o in alternativa il raggio di girazione – è un indicatore del processo di folding. Folding landscape: poichè il folding è un problema multidimensionale, le analisi basate su coordinate di reazione monodimensionali offrono un quadro incompleto del processo di folding. Le coordinate tipicamente adoperate sono l’RMSD, il raggio di girazione e la percentuale di contatti nativi. © Irene Righetto e Francesco Filippini, 2005-2017