SPETTROSCOPIA NMR DI PROTEINE Struttura tridimensionale della proteina G con il metodo degli accoppiamenti dipolari Candidato: Francesco Stellato Relatore: Prof. S. Morante (Dip.Fisica, Tor Vergata) Correlatore: Prof. M. Blackledge (IBS, Grenoble) 1 SOMMARIO • • • • • • Basi teoriche fisiche Apparato sperimentale Basi “teoriche” biologiche Preparazione del campione Simulazione Conclusioni 2 Basi teoriche fisiche Già nel 1946 Bloch1 e Purcell2, indipendentemente l’uno dall’altro, intuirono le potenzialità della Risonanza Magnetica Nucleare (NMR). L’NMR si basa sull’interazione tra il momento magnetico nucleare ed un campo magnetico esterno e può, quindi, essere utilizzato solo se J≠0. A Pari Pari Z Pari Dispari J 0 Intero Dispari Pari/Dispari Semi-intero A = numero di massa, Z = numero atomico 1Bloch, Hansen, Packard. (1946), Phys.Rev. 69, p. 127 3 Torrey, Pound. (1946), Phys. Rev. 69, pp. 37-38 2Purcell, J2 =│J2│= J·J = ħ2[J(J+1)] µ = γJ momento magnetico associato, γ = rapporto giromagnetico La degenerazione è rimossa in presenza di un campo magnetico esterno, B Jz= ħm, m = (-J, -J+1,…, J-1, J) Em = -µ·B = -γJ·B prendendo B // z ⇒ B → B0 Em = - γJzB0 = -mħγB0 2J+1 livelli equispaziati (livelli Zeeman) 4 All’equilibrio: stati popolati secondo la statistica di Boltzmann Nm = N exp(− Em/kBT) J ∑ exp(−E /k T) m B 1 + mhγB0/kBT ≈ 2J + 1 m=− J T∼300 K ⇒ mħγB0/kT << 1 Per un campione macroscopico ⇒ M=M0 ẑ Nγ 2 h 2 B0J(J + 1) M0 = γh ∑ mNm ≈ 3kBT m=− J J ħ= 1.05 x 10-34 J·s; γ= 108 (T·s)-1; B= 10T; kB= 1.38 x 10-23 J·K-1 5 EQUAZIONI DI BLOCH dJ(t)/dt=M(t) x B(t); Poichè, M=γJ ⇒ dM(t)/dt=M(t) x γB(t) Sistema di riferimento rotante intorno ad un asse fisso con velocità angolare costante, ω (dM(t)/dt)rot=(dM(t)/dt)lab+M(t) x ω= M(t)x(γB(t)+ω) Ponendo, Beff=B(t)+ω/γ Si ottiene, (dM(t)/dt)rot=M(t) x γBeff(t) M(t) precede intorno a B(t) con frequenza ω = γB; se B=(0,0,B0) ⇒ ω = ω0= γB0: M(t): campo magnetico variabile nel tempo ⇒ f =-dΦ/dt. f = segnale NMR 6 All’equilibrio: M//B ⇒ Non c’è segnale impulso rf ⇒ M(t) precede intorno a B0 ⇒ c’è segnale 7 A causa di fenomeni dissipativi (rilassamento) ⇒ decadimento di: magnetizzazione trasversa (Mx e My) e longitudinale (Mz) Bloch ha proposto semplici espressioni per descrivere il fenomeno del rilassamento: dMx(t)/dt=-Mx(t)/T2 → Mx(t)=Mx(0)exp(-t/T2) dMy(t)/dt=-My(t)/T2 → My(t)=My(0)exp(-t/T2), dMz(t)/dt=[M0-Mz(t)]/T1 → Mz(t)=M0-[M0-Mz(0)]exp(-t/T1) T1 e T2 : costanti di tempo longitudinale e trasversale 8 Apparato sperimentale 1. Magnete: solenoide superconduttore; B > 10 T 2. Sonda (coassiale al magnete): invia l’impulso rf e riceve il segnale 3. Programmatore di impulsi e trasmettitore: generano l’impulso perturbante 4. Rivelatore: preamplificazione conversione digitale 5. e Computer: acquisizione dati e FT ⇒ spettro NMR 9 Schema generale di un esperimento NMR 1. Il campione è posto in un campo magnetico B 2. L’invio di un impulso elettromagnetico perturba l’equilibrio 3. La precessione della magnetizzazione genera un segnale elettrico noto come FID (Free Induction Decay) 4. Il FID è registrato, e quindi trasformato di Fourier, nel dominio della frequenza: FID(t) → ν (ω) 10 Basi “teoriche” biologiche Le proteine sono polimeri lineari di aminoacidi (aa) e svolgono la maggior parte delle funzioni necessarie alla vita (trasporto, catalisi, difesa immunitaria, etc…). I 20 diversi aa naturali differiscono per le caratteristiche fisicochimiche della catena laterale R. Gli aa sono legati tramite il legame peptidico, che ha luogo tra il gruppo carbossilico di un aa ed il gruppo amminico del successivo, con la formazione di una molecola d’acqua. 11 E’ utile definire 2 angoli torsionali: •φ: rotazione intorno a Cα-N •ψ: rotazione intorno a Cα -C’ In una proteina sono individuabili 4 livelli strutturali: 1. Struttura primaria = sequenza lineare di aminoacidi 2. Struttura secondaria = struttura locale della catena (α-elica, βsheet, …) 3. Struttura terziaria = struttura 3D globale 4. Struttura quaternaria = disposizione spaziale di subunità diverse 12 Preparazione del campione 1. Selezione del gene che codifica la proteina 2. Inserimento del gene in un plasmide e trasferimento in batterio (E. coli) 3. Scelta del mezzo di crescita*: crescita a 37 °C 4. Lisi e purificazione della proteina Caratteristiche necessarie: 1. Campione puro (almeno) al 95 % 2. Proteina stabile per tutta la durata dell’esperimento 3. La proteina non deve formare aggregati alla concentrazione necessaria per l’esperimento (generalmente, circa 1 mM) 13 • 15NH 4Cl (cloruro di ammonio) come unica fonte di N, per avere proteine marcate con 15N • 13C 6H12O6 (glucosio) come unica fonte di C, per avere proteine marcate con 13C • 2H + 2O (acqua pesante) per avere proteine marcate all’80% con 2H C62H12O6 (glucosio) per avere il 100% di 2H 14 Simulazione Dati sperimentali RDC3 MODULE4 MECCANO5 Dati cristallografici1 File PDB2 InsightII* RMS *©Accelrys Inc. Σ[( (x1-x2)2 + (y1-y2)2 + (z1-z2)2]½ / N 15 La proteina G proteina della parete batterica con vari siti di legame per l’anticorpo Sito GB3 α-elica β-sheet1 β-sheet2 β-sheet3 β-sheet4 ↑ 16 HEADER IMMUNOGLOBULIN BINDING PROTEIN 05-AUG-94 XXXX TITLE THE THIRD IGG-BINDING DOMAIN FROM STREPTOCOCCAL PROTEIN G: TITLE 2 AN ANALYSIS BY X-RAY CRYSTALLOGRAPHY OF THE STRUCTURE TITLE 3 ALONE AND IN A COMPLEX WITH FAB COMPND PROTEIN G KEYWDS IMMUNOGLOBULIN BINDING PROTEIN EXPDTA X-RAY DIFFRACTION AUTHOR J.P.DERRICK, D.B.WIGLEY ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ↑ 1 N 2 CA 3 C 4 O 5 CB 6 CG 7 SD 8 CE 9 N 10 CA 11 C 12 O MET A MET A MET A MET A MET A MET A MET A MET A THR A THR A THR A THR A 1 1 1 1 1 1 1 1 2 2 2 2 1.482 1.504 1.417 1.828 2.786 4.008 5.553 5.224 0.914 0.874 2.218 2.738 2.881 3.440 4.966 5.536 3.039 3.686 3.396 4.534 5.587 7.070 7.455 6.701 4.315 5.674 5.566 4.548 6.438 5.823 6.808 8.175 6.600 6.635 7.275 8.119 1.00 10.85 1.00 9.28 1.00 7.23 1.00 10.61 1.00 13.17 1.00 23.31 1.00 28.10 1.00 29.75 1.00 9.74 1.00 12.11 1.00 10.05 1.00 11.94 N C C O C C S C N C C O 17 •RDC: Accoppiamento dipolare per un sistema di 2 nuclei, A e B 2 H = D AB J A zJBz(3cos θ − 1) max < >: media temporale o sull’ensemble (⇒ solvente anisotropo) θ: angolo AB, B; DAB=-µ0(h/2π)γAγB/(4π2r3) DAB può essere data in funzione di θ e di una matrice diagonale, A, (tensore di allineamento). Gli elementi Aii corrispondono alla probabilità di trovare l’i-esimo asse parallelo a B0. 18 ↑ Sono stati misurati (Ulmer 3) • 6 campioni (A-F) di proteina G da E.coli HMS174 in mezzo minimo di crescita: 13C6H12O6 e 15NH4Cl e con diversi solventi • 4 valori di RDC per residuo: Cα-C’, Cα-Hα, N-H, C’-N RDC calcolati RDC sperimentali MODULE4 ↑ A 3 T.S. Ulmer, B.E.Ramirez, F.Delaglio, A.Bax. (2003), JACS 125: pp. 9179-9191 4 MODULE By P.Dosset, J.C.Hus, M.Blackledge. IBS, Grenoble 19 RDC in 2 mezzi φeψ (se disponibili) Aii nei 2mezzi MECCANO Procedura “step-by-step”: 2 χ PDB dal 1° peptide determinando l’orientazione relativa di quelli seguenti per cui 2 2 2 exp calc − ϕ − ϕ − exp calc exp calc ( ) (ψ ψ ) (D D ) +(109− ϑ)2 k + + χ2 = ∑ σ σ σij ij ↑ è minima. 20 MECCANO By M.Blackledge. IBS, Grenoble 5 La simulazione è stata eseguita utilizzando i seguenti campioni: peg: polietilen glicolo; npg: gel di poliacrilamide carico negativamente ppg: gel di poliacrilamide carico positivamente In particolare: da 1 a 5 è stata usata la coppia npg-ppg (Anpg · Appg = -0.132), per 6 e 7 la coppia npg-peg (Anpg · Apeg = 0.224) Residui RMS1(Å) RMS2(Å) RMS3(Å) RMS4(Å) RMS5(Å) RMS6(Å) RMS7(Å) 8-60 12.863 11.003 9.540 2.775 5.530 8-41 10.838 2.614 2.681 2.311 2.699 22-41 5.122 29-41 2.963 5.635 2.563 0.680 0.334 0.651 RMS1 : α-elica; RMS2 : intera struttura; RMS3 : vincolo su φ e ψ (σ=10°); RMS4 : vincolo su φ e ψ (σ=0.001°); RMS5 : come RMS3 tranne tra 41-44 dove come RMS4; RMS6 : come RMS1 ; RMS7 : come RMS4 21 Conclusioni L’NMR è una tecnica molto potente per lo studio della struttura delle molecole in soluzione. La ricerca di strategie sempre più efficienti per estrarre informazione dagli spettri è di importanza fondamentale. L’uso degli RDC come unico mezzo per determinare la struttura 3D va proprio in questa direzione, e il lavoro di simulazione qui presentato ne ha dimostrato le potenzialità nel caso specifico di una proteina strutturalmente rappresentativa. 22 Interpretazione dei risultati delle simulazioni RMS1: il risultato è buono solo nella parte di elica, che è la parte usata per trovare il tensore di allineamento. RMS2: il risultato è buono anche tra 8 e 41, mentre nella parte finale persistono problemi. RMS3: il risultato è migliore di quello ottenuto senza questi vincoli, ma nella parte finale persistono problemi. RMS4: il risultato è buono ovunque. RMS5: Per i residui 6-41 si ottiene come aspettato un RMS simile a quello di RMS3 mentre l’RMS dell’intera proteina è sensibilmente migliore. RMS6 e RMS7: Quanto più piccolo è Aa · Ab tanto migliore è la determinazione della struttura 3D. 23 Proprietà di nuclei leggeri con J≠0 Nucleo J γ (T·s)-1 % 1H ½ 1 ½ 1 ½ 5/2 ½ 2.67·108 4.11·107 6.73·107 1.93·107 2.71·107 -3.63·107 2.51·108 99.98 0.02 1.11 99.64 0.36 0.04 100.00 2H 13C 14N 15N 17O 19F 24 Modello a strati Livelli a particella singola V = - V0 + ½ k r2 – Vls l⋅s – Vl l(l+1) 25