INTRODUZIONE ALLA BIOCHIMICA DELLE PROTEINE BCP 1-2 Pietre miliari • • • • • • • • Lehninger 1973 “Biochemistry” Biochemistry Proteine ricombinanti Protein engineering Cristallografia, NMR, EM, MS, spettroscopie ... Computing Bi i f Bioinformatica ti Genomica ... Pietre miliari • Le proteine supportano ogni reazione che avviene in un sistema biologico g • Le proteine compongono il 50% del peso secco della presenti in percentuali p molto maggiori gg cellula;; sono p a quelle delle altre macromolecole cellulari • Ca. 1839 Johannes Mulder e Jakob Berzelius ( C, N, O, H in gelatina, albumina, ...). Proteus ...Æ proteine • Almeno 40 Premi Nobel per la Chimica o per Biologia e Medicina sono stati assegnati in relazione a studi su proteine Alcune Funzioni delle Proteine • • • • • • • • • • • Enzimi/catalizzatori Proteine contrattili o strutturali Proteine di trasporto Eff tt i Effettori Proteine di difesa Proteine per il trasporto elettronico Recettori Repressori Chaperoni Proteine di deposito ... TRIPSINA ACTINA Hb INSULINA Ab Cyt OXID CD4 Jun GroEl FERRITINA Peso molecolare vs. vs Mr • Mr e’ la massa molecolare relativa a 1/12 della massa dell’isotopo 12C (che vale esattamente 12 u.m.a.). Mr e’ un rapporto, e quindi ADIMENSIONALE. • 1 Da equivale alla massa di 1 g / N (6.022 x 1023). Spesso si usa il Da per indicare il “peso molecolare”, che quindi rappresenta la massa, massa espressa in g g, di una mole di proteina. Il “peso molecolare” ha dimensoni di g/mole. • Dal punto di vista pratico Mr e peso molecolare g usati indifferentemente. vengono Perche’ le PROTEINE? Perche • 27.000 ORF nel genoma umano • 90.000 proteine (splicing alternativo, mod. post-traduzionali,, assemblaggi p gg quaternari) q ) • Fibrosi cistica: delezione di 1 residuo/1500 aa • Anemia falciforme: 2 residui mutati (EÆV) / 574 aa • Cancro ... g design g • Drug Aminoacidi • • • • Ala: m m.w. w 89 89, p p.f. f 314°C 314 C Acido propionico: m.w. 74, p.f. -20.8°C P Proprieta’ i t ’ acido-base id b Eq. Henderson-Hasselbach pH = pKa + log[A-]/[HA] Proprietà generali Le forme ioniche degli aminoacidi, senza considerare alcuna ionizzazione delle catene laterali. Proprietà acidoacido-base pKa degli aminoacidi I valori di pKa del gruppo carbossilico ed aminico degli altri aminoacidi sono simili a quelli della glicina. Alcuni aminoacidi contengono anche catene laterali ionizzabili: Asp, Glu, His, Cys, Tyr, Lys e Arg. Il pKa delle catene laterali ionizzabili degli aminoacidi è compreso tra i valori 3.9 (Asp) e 12.5 (Arg). V. 3 animated lessons Proprietà acidoacido-base pK degli aminoacidi Un aminoacido, come Gly, contiene due gruppi ionizzabili: un gruppo carbossilico e un gruppo aminico protonato. Quando si aggiunge una base (per esempio OH-), si ha la titolazione di questi due gruppi. Nella glicina il pKa del gruppo –COOH è 2.4 (per cui a pH > 2.4 sii ha h la l forma f –COO COO-), ) mentre t quello del gruppo –NH3+ è 9.8 (per cui solo a pH > 9.8 si ha la forma –NH2). ) Proprietà acidoacido-base Acido glutammico Lisina Proprietà generali Tutti gli aminoacidi (ad eccezione della glicina) derivati da proteine sono otticamente attivi, cioè ruotano il piano di polarizzazione della luce. Le molecole l l otticamente i attive i sono asimmetriche in modo da non essere sovrapponibili con le loro immagini speculari (enantiomeri). (enantiomeri) Ciò è caratteristico di molecole contenenti atomi di carbonio tetraedrici con 4 diversi sostituenti. sostituenti L’atomo centrale si dice centro chirale. Proprietà generali Il centro chirale degli aminoacidi è l’atomo Cα. Tutti gli aminoacidi derivati da proteine hanno una configurazione stereochimica di tipo L. La configurazione assoluta degli aminoacidi L può essere facilmente ricordata: - guardando verso il Cα dal suo atomo H, gli altri atomi sostituenti formano, se letti in senso orario, la parola CORN. Il legame peptidico Gli aminoacidi polimerizzano durante la sintesi delle proteine mediante la formazione di legami peptidici. Il legame peptidico C–N si ha quando il gruppo carbossilico b ili di un peptide tid condensa con il gruppo amminico del peptide successivo mediante ll’eliminazione eliminazione di una molecola d’acqua. Il legame peptidico Il gruppo peptidico ha una struttura rigida e planare, dovuta al parziale (~40 %) carattere di doppio legame del legame g peptidico. p p O O- C C N N+ H H Il legame peptidico Il legame peptidico C–N è 0.13 Å più corto del legame singolo N–Cα e 0.08 Å più lungo di un doppio legame C=N. Il legame peptidico, quindi, presenta per il 60 % una natura di legame singolo e per il 40 % una natura di legame doppio. Il legame peptidico trans Generalmente il gruppo peptidico assume la conformazione trans - atomi ((Cα)n e ((Cα)n+1 opposti pp rispetto p al legame peptidico C–N. cis In alcuni casi il gruppo peptidico può assume la conformazione cis ( 8 (~8 kJ kJ·mol l-11 meno stabile bil d ll della conformazione trans. Problemi sterici, perché distanza Cα-Cα = 2.8 Å). Il legame peptidico Il gruppo peptidico ha un momento di dipolo. Gli atomi O e N sono rispettivamente p più p elettronegativi di C ed H. La conseguente delocalizzazione di carica porta alla formazione di due dipoli (CO ed NH) con analoga direzione e verso nel gruppo peptidico. Il momento di dipolo di l risultante i l è di circa i 3.5 Debye. O C N H Macromolecole Biologiche Il legame peptidico Come si ricava il valore del momento di dipolo del gruppo peptidico: momento dipolo C=O (frazione di carica × distanza atomi C ed O): μA = 0.42 × 1.23 = 0.52 eÅ momento dipolo N–H (frazione di carica × distanza atomi N ed H): μB = 0.20 × 1.00 = 0.20 eÅ Il momento di dipolo risultante sarà dato dalla somma: μ = μA + μB = 0.72 eÅ Å Nel sistema internazionale il momento di dipolo è espresso in Cm, quindi: 0 72 × 1.6 0.72 1 6 × 10-19 × 10-10 = 1.15 1 15 × 10-29 Cm carica e- Å in metri poiché 1 Debye = 3.35 × 10-30 Cm, ne deriva che 1.15 × 10-29 Cm equivale a circa 3.5 Debye. Il legame peptidico Per ciascun aminoacido costituente la catena polipeptidica si presentano 20 diverse possibilità di catena laterale (o residui), residui) per cui è facile immaginare l’enorme numero di diverse catene polipeptidiche che possono essere costituite. Se si considera un dipeptide, si avranno 202 = 400 possibili dipeptidi diversi. Se si considera un tripeptide, si avranno 203 = 8000 possibili tripeptidi diversi. Nel caso delle proteine, proteine una piccola proteina è costituita da una singola catena polipeptidica di circa 100 residui, per cui si avranno 20100 = 1.27 × 10130 possibili catene polipeptidiche diverse! Gli organismi sulla terra sintetizzano un gran numero di proteine, con caratteristiche fisico-chimiche differenti, che derivano dalle diverse proprietà dei 20 aminoacidi ‘standard’ e da come questi si combinano nella catena polipeptidica. li tidi Gli aminoacidi http://www biology arizona edu/biochemistry/problem sets/aa/aa html http://www.biology.arizona.edu/biochemistry/problem_sets/aa/aa.html http://www.imb-jena.de/IMAGE_AA.html 20 catene laterali diverse per gli aminoacidi: aminoacidi: classificazione e caratteristiche Le 20 diverse catene laterali (gruppo R) che costituiscono gli aminoacidi si differenziano considerevolmente per dimensioni, volume e per le loro caratteristiche fisico chimiche, quali polarità, acidità, basicità, aromaticità, flessibilità conformazionale, reattività chimica, tendenza a formare legami idrogeno. Q Queste diverse caratteristiche sono le maggiori gg responsabili p della g grande varietà di proprietà delle proteine. Per convenzione, i nomi degli aminoacidi sono abbreviati con un codice a tre lettere e con uno a una lettera. Gli aminoacidi sono generalmente classificati a seconda della polarità delle loro catene laterali. Infatti,, il ripiegamento p g della catena p polipeptidica p p nella sua conformazione nativa è dovuto principalmente alla tendenza che hanno le catene laterali idrofobiche a sfuggire il contatto con il solvente e le catene laterali idrofiliche ad essere esposte all’acqua. Si possono quindi distinguere 3 gruppi di aminoacidi: - gruppo R non polare - gruppo R polare non carico - gruppo R polare carico Gruppo R non polare Glicina Gly Alanina Ala Valina Val Leucina Leu Isoleucina Ile Metionina Met Prolina Pro Fenilalanina Phe Ti t f Triptofano T Trp G A V L I M P F W Gruppo R polare carico Lisina Arginina Istidina Acido Aspartico Acido Glutammico Lys Arg His Asp Glu Gruppo R polare non carico Serina Ser S TreoninaThr T Asparagina Asn N Glutammina Gln Q Tirosina Tyr Y Cisteina Cys C K R H D E Le catene laterali degli aminoacidi Esistono alcune regole per ricordare facilmente il codice ad una lettera degli aminoacidi. - se solo un aminoacido comincia con una determinata lettera, allora si usa quella lettera: C = Cys = Cysteine H = His = Histidine I = Ile = Isoleucine M = Met = Methionine S = Ser = Serine V = Val = Valine - se ppiù di un aminoacido comincia p per una determinata lettera,, q quella lettera viene assegnata all’aminoacido più ricorrente: A = Ala = Alanine G = Gly Gl = Glycine Gl i L = Leu = Leucine P = Pro = Proline T = Thr Th = Threonine Th i Le catene laterali degli aminoacidi - alcuni sono evocativi della fonetica: F = Phe = Phenylalanine (Fenylalanine) R = Arg = Arginine (aRginine) Y = Tyr = Tyrosine (tYrosine) W = Trp = Tryprophan (doppio anello nella molecola) D = Asp = Aspartic acid (asparDic acid) - altri casi: N = Asn = Asparagine p g ((AsparagiNe) p g ) E = Glu = Glutamic acid (da ‘gluE’) Q = Gln = Glutamine (Q-tamine) K = Lysine (K viene prima di L nell’alfabeto) Macromolecole Biologiche Gruppo R non polare Glicina E’ stato il primo aminoacido ad essere identificato nelle proteine idrolizzate, nel 1820. E’ l’aminoacido ppiù semplice, p , con la catena laterale p più p piccola,, formata soltanto da un atomo H. La presenza del solo atomo H come catena laterale fa sì che: - il Cα non sia asimmetrico, per cui non si può distinguere tra forma L e D. La glicina, quindi, è l’ i aminoacido l’unico i id a non essere otticamente tti t attivo. tti - la catena principale della glicina abbia la massima flessibilità conformazionale. conformazionale Macromolecole Biologiche Gruppo R non polare Alanina, Valina, Leucina e Isoleucina Presentano catene laterali alifatiche di diverse dimensioni, costituite da gruppi inerti metilene ((–CH2–)) e metile ((–CH3)). In particolare, la catena laterale dell’isoleucina presenta un secondo centro chirale (atomo di Cβ asimmetrico), per cui in teoria sono possibili 22 = 4 stereoisomeri per l’isoleucina. In realtà, la catena laterale dell’isoleucina isolata nelle proteine e’ sempre di tipo L. Gruppo R non polare Metionina La sua catena laterale presenta un gruppo tioetere (R–S–R) che ricorda un gruppo n-butile in molte delle sue proprietà fisiche quali volume, volume conformazione, polarità (gli atomi C e S hanno elettronegatività quasi uguale ed S è circa delle dimensioni di un gruppo metilene –CH2). S e’ nucleofilo. Puo essere ossidato a solfossido e a solfone. E’ il p punto di attacco per Br-CN, nella frammentazione delle proteine. Gruppo R non polare Prolina Il gruppo alifatico che costituisce la catena laterale della prolina è legato covalentemente all’atomo N della catena principale, a formare un anello pirrolidinico i lidi i (caratteristica ( tt i ti unica i fra f i 20 aminoacidi). i idi) La struttura ciclica della catena laterale della prolina impone rigidi vincoli conformazionali sulla catena principale (la rotazione intorno al legame N–Cα è bloccata a circa -60 60°)). Il 10 % delle proline nelle proteine adotta un legame peptidico in conformazione cis. Il ΔG tra le forme cis e trans della Pro e’ 8.3 kJ/mol. L’energia di attivazione per l’isomerizzazione cis/trans di Pro e’ di 54.3 kJ/mol, contro 83 kJ/mol degli altri aminoacidi. Gruppo R non polare Fenilalanina e Triptofano La fenilalanina e il triptofano sono aminoacidi aromatici, in quanto la loro catena laterale contiene un anello aromatico chimicamente paragonabile a quello del benzene. In particolare, la catena laterale del triptofano, costituita tit it da d un gruppo indolico, i d li è la l più iù grande d e voluminosa di tutti i 20 aminoacidi. La ppresenza di un anello aromatico conferisce a tali aminoacidi la proprietà di assorbire la radiazione elettromagnetica nella banda dell’ultravioletto e quindi di essere un’utile sonda fluorescente per studiare la struttura delle proteine nelle zone ad essi circostanti. Gruppo R non polare Fenilalanina e Triptofano Nessuno degli aminoacidi assorbe la luce nella banda del visibile, visibile alcuni aminoacidi assorbono la radiazione nella banda dell’ultravioletto e tutti assorbono nella banda dell’infrarosso. Solo gli aminoacidi aromatici Phe, Tyr e Trp hanno un significativo assorbimento nell’ultravioletto ll’ lt i l tt all di sopra di λ = 250 nm. Emettono in fluorescenza tra 282 e 348 nm. I coefficienti di estinzione molare misurati a 280 nm sono (M-1 cm-1): Phe Tyr Trp 195 1420 5600 Gruppo R polare non carico Serina e Treonina Le catene laterali di serina e treonina presentano un gruppo idrossilico ((R–OH)) di dimensioni diverse. In particolare, anche la catena laterale della treonina presenta un secondo centro chirale (atomo di Cβ asimmetrico). Discorso analogo alla catena laterale dell’isoleucina. Gruppo R polare non carico Asparagina e Glutammina Asparagina e glutammina sono la forma ammidica rispettivamente di acido aspartico e acido glutammico. Non sono, però, il prodotto dell’amidazione dei due acidi, ma ricorrono in natura e sono incorporati direttamente nelle proteine. Gruppo R polare non carico Tirosina La catena laterale della tirosina presenta un gruppo fenolico (anello aromatico aromatico–OH) OH), responsabile, responsabile insieme agli anelli aromatici di Phe e Trp, dell’assorbimento nell’ultravioletto e della fluorescenza delle p proteine che contengono g questi q aminoacidi. Cisteina La catena laterale della cisteina contiene un gruppo tiolo (R–SH), estremamente reattivo. Due cisteine che si trovano in posizioni diverse della catena polipeptidica, li idi ma adiacenti di i nella ll struttura tridimensionale di una proteina possono essere ossidate e formare un ponte disolfuro. Ponte disolfuro Il ponte disolfuro è di solito il prodotto finale dell’ossidazione da parte di O2 atmosferico, secondo il seguente schema di reazione: Ponte disolfuro Questa reazione richiede un ambiente ossidativo e quindi i ponti disolfuro non ricorrono normalmente in proteine intracellulari, che si trovano in un ambiente principalmente p p riducente. I p ponti disolfuro sono invece frequenti q nelle p proteine extracellulari secrete dalle cellule e negli eucarioti. I ponti disolfuro stabilizzano la struttura tridimensionale delle proteine: possono formarsi fra cisteine appartenenti a due catene polipeptidiche diverse (come per esempio tra la catena A e la catena B dell’insulina), oppure possono essere intramolecolari, rendendo così la proteina meno soggetta a degradazione. I ponti disolfuro sono legami covalenti, che possono essere rotti introducendo un agente riducente, come per esempio β-mercaptoetanolo o ditiotreitolo (DTT). (DTT) Gruppo R polare carico Lisina, Arginina e Istidina Sono tre aminoacidi basici, carichi positivamente a pH fisiologico. La catena laterale della lisina p presenta un g gruppo pp butilammonio,, q quella dell’arginina un gruppo propilguanidinico e quella dell’istidina un gruppo imidazolico. Gruppo R polare carico L’istidina, in particolare, ha un pKR = 6.3-6.8 e ionizza entro l’intervallo di pH fisiologico (attorno a 7.2). A pH = 6.4, il suo gruppo imidazolico è carico ppositivamente solo al 50 %;; a p pH = 7.4 la catena laterale dell’istidina è elettrostaticamente carica solo al 10 %, tendendo alla neutralità all’estremità basica dell’intervallo del pH fisiologico. Conseguenza di tale proprietà è che le catene laterali dell’istidina spesso sono coinvolte nelle reazioni catalitiche degli enzimi che richiedono scambio di ioni H+. Gruppo R polare carico Acido aspartico e Acido glutammico Sono due aminoacidi acidi, carichi negativamente sopra pH = 4 (gruppo COO-). Essi differiscono uno dall’altro solo nell’avere rispettivamente uno o due gruppi metilene. La piccola differenza in lunghezza della loro catena laterale fa sì che abbiano una reattività chimica sensibilmente diversa. Q d sii trovano Quando t nell loro l stato t t ionizzato, i i t cii sii riferisce if i ad d essii come aspartato e glutammato. http://www.wiley.com/legacy/college/boyer/0470003790/animations/animations.htm Aminoacidi ‘non standard’ I 20 aminoacidi ‘standard’ standard non sono gli unici aminoacidi che si trovano nei sistemi biologici. Esistono anche gli aminoacidi ‘non standard’, che talvolta sono importanti costituenti delle proteine. Gli aminoacidi ‘non standard’ risultano da specifiche modificazioni degli aminoacidi ‘standard’ dopo la sintesi della catena polipeptidica (modificazioni post-traslazionali). In molti casi queste modificazioni sono importanti, se non essenziali, per la funzione della proteina. Spesso sono modificati S difi ti anche h aminoacidi i idi di proteine t i che h formano f complessi l i con acidi nucleici: per esempio proteine ribosomiali e cromosomiali (istoni) possono essere metilate, acetilate, e/o fosforilate. Aminoacidi ‘non standard’ Fra gli aminoacidi modificati più importanti si hanno la 4 4-idrossiprolina idrossiprolina e la 5-idrossilisina, spesso trovati come costituenti della proteina fibrosa collagene. Aminoacidi ‘non standard’ N formilmetionina è il residuo N N-formilmetionina N-terminale terminale di tutte le proteine procariotiche; di solito viene rimossa durante il processo di maturazione della proteina. p L’acido γ-carbossiglutammico è il costituente di varie proteine coinvolte nella ll coagulazione l i d l sangue. del Gli aminoacidi di tipo D Gli aminoacidi di tipo D sono pochissimo rappresentati in Natura. Natura Essi sono componenti specifici di peptidi batterici (lunghi meno di 20 residui) sintetizzati enzimaticamente piuttosto che tramite i ribosomi. Questi polipeptidi sono importanti costituenti che conferiscono resistenza alle pareti cellulari batteriche, perché gli aminoacidi di tipo D subiscono meno facilmente l’attacco di peptidasi che comunemente degradano le strutture polipeptidiche costituite da aminoacidi di tipo L. Inoltre, gli aminoacidi di tipo D sono i componenti di antibiotici prodotti dai b tt i come valinomicina, batteri, li i i gramicidina i idi A e actinomicina ti i i D. D Derivati degli aminoacidi Gli aminoacidi e i loro derivati svolgono funzioni biologiche molto importanti, oltre ad essere i costituenti delle proteine: - intermedi in vari processi metabolici: citrullina e ornitina sono intermedi i di nell ciclo i l dell’urea; d ll omocisteina è un intermedio nel metabolismo degli aminoacidi; S-adenosilmetionina è una molecola in grado di trasferire gruppi metilici. Derivati degli aminoacidi - messaggeri chimici nella comunicazione fra le cellule: glicina, acido γ-aminobutirrico (GABA; prodotto della decarbossilazione del glutammato) e dopamina (derivato della tirosina) sono neurotrasmettitori; (prodotto della decarbossilazione dell’istidina)) è un p potente istamina (p mediatore locale delle reazioni allergiche; tiroxina (derivato della tirosina) è un ormone della tiroide, contenente iodio, che generalmente stimola il metabolismo nei vertebrati. Test yourself • http://www http://www.wiley.com//legacy/wileychi/whitf wiley com//legacy/wileychi/whitf ordproteins/supp/MCQ/c02_quiz.htm • http://www.wiley.com/legacy/wileychi/whitf http://www wiley com/legacy/wileychi/whitf ordproteins/supp/MCQ/c03_quiz.htm