La funzione delle proteine dipende dalla loro struttura tridimensionale

La funzione delle proteine dipende dalla loro
struttura tridimensionale
•
•
•
•
•
La struttura dipende dal ripiegamento di particolari sequenze
aminoacidiche
La sequenza aminoacidica della catena polipeptidica è la struttura
primaria
Regioni diverse della sequenza formano strutture secondarie regolari
(alfa eliche e filamenti beta)
Gli elementi di struttura secondaria si dispongono secondo semplici
motivi strutturali. La struttura terziaria risulta dalla associazione di
più motivi strutturali in una o più unità dette “domini”.
La proteina può essere formata da più catene polipeptidiche disposte in
una struttura quaternaria
Elementi strutturali delle proteine
• L’interno delle molecole proteiche contiene
soprattutto catene laterali idrofobe disposte in
strutture secondarie che permettono di neutralizzare
la polarità dei loro gruppi polari mediante la
formazione di legami idrogeno.
• Esistono 2 tipi principali di struttura secondaria: αeliche e foglietti-β (che costituisocno le regioni del
core), e sono collegate da regioni loop presenti alla
superficie
Gli elementi della costruzione
α-elica
-Presenti nelle proteine quando una stringa di residui consecutivi
presentano tutti coppie di angoli diedri Φ e ψ con valori compresi
tra -60° e -50°.
-Presenta 3,6 residui per spira
-Stabilizzata da legami idrogeno che si formano tra il gruppo C=O
di un residuo n ed il gruppo NH del residuo n+4. In questo modo
tutti i gruppi NH e CO della catena principale sono uniti da
legami idrogeno.
-L’elica è sempre destrorsa
Gli elementi della costruzione
foglietto-β
Rossiossigeno
Bluazoto
Biancoidrogeno
NeroCα cat princ
Violaposizione cat lat
-Costituiti da filamenti β che possono essere tutti
antiparalleli oppure paralleli tra loro.
-Nel foglietto β i filamenti si trovano allineati
giacendo uno accanto all’altro in modo da formare legami
idrogeno tra i gruppi C=O di un filamento β ed i
gruppi NH di un filamento adiacente
I filamenti beta antiparalleli sono tra
gli elementi a più alta stabilità
foglietto β antiparallelo
(direzioni opposte NC CN)
foglietto β parallelo
(medesima direzione biochimica NC)
Gli elementi della costruzione
loop
-tratti di catena apparentemente disorganizzati, di lunghezza variabile
-fanno da collegamento fra α-eliche o filamenti β
-partecipano spesso alla formazione di siti di legame
(come i loop degli anticorpi) o del sito attivo degli enzimi
-si trovano alla superficie della molecola
I diagrammi di topologia
Topologia come gli elementi di struttura secondaria sono connessi tra loro
utili per rappresentare le connessioni tra elementi di struttura secondaria
aspartato
carbamiltransferasi
flavodossina
plastocianina
Gli elementi di struttura secondaria sono
collegati a formare semplici motivi strutturali
• MOTIVO STRUTTURALE  semplice
combinazione di pochi elementi
fondamentali di struttura secondaria
• Motivi strutturali semplici possono
combinarsi a formare motivi complessi
• Combinazioni di piccoli motivi strutturali
costituiscono il core dei domini (unità
fondamentali della struttura terziaria)
I 4 motivi strutturali più ricorrenti
Elica-loop-elica
Forcina β
Chiave greca
β-α-β
La combinazione dei motivi strutturali semplici dà
luogo a strutture complesse
Motivo Elica-loop-elica
motivo strutturale specifico
per il legame del DNA
motivo strutturale specifico
per il legame del calcio
(parvalbuina,calmodulina, troponinaC)
Il motivo “EF hand”
-Comprende 2 alfa-eliche:E ed F, che affiancano il loop:
5 residui del loop legano il calcio quindi la loro cat lat
deve contenere un atomo di ossigeno
Elica E direzione che parte dalla base dell’indice
Dito medio regione loop di 12 residui che lega il calcio
Elica F diretta all’estremità del pollice
-Residuo num.6 del loop è sempre glicina
(poco ingombrante)
La mano destra simboleggia
il motivo di legame al calcio
Sequenze consenso dei motivi EF
in 3 proteine diverse
(in arancio aa deputati al legame
con il calcio;
In verdeaa con cat lat idrofobe
destinate a formare core idrofobo
tra le alfa-eliche)
Struttura della troponina C
con i suoi motivi EF
-E’ costituita da 4 motivi EF hand di cui 2
legano il calcio (sfere rosa)
-L’atomo di calcio è legato attraverso
6 atomi di ossigeno, dei quali tre proviengono
dalla cat lat di Asp (D9), Asn (N11) e Asp (D13)
due sono forniti dalla cat lat di Glu (E20),
ed uno dal legame peptidico del residuo 15.
-Al calcio è legata anche una molecola d’acqua.
Quindi questo motivo, per espletare la sua funzione,
necessita sia di una specifica conform della catena principale sia
della presenza di un peculiare raggruppamento di catene laterali.
Il motivo elica-loop-elica fornisce l’impalcatura che ancora i ligandi
degli ioni calcio in posizione corretta per poter legare e liberare questi ultimi
motivo elica-loop-elica legante il DNA
Motivo elica-loop-elica legante il
DNA presente nella proteina Cro del fago λ….
…legato al DNA
Forcine β
forcina β come foglietto isolato
forcina β come parte di un
foglietto più complesso
Motivo a greca
-Quando 4 filamenti beta antiparalleli si dispongono
secondo un modello simile all’unità ripetitiva di un tipico
disegno ornamentale caratteristico dell’arte dell’antica
Grecia, noto come “Greca”.
-Si basa sull’iniziale formazione di una lunga struttura
antiparallela in cui i loop sono presenti al centro di entrambi
i filamenti beta.
-Il motivo a greca si originerebbe in conseguenza di
cambiamenti strutturali nelle regioni loop interposte tra i
filamenti beta 1 e 2 e nelle regioni
interposte tra i filamenti 3 e 4. Per effetto di ciò, la
struttura si ripiega verso il basso ed il filamnto beta 2 va
ad associarsi col filamento 1 formando con questo legami
idrogeno.
Ipotetica modalità di ripiegamento di
struttura a forcina che porta
alla formazione del motivo a greca
Motivo a greca
a) diagramma topologico della greca
b)motivo a greca presente
nell’enzima nucleasi Staphylococcus
.
Il motivo a greca fornisce un
semplice modo di collegare filamenti beta
antiparalleli che si trovino su lati opposti di una struttura a bott
Motivo β-α-β
a) Schema del percorso della catena principale
b) Diagrammi topologici del motivo β-α-β
-Permette il collegamento tra filamenti beta paralleli.
-Consiste di 2 fil beta paralleli, un’alfa elica e due regioni loop.
-L’alfa elica collega l’estremità carbossilica di un filamento beta
con quella aminica del filamento beta successivo
-Il loop che collega il terminale carbossilico del filamento
beta con quello aminico dell’alfa elica spesso è implicato nella
formazione del sito funzionale
Motivo β-α-β
a) Modalità di collegamento destrorsa
b) Collegamento di tipo sinistrorso
,
In linea di principio questo motivo può presentare due diverse disposizioni:
una in cui l’elica si trova al di sopra del piano della pagina (“connessione
destrorsa” perché presenta il medesimo orientamento di una alfa elica
destrorsa); ed una in cui l’elica si trova al di sotto del piano della pagina
(sinistrorsa).
In realtà la connessione è sempre destrorsa, con l’unica eccezione della
subtilisina.
I DOMINI
Strutture alfa  elica superavvolta
fascio a 4 eliche
ripiegamento della globina
Strutture alfa-beta 
TIM barrel
foglietto alfa- beta aperto
ferro di cavallo
Strutture beta
antiparallele  Beta barrel  greca
Up-and-down
Jelly roll
Strutture beta
parallele 
Elica beta a 2 foglietti
Elica beta a 3 foglietti
Il dominio è
• unità compatta e semi-independente
(Richardson, 1981).
• unità stabile di una proteina che può
ripiegarsi autonomamente (Wetlaufer,
ti1973).
• modulo funzionale ed evoluzionistico
ricorrente (Bork, 1992)
icazione dei domini è essenziale:
• I domini hanno dimensioni variabili. Circa il 50% delle proteine
studiate hanno domini compresi fra 51 e 150 amminoacidi. Sono note
proteine con molti domini (13) e le interazioni interdominio sono le
stesse che stabilizzano le loro strutture interne.
• i cuori idrofobici sono fondamentali per la stabilità dei domini (nelle
sezioni proteiche i residui idrofobici sono in giallo)
lisozima da Gallus
gallus pdb: 1hel
esochinasi da Homo sapiens pdb:
Non tutti i domini sono costituiti da tratti continui di
polipeptide. In alcune proteine un dominio è interrotto da un
tratto di sequenza che si ripiega in un dominio separato,
dopo il quale continua il dominio originale.
alanina racemasi da Bacillus stearothermophilus
pdb: 1sft
Le proteine multidominio si sono probabilmente evolute dalla
fusione dei geni che un tempo codificavano per proteine separate.
tioesterasi da E. coli (pdb:
1c8u)
2 domini
fusi
tioestere deidratasi da E.
coli (pdb: 1mkb)
omodimero con ciascun
monomero simile ai domini
della tioesterasi
Il numero dei fold (motivi strutturali) proteici è vasto
ma limitato.
triptofano sintasi da
Salmonella typhimurium
α-galattosidasi da
Homo sapiens
Elica superavvolta
Struttura ad elica superavvolta.
Un’alfa elica isolata presenta una ridotta stabilità in soluzione.
Perciò, nelle proteine, le alfa eliche sono stabilizzate dal reciproco
impaccamento mediato dall’interazione delle catene idrofobe.
Il modo più semplice di realizzare tale stabilizzazione è quello di
associare 2 alfa-eliche, in modo da formare una struttura superavvolta.
Una strutura superavvolta sinistrorsa formata da 2 alfa eliche destrorse
riduce il numero di residui per giro in ognuna delle eliche costitutive da
3,6 a 3,5, in modo che le interazioni tra le catene laterali delle 2 eliche
vengono a ripetersi ogni 7 residui. Ciò si riflette nelle sequenze
aminoacidiche delle due catene, le quali risultano ripetitive,
con un periodo di ripetitività di 7 residui.
Elica superavvolta
I residui aminoacidici nell’unità ripetitiva vengono indicati
come “a-g” ed il residuo “d” è idrofobo (di solito è una leucina).
La regione idrofoba tra le due alfa eliche è completata
dai residui “a” che sono idrofobi anch’essi.
Ripetitività degli aa in un’alfa elica
superavvolta:
un residuo di leucina si ripete ogni 7
aminoacidi
Impaccamento delle
catene laterali idrofobe tra 2
alfa-eliche in una struttura
Ruolo delle interazioni elettrostatiche
a) Visione schematica dall’alto di una ripetizione di sette aa.
b) Visione schematica laterale di una struttura superavvolta
I residui “e” e “g” che orlano il
core idrofobo sono carichi e le loro
catene forniscono interazioni ioniche (ponti salini) tra le α eliche.
Fascio a 4 eliche
-Due alfa eliche impaccate insieme in una struttura
superavvolta sono elementi costitutivi di un dominio ma
non sono sufficienti a formare un dominio completo.
-Infatti, il dominio ad alfa elica più semplice consiste
in 4 alfa eliche disposte in un fascio con l’asse di ognuna
parallelo a quelli delle altre.
-Le alfa eliche sono disposte in modo tale che le eliche
consecutive nella sequenza aminoacidica vengono ad
essere adiacenti.
Dispiegamento della catena
polipeptidica
in un dominio costituito da
un fascio di 4 eliche
Fascio a 4 eliche
Proiezione del motivo su un piano
perpendicolare all’asse del fascio
Le catene laterali di ciascuna elica sono disposte in modo tale
che le catene laterali idrofobe si trovano comprese nello spazio
tra le eliche, mentre le catene laterali idrofile vengono a trovarsi alla
superficie del fascio. In questo modo, nella parte centrale del fascio
viene a formarsi un core idrofobo in cui le catene laterali si trovano
ammassate così fittamente da escludere la presenza di molecole d’acqua.
Cerchi grandi catena principale delle alfa–eliche
Cerchi piccoli catene laterali: verdi (catene laterali idrofobe ammassate);
rosse (cat lat idrofile che si trovano esposte alla superficie del fascio)
Fasci a 4 eliche come singolo dominio di proteine
monomeriche, o come motivo di dimerizzazione
Il Ripiegamento della globina
Fascio di 8 eliche
Collegate da brevi loop
Formazione di una tasca
idrofobica in cui si trova
il sito attivo
Strutture a dominio alfa-beta
(foglietto β centrale di tipo parallelo o misto circondato da α eliche)
Modalità di connessione β-α-β
Le tre strutture alfa-beta sono tutte costituite da motivi β-α-β
collegati tra loro in modo che i filamenti β vengono ad essere paralleli.
2 motivi β-α-β si possono collegare in 2 diversi modi:
a) le alfa eliche si trovano tutte sul medesimo piano del foglietto
(TIM barrel e ferro di cavallo);
b) le alfa eliche si trovano sul piano opposto (foglietti beta aperti)
TIM Barrel
Gli 8 filamenti beta racchiudono
un core idrofobo impaccato
costituito dalle catene laterali dei
residui presenti in filamenti beta
alternati.
Il core è disposto a formare tre
strati, dove ogni strato contiene
4 catene laterali provenienti dai
residui presenti in filamenti beta
alternati.
Struttura formata da 8 filamenti beta paralleli
Filamento 8 forma legami idrogeno col filamento1
Per formarla sono necessari almeno 200 aa
Presente in molti enzimi
Filamenti beta ed alfa eliche  impalcatua strutturale
Regioni loop  siti attivi
–
Rappresentazione vista dall’altodella strutturaa botte del
sito attivo dell’enzima RuBisCo.
Il sito di legame per il substrato (in rosso)
è generato da numerose catene laterali
cariche (in blu) presenti su differenti loop.
Nel TIM barrel il sito attivo si trova
in una tasca formata dalle regioni loop
che collegano le estremità carbossiliche
dei filamenti β con le adiacenti α-eliche.
La Piruvato chinasi
contiene diversi domini, uno dei quali con
struttura TIM barrel
• La struttura di questo enzima
illustra perfettamente in che
modo una lunga catena
polipeptidica può ripiegarsi a
formare domini di tipo
diverso dal punto di vista
strutturale.
• La funzione enzimatica
risulta sempre associata con
il dominio che presenta
struttura a botte.
Il foglietto alfa-beta aperto
Nei domini con struttura α/β aperta, il sito attivo si trova in una fessura
localizzata esternamente all’estremità carbossilica dei filamenti β.
Questa fessura è formata da 2 regioni loop adiacenti che collegano
i due filamenti con α eliche presenti su facce opposte del foglietto β.
Ciò è illustrato dalle dita curvate delle due mani, in cui la metà superiore
delle dita rappresenta le regioni loop mentre la metà inferiore
rappresenta i filamenti β. Il cilindro rappresenta un ligando posizionato
nella fessura di legame.
Esempi di tipi diversi di strutture α/β aperta
flavodossina e adenilato chinasi
esochinasi e fosfoglicerato mutasi
Ripiegamento a Ferro di cavallo
Struttura dell’inibitore della ribonucleasi, Ruolo dei residui conservati di leucina dei
costituita da motivi β-loop-α ripetuti,
motivi ricchi di leucina nella
ricorda un ferro di cavallo formato
stabilizzazione del modulo strutturale
all’interno da un foglietto β parallelo a
β-loop- α
17 filamenti e all’esterno da 16 α eliche.
Il beta Barrel
• Comprende enzimi, proteine di trasporto, anticorpi,
proteine virali di rivestimento.
• Core: costituito da filamenti β (da 4-5 a più di 10),
disposti in modo antiparallelo a formare 2 foglietti β
collegati ed impaccati l’uno con l’altro.
• Le strutture β antiparallele presentano un core di
catene laterali idrofobe all’interno di una struttura a
botte, formato dalle catene laterali dei residui
presenti nei filamenti β , mentre la superficie è
costituita da residui provenienti sia dai filamenti β
che da regioni loop
β
La maggior parte delle strutture
rientra in pochi
gruppi con topologia uguale o simile
motivi a greca
up and down
Ogni filamento β è
collegato al successivo
attraverso una breve
regione loop
Quando in una struttura a
β barrel a 8 filamenti,
il numero n è collegato
al filamento n+3
jelly roll
La catena polipeptidica
si avviluppa attorno ad
un’ideale struttura a
botte centrale come un
dolce arrotolato coperto
di gelatina
Un esempio di struttura a β-barrel
greca: la SOD
8 filamenti β antiparalleli disposti attorno alla superficie di una botte ideale.
La struttura, a " β -barrel" , evidenzia un motivo topologico a “greca”,
comune a molti sistemi biologici di grande interesse, tra cui, ad esempio,
le immunoglobuline.
RBP lega il retinolo all’interno di una
struttura a botte up and down
8 filamenti β antiparalleli ruotati e ripiegati
in modo che la struttura può anche essere vista
come 2 foglietti β (verde e blu) impaccati
l’uno contro l’altro.
Alcuni dei filamenti β ruoati (in rosso)
partecipano alla formazione
di entrambi i foglietti β.
La vitamina A si trova legata all’interno
della struttura a botte tra i 2 foglietti β,
in modo da esporre alla superficie della proteina
l’unica porzione idrofila della molecola
(coda contenente un gruppo OH)
La neuraminidasi si ripiega a
formare foglietti beta up and down
Presente nel virus dell’influenza
Catalizza idrolisi dell’acido sialico
Omotetramero costituito da
4 catene polipeptidiche identiche,
ognuna di 470 aa
Ogni monomero è ripiegato a formare
una superstruttura a botte
costituita da 24 filamenti β
disposti a formare 6 motivi strutturali
simili, ognuno dei quali contiene 4
filamenti β che rappresentano le pale
della struttura a forma di elica
Nella neuraminidasi i motivi strutturali generati col
ripiegamento formano una superstruttura a forma di
elica
Tetramero:
4 domini ognuno
con struttura ad
elica a 6 pale
Monomero:
(Dominio:elica a 6 pale)
Topologia del
monomero
Motivo:
(foglietto β:pala dell’elica)
Ognuna delle 4 subunità del tetramero è ripiegata
a formare un singolo dominio costituito da 6 motivi
strutturali simili strettamente impaccati.
Tale motivo strutturale è un foglietto β a 4 filamenti
antiparalleli up-and-down.
Questi 6 foglietti β sono disposti in modo da formare
le sei lame di un’elica a 6 pale
La regione strutturale e la regione del sito
attivo risultano ben separate.
In conseguenza della simmetria
senaria dei 6 motivi strutturali
a foglietti β, le 12 regioni loop
derivate dai foglietti si trovano
dalla stessa parte della molecola
Le regioni loop che collegano i
motivi strutturali formano
un’ampia tasca ad imbuto
contenente il sito attivo
I filamenti beta rappresentano lo scheletro
strutturale sul quale è incernierato il sito attivo
costituito da loop di connessione tra un elemento
e un altro elemento
L’emoagglutinina si ripiega a formare un
motivo strutturale a jelly roll
Formata da 3 subunità, ognuna delle quali è
ancorata alla membrana pericapsidica del
virus dell’influenza. Le teste globulari
contengono i siti per i recettori che legano
i residui di acido sialico presenti alla
superficie delle cellule eucariotiche
Singola subunità
dell’emoagglutinina
del virus
dell’influenza
Il sito di legame per il recettore è
formato dal dominio jelly roll
La testa globulare di ogni subunità
dell’emoagglutinina
ha una struttura a botte jelly roll distorta.
Il sito di legame è localizzato all’apice della
subunità, all’interno della struttura a botte jelly roll.
Domini ad eliche β parallele
• Scoperta nel 1993 in California
• Presente in molte proteasi batteriche
extracellulari e nella proteina della coda del
batteriofago P22
• La catena polipeptidica risulta ripiegata a
formare un ampio superavvolgimento ad elica
formato da filamenti β separati da regioni
loop
• I filamenti β si allineano a formare 2 o 3
foglietti β paralleli che racchiudono un core
riempito dagli atomi delle catene laterali.
Eliche beta parallele a 2 foglietti
Elica β a 2 foglietti dove
sono mostrati 3
superavvolgimenti
completi dell’elica.
- Ogni unità strutturale è costituita da 18 residui
che formano una struttura β-loop-β.
- Ogni regione loop contiene sei residui di sequenza
Gly-Gly-X-Gly-X-Asp-H-U-X dove U è un
aminoacido con catena ingombrante e idrofobica,
spesso una leucina.
-Ioni calcio sono legati ad entrambe le regioni loop,
stabilizzandole.
Eliche beta parallele a 3 foglietti
- 2 dei foglietti β sono paralleli
l’un l’altro e perpendicolari al terzo.
-Ogni giro dell’elica contiene 3 brevi
filamenti β ognuno di 3-5 residui
collegati da 3 regioni loop.
-Uno dei loop è sempre costiuito solo
da 2 residui, mentre gli altri 2 sono
più lunghi e variano in dimensioni.
-Quindi l’elica β comprende
comprende 3 foglietti
β paralleli grossolanamente disposti
come le tre facce di un prisma
Struttura della pectato liasi C
CATH
http://www.biochem.ucl.ac.uk/bsm/cath
• Banca Dati secondaria (viene fatta prima
un’analisi, una selezione ed infine viene
eseguito l’immagazzinamento dei dati)
• Classificazione delle proteine in base a
similarità di sequenza e strutturali
•La funzione non è presa in considerazione
in questa banca dati
Livelli di classificazione
• Class (α, β, mixed α-β, low 2ndry structure
content)
• Architecture: stesso arrangiamento spaziale
tra le strutture secondarie, ma connessioni
diverse
• Topology: stesso fold
• Homologous superfamily: proteine con
probabile ancestore comune
• Sequence Family: proteine con identità di
sequenza (id >= 35%) e funzionalità
CLASS (C-level)
• Assegnata in modo automatico
• Class : secondary structure composition and contacts
– Class1 : Mainly Alpha
– Class2 : Mainly Beta
– Class3 : Mixed Alpha- Beta
– Class4 : Few Secondary Structures
Class1
Class2
Class3
Class4
Architecture (A-level)
-forma generale del dominio
-descrizione dell’arrangiamento della struttura secondaria
indipendentemente dalle connessioni
- Effettuata manualmente
Topology (T-level)
Proteine che hanno la stessa topologia
hanno fold simile e core abbastanza
conservato, e quindi hanno strutture
che sono simili ma con funzioni diverse.
prende in considerazione le connessioni tra elementi di struttura secondaria,
ovvero le connessioni tra motivi strutturali
Homologous superfamily (H-level)
Raggruppa insieme proteine che si pensa abbiano un ancestore comune e che
quindi sono omologhe. In questo modo vengono definiti dei gruppi di
superfamiglie omologhe.
Metodi di classificazione
-avviene in maniera gerarchica, così che ogni proteina è riconosciuta
attraverso un numero.
-es: 1.10.490.20 vuol dire che la proteina appartiene alla Classe 1,
Architettura 10, Topologia 490 e Homologia 20.
-ad ogni numero corrisponde una ed una sola proteina
Criteri di classificazione
Step 1 : si selezionano serie di strutture su PDB
(risolte per diffrazione o NMR a risoluzione di almeno
3.0 Å)
Step 2: Comparazione di sequenze: proteine con
identità di sequenza >35% vengono messe a livello S
Step 3: dividere proteine in domini per poi analizzarle
singolarmente. L’assegnamento della classe è
automatico perché utilizza una procedura che esamina
la composizione della struttura secondaria
analizzando il valore degli angoli Φ e ψ .
Step 4: Comparazione di struttura per definire H e T
in maniera automatica utilizzando il programma SSAP
SSAP
(Sequence Structure Alignement Program)
• Programma di comparazione strutturale
• Compara distanze tra residui in modo sequenziale.
• Il parametro utilizzato per la classificazione è il
numero S che è proporzionale all’ ’inverso della
sommatoria di queste differenze. Tanto è più piccola
questa differenza tanto più saranno simili le strutture
e tanto più S sarà grande. Se S è uguale a 100 le
strutture sono completamente identiche.
• La soglia è S=70 per il livello T, e di S= 80 per il
livello H. Quindi tra 70 e 80 la proteina viene
classificata nel livello T o da 80 in su viene
classificata nel livello H.
Modalità di Ricerca
• Codice PDB
• Codice CATH
• Parole chiave
• Accesso tramite link da altri database
(es. PDB)