Fondamenti di biologia in silico

Fondamenti di biologia in silico
Davide Cittaro
master in bioinformatica 2003
Il metabolismo è la collezione di interconversioni di specie chimiche effettuate da un
organismo vivente. Esso è la somma di diverse migliaia di reazioni catalizzate da enzimi.
Questo insieme di reazioni forma una rete altamente interconnessa, con una cinetica
generale non lineare con le concentrazioni degli intermedi metabolici, è difficilmente
modellabile.
I biochimici conoscono i più importanti pathways metabolici, e hanno sudiato gli enzimi
e i loro geni in dettaglio. Il loro scopo è capire il comportamento del metabolismo nel
suo insieme in termini di proprietà dei diversi enzimi. Una volta compreso questo, ci si
auspica di poter agire in maniera mirata, ad esempio, su una via per aumentare la
produzione di determinato metabolita, o di poter intervenire farmacologicamente su una
via metabolica per deprimerla.
Il controllo di un flusso metabolico è un problema asimmetrico: si può facilmente ridurre
un flusso inibendo l'attività di un enzima od eliminandolo, ma dall'altra parte è difficile
aumentare il flusso verso un prodotto specifico. L'approccio è stato reso più difficile dalla
credenza diffusa nell'esistenza di un unico rate-limiting step in ciascuna via metabolica.
L'idea che non esista un rate-limiting step non è nuova, già nel 1964 Stephen Waley
mostrò che la resa di una sequenza di enzimi non saturati (enzimi per cui la
concentrazione di metaboliti è sotto la relativa Km) dipende non linearmente dai parametri
cinetici di tutti gli enzimi1.
Per definizione il rate-limiting step è il punto a minore velocità in un pathway anche se è
facile accorgersi che in condizioni di stato stazionario tutti i punti lungo un pathway
lineare procedono alla stessa velocità. In più se un rate-limiting step esiste allora variare
l'attività del relativo enzima dovrebbe cambiere il flusso nel pathway, e variare qualunque
altra attività non avrebbe alcun effetto. Ciononostante ci sono evidenze di numerosi
pathway in cui il flusso è influenzato dall'attività di molti punti. Se il controllo è diffuso
su un numero di punti, come si possono allora comparare i contributi relativi?
L'analisi del controllo del metabolismo (MCA) definisce la relazione quantitativa tra il
flusso in una via e l'attività di un enzima in termini di coefficiente di controllo di flusso.
La differenza fondamentale tra il concetto di rate-limiting step e MCA è evidente se
consideriamo la domanda che ci poniamo riguardo alla relazione tra il flusso metabolico
e l'attività di un particolare enzima. Nel primo caso ci chiediamo se un enzima sia il ratelimiting step e la risposta può solo essere 'si' o 'no'. Nel secondo caso ci chiediamo come
cambia il flusso al variare dell'attività di un enzima. Questo comporta una più dettagliata
risposta e permette una gamma di possibilità tra la nulla e la totale dipendenza.
Immaginiamo un pathway generico in cui un prodotto X0 è trasformato da una catena
metabolica in X1:
xase
X0
ydh
S1
Jxase
...Y
S6...
X1
Jydh
e si consideri un piccolo cambiamento, δExase, della quantità dell'enzima Exase, e che
1 Waley SG, 1964. A note on the kinetics of multi-enzyme systems. Biochem J. 91(3):514-517
questo produca un piccolo cambiamento, δJydh, nel flusso J del pathway allo stato
stazionario, misurato al punto catalizzato dall'enzima ydh. Il coefficiente di controllo del
flusso C è:
C
J ydh E xase
J ydh
E xase
J ydh
xase
(1)
per δExase e δJydh tendenti a zero, cioè
C
J ydh
xase
ln J ydh
(2)
ln E xase
ed è pari alla pendenza della tangente alla curva in fig. 1.
Il valore di questo coefficiente può variare tra 0 e 1. Un valore di 1 corrisponde ad una
relazione di proporzionalità tra il flusso e la quantità di enzima. E' possibile l'esistenza di
coefficienti negativi. Per esempio, in un pathway ramificato, in cui un metabolita può
seguire due differenti cammini, un aumento nell'attività di un enzima di un ramo
aumenterebbe il flusso lungo quel ramo e conseguentemente diminuirebbe la quantità di
metabolita disponibile per seguire l'altro ramo.
ln J ydh C Jydh
xase
ln E xase
Figura 1 - In un grafico bilogaritmico, il
coefficiente di controllo di flusso è la pendenza
della tangente alla curva nel punto di interesse.
Le evidenze sperimentali che derivano dalla genetica dei diploidi inducono a pensare che
i coefficienti di flusso siano generalmente piccoli. In primo luogo si consideri che gli
organismi diploidi hanno due copie funzionanti di ogni enzima per ciascuna cellula e che
la quantità di enzima e solitamente proporzionale alla dose genica. Si consideri poi che la
maggioranza delle mutazioni che codificano per proteine inattive sono recessive, e questo
comporta un fenotipo normale per gli eterozigoti. Dal momento che gli enzimi
influenzano il fenotipo attraverso la loro azione e in definitiva attraverso il flusso nei
pathways metabolici, l'osservazione che il wild-type è dominante significa che non vi
sono cambiamenti evidenti nel flusso nell'eterozigote, anche se contiente solo metà
dell'enzima presente nell'omozigote wild-type. Questo è possibile solo se il coefficiente di
controllo del flusso è molto minore di 1, prossimo a zero. Dal momento che è così
comune avere mutazioni recessive, l'implicazione è che la maggior parte degli enzimi
hanno un coefficiente di controllo di flusso piccolo.
Se il valore del coefficiente è noto, si possono fare predizioni approssimate su quanto
cambierà un flusso se si cambia la quantità di enzima. L'equazione (2) integrata da
J
ln J ydh C xase
ydh
(3)
ln E xase
Questo corrisponde alla forma esponenziale:
J aE C
(4)
in cui, per semplicità, si sono omessi gli indici mentre a è una costante di proporzionalità.
Le equazioni (3) e (4) sono approssimazioni della relazione flusso-enzima migliori della
seguente equazione lineare:
J ydh J
C xase
ydh
J ydh
E xase
(5)
E xase
Le equazioni fin ora presentate hanno un limitato potere predittivo per grandi variazioni
nella quantità di enzima. Un migliore predittore è stato proposto nel 1993 e si applica
solo ai casi in cui la relazione flusso-enzima è un'iperbole rettangolare:
J ydh AE xase
B
(6)
E xase
dove A e B sono costanti. Un gran numero di valori determinati sperimentalmente
sembrerebbe rispettare questa relazione in cui è lineare il rapporto tra 1/Jydh e 1/Exase.
Quando questa relazione è vera in un pathway lineare permette il calcolo del coeffifciente
di controllo al livello di enzima E1, attraverso le misure di due valori del flusso Jydh, J1 e
J2, a due livelli molto diversi di enzima Exase, E1 e E2:
C EJ J2 ! J1 E 2
E 2 ! E1 J2
(7)
Con queste equazioni si possono fare previsioni sul flusso in dipendenza dalla quantità di
enzima. Si supponga quindi sia possibile aumentare la quantità di enzima r volte: il flusso
del pathway sarà aumentato di un fattore f dato dalla equazione;
1
f"
1#
r# 1 J
CE
r
(8)
Cambiando la quantità di un sigolo enzima, l'effetto sul flusso del pathway sarà piuttosto
limitato, a meno che il coefficiente non sia maggiore di 0.5 (fig. 2). Il massimo
cambiamento si può ottenere per valori di r >> 1, per cui la (8) diventa:
f"
1
J
1# CE
(9)
Quindi se CJE = 0.5, il si può avere un aumento del flusso di 2 volte al massimo.
(2$
&0.
34
&0,
576
384 6
6
&1*
_
&0(
[ Z V^\ ]
S YX
0& $
UVWU
SR T
.
,
*
(
$
$
$%'&
$% (
$% )
$% *
$% +
$% ,
$% 9;:=<?> >'@ AB@ <
CBD <FE=@GA0:=CH':JI I :KEL@>MI NPOBOG:Q29
$% .
$% /
&
Figura 2 - La variazione relativa del flusso per grandi aumenti della quantità
di enzma.
Se si considerano tutti gli enzimi che compongono una via metabolica, la somma dei loro
coefficienti di controllo di flusso è pari a 1. Considerata una via metabolica allo stato
stazionario, se aumentiamo la concentrazione di tutti gli enzimi del pathway di un
rapporto α si avrà un pari aumento del tasso con cui ciascuna reazione enzimatica
procede. Di conseguenza il flusso netto da o verso ciascun metabolita sarà invariato. Dal
momento che ciò si applica a tutte le reazioni, ne segue che la concentrazione di tutti i
metaboliti allo stato stazionario rimarrà invariata al termine di questa operazione e che il
cambiamento del flusso allo stato stazionario sarà pure aumentato di un rapporto pari ad
α. Formalmente, se:
dJ `
C 1J acb ... d C Jn ecfhg
J
ii
n
C Ji j
(10)
1
e
dJ
J
kml
(11)
allora deve essere per forza
n
n
i
o
C Ji p 1
(12)
1
in cui i è l'i-esimo enzima degli n che compongono una via metabolica. Questa relazione
è conosciuta come il teorema della somma.
Il teorema della somma mostra che gli enzimi del pathway possono condividere il
controllo del flusso. In un pathway lineare di enzimi con cinetica normale, tutti i
coefficienti sono positivi o nulli e il massimo valore di un coefficiente potrebbe essere 1.
Un enzima con un tale coefficiente sarebbe rate-liminting ed esisterebbe una relazione di
proporzionalità tra l'attività dell'enzima e il flusso nel pahtway.
La (12) dice che la somma è calcolata per i coefficienti di tutti gli enzimi nel sistema
metabolico considerato, implicando potenzialmente la cellula intera. In pratica ci si
aspetta che un flusso sia influenzato principalmente dagli enzimi di quel pathway, e forse
solo da alcuni altri connessi con esso. I coefficienti di controllo di centiania, di migliaia,
di enzimi in una cellula su un singolo flusso saranno nulli, quindi il controllo di ogni
singolo flusso è solo virtualmente condiviso da tutti gli enzimi di una cellula. Un'altra
conseguenza della natura ramificata e interconnessa del metabolismo è che, per un
pathway in particolare, ci sono altri pathway che possono sottrarre reagenti o energia da
esso causando la diminuzione del flusso, in questo senso quegli enzimi hanno un
coefficiente di controllo negativo sul pathway che stiamo considerando.
Il teorema della somma mostra che i coefficienti di controllo di flusso di un enzima sono
una proprietà sistemica. Dal momento che i coefficienti diminuiscono all'aumentare della
quantità di un enzima, il teorema della somma fa si che i coefficienti di un altro enzima
aumentino fino a che la sommatoria sia nuovamente pari a 1. I coefficienti di controllo di
flusso, quindi, non sono una proprietà degli enzimi stessi ma del sistema intero. Di
conseguenza i valori dei coefficienti non possono essere determinati considerando le
proprietà degli enzimi isolati e in più bisogna considerare che i valori possono
ridistribuirsi tra gli enzimi a seconda delle circostanze.
Come si possono applicare i presupposti teorici fin qui spiegati? Aumentare tutti gli
enzimi in un sistema metabolico della medesima quantità causerà un pari aumento del
flusso. Tuttavia questo non comporta un aumento dell'efficienza di conversione dal
momento che bisognerebbe sintetizzare un pari aumento di biomassa. Se un gruppo di
enzimi sono sovraespressi insieme, allora l'aumento di flusso sarà, nella migliore ipotesi,
pari alla equazione (8) per la somma dei coefficienti degli enzimi del gruppo. Un
migliore risultato può essere ottenuto sovraesprimendo gli enzimi con coefficienti di
controllo significativamente elevati.
Pianificare i cambiamenti necessari dipende dall'analisi dei profili di flusso in un
organismo e dal calcolo di quanto debbano cambiare per supportare l'aumento di flusso
nel prodotto voluto. Nel progettare il cambiamento non si può non tenere conto che il
controllo accurato dei livelli di sovraespressione di un gran numero di geni va oltre le
odierne conoscenze di biologia molecolare. Ciononostante alcuni esperimenti a questo
riguardo si sono dimostrati interessanti e convincenti. Per esempio un ceppo di lievito,
ingegnerizzato per la sovra-espressione di cinque geni della via del triptofano di un
fattore 23, possedeva un flusso verso il triptofano aumentato di 9 volte (Niederberger et
al., 19922). La sovra-espressione di almeno quattro dei geni è necessaria per ottenere un
significativo aumento del flusso.
Un altro sistema per ottenere aumenti del flusso lungo una via metabolica potrebbe essere
di cambiare la struttura del controllo di un pathway. Abolire l'inibizione da feedback su
un enzima all'inizio di una via dovrebbe, in teoria, aumentare il coefficiente di controllo
di flusso di quell'enzima. Secondo la MCA, infatti, in una via metabolica
S0
S1
S2
v1
v2
S3
v3
in cui il metabolita S2 esercita un feedback negativo sulla reazione 1 con velocità di
reazione v1, si ha che
C
q
J
1
t
u
v2
S1
v3
S2
vxw
v1
S1
y
r
v2 s v3
S1 S2
v3 zx{ v1
S2
S1
|
v2
S2
}x~
v2
S1

v1
S2
(13)
mentre senza inibizione il coefficiente di controllo dello stesso enzima sarebbe:
C
J
1
€
in cui
ƒ
v2
S1
‹
„
vi
Sj

v3
S2
…x†
v2
S1
v1
S1
‡
‚
v3
S2
v3
S2
ˆx‰
v1
S1
Š
(14)
v2
S2
è l'elasiticità3 della i-esima reazione rispetto alla variazione del j-esimo
2 Niederberger P et al.,1992. A strategy for increasing an in vivo flux by genetic manipulation: the
tryptophan system of yeast. Biochem. J. 287: 473-479
3 l'elasiticità, definita come
Œ
vi
Sj
Ž

vi
Sj
S j ‘ vi
misura quanto un tasso di reazione vi sia responsivo ad
un cambiamento di un qualunque modificatore Sj, dove per modificatore si intende un qualsiasi
substrato.
In alcuni casi, effettivamente, la distruzione dell'inibizione è servita a creare
microorganismi per la produzione industriale di aminoacidi; tuttavia non è un
procedimento generalizzabile e simulazioni al calcolatore suggeriscono che il principale
effetto dell'abolizione dell'inibizione sia l'aumento degli intermedi metabolici piuttosto
che dei flussi. Le stesse considerazioni possono essere riferite ad enzimi sottoposti a
regolazione allosterica.
Quando l'aumento dell'attività di un enzima è elevato, ad esempio dopo un intervento di
modificazione genetica su una via metabolica, la MCA non è precisa dal momento che le
variazioni nelle quantità enzimatiche non si possono considerare infinitesimali e quindi
non valgono le relazioni da cui si ricavano i coefficienti di controllo di flusso. In questi
casi si ricorre ad una estensione della MCA detta analisi dei cambiamenti finiti (Finite
Change Analysis). La quantità centrale di questo tipo di analisi è l'indice di deviazione
D VEj che definisce l'effetto sulla variabile V di un cambiamento di r volte nell'attività di
un enzima Ej:
D
V
Ej
’”“
•
r
V Ej
Ej – Vr
™
(15)
š
dove — E j ˜ E j E j E j r › 1 e œ V  V r ž V 0 . V tipicamente è un flusso o
una concentrazione di un metabolita. L'indice di deviazione è analogo al coefficiente di
controllo di flusso della MCA classica, eccetto per il fatto che è scalato al nuovo valore
dopo la variazione e non all'originale. Gli indici di deviazione hanno un certo numero di
proprietà utili, se sono verificate alcune condizioni di comportamento delle vie
metaboliche. Se il comportamento di ciascuna reazione di un pathway è lineare rispetto ai
substrati ed ai prodotti, non vi è un significativo cambiamento nei livelli di saturazione di
ciascuno step durante i cambiamenti di flusso considerati. Se esistono queste premesse si
V
può dimostrare che il coefficiente D Ej è indipendente da r. Il corollario è ugualmente
V
utile: se si trova che D Ej dipende da r allora le cinetiche delle reazioni considerate
sono significativamente distanti dalla linearità.
Queste considerazioni sono state utilizzate in alcuni esperimenti di sovraespressione di
una fosfofruttochinasi batterica in tuberi di patata per mostrare che la PFK non controlla
il flusso glicolitico, contrariamente a quanto ritenuto. La PFK, infatti, è un enzima
candidato ad essere rate-limiting poichè si trova all'inizio della via metabolica, è regolato
allostericamente e, nella patata, subisce inibizione da feedback da parte del
fosfoenolpiruvato. Fatte le dovute approssimazioni sperimentali, l'espressione di livelli
crescenti di PFK batterica (e quindi non suscettibile all'inibizione da feedback della
patata) non comporta un aumento del flusso e gli indici di deviazione calcolati sui tassi
respiratori sono piccoli. Si osserva invece un effetto sui metaboliti i cui indici di
deviazione sono generalmente costanti, compatibilmente con le assunzioni fatte per la
Finite Change Analysis4.
r
0
0
parametro che influenza una reazioe (concentrazione di enzima, di metaboliti, pH...).
4 Thomas S et al., 1997. Finite change analysis of glycolytic intermediates in tuber tissue of lines of
transgenic potato (Solanum tuberosum) overexpressing phosphofructokinase. Biochem. J. 322:111-117