Sintesi
Introduzione
Il ciclo cellulare è l'insieme dei processi che permettono ad una cellula di riprodursi, per divisione, in due cellule glie. È controllato da una rete di regolazione
complessa spesso designata dall'espressione: motore del ciclo cellulare (Murray,
1992). Questo macchinario molecolare è formato da componenti che si regolano
a vicenda, e controllano anche, a valle, tutto un ventaglio di processi necessari alla
replicazione della cellula. Tali processi retroagiscono sul motore , formando dei
checkpoints in grado di sospendere la progressione del ciclo per garantire il tempo
necessario al buon svolgimento di ogni tappa.
La sua cruciale importanza in biologia fa del ciclo cellulare un tema prediletto
in una grande quantità di lavori. Tuttavia, a misura che vengono scoperti i meccanismi di controllo del ciclo, essi si dimostrano sempre più complessi e di dicile
comprensione.
I modelli informatici sono un strumento pratico che permette di
gestire questa complessità. Benchè si utilizzino prevalentemente approcci di tipo
quantitativo in questi modelli, specialmente nello studio del ciclo cellulare in cui i
lavori dei gruppi di Béla Novák et John Tyson in particolare hanno permesso importanti progressi (Novák e Tyson, 1993; Ciliberto e Tyson, 2000; Novák e Tyson,
2004; Chen
et al.,
2004; Sveiczer
et al.,
2004; Csikász-Nagy
et al.,
2006), i for-
malismi qualitativi orono un approccio complementare, soprattutto facilitando lo
studio di grandi reti.
La modellizzazione logica è stata applicata con successo a diverse reti di regolazione biologica (Kaufman
Thomas, 1995; Muraille
1998; Mendoza
et al.,
et al.,
et al.,
1999; Espinosa-Soto
2003; Albert e Othmer, 2003; Chaves
et al.,
1985; Kaufman e Thomas, 1987; Thiery e
1996; Mendoza, 2006; Mendoza e Alvarez-Buylla,
et al.,
et al.,
2004; Sánchez e Thiery, 2001,
2006; Chaves e Albert, 2008; Sánchez
2008; Ghysen e Thomas, 2003; Schaub
et al.,
2007). La maggior parte di
queste applicazioni tratta di sistemi decisionali che permettono la selezione di un
destino cellulare specico, il quale a sua volta può essere analizzato in termini di
stati stabili alternativi. Al contrario, nel caso del ciclo cellulare, ciò che importa è
la sequenza precisa delle transizioni, in altre parole l'ordine dei cambiamenti d'attività dei componenti che controllano la progressione del ciclo nei sue varie fasi.
La modellizzazione logica del ciclo è solo agli inizi, ma negli ultimi anni, è stata
sviluppata una serie di modelli logici sempre più sosticati (Huang e Ingber, 2000;
19
20
Li
et al., 2004; Fauré et al., 2006; Davidich e Bornholdt, 2008a,b; Fauré et al., 2009;
Irons, 2009).
Nel corso del mio dottorato, mi sono interessato alla modellizzazione qualitativa
del ciclo cellulare. Ispirato da Novák e Tyson (2004), il modello schematico della
rete mammifera costituisce il mio primo passo in questo campo (Fauré
et al., 2006).
Questo lavoro mi ha portato a proporre un sistema di classi di priorità per facilitare
l'esplorazione del grande attrattore ciclico generato dal modello. Tale sistema si è
rivelato estremamente utile quando mi sono rivolto al ciclo cellulare nel lievito.
Benché la rete di regolazione che controlla il ciclo cellulare sia molto più semplice nel lievito gemmante che nei mammiferi, è anche molto meglio conosciuta. In
questo contesto, il mio lavoro s'ispira ad un modello dierenziale pubblicato dai
gruppi di Béla Novák e John Tyson (Chen
et al., 2004).
Questo lavoro rappresen-
tava allora uno dei tentativi più riusciti di modellizzazione della rete di regolazione
del ciclo cellulare nel lievito, tuttavia estendere la sua portata a moduli di controllo supplementari sembrava dicile.
Un approccio modulare era necessario, ed il
quadro logico sembrava lo strumento ideale per attuarlo.
Il modello che ho sviluppato, basandomi sul modello di Chen, riproduce qualitativamente i principali risultati del modello originale. Inoltre ho potuto trasporre nel
formalismo logico il modello del checkpoint della morfogenesi publicato da Ciliberto
et al.
(2003), come pure il modello del controllo dell'uscita dalla mitosi pubblica-
to da Queralt
et al.
(2006), ed accoppiarli al modello centrale del ciclo cellulare.
Sebbene un metodo formale d'accoppiamento di modelli resti ancora da denire,
questi risultati mostrano che un approccio modulare è possibile nel formalismo
logico (Fauré
et al., 2009).
Inne gli sviluppi metodologici legati al mio lavoro sul ciclo cellulare sono stati
implementati nel software GINsim (Naldi
et al., 2009).
Risultati
Analisi dinamica di un modello generico del controllo del ciclo
cellulare nei mammiferi
Quando abbiamo deciso, durante il mio stage di master in 2005, di applicare il
formalismo logico allo sviluppo di un modello del ciclo cellulare, abbiamo realizzato
che non disponevamo degli strumenti necessari ad analizzare un tale modello. In
eetti, come precedentemente accennato, il formalismo logico, o semplicemente
Booleano, era stato utilizzato principalmente per studiare sistemi decisionali che
permettono la selezione di destini cellulari specici, i quali possono essere analizzati
in termini di stati stabili. Il modello Booleano del ciclo cellulare proposto da Huang
e Ingber (2000) costituisce un'eccezione notevole. Tuttavia, esso è relativamente
piccolo ed è studiato per simulazioni sincrone. Quest'approcio semplica in gran
parte le traiettorie, in quanto ogni stato non possiede più di un successore. Anche
modelli Booleani più recenti (Li
et al.,
2004; Davidich e Bornholdt, 2008b) sono
basati su questo approcio : poche variabili, aggiornamento sincrono.
Al contrario, noi ci siamo interessati ad un sistema oscillante relativamente ben
documentato e abbastanza grande: il macchinario di controllo del ciclo cellulare.
21
Lo studio dell'attrattore complesso, la cui generazione non è esclusa in tale rete,
era problematico considerando gli strumenti di cui disponevamo all'epoca. GINsim
oriva già la possibilità di studiare porzioni limitate del grafo delle transizioni di
stato asincrono (Gonzalez
et al.,
2006), permettendo così all'utilizzatore di con-
centrarsi sulle porzioni più rilevanti della dinamica; tuttavia, il sistema di priorità
che abbiamo proposto (Fauré
et al.,
2006) è stato sviluppato specicamente per
superare questa dicoltà.
Il modello che abbiamo scelto per mettere a punto il nostro approccio al ciclo
cellulare è la rete di regolazione nei mammiferi, come descritto da Novák e Tyson
(2004). Si tratta di un modello schematico, basato su un'astrazione delle famiglie
di proteine che compongono la rete reale. Un altro modello, molto più dettagliato e
basato sul ciclo cellulare del lievito gemmante, è stato pubblicato quasi nello stesso
periodo (Chen
et al.,
2004), ma era troppo complesso e rappresentava una sda
troppo grande per un primo tentativo. Al contrario, sucientemente dettagliato da
poter essere considerato interessante, il modello sui mammiferi era anche piccolo
a sucienza anché il suo adattamento Booleano potesse essere studiato sotto
l'ipotesi di aggiornamento asincrono completo.
Questo modello raccoglie gli attori principali del modello originale: le quattro
cicline (D, E, A e B), l'inibitore dei cdk p27Kip1, il fattore di trascrizione E2F ed
il suo inibittore Rb, come pure gli attivattori dell'APC Cdc20 e Cdh1. L'eetto
dei fattori di crescita è rappresentato dall'attivazione della ciclina D. Un aspetto
originale di questo modello risiede nella rappresentazione implicita dei complessi
molecolari: così, un complesso è considerato formato quando sono presenti tutti
i suoi componenti.
La principale modica riguarda l'introduzione della proteina
UbcH10, recentemente scoperta da (Rape e Kirschner, 2004), allo scopo di tener
conto del fatto che la ciclina A è un bersaglio di Cdh1 alla ne della mitosi ed
all'inizio della fase G1, ma non alla ne di G1, permettendo così alla ciclina di
accumularsi e di inattivare Cdh1.
Il risultato della simulazione di questo modello è un attrattore ciclico, che corrisponde ai dati biologici.
Abbiamo anche potuto riprodurre il comportamento
di alcuni mutanti, nonostante la scelta di attenerci ad una rappresentazione rigorosamente Booleana. Il passaggio al multilivello dovrebbe permettere di anare
il modello.
Modellizzazione logica modulare del ciclo cellulare nel lievito
gemmante
I lieviti, ed in particolare il lievito gemmante, sono da tempo organismi modelli
di riferimento per lo studio dei meccanismi di controllo del ciclo cellulare.
Sac-
charomyces cerevisiae è un organismo unicellulare semplice, usato da tempo immemorabile per la fabbricazione della birra e la panicazione di qui il suo nome
comune di lievito di birra o lievito da fornaio. Contrariamente alla rete di regolazione che controlla il ciclo cellulare nei mammiferi, poco conosciuto rispetto alla
sua complessità, la rete del ciclo cellulare del lievito gemmante è stato oggetto di
studi intensivi. Nel corso degli anni 1970, sono stati realizzati importanti schermi
genetici, facilitati dalla possibilità di allevare stirpi aploidi, cosa che permette di
22
evitare la trappola delle mutazioni recessive. Molti regolatori chiave della divisione
cellulare sono stati scoperti in questo contesto (Simchen, 1978). Di conseguenza,
il ciclo cellulare del lievito costituisce anche un sistema di scelta per sviluppare
o testare metodi informatici dedicati alla modellizzazione delle reti di regolazione
biologiche.
Diversi modelli pubblicati dai gruppi di Béla Novák e John Tyson trattano di
quest'organismo. In particolare, un modello pubblicato da Chen
et al. (2004) costi-
tuisce uno degli approcci più dettagliati di modellizzazione della rete di regolazione
del ciclo cellulare nel lievito. Altri articoli dedicati a moduli di controllo specici,
come il checkpoint della morfogenesi Ciliberto
MEN Queralt
et al.,
et al.,
2003, oppure le reti FEAR e
2006, sono stati pubblicati dagli stessi gruppi. La possibilità
di accorpare il modulo del checkpoint della morfogenesi al modello centrale era già
stata dibattuta in (Chen
et al., 2004); ciononostante, gli autori informavano che il
compito non sarebbe stato semplice e nessun modello è stato ancora pubblicato.
Tuttavia, in un articolo recente, Randhawa
et al. (2008) hanno annunciato che l'ac-
coppiamento dei due moduli era stato realizzato con successo e sarebbe sul punto
di essere pubblicato. Quando abbiamo iniziato questo progetto, la prospettiva di
un modello accoppiato, che raccogliesse insieme il modello centrale, il checkpoint
della morfogenesi e le reti FEAR e MEN, sembrava ancora lontana.
Lo sviluppo di ambienti di modellizzazione permettenti la denizione e l'analisi
di reti di regolazione vaste e complesse è una vera sda. Benché la pertinenza di
una tale strategia sia riconosciuta (Hartwell
et al., 1999; Snoep et al., 2006), questo
tipo di ambiente resta da denire. Una strategia promettente per arontare questa
questione si fonda su un approccio modulare alle reti di regolazione, il quale permette l'identicazione di moduli funzionali che possono essere modellizzati e analizzati
separatamente. Poi, per ottenere reti più vaste, occorre assemblare sotto-modelli.
In quest'ottica, Randhawa
et al.
(2008) presentano uno strumento per guidare il
modellizzatore nel corso del processo di composizione, che usano per ricostruire
il modello generico pubblicato da Tyson e Novak (2001). Nel quadro logico , un
tale approccio modulare è stato adottato per costruire modelli multicellulari basati
sull'interazione tra moduli cellulari che non si sovrappongono (Schaub
Sánchez
et al., 2008).
et al., 2007;
In questo contesto, ci eravamo posti due obbiettivi: per prima cosa ci siamo
proposti di utilizzare il modello di Chen come un test per il nostro approccio di
modellizzazione; in eetti, con le sue 26 variabili e più di 130 mutanti documentati,
questo modello rappresentava una vera sda. Poi volevamo estendere questo modello per renderlo completo e realistico, accoppiando moduli di controllo supplementari
e aggiornando alcune parti del modello con i nuovi dati sperimentali.
La nostra versione logica di questo modello, presentata in Fauré
et al.
(2009),
rende conto con successo, in termini qualitativi, del comportamento di questi numerosi mutanti. A questo modello centrale, abbiamo accorpato il modulo del checkpoint della morfogenesi, adattato da Ciliberto
et al.
(2003) e abbiamo aggiornato
la sotto-rete che controlla l'uscita dalla mitosi con un modulo adattato da Queralt
et al. (2006).
Il modello così costruito raccoglie le caratteristiche principali dei suoi
componenti, compresa la simulazione di più di 150 tipi di perturbazioni.
23
Il metodo di accoppiamento è facilitato dall'utilizzo di espressioni logiche compatte al posto di parametri logici.
Questa possibilità sarà implementata nella
prossima versione pubblica del nostro software GINsim. Prossimamente formalizzaremo il metodo sistematico di composizione e di implementarlo in GINsim.
Modellizzazione logica di reti di regolazione con GINsim 2.3
GINsim (Gene Interaction Network simulation) è uno strumento informatico userfriendly per la modellizzazione e la simulazione di reti di regolazione genetiche
sviluppato nel gruppo del mio direttore di tesi, Denis Thiery. Come tale, GINsim
è stato il mio principale strumento di lavoro nel corso di questo dottorato. Tutti
i modelli presentati in questa sede sono stati sviluppati con GINsim e saranno
disponibili sul nostro sito web (www.gin.univ-mrs.fr).
Da quando è uscito, GINsim è in continua evoluzione (Chaouiya
2004; Gonzalez
et al.,
2006) e quest'articolo (Naldi
et al.,
et al.,
2002,
2009) presenta l'ultima
versione pubblica.
In quanto biologo di formazione, non ho contribuito direttamente allo sviluppo
di GINsim. Tuttavia, il mio lavoro sul ciclo cellulare ha motivato nuovi sviluppi
metodologici, adesso implementati nel software. In particolare, il sistema di priorità
introdotto in (Fauré
et al., 2006) per gestire le dimensioni crescenti del grafo delle
transizioni di stato è stato incluso in GINsim 2.3.
in (Fauré
et al.,
Le funzioni logiche utilizzate
2009), per sostituire con una rappresentazione più pratica i set
di parametri sempre più complessi dei nodi fortemente regolati, sarà presentata in
una prossima versione (sono già disponibile in versione beta sul sito di GINsim).
Naldi
et al.
(2009) si riferisce ad un semplice modello del controllo del ciclo
cellulare derivato da Davidich e Bornholdt (2008b). Questo modello è analizzatto
in dettaglio in una rivista attualmente in corso di presentazione, riprodotta in
allegato (Faur{\'{e}} e Thiery, sottomesso).
Discussione
Il ciclo cellulare è un processo molto complesso, il quale richiede un coordinamento
stretto tra i diversi moduli che controllano le varie tappe della replicazione della cellula. Il macchinario centrale che aziona il ciclo è esso stesso controllato da
un insieme di moduli che servono da dispositivi di controllo di qualità per assicurare l'adabilità della replicazione e la progressione ordinata degli eventi.
Il
ciclo cellulare è anche condizionato da segnali esterni che collegano la cellula al suo
ambiente.
Di fronte a tale complessità, il formalismo logico ore diversi vantaggi. I modelli
logici sono relativamente semplici da denire e non richiedono dati quantitativi.
Come sopra menzionato, sono disponibili vari strumenti per lo studio della dinamica
di modelli logici, in particolare per l'identicazione degli stati stabili e per l'analisi
del ruolo dinamico dei circuiti di regolazione. Nonostante la loro relativa semplicità
e la loro natura qualitativa, i modelli logici possono rendere conto di variazioni
sottili del comportamento originale, come attestato per la simulazione di numerose
perturbazioni in (Fauré
et al., 2009).
24
Inoltre, questo aspetto grossolano può essere un vantaggio quando si tratta di
comparare modelli tra loro. In eetti, se i moduli sono stati deniti dall'evoluzione,
come suggeriscono alcune loni di ricerca (Wagner
et al., 2007), è possibile che al-
cuni schemi d'organizzazione siano conservati o selezionati, come si osserva nel
caso dei motivi di rete (Wolf e Arkin, 2003). Come fanno notare Ingolia e Murray (2004), il fatto che [gli approcci logici] siano ciechi ai meccanismi molecolari
può essere un vantaggio, rivelando similarità formali tra sistemi che implicano tipi
di componenti e d'interazioni molto diversi. Questi autori osservano che sistemi
oscillanti, come il ciclo cellulare, l'orologio circadiano oppure le cellule pacemaker del cuore, mostrano strutture simili basate su circuiti di regolazione negativi
a due componenti, mentre si fondano su meccanismi molecolari molto diversi. Il
formalismo logico facilita l'identicazione di similarità fra sistemi le cui dierenze
a livello molecolare giusticherebbero rappresentazioni diverse in formalismi più
dettagliati.
Il formalismo logico ore proprietà di composizione interessanti, che potrebbero
essere sfruttate per sviluppare strategie di modellizzazione incrementale. La combinazione di modelli dierenziali richiede ancora valutazioni e adeguamenti complessi
di vasti set di parametri cinetici. Ad esempio, il modello descritto da Csikász-Nagy
et al. (2006), presentato in modo modulare, richiede parametri cinetici direttamente
ispirati ad altri modelli di ODE ed è lontano dall'essere esteso e dettagliato quanto questi ultimi. Similmente il promettente approccio formalizzato da (Randhawa
et al.,
2008) è applicato alla ricostruzione ab initio di un modello relativamente
semplice già pubblicato da (Tyson e Novak, 2001). Attualmente il nostro modello
accoppiato è verosimilmente il più esteso modello del ciclo cellulare nel lievito.
Tuttavia i modelli logici non possono generare predizioni realmente quantitative.
È dunque necessario creare connessioni tra gli approcci qualitativi e quantitativi.
Ad esempio, i modelli pubblicati in (Fauré
et al., 2006) e (Fauré et al., 2009) sono
stati costruiti con la trasposizione manuale in ambito logico di modelli dierenziali.
Davidich e Bornholdt (2008a) propongono un metodo di traduzione più formale,
che applicano al modello del ciclo cellulare del lievito a ssione di (Novák
et al.,
2001). In riferimento ad altri applicazioni biologici, diversi software, come SQUAD
(Mendoza e Xenarios, 2006) ed Odefy (Wittmann
et al.,
2008), arrivano persino
ad automatizzare la traduzione di modelli logici in equazioni dierenziali generiche. Parallelamente, modelli dierenziali sono anche stati adattati in un quadro
probabilistico, come le reti di Petri stocastiche (Mura e Csikász-Nagy, 2008).
Al di là della sua applicazione al ciclo cellullare, il mio lavoro ha condotto a
sviluppi metodologici, come la rappresentazione dei complessi multiproteici, il sistema di priorità e l'utilizzo di formule logiche per rappresentare i parametri del
modello, che sono stati implementati, o sono in corso d'implementazione, in GINsim.
Inoltre, il mio lavoro apre interessanti prospettive future per la denizione
di modelli più estesi di reti di regolazione diverse, visto l'organizazzione modulare
sembra una caratteristica ricorrente nei sistemi biologici. Inne, pone anche questioni teoriche sulla natura dei moduli, i ruoli dinamici dei circuiti di regolazione
con la loro conservazione nel corso dell'evoluzione e la robustezza del modello, tre
questioni che potrebbero essere profondamente legate tra loro.