Sintesi Introduzione Il ciclo cellulare è l'insieme dei processi che permettono ad una cellula di riprodursi, per divisione, in due cellule glie. È controllato da una rete di regolazione complessa spesso designata dall'espressione: motore del ciclo cellulare (Murray, 1992). Questo macchinario molecolare è formato da componenti che si regolano a vicenda, e controllano anche, a valle, tutto un ventaglio di processi necessari alla replicazione della cellula. Tali processi retroagiscono sul motore , formando dei checkpoints in grado di sospendere la progressione del ciclo per garantire il tempo necessario al buon svolgimento di ogni tappa. La sua cruciale importanza in biologia fa del ciclo cellulare un tema prediletto in una grande quantità di lavori. Tuttavia, a misura che vengono scoperti i meccanismi di controllo del ciclo, essi si dimostrano sempre più complessi e di dicile comprensione. I modelli informatici sono un strumento pratico che permette di gestire questa complessità. Benchè si utilizzino prevalentemente approcci di tipo quantitativo in questi modelli, specialmente nello studio del ciclo cellulare in cui i lavori dei gruppi di Béla Novák et John Tyson in particolare hanno permesso importanti progressi (Novák e Tyson, 1993; Ciliberto e Tyson, 2000; Novák e Tyson, 2004; Chen et al., 2004; Sveiczer et al., 2004; Csikász-Nagy et al., 2006), i for- malismi qualitativi orono un approccio complementare, soprattutto facilitando lo studio di grandi reti. La modellizzazione logica è stata applicata con successo a diverse reti di regolazione biologica (Kaufman Thomas, 1995; Muraille 1998; Mendoza et al., et al., et al., 1999; Espinosa-Soto 2003; Albert e Othmer, 2003; Chaves et al., 1985; Kaufman e Thomas, 1987; Thiery e 1996; Mendoza, 2006; Mendoza e Alvarez-Buylla, et al., et al., 2004; Sánchez e Thiery, 2001, 2006; Chaves e Albert, 2008; Sánchez 2008; Ghysen e Thomas, 2003; Schaub et al., 2007). La maggior parte di queste applicazioni tratta di sistemi decisionali che permettono la selezione di un destino cellulare specico, il quale a sua volta può essere analizzato in termini di stati stabili alternativi. Al contrario, nel caso del ciclo cellulare, ciò che importa è la sequenza precisa delle transizioni, in altre parole l'ordine dei cambiamenti d'attività dei componenti che controllano la progressione del ciclo nei sue varie fasi. La modellizzazione logica del ciclo è solo agli inizi, ma negli ultimi anni, è stata sviluppata una serie di modelli logici sempre più sosticati (Huang e Ingber, 2000; 19 20 Li et al., 2004; Fauré et al., 2006; Davidich e Bornholdt, 2008a,b; Fauré et al., 2009; Irons, 2009). Nel corso del mio dottorato, mi sono interessato alla modellizzazione qualitativa del ciclo cellulare. Ispirato da Novák e Tyson (2004), il modello schematico della rete mammifera costituisce il mio primo passo in questo campo (Fauré et al., 2006). Questo lavoro mi ha portato a proporre un sistema di classi di priorità per facilitare l'esplorazione del grande attrattore ciclico generato dal modello. Tale sistema si è rivelato estremamente utile quando mi sono rivolto al ciclo cellulare nel lievito. Benché la rete di regolazione che controlla il ciclo cellulare sia molto più semplice nel lievito gemmante che nei mammiferi, è anche molto meglio conosciuta. In questo contesto, il mio lavoro s'ispira ad un modello dierenziale pubblicato dai gruppi di Béla Novák e John Tyson (Chen et al., 2004). Questo lavoro rappresen- tava allora uno dei tentativi più riusciti di modellizzazione della rete di regolazione del ciclo cellulare nel lievito, tuttavia estendere la sua portata a moduli di controllo supplementari sembrava dicile. Un approccio modulare era necessario, ed il quadro logico sembrava lo strumento ideale per attuarlo. Il modello che ho sviluppato, basandomi sul modello di Chen, riproduce qualitativamente i principali risultati del modello originale. Inoltre ho potuto trasporre nel formalismo logico il modello del checkpoint della morfogenesi publicato da Ciliberto et al. (2003), come pure il modello del controllo dell'uscita dalla mitosi pubblica- to da Queralt et al. (2006), ed accoppiarli al modello centrale del ciclo cellulare. Sebbene un metodo formale d'accoppiamento di modelli resti ancora da denire, questi risultati mostrano che un approccio modulare è possibile nel formalismo logico (Fauré et al., 2009). Inne gli sviluppi metodologici legati al mio lavoro sul ciclo cellulare sono stati implementati nel software GINsim (Naldi et al., 2009). Risultati Analisi dinamica di un modello generico del controllo del ciclo cellulare nei mammiferi Quando abbiamo deciso, durante il mio stage di master in 2005, di applicare il formalismo logico allo sviluppo di un modello del ciclo cellulare, abbiamo realizzato che non disponevamo degli strumenti necessari ad analizzare un tale modello. In eetti, come precedentemente accennato, il formalismo logico, o semplicemente Booleano, era stato utilizzato principalmente per studiare sistemi decisionali che permettono la selezione di destini cellulari specici, i quali possono essere analizzati in termini di stati stabili. Il modello Booleano del ciclo cellulare proposto da Huang e Ingber (2000) costituisce un'eccezione notevole. Tuttavia, esso è relativamente piccolo ed è studiato per simulazioni sincrone. Quest'approcio semplica in gran parte le traiettorie, in quanto ogni stato non possiede più di un successore. Anche modelli Booleani più recenti (Li et al., 2004; Davidich e Bornholdt, 2008b) sono basati su questo approcio : poche variabili, aggiornamento sincrono. Al contrario, noi ci siamo interessati ad un sistema oscillante relativamente ben documentato e abbastanza grande: il macchinario di controllo del ciclo cellulare. 21 Lo studio dell'attrattore complesso, la cui generazione non è esclusa in tale rete, era problematico considerando gli strumenti di cui disponevamo all'epoca. GINsim oriva già la possibilità di studiare porzioni limitate del grafo delle transizioni di stato asincrono (Gonzalez et al., 2006), permettendo così all'utilizzatore di con- centrarsi sulle porzioni più rilevanti della dinamica; tuttavia, il sistema di priorità che abbiamo proposto (Fauré et al., 2006) è stato sviluppato specicamente per superare questa dicoltà. Il modello che abbiamo scelto per mettere a punto il nostro approccio al ciclo cellulare è la rete di regolazione nei mammiferi, come descritto da Novák e Tyson (2004). Si tratta di un modello schematico, basato su un'astrazione delle famiglie di proteine che compongono la rete reale. Un altro modello, molto più dettagliato e basato sul ciclo cellulare del lievito gemmante, è stato pubblicato quasi nello stesso periodo (Chen et al., 2004), ma era troppo complesso e rappresentava una sda troppo grande per un primo tentativo. Al contrario, sucientemente dettagliato da poter essere considerato interessante, il modello sui mammiferi era anche piccolo a sucienza anché il suo adattamento Booleano potesse essere studiato sotto l'ipotesi di aggiornamento asincrono completo. Questo modello raccoglie gli attori principali del modello originale: le quattro cicline (D, E, A e B), l'inibitore dei cdk p27Kip1, il fattore di trascrizione E2F ed il suo inibittore Rb, come pure gli attivattori dell'APC Cdc20 e Cdh1. L'eetto dei fattori di crescita è rappresentato dall'attivazione della ciclina D. Un aspetto originale di questo modello risiede nella rappresentazione implicita dei complessi molecolari: così, un complesso è considerato formato quando sono presenti tutti i suoi componenti. La principale modica riguarda l'introduzione della proteina UbcH10, recentemente scoperta da (Rape e Kirschner, 2004), allo scopo di tener conto del fatto che la ciclina A è un bersaglio di Cdh1 alla ne della mitosi ed all'inizio della fase G1, ma non alla ne di G1, permettendo così alla ciclina di accumularsi e di inattivare Cdh1. Il risultato della simulazione di questo modello è un attrattore ciclico, che corrisponde ai dati biologici. Abbiamo anche potuto riprodurre il comportamento di alcuni mutanti, nonostante la scelta di attenerci ad una rappresentazione rigorosamente Booleana. Il passaggio al multilivello dovrebbe permettere di anare il modello. Modellizzazione logica modulare del ciclo cellulare nel lievito gemmante I lieviti, ed in particolare il lievito gemmante, sono da tempo organismi modelli di riferimento per lo studio dei meccanismi di controllo del ciclo cellulare. Sac- charomyces cerevisiae è un organismo unicellulare semplice, usato da tempo immemorabile per la fabbricazione della birra e la panicazione di qui il suo nome comune di lievito di birra o lievito da fornaio. Contrariamente alla rete di regolazione che controlla il ciclo cellulare nei mammiferi, poco conosciuto rispetto alla sua complessità, la rete del ciclo cellulare del lievito gemmante è stato oggetto di studi intensivi. Nel corso degli anni 1970, sono stati realizzati importanti schermi genetici, facilitati dalla possibilità di allevare stirpi aploidi, cosa che permette di 22 evitare la trappola delle mutazioni recessive. Molti regolatori chiave della divisione cellulare sono stati scoperti in questo contesto (Simchen, 1978). Di conseguenza, il ciclo cellulare del lievito costituisce anche un sistema di scelta per sviluppare o testare metodi informatici dedicati alla modellizzazione delle reti di regolazione biologiche. Diversi modelli pubblicati dai gruppi di Béla Novák e John Tyson trattano di quest'organismo. In particolare, un modello pubblicato da Chen et al. (2004) costi- tuisce uno degli approcci più dettagliati di modellizzazione della rete di regolazione del ciclo cellulare nel lievito. Altri articoli dedicati a moduli di controllo specici, come il checkpoint della morfogenesi Ciliberto MEN Queralt et al., et al., 2003, oppure le reti FEAR e 2006, sono stati pubblicati dagli stessi gruppi. La possibilità di accorpare il modulo del checkpoint della morfogenesi al modello centrale era già stata dibattuta in (Chen et al., 2004); ciononostante, gli autori informavano che il compito non sarebbe stato semplice e nessun modello è stato ancora pubblicato. Tuttavia, in un articolo recente, Randhawa et al. (2008) hanno annunciato che l'ac- coppiamento dei due moduli era stato realizzato con successo e sarebbe sul punto di essere pubblicato. Quando abbiamo iniziato questo progetto, la prospettiva di un modello accoppiato, che raccogliesse insieme il modello centrale, il checkpoint della morfogenesi e le reti FEAR e MEN, sembrava ancora lontana. Lo sviluppo di ambienti di modellizzazione permettenti la denizione e l'analisi di reti di regolazione vaste e complesse è una vera sda. Benché la pertinenza di una tale strategia sia riconosciuta (Hartwell et al., 1999; Snoep et al., 2006), questo tipo di ambiente resta da denire. Una strategia promettente per arontare questa questione si fonda su un approccio modulare alle reti di regolazione, il quale permette l'identicazione di moduli funzionali che possono essere modellizzati e analizzati separatamente. Poi, per ottenere reti più vaste, occorre assemblare sotto-modelli. In quest'ottica, Randhawa et al. (2008) presentano uno strumento per guidare il modellizzatore nel corso del processo di composizione, che usano per ricostruire il modello generico pubblicato da Tyson e Novak (2001). Nel quadro logico , un tale approccio modulare è stato adottato per costruire modelli multicellulari basati sull'interazione tra moduli cellulari che non si sovrappongono (Schaub Sánchez et al., 2008). et al., 2007; In questo contesto, ci eravamo posti due obbiettivi: per prima cosa ci siamo proposti di utilizzare il modello di Chen come un test per il nostro approccio di modellizzazione; in eetti, con le sue 26 variabili e più di 130 mutanti documentati, questo modello rappresentava una vera sda. Poi volevamo estendere questo modello per renderlo completo e realistico, accoppiando moduli di controllo supplementari e aggiornando alcune parti del modello con i nuovi dati sperimentali. La nostra versione logica di questo modello, presentata in Fauré et al. (2009), rende conto con successo, in termini qualitativi, del comportamento di questi numerosi mutanti. A questo modello centrale, abbiamo accorpato il modulo del checkpoint della morfogenesi, adattato da Ciliberto et al. (2003) e abbiamo aggiornato la sotto-rete che controlla l'uscita dalla mitosi con un modulo adattato da Queralt et al. (2006). Il modello così costruito raccoglie le caratteristiche principali dei suoi componenti, compresa la simulazione di più di 150 tipi di perturbazioni. 23 Il metodo di accoppiamento è facilitato dall'utilizzo di espressioni logiche compatte al posto di parametri logici. Questa possibilità sarà implementata nella prossima versione pubblica del nostro software GINsim. Prossimamente formalizzaremo il metodo sistematico di composizione e di implementarlo in GINsim. Modellizzazione logica di reti di regolazione con GINsim 2.3 GINsim (Gene Interaction Network simulation) è uno strumento informatico userfriendly per la modellizzazione e la simulazione di reti di regolazione genetiche sviluppato nel gruppo del mio direttore di tesi, Denis Thiery. Come tale, GINsim è stato il mio principale strumento di lavoro nel corso di questo dottorato. Tutti i modelli presentati in questa sede sono stati sviluppati con GINsim e saranno disponibili sul nostro sito web (www.gin.univ-mrs.fr). Da quando è uscito, GINsim è in continua evoluzione (Chaouiya 2004; Gonzalez et al., 2006) e quest'articolo (Naldi et al., et al., 2002, 2009) presenta l'ultima versione pubblica. In quanto biologo di formazione, non ho contribuito direttamente allo sviluppo di GINsim. Tuttavia, il mio lavoro sul ciclo cellulare ha motivato nuovi sviluppi metodologici, adesso implementati nel software. In particolare, il sistema di priorità introdotto in (Fauré et al., 2006) per gestire le dimensioni crescenti del grafo delle transizioni di stato è stato incluso in GINsim 2.3. in (Fauré et al., Le funzioni logiche utilizzate 2009), per sostituire con una rappresentazione più pratica i set di parametri sempre più complessi dei nodi fortemente regolati, sarà presentata in una prossima versione (sono già disponibile in versione beta sul sito di GINsim). Naldi et al. (2009) si riferisce ad un semplice modello del controllo del ciclo cellulare derivato da Davidich e Bornholdt (2008b). Questo modello è analizzatto in dettaglio in una rivista attualmente in corso di presentazione, riprodotta in allegato (Faur{\'{e}} e Thiery, sottomesso). Discussione Il ciclo cellulare è un processo molto complesso, il quale richiede un coordinamento stretto tra i diversi moduli che controllano le varie tappe della replicazione della cellula. Il macchinario centrale che aziona il ciclo è esso stesso controllato da un insieme di moduli che servono da dispositivi di controllo di qualità per assicurare l'adabilità della replicazione e la progressione ordinata degli eventi. Il ciclo cellulare è anche condizionato da segnali esterni che collegano la cellula al suo ambiente. Di fronte a tale complessità, il formalismo logico ore diversi vantaggi. I modelli logici sono relativamente semplici da denire e non richiedono dati quantitativi. Come sopra menzionato, sono disponibili vari strumenti per lo studio della dinamica di modelli logici, in particolare per l'identicazione degli stati stabili e per l'analisi del ruolo dinamico dei circuiti di regolazione. Nonostante la loro relativa semplicità e la loro natura qualitativa, i modelli logici possono rendere conto di variazioni sottili del comportamento originale, come attestato per la simulazione di numerose perturbazioni in (Fauré et al., 2009). 24 Inoltre, questo aspetto grossolano può essere un vantaggio quando si tratta di comparare modelli tra loro. In eetti, se i moduli sono stati deniti dall'evoluzione, come suggeriscono alcune loni di ricerca (Wagner et al., 2007), è possibile che al- cuni schemi d'organizzazione siano conservati o selezionati, come si osserva nel caso dei motivi di rete (Wolf e Arkin, 2003). Come fanno notare Ingolia e Murray (2004), il fatto che [gli approcci logici] siano ciechi ai meccanismi molecolari può essere un vantaggio, rivelando similarità formali tra sistemi che implicano tipi di componenti e d'interazioni molto diversi. Questi autori osservano che sistemi oscillanti, come il ciclo cellulare, l'orologio circadiano oppure le cellule pacemaker del cuore, mostrano strutture simili basate su circuiti di regolazione negativi a due componenti, mentre si fondano su meccanismi molecolari molto diversi. Il formalismo logico facilita l'identicazione di similarità fra sistemi le cui dierenze a livello molecolare giusticherebbero rappresentazioni diverse in formalismi più dettagliati. Il formalismo logico ore proprietà di composizione interessanti, che potrebbero essere sfruttate per sviluppare strategie di modellizzazione incrementale. La combinazione di modelli dierenziali richiede ancora valutazioni e adeguamenti complessi di vasti set di parametri cinetici. Ad esempio, il modello descritto da Csikász-Nagy et al. (2006), presentato in modo modulare, richiede parametri cinetici direttamente ispirati ad altri modelli di ODE ed è lontano dall'essere esteso e dettagliato quanto questi ultimi. Similmente il promettente approccio formalizzato da (Randhawa et al., 2008) è applicato alla ricostruzione ab initio di un modello relativamente semplice già pubblicato da (Tyson e Novak, 2001). Attualmente il nostro modello accoppiato è verosimilmente il più esteso modello del ciclo cellulare nel lievito. Tuttavia i modelli logici non possono generare predizioni realmente quantitative. È dunque necessario creare connessioni tra gli approcci qualitativi e quantitativi. Ad esempio, i modelli pubblicati in (Fauré et al., 2006) e (Fauré et al., 2009) sono stati costruiti con la trasposizione manuale in ambito logico di modelli dierenziali. Davidich e Bornholdt (2008a) propongono un metodo di traduzione più formale, che applicano al modello del ciclo cellulare del lievito a ssione di (Novák et al., 2001). In riferimento ad altri applicazioni biologici, diversi software, come SQUAD (Mendoza e Xenarios, 2006) ed Odefy (Wittmann et al., 2008), arrivano persino ad automatizzare la traduzione di modelli logici in equazioni dierenziali generiche. Parallelamente, modelli dierenziali sono anche stati adattati in un quadro probabilistico, come le reti di Petri stocastiche (Mura e Csikász-Nagy, 2008). Al di là della sua applicazione al ciclo cellullare, il mio lavoro ha condotto a sviluppi metodologici, come la rappresentazione dei complessi multiproteici, il sistema di priorità e l'utilizzo di formule logiche per rappresentare i parametri del modello, che sono stati implementati, o sono in corso d'implementazione, in GINsim. Inoltre, il mio lavoro apre interessanti prospettive future per la denizione di modelli più estesi di reti di regolazione diverse, visto l'organizazzione modulare sembra una caratteristica ricorrente nei sistemi biologici. Inne, pone anche questioni teoriche sulla natura dei moduli, i ruoli dinamici dei circuiti di regolazione con la loro conservazione nel corso dell'evoluzione e la robustezza del modello, tre questioni che potrebbero essere profondamente legate tra loro.