Bioingegneria Sim(U) lare una cellula 2 vivente 1 2 3 4 André Kutscherauer Con il primo modello al computer di un organismo unicellulare, i biologi hanno realizzato una nuova e potente categoria di strumenti per capire come funziona la vita di Markus W. Covert 56 Le Scienze 547 marzo 2014 www.lescienze.it Le Scienze 57 Markus W. Covert è assistant professor di bioingegneria alla Stanford University, dove dirige un laboratorio dedicato alla biologia dei sistemi. L’ intuizione cruciale l’ho avuta mentre tornavo a casa in bici, il giorno di San Va­ lentino del 2008. Mentre pedalavo, la mente girava attorno a un problema che aveva occupato me e altri colleghi per oltre dieci anni. È possibile simulare la vita con un programma, includendo tutta la meravigliosa, misteriosa e incredi­ bilmente complessa biochimica che la fa funzionare? Un modello computeriz­ zato di cellule viventi, anche se lacunoso e poco accurato, sarebbe uno strumento assai utile. I biologi potrebbero testare idee sperimentali prima di impegnare tempo e denaro per farlo realmente in labora­ torio. Gli scienziati che sviluppano farmaci, per esempio, potrebbero accelerare la ricerca di nuovi anti­ biotici, individuando molecole la cui inibizione uccide un batterio. I bioingegneri come me potrebbero trapiantare e ricollegare i geni dei microrganismi virtuali per progettare ceppi modifica­ ti con caratteristiche speciali: per esempio, diventare fluorescen­ ti se infettati da un certo virus, oppure capaci di estrarre idrogeno dal petrolio. Tutto questo senza i rischi che comporta l’alterazione di microrganismi reali. Se capissimo come ottenere modelli suffi­ cientemente sofisticati per simulare le cellule umane, questi stru­ menti potrebbero trasformare la ricerca medica permettendo agli scienziati di effettuare studi oggi impossibili perché ancora non si riescono a coltivare molti tipi di cellule umane. Tutto questo sarebbe rimasto solo una fantasia se non si fosse riusciti a sbrogliare la ragnatela di reazioni chimiche e di connes­ sioni fisiche che fanno funzionare le cellule viventi. Molti tentati­ vi precedenti, sia nel mio laboratorio della Stanford University sia in quelli di altri colleghi, avevano incontrato ostacoli insormonta­ bili. Alcuni avevano fallito del tutto. Ma mentre pedalavo lentamente nel campus in quella sera d’inverno pensavo al lavoro che facevo in quel periodo: registra­ re immagini e video di singole cellule viventi. In quel momento ho avuto l’illuminazione per creare un simulatore semplice e fun­ zionale: scegliere uno dei microrganismi unicellulari più semplici esistenti, un batterio chiamato Mycoplasma genitalium, e costrui­ re un modello di uno di questi germi. Limitare la simulazione a una sola cellula avrebbe semplificato il problema a sufficienza. In questo modo teoricamente avremmo potuto includere ogni even­ to biologico che sappiamo verificarsi nelle cellule: l’apertura della doppia elica del DNA; la trascrizione dei messaggi del DNA in una copia di RNA, la produzione di ogni enzima e delle proteine in ba­ se alle istruzioni contenute nell’RNA, e l’interazione tra ognuno di questi attori e molti altri, tutti impegnati a far crescere la cellula e infine a farla dividere in due «figlie». La simulazione avrebbe ge­ nerato, quasi da zero, l’intero film della vita unicellulare. I tentativi precedenti avevano sempre puntato a simulare un’in­ tera colonie di cellule, perché è da lì che provengono quasi tutti i In breve I modelli al computer in grado di simulare la funzione di ogni gene e molecola in una cellula potrebbero rivoluzionare il nostro modo di 58 Le Scienze studiare, capire e progettare i sistemi biologici. Una simulazione completa di un comune batterio infettivo è stata completata l’anno scorso, e per quanto imperfetta sta già generando nuove scoperte. I ricercatori ora sono al lavoro su modelli di organismi più complessi. L’obiettivo a lungo termine è simulare le cellule e gli organi umani con un dettaglio confrontabile. 547 marzo 2014 dati che abbiamo sul comportamento cellulare: dalle popolazioni, non dai singoli microbi. Tuttavia lo sviluppo sia delle biotecnolo­ gie sia dell’informatica ha iniziato a rendere lo studio delle singole cellule molto più facile. Avevo capito di avere finalmente a dispo­ sizione gli strumenti per tentare un approccio diverso. Le idee mi frullavano in testa: appena arrivato a casa ho abboz­ zato progetti per un simulatore. La mattina dopo ho cominciato a scrivere il codice del programma per un paio dei tanti processi di­ versi che avvengono in un microrganismo. Dopo una settimana avevo completato molti moduli sperimentali: ognuno era una rap­ presentazione di un particolare processo cellulare. I moduli produ­ cevano risultati che sembravano piuttosto realistici. Ho mostrato il lavoro a diversi colleghi biologi: la maggior parte di essi pensava che fossi pazzo. Ma sentivo di aver trova­ to qualcosa, e due dottorandi audaci ed eccezionali, Jonathan R. Karr e Jayodita C. Sanghvi, hanno visto potenzialità sufficienti nell’approccio da lavorare con me al progetto. Completare il modello significava produrre decine di questi mo­ duli, cercare i dati biochimici su un migliaio di articoli scientifici e poi usare quei valori per vincolare e modificare migliaia di pa­ rametri, come la forza del legame di un enzima al suo substrato, o quanto spesso le proteine che leggono il DNA si spingono via l’u­ na con l’altra dalla doppia elica. Sospettavo che anche con il dili­ gente aiuto di collaboratori e dottoran­ di il progetto avrebbe richiesto anni: ma sentivo anche che alla fine avrebbe funzionato. Non c’era modo di saperlo con certezza: bisognava provare. Una sfida grandiosa Quando ho mostrato una parte del codice a dei colleghi biologi, in tanti hanno pensato che fossi pazzo. Tuttavia sentivo di aver trovato qualcosa Nel decidere di scalare questa mon­ tagna ci siamo ispirati al ricercatore che per primo aveva sognato di mo­ dellizzare la vita. Nel 1984 Harold Mo­ rowitz, all’epoca alla Yale University, aveva tracciato la strada, osservando che i batteri più semplici che i biolo­ gi erano riusciti a coltivare, i micopla­ smi, erano il logico punto di partenza. Oltre a essere molto piccoli e relativa­ mente semplici, due specie di Mycoplasma causano malattie negli esseri umani: M. genitalium è un germe parassita trasmesso sessualmente che prospera nel tratto urinario e vaginale; M. pneumoniae può causare la polmonite ati­ pica. Un modello di una delle due specie poteva essere molto utile per la medicina, non solo come fonte di nuove conoscenze di bio­ logia fondamentale. Il primo passo, proponeva Morowitz, avrebbe dovuto essere il sequenziamento del genoma del microrganismo scelto. Craig Ven­ ter e colleghi dell’Institute for Genomic Research (TIGR) hanno completato il genoma di M. genitalium nel 1995; ha solo 525 geni (mentre le cellule umane ne hanno oltre 20.000). Ero un dottorando a San Diego quando, quattro anni dopo, il gruppo del TIGR aveva concluso che solo 400 di quei geni sono essenziali per la vita (almeno finché i microrganismi crescono in un terreno di coltura ricco). Venter e collaboratori hanno poi fon­ dato Celera, e hanno fatto a gara con il governo degli Stati Uni­ ti per sequenziare il genoma umano. Hanno sintetizzato i geni es­ senziali di una delle specie di Mycoplasma e ne hanno mostrato il funzionamento in una cellula. www.lescienze.it Per me e altri giovani biologi della fine degli anni novanta, questo gruppo era come i Led Zeppelin: personalità iconoclaste e sopra le righe che suonavano musica che non avevamo mai ascol­ tato prima. Clyde Hutchinson, uno dei biologi del gruppo di Ven­ ter, ha dichiarato che la prova finale della nostra conoscenza delle cellule semplici sarebbe arrivata quando qualcuno le avrebbe mo­ dellizzate al computer. Puoi costruire una cellula funzionale in la­ boratorio combinando pezzi senza capire ogni dettaglio di come si incastrino tra loro. Per il programma, questo non basta. Anche Morowitz aveva invitato i colleghi scienziati a creare un simulatore cellulare basandosi sui dati genomici di Mycoplasma. Sosteneva che «ogni esperimento che possa essere effettuato in laboratorio può essere effettuato anche al computer. La misura in cui i risultati sperimentali e quelli della simulazione corrispon­ dono è la misura della completezza del paradigma della biologia molecolare», cioè della nostra teoria su come il DNA e le altre bio­ molecole della cellula interagiscono per produrre la vita come la conosciamo. In altre parole, mentre mettiamo insieme le tessere del puzzle diventa più evidente quali siano i pezzi e le interazioni mancanti nella nostra teoria. Per quanto i sequenziatori ad alta efficienza e gli strumenti di laboratorio robotizzati abbiano notevolmente accelerato la ricer­ ca dei pezzi mancanti, la valanga di sequenze di DNA e gli sche­ mi di attività genetica che producono non sono forniti di spiegazione su co­ me le diverse parti vadano messe in­ sieme. Il pioniere della genetica Sidney Brenner ha battezzato questa biologia «a basso input, ad alta elaborazione, senza output», perché troppo spesso gli esperimenti non sono basati su ipote­ si e generano poche nuove informazio­ ni sui sistemi più grandi che fanno fun­ zionare (o malfunzionare) la vita. Questa situazione spiega in parte il motivo per cui, nonostante le tante no­ tizie riguardanti la scoperta di geni as­ sociati a cancro, obesità o diabete, le cure per queste malattie siano elusive al limite della frustrazione. È diventato chiaro che le soluzioni arriveranno so­ lo quando riusciremo a districarci tra le decine o addirittura cen­ tinaia di fattori che interagiscono, a volte in modi poco intuitivi, per causare queste malattie. I pionieri della modellizzazione cellulare avevano capito che le simulazioni di intere cellule che includessero tutti i componenti cellulari e le loro reti di interazioni sarebbero state strumenti molto potenti per dare un significato a questi dati scollegati e confusi. Per sua natura, un simulatore di un’intera cellula sarebbe stato il distil­ lato di un insieme coerente di ipotesi su ciò che accade dentro una cellula, sotto forma di algoritmi matematici rigorosi. I disegni schematici che spesso si vedono negli articoli delle ri­ viste scientifiche, in cui il fattore X regola il gene Y – più o meno – non raggiungono neanche lontanamente la precisione necessa­ ria per il programma. I programmatori esprimono questi proces­ si come equazioni (un esempio semplice: Y = aX + b) anche se de­ vono fare ipotesi ragionate sui valori di variabili come a e b. Alla fine questa necessità di precisione evidenzia gli esperimenti di la­ boratorio che devono essere effettuati per colmare le lacune nella conoscenza di tempi di reazione e altre quantità. Le Scienze 59 Allo stesso tempo, era chiaro che una volta che i modelli fosse­ ro stati verificati avrebbero preso il posto di alcuni esperimenti, ri­ sparmiando il dispendioso lavoro di laboratorio per questioni che non possono essere risolte dalla sola simulazione. Ed esperimenti simulati che generassero risultati sorprendenti aiuterebbero i ri­ cercatori a identificare le giuste priorità nel loro lavoro, accele­ rando il processo di scoperta scientifica. I modelli offrono stru­ menti così invitanti per cercare le catene causali al punto che nel 2001 Masaru Tomita della Keio University, in Giappone, ha bat­ tezzato la simulazione di un’intera cellula «una grandiosa sfida del XXI secolo». Ancora dottorando ero impressionato dai primi risultati rag­ giunti dai principali simulatori di cellule dell’epoca (si veda il box nella pagina fronte), e per me questa grandiosa sfida era diventa­ ta un’ossessione. Anche mentre mettevo in piedi il laboratorio ero concentrato sulle tecniche per ottenere immagini e filmati di sin­ gole cellule, la sfida era nei miei pensieri. E poi, durante quella pe­ dalata verso casa di febbraio, ho capito come vincerla. Due intuizioni fondamentali Era chiaro che prima che si potesse simulare il ciclo vitale di una specie microbica abbastanza accuratamente da imitarne i comportamenti complessi e fare nuove scoperte, avremmo dovuto risolvere tre problemi. Primo, era necessario codificare in formu­ le matematiche e algoritmi informati­ ci tutte le funzioni rilevanti, dai flus­ si di energia, nutrienti e prodotti delle reazioni all’interno della cellula, alla sintesi e alla decomposizione di DNA, RNA e proteine, fino all’attività di una miriade di enzimi. Secondo, avremmo dovuto trovare una piattaforma gene­ rale per integrare tutte queste funzioni. Il problema finale era per molti versi il più difficile: stabilire i limiti superiori e inferiori per ognuno dei circa 1700 pa­ rametri del modello in modo che aves­ sero valori biologicamente realistici, o almeno del giusto ordine di grandezza. Avevo capito che per quanto potes­ simo esplorare con attenzione le ricer­ che passate su M. genitalium e le stret­ te relazioni tra i diversi parametri (alla fine Karr, Sanghvi e io abbiamo passa­ to due anni raccogliendo dati da circa 900 articoli), avremmo do­ vuto basarci su ipotesi ragionate o su risultati di esperimenti effet­ tuati su batteri diversi, come Escherichia coli, per ottenere alcuni dati: per esempio quanto tempo in media i trascritti RNA riman­ gono in giro nella cellula prima che gli enzimi li facciano a pezzi per riciclarli. Senza un modo di vincolare e controllare queste ipo­ tesi, non avevamo speranze di successo. In quel momento eureka! del 2008, ho capito che modellare una singola cellula, invece che un gruppo di cellule, come ave­ vano fatto quasi tutti gli studi precedenti, avrebbe potuto darci i vincoli che cercavamo. Consideriamo la crescita e la riproduzio­ ne. Una grande popolazione di cellule cresce incrementalmente, e la nascita e la morte di una cellula non cambiano di molto le co­ se. Ma per una cellula sola la divisione è un evento drammatico. Prima di dividersi, l’organismo deve raddoppiare la propria mas­ sa, non solo la sua massa totale. La quantità di DNA, di membra­ na cellulare e di ogni proteina necessaria alla sopravvivenza deve raddoppiare. Se il modello è limitato a una sola cellula, il compu­ ter può davvero contare e seguire ogni molecola lungo l’intero ci­ clo cellulare. Può controllare se tutti i numeri si bilanciano quan­ do una cellula si sdoppia. Inoltre, una singola cellula si riproduce essenzialmente a un tasso costante. M. genitalium, per esempio, tipicamente si divide ogni 9 o 10 ore in un normale ambiente di laboratorio. Raramen­ te ci vogliono meno di 6 ore o più di 15. La necessità della cellu­ la di duplicare tutto il suo contenuto in questa finestra temporale ristretta ci avrebbe permesso di scegliere un intervallo plausibilie per molte variabili altrimenti indeterminate, come quelle che con­ trollano il momento d’inizio della replicazione cellulare. Ho messo insieme un gruppo di fisici, biologi, esperti di mo­ delli e addirittura un ingegnere del software che aveva lavorato a Goo­gle e abbiamo discusso quali approcci matematici seguire. Mi­ chael Schuler, un ingegnere biomedico della Cornell University che era un pioniere della simulazione cellulare, ha costruito mo­ delli impressionanti con normali equazioni differenziali. Bernhard Palsson, con il quale avevo studiato a San Diego, aveva sviluppa­ to una tecnica potente, chiamata flux balance analysis, che fun­ zionava bene per modellare il metabolismo. Ma altri hanno di­ mostrato che il caso è un elemento importante nella trascrizione genica, e la divisione cellulare ovviamente implica un cambia­ mento nella geometria della membra­ na cellulare; quei metodi non avreb­ bero affrontato questi aspetti. Già durante il dottorato avevo capito che nessuna tecnica da sola avrebbe potu­ to modellizzare tutte le funzioni di una cellula: la mia tesi di dottorato aveva proprio dimostrato un modo per colle­ gare due approcci matematici distinti in un unico simulatore. Abbiamo quindi deciso di creare il modello cellulare come un insieme di 28 moduli distinti, ognuno dei qua­ li usa l’algoritmo migliore per i proces­ si biologici e per la conoscenza che ab­ biamo dei processi stessi (si veda il box a p. 62). Questa strategia ha portato a una raccolta di procedure matemati­ che: dovevamo trovare il modo di col­ legare tutto in un unico insieme coeso. Mi è tornato in mente un corso di progettazione di impianti chi­ mici che avevo frequentato da studente. Come progetto finale ave­ vamo usato un pacchetto di simulazione molto potente chiamato HYSIS per progettare una grande raffineria. HYSYS permetteva di prevedere un contenitore separato per ogni reazione principale. Al­ cuni tubi portavano poi il prodotto di ogni contenitore verso gli al­ tri contenitori. Questo sistema combinava molti tipi diversi di ope­ razioni chimiche in un sistema ordinato e prevedibile. Questo approccio, con qualche modifica, avrebbe potuto fun­ zionare per il nostro simulatore cellulare se avessi deciso di fare un’ipotesi importante che avrebbe semplificato le cose: per quanto tutti questi processi biologici avvengano simultaneamente in una cellula vivente, le loro azioni sono effettivamente indipendenti su periodi inferiori a un secondo. Prendendo per buona questa ipote­ si, avremmo potuto dividere la vita della cellula in scatti da un se­ condo, e far funzionare ognuno dei 28 moduli, in ordine, per uno cronologia Le tappe della simulazione cellulare La lunga strada fino al primo modello funzionante di una singola cellula di un semplice batterio, Mycoplasma genitalium, è stata tracciata in base agli sforzi teorici, genetici e di modellizzazione di altri ricercatori. Progettare un modello al computer di una cellula umana è sicuramente un compito ancora più difficile, data la maggiore complessità delle cellule dei mammiferi. Le cellule umane, per esempio, contengono quasi 40 volte il numero di geni del micoplasma, impacchettati in cromosomi molto più intricati per la loro struttura fisica e per l’informazione che contengono. Qui sotto sono elencati anche alcuni dei passi cruciali che dovranno essere compiuti. Il batterio unicellulare Mycoplasma genitalium (corpi viola) è una forma di vita semplice. Ma modellizzare il suo ciclo di vita non è stato facile. Il nostro modello cellulare è composto da diversi moduli che usano l’algoritmo migliore per i processi biologici e per la conoscenza che abbiamo dei processi 60 Le Scienze 547 marzo 2014 1967 Francis Crick e Sidney Brenner formulano e propongono «Project K: The Complete Solution of Escherichia coli» uno sforzo per arrivare al «progetto» di questo comune batterio intestinale, compresi i dettagli della sua genetica, gestione energetica e riproduzione. 1984 Harold Morowitz, allora alla Yale University, delinea un progetto per sequenziare e modellizzare un batterio del genere Mycoplasma. 1984 Science Source Michael Schuler, della Cornell University, presenta un modello al computer che usa equazioni differenziali per descrivere gran parte dei principali processi biologici coinvolti nella crescita di una cellula di E. coli. Il modello non era in grado di includere l’attività al livello dei geni, perché il genoma di E. coli non era ancora stato sequenziato. 1989-1990 Bernhard Palsson dell’Università www.lescienze.it del Michigan crea un modello dettagliato del metabolismo dei globuli rossi umani che comprende gli effetti della variazione del pH e di un basso livello di glucosio nel sangue. 1995 Craig Venter del TIGR e i suoi collaboratori completano la sequenza del genoma di M. genitalium. ha difficoltà a manipolare le cellule B in coltura. 2002 Palsson, George Church della Harvard University e Covert, insieme a molti altri, completano un modello su scala genomica del metabolismo di Helicobacter pylori, un batterio che infetta gli umani e può causare l’ulcera e il cancro allo stomaco. 1999 2004 Masaru Tomita e il suo gruppo della Keio University in Giappone costruiscono E-cell, un sistema di modellizzazione delle cellule basato su equazioni differenziali che include 127 geni, gran parte dei quali di M. genitalium. 2002 Palsson e Covert, insieme ad altri tre colleghi, pubblicano un modello computazionale di tutti i 1010 geni coinvolti nella regolazione del metabolismo e della trascrizione del DNA di E. coli, mostrando che il modello prevede accuratamente i risultati degli esperimenti effettuati in laboratorio sui batteri reali. L’Alliance for Cellular Signalling, una vasta collaborazione di circa 50 ricercatori, lancia un ambizioso progetto decennale da 10 milioni di dollari per simulare le cellule B del sistema immunitario e le cellule del miocardio nel topo. Il progetto produce dati molto interessanti ma Covert e colleghi pubblicano un modello di tutta la cellula di M. genitalium. Per la prima volta vengono simulati tutti i processi genici e biochimici noti in un organismo autoreplicante. 2012 2013 Covert e collaboratori mostrano che il modello prevede con precisione l’attività di molti enzimi. NEL FUTURO Completare un modello cellulare di un batterio più rappresentativo e meglio studiato, come E. coli. Modellizzare un eucariote unicellulare, come il lievito Saccharomyces cerevisiae. In un eucariote, il DNA è impacchettato in un nucleo chiuso da una membrana, e non libero di spostarsi nella cellula come in un batterio. Costruire un modello di una cellula animale che può essere facilmente coltivata, come un macrofago (un tipo di cellula del sistema immunitario) del topo. Costruire una prima bozza di un modello di cellula umana, probabilmente di nuovo un macrofago. Modellizzare altri tipi di cellule umane, in particolare quelle che hanno ruoli importanti nelle patologie più comuni. Le Scienze 61 DEN T RO U NA CELL U LA V I R T UALE Il simulatore in funzione Il modello al computer del batterio infettivo Mycoplasma genitalium elaborato dall’autore di questo articolo rappresenta quasi ogni aspetto della vita, della crescita e della replicazione di questo microrganismo. Nessun approccio matematico da solo può simulare ogni funzione biologica della cellula, così queste funzioni sono divise in 28 moduli distinti (indicati nella cellula in basso) coinvolti nella gestione del DNA (in viola), dell’RNA (in azzurro), delle proteine (in blu), e dell’energia, dei nutrienti e degli scarti (in rosa). Per ogni modulo è stato selezionato il metodo matematico che funziona meglio: le didascalie evidenziano diversi esempi. Il programma inizia con tutti i moduli che lavorano in una sequenza casua- le per simulare un secondo di tempo reale. Molti valori di ingresso (input) sono stati selezionati da una grande tavola delle variabili che rappresenta il loro stato iniziale, e alcuni valori sono scelti in base a intervalli e funzioni di probabilità. È possibile simulare diversi scenari alterando la configurazione di partenza. Dopo il primo passo, il programma aggiorna la tavola degli stati per rispecchiare i valori in uscita (output) di tutti i moduli. La sequenza viene fatta ripartire per un altro secondo, si aggiorna di nuovo la tavola di stati cellulari, e così via. Il ciclo continua fino a quando la cellula si duplica, muore o diventa irrealisticamente vecchia. Il metabolismo dell’energia, dei nutrienti e degli scarti è simulato usando la flux balance analysis, che sfrutta le tecniche di programmazione lineare per calcolare i tassi di reazione che ottimizzano la crescita, la produzione di energia o un’altra caratteristica a scelta. Questo metodo ipotizza che le reazioni avvengano abbastanza rapidamente da raggiungere uno stato stazionario nel tempo di un secondo di ogni ciclo della simulazione. Per evitare che i primi moduli della sequenza usino le sostanze necessarie agli altri moduli, il simulatore stima la porzione necessaria a ogni modulo, e le alloca di conseguenza. Il decadimento e il riciclo dell’RNA e delle proteine sono simulati usando processi di Poisson, che usano un generatore di numeri casuali e funzioni di probabilità per decidere se un determinato frammento di RNA o di proteina decade o sopravvive fino alla successiva iterazione del processo. Elaborazione delle proteine Traduzione dell’RNA in proteine Divisione e distribuzione delle proteine Assemblaggio dei ribosomi che producono le proteine Attivazione delle proteine Trascrizione Formazione del polimero FtsZ Condensazione Divisione del dei cromosomi contenuto della cellula Segregazione dei cromosomi Inizio della replicazione Replicazione del DNA Reattanti e prodotti del metabolismo DNA nei cromosomi Copie RNA dei segmenti di DNA Enzimi e altre proteine Nutrienti esterni La formazione dell’anello di divisione è simulata da un modello ibrido, composto di due parti. L’anello, fatto di polimeri FtsZ, cresce a formare un muro che divide in due la membrana cellulare durante la replicazione. Nella prima parte del modello, un insieme di equazioni differenziali stima la crescita per polimerizzazione dell’anello FtsZ. Nella seconda parte, un modello geometrico del ripiegamento del filamento simula l’anello, schiacciando gradualmente l’ellisse della cellula intorno all’asse mediano, finché l’organismo non si divide in due cellule figlie. La trascrizione e la traduzione genica – le fasi che producono molte delle proteine necessarie per la crescita e la duplicazione della cellula – sono simulate da algoritmi compositi che includono modelli di Markov (che seguono nel tempo gli stati degli enzimi che copiano i geni dal DNA all’RNA), il legame probabilistico di questi enzimi con il DNA e la programmazione lineare per allocare l’energia e le altre risorse. I danni e la riparazione del DNA sono simulati nello stesso modo non deterministico. 62 Le Scienze 547 marzo 2014 Illustrazione di AXS Biomedical Animation Studio; fonte: «A Whole-Cell Computational Model Predicts Phenotype from Genotype», di Jonathan R. Karr e altri, in « Cell», Vol. 150, n. 2, 20 luglio 2012. Danno del DNA Riparazione del DNA Superavvolgimento del DNA Formazione dei complessi di proteine Regolazione della trascrizione Interazione con l’ospite Decadimento delle proteine Elaborazione dell’RNA Metabolismo Assemblaggio della struttura di ancoraggio all’ospite Modificazione delle proteine re quando altri geni essenziali sono spenti. Quei cicli aggiuntivi di replicazione possono aver avvenire tutte le volte che la cellu­ la accumula più copie delle proteine codificate dal gene rispet­ to alle copie necessarie in un ciclo vitale: la quantità in eccesso è trasmessa ai discendenti, che muoiono solo quando finiscono le scorte. Questi risultati iniziali sono molto interessanti, ma potreb­ bero volerci anni per capire tutto quello che ci dicono le simula­ zioni riguardo al funzionamento di questi microrganismi e più in generale delle cellule. Il nostro lavoro con Mycoplasma genitalium è solo il primo dei numerosi passi sulla strada della modellizzazione al computer di cellule e tessuti umani al livello di geni e molecole. Il modello che abbiamo oggi è tutt’altro che perfetto, e i micoplasmi sono il li­ mite della semplicità delle forme di vita. Abbiamo reso disponi­ bili gratuitamente on line tutte le simulazioni, il codice sorgente, la base di conoscenza (knowledge base), il codice di visualizzazio­ ne e i dati sperimentali, e noi e altri ri­ cercatori siamo già al lavoro per mi­ gliorare il simulatore ed estenderlo a una serie di organismi, come Escherichia coli e il lievito Saccharomyces cerevisiae, entrambi estremamente diffu­ si nei laboratori accademici e in quelli industriali. In queste specie la regolazione dei geni è molto più complessa, e la col­ locazione spaziale dei fenomeni nella cellula è molto più importante. Quan­ do saremo riusciti a risolvere questi problemi prevedo che l’obiettivo suc­ cessivo saranno le cellule murine o umane: probabilmente una cellula co­ me un macrofago (una cellula di difesa del sistema immunitario), che può es­ sere facilmente coltivata e usata come fonte di dati per modulare e validare il modello. Non so quanto siamo lontani oggi da una tecnologia del gene­ re. In confronto ai batteri, le cellule umane hanno molte più suddi­ visioni e mostrano un controllo genetico assai più grande, di cui in larga parte non sappiamo nulla. Inoltre, come parte della squadra di un tessuto multicellulare, le cellule umane – rispetto ai batteri – interagiscono molto più strettamente con altri tipi cellulari. Il 13 febbraio 2008 avrei detto che mancava almeno una deci­ na d’anni per arivare alla modellizzazione della cellula più sem­ plice, e non avrei neppure preso in considerazione il tentativo di simulare nulla di più complesso. Ora possiamo almeno pensare di tentare la simulazione di una cellula umana, anche solo per vede­ re come sbaglia il programma: il che ci farà vedere quali sono le tante cose che ancora dobbiamo imparare sulle nostre stesse cel­ lule. E non sarebbe poco. n Mentre guardavo pagine di grafici e visualizzazioni, il cuore batteva sempre più veloce. Il modello funzionava. Che cosa ci avrebbe insegnato? Ripiegamento delle proteine tRNA che si lega agli Decadimento amminoacidi dell’RNA Modificazione dell’RNA Input dall’ambiente esterno scatto prima di aggiornare l’insieme delle variabili cellulari. Il mo­ dello avrebbe fotografato tutta l’interdipendenza della biochimi­ ca, per esempio la necessità dell’energia e dei nucleotidi prodot­ ti dal metabolismo per la trascrizione genica e la sintesi del DNA, ma solo a scale temporali più grandi di un secondo. Non avevamo alcuna prova teorica che tutto ciò avrebbe fun­ zionato: era tutto sulla fiducia. Costruendo la nostra cellula virtuale, avevamo inserito sensori software per misurare ciò che stava succedendo all’interno. Ogni simulazione, che copriva l’intero ciclo vitale di una cellula, ma­ cinava 500 megabyte di dati. I risultati numerici arrivavano a un pannello di controllo: un insieme di decine di grafici e immagini che stampati riempivano un intero raccoglitore. I primi risultati erano frustranti. Per mesi, mentre corregge­ vamo il codice, affinavamo la matematica e per i parametri ag­ giungevamo vincoli migliori derivati dal lavoro di laboratorio, la cellula si rifiutava di dividersi o si comportava in modo bizzarro. Per un certo periodo, per esempio, produceva grandi quantità dell’amminoacido ala­ nina e poco altro. Poi, un giorno, il nostro germe ci­ bernetico ha raggiunto la fine del suo ciclo cellulare e si è diviso con succes­ so. E il tempo di replicazione era di cir­ ca nove ore, proprio come M. genitalium reale! Altri parametri erano ancora lontani dalla realtà, ma sen­ tivamo che il successo era ormai alla nostra portata. Mesi dopo ero a una conferenza di due giorni a Bethesda quando tra una sessione e l’altra mi hanno chiama­ to dalla reception dell’albergo: «Dot­ tor Covert? È arrivato questo pacco per lei». Tornato in stanza, ho aperto la scatola e ho estratto il raccoglitore. Nelle ore successi­ ve ho esaminato le centinaia di pagine, grafici e visualizzazioni complesse, con il cuore che batteva sempre più rapidamente. Gran parte dei dati sembravano quelli di una cellula reale che cresce. E il resto era interessante: inaspettato, ma biologicamente plausi­ bile. In quel momento ho capito che avevamo raggiunto la cima della montagna che anni fa incombeva su tutti noi. Il primo mo­ dello al computer di un intero organismo vivente funzionava. Che cosa ci avrebbe insegnato? Una finestra nella vita della cellula Un anno dopo aver applicato il nostro nuovo strumento os­ serviamo ancora fenomeni affascinanti all’interno dei meccani­ smi del nostro microrganismo virtuale, mentre gestisce i milio­ ni di dettagli implicati dalla vita e dalla divisione. Abbiamo visto, con nostra sorpresa, che le proteine si espellono tra loro dal DNA incredibilmente spesso: circa 30.000 volte nelle nove ore del ci­ clo vitale. Abbiamo anche scoperto che il tasso molto stabile di riproduzione del microbo è in realtà una proprietà emergen­ te che deriva dall’interazione complessa tra due distinte fasi della replicazione, ognuna delle quali ha una durata indipendente mol­ to variabile. I dati registrati secondo per secondo del comporta­ mento cellulare ci hanno permesso di spiegare il motivo per cui la cellula smette di dividersi immediatamente quando certi geni sono disattivati ma si riproduce altre dieci volte prima di mori­ www.lescienze.it per approfondire The Dawn of Virtual Cell Biology. Freddolino P.L. e Tavazoie S., in «Cell», Vol. 150, n. 2, pp. 248–250, 20 luglio 2012. A Whole-Cell Computational Model Predicts Phenotype from Genotype. Karr J.R. e altri, in «Cell», Vol. 150, n. 2, pp. 389–401, 20 luglio 2012. Bridging the Layers: Toward Integration of Signal Transduction, Regulation and Metabolism into Mathematical Models. Gonçalves E. e altri, in «Molecular Biosystems», Vol. 9, n. 7, pp. 1576–1583, luglio 2013. Cellule simulate. Gibbs W.W., in «Le Scienze», n. 397, settembre 2001. Le Scienze 63