Con il primo modello al computer di un organismo unicellulare, i

Bioingegneria
Sim(U) lare
una cellula
2
vivente
1
2
3
4
André Kutscherauer
Con il
primo modello
al computer di un
organismo unicellulare,
i biologi hanno realizzato
una nuova e potente
categoria di strumenti
per capire come
funziona la vita
di Markus W. Covert
56 Le Scienze
547 marzo 2014
www.lescienze.it
Le Scienze 57
Markus W. Covert è assistant professor
di bioingegneria alla Stanford University, dove dirige
un laboratorio dedicato alla biologia dei sistemi.
L’
intuizione cruciale l’ho avuta mentre tornavo a casa in bici, il giorno di San Va­
lentino del 2008. Mentre pedalavo, la mente girava attorno a un problema che
aveva occupato me e altri colleghi per oltre dieci anni. È possibile simulare la
vita con un programma, includendo tutta la meravigliosa, misteriosa e incredi­
bilmente complessa biochimica che la fa funzionare? Un modello computeriz­
zato di cellule viventi, anche se lacunoso e poco accurato, sarebbe uno strumento assai utile. I biologi
potrebbero testare idee sperimentali prima di impegnare tempo e denaro per farlo realmente in labora­
torio. Gli scienziati che sviluppano farmaci, per esempio, potrebbero accelerare la ricerca di nuovi anti­
biotici, individuando molecole la cui inibizione uccide un batterio.
I bioingegneri come me potrebbero trapiantare e ricollegare
i geni dei microrganismi virtuali per progettare ceppi modifica­
ti con caratteristiche speciali: per esempio, diventare fluorescen­
ti se infettati da un certo virus, oppure capaci di estrarre idrogeno
dal petrolio. Tutto questo senza i rischi che comporta l’alterazione
di microrganismi reali. Se capissimo come ottenere modelli suffi­
cientemente sofisticati per simulare le cellule umane, questi stru­
menti potrebbero trasformare la ricerca medica permettendo agli
scienziati di effettuare studi oggi impossibili perché ancora non si
riescono a coltivare molti tipi di cellule umane.
Tutto questo sarebbe rimasto solo una fantasia se non si fosse
riusciti a sbrogliare la ragnatela di reazioni chimiche e di connes­
sioni fisiche che fanno funzionare le cellule viventi. Molti tentati­
vi precedenti, sia nel mio laboratorio della Stanford University sia
in quelli di altri colleghi, avevano incontrato ostacoli insormonta­
bili. Alcuni avevano fallito del tutto.
Ma mentre pedalavo lentamente nel campus in quella sera
d’inverno pensavo al lavoro che facevo in quel periodo: registra­
re immagini e video di singole cellule viventi. In quel momento
ho avuto l’illuminazione per creare un simulatore semplice e fun­
zionale: scegliere uno dei microrganismi unicellulari più semplici
esistenti, un batterio chiamato Mycoplasma genitalium, e costrui­
re un modello di uno di questi germi. Limitare la simulazione a
una sola cellula avrebbe semplificato il problema a sufficienza. In
questo modo teoricamente avremmo potuto includere ogni even­
to biologico che sappiamo verificarsi nelle cellule: l’apertura della
doppia elica del DNA; la trascrizione dei messaggi del DNA in una
copia di RNA, la produzione di ogni enzima e delle proteine in ba­
se alle istruzioni contenute nell’RNA, e l’interazione tra ognuno di
questi attori e molti altri, tutti impegnati a far crescere la cellula e
infine a farla dividere in due «figlie». La simulazione avrebbe ge­
nerato, quasi da zero, l’intero film della vita unicellulare.
I tentativi precedenti avevano sempre puntato a simulare un’in­
tera colonie di cellule, perché è da lì che provengono quasi tutti i
In breve
I modelli al computer in grado di
simulare la funzione di ogni gene e
molecola in una cellula potrebbero
rivoluzionare il nostro modo di
58 Le Scienze
studiare, capire e progettare i
sistemi biologici.
Una simulazione completa di un
comune batterio infettivo è stata
completata l’anno scorso, e per
quanto imperfetta sta già generando
nuove scoperte.
I ricercatori ora sono al lavoro su
modelli di organismi più complessi.
L’obiettivo a lungo termine è
simulare le cellule e gli organi umani
con un dettaglio confrontabile.
547 marzo 2014
dati che abbiamo sul comportamento cellulare: dalle popolazioni,
non dai singoli microbi. Tuttavia lo sviluppo sia delle biotecnolo­
gie sia dell’informatica ha iniziato a rendere lo studio delle singole
cellule molto più facile. Avevo capito di avere finalmente a dispo­
sizione gli strumenti per tentare un approccio diverso.
Le idee mi frullavano in testa: appena arrivato a casa ho abboz­
zato progetti per un simulatore. La mattina dopo ho cominciato a
scrivere il codice del programma per un paio dei tanti processi di­
versi che avvengono in un microrganismo. Dopo una settimana
avevo completato molti moduli sperimentali: ognuno era una rap­
presentazione di un particolare processo cellulare. I moduli produ­
cevano risultati che sembravano piuttosto realistici.
Ho mostrato il lavoro a diversi colleghi biologi: la maggior
parte di essi pensava che fossi pazzo. Ma sentivo di aver trova­
to qualcosa, e due dottorandi audaci ed eccezionali, Jonathan R.
Karr e Jayodita C. Sanghvi, hanno visto potenzialità sufficienti
nell’approccio da lavorare con me al progetto.
Completare il modello significava produrre decine di questi mo­
duli, cercare i dati biochimici su un migliaio di articoli scientifici
e poi usare quei valori per vincolare e modificare migliaia di pa­
rametri, come la forza del legame di un enzima al suo substrato, o
quanto spesso le proteine che leggono il DNA si spingono via l’u­
na con l’altra dalla doppia elica. Sospettavo che anche con il dili­
gente aiuto di collaboratori e dottoran­
di il progetto avrebbe richiesto anni:
ma sentivo anche che alla fine avrebbe
funzionato. Non c’era modo di saperlo
con certezza: bisognava provare.
Una sfida grandiosa
Quando ho mostrato
una parte del codice
a dei colleghi biologi,
in tanti hanno
pensato che fossi
pazzo. Tuttavia
sentivo di aver
trovato qualcosa
Nel decidere di scalare questa mon­
tagna ci siamo ispirati al ricercatore
che per primo aveva sognato di mo­
dellizzare la vita. Nel 1984 Harold Mo­
rowitz, all’epoca alla Yale University,
aveva tracciato la strada, osservando
che i batteri più semplici che i biolo­
gi erano riusciti a coltivare, i micopla­
smi, erano il logico punto di partenza.
Oltre a essere molto piccoli e relativa­
mente semplici, due specie di Mycoplasma causano malattie negli esseri umani: M. genitalium è un
germe parassita trasmesso sessualmente che prospera nel tratto
urinario e vaginale; M. pneumoniae può causare la polmonite ati­
pica. Un modello di una delle due specie poteva essere molto utile
per la medicina, non solo come fonte di nuove conoscenze di bio­
logia fondamentale.
Il primo passo, proponeva Morowitz, avrebbe dovuto essere il
sequenziamento del genoma del microrganismo scelto. Craig Ven­
ter e colleghi dell’Institute for Genomic Research (TIGR) hanno
completato il genoma di M. genitalium nel 1995; ha solo 525 geni
(mentre le cellule umane ne hanno oltre 20.000).
Ero un dottorando a San Diego quando, quattro anni dopo, il
gruppo del TIGR aveva concluso che solo 400 di quei geni sono
essenziali per la vita (almeno finché i microrganismi crescono in
un terreno di coltura ricco). Venter e collaboratori hanno poi fon­
dato Celera, e hanno fatto a gara con il governo degli Stati Uni­
ti per sequenziare il genoma umano. Hanno sintetizzato i geni es­
senziali di una delle specie di Mycoplasma e ne hanno mostrato il
funzionamento in una cellula.
www.lescienze.it
Per me e altri giovani biologi della fine degli anni novanta,
questo gruppo era come i Led Zeppelin: personalità iconoclaste e
sopra le righe che suonavano musica che non avevamo mai ascol­
tato prima. Clyde Hutchinson, uno dei biologi del gruppo di Ven­
ter, ha dichiarato che la prova finale della nostra conoscenza delle
cellule semplici sarebbe arrivata quando qualcuno le avrebbe mo­
dellizzate al computer. Puoi costruire una cellula funzionale in la­
boratorio combinando pezzi senza capire ogni dettaglio di come si
incastrino tra loro. Per il programma, questo non basta.
Anche Morowitz aveva invitato i colleghi scienziati a creare
un simulatore cellulare basandosi sui dati genomici di Mycoplasma. Sosteneva che «ogni esperimento che possa essere effettuato
in laboratorio può essere effettuato anche al computer. La misura
in cui i risultati sperimentali e quelli della simulazione corrispon­
dono è la misura della completezza del paradigma della biologia
molecolare», cioè della nostra teoria su come il DNA e le altre bio­
molecole della cellula interagiscono per produrre la vita come la
conosciamo. In altre parole, mentre mettiamo insieme le tessere
del puzzle diventa più evidente quali siano i pezzi e le interazioni
mancanti nella nostra teoria.
Per quanto i sequenziatori ad alta efficienza e gli strumenti di
laboratorio robotizzati abbiano notevolmente accelerato la ricer­
ca dei pezzi mancanti, la valanga di sequenze di DNA e gli sche­
mi di attività genetica che producono
non sono forniti di spiegazione su co­
me le diverse parti vadano messe in­
sieme. Il pioniere della genetica Sidney
Brenner ha battezzato questa biologia
«a basso input, ad alta elaborazione,
senza output», perché troppo spesso gli
esperimenti non sono basati su ipote­
si e generano poche nuove informazio­
ni sui sistemi più grandi che fanno fun­
zionare (o malfunzionare) la vita.
Questa situazione spiega in parte il
motivo per cui, nonostante le tante no­
tizie riguardanti la scoperta di geni as­
sociati a cancro, obesità o diabete, le
cure per queste malattie siano elusive
al limite della frustrazione. È diventato
chiaro che le soluzioni arriveranno so­
lo quando riusciremo a districarci tra le decine o addirittura cen­
tinaia di fattori che interagiscono, a volte in modi poco intuitivi,
per causare queste malattie.
I pionieri della modellizzazione cellulare avevano capito che le
simulazioni di intere cellule che includessero tutti i componenti
cellulari e le loro reti di interazioni sarebbero state strumenti molto
potenti per dare un significato a questi dati scollegati e confusi. Per
sua natura, un simulatore di un’intera cellula sarebbe stato il distil­
lato di un insieme coerente di ipotesi su ciò che accade dentro una
cellula, sotto forma di algoritmi matematici rigorosi.
I disegni schematici che spesso si vedono negli articoli delle ri­
viste scientifiche, in cui il fattore X regola il gene Y – più o meno
– non raggiungono neanche lontanamente la precisione necessa­
ria per il programma. I programmatori esprimono questi proces­
si come equazioni (un esempio semplice: Y = aX + b) anche se de­
vono fare ipotesi ragionate sui valori di variabili come a e b. Alla
fine questa necessità di precisione evidenzia gli esperimenti di la­
boratorio che devono essere effettuati per colmare le lacune nella
conoscenza di tempi di reazione e altre quantità.
Le Scienze 59
Allo stesso tempo, era chiaro che una volta che i modelli fosse­
ro stati verificati avrebbero preso il posto di alcuni esperimenti, ri­
sparmiando il dispendioso lavoro di laboratorio per questioni che
non possono essere risolte dalla sola simulazione. Ed esperimenti
simulati che generassero risultati sorprendenti aiuterebbero i ri­
cercatori a identificare le giuste priorità nel loro lavoro, accele­
rando il processo di scoperta scientifica. I modelli offrono stru­
menti così invitanti per cercare le catene causali al punto che nel
2001 Masaru Tomita della Keio University, in Giappone, ha bat­
tezzato la simulazione di un’intera cellula «una grandiosa sfida
del XXI secolo».
Ancora dottorando ero impressionato dai primi risultati rag­
giunti dai principali simulatori di cellule dell’epoca (si veda il box
nella pagina fronte), e per me questa grandiosa sfida era diventa­
ta un’ossessione. Anche mentre mettevo in piedi il laboratorio ero
concentrato sulle tecniche per ottenere immagini e filmati di sin­
gole cellule, la sfida era nei miei pensieri. E poi, durante quella pe­
dalata verso casa di febbraio, ho capito come vincerla.
Due intuizioni fondamentali
Era chiaro che prima che si potesse simulare il ciclo vitale di
una specie microbica abbastanza accuratamente da imitarne i
comportamenti complessi e fare nuove scoperte, avremmo dovuto
risolvere tre problemi. Primo, era necessario codificare in formu­
le matematiche e algoritmi informati­
ci tutte le funzioni rilevanti, dai flus­
si di energia, nutrienti e prodotti delle
reazioni all’interno della cellula, alla
sintesi e alla decomposizione di DNA,
RNA e proteine, fino all’attività di una
miriade di enzimi. Secondo, avremmo
dovuto trovare una piattaforma gene­
rale per integrare tutte queste funzioni.
Il problema finale era per molti versi il
più difficile: stabilire i limiti superiori e
inferiori per ognuno dei circa 1700 pa­
rametri del modello in modo che aves­
sero valori biologicamente realistici, o
almeno del giusto ordine di grandezza.
Avevo capito che per quanto potes­
simo esplorare con attenzione le ricer­
che passate su M. genitalium e le stret­
te relazioni tra i diversi parametri (alla
fine Karr, Sanghvi e io abbiamo passa­
to due anni raccogliendo dati da circa 900 articoli), avremmo do­
vuto basarci su ipotesi ragionate o su risultati di esperimenti effet­
tuati su batteri diversi, come Escherichia coli, per ottenere alcuni
dati: per esempio quanto tempo in media i trascritti RNA riman­
gono in giro nella cellula prima che gli enzimi li facciano a pezzi
per riciclarli. Senza un modo di vincolare e controllare queste ipo­
tesi, non avevamo speranze di successo.
In quel momento eureka! del 2008, ho capito che modellare
una singola cellula, invece che un gruppo di cellule, come ave­
vano fatto quasi tutti gli studi precedenti, avrebbe potuto darci i
vincoli che cercavamo. Consideriamo la crescita e la riproduzio­
ne. Una grande popolazione di cellule cresce incrementalmente, e
la nascita e la morte di una cellula non cambiano di molto le co­
se. Ma per una cellula sola la divisione è un evento drammatico.
Prima di dividersi, l’organismo deve raddoppiare la propria mas­
sa, non solo la sua massa totale. La quantità di DNA, di membra­
na cellulare e di ogni proteina necessaria alla sopravvivenza deve
raddoppiare. Se il modello è limitato a una sola cellula, il compu­
ter può davvero contare e seguire ogni molecola lungo l’intero ci­
clo cellulare. Può controllare se tutti i numeri si bilanciano quan­
do una cellula si sdoppia.
Inoltre, una singola cellula si riproduce essenzialmente a un
tasso costante. M. genitalium, per esempio, tipicamente si divide
ogni 9 o 10 ore in un normale ambiente di laboratorio. Raramen­
te ci vogliono meno di 6 ore o più di 15. La necessità della cellu­
la di duplicare tutto il suo contenuto in questa finestra temporale
ristretta ci avrebbe permesso di scegliere un intervallo plausibilie
per molte variabili altrimenti indeterminate, come quelle che con­
trollano il momento d’inizio della replicazione cellulare.
Ho messo insieme un gruppo di fisici, biologi, esperti di mo­
delli e addirittura un ingegnere del software che aveva lavorato a
Goo­gle e abbiamo discusso quali approcci matematici seguire. Mi­
chael Schuler, un ingegnere biomedico della Cornell University
che era un pioniere della simulazione cellulare, ha costruito mo­
delli impressionanti con normali equazioni differenziali. Bernhard
Palsson, con il quale avevo studiato a San Diego, aveva sviluppa­
to una tecnica potente, chiamata flux balance analysis, che fun­
zionava bene per modellare il metabolismo. Ma altri hanno di­
mostrato che il caso è un elemento importante nella trascrizione
genica, e la divisione cellulare ovviamente implica un cambia­
mento nella geometria della membra­
na cellulare; quei metodi non avreb­
bero affrontato questi aspetti. Già
durante il dottorato avevo capito che
nessuna tecnica da sola avrebbe potu­
to modellizzare tutte le funzioni di una
cellula: la mia tesi di dottorato aveva
proprio dimostrato un modo per colle­
gare due approcci matematici distinti
in un unico simulatore.
Abbiamo quindi deciso di creare il
modello cellulare come un insieme di
28 moduli distinti, ognuno dei qua­
li usa l’algoritmo migliore per i proces­
si biologici e per la conoscenza che ab­
biamo dei processi stessi (si veda il box
a p. 62). Questa strategia ha portato a
una raccolta di procedure matemati­
che: dovevamo trovare il modo di col­
legare tutto in un unico insieme coeso.
Mi è tornato in mente un corso di progettazione di impianti chi­
mici che avevo frequentato da studente. Come progetto finale ave­
vamo usato un pacchetto di simulazione molto potente chiamato
HYSIS per progettare una grande raffineria. HYSYS permetteva di
prevedere un contenitore separato per ogni reazione principale. Al­
cuni tubi portavano poi il prodotto di ogni contenitore verso gli al­
tri contenitori. Questo sistema combinava molti tipi diversi di ope­
razioni chimiche in un sistema ordinato e prevedibile.
Questo approccio, con qualche modifica, avrebbe potuto fun­
zionare per il nostro simulatore cellulare se avessi deciso di fare
un’ipotesi importante che avrebbe semplificato le cose: per quanto
tutti questi processi biologici avvengano simultaneamente in una
cellula vivente, le loro azioni sono effettivamente indipendenti su
periodi inferiori a un secondo. Prendendo per buona questa ipote­
si, avremmo potuto dividere la vita della cellula in scatti da un se­
condo, e far funzionare ognuno dei 28 moduli, in ordine, per uno
cronologia
Le tappe della
simulazione
cellulare
La lunga strada fino al primo modello funzionante di una singola cellula di un semplice batterio,
Mycoplasma genitalium, è stata tracciata in base
agli sforzi teorici, genetici e di modellizzazione di
altri ricercatori. Progettare un modello al computer di una cellula umana è sicuramente un compito ancora più difficile, data la maggiore complessità delle cellule dei mammiferi. Le cellule umane,
per esempio, contengono quasi 40 volte il numero di geni del micoplasma, impacchettati in cromosomi molto più intricati per la loro struttura fisica e per l’informazione che contengono. Qui
sotto sono elencati anche alcuni dei passi cruciali
che dovranno essere compiuti.
Il batterio unicellulare Mycoplasma
genitalium (corpi viola) è una forma
di vita semplice. Ma modellizzare il suo
ciclo di vita non è stato facile.
Il nostro modello
cellulare è composto
da diversi moduli
che usano l’algoritmo
migliore per
i processi biologici
e per la conoscenza
che abbiamo
dei processi
60 Le Scienze
547 marzo 2014
1967
Francis Crick e Sidney Brenner
formulano e propongono «Project
K: The Complete Solution of
Escherichia coli» uno sforzo per
arrivare al «progetto» di questo
comune batterio intestinale,
compresi i dettagli della sua
genetica, gestione energetica e
riproduzione.
1984
Harold Morowitz, allora alla Yale
University, delinea un progetto per
sequenziare e modellizzare un
batterio del genere Mycoplasma.
1984
Science Source
Michael Schuler, della Cornell
University, presenta un modello
al computer che usa equazioni
differenziali per descrivere gran
parte dei principali processi biologici
coinvolti nella crescita di una cellula
di E. coli. Il modello non era in grado
di includere l’attività al livello dei
geni, perché il genoma di E. coli non
era ancora stato sequenziato.
1989-1990
Bernhard Palsson dell’Università
www.lescienze.it
del Michigan crea un modello
dettagliato del metabolismo dei
globuli rossi umani che comprende
gli effetti della variazione del pH e
di un basso livello di glucosio nel
sangue.
1995
Craig Venter del TIGR e i suoi
collaboratori completano la
sequenza del genoma di M.
genitalium.
ha difficoltà a manipolare le cellule
B in coltura.
2002
Palsson, George Church
della Harvard University e Covert,
insieme a molti altri, completano
un modello su scala genomica
del metabolismo di Helicobacter
pylori, un batterio che infetta
gli umani e può causare l’ulcera
e il cancro allo stomaco.
1999
2004
Masaru Tomita e il suo gruppo
della Keio University in Giappone
costruiscono E-cell, un sistema
di modellizzazione delle cellule
basato su equazioni differenziali che
include 127 geni, gran parte dei
quali di M. genitalium.
2002
Palsson e Covert, insieme ad altri
tre colleghi, pubblicano un modello
computazionale di tutti i 1010
geni coinvolti nella regolazione del
metabolismo e della trascrizione
del DNA di E. coli, mostrando che il
modello prevede accuratamente i
risultati degli esperimenti effettuati
in laboratorio sui batteri reali.
L’Alliance for Cellular Signalling,
una vasta collaborazione di circa
50 ricercatori, lancia un ambizioso
progetto decennale da 10 milioni
di dollari per simulare le cellule B
del sistema immunitario e le cellule
del miocardio nel topo. Il progetto
produce dati molto interessanti ma
Covert e colleghi pubblicano un
modello di tutta la cellula di M.
genitalium. Per la prima volta
vengono simulati tutti i processi
genici e biochimici noti in un
organismo autoreplicante.
2012
2013
Covert e collaboratori mostrano che
il modello prevede con precisione
l’attività di molti enzimi.
NEL FUTURO
Completare un modello cellulare di
un batterio più rappresentativo e
meglio studiato, come E. coli.
Modellizzare un eucariote
unicellulare, come il lievito
Saccharomyces cerevisiae. In un
eucariote, il DNA è impacchettato in
un nucleo chiuso da una membrana,
e non libero di spostarsi nella cellula
come in un batterio.
Costruire un modello di una cellula
animale che può essere facilmente
coltivata, come un macrofago
(un tipo di cellula del sistema
immunitario) del topo.
Costruire una prima bozza di
un modello di cellula umana,
probabilmente di nuovo un
macrofago.
Modellizzare altri tipi di cellule
umane, in particolare quelle
che hanno ruoli importanti nelle
patologie più comuni.
Le Scienze 61
DEN T RO U NA CELL U LA V I R T UALE
Il simulatore in funzione
Il modello al computer del batterio infettivo Mycoplasma genitalium elaborato dall’autore di questo articolo rappresenta quasi ogni aspetto della vita, della crescita e della replicazione di questo microrganismo. Nessun
approccio matematico da solo può simulare ogni funzione biologica della
cellula, così queste funzioni sono divise in 28 moduli distinti (indicati nella
cellula in basso) coinvolti nella gestione del DNA (in viola), dell’RNA (in azzurro), delle proteine (in blu), e dell’energia, dei nutrienti e degli scarti (in
rosa). Per ogni modulo è stato selezionato il metodo matematico che funziona meglio: le didascalie evidenziano diversi esempi.
Il programma inizia con tutti i moduli che lavorano in una sequenza casua-
le per simulare un secondo di tempo reale. Molti valori di ingresso (input)
sono stati selezionati da una grande tavola delle variabili che rappresenta
il loro stato iniziale, e alcuni valori sono scelti in base a intervalli e funzioni di probabilità. È possibile simulare diversi scenari alterando la configurazione di partenza.
Dopo il primo passo, il programma aggiorna la tavola degli stati per rispecchiare i valori in uscita (output) di tutti i moduli. La sequenza viene fatta ripartire per un altro secondo, si aggiorna di nuovo la tavola di stati cellulari,
e così via. Il ciclo continua fino a quando la cellula si duplica, muore o diventa irrealisticamente vecchia.
Il metabolismo dell’energia, dei nutrienti e degli scarti è simulato usando la
flux balance analysis, che sfrutta le tecniche di programmazione lineare per
calcolare i tassi di reazione che ottimizzano la crescita, la produzione di
energia o un’altra caratteristica a scelta. Questo metodo ipotizza che le
reazioni avvengano abbastanza rapidamente da raggiungere uno stato
stazionario nel tempo di un secondo di ogni ciclo della simulazione. Per
evitare che i primi moduli della sequenza usino le sostanze necessarie agli
altri moduli, il simulatore stima la porzione necessaria a ogni modulo, e le
alloca di conseguenza.
Il decadimento e il riciclo dell’RNA e delle proteine sono simulati usando
processi di Poisson, che usano un generatore di numeri casuali e funzioni di
probabilità per decidere se un determinato frammento di RNA o di proteina
decade o sopravvive fino alla successiva iterazione del processo.
Elaborazione
delle proteine
Traduzione
dell’RNA
in proteine
Divisione e
distribuzione
delle proteine
Assemblaggio
dei ribosomi che
producono le proteine
Attivazione
delle proteine
Trascrizione
Formazione
del polimero
FtsZ
Condensazione Divisione del
dei cromosomi contenuto
della cellula
Segregazione
dei cromosomi
Inizio della
replicazione
Replicazione
del DNA
Reattanti e prodotti del metabolismo
DNA nei cromosomi
Copie RNA dei segmenti di DNA
Enzimi e altre proteine
Nutrienti esterni
La formazione dell’anello di divisione è simulata da un modello
ibrido, composto di due parti. L’anello, fatto di polimeri FtsZ,
cresce a formare un muro che divide in due la membrana
cellulare durante la replicazione. Nella prima parte del modello, un
insieme di equazioni differenziali stima la crescita per
polimerizzazione dell’anello FtsZ. Nella seconda parte, un modello
geometrico del ripiegamento del filamento simula l’anello,
schiacciando gradualmente l’ellisse della cellula intorno all’asse
mediano, finché l’organismo non si divide in due cellule figlie.
La trascrizione e la traduzione genica – le fasi che producono molte delle proteine
necessarie per la crescita e la duplicazione della cellula – sono simulate da algoritmi
compositi che includono modelli di Markov (che seguono nel tempo gli stati degli enzimi
che copiano i geni dal DNA all’RNA), il legame probabilistico di questi enzimi con il DNA e
la programmazione lineare per allocare l’energia e le altre risorse.
I danni e la riparazione del DNA sono simulati nello stesso modo non deterministico.
62 Le Scienze
547 marzo 2014
Illustrazione di AXS Biomedical Animation Studio; fonte: «A Whole-Cell Computational Model Predicts Phenotype
from Genotype», di Jonathan R. Karr e altri, in « Cell», Vol. 150, n. 2, 20 luglio 2012.
Danno
del DNA
Riparazione
del DNA
Superavvolgimento
del DNA
Formazione
dei complessi
di proteine
Regolazione
della trascrizione
Interazione
con l’ospite
Decadimento
delle proteine
Elaborazione
dell’RNA
Metabolismo
Assemblaggio
della struttura
di ancoraggio
all’ospite
Modificazione
delle proteine
re quando altri geni essenziali sono spenti. Quei cicli aggiuntivi
di replicazione possono aver avvenire tutte le volte che la cellu­
la accumula più copie delle proteine codificate dal gene rispet­
to alle copie necessarie in un ciclo vitale: la quantità in eccesso è
trasmessa ai discendenti, che muoiono solo quando finiscono le
scorte. Questi risultati iniziali sono molto interessanti, ma potreb­
bero volerci anni per capire tutto quello che ci dicono le simula­
zioni riguardo al funzionamento di questi microrganismi e più in
generale delle cellule.
Il nostro lavoro con Mycoplasma genitalium è solo il primo dei
numerosi passi sulla strada della modellizzazione al computer di
cellule e tessuti umani al livello di geni e molecole. Il modello che
abbiamo oggi è tutt’altro che perfetto, e i micoplasmi sono il li­
mite della semplicità delle forme di vita. Abbiamo reso disponi­
bili gratuitamente on line tutte le simulazioni, il codice sorgente,
la base di conoscenza (knowledge base), il codice di visualizzazio­
ne e i dati sperimentali, e noi e altri ri­
cercatori siamo già al lavoro per mi­
gliorare il simulatore ed estenderlo a
una serie di organismi, come Escherichia coli e il lievito Saccharomyces cerevisiae, entrambi estremamente diffu­
si nei laboratori accademici e in quelli
industriali.
In queste specie la regolazione dei
geni è molto più complessa, e la col­
locazione spaziale dei fenomeni nella
cellula è molto più importante. Quan­
do saremo riusciti a risolvere questi
problemi prevedo che l’obiettivo suc­
cessivo saranno le cellule murine o
umane: probabilmente una cellula co­
me un macrofago (una cellula di difesa
del sistema immunitario), che può es­
sere facilmente coltivata e usata come fonte di dati per modulare
e validare il modello.
Non so quanto siamo lontani oggi da una tecnologia del gene­
re. In confronto ai batteri, le cellule umane hanno molte più suddi­
visioni e mostrano un controllo genetico assai più grande, di cui in
larga parte non sappiamo nulla. Inoltre, come parte della squadra
di un tessuto multicellulare, le cellule umane – rispetto ai batteri –
interagiscono molto più strettamente con altri tipi cellulari.
Il 13 febbraio 2008 avrei detto che mancava almeno una deci­
na d’anni per arivare alla modellizzazione della cellula più sem­
plice, e non avrei neppure preso in considerazione il tentativo di
simulare nulla di più complesso. Ora possiamo almeno pensare di
tentare la simulazione di una cellula umana, anche solo per vede­
re come sbaglia il programma: il che ci farà vedere quali sono le
tante cose che ancora dobbiamo imparare sulle nostre stesse cel­
lule. E non sarebbe poco.
n
Mentre guardavo
pagine di grafici e
visualizzazioni,
il cuore batteva
sempre più veloce.
Il modello
funzionava. Che cosa
ci avrebbe insegnato?
Ripiegamento
delle proteine
tRNA che
si lega agli
Decadimento
amminoacidi
dell’RNA Modificazione
dell’RNA
Input
dall’ambiente
esterno
scatto prima di aggiornare l’insieme delle variabili cellulari. Il mo­
dello avrebbe fotografato tutta l’interdipendenza della biochimi­
ca, per esempio la necessità dell’energia e dei nucleotidi prodot­
ti dal metabolismo per la trascrizione genica e la sintesi del DNA,
ma solo a scale temporali più grandi di un secondo.
Non avevamo alcuna prova teorica che tutto ciò avrebbe fun­
zionato: era tutto sulla fiducia.
Costruendo la nostra cellula virtuale, avevamo inserito sensori
software per misurare ciò che stava succedendo all’interno. Ogni
simulazione, che copriva l’intero ciclo vitale di una cellula, ma­
cinava 500 megabyte di dati. I risultati numerici arrivavano a un
pannello di controllo: un insieme di decine di grafici e immagini
che stampati riempivano un intero raccoglitore.
I primi risultati erano frustranti. Per mesi, mentre corregge­
vamo il codice, affinavamo la matematica e per i parametri ag­
giungevamo vincoli migliori derivati dal lavoro di laboratorio,
la cellula si rifiutava di dividersi o si
comportava in modo bizzarro. Per un
certo periodo, per esempio, produceva
grandi quantità dell’amminoacido ala­
nina e poco altro.
Poi, un giorno, il nostro germe ci­
bernetico ha raggiunto la fine del suo
ciclo cellulare e si è diviso con succes­
so. E il tempo di replicazione era di cir­
ca nove ore, proprio come M. genitalium reale! Altri parametri erano
ancora lontani dalla realtà, ma sen­
tivamo che il successo era ormai alla
nostra portata.
Mesi dopo ero a una conferenza di
due giorni a Bethesda quando tra una
sessione e l’altra mi hanno chiama­
to dalla reception dell’albergo: «Dot­
tor Covert? È arrivato questo pacco per lei». Tornato in stanza, ho
aperto la scatola e ho estratto il raccoglitore. Nelle ore successi­
ve ho esaminato le centinaia di pagine, grafici e visualizzazioni
complesse, con il cuore che batteva sempre più rapidamente. Gran
parte dei dati sembravano quelli di una cellula reale che cresce. E
il resto era interessante: inaspettato, ma biologicamente plausi­
bile. In quel momento ho capito che avevamo raggiunto la cima
della montagna che anni fa incombeva su tutti noi. Il primo mo­
dello al computer di un intero organismo vivente funzionava. Che
cosa ci avrebbe insegnato?
Una finestra nella vita della cellula
Un anno dopo aver applicato il nostro nuovo strumento os­
serviamo ancora fenomeni affascinanti all’interno dei meccani­
smi del nostro microrganismo virtuale, mentre gestisce i milio­
ni di dettagli implicati dalla vita e dalla divisione. Abbiamo visto,
con nostra sorpresa, che le proteine si espellono tra loro dal DNA
incredibilmente spesso: circa 30.000 volte nelle nove ore del ci­
clo vitale. Abbiamo anche scoperto che il tasso molto stabile
di riproduzione del microbo è in realtà una proprietà emergen­
te che deriva dall’interazione complessa tra due distinte fasi della
replicazione, ognuna delle quali ha una durata indipendente mol­
to variabile. I dati registrati secondo per secondo del comporta­
mento cellulare ci hanno permesso di spiegare il motivo per cui
la cellula smette di dividersi immediatamente quando certi geni
sono disattivati ma si riproduce altre dieci volte prima di mori­
www.lescienze.it
per approfondire
The Dawn of Virtual Cell Biology. Freddolino P.L. e Tavazoie S., in «Cell», Vol. 150,
n. 2, pp. 248–250, 20 luglio 2012.
A Whole-Cell Computational Model Predicts Phenotype from Genotype. Karr
J.R. e altri, in «Cell», Vol. 150, n. 2, pp. 389–401, 20 luglio 2012.
Bridging the Layers: Toward Integration of Signal Transduction, Regulation and
Metabolism into Mathematical Models. Gonçalves E. e altri, in «Molecular
Biosystems», Vol. 9, n. 7, pp. 1576–1583, luglio 2013.
Cellule simulate. Gibbs W.W., in «Le Scienze», n. 397, settembre 2001.
Le Scienze 63