Genomi 8
The
Minimal Genome
The Minimal Genome project
In a 1999 study among M. genitalium and Mycoplasma pneumoniae, the Craig Venter team mapped around 2,200 transposon insertion sites
and identified 130 putative non-essentials genes in M. genitalium protein coding genes or M. pneumoniae orthologs of M. genitalium genes. In
their experiment they grew a set of Tn4001 transformed cells for many weeks and isolated the genomic DNA from these mixture of mutants.
Amplicons were sequenced to detect the transposon insertion sites in mycoplasma genomes. Genes that contained the transposon insertions
were hypothetical proteins or proteins considered non-essential.
Meanwhile, during this process some of the disruptive genes that at first were considered non-essential, after more analyses turned out be
essential. The reason for this error could have been due to genes being tolerant to the transposon insertions and thus not being disrupted; cells
may have contained two copies of the same gene; or gene product was supplied by more than one cell in those mixed pools of mutants.
Insertion of transposon in a gene meant it was disturbed, hence non-essential, but because they did not confirm the absence of gene products
they mistook all disruptive genes as non-essential genes.
The same study of 1999 was later expanded and the updated results were then published in 2005. Some of the disruptive genes though to be
essential were isoleucyl and tyrosyl-tRNA synthetases (MG345 and MG455), DNA replication gene dnaA (MG469), and DNA polymerase III
subunit a (MG261). The way they improved this study was by isolating and characterizing M. genitalium Tn4001 insertions in each colony one
by one. The individual analyses of each colony showed more results and estimates of essential genes necessary for life. The key improvement
they made in this study was isolating and characterizing individual transposon mutants. Previously, they isolated many colonies containing a
mixture of mutants. The filter cloning approach helped in separating the mixtures of mutants.
Now, they claim completely different sets of non-essential genes. The 130 non-essential genes claimed at first have now reduced to 67. Of the
remaining 63 genes 26 genes were only disrupted in M. pneumoniae which means that some M. genitalium orthologs of non-essential M.
pneumoniae genes were actually essential.
They have now fully identified almost all of the non-essential genes in M. genitalium, the number of gene disruptions based on colonies
analyzed reached a plateau as function and they claim a total of 100 non-essential genes out of the 482 protein coding genes in M. genitalium
The ultimate result of this project has now come down to constructing a synthetic organism, Mycoplasma laboratorium based on the 387
protein coding region and 43 structural RNA genes found in M. genitalium
1. Determinazione del genoma minimale
Global Transposon Mutagenesis and a
Minimal Mycoplasma Genome (1999)
Mycoplasma genitalium with 517 genes (480 protein-coding genes plus 37 genes for RNA species) has
the smallest gene complement of any independently replicating cell so far identified.
Global transposon mutagenesis was used to identify nonessential genes in an effort to learn whether
the naturally occurring gene complement is a true minimal genome under laboratory growth
conditions.
The positions of 2209 transposon insertions in the completely sequenced genomes of M. genitalium
and its close relative M. pneumoniae were determined by sequencing across the junction of the
transposon and the genomic DNA. These junctions defined 1354 distinct sites of insertion that were
not lethal.
The analysis suggests that 265 to 350 of the 480 protein-coding genes of M. genitalium are essential
under laboratory growth conditions, including about 100 genes of unknown function.
I geni essenziali sono conservati filogeneticamente
1996:
Sequenziati i genomi di Haemophilus influenzae e Mycoplasma genitalium, molto
diversi tra loro, e prima proposta di genoma minimo teorico di 256 geni, basato
sul confronto dei geni ortologhi presenti in entrambi i microrganismi (geni
essenziali devono essere conservati).
Haemophilus influenzae
Mycoplasma genitalium
Microorganismi utilizzati per determinare il
genoma minimale
ENTRAMBI COMPLETAMENTE SEQUENZIATI
M pneumoniae è il parente più vicino a M genitalium
Mycoplasma
genitalium:
580 kb (517 geni)
480 geni codificanti proteine
37 geni codificanti per RNA
considerato il più piccolo genoma cellulare
Mycoplasma
pneumoniae:
816 kb (236 kb in più di M. genitalium)
possiede i geni ortologhi di tutti i 480 geni di M.
genitalium + 197 geni addizionali
Le proteine codificate dai geni ortologhi hanno un’ omologia soltanto del 65%:
distanza evolutiva elevata
Microorganismi utilizzati per determinare il
genoma minimale
•
The smallest known cellular genome is that of Mycoplasma genitalium, which is only 580 kb. This
genome has been completely sequenced, and analysis of the sequence revealed 480 protein-coding
genes plus 37 genes for RNA species.
•
Mycoplasma pneumoniae is the closest known relative of M. genitalium, with a genome size of 816
kb, 236 kb larger than that of M. genitalium
Comparison of the two genomes indicates that M. pneumoniae includes orthologs of virtually every
one of the 480 M. genitalium protein-coding genes, plus an additional 197 genes. There is a substantial
evolutionary distance between orthologous genes in the two species, which share an average of only
65% amino acid sequence identity.
“The existence of these two species with
overlapping gene content provided an
experimental paradigm to test whether the 480
protein-coding genes shared between the
species were already close to a minimal gene
set. We applied transposon mutagenesis to
these completely sequenced genomes, which
permitted precise localization of insertion sites
with respect to each of the coding sequences.”
Come determinare se un gene é
essenziale?
Si inattivano i geni tramite mutagenesi traspositiva
(transposon mutagenesis)
Se il batterio trasformato cresce in coltura il gene non è
considerato essenziale (anche se potrebbe esserlo ->
famiglie geniche)
I geni nei quali non si riscontra inserzione sono considerati
essenziali
Transposon mutagenesis

Trasposone Tn4001 all’interno del plasmide di E.
coli plSM2062

Trasformazione tramite elettroporazione
M. genitalium e M. pneumoniae

Il plasmide contiene la resistenza alla gentamicina
-> in terreno con antibiotico crescono solo i batteri
che hanno inglobato il plasmide e di conseguenza
il trasposone

Estrazione del DNA, digestione, circolarizzazione,
IPCR, digestione, clonaggio in pUC18, creazione di
una libreria di giunzioni tra trasposone e DNA
genomico

Sequenziamento

Identificazione della regione dove si è inserito il
trasposone
in
Risultato della mutagenesi traspositiva
Analisi di 2209 inserzioni ha rivelato 1354 siti di inserzione diversi, equalmente suddivisi fra I due
microrganismi. Preferenza di inserzione in sequenze non codificanti (71% M. genitalium e 61% in M.
pneumoniae). This represents a substantial preference for intergenic insertion because coding sequence
constitutes 85% of the M. genitalium genome and 89% of the M. pneumoniae genome, and is consistent with the
idea that intergenic sequences are less critical than protein-coding regions for viability
Inserzioni in 140 geni in M. genitalium e 179 geni in M. pneumoniae
Inserzioni in M. pneumoniae soprattutto all’interno di geni specie-specifici. This result supports our
assumption that the M. pneumoniae–specific portion of the genome is fully dispensable
Consistente assenza di inserzioni in regioni considerate a priori essenziali. The conspicuous absence of
transposon insertions into certain regions expected to be essential - for example, the region containing a cluster of
ribosomal genes - provides additional support for the validity of transposon mutagenesis as an assay for
dispensability
Quando considerare distruttiva un'inserzione:
Inserzioni all’estremità 3’ possono
rimuovere solo un terminale COOH non
essenziale
Inserzioni all’estremità 5’ non sempre
distruggono la funzione genica
Un’inserzione è considerata distruttiva se avviene entro l’80% della sequenza dall’estremità 5’, ma a
valle del nono nucleotide della regione codificante la proteina. This criterion eliminates events in which the 5’
end of the gene may actually be intact because of duplication of a short sequence at the target site. Similarly, an
insertion near the 5’ end of a gene may not always destroy gene function. Transposon Tn4001 contains an outwarddirected promoter that could drive transcription of flanking chromosomal DNA, leading to translation if an internal
start site is located nearby downstream
Quindi i geni con inserzioni distruttive
sono:
66% di M. genitalium
84% di M. pneumoniae
La differenza è da attribuirsi alla più alta
proporzione di geni non-essenziali di
M.pneumoniae
The majority of M. genitalium orthologs that have disruptive insertions are absent from the third fully sequenced
mycoplasma genome, Ureaplasma urealyticum, consistent with the idea that they are not essential.
Dopo aver stabilito che i geni M. pneumoniae specifici non sono
indispensabili, si è cercato di trovare il numero dei geni
essenziali all’interno degli ortologhi
Dei 480 geni ortologhi, che M. genitalium e M. pneumoniae hanno
in comune, sono stati trovati 129 geni con inserzione
non sono essenziali per la vita in laboratorio
We have also estimated the number of nonessential genes to be between 180 to 215 under the
assumption that the number of sites hit per gene follows a Poisson distribution. These larger
estimates fit reasonably with the observed proportion of orthologs hit in both species. Therefore, on
the basis of our highest and lowest estimates for nonessential genes, we estimate that the number
of essential mycoplasma protein-coding genes is between 265 and 350.
SPERIMENTALMENTE:
480 (ortologhi) – 129 (geni non indispensabili)
351 GENI ESSENZIALI
TEORICAMENTE:
480 (ortologhi) – 180/215 (geni non indispensabili)
265-350 GENI ESSENZIALI
The 351 M. genitalium orthologs for which we have not yet identified a disruptive insertion constitute a first
approximation to the true set of essential mycoplasma genes. From our estimate, we predict that at least 3/4 of the
351 undisrupted genes are essential. We also expect that most undisrupted genes within each functional class
represent essential genes. Examination of the gene disruption data, organized by functional role, reveals that all
functional classes of genes are not equally mutable under the selective growth conditions used in this study, which
suggests that the genes are closer to a minimal set for some cellular functions than for others
Pathway essenziali
Nessuna inserzione ritrovata in:
Geni della glicolisi
(10 geni)
Geni delle pompe
protoniche (8 geni)
Si è visto che:
sono essenziali anche 111 geni di qui non si conosce la
funzione (unknown), che andranno caratterizzati in futuro
geni che si ipotizzavano essenziali come le lipoproteine non lo
sono
esse servono per l’infezione della cellula ospite, quindi
sono essenziali per la vita in natura, ma non per quella in
laboratorio
I rompicapo
Trasportatori ABC
trasportano molecole all’interno della cellula sfruttando
l’idrolisi di ATP
3 subunità:
ATP-binding
Permeasi
Ligand-binding
ATP-binding
sono le più rappresentate nel genoma ma
alcune sembrano essere “orfane” dato che
le altre due subunità sono meno numerose
The fact that only 25% of the ATP-binding subunits in our data set tolerate insertions suggests that
at least some of these orphan subunits do serve an essential function within the cell -> Analysis of
the M. genitalium genomic sequence data with less stringent searching parameters aimed at finding
partners of the orphan specificity subunits, led to the identification of potential transport partners
Trasportatore del fosfato
è fondamentale per la vita
Delle 3 subunità, 2 possono essere distrutte
quindi non è essenziale...PERCHÉ?
This finding forces us to consider the possibility that some as yet undefined transport
system exists in these mycoplasmas that can compensate for mutations in the
putative phosphate transporter
Nei due genomi sono presenti due omologhi di DNA pol III oltre che a recA e uvrA
uno dei due omologhi di DNA pol III
Sono presenti inserzioni in
recA
uvrA
It is almost certain that cells bearing such gene disruptions in nature would be quickly
selected against. Although it is difficult to address this idea quantitatively, it poses a
relevant question for consideration when attempting to define a minimal gene set for
cellular life.
Osservate alcune inserzioni (circa l’1% di tutte le inserzioni mappate) in
geni ritenuti essenziali
l’annotazione di geni in base alla similarità di sequenza è sbagliata
le inserzioni non hanno distrutto i geni (poco probabile)
i geni sono stati duplicati (some cells might contain a functional duplicate copy of a gene
in addition to the disrupted gene)
le cellule incorporano enzimi dal mezzo
cross-feeding
(one strain shows superior growth on the limiting primary resource (glucose)
but degrades it only partially and excretes product (e.g., acetate) that is used as secondary
substrate by another strain
Conclusive proof of the dispensability of any specific gene requires cloning and
detailed characterization of a pure population carrying the disrupted gene.
Conclusioni della mutagenesi traspositiva
Preferenza di inserzione in sequenze non codificanti (71% M. genitalium e 61%
in M. pneumoniae), di conseguenza le sequenze intergeniche non sono necessarie per
la vita in senso stretto
Inserzioni in 140 geni (M. genitalium) e 179 (M. pneumoniae)
Inserzioni in M. pneumoniae soprattutto all’interno di geni specie-specifici
condivisi o con bassa % di identità, di conseguenza la porzione specifica
di M. pneumoniae non è indispensabile
NON
Consistente assenza di inserzioni in regioni considerate a priori essenziali, di
conseguenza si è visto che la mutagenesi traspositiva è un buon metodo di
analisi dei geni essenziali (genoma minimo)
Sebbene M. genitalium contenga il più piccolo numero di geni, molti di essi non sono
essenziali per la vita in laboratorio
Dei 111 geni a funzione ignota ed essenziali molti sono Mycoplasma specifici
2. Determinazione del genoma minimale
Essential genes of a minimal bacterium
(2006)
Mycoplasma genitalium has the smallest genome of any organism that can be grown in pure
culture. It has a minimal metabolism and little genomic redundancy. Consequently, its genome is
expected to be a close approximation to the minimal set of genes needed to sustain bacterial
life.
Using global transposon mutagenesis, we isolated and characterized gene disruption mutants
for 100 different nonessential protein-coding genes. None of the 43 RNA-coding genes were
disrupted. Herein, we identify 382 of the 482 M. genitalium protein-coding genes as essential,
plus five sets of disrupted genes that encode proteins with potentially redundant essential
functions, such as phosphate transport. Genes encoding proteins of unknown function
constitute 28% of the essential protein-coding genes set. Disruption of some genes accelerated
M. genitalium growth.
“In 1999 we reported the use of global transposon mutagenesis to experimentally determine the genes
not essential for laboratory growth of M. genitalium
In that report we identified 130 putatively nonessential M. genitalium protein-coding genes or M.
pneumoniae orthologs of M. genitalium genes. We estimated that 265–350 of the protein-coding
genes of M. Genitalium are essential under laboratory growth conditions.
However, proof of gene dispensability requires isolation and characterization of pure clonal
populations, which we did not do. We grew Tn4001- transformed cells in mixed pools for several weeks
and then isolated genomic DNA from those mixtures of mutants.
Herein, we report an expanded study in which we have isolated and characterized M. genitalium
Tn4001 insertion mutants that were present in individual colonies picked from agar plates. From this
analysis, we made a more thorough estimate of the number of genes essential for growth of this
minimalist bacterium.”
To exclude the possibility that gene disruptions were the result of a transposon insertion in one copy
of a duplicated gene, we used PCR to detect genes lacking the insertion. These PCRs showed us that
almost all of the colonies contained both disrupted and WT versions of the genes identified as
having the Tn4001. Further analysis using quantitative PCR showed that most colonies were
mixtures of two or more mutants
In total, we analyzed 3,321 M. genitalium transposon insertion mutant primary colonies and
subcolonies to determine the locations of Tn4001tet inserts
Of the successfully sequenced subcolonies, 59% revealed a transposon insertion at a different site
from that in the parental primary colony
We mapped a total of 2,462 different transposon insertion sites on the genome. 84% of the
mutations were in protein-coding genes. No rRNA, tRNA, or structural RNA genes contained
insertions.
To address our central question of which M. genitalium genes were not essential for growth in SP4 (a
rich laboratory medium), we used the same criteria to designate a gene disruption as in our previous
study. We considered transposon insertions disruptive if they were after the first three codons and
before the 3-most 20% of the coding sequence of a gene.
After subcloning, we were able to isolate gene disruption mutant colonies for 100 different disrupted
M. genitalium genes
48 of the 100 disrupted genes were either hypothetical proteins or proteins of unknown function,
and there was an absence of disruptions in genes and regions expected to be universally essential
Several mutants manifested remarkable phenotypes. Although some of the mutants grew slowly,
mutants in lactate malate dehydrogenase (MG460) and conserved hypothetical proteins MG414 and
MG415 mutants had doubling times up to 20% faster than WT M. genitalium.
Mutants in MG185, which encodes a putative lipoprotein, floated rather than adhering to plastic as do
WT cells. Cells with transposon insertions in the transketolase gene (MG066), which encodes a
membrane protein and pentose phosphate pathway enzyme, grew in chains of clumped cells rather
than in the monolayers characteristic of WT M. genitalium
Of the successfully sequenced subcolonies, 59% revealed a transposon insertion at a different site
from that in the parental primary colon. However, the rate of accumulation of new insertion sites
dropped after our first 600 sequences from independent colonies, indicating that we were
approaching saturation mutagenesis of all nonlethal insertion sites
We believe that we have identified nearly all of the nonessential genes in M. genitalium
because, as shown in Fig. 1, the number of new gene disruptions reached a plateau as a function
of the number of colonies analyzed.
Mostly, we mutated the kinds of genes we expected to be nonessential: 48 of the 100 disrupted
genes were either hypothetical proteins or proteins of unknown function, and there was an
absence of disruptions in genes and regions expected to be universally essential.
Still, many disrupted genes encoded proteins that one might think would be important because of
the roles they play in metabolism or information storage and processing.
None of the genes encoding the key enzymes of DNA replication were disrupted.
However, we isolated mutants in other DNA metabolism genes that were expendable for the
duration of our experiment, but might be necessary to maintain the M. genitalium genome over
periods much longer than this experiment, like the genes involved in recombination and DNA repair.
Metabolic pathways and substrate transport mechanisms encoded by M. genitalium. Metabolic products are colored
red, and mycoplasma proteins are black. White letters on black boxes mark nonessential functions or proteins based on our current
gene disruption study. Question marks denote enzymes or transporters not identified that would be necessary to complete pathways,
and those missing enzyme and transporter names are colored green. Transporters are colored according to their substrates: yellow,
cations; green, anions and amino acids; orange, carbohydrates; purple, multidrug and metabolic end product efflux. The arrows
indicate the predicted direction of substrate transport. The ABC type transporters are drawn as follows: rectangle, substrate-binding
protein; diamonds, membrane-spanning permeases; circles, ATP-binding subunits.
Under our laboratory conditions, we identified 100 nonessential genes. Logically, the
remaining 382 M. genitalium proteincoding genes, 3 phosphate transporter genes,
and 43 RNAcoding genes presumably constitute the set of genes essential for growth
of this minimal cell
Accordingly, these families’ functions may be essential, and we expanded our
projection of the set of essential genes to 387 to include them. This is a significantly
greater number of essential genes than the 265–350 predicted in our previous study
of M. genitalium
These data suggest that a genome constructed to encode 387 protein-coding and
43 structural RNA genes could sustain a viable synthetic cell, a Mycoplasma
laboratorium
3. TRASFERIMENTO DI UN GENOMA
COMPLETO DA UNA SPECIE BATTERICA AD
UN’ALTRA
Genome Transplantation in Bacteria:
Changing One Species to Another
As a step toward propagation of synthetic genomes, the genome of a bacterial cell was
completely replaced with one from another species by transplanting a whole genome as
naked DNA.
Intact genomic DNA from Mycoplasma mycoides, virtually free of protein, was
transplanted into Mycoplasma capricolum cells by polyethylene glycol–mediated
transformation. Cells selected for tetracycline resistance, carried by the M. mycoides
chromosome, contain the complete donor genome and are free of detectable recipient
genomic sequences.
These cells that result from genome transplantation are phenotypically identical to the
M. mycoides LC donor strain as judged by several criteria.
“GENOME TRANSPLANTATION”
un intero genoma batterico da una specie è “trapiantato”
(trasformazione PEG mediata) in un'altra specie batterica
il ricevente mostra genotipo e fenotipo del donatore
il ricevente perde il proprio genoma
non c'è ricombinazione tra i cromosomi in entrata e in uscita
cambio di una specie batterica in un'altra
Premesse
1994: Osvald Avery scopre che il DNA nudo può essere incorporato
da P. pneumoniae
2005: Itaya et al. primo trasferimento di un genoma quasi completo
da Synechocystis PCC6803 a Bacillus subtilis, ma riscontrati
diversi problemi a livello di silenziamento genico
2007: R. A. Holt et al. trasferiscono un intero genoma da
Haemophilus influenzae a Escherichia coli con l’utilizzo di BAC.
Sono stati riscontrati problemi di incompatibilità tra i due
genomi.
Perché é stato scelto il Mycoplasma?
uso di UGA per codificare
triptofano (invece di un codone
di stop)-> no proteine prodotte
in E. coli durante il clonaggio
piccoli genomi
la mancanza totale di una parete
cellulare lo rende più simile ad una
cellula eucariotica e rende più semplice
l’inserimento di DNA
presenta un accrescimento rapido
(divisione ogni 80-100 min)
Specie usate per il “trapianto”:
1. Mycoplasma mycoides sottospecie mycoides LC (large colony) ceppo GM12
come cellule donatrici. Presenta resistenza alla tetraciclina e il gene lac-Z
2. Mycoplasma capricolum sottospecie capricolum, ceppo California kid come
cellule riceventi
I genomi dei due microrganismi sono stati sequenziati e comparati:
91.5% identità nucleotidica
We found that 76.4% of the 1,083,241-bp draft sequence of the M.
mycoides LC genome could be mapped to the 1,010,023-bp M.
capricolum genome, and this content matched on average at 91.5%
nucleotide identity.
The remaining ~24% of the M. mycoides LC genome contains a
large number of insertion sequences not found in M. capricolum.
Tre fasi principali del “trapianto”:
1. Isolamento del genoma intatto del donatore da M. mycoides LC
2. Preparazione delle cellule riceventi di M. capricolum
3. Inserimento del genoma isolato nelle cellule riceventi
Plasmidi di M. mycoides LC con origine
del complesso di replicazione (ORC)
M. mycoides
M. capricolum
Plasmidi di M. capricolum LC con origine
del complesso di replicazione (ORC)
We chose our donor and recipient cells for genome transplantation on the basis of our observation that plasmids
containing a M. mycoides LC origin of replication complex (ORC) can be established in M. capricolum, whereas
plasmids with an M. capricolum ORC cannot be established in M. mycoides LC
Preparazione delle cellule donatrici:
M. mycoides
1. Ridurre al massimo le manipolazioni
del genoma per non romperlo
Cellule messe in blocchi di agarosio,
trattate con detergenti ed enzimi
proteolitici per ottenere DNA purificato
2. Inserimento delle cellule nei plug di agarosio
Interessa avere DNA circolare:
usata elettroforesi a campo pulsato (PFGE) per separare il DNA
circolare (intrappolato nel plug) da quello danneggiato
(lineare). Circular DNA is indeed trapped into the agarose. Cirlces become hooked on
threads of agarose fibers and become frozen in their forward motion.
Ulteriori prove per confermare di avere solo DNA circolare:
trattamento con nucleasi
analisi dei plug (verifica della purezza del DNA)
spettrometria di massa (verifica della purezza del DNA)
3. Liberazione del DNA dai plug
Trasfrormazione di M. capricolum
1. Trattamento delle cellule di M. capricolum con PEG per la trasformazione
in presenza del genoma di M. mycoides,
3. Recupero della cellule e semina su piastre contenenti tetraciclina e X-gal.
(il batterio donatore ha il gene di resistenza all’antibiotico e il gene lac-Z)
Cosa ci si aspetta???
Dato che il genoma donatore possiede i geni per la resistenza alla
tetraciclina e l’operone lac, la cellula ricevente, che ha assunto il
genoma donatore, possiede resistenza all’antibiotico e assume
colorazione blu in presenza di X-gal
Cosa si é osservato?
Si sono osservate colonie resistenti all’antibiotico e blu in un primo tempo,
successivamente si è notata la comparsa di
piccole colonie bianche
Si pensa che per un breve periodo di tempo la cellula mantiene entrambi i
genomi, perché quello del ricevente non è stato tolto: le colonie resistenti e
bianche devono derivare da ricombinazione
The plates were incubated at 37°C until large blue colonies, putatively M. mycoides LC,
formed after ~3 days.
Sometimes, after ~10 days smaller M. capricolum colonies, both blue and white, were
visible.
Thus, all of these colonies were tetracycline-resistant, as evidenced by their surviving the
antibiotic selection, and only some expressed b-galactosidase. These colonies might be the
result of recombination. We observed that these colonies appeared after almost twice as
many days as it took for the transplants to become visible
The blue, tetracycline-resistant colonies resulting from M. mycoides LC genome
transplantation were to be expected if the genome was successfully transplanted.
However, colonies with that phenotype could also result from recombination of a
fragment of M. mycoides LC genomic DNA containing the tetM and lacZ genes into the M.
capricolum genome.
To rule out recombination, we examined the phenotype and genotype of the
transplanted clones.
Analisi genotipiche
PCR con primer specie-specifici
Analisi SOUTHERN BLOT di
donatore, ricevente e “trapiantati”
SEQUENZIAMENTO di un
campione delle librerie
genomiche totali di uno dei due
cloni “trapiantati”
I risultati non escludono che la
ricombinazione non avvenga
Il 54% dei trapiantati hanno
profilo identico al wild-type
Analisi di 1300 reads di ciascun clone
(2), e tutte si appaiono con la
sequenza di M. mycoides
Le analisi genotipiche hanno confermato il
corretto inserimento del genoma del donatore
nel ricevente, ma lasciano aperta l’ipotesi di
una possibile ricombinazione tra i due genomi
Analisi fenotipica
COLONY WESTERN BLOT su donatore e ricevente e
quattro diversi cloni “trapiantati” utilizzando degli
anticorpi specifici per gli antigeni di superficie di
M. capricolum e successivamente per M. mycoides
Nei blot dei “trapiantati” l’anticorpo specifico per
l'antigene di superficie di M. mycoides ibrida con la
stessa intensità che si osserva nel blot del wild-type.
Invece l’anticorpo specifico per l' antigene di
superficie di M. capricolum non ibrida nei blot dei
“trapiantati”
E' stata effettuata un'analisi proteomica consistente in un'
ELETTROFORESI BIDIMENSIONALE su lisati cellulari (proteine).
Spot di M. mycoides IDENTICI agli spot dei “trapiantati”
Spot di M. capricolum MOLTO DIVERSI (più del 50%) dagli spot dei “trapiantati”
Questi risultati sono stati ulteriormente confermati dalle analisi MALDI-MS
(spettrometria di massa a dessorbimento-ionizzazione laser assistito da matrice)
Conclusioni del trapianto di un genoma
batterico
Questi dati hanno dimostrato che è possibile il “trapianto” di
interi genomi da una specie ad un’altra. La progenie risultante è
genotipicamente e fenotipicamente uguale al donatore
Si pensa che subito dopo il “trapianto” gli organismi portino entrambi
i genomi
Negli esperimenti più efficienti, solo 1 cellula ricevente
su ~ 150,000 è stata “trapiantata”; questa bassa
efficienza non ha permesso di dimostrare un
mosaicismo momentaneo.
Il “trapianto” di genoma funziona per le specie scelte
SONO FILOGENETICAMENTE
MOLTO SIMILI
MA PER LE ALTRE SPECIE FUNZIONERA‘?
“These data demonstrate the transplantation of whole genomes from one species to
another such that the resulting progeny are the same species as the donor genome.
However, they do not explain the mechanism of the transplant.”
Non è una trasformazione naturale del DNA
il “trapianto” del genoma in questione non richiede la
ricombinazione
il DNA che si inserisce è circolare
non è stata identificata la presenza di geni di uptake per il
DNA nel genoma di M. capricolum
In assenza di trattamenti con detergenti o proteasi K, i nucleoidi
delle cellule di M. mycoides LC non producono “trapiantati”.
Data l’improbabilità di un evento naturale come il libero fluttuare
di genomi batterici, il “trapianto” di genoma potrebbe essere un
fenomeno solo da laboratorio
In ogni caso, E' STATA MESSA A PUNTO UNA FORMA DI
TRASFERIMENTO DI DNA BATTERICO CHE PERMETTE ALLE
CELLULE RICEVENTI DI FUNGERE DA PIATTAFORME PER LA
PRODUZIONE DI NUOVE SPECIE con l’uso di genomi naturali
modificati o sintetici
4. SINTESI CHIMICA, ASSEMBLAGGIO E
CLONAGGIO DI UN GENOMA
Complete Chemical Synthesis, Assembly, and
Cloning of a Mycoplasma genitalium Genome
A 582,970–base pair Mycoplasma genitalium genome has been synthesized.
This synthetic genome, named M. genitalium JCVI-1.0, contains all the genes of wild-type M.
genitalium G37 except MG408, which was disrupted by an antibiotic marker to block
pathogenicity and to allow for selection.
To identify the genome as synthetic, “watermarks” were inserted at intergenic sites known
to tolerate transposon insertions. Overlapping “cassettes” of 5 to 7 kilobases (kb),
assembled from chemically synthesized oligonucleotides, were joined by in vitro
recombination to produce intermediate assemblies of approximately 24 kb, 72 kb (“1/8
genome”), and 144 kb (“1/4 genome”), which were all cloned as bacterial artificial
chromosomes in Escherichia coli. Most of these intermediate clones were sequenced, and
clones of all four 1/4 genomes with the correct sequence were identified. The complete
synthetic genome was assembled by transformation-associated recombination cloning in
the yeast Saccharomyces cerevisiae, then isolated and sequenced. A clone with the correct
sequence was identified.
Mycoplasma genitalium
batterio con il genoma più piccolo (580,076bp)
485 geni codificanti proteine di cui 100 non essenziali
non si sa quali dei 100 sono non essenziali simultaneamente
We proposed that one approach to this question would be to produce reduced
genomes by chemical synthesis and introduce them into cells to test their
capacity to provide the essential genetic functions for life
“The largest previously published synthetic
DNA that we are aware of is a 32-kb polyketide
gene cluster»
Come costruire il genoma sintetico?
1. Divisione del genoma in 101 cassette di 5-7 Kb tramite:
sintesi
sequenziamento
ligazione
2. Inserimento di sequenze watermark nelle cassette 14-29-3955 e 61 → corte sequenze inserite in siti intergenici,
utilizzate per distinguere il genoma sintetico da quello nativo
3. Inserimento di 2514 bp (resistenza aminoglicosilica) nella cassetta 89,
all'interno gene MG408, allo scopo di perdere la patogenicità nei
mammiferi
4. Dimensione del genoma sintetico ottenuto (JVCI-1.0) è di 582,970 bp,
partendo da 580,076 bp (M. genitalium)
Le cassette:
Le cassette sono state sintetizzate dalla Blue Heron
Technology
ognuna contiene una o più geni completi
ogni cassetta termina con una sequenza che si
sovrappone alla successiva per poterle assemblare
la cassetta 101 si sovrappone alla 1 per formare una
struttura circolare
Fasi (5) di assemblaggio del genoma:
assemblaggio delle cassette in vitro e clonaggio in E. coli (A-B-C)
assemblaggio delle cassette in vivo e clonaggio in S. cerevisiae (D e E)
clonaggio in E. coli
clonaggio in S. cerevisiae
Assemblaggio in vitro e clonaggio in E. coli
Le cassette sono state recuperate dai rispettivi plasmidi e sottoposte alle
seguenti reazioni:
In seguito a digestione con
3’-esonucleasi, le cassette espongono
le estremità sovrapponibili
Le estremità si appaiano formando
una lunga molecola composta da 4
cassette
Il costrutto così ottenuto viene quindi
riparato con Taq-polimerasi e Taqligasi
PCR amplification was used to produce a
unique BAC vector for the cloning of each
assembly, with terminal overlaps to the ends
of the assembly.
Each PCR primer includes an overlap with
one end of the BAC, a Not I restriction site,
and an overlap with one end of the cassette
assembly.
The 3′ ends of the mixture of duplex vector and
cassette DNAs were then digested to expose the
overlap regions using T4 polymerase in the
absence of dNTPs.
The annealed joints were repaired using Taq
polymerase and Taq ligase
Because the M. genitalium JCVI-1.0 genome does not contain a Not I site, all of
the assemblies can be released intact from the BAC.
A questo punto, i BAC neo-sintetizzati vengono inseriti in E. coli per
la moltiplicazione.
Dopo la replicazione in E. coli si recupera il frammento d'interesse
mediante restrizione con NotI.
In questo modo sono state ottenute le 25 serie A
B-series assemblies were constructed from Not I–digested A-series clones
C-series assemblies were constructed from Not I–digested B-series
assemblies.
Assemblaggio in vivo e clonaggio in S. cerevisiae
Dato che si sospettava l’instabilità di grandi assemblaggi in E. coli, è stato
necessario passare in lievito utilizzando la tecnica TAR (Transformation
Associated Ricombination), che si basa sulla ricombinazione omologa
durante la co-trasformazione in sferoplasti di lievito.
Il vettore TAR è costituito da:
sequenza BAC
sequenza YAC
due 'ganci' alle due estremità che
subiscono una ricombinazione con le
regioni omologhe del gene d’interesse 
circolarizzazione
All'interno del lievito riusciamo ad assemblare l'intero genoma
Estrazione del genoma sintetico di
M.genitalium dal lievito e verifica
della sua sequenza:
Analisi CHEF
Kb
DNA totale isolato in agarosio
Taglio selettivo del cromosoma sintetico
con NotI
Separazione del frammento sintetico
tramite elettroforesi
582.0
145.5
96.0
48.5
23.0
9.4
Sequenziamento del DNA del clone
sMgTARBAC37 con copertura 7x
6.6
4.4
Conclusioni della sintesi chimica, assemblaggio e clonaggio di un genoma
L’intero cromosoma di M. genitalium è stato progettato,
sintetizzato, assemblato e clonato in lievito
Il costrutto è formato da 104 oligonucleotidi lunghi 50
basi ciascuno; fino ad ora è la più grande molecola
sintetica a struttura nota ottenuta (582,970 bp)
L'efficacia della procedura in vitro è diminuita con
l'aumentare della dimensione degli assemblati, per cui
l’assemblaggio dei frammenti più grandi va effettuato
mediante ricombinazione in vivo
We are currently using a TARBAC vector to propagate the
synthetic chromosome in yeast.
We do not know whether this vector might interfere
with the production of viable cells by transplantation,
nor do we know whether the genomic location of the
vector could affect viability.
It may be necessary to alter the vector sequences or
even to excise the vector before transplantation.
In closing, we wonder whether use of the UGA codon to code for tryptophan in
mycoplasmas, rather than for termination as in the “universal” code, contributed
to our success in cloning the synthetic M. genitalium JCVI-1.0 genome.
This may make cloning in E. coli and other organisms less toxic because most M.
genitalium proteins will be truncated. If so, then it should be possible to synthesize
other genome constructions using this same code. The genome would then need to
be installed, for example, by transplantation, in a cytoplasm that can properly
translate the UGA to tryptophan. To generalize on this phenomenon, it might be
possible to use other codon changes as long as there is a receptive cytoplasm with
appropriate codon usage.
5. Creazione di una cellula batterica
controllata dal genoma sintetico
Creation of a Bacterial Cell Controlled by a
Chemically Synthesized Genome
Because M. genitalium has an extremely slow growth rate, we turned to two fastergrowing mycoplasma species, M. mycoides subspecies capri (GM12) as donor, and M.
capricolum subspecies capricolum (CK) as recipient.
The 1.08 Mb Mycoplasma mycoides JCVI-syn1.0 genome has been designed,
synthesised, and assembled starting from digitized genome sequence information
Then, the JCVI-syn1.0 genome has been transplantated into a M. capricolum recipient
cell to create new M. mycoides cells that are controlled only by the synthetic
chromosome.
The only DNA in the cells is the designed synthetic DNA sequence, including
“watermark” sequences and other designed gene deletions and polymorphisms, and
mutations acquired during the building process.
The new cells have expected phenotypic properties and are capable of continuous selfreplication.
Ostacoli iniziali
Metodo per estrarre il cromosoma intatto dal lievito
richiede
miglioramento
capire se è possibile “trapiantare” il cromosoma estratto da lievito in una
cellula batterica
verificare che la cellula batterica sia controllata esclusivamente dal genoma
sintetico
M. mycoides subspecies capri
(donatore)
M. genitalium
crescita troppo lenta
crescita più veloce
M. capricolum subspecies capricolum
(ricevente)
Nel lievito il genoma sintetico non è metilato mentre il sistema di
restrizione presente nel ricevente richiede la metilazione
3 soluzioni proposte:
metilazione del DNA estratto da lievito (donatore) con metilasi
purificate
metilazione del DNA estratto da lievito (donatore) con estratti
crudi dalla specie di M. mycoides o M. capricolum
disattivazione del sistema di restrizione del ricevente
M. mycoides e M. capricolum possiedono il medesimo sistema di
restrizione!
Fasi del processo
Sequenziamento di due ceppi di M. mycoides subspecies capri:
CP001621 e CP001668 (le 2 sequenze differiscono per 95 siti ma sono
state considerate entrambe affidabili)
Disegno di “cassette” geniche sulla base della sequenza del ceppo
CP001668.
Aggiunta di 4 watermarks per differenziare ulteriormente il genoma
sintetico dal naturale.
Strategia di assemblaggio del genoma sintetico
Cassette geniche di 1080 pb con
80 pb che si sovrappongono alla
cassetta adiacente
Sintesi di oligonucleotidi affidata
alla Blue Heron
Inserzione di un sito di restrizione
Not I nelle cassette e negli
intermedi di assemblaggio
Assemblaggio gerarchico in 3
passaggi
I PASSAGGIO: ASSEMBLAGGIO DI INTERMEDI
SINTETICI DI 10 Kb
• For the first stage of assembly, a yeast/E. coli
shuttle vector, termed pCC1BAC-LCYEAST, was
produced
• Cassette e un vettore sono ricombinati in lievito
(sovrapposizione cassette da 1Kb per formare
quelle da 10 Kb)
• Trasferimento in E. coli
• Screening delle cellule e
selezione dei cloni
contenenti il DNA plasmidico
In general, at least one 10-kb assembled
fragment could be obtained by screening 10 yeast clones
• Sequenziamento e selezione dei cloni che non
contengono errori per il passaggio successivo
Nineteen out of 111 assemblies contained errors. Alternate clones were
selected, sequence-verified, and moved on to the next assembly stage
II PASSAGGIO: ASSEMBLAGGIO DI INTERMEDI
SINTETICI DI 100 Kb
•
Ricombinazione in lievito per dare intermedi
di 100 Kb
•
Estrazione del DNA ricombinante dal lievito
(no trasferimento in E.coli, perché non è stabile)
•
Multiplex PCR (coppia di primer per ogni 10 Kb) per
verificare la presenza di tutti gli ampliconi = assemblaggio
corretto. In general, 25% or more of the clones screened
contained all of the amplicons expected for a complete
assembly
•
Dimensione corretta verificata su gel di
agarosio: a second stage assembly intermediate of the
correct size was usually produced. In some cases, however,
small deletions occurred. In other instances,multiple 10-kb
fragments were assembled, which produced a larger
second-stage assembly intermediate
III PASSAGGIO: COMPLETO ASSEMBLAGGIO
DEL GENOMA
•
Isolamento degli 11 frammenti circolari
(100 Kb) da sferoplasti di lievito mediante
lisi alcalina
•
Le 11 cassette sono state assemblate in
lievito
•
Digestione di una piccola frazione degli
intermedi con Not I e purificazione
attraverso FIGE
•
PCR Multiplex a livello delle giunzioni per
verificare il corretto assemblaggio
•
Genoma di M. mycoides assemblato!!
In preparation for the final stage of assembly, it was necessary to isolate each of the 11 second-stage
assemblies from yeast spheroplasts by an alkaline-lysis procedure.
To further purify the 11 assembly intermediates, they were treated with exonuclease and passed
through an anion-exchange column. A small fraction of the total plasmid DNA (1/100) was digested
with Not I and analyzed by field-inversion gel electrophoresis (FIGE).
The method above does not completely remove all of the linear yeast chromosomal DNA, which we
found could substantially decrease the yeast transformation and assembly efficiency. To further enrich
for the 11 circular assembly intermediates, ~200 ng samples of each assembly were pooled and mixed
with molten agarose. As the agarose solidifies, the fibers thread through and topologically “trap”
circular DNA. Untrapped linear DNA can then be separated out of the agarose plug by electrophoresis,
thus enriching for the trapped circular molecules. The 11 circular assembly intermediates were digested
with Not I so that the inserts could be released. Subsequently, the fragments were extracted from the
agarose plug, analyzed by FIGE, and transformed into yeast spheroplasts . In this third and final stage of
assembly, an additional vector sequence was not required because the yeast cloning elements were
already present in assembly 811-900.
“Trapianto” del genoma sintetico nella cellula
ricevente
Il genoma sintetico di M. mycoides contenuto nel lievito
YCp235 viene “trapiantato” nella cellula ricevente M.
capricolum (con sistema di restrizione inattivo)
Selezione delle colonie contenenti il genoma
sintetico è fatta mediante crescita in terreno
selettivo SP4 con tetraciclina e X-gal a 37˚C
Sequenziamento
Sequenziamento del genoma di M. mycoides JCVI-syn1.0 e
confronto con il genoma minimo disegnato
Diversità:
8 SNP
Trasposone omologo a quello di E. coli (ISI)
Duplicazione di 85bp
The transposon insertion exactly matches the size and sequence of IS1, a transposon in E.
coli. It is likely that IS1 infected the 10-kb subassembly following its transfer to E. coli. The
IS1 insert is flanked by direct repeats of M. mycoides sequence, suggesting that it was
inserted by a transposition mechanism. The 85-bp duplication is a result of a
nonhomologous end joining event, which was not detected in our sequence analysis at the
10-kb stage. These two insertions disrupt two genes that are evidently nonessential.
Assenza di sequenze di M. capricolum: completo
rimpiazzo del genoma sintetico
Osservazione morfologica
Cellula sintetica in grado di replicarsi autonomamente con curva di
crescita logaritmica
Osservazione colonie (piastre con agar SP4 e X-gal) con microscopio
ottico
M. mycoides
JCVI-syn1.0
WT
Ulteriori analisi:
Analisi proteomica, mediante elettroforesi
bidimensionale
Confrontati i profili di M. mycoides con genoma
sintetico e del ceppo wild-type
Risultato: i profili sono identici
Saggi di colorazione e tasso di crescita (confrontata la
velocità di crescita tra sintetico e wild-type)
presentano lievi differenze
CONCLUSIONI
Ottenere un genoma sintetico senza errori è una pratica
molto complessa
Questo lavoro rappresenta la base per l’assemblaggio e la
caratterizzazione di un genoma sintetico
Si sono apportate piccole modifiche alla sequenza di partenza,
ma nulla impedisce a lavori futuri, di apportare maggiori
modifiche in base alle varie richieste biotecnologiche
Questo lavoro ha aperto una serie di discussioni di tipo etico
Com’è arrivata al mondo
questa informazione??
La Repubblica
GENETICA
Nasce la prima vita artificiale
"Ecco la cellula in laboratorio"
Su Science l'annuncio del gruppo guidato da Craig Venter: un batterio col Dna
sintetico. "Può riprodursi". Obiettivo: creare nuovi farmaci e salvare il clima
di ELENA DUSI
Corriere della Sera
Ecco l'inizio della «vita artificiale»
Costruita la prima cellula
Svolta epocale nella ricerca. È controllata da un Dna sintetico ed è in grado di
dividersi e moltiplicarsi
The Economist
Artificial lifeforms
Genesis redux
A new form of life has been created in a laboratory, and the era of synthetic
biology is dawning
May 20th 2010