OMICS. 2013 Feb;17(2):61-70. doi: 10.1089/omi.2012.0082.
EMERGING TRENDS IN GENOMIC APPROACHES
FOR MICROBIAL BIOPROSPECTING.
Akondi KB, Lakshimi VV.
Main aspects
1. Microorganisms constitute two out of the three domains of life on earth.
2. They exhibit vast biodiversity and metabolic versatility. This enables the
microorganisms to inhabit and thrive in even the most extreme
environmental conditions, making them all pervading.
3. The magnitude of biodiversity observed among microorganisms
substantially supersedes that exhibited by the eukaryotes.
4. These characteristics make the microbial world a very lucrative and
inexhaustible resource for prospecting novel bioactive molecules.
Over 99% of the microbial world
still remains to be explored.
The primary reason for this is that the culture-dependent methods
used in the laboratories are grossly insufficient, as they support the
growth of under 1% of the microorganisms found in nature.
This limitation necessitated the development of techniques to circumvent
culture dependency and gain access to the outstanding majority of the
microorganisms. The development of culture-independent techniques
has essentially reshaped the study of microbial diversity and community
dynamics.
Application of genomic and metagenomic approaches is
contributing substantially towards characterization of the real
microbial diversity.
The amenability of these techniques to high throughput has opened the
doors to explore the vast number of "uncultivable" microbial forms in
substantially lesser time..
I MICROORGANISMI e il
loro AMBIENTE NATURALE
In natura le cellule vivono in associazione con altre cellule
POPOLAZIONI
INSIEME DI NUMEROSI ORGANISMI DELLA STESSA SPECIE
Composte da gruppi di cellule che derivano da divisioni cellulari successive
a partire da una singola cellula parentale
Si definisce habitat il luogo in cui una popolazione microbica vive
CONSORZIO MICROBICO
L’insieme di più popolazioni che occupano lo stesso
habitat e sono metabolicamente correlate
COMUNITA’ MICROBICHE
sono costituite da diverse popolazioni microbiche
(consorzi) che interagiscono tra di loro in un
determinato ambiente.
I componenti e il num di cellule che costituiscono una comunità microbica dipendono
dalle risorse e dalle condizioni presenti in quel determinato habitat
ECOSISTEMA
è costituito dagli organismi viventi unitamente ai
costituenti chimici e fisici dell’ambiente di cui
fanno parte
In molti casi vi è cooperazione: per esempio i prodotti di scarto delle attività metaboliche
di alcune cellule possono fungere da nutrienti per altre cellule
Giovanni Vallini © 2006
Le popolazioni in una comunità microbica interagiscono tra loro in modo benefico e/o dannoso
I MICROORGANISMI e il
loro AMBIENTE NATURALE
Un ECOSISTEMA è controllato in modo
significativo dalle TRASFORMAZIONI
MICROBICHE
I microorganismi, conducendo i loro processi metabolici, rimuovono nutrienti
dall’ambiente circostante.
Allo stesso tempo, liberano nell’ambiente i loro prodotti di scarto
Nel tempo, un ECOSISTEMA gradualmente
cambia, sia CHIMICAMENTE che FISICAMENTE
attraverso le trasformazioni microbiche dei
nutrienti
ECOLOGIA MICROBICA
studio dei microrganismi
nei loro habitat naturali
MAIN QUESTIONS
1. CHE TIPO DI MICROORGANISMI
SONO PRESENTI
2. CHE COSA FANNO
3. IN CHE MODO LE LORO ATTIVITA’
SONO COLLEGATE ALLE FUNZIONI
DELL’ECOSISTEMA?
4. COME POSSO UTILIZZARLI?
METODI per l’ANALISI dei MICROORGANISMI e
delle COMUNITA’ MICROBICHE
Metodi
CULTURE-DEPENDENT
convenzionali
Metodi
CULTURE-INDEPENDENT
molecolari
Permettono l’ISOLAMENTO dei
Tecniche che prescindono dalla
microrganismi mediante l’impiego
coltivabilità di un microrganismo.
di terreni selettivi specifici per la
Consentono di monitorare la
crescita seguito da una
COMPOSIZIONE e le DINAMICHE di
CARATTERIZZAZIONE mediante popolazione delle comunità microbiche
saggi fisiologici e metabolici
presenti in varie matrici (acqua, suolo,
reflui, alimenti etc.) senza ricorrere a
isolamenti preventivi
Permettono di analizzare le caratteristiche biochimiche
e genetiche delle cellule che compongono la comunità
Metodi MICROSCOPICI
Utilizzando sonde fluorescenti permettono
l’identificazione in situ dei microrganismi
(FISH)
Le tecniche molecolari permettono la
frazione coltivabile che di quella non
campione ambientale. Con le tecniche
invece possibile identificare solo quei
crescere su determinati terreni selettivi
caratterizzazione sia della
coltivabile presente in un
di coltivazione standard è
microorganismi capaci di
La quantità di campione necessaria per lo studio della comunità
microbica utilizzando tecniche molecolari è minore rispetto a
quella necessaria per l’approccio classico
Solo con le tecniche culture-dependent è possibile avere a
disposizione il microorganismo isolato per studi di carattere
fisiologico e metabolico. È importante cercare di ottimizzare le
tecniche di pre-arricchimento e arricchimento selettivi per riuscire
a recuperare le popolazioni microbiche meno dominanti, stressate
e non coltivabili, che sono presenti a bassa carica
CULTURE-INDEPENDENT methods
i) Direct lysis of bacterial cells in soil
ii) The extraction of the nucleic acids from the matrix
iii) The analysis of targeted sequences or of the whole
body of genetic information
Two main types of molecular technique are available to study
bacterial communities using DNA directly extracted from the soil
(figure 1):
— molecular approaches which usually investigate parts of this
information by focusing on genome sequences which are targeted
and amplified by PCR that are called ‘partial community DNA
analysis’;
— molecular approaches which try to investigate all the genetic
information in the extracted DNA and that are called ‘whole
community DNA analysis’
CULTURE-INDEPENDENT methods
1. RICOSTRUIRE L’EFFETTIVA COMPOSIZIONE DI UNA COMUNITA’
MICROBICA
2. SEGUIRE L’EVOLUZIONE E IL COMPORTAMENTO DI UN
CONSORZIO MICROBICO NEL TEMPO (MONITORAGGIO
DIACRONICO) O NELLO SPAZIO
3. MONITORARE in situ LA PERSISTENZA DI UNO SPECIFICO
TARGET MICROBICO
4. VALUTARE LA SICUREZZA MICROBIOLOGICA TRAMITE
MONITORAGGIO in situ DI MICROORGANISMI PATOGENI
TECNICHE MOLECOLARI
Permettono di rilevare sia microorganismi presenti a basse
concentrazioni che microorganismi non coltivabili in laboratorio
Acidi nucleici/Proteine/Lipidi
ACIDI NUCLEICI
A. Tecniche che si basano sull’analisi delle sequenze di DNA
indipendentemente da conoscenze pregresse circa la struttura
della comunità microbica di interesse. In particolare le tecniche
che si basano sulla PCR si sono rivelate un mezzo estremamente
veloce ed efficace per l’identificazione, la caratterizzazione e il
monitoraggio dei microorganismi in generale e dei batteri in
particolare
B. Tecniche di ibridazione che impiegano sonde molecolari,
utilizzate quando esistono informazioni pregresse riguardo alla
comunità microbica di interesse
figure 1
Schematic representation of the
different molecular approaches for
assessing the genetic diversity and
structure of soil
bacterial communities. DNAs are
directly extracted from soil samples and
subsequently analysed either by
characterizing particular
sequences targeted and amplified by
PCR (approaches called ‘partial
community DNA analysis’) or by
characterizing all the genetic
information (approaches called ‘whole
community DNA analysis’). PCR
products can be analysed by cloning or
genetic fingerprint.
Genetic fingerprint consists in a rapid
and simple electrophoretic analysis of
the PCR products enabling the analysis
of the genetic
structure of the community.
Characterization of cloned sequences
enables assessment of the genetic
diversity of a community and can
reveal the phylogenetic affiliation of the
community members. Similarly, the
sequencing of bands of fingerprint
profiles can lead to
identification of particular populations.
Whole community DNA analyses such as
cross-DNA hybridization and DNA
fractionation by
density gradient can help to assess the
genetic structure of a community,
whereas reassociation kinetics
estimates genetic diversity in
terms of the number of different
genomes present in a community.
PARTIAL & WHOLE COMMUNITY ANALYSIS TECHNIQUES
PARTIAL COMMUNITY ANALYSIS METHODS
These approaches consist in the analysis of PCR-amplified sequences.
The most commonly used target sequences are the genes of the
ribosomal operon, and particularly the rrs gene (16S rRNA) and the
spacer between the rrs and rrl genes (intergenic spacer (IGS) 16S-23S).
These methods include:
— ‘genetic fingerprinting’, which provides a global picture of the genetic
structure of the bacterial community;
— PCR fragment cloning followed by restriction and/or sequencing
analysis, which enable assessment of the diversity of the community in
terms of the number of different species and, to a lesser extent, the relative
abundance of these species.
TECNICHE DI PCR FINGERPRINTING
In generale le metodiche molecolari basate sull’utilizzo della PCR permettono
di distinguere entità microbiche strettamente correlate dal punto di vista
genetico attraverso l’ottenimento di specifiche impronte molecolari
(molecular fingerprinting)
PCR con primers per marker genici di interesse TASSONOMICO
16S rRNA, 23S rRNA, regione intergenica 16S-23S
18S e 26S rRNA, ITS
rRNA RIBOSOMALI
Molecole essenziali per la vita delle cellule
Costituiscono la parte non proteica dei ribosomi
Elementi chiave della sintesi proteica
I rRNA possono essere considerati dei veri e propri
CRONOMETRI MOLECOLARI
perché caratterizzati dalla presenza al loro interno di zone più o
meno conservate,soggette a differente variabilità durante il
processo evolutivo.
L’informazione contenuta nei rRNA fa si che il sequenziamento dei
geni (rDNA) che codificano per le suddette macromolecole permetta
l’individuazione,su base genetica, di generi e specie, anche nel caso
di batteri di difficile classificazione
IL GENE 16S rRNA
LA SEQUENZA DEL GENE CHE CODIFICA PER IL16S rRNA NEI
MICROORGANISMI PROCARIOTI (EUBATTERI E
ARCHEBATTERI) SI E’ RIVELATA UN OTTIMO STRUMENTO
TASSONOMICO
 È una sequenza universale tra i batteri
 Non è soggetta a trasmissione orizzontale
 Presenta regioni conservate e regioni variabili intersperse
discriminanti le diverse specie batteriche
Le regioni al 5’ e 3’ del 16S rDNA sono fortemente conservate
mentre quelle interne presentano una maggiore variabilità.
I primers per le reazioni di PCR possono essere disegnati su tutte e
due le regioni fornendo informazioni differenti:
-Se disegnati al 5’ e 3’ permettono amplificazione e
sequenziamento di regioni conservate che consentono
l’identificazione del genere
-Se disegnati sulle regioni ipervariabili è possibile ottenere anche
l’identificazione della specie
RDP – Ribosomal Database Project – allineamento e identificazione
The genetic fingerprints provide complex band profiles
(i.e. a high number of different bands per profile) which
yield a representative of the genetic structure of the
community as a whole or of a section of it, defined by the
selected primers.
These profiles are not directly interpretable in terms of
richness and evenness, since one band may originate from
different species and one cell may be represented by
several bands.
This is particularly true with ribosomal sequences, since a
single bacterial species may have several different
rRNA sequences and different bacterial species may
have closely related rDNA sequences.
ARDRA – Amplified Ribosomal DNA
Restriction Analysis
Tecnica efficace, veloce, semplice ed economica per
l’identificazione della composizione di comunità microbiche
complesse
• Permette analisi simultanea di un elevato numero di
microorganismi
• Fornisce importanti informazioni sulle popolazioni microbiche
presenti in
ambienti differenti descrivendo il loro grado di
biodiversità e il loro
comportamento nel tempo
• Riesce a discriminare i microorganismi a livello di specie
Consiste nello studio dei profili elettroforetici
ottenuti dopo digestione con enzimi di restrizione
della sequenza di 16S rDNA ottenuta mediante PCR
ARDRA – Amplified Ribosomal DNA Restriction Analysis
Su 16S/18S/26S
L’ARDRA può essere utilizzata per lo screening di microorganismi
coltivabili e non coltivabili
1. Isolamento dei batteri dall’ambiente naturale mediante le
tradizionali tecniche di coltura/ottenimento del DNA totale
dalla matrice
2. Amplificazione del 16S/18S rDNA dei singoli isolati via PCR
3. Digestione degli ampliconi ottenuti mediante l’impiego di
endonucleasi
4. Separazione elettroforetica dei prodotti della digestione per
ciascun amplicone e ottenimento di profili elettroforetici
tipici (impronta) per ciascun amplicone digerito
5. Suddivisione dei profili ottenuti per ciascun amplicone in
gruppi definiti OTU (Operational Taxonomic Units)
6. Sequenziamento del 16S/18S rDNA per il capostipite di
ogni OTUs
7. Allineamento delle sequenze ottenute con quelle presente
in banca dati mediante programma BLAST
8. Assegnazione dell’appartenenza a genere e specie
CLONAGGIO E SEQUENZIAMENTO DEL 16S/18S rDNA
COSTRUZIONE DI LIBRARY di 16S/18S rDNA
1. Estrazione del DNA totale dalla matrice ambientale di interesse
2. Amplificazione dell’intero gene16S/18S rDNA o di una regione
interna di interesse
3. Inserimento del gene in vettore di clonaggio (pGEM, pBS) e
ottenimento di un numero di cloni compreso tra 100 e 200
4. Screening dei cloni ottenuti mediante analisi RFLP sull’inserto
(metodica ARDRA)
1kb
100bp
AluI
Profili ARDRA
ottenuti dagli isolati
da matrice
ambientale
PbIsol
1
2
3
4
5
6
100bp
7
8
1kb
HhaI
PbIsol
1
2
3
4
5
6
7
8
T-RFLP
(Terminal-Restriction Fragment Lenght Polymorphism)
È una tecnica che si basa sulla digestione con endonucleasi di
restrizione di prodotti di PCR ottenuti direttamente dal DNA totale
estratto dalla matrice ambientale
Detti frammenti vengono generati da primers complementari a
sequenze consenso del 16S rRNA gene, entrambi marcati
all’estremità ‘5
Gli ampliconi digeriti provenienti da tutti i batteri presenti
all’interno di una comunità sono separati o con elettroforesi su gel
o con elettroforesi capillare. Solo i frammenti che portano
l’estremità marcata vengono rilevati e contemporaneamente
analizzati da un sequenziatore automatico.
La T-RFLP unisce il vantaggio di poter essere facilmente
applicabile per l’analisi di più campioni con quello di fornire in
breve tempo informazioni a carattere tassonomico mediante il
diretto sequenziamento degli ampliconi
Svantaggio: tecnica molto costosa
ARISA (Automated Ribosomal Intergenic Spacer Analysis)
Tecnica di fingerprinting molecolare delle comunità microbiche
basato sul polimorfismo di lunghezza della regione
spaziatrice compresa tra i geni codificanti il 16S e il 23S rRNA
(ITS – Internal Transcribed Spacers)
16S rDNA, 23S rDNA, regione intergenica 16S-23S
I primers vengono disegnati su regioni conservate in modo da
garantire l’amplificazione di un ampio spettro tassonomico
Un primer viene marcato al 5’ con un fluoroforo → per rilevare
presenza e dimensioni dell’amplicone mediante sequenziatore
automatico
ARISA (Automated Ribosomal Intergenic Spacer Analysis)
Gli operoni ribosomali (anche gli ITS) son presenti in un ceppo
microbico in copie multiple
Le singole copie possono differire nelle regioni ITS a causa di
inserzioni e delezioni di una o poche basi o anche di interi geni per
tRNA
Specie batteriche diverse avranno regioni
intergeniche di lunghezza diversa
Ceppi diversi appartenenti ad una stessa
specie batterica possono differire per la
lunghezza delle regioni ITS
1. STIMARE NUMERO DI SPECIE DIVERSE
2. STIMARE LA VARIABILITA’ ESISTENTE ALL’INTERNO
DELLA STESSA SPECIE
DGGE (Denaturing Gradient Gel Electrophoresis)
Tecnica comunemente impiegata per studi di ecologia microbica
È UNA TECNICA SEPARATIVA ELETTROFORETICA CHE
PERMETTE DI IDENTIFICARE SINGOLE VARIAZIONI DI
SEQUENZA IN UN FRAMMENTO DI DNA
1. Estrazione del DNA totale dalla matrice ambientale
2. Amplificazione di regioni ipervariabili del 16S o altri geni
codificanti per rRNA
3. Separazione elettroforetica su gel di poliacrilammide in
presenza di un denaturante chimico(urea e formammide)
Come avviene la separazione elettroforetica
La separazione si ottiene sfruttando la diversa mobilità
elettroforetica, su gel di poliacrilammide contenente un
gradiente lineare di denaturante, di molecole di DNA a doppio
filamento di medesima lunghezza ma differente sequenza
nucleotidica
Frammenti
con
sequenze
diverse
possiedono
profili
di
denatuazione differenti e cessano di migrare lungo il gel in
corrispondenza di posizioni non uguali
La denaturazione dei frammenti di DNA procede per domini di
melting ovvero stretch di paia di basi aventi la stessa
temperatura di denaturazione (Tm).
Una volta che il dominio avente la temperatura di denaturazione più
bassa raggiunge raggiunge il punto nel gel a cui corrisponde la sua
Tm, si assiste al passaggio da una conformazione a elica ad una
conformazione parzialmente svolta del frammento di DNA
ARRESTO DELLA MIGRAZIONE DELLA MOLECOLA
IN QUEL DETERMINATO PUNTO DEL GEL
Quale tipo di informazione si ottiene
L’analisi PCR-DGGE fornisce una serie di profili
elettroforetici con una distribuzione caratteristica di
bande, ciascuna riconducibile ad una specie batterica,
descrivendo nel suo complesso la struttura tassonomica e
il grado di diversità della comunità microbica associata
alla matrice ambientale in studio
I primers utilizzati
All’estremità 5’ del primer forward viene aggiunto un clamp
(stringa di basi nuceotidiche) in GC di circa 30-40 paia di basi,
caratterizzato da una Tm più elevata rispetto a qualsiasi altra
regione del frammento del DNA 16S amplificato.
Il GC-clamp quindi funge da dominio ad alta temperatura di
melting impedendo così la completa dissociazione del filamento di
DNA in molecole a singolo filamento
Questa sequenza viene co-amplificata nella reazione di PCR e incorporata nei
frammenti
LA DGGE VIENE CONSIDERATA UN POTENTE STRUMENTO IN GRADO
DI MONITORARE ILCOMPORTAMENTO DELLE COMUNITA’
BATTERICHE A SEGUITO DI CAMBIAMENTI AMBIENTALI IN QUANTO
POSSONO ESSERE ANALIZZATI SIMULTANEAMENTE MOLTI
CAMPIONI COLLEZIONATI A DIVERSI INTERVALLI DI TEMPO, COSA
CHE NON PUO’ ESSERE FATTA ALTRETTANTO AGEVOLMENTE CON
PROCEDIMENTI DI CLONAGGIO
• conoscere la composizione di una comunità microbica complessa
• seguire nel tempo l’evoluzione di una comunità microbica, per
esempio a seguito di un intervento di bonifica o a causa di una
pressione sellettiva esercitata da un agente contaminante
• monitorare la persistenza di alcuni ceppi microbici all’interno di
una comunità complessa a seguito di inoculo massivo
(bioaugmentation)
• monitorare la presenza di genotipi di interesse all’interno della
comunità microbica e la loro evoluzione nel tempo
Per conoscere la composizione di una comunità microbica complessa:

le bande caratteristiche dei profili possono essere tagliate da
gel e successivamente sequenziate per avere una correlazione
filogenetica dei membri della comunità microbica
1.
2.
3.
4.
5.
Taglio delle bande maggiormente rappresentative
Eluizione della banda da gel
Ri-amplificazione del frammento di interesse
Sub-clonaggio del frammento in un opportuno vettore
Sequenziamento e confronto in banca dati
 il profilo DGGE può essere ibridato con sonde gruppospecifiche per determinare la presenza di una specifica
popolazione batterica
DG-DGGE (Double Gradient –
Denaturing Gradient Gel Electrophoresis
Il doppio gradiente è costituito dal gradiente chimico e da un
gradiente di porosità (% di poliacrilammide)
Il gradiente in porosità viene realizzato parallelamente a quello di denatura
La presenza del gradiente in porosità aumenta il grado di
risoluzione delle singole bande
RT-DGGE (Reverse Trascriptase – DGGE)
In questa variante migrano nel gel di poliacrilammide i cDNA
derivanti dalla retrotrascrizione dell’RNA estratto dal campione
Questa analisi fornisce importanti informazioni sulla vitalità dei
microrganismi che compongono la comunità microbica di
interesse
TGGE (Temperature Gradient Gel Electrophoresis)
In questo caso il gradiente non è costituito da un agente chimico
ma dalla temperatura. Un apposito dispositivo infatti crea un
gradiente di temperatura nello spazio.
Gli ampliconi ottenuti con PCR vengono ancora una volta separati
sfruttando la loro diversa Tm
DGGE (Denaturing Gradient Gel Electrophoresis)
LIMITI
• La DGGE è in grado di evidenziare solo gli amplificati ottenuti
dalle specie predominanti presenti nella comunità, infatti non è
possibile ottenere la separazione di tutti i frammentidi16S rDNA (o
di altri geni target)ottenuti dall’intera gamma di microorganismi
presenti all’interno di una matrice complessa
Numerosi studi hanno mostrato che solo le popolazioni
batteriche rappresentanti l’1% o aliquote maggiori della
comunità microbica possono essere evidenziate mediante
PCR-DGGE
• Con la DGGE è possibile separare solo frammenti di piccole
dimensioni,fino a 500 bp
• spesso si osserva la migrazione nella stessa posizione di
frammenti di DNA di diversa sequenza ma con comportamento di
melting molto simile che rende difficile il recupero di essi dal gel di
poliacrilammide
D2
D1
I
II
III
I
II
E1
D3
III
I
II
III
I
E2
II
III
I
II
E3
III
I
II
F1
III
I
II
F2
III
I
II
F3
III
I
II
G
III
H
SSCP (Single-Stranded Conformational Polymorphism)
Come la DGGE è una tecnica che permette di studiare le diversità di
comunità microbiche complesse attraverso l’analisi dei geni 16S
rDNA
I prodotti di PCR ottenuti vengono digeriti con esonucleasi in modo
da ottenere singoli filamenti
In condizioni non denaturanti i singoli filamenti assumono una
diversa conformazione in base alla loro sequenza nucleotidica
Quindi, a causa della loro diversa mobilità elettroforetica, le diverse
conformazioni possono essere separate per elettoforesi su gel di
poliacrilammide in condizioni non denaturanti
Le analisi SSCP richiedono un’elevata ottimizzazione delle
condizioni operative e basse temperature di lavoro. La capacità
discriminatoria della SSCP, generalmente più efficiente per
frammenti fino a 400 bp, dipende dalla posizione delle variazioni
nella sequenza del gene studiato
I prodotti possono essere rilevati marcando uno o entrambi i
primers con composti fluorescenti
METODICHE DI TIPIZZAZIONE
RAPD (Random amplified polymorphic DNA)
Analisi di variabilità tra ceppi batterici
Non impiegata per analisi di comunità
Amplificazione sul DNA genomico utilizzando un singolo
oligonucleotide, generalmente molto corto (10 bp), come
innesco
generazione di più frammenti di diversa
bassa stringenza
lunghezza (variabile da 100 a 2000 bp)
Separazione elettroforetica su gel di agarosio o
poliacrilammide: ottengo impronta molecolare del microrganismo
analizzato
Ceppi batterici diversi possono dare profili RAPD diversi: tanto
maggiore è la differenza tra ceppi tanto maggiore è la differenza
tra i profili ottenuti
Repetitive element sequence based PCR –
rep-PCR genomic fingerprinting
Rep-PCR is molecular biology based method very suitable for
rapid
grouping
and
tentatively
identification
of
microorganisms. Eukaryotic and prokaryotic DNA contains socalled repetitive DNA elements distributed more or less randomly
over the genome. In rep-PCR primers that anneals to these
repetitive elements are used. The PCR-products are separated
using agarose gel electrophoresis and a species (sometimes
strain)-specific pattern is obtained. These patterns can be
analysed using e.g. BioNumerics. Isolates with similar patterns
(i.e. belonging to the same species) will cluster together. Full
identification can be achieved by e.g. sequencing a limited number
of isolates from each group within the cluster. Various rep-PCRprimers have been developed. The primer GTG5 (5’GTG GTG GTG
GTG GTG 3’) seems to be very suitable for grouping of LAB and
yeast at the species level, but other primers may prove better
depending on the specific task (use the same over all approach,
just change primers and possibly annealing and elongation
temperature).
Repetitive element sequence based PCR –
rep-PCR genomic fingerprinting
Three categories of conserved repetitive sequences are
used for bacterial typing:
1. the enterobacterial repetitive intergenic consensus
sequence ERIC; they are127-bp imperfect palindromes that
occur in multiple copies in the genomes of enteric bacteria and
vibrios
2. the repetitive extragenic palindromic sequence REP;
3. The BOX element.
Often, the three categories are used in combination in
order to achieve better discrimination.
rep-PCR
BOX-PCR FINGERPRINTING
A highly conserved repeated DNA element has been identified in the chromosome
of Streptococcus pneumoniae (pneumococcus) and given the name of
the BOX repetitive element. This was the first demonstration of the presence
of such a repetitive DNA moiety in a Gram positive bacterial species.
Approximately 25 of these elements are found in noncoding regions dispersed
throughout the entire pneumococcal genome. The BOX repeat is found to consist
of three discriminate regions: boxA, boxB, and boxC, which are 59, 45, and
50 basepairs in length, respectively. Various different combinations of these
three elements are found to be present in different BOX loci and limited
sequence heterogeneity is encountered among different elements from the same
strain or elements sequenced from different strains. The first publication on the
BOX repetitive elements also described its intricate secondary structure, supported
by compensating basepairing in different loci where the repeat is
Encountered. Moreover, their location in the vicinity of genes
involved in the regulation of various aspects of bacterial competence, genetic
transformation and virulence suggest that the elements might well be involved
in coordination of the control of gene expression. More recently has been
demonstrated that the presence of a BOX element is associated with
variation in colony opacity of the pneumococcus. The frequency with which
the colonies switched from transparent to opaque clearly depended on the
presence of boxA and boxC elements. It has also been shown that BOX
elements form targets for site-specific recombination events, which provides
another possibility
AFLP (Amplified Fragment Lenght Polymorphism)
Tecnica di fingerprinting molecolare che si basa sulla
restrizione e amplificazione del DNA
1. Restrizione – il DNA viene digerito con enzimi di restrizione
in modo da produrre frammenti di dimensioni inferiori a 1kb
2. Ligazione – i frammenti vengono ligati ad adattatori che
presentano le estremità complementari ai siti di taglio
3. Amplificazione – con primer disegnati su sequenza
oligonucleotidica degli adattatori. L’aggiunta di una o due basi al
3’ della sequenza dei primers riduce il numero dei frammenti che
vengono amplificati
4. Separazione – elettroforesi su gel di poliacrillamide;
elettroforesi capillare mediante l’uso di sequenziatori automatici
Applicazioni: identificazione di ceppi batterici (patogeni), studi di
genetica di popolazioni microbiche
PULSED FIELD GEL ELECTROPHORESIS
PFGE uses molecular scissors, called restriction enzymes, to cut
bacterial DNA at certain locations known as restriction sites. These
molecular scissors are selected to generate a small number of DNA
pieces that can be separated based on size. Usually these DNA pieces,
or restriction fragments, are large and need to be specially treated
and separated to generate a DNA fingerprint.
- First the bacteria are loaded into an agarose suspension, similar to
gelatin,
- then the bacterial cell is opened to release the DNA.
- Once the DNA is released then the agarose and DNA suspension,
also known as a plug, is treated with restriction enzymes.
- The treated plugs are then loaded onto an agarose gel and the
restriction fragments are separated based on size using an electric
field.
- What makes PFGE different from how scientists usually separate DNA
is because PFGE can separate several large restriction fragments.
To do this an electric field that constantly changes direction to
the gel is used to generate a DNA fingerprint.
Advantages of PFGE
PFGE subtyping has been successfully applied to the subtyping of
many pathogenic bacteria and has high concordance with
epidemiological relatedness.
PFGE has been repeatedly shown to be more discriminating than
methods such as ribotyping or multi-locus sequence typing for many
bacteria.
PFGE in the same basic format can be applied as a universal generic
method for subtyping of bacteria. Only the choice of the restriction
enzyme and conditions for electrophoresis need to be optimized for
each species.
DNA restriction patterns generated by PFGE are stable and
reproducible.
Limitations of PFGE
Time consuming
Requires a trained and skilled technician
Does not discriminate between all unrelated isolates
Pattern results vary slightly between technicians
Can’t optimize separation in every part of the gel at the same time
Don’t really know if bands of same size are same pieces of DNA
Bands are not independent
Change in one restriction site can mean more than one band
change
“Relatedness” should be used as a guide, not true phylogenetic
measure
Some strains cannot be typed by PFGE
FISH (Fluorescence In situ Hybridisation)
È una metodica frequentemente utilizzata in microbiologia
ambientale per lo studio di comunità microbiche complesse
L’ibridazione,basata sull’impiego di oligonucleotidi marcati con
composti fluorescenti, viene indotta su cellule intere fissate
Le cellule bersaglio vengono osservate con un microscopio a epifluorescenza
L’impiego di sonde molecolari prevede la conoscenza del gene da
studiare.
Quando il gene target è il 16S possono essere costruite sia sonde
universali in grado di appaiarsi con gli rRNA di eubatteri o
archebatteri su regioni conservate,sia sonde specie-specifiche aventi
come bersaglio le regioni altamente variabili dell’rRNA
La FISH può essere applicata sia per monitorare la presenza
di particolari gruppi di microorganismi in una matrice
complessa, sia per individuare la presenza di una
determinata specie batterica
The sample is first fixed to stabilize the cells and permeabilize the cell
membranes. The labelled oligonucleotide probe is then added and allowed to
hybridize to its intracellular targets before the excess probe is washed away.
The sample is then ready for single-cell identification and quantification by
either epifluorescence microscopy or flow cytometry.
FISH
CULTURE-INDEPENDENT methods
IBRIDAZIONE SU MICROARRAY
TECNOLOGIA GENOMICA utilizzata per lo studio dell’espressione
genica e per la ricerca di mutazioni puntiformi
MICROARRAY: supporto solido (plastica, vetro) cui sono adesi in
modo covalente e in una disposizione ordinata acidi nucleici che
funzionano come sonde




Estrazione del DNA o RNA dal ceppo batterico
Frammentazione e marcatura con fluorocromi
Ibridazione con le sonde fissate sul microarray
Analisi con uno scanner a fluorescenza per rilevare quale sonda ha ibridato
1. Quali sequenze e quali geni sono presenti anche nel ceppo o
campione ambientale analizzato
2. Quanti e quali geni sono espressi in quel ceppo
IBRIDAZIONE SU MICROARRAY
In contesto microbiologico-ambientale:
Collezioni di geni funzionali
Per evidenziare la presenza di geni
che codificano enzimi coinvolti nei
processi biogeochimici
Collezioni di geni marcatori tassonomici (16S rDNA)
Per identificare le specie presenti in un campione ambientale
Metodo molto potente in quanto permette di descrivere una comunità batterica in
‘tempo reale’
Interi genomi di ceppi di riferimento
Per valutare le differenze nel contenuto genomico tra un
ceppo di riferimento e un ceppo naturale isolato
nell’ambiente
METAGENOMICA
ISOLAMENTO DIRETTO DI DNA DALL’AMBIENTE E SUO
SUCCESSIVO CLONAGGIO E SEQUENZIAMENTO
è un potente strumento per la scoperta della genetica e
fisiologia dei microrganismi non coltivabili




isolamento del DNA genomico dall’ambiente
clonaggio del DNA in apposito vettore
trasformazione di un ceppo ricevente
screening della libreria metagenomica così ottenuta
Selezione dei cloni
Sequenziamen
per PCR o ibridazione to casuale
(per la presenza di
massivo
marcatori filogenetici
o di geni di
interesse)
Selezione dei cloni per
espressione di un fenotipo
particolare
(specifiche attività enzimatiche o
produzione di antibiotici)
L’ANALISI STATISTICA
I trattamenti statistici utilizzati includono quattro diversi livelli di analisi
Quantificazione della diversità genetica
Confronto dei profili (aplotipi): numero di bande diverse o in comune
Misura della distanza genetica
Misura del rapporto tra le bande condivise tra i due campioni rispetto alle
bande totali presenti
Analisi della struttura genetica
Per correlare la diversità osservata alle variabili presenti nell’ambiente e quindi
dare significato biologico-funzionale alle differenze osservate
AMOVA (analisi della varianza molecolare)
Analisi multivariata
Analisi delle relazioni genetiche tra le popolazioni
Stima della distanza tra sequenze con numero di nucleotidi differenti
UPGMA
L’evoluzione è il processo per il quale i
cambiamenti che intervengono in una linea di
discendenti portano, nel tempo, alla formazione di
nuove varietà, ed eventualmente di nuove specie di
organismi.
L’evoluzione avviene in ogni sistema
autoreplicantesi in cui la variazione è il risultato del
processo di mutazione e la selezione si basa sulla
capacità adattativa differenziale.
Così nel tempo evolvono sia le cellule sia i virus.
Le relazioni evolutive tra gli organismi sono oggetto di
studio della filogenesi.
Le relazioni filogenetiche tra cellule possono essere
dedotte confrontando l’informazione genetica
(sequenza nucleotidica o amminoacidica) che esiste
nei loro acidi nucleici o nelle proteine.
Le macromolecole che formano il ribosoma , RNA
ribosomali, sono strumenti eccellenti per valutare le
relazioni evolutive.
ATTTTGTTCACTAATAGGGGGCGATTGGGCCGACGTCGCATGCTCCCGGCCGCCATGGCGGCCGCGG
GAATTCGATTACGGCTACCTTGTTACGACTTCACCCCAGTCATCGGCCACACCGTGGCAAGCGCCCTCC
CGAAGGTTAAGCTACCTGCTTCTGGTGCAACAAACTCCCATGGTGTGACGGGCGGTGTGTACAAGGCC
CGGGAACGTATTCACCGCAGCAATGCTGATCTGCGATTACTAGCGATTCCGACTTCATGGAGTCGAGTT
GCAGACTCCAATCCGGACTGAGATAGGGTTTCTGGGATTGGCTTACCGTCGCCGGCTTGCAGCCCTCT
GTCCCTACCATTGTAGTACGTGTGTAGCCCTGGCCGTAAGGGCCATGATGACTTGACGTCATCCCCACC
TTCCTCCGGTTTGTCACCGGCGGTCTCCTTAGAGTTCCCACCATTACGTGCTGGCAACTAAGGACAAGG
GTTGCGCTCGTTGCGGGACTTAACCCAACATCTCACGACGCGAGCTGACGACAGCCATGCAGCACCTG
TGTTCGAGTTCCCGAAGGCACCAATCCATCTCTGGAAAGTTCTCGACATGTCAAGGCCAGGTAAGGTTC
TTCGCGTTGCATCGAAATTAAACCACATACTCCACCGCTTGTGCGGGCCCCCGTCAATTCCTCTGAGTTT
CAGTCTTGCGACCGTACTCCCCAGGCGGCGAACTTAACGCGTTAGCTTCGATACTGCGTGCCAATTGCA
CCCCAACATCCAGTTCGCATCGTTTAGGGCGTGGACTACCAGGGTATCTAATCCTGTTTGCTCCCCACG
CTTTCGTGCCTCAGTGTCAGTGTTGGTTCCAGGTAGCTGCCTTTCGCCAATGAGATGTTCCTTCCCGATC
TCTACGCATTTCCACTGCTACACCGGGAATTTCCGCTACCCTTCTACCACACTTCTAGTTGTCAGTTTCCA
CCTGCAGTTCCCAGGGTTGGAGGCTCAGGGCTTTTCCACAACAGACTTAAACAAACCCACCCTACGCA
CGCCTTTAGCGCCCAGGTAATTCCGGAGTTACGGCTTGCACCCCTTTCGTATTACCGGCGGCTGCCTGG
ACGAAGTTACCGGTGCCTTATTCTTTGGAACCGTCTATCCCGACCAAGATTACGCTTGAATCCTTTCCAC
AAGCCTTTACAACTCGGAGCCTCTATTTCA
http://www.ncbi.nlm.nih.gov/genbank/
GenBank Overview
What is GenBank?
GenBank ® is the NIH genetic sequence database, an annotated
collection of all publicly available DNA sequences (Nucleic Acids
Research, 2013 Jan;41(D1):D36-42).
GenBank is part of the International Nucleotide Sequence Database
Collaboration , which comprises the DNA DataBank of Japan (DDBJ),
the European Molecular Biology Laboratory (EMBL), and GenBank at
NCBI. These three organizations exchange data on a daily basis.
The complete release notes for the current version of GenBank are
available on the NCBI ftp site. A new release is made every two
months. GenBank growth statistics for both the traditional GenBank
divisions and the WGS division are available from each release.
An example of a GenBank record may be viewed for a Saccharomyces
cerevisiae gene.
Choose a BLAST program to run.
Program
Program Description
nucleotide blast
Search a nucleotide database using a nucleotide query
Algorithms: blastn, megablast, discontiguous megablast
protein blast
Search protein database using a protein query
Algorithms: blastp, psi-blast, phi-blast, delta-blast
blastx
Search protein database using a translated nucleotide
query
tblastn
Search translated nucleotide database using a protein
query
tblastx
Search translated nucleotide database using a translated
nucleotide query
1) Connect to the NCBI BLAST Homepage with your browser.
http://www.ncbi.nlm.nih.gov/BLAST/
2) In the Nucleotide section on the page choose the link to the
Nucleotide-nucleotide BLAST (blastn) search algorithm
3) Enter your DNA sequence into the Search text box
Copy your DNA sequence by either selecting the sequence with the mouse
and using the Copy command in the Edit menu of your browser. Click on
the Search dialog box in the NCBI window and paste your DNA sequence
into the box by choosing the Paste command under the Edit menu, or the
paste keyboard command.
If you only want to search with a subset of your sequence you can select
these bases by putting in the appropriate numbers in the Set
subsequence dialog boxes. However it is often easier just to edit the
sequences that you want in text edit program (Word), and paste them in.
.
4) Seelct the default (nr) database in the Choose database
menu box.
There are many different databases that you can choose among to
do your searches. Some databases only contain DNA or protein
sequences for a specific organism, such as humans or mouse.
Others contain different types of DNA (genomic vs cDNA sequences,
etc.). To search only a specific database, click on the Database
Menu box and while holding on the mouse button, scroll to the
database you want, and release the mouse button. The nr is the
default value. The nr nucleotide database search includes all Nonredundant GenBank + EMBL + DDBJ + PDB sequences (but no EST,
STS, GSS, or HTGS sequences). The nr peptide sequence database
includes all non-redundant GenBank CDS (coding sequence)
translations + PDB + SwissProt + PIR + PRF. Note that the program
is smart enough to determine which nr database to search according
to which blast program you run (e.g. peptide database for blastp,
nucleotide database for blastn). If you want to search the EST
sequences, you have to do a separate blast
5) Click on the BLAST! button to perform the search.
To run the Blast search click on the BLAST! button. However, if
desired, there are other options that you may want to alter before
doing your search to reduce or increase the number of matches or to
change the output from of the data from the search. A short
description of these options is shown below.
http://eztaxon-e.ezbiocloud.net/ezt_identify
Task
s
R
a
Name
n
k
1
2
3
4
5
6
7
8
Strain Authors
Taxonomy
Pairw
ise
Diff/
Access
Simil Total
ion
arity nt
(%)
Lysobacter
Bacteria; Proteobacteria; Gammaproteobacteria;
GH19- Weon et al.
yangpyeong
Xanthomonadales; Xanthomonadaceae; Lysobacter;
3(T)
2006
ensis
Lysobacter yangpyeongensis;
Bacteria; Proteobacteria; Gammaproteobacteria;
Lysobacter YC6269 Aslam et al.
Xanthomonadales; Xanthomonadaceae; Lysobacter;
oryzae
(T)
2009
Lysobacter oryzae;
Bacteria; Proteobacteria; Gammaproteobacteria;
Lysobacter GH1- Weon et al.
Xanthomonadales; Xanthomonadaceae; Lysobacter;
daejeonensis 9(T)
2006
Lysobacter daejeonensis;
Stenotropho
Bacteria; Proteobacteria; Gammaproteobacteria;
ICB
Ramos et al.
monas
Xanthomonadales; Xanthomonadaceae;
89(T) 2011
pavanii
Stenotrophomonas; Stenotrophomonas pavanii;
ATCC Gray and
Bacteria; Proteobacteria; Gammaproteobacteria;
Pseudomona
23328( Thornton
Xanthomonadales; Xanthomonadaceae;
s pictorum
T)
1928
Stenotrophomonas; Pseudomonas pictorum;
ATCC
Bacteria; Proteobacteria; Gammaproteobacteria;
Pseudomona
19867( Moniz 1963 Xanthomonadales; Xanthomonadaceae;
s hibiscicola
T)
Stenotrophomonas; Pseudomonas hibiscicola;
Stenotropho
Bacteria; Proteobacteria; Gammaproteobacteria;
TR6Yang et al.
monas
Xanthomonadales; Xanthomonadaceae;
01(T) 2006
koreensis
Stenotrophomonas; Stenotrophomonas koreensis;
Bacteria; Proteobacteria; Gammaproteobacteria;
Lysobacter ZLDZhang et al.
Xanthomonadales; Xanthomonadaceae; Lysobacter;
bugurensis 29(T) 2011
Lysobacter bugurensis;
Comp
leten
ess
(%)
meg
aBLA BLASTN
ST
score
score
DQ191 47.47 622/1
99.7
179
47.47 184
0
EU376 47.17 626/1
97.0
963
47.17 185
0
DQ191 45.95 640/1
99.7
178
45.95 184
0
FJ748645.62 640/1
100
83
45.62 177
0
AB021 45.62 640/1
98.7
392
45.62 177
0
AB021 45.54 641/1
98.8
405
45.54 177
0
AB166 45.42 644/1
99.7
885
45.42 180
0