Metodiche di tipizzazione molecolare di specie batteriche Gherardi Giovanni Università Campus Bio-Medico Roma Corso di Laurea Tecniche di laboratorio Biomedico aa.2010/2011 Diversità genetica: specificità ospite Patogenicità resistenza antibiotica virulenza perché identificare i batteri a livello di sub specie/ceppo? Aumentata virulenza e trasmissibilità Resistenza multipla agli antibiotici Aumentato spettro d’ospite Possibilità di manipolazione genetica con bioterrorismo Diversità intraspecie è dovuto a 3 eventi: trasferimento genico orizzontale perdita o acquisizione di geni ricombinazione …quindi, perché la tipizzazione molecolare : •ORIGINE CLONALE DEI CEPPI (SE DERIVANO DA UN ORGANISMO PARENTALE) •IDENTIFICAZIONE DEI BATTERI A LIVELLO DI CEPPO •DALLA DIVERSITA’ GENETICA SPIEGARE IMPORTANTI CARATTERISTICHE FENOTIPICHE APPLICAZIONI: - clinico, disseminazione di infezioni pazientepaziente, animale-paziente, ambiente-paziente) - ambientale (presenza e diffusione di organismi in ambienti inanimati) - industriale (identificazione di organismi di valore o “minacciosi” nel campo bio-industriale) Utile per identificare ceppi o cloni all’interno di una specie di patogeni emergenti (bioterrorismo e in biologia forense) Distinguiamo: - comparativa “typing”: di screening - definitiva “typing” (library): definisce “definitivamente” il clone Tipizzazione può essere eseguita a diversi livelli: 1.locale, per piccoli studi. 2.regionale o nazionale, in un “reference laboratory”. 3.Internazionale, “networks” internazionali, definendo e sorvegliando la disseminazione globale di particolari cloni. PRIMA FASE: SELEZIONE DELLA COLLEZIONE DEI CEPPI Ceppi di particolare interesse: - ceppi non correlati epidemiologicamente - ceppi appartenenti ad “outbreaks” a - isolati con determinati criteri di selezione (particolari fattori di virulenza, particolari tratti di antibiotico-resistenza, ecc) Il numero dei ceppi e la complessità dipende dagli obiettivi della ricerca Gli organismi dovrebbero essere conservati in brodo con glicerolo a – 80°C, secondo le linee guida. IMPORTANTE! Vi deve essere sempre un database con dati clinici, epidemiologici e demografici dei ceppi. a (outbreak: aumento temporale nella incidenza di infezione o colonizzazione da parte di certe specie batteriche, provocate da una aumentata trasmissione di un ceppo specifico). RAGIONI PER LA TIPIZZAZIONE Sorveglianza delle malattie infettive Investigazione di outbreaks Studi di patogenesi e del corso di infezione. Quando riguarda tipizzazione di gruppi di ceppi con diverso grado di virulenza, in questo caso possono essere identificati markers di virulenza correlati alla patogenesi (presenza di determinati fattori di virulenza associati ad alcuni cloni o ceppi). Studio della genetica di popolazione batterica CRITERI PER LA VALUTAZIONE E VALIDAZIONE DEI METODI DI TIPIZZAZIONE 1.”Performance criteria” - Stabilità - “typeability” - Potere discriminatorio - Concordanza (con il quadro epidemiologico) - Riproducibilità - “test population” 2. “Convenience criteria” - Flessibilità e spettro - Rapidità - Accessibilità - Facilità di esecuzione - Costo - Disponibilità per analisi computerizzata e di database elettronici Performance criteria STABILITA’ Le caratteristiche testate dovrebbero rimanere stabili per ogni isolato dopo il suo isolamento primario e durante la conservazione e la subcultura in laboratorio. Per saggiare la stabilità, subculture multiple dello stesso ceppo, conservato in periodi diversi e in diverse condizioni, devono essere processate nella stessa corsa per rendere al minimo le variazioni introdotte in laboratorio TYPEABILITY Si riferisce alla capacità del metodo di assegnare un tipo a tutti gli isolati testati con quel metodo. Può essere espressa come percentuale di isolati tipizzabili sul numero totale di isolati tipizzati (tipizzabili e non-tipizzabili). POTERE DISCRIMINATORIO Si riferisce alla capacità di un metodo di assegnare diversi tipi a due ceppi non correlati campionati “randomly” all’interno di una popolazione di una data specie. Può essere espresso come probabilità, mediante il Simpson index. Il Simpson index dovrebbe idealmente corrispondere a 1.00, ma in pratica dovrebbe essere > 0.95 perché un metodo di tipizzazione possa essere considerato più o meno “ideale”. Metodi di tipizzazione che indagano polimorfismi in siti multipli dell’intero genoma hanno più probabilità di avere un maggiore potere discriminatorio rispetto ai metodi che indagano un singolo locus. CONCORDANZA Concordanza epidemiologica. I risultati di tipizzazione dovrebbero riflettere, confermare e possibilmente chiarire l’informazione epidemiologica disponibile sui casi in esame. RIPRODUCIBILITA’ Si riferisce alla capacità di un metodo di tipizzazione di assegnare lo spesso tipo ad un isolato testato in occasioni indipendenti, separate nel tempo e/o nello spazio. La riproducibilità può essere influenzata da vari step in una procedura, come risultato o del protocollo usato o del grado di stringenza: variazioni nella condizione di crescita, dei metodi usati nella estrazione del DNA, nei reagenti usati, diversi tipi di apparecchiature, diversità nella osservazione e registrazione dei risultati, come anche nela loro analisi ed interpretazione. Da ciò è importante sia la riproducibilità intra-laboratorio che quella inter-laboratorio; entrambe richiedono standardizzazione dei protocolli e personale adeguatamente attrezzato. TEST POPULATION Questo è il prerequisito per valutare la “typeability”, il potere discriminatorio e la concordanza epidemiologica dei metodi di tipizzazione. La natura della popolazione è definita dal contesto epidemiologico, cioè dalla specie coinvolta, se lo studio è locale, regionale o globale, e se la sorveglianza è “long-term”. Un sufficiente numero di isolati all’interno di una popolazione test dovrebbe essere incluso (circa 100 isolati) e questi dovrebbero riflettere la diversità totale interno di quella specie. E’ anche importante coprire diverse nicchie ecologiche, come particolari popolazioni di pazienti (età, stato immunitario, tipo di ospedale e reparto, origine geografica, ecc) e importante serbatoi ambientali per le infezioni ad esempio “foodborne” e “waterborne”. Convenience criteria FLESSIBILITA’ E SPETTRO Questo riflette il range di specie che sono tipizzabili con modificazioni minime del metodo (principio, apparecchiature, reagenti, ecc.). I metodi basati sul sequenziamento del DNA mostrano ottima flessibilità. RAPIDITA’ Si riferisce al tempo totale richiesto, a partire dagli isolati batterici ai risultati finali di tipizzazione (interpretazione dei risultati inclusa). I metodi più rapidi sono le cosiddette procedure “coltureindipendenti”. ACCESSIBILITA’ Dipende dalla disponibilità dei reagenti e delle apparecchiature, e dalle attitudini richieste dal personale. FACILITA’ DI ESECUZIONE Comprende semplicità tecnica, carico di lavoro, utile per processare un gran numero di isolati, facilità di interpretazione dei risultati. COSTO DISPONIBILITA’ PER ANALISI COMPUTERIZZATA E DI DATABASE ELETTRONICI Disponibilità di analisi computerizzata ed incorporazione dei risultati in database elettronici, fattori importanti per “studi di confronti longitudinali” tra numerosi isolati. Studi epidemiologici locali: analisi computerizzata e visiva. Studi epidemiologici regionali e globali, importante la creazione di database elettronici per valutare diffusione di specifici cloni. Importante esempio di database elettronici : MLST. METODI DI TIPIZZAZIONE FENOTIPICI E GENOTIPICI METODI FENOTIPICI - biotyping - pattern di sensibilità agli antibiotici (antibiogramma) - serotyping - tipizzazione fagica e batteriocina (saggia i profili litici esposti a diversi batteriofagi o batteriocine - tossine batteriche) - SDS-PAGE, di componenti cellulari e extracellulari - Multilocus enzyme electrophoresis (MLEE) - Spettrometria di massa (MS) diversi approcci “-omics”: proteomics, glycomics,… MALDI - TOF Biotyping Reazioni enzimatiche Biotipo 1 Biotipo 2 Biotipo 3 Biotipo 4 Fermentazioni di zuccheri Serotyping Antibiotyping Quellung reaction per la sierotipizzazione capsulare dello Streptococcus pneumoniae (esempio antisiero per sierotipo capsulare 14) Serotyping Tipizzazione fagica SDS-PAGE MALDI – TOF MS Moura et al. FEMS Immunol Med Microbiol 2008, 53:333-342 Moura et al. FEMS Immunol Med Microbiol 2008, 53:333-342 METODI GENOTIPICI METODI BASATI SULL’IBRIDAZIONE - ibridazione diretta - ribotyping METODI BASATI SU FRAMMENTI - tipizzazione plasmidica - metodi RFLP (restriction fragment length polymorphism): • Restriction endonuclease analysis (REA); Ribotyping; Tipizzazione della sequenza IS6110 di M. tuberculosis • PFGE - PCR fingerprinting (esempio sequenze BOX in S. pneumoniae o sequenze IS256 per S. aureus) Per aumentare la risoluzione della PCR fingerprinting la PCR è seguita da restrizione con un enzima di restrizione (PCR-RFLP analisi). - amplified fragment length polymorphism (AFLP) analisi, esempio di metodo di tipizzazione basato sulla PCR. - multilocus variable number tandem repeat (VNTR) analisi (MLVA) METODI BASATI SUL SEQUENZIAMENTO DEL DNA - single-locus sequence typing (SLST): emm typing per lo S. pyogenes, spa typing per S.aureus. - MLST - SNP genotyping METODI BASATI SULL’IBRIDAZIONE Direct (and reverse) hybridisation: Il DNA immobilizzato viene ibridizzato con sonde di DNA selettive; alcuni templates vengono riconosciuti, altri no. Essenzialmente è la tecnologia del ‘Southern hybridisation’. Esempi: • Binary typing per lo S. aureus • Spoligotyping per M.tuberculosis, amplificazione di locus con tandem repeat con variazioni nella sequenza interna. Tali varianti vengono evidenziate con sonde tandem repeat-specifiche Ribotyping: Stima il numero dei loci genici ribosomiali e la loro localizzazione lungo il cromosoma Usa sonde di DNA Gli operoni rRNA comprendono geni conservati, ciascuno dei quali è fiancheggiato da regioni di DNA variabili. Variazioni di sequenze in queste regioni porta a diversi profili RFLP quando si utilizzano sonde di DNA per i domini conservati dei geni 16S e 23S rRNA. Ribotyping: Vantaggi: • Automatizzata • Riproducibile • Operoni rRNA sono universali • poche bande prodotte • economica Svantaggi: • Basso potere discriminatorio • richiede grandi quantità di DNA genomico ad alta qualità • labor e time consuming • sistemi di rilevazione complessi, quali radioisotopi METODI BASATI SUI FRAMMENTI Plasmid typing: Dipende dal numero, dalla dimensione e dai profili di restrizione con REs. Svantaggi: • Mancanza di stabilità nel contenuto dei plasmidi rende tale tecnica poco utilizzata REA: REstriction endonuclease analysis (REA), utilizzando enzimi ad alta frequenza di taglio. L’analisi REA viene accoppiata a Southern blot e poi ad ibridazione, esempi: • Rybotyping • IS 6110 M.tuberculosis IS6110 typing- RFLP PFGE SCELTA DELL’ENZIMA DI RESTRIZIONE (RE con bassa frequenza di taglio) STANDARDIZZAZIONE DEI PROTOCOLLI, SVILUPPO DI DATABASE GLOBALI (PulseNet: per foodborne deseases quali Escherichia coli O157:H7, Salmonella non-typhi, Shigella, e Listeria monocytogenes) LIMITAZIONI PERSONALE SPECIALIZZATO (concentrazione del DNA nelle plugs, percentuale di agarosio, voltaggio, temperatura forza del tampone, attitudini tecniche, ecc) LABORIOSA E LUNGA SCARSA RIPRODUCIBILITA’ INTERLABORATORIO RICHIEDE DNA AD ALTA QUALITA’ BANDE QUASI IDENTICHE, MA DIVERSE: SCARSA RISOLUZIONE PFGE Dendogramma Dice coefficiente: no. bande A + no. bande B uguali no. bande A + no. bande B totali Un evento mutazionale può differire da 0 a 4 bande (frammenti di DNA). Quando non vi sono bande di differenza osservabili, gli isolati devono essere chiamati “indistinguishable” e non “identical”, ed assegnati allo stesso tipo e subtipo. Quando gli isolati differiscono per 1 - 4 bande, questi devono essere assegnati allo stesso tipo, ma con diverso subtipo. Da 5 a 8 bande di differenza possono essere attribuibili ad almeno due eventi mutazionali. In generale: -fino a 4 bande di differenza: isolati correlati geneticamente. -da 5 a 6 bande di differenza: da considerare le informazioni cliniche ed epidemiologiche -sopra le 6 bande di differenza: isolati non correlati geneticamente Sempre: correlare i dati ottenuti con la PFGE con le notizie cliniche ed epidemiologiche. Interpretazione visiva + computer-assistita. La PCR (reazione a catena della polimerasi) utilizzata per amplificare sequenze di DNA (a) Il DNA da amplificare (DNA bersaglio) viene prima riscaldato per separare le due eliche (DENATURATION), poi vengono aggiunti in eccesso due oligonucleotidi come inneschi (primers) (ANNEALING), uno complementare ad ogni elica, e la DNA polimerasi. (b) In seguito all’appaiamento del primer l’estensione del primer da parte della DNA polimerasi genera una copia della sequenza originale di DNA (EXTENSION). (c) Due cicli aggiuntivi di PCR generano rispettivamente 4 e 8 copie della sequenza originale di DNA. (d) Risultati ottenuti dopo 20 cicli di PCR su una preparazione di DNA contenente solo 10 copie del gene bersaglio. Utilizzo della PCR: 1.Clonaggio e sequenziamento 2.Studi comparativi ed evoluzionistici (gene del 16S rRNA) 3.Amplificare piccole quantità di DNA 4.Microbiologia diagnostica 5.Fingerprinting in medicina legale PCR PCR fingerprinting: Utilizzo di primers conosciuti che vanno ad amplificare frammenti ben noti di specifiche specie batteriche (a differenza dei primers “sconosciuti” che vanno ad amplificare arbitrariamente frammenti di DNA) esempi: • BOX-PCR per S. penumoniae • IS256-PCR per S. aureus BOX-PCR Per aumentare la risoluzione della PCR fingerprinting la PCR è seguita da restrizione con un enzima di restrizione (PCR-RFLP analisi). Permette di evidenziare mutazioni puntiformi nel sito di taglio dell’enzima: è una variante del metodo Single nucleotide polimorphislms (SNPs) REP-PCR Sequenze di DNA ripetute in multiple copie sono presenti nei genomi batterici. La loro funzione non è nota, ma sono utili per il fingerprinting dei batteri. Utilizzati specifici primers che amplificano frammenti di DNA che si ritrovano tra le sequenze ripetute. 3 famiglie di sequenze ripetute sono state utilizzate nella REP-PCR: - le sequenze 35–40-bp repetitive extragenic palindromic (REP) -le sequenze 124–127-bp enterobacterial repetitive intergenic consensus (ERIC) -le sequenze 154-bp BOX element I frammenti si visualizzano mediante elettroforesi su gel agarosio o elettroforesi capillare. VANTAGGI Basso costo, rapidità, facilità, poco laboriosa, riproducibilità sia su eucarioti che su procarioti usata su: Acinetobacter spp., Streptococcus pneumoniae, M. tuberculosis , Clostridium difficile, L. monocytogenes Un kit commerciale: REP-PCR DiversiLab (Spectral Genomics Inc., Houston, TX), con il DIVERSILAB software che fornisce la interpretazione e la conservazione dei dati in un database. Inoltre permette di lavorare sulle cellule intere senza estrarre il DNA. SVANTAGGI rischi di contaminazioni, Artefatti, Necessità di controlli multipli AP-PCR (Arbitrarily primed PCR) o RAPD E’ una PCR random di regioni genomiche sconosciute usando primers scelti arbitrariamente. Usando primers corti (generalmente di 10 bp) in combinazione con basse temperature di annealing, l’AP-PCR permette l’amplificazione di loci multipli, con ampliconi di diversa grandezza. VANTAGGI economica rapida Sensibile SVANTAGGI Riproducibilità inter-laboratorio Influenzata da diversi paramentri( temperatura di annealing e sequenza dei primers, qualità e concentrazione del DNA template, apparecchiatura di PCR e reagenti) Ottimizzazione Standardizzazione della procedura mediante “Ready-To-Go RAPD analysis beads (Amersham Pharmacia Biotech)”, che fornisce Taq, dNTPs, buffers e un protocollo generale della RAPD AP-PCR (Arbitrarily primed PCR) o RAPD AP-PCR (Arbitrarily primed PCR) o RAPD I primers arbitrari devono legarsi al template secondo uno specifico ORIENTAMENTO I primers arbitrari devono legarsi al template entro una RAGIONEVOLE DISTANZA l’uno dall’altro Amplified Fragment Length Polimorphism Analysis (AFLP): AFLP consiste di 2 amplificazioni: una preselettiva ed una più selettiva, che genera frammenti che possono essere usati come markers discriminatori Il successo della AFLP dipende da tre fattori: reagenti ottimizzati, una robusta ed affidabile piattaforma elettroforetica, un efficacie analisi software (elettroforesi capillare). Vantaggi: possono essere amplificati più loci in una reazione di PCR, poco DNA richiesto, buon potere discriminatorio, riproducibile, economica, automatizzata Tranne che per pochissime specie bateriche (es Acinetobacter baumannii), la riproducibilità interlaboratorio è scarsa data la necessità assoluta di software dedicati per l’interpretazione dei risultati specialmente utilizzando primers marcati e l’utilizzo di apparecchiature di sequenziamento automatizzato) MLVA (multilocus variable number tandem repteat analysis) Metodica introdotta nel 2000 MLVA Variable number tandem repeats (VNTR) sono sequenze di DNA ripetute in tandem (“testa-coda”), che variano nel numero di copie e sono ampiamente disperse nel genoma, sia in regioni non codificanti che nei geni, che evolvono rapidamente. Utilizzando primers specifici a sequenze altamente conservate si ottengono frammenti che variano per dimensione e per numero di unità ripetute, i cui profili si analizzano mediante software specifici. Marcando gli ampliconi di PCR con diversi coloranti e separandoli mediante elettroforesi capillare in un sequenziatore automatico, la MLVA può essere eseguita come multiplex PCR, aumentando l’efficacia. Il primo passo è individuare i loci VNTR lungo il genoma (diversi programmi, come TANDEM REPEAT FINDER, il Tandem Repeat database, e il Microsatellite Repeats database). Tali programmi permettono anche di stabilire delle relazioni filogenetiche. VANTAGGI Alto potere discriminatorio, Rapida, Facile, Economica, Riproducibile, Utilizzabile per le outbreaks SVANTAGGI VNTR evolvono rapidamente: non utilizzabile per gli studi epidemiologici “long-term”. In alcune specie (es E. faecium) potere discriminatorio più basso rispetto alla MLST e PFGE. Utilizzata su: Francisella tularensis, Bacillus anthracis, Yersinia pestis, e M. tuberculosis. Più recentemente su methicillin-resistant Staphylococcus aureus, Burkholderia pseudomallei, e C. difficile. La stabilità è principalmente associata alla lunghezza dell’unità ripetuta, al numero di copie dell’unità ripetuta, e alla purezza. Vi è un programma (SERV), che serve alla selezione e al confronto delle VNTR, che si basa proprio sulla lunghezza dell’unità ripetuta, al numero di copie dell’unità ripetuta, e alla purezza. Con la conoscenza delle sequenze genomiche di nuove specie batteriche sarà possibile migliorare la metodica MLVA, trovando nuove VNTRs e nuovi primers. Metodi basati sul sequenziamento del DNA Sequenziamento del DNA I dideossinucleotidi e il sequenziamento con il metodo di Sanger (a) Un deossinucleotide normale ha un gruppo idrossilico sul carbonio al 3’ mentre un dideossinucleotide ne è privo. (b) La terminazione della reazione di elongazione avviene a seguito all’incorporazione del dideossinucleotide Sequenziamento del DNA utilizzando il metodo di Sanger Si richiede un DNA a singolo filamento e la sequenza viene determinata in seguito a sintesi del filamento copia utilizzando una DNA polimerasi, che sintetizza a partire da un innesco specifico (primer), usando i 4 deossiribonucleotidi trifosfati. Nelle miscele di incubazione, costituite da 4 provette separate, vi sono piccole quantità di analoghi dideossi dei deossiribonucleotidi. Poiché lo zucchero nei dideossi manca la catena si interrompe e la reazione di sequenziamento termina. (a) Si devono correre quattro diverse reazioni, una per ogni dideossinucleotide. Si ottengono frammenti di lunghezza variabile in dipendenza dei tempi di incubazione. Analizzando i vari frammenti e confrontandoli è possibile leggere la sequenza copia del DNA. •Utilizzo di dideossi radioattivi, rilevazione con sviluppo di lastre radiografiche (b) •Utilizzo di dideossi fluorescenti, sequenziamento ottenuto con metodo automatico (c), bande riconosciute per spettroscopia a fluorescenza. Utilizzo di 4 diversi coloranti fluorescenti A:blu G:rosso C:verde T:giallo Single-locus sequence typing (SLST) emm typing per lo Streptococcus pyogenes spa typing per lo Staphylococcus aureus emm sequence typing emm sequence typing From B. Beall Amplificazione di circa 1500 bp. Le sequenze della regione ipervariabile possono essere ottenute da tutti i sierotipi di Lancefield ceppi di riferimento. In generale, queste sequenze condividono soltanto circa 40 – 80% di identità di sequenza dei 50 codoni delle regioni determinanti il “sequence type”. Sequence hypervariable (HV) typespecific region adjacent to primer 1 From B. Beall emm gene Emm gene database From B. Beall Attualmente sono stai descritti> 180 “sequence types” che condividono > 95% identità di sequenza della regione determinante il tipo. Shortcut per il sequence typing: HindII + HaeIII D ice (O p t :1 . 00 % ) ( T o l 1 . 5 % - 1 .5 % ) ( H > 0 . 0 % S > 0 . 0% ) [ 0 .0 % -1 0 0 .0 % ] e mm 100 90 80 70 60 50 40 30 20 em m .. .. .. ... ... .. .. ... ... ... ... ... emm1 emm12 emm3 ... D ic e (O p t :1 . 00 % ) ( T o l 1 . 5 % - 1 .5 % ) ( H > 0 . 0 % S > 0 . 0 % ) [ 0 .0 % -1 0 0 .0 % ] e mm DdeI 100 95 90 85 80 75 70 65 60 55 em m .... ... .... .... .... .... .... .... .... ... ... ... emm12 emm3 emm1 emm Ha Hi Dd Ha Dd From B. Beall emm PCR PCR--RFLP typing (hindII + haeIII restriction enzymes) emm 4 emm 87 emm 12 emm 78 emm 87 emm 89 emm 4 emm 3 emm 9 emm 5 emm 5 Dicuonzo G, Gherardi G et al, JCM 2001 emm 75 st 448 emm 77 emm 1 emm 28 emm 6 emm 11 emm 14 emm 22 emm 59 emm 80 emm 29 emm 22 emm 44/61 emm 2 emm 87 emm 28 spa sequence typing MLST Interpretation of MLST In the interpretation of results, strains with identical allelic profiles or differing at a single locus (single locus variant – SLV) were considered to be genetically related, and strains differing in 2 of the 7 loci (double locus variant – DLV) were assumed likely to be genetically related. An example of population analysis by eBURST DNA microarrays Vetrini trattati (chips) che contengono numerose reazioni in un’unica reazione. Utilizzo di più metodiche di tipizzazione combinate Metodi di “typing” solo per la ricerca? NO!!!!!!!!!!!! …anche per l’attività clinica nelle misure di controllo dell’infezione.