Alice Fulgido & Giuseppe Cazzato Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint Concetti base GENOMA: Intero patrimonio genetico di una specie. Esso però non comprende solo l’insieme di tutti i geni necessari alla vita di un organismo, ma anche tutto il DNA “non genico” CROMOSOMI: molecole di DNA organizzate in unità strutturali e funzionali in cui è suddiviso il genoma GENE: unità ereditaria fondamentale degli organismi viventi contiene le informazioni genetiche che codificano per funzioni specifiche all’interno della cellula Relazione DNA-gene-cromosoma Confronto tra sequenze genomiche METODI: - Mapping, determinare la posizione dei geni su un cromosoma e la distanza che li separa - Sequencing , identificare l’ordine delle unità chimiche base del Dna (sequenze nucleotidiche) BENEFICI: - diagnosi e cura di malattie oggi incurabili - migliori selezioni di prodotti di agricoltura e allevamento - miglioramento nelle tecniche di investigazione criminale Riproduzione del DNA Processo molecolare di REPLICAZIONE DEL DNA comprende: - formazione di legami idrogeno fra le basi complementari (A, T, C, G) - formazione di un legame covalente fosfodiesterico Processo di RIPARTIZIONE DEI CROMOSOMI nelle cellule figlie Replicazione del DNA Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint Cos’è una mutazione? Il risultato del cambiamento di una o più basi del DNA Cause : - Cambiamenti accidentali (durante i processi di replicazione e ricombinazione) - Mutageni (fisici o chimici) Mutazioni GENICHE: interessano un singolo gene(consistono in sottrazione, aggiunta o sostituzione di uno o più nucleotidi) CROMOSOMICHE: estese della struttura dei cromosomi, dipendono da una rottura e da una ristrutturazione anomala degli stessi cromosomi. GENOMICHE: consistono in alterazioni non della struttura ma del numero dei cromosomi. Conseguenze delle mutazioni perdita di funzione del gene Misappaiamenti (appaiamenti errati) se non rimossi rapidamente si propagheranno nelle duplicazioni successive Ma anche “Differenze migliorative” (che permettono l’evoluzione della specie) Riarrangiamenti Modifiche della disposizione dei geni sui cromosomi. Svolgono un ruolo molto importante nell’evoluzione della specie Hanno origine da uno o più DSB Avvengono quando i meccanismi di riparazione falliscono o quando si presentano errori Tipi: delezione, inserzione, inversione, traslocazione, etc… Tipi di riarrangiamento Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint Double Strand Break (DSB) Più frequenti rotture del DNA Interessa entrambi i filamenti complementari di DNA Conseguenza dell'esposizione del DNA ad agenti genotossici o di normali processi cellulari Se non riparata prontamente dalla cellula può causare gravi problemi di instabilità genomica Strategie: HR (SSA), NHEJ, NAHR Homologous Recombination (HR) Ricombinazione omologa Cromosoma omologo al danneggiato è usato come stampo per la riparazione (error free) Conservativo Single Strand Annealing (SSA): variante di HR. - Si attiva se il DSB si realizza tra sequenze ripetute - Eliminazione di estremità non omologhe e allineamento di sequenze omologhe Non-Homologous End Joining (NHEJ) Ricongiungimento delle estremità non omologhe Non considera l’informazione iniziale del DNA Può portare a delezioni o mutazioni NHEJ vs HR Non-Allelic Homologous Recombination (NAHR) Responsabile di parecchi disordini genomici umani Comporta il cosiddetto riarrangiamento non equilibrato: acquisizione o perdita di DNA Fasi della ricombinazione Rottura e successiva riunione di due cromatidi (M e F) Produzione di due cromatidi riarrangiati (C1 e C2) Ricombinazione: CROSSING-OVER Meccanismo di ricombinazione del materiale genetico proveniente dai due genitori Risutato: il figlio eredita una mescolanza casuale degli alleli dei due genitori per i diversi caratteri. Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint Cariotipo Costituzione del patrimonio cromosomico di una specie dal punto di vista morfologico Analisi del cariotipo: rappresentazione ordinata del corredo cromosomico di un individuo Studio di cariotipi Confronto fra cariotipi Bandeggio cromosomico (1970) FISH (1990) CGH-array Mappa genetica Bandeggio cromosomico Tecnica di colorazione con sostanze fluorescenti Vantaggi: ricostruzione della mappa di tutti i cromosomi (morfologia) e messa in evidenza di eventuali mutazioni confronto fra cariotipi di differenti specie basandosi su tali modelli rilevazione di molteplici patologie pre e post-natali Limitazione: bassa sensibilità diagnostica Fluorescent In Situ Hybridization (FISH) Ibridazione: processo molecolare che unisce due singoli filamenti complementari di molecole di DNA per formare molecole con doppio filamento di DNA Utilizza sonde a fluorescenza che si legano in modo estremamente selettivo ad alcune specifiche regioni del cromosoma Possibili usi: mappare la sequenze di uno specifico cromosoma colorare i cromosomi per raffrontare due specie o varietà utilizzando il DNA di interi cromosomi scoprire se un paziente è stato infettato da un agente patogeno (studi clinici) Esempio applicazione FISH Comparative Genomic Hybridization (CGH) Strumento diagnostico per la rilevazione di sbilanciamenti cromosomici Principio della tecnica: si basa su una competizione per il legame di 2 DNA genomici (marcati con fluorocromi diversi) a cromosomi in metafase (non marcati e provenienti da un soggetto sano). Risultato: rapporto delle 2 fluorescenze. In caso di numero di copie normali avrò 2 copie di DNA da testare e 2 copie del DNA di controllo genomico, per cui il rapporto tra i 2 fluorocromi 2/2 è pari a 1. Limite: la variabilità della morfologia dei cromosomi che ne limitano la risoluzione a circa 3-7 Mb per le delezioni e 2 Mb per le amplificazioni Array-CGH Il principio: coibridazione del DNA in esame e del DNA di controllo, marcati con fluorocromi diversi, su un microarray di cloni genomici. Sostituzione cromosomi delle metafasi di riferimento con una matrice su cui sono spottati cloni YAC, BAC o PAC corrispondenti a loci specifici del cromosoma. Vantaggi: -immediata correlazione tra l’eventuale alterazione e una precisa posizione nel genoma -standardizzazione della tecnica, ripetibilità e affidabilità del risultato CGH vs Array-CGH Mappa Genetica Basata sui dati di ricombinazione genetica Processo che determina la posizione relativa dei geni sui cromosomi a partire da un loco preso come riferimento Realizzata per mezzo di due tecniche principali: - Analisi di linkage (analisi degli alleli di diversi marcatori all’interno di una famiglia di individui) - Mappa di radiazione ibrida (l’irradiazione di cellule umane con dosi elevate di raggi X e la successiva fusione delle cellule irradiate con cellule di Hamster, consente di ottenere linee cellulari nelle quali frammenti di cromosomi umani risultano integrati nel genoma di Hamster) Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint Allineamento genomico Scopo: mettere a confronto sequenze di genomi della stessa specie o di specie differenti, con l’intento di trovare la percentuale di DNA comune(=conservato), rispetto alla percentuale di DNA che ha subito modificazioni(riarrangiamenti) nel corso dell’evoluzione o a causa di errori all’interno dell’organismo. Tipi di algoritmi di allineamento: locali e globali Esempio di allineamento genomico Date due sequenze nucleotidiche,determinare se sono sufficientemente simili da farci ritenere che siano derivate da un progenitore comune attraverso processi di mutazione. Quale è l’allineamento (statisticamente) migliore ? Per confrontare quantitativamente gli allineamenti è necessario definire uno score: Possibili allineamenti Algoritmi globali e locali Globali: - gestiscono l’allineamento di sequenze intere -svantaggio: i segmenti delle sequenze devono essere ordinati e non presentare cambiamenti. Locali: -si allineano sottosequenze delle sequenze di partenza (ad esempio l’algoritmo di Smith-Waterman) -privilegiati rispetto a quelli globali Risultato di una procedura di allineamento Metodo seed-extend Strategia di allineamento Si basa su: - trovare la parte di segmenti conservati(definiti “ancore”) - allineare attorno alle ancore i segmenti riarrangiati Step ANCHORING: Individuare le potenziali regioni di omologhi (ancore) Filtrarle (ossia eliminare i falsi positivi e fare una scelta fra le differenti copie di elementi duplicati) Allineare le regioni omologhe identificate (tenendo conto di eventuali gap) Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint Individuazione dei breakpoint (tramite metodi di allineamento genomico) Lo scopo non è presentare un metodo specifico (ve ne sono molti, con scopi diversi) ma dare le idee base. Nella discussione utilizzeremo le idee presentate in GRIMM-SYNTENY CHAINNET Couronne & Patcher (CP) MAUVE 42 BLAST (Basic Local Alignment Search Tool) Strumenti per la ricerca rapida di sequenze di similarità in banche dati di DNA e proteine. Perchè? I programmi dinamici (Smith-Waterman) sono stati ideati per allineare due sequenze in modo esatto ma sono troppo lenti per fare ricerche in banche dati. Come? Sfruttando l’indicizzazione delle sequenze nel DB 43 BLAST - funzionamento 1. Crea un elenco di parole di lunghezza W a partire dalla sequenza query. (W=3 per le proteine, W=11 per il DNA) 44 BLAST - funzionamento 2. Per ogni parola crea un elenco di parole affini (W-mers) con score maggiore di una soglia T 45 BLAST - funzionamento 3.4. Analizza le sequenze del Cerca ditutte estendere ciascun hitDB in cercando entrambeun le match con un W-mers direzioni (senza gap) e mantiene gli HSP che superano una certa soglia S 46 Anchoring [1/2] Individua la similarità locale tra due genomi GRIMM-SYNTENY esegue PatternHunter (gapped) e prende allineamenti unici e non sovrapposti CHAINNET esegue BLASTZ (gapped) e prende solo gli allineamenti non interrotti CP BLAT match quasi esatto (+ veloce) MAUVE Solo allineamenti con match esatto e unico Num. di basi trovate 47 Anchoring (variante) Problema: Due specie “distanti” DNA intergenico è mal conservato Sol.1: allineamento più lasco più falsi positivi Proposta: utilizzare il DNA codificante (meglio conservato) ed effettuare l’allineamento a livello di proteine (le ancore saranno i geni) Secondo gli studi di Bourque (confronto mammiferi/polli) i risultati con i due tipi di ancore sono consistenti. 48 Filtering Idea: basarsi sul contesto. 1. Raggruppare le ancore GRIMM-SYNTENY: Manhattan distance < soglia Gruppi con almeno C coppie di basi CP Raggruppa senza tenere conto dell’orientamento delle ancore Allineamento globale dei gruppi 49 Filtering 2. Collegare le ancore (considerando ordine e orientazione delle ancore) Chainnet Usa un albero a k-dimensioni Un’ancora potrebbe appartenere a più catene Non butta via niente ma assegna un punteggio Mauve Ripete i passi precedenti con parametri sempre più stringenti Conserva le catene con più di X elementi 50 Allineamento Si passa dalle ancore ad un unico allineamento estendendo i gruppi/catene trovati sinora Livelli di soglia e parametri minuziosi => difficile fare un confronto tra gli algoritmi Ogni algoritmo è stato studiato per specifiche condizioni e specifiche tipologie di studi. 51 Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint Analisi delle regioni di breakpoint Breakpoint: porzione di genoma che è coinvolta in un riarrangiamento Regioni di breakpoint: regione genomica tra due segmenti “corretti” 53 Analisi delle regioni di breakpoint Analisi puntuale evoluzione di un breakpoint nel tempo Es: studio malattia e sua evoluzione Analisi sistematica (tutti) i breakpoint nel complesso Più utile a livello statistico Molti progetti nell’ultima decade per cercare caratteristiche comuni 54 Obiettivo Scoprire i meccanismi molecolari che regolano i riarrangiamenti. modello di apparizione dei breakpoint ?? Random Hotspot [Nadau & Taylor -1980] [Pevzner, Kent, …] (accettato per i breakpoint somatici) 55 Studi sistematici Fenomeno: perdita di similarità tra grandi blocchi di sintenia Causa ? Errori di allineamento Micro-riarrangiamenti [Trinh, Sankov, …] [Kent, … ] -> modello non-random (molti rearrangement rendono quella regione più propensa ad ulteriori rearrangement) 56 Dupliconi Duplicazioni Segmentali (Low Copy Repeats) - elementi molto simili (>95%) - relativamente piccoli (1-15 kb) Spesso sono duplicati nella stessa regione cromosomica e sono quindi soggetti a ricombinazioni omologhe tra due copie in differenti loci NAHR 57 Sperimentalmente: Duplicazione segmentale prima di un rearrangement Associazione tra i due cambiamenti (causa/effetto? ) [Armengol] Dupliconi e Rearrangement sono indipendenti Trovati solo di recente [Bailey] Caratteristici dei primati Si trovano entrambi nelle “regioni di rottura” 58 Fragile sites Aree del cromosoma con tendenza a rompersi in specifiche condizioni di coltura cellulare La loro presenza indica una zona propensa a possibili riarrangiamenti e a rotture di tipo evoluzionistico (80% secondo gli studi di Ruiz Herrera) Non esiste un modello e tale correlazione (e sua tipologia) resta in discussione. 59 Analisi puntuale L’esplorazione più in dettaglio del singolo breakpoint porta a modelli per spiegare il rearrangement. Come al solito, molti studi e molti risultati diversi.. Per quanto riguarda i dupliconi i risultati sono analoghi rispetto agli studi sistematici anche se in molti casi non si è ancora compreso il meccanismo esatto. 60 Conclusioni Molti aspetti riguardanti i processi di rottura dei cromosomi sono ancora irrisolti. Trend: combinare la potenza dell’approccio puntuale con le ipotesi generate da analisi sistematiche. Modello di distribuzione dei breakpoint sembra essere quello non-random 61 References (principali) A small trip in the untranquil world of genomes. A survey on the detection and analysis of genome rearrangement breakpoints. Claire Lemaitre, Marie-France Sagot Genetica in una prospettiva genomica Hartl Daniel L. – Jones Elisabeth W. Introduzione alla bioinformatica G.Valle, M.H.Citterich, M.Attimonelli, G.Pesole 62