Alice Fulgido & Giuseppe Cazzato
 Concetti base
 Mutazioni e riarrangiamenti
 Processi di riparazione del DNA
 Metodi di studio dei cariotipi
 Allineamenti genomici
 Analisi delle regioni di breakpoint
Concetti base
 GENOMA:
Intero patrimonio genetico di una specie. Esso però non
comprende solo l’insieme di tutti i geni necessari alla vita di un
organismo, ma anche tutto il DNA “non genico”
 CROMOSOMI:
molecole di DNA organizzate in unità strutturali e funzionali in
cui è suddiviso il genoma
 GENE:
unità ereditaria fondamentale degli organismi viventi
contiene le informazioni genetiche che codificano per funzioni
specifiche all’interno della cellula
Relazione DNA-gene-cromosoma
Confronto tra sequenze genomiche
 METODI:
- Mapping, determinare la posizione dei geni su un
cromosoma e la distanza che li separa
- Sequencing , identificare l’ordine delle unità chimiche
base del Dna (sequenze nucleotidiche)
 BENEFICI:
- diagnosi e cura di malattie oggi incurabili
- migliori selezioni di prodotti di agricoltura e allevamento
- miglioramento nelle tecniche di investigazione criminale
Riproduzione del DNA
 Processo molecolare di REPLICAZIONE DEL DNA
comprende:
- formazione di legami idrogeno fra le basi
complementari (A, T, C, G)
- formazione di un legame covalente fosfodiesterico
 Processo di RIPARTIZIONE DEI CROMOSOMI nelle
cellule figlie
Replicazione del DNA
 Concetti base
 Mutazioni e riarrangiamenti
 Processi di riparazione del DNA
 Metodi di studio dei cariotipi
 Allineamenti genomici
 Analisi delle regioni di breakpoint
Cos’è una mutazione?
Il risultato del cambiamento di una o più basi del DNA
Cause :
- Cambiamenti accidentali
(durante i processi di
replicazione e ricombinazione)
- Mutageni
(fisici o chimici)
Mutazioni
 GENICHE: interessano un singolo gene(consistono in
sottrazione, aggiunta o sostituzione di uno o più
nucleotidi)
 CROMOSOMICHE: estese della struttura dei
cromosomi, dipendono da una rottura e da una
ristrutturazione anomala degli stessi cromosomi.
 GENOMICHE: consistono in alterazioni non della
struttura ma del numero dei cromosomi.
Conseguenze delle mutazioni
 perdita di funzione del gene
 Misappaiamenti (appaiamenti errati)
se non rimossi rapidamente si propagheranno nelle
duplicazioni successive
Ma anche
 “Differenze migliorative”
(che permettono l’evoluzione della specie)
Riarrangiamenti
 Modifiche della disposizione dei geni sui cromosomi.
 Svolgono un ruolo molto importante nell’evoluzione
della specie
 Hanno origine da uno o più DSB
 Avvengono quando i meccanismi di riparazione
falliscono o quando si presentano errori
Tipi: delezione, inserzione, inversione, traslocazione, etc…
Tipi di riarrangiamento
 Concetti base
 Mutazioni e riarrangiamenti
 Processi di riparazione del DNA
 Metodi di studio dei cariotipi
 Allineamenti genomici
 Analisi delle regioni di breakpoint
Double Strand Break (DSB)
 Più frequenti rotture del DNA
 Interessa entrambi i filamenti complementari di DNA
 Conseguenza dell'esposizione del DNA ad agenti
genotossici o di normali processi cellulari
 Se non riparata prontamente dalla cellula può causare
gravi problemi di instabilità genomica
 Strategie: HR (SSA), NHEJ, NAHR
Homologous Recombination (HR)
 Ricombinazione omologa
 Cromosoma omologo al danneggiato è usato come
stampo per la riparazione (error free)
 Conservativo
 Single Strand Annealing (SSA): variante di HR.
- Si attiva se il DSB si realizza tra sequenze ripetute
- Eliminazione di estremità non omologhe e
allineamento di sequenze omologhe
Non-Homologous End Joining (NHEJ)
 Ricongiungimento delle estremità non omologhe
 Non considera l’informazione iniziale del DNA
 Può portare a delezioni o mutazioni
NHEJ vs HR
Non-Allelic Homologous Recombination
(NAHR)
 Responsabile di parecchi disordini genomici umani
 Comporta il cosiddetto riarrangiamento non
equilibrato: acquisizione o perdita di DNA
Fasi della ricombinazione
 Rottura e successiva riunione di due cromatidi (M e F)
 Produzione di due cromatidi riarrangiati (C1 e C2)
Ricombinazione: CROSSING-OVER
 Meccanismo di ricombinazione
del materiale genetico
proveniente dai due
genitori
 Risutato: il figlio eredita
una mescolanza casuale
degli alleli dei due genitori
per i diversi caratteri.
 Concetti base
 Mutazioni e riarrangiamenti
 Processi di riparazione del DNA
 Metodi di studio dei cariotipi
 Allineamenti genomici
 Analisi delle regioni di breakpoint
Cariotipo
Costituzione del patrimonio cromosomico di una specie
dal punto di vista morfologico
Analisi del cariotipo: rappresentazione ordinata del
corredo cromosomico di un individuo
Studio di cariotipi
 Confronto fra cariotipi
 Bandeggio cromosomico (1970)
 FISH (1990)
 CGH-array
 Mappa genetica
Bandeggio cromosomico
 Tecnica di colorazione con sostanze fluorescenti
Vantaggi:
 ricostruzione della mappa di tutti i cromosomi
(morfologia) e messa in evidenza di eventuali mutazioni
 confronto fra cariotipi di differenti specie basandosi su
tali modelli
 rilevazione di molteplici patologie pre e post-natali
 Limitazione: bassa sensibilità diagnostica
Fluorescent In Situ Hybridization (FISH)
 Ibridazione: processo molecolare che unisce due singoli
filamenti complementari di molecole di DNA per formare
molecole con doppio filamento di DNA
 Utilizza sonde a fluorescenza che si legano in modo
estremamente selettivo ad alcune specifiche regioni del
cromosoma
Possibili usi:
 mappare la sequenze di uno specifico cromosoma
 colorare i cromosomi per raffrontare due specie o varietà
utilizzando il DNA di interi cromosomi
 scoprire se un paziente è stato infettato da un agente
patogeno (studi clinici)
Esempio applicazione FISH
Comparative Genomic Hybridization (CGH)
Strumento diagnostico per la rilevazione di sbilanciamenti
cromosomici
 Principio della tecnica: si basa su una competizione per il
legame di 2 DNA genomici (marcati con fluorocromi diversi) a
cromosomi in metafase (non marcati e provenienti da un soggetto
sano).
 Risultato: rapporto delle 2 fluorescenze. In caso di numero di
copie normali avrò 2 copie di DNA da testare e 2 copie del
DNA di controllo genomico, per cui il rapporto tra i 2
fluorocromi 2/2 è pari a 1.
 Limite: la variabilità della morfologia dei cromosomi che ne
limitano la risoluzione a circa 3-7 Mb per le delezioni e
2 Mb per le amplificazioni
Array-CGH
 Il principio: coibridazione del DNA in esame e del DNA di
controllo, marcati con fluorocromi diversi, su un
microarray di cloni genomici.
 Sostituzione cromosomi delle metafasi di riferimento con
una matrice su cui sono spottati cloni YAC, BAC o PAC
corrispondenti a loci specifici del cromosoma.
 Vantaggi:
-immediata correlazione tra l’eventuale alterazione e
una precisa posizione nel genoma
-standardizzazione della tecnica, ripetibilità e
affidabilità del risultato
CGH vs Array-CGH
Mappa Genetica
 Basata sui dati di ricombinazione genetica
 Processo che determina la posizione relativa dei geni
sui cromosomi a partire da un loco preso come
riferimento
 Realizzata per mezzo di due tecniche principali:
- Analisi di linkage (analisi degli alleli di diversi marcatori
all’interno di una famiglia di individui)
- Mappa di radiazione ibrida (l’irradiazione di cellule
umane con dosi elevate di raggi X e la successiva fusione delle cellule
irradiate con cellule di Hamster, consente di ottenere linee cellulari
nelle quali frammenti di cromosomi umani risultano integrati nel
genoma di Hamster)
 Concetti base
 Mutazioni e riarrangiamenti
 Processi di riparazione del DNA
 Metodi di studio dei cariotipi
 Allineamenti genomici
 Analisi delle regioni di breakpoint
Allineamento genomico
 Scopo: mettere a confronto sequenze di genomi della
stessa specie o di specie differenti, con l’intento di
trovare la percentuale di DNA comune(=conservato),
rispetto alla percentuale di DNA che ha subito
modificazioni(riarrangiamenti) nel corso
dell’evoluzione o a causa di errori all’interno
dell’organismo.
 Tipi di algoritmi di allineamento: locali e globali
Esempio di allineamento genomico
Date due sequenze nucleotidiche,determinare se sono
sufficientemente simili da farci ritenere che siano derivate
da un progenitore comune attraverso processi di
mutazione.
Quale è l’allineamento
(statisticamente) migliore ?
Per confrontare quantitativamente gli allineamenti è
necessario definire uno score:
Possibili allineamenti
Algoritmi globali e locali
 Globali:
- gestiscono l’allineamento di sequenze intere
-svantaggio: i segmenti delle sequenze devono essere
ordinati e non presentare cambiamenti.
 Locali:
-si allineano sottosequenze delle sequenze di partenza
(ad esempio l’algoritmo di Smith-Waterman)
-privilegiati rispetto a quelli globali
Risultato di una procedura di
allineamento
Metodo seed-extend
 Strategia di allineamento
 Si basa su:
- trovare la parte di segmenti conservati(definiti
“ancore”)
- allineare attorno alle ancore i segmenti riarrangiati
Step
 ANCHORING: Individuare le potenziali regioni di
omologhi (ancore)
 Filtrarle (ossia eliminare i falsi positivi e fare una scelta
fra le differenti copie di elementi duplicati)
 Allineare le regioni omologhe identificate (tenendo
conto di eventuali gap)
 Concetti base
 Mutazioni e riarrangiamenti
 Processi di riparazione del DNA
 Metodi di studio dei cariotipi
 Allineamenti genomici
 Analisi delle regioni di breakpoint
Individuazione dei breakpoint
(tramite metodi di allineamento genomico)
Lo scopo non è presentare un metodo specifico (ve ne
sono molti, con scopi diversi) ma dare le idee base.
Nella discussione utilizzeremo le idee presentate in
 GRIMM-SYNTENY
 CHAINNET
 Couronne & Patcher (CP)
 MAUVE
42
BLAST (Basic Local Alignment Search Tool)
Strumenti per la ricerca rapida di sequenze di similarità
in banche dati di DNA e proteine.
 Perchè?
I programmi dinamici (Smith-Waterman) sono stati
ideati per allineare due sequenze in modo esatto ma
sono troppo lenti per fare ricerche in banche dati.
 Come?
Sfruttando l’indicizzazione delle sequenze nel DB
43
BLAST - funzionamento
1.
Crea un elenco di parole di lunghezza W a partire
dalla sequenza query.
(W=3 per le proteine, W=11 per il DNA)
44
BLAST - funzionamento
2. Per ogni parola crea un elenco di parole affini
(W-mers) con score maggiore di una soglia T
45
BLAST - funzionamento
3.4. Analizza
le sequenze
del
Cerca ditutte
estendere
ciascun
hitDB
in cercando
entrambeun
le
match
con un
W-mers
direzioni
(senza
gap) e mantiene gli HSP che
superano una certa soglia S
46
Anchoring
[1/2]
Individua la similarità locale tra due genomi
 GRIMM-SYNTENY
esegue PatternHunter (gapped)
e prende allineamenti unici e non sovrapposti
 CHAINNET
esegue BLASTZ (gapped)
e prende solo gli allineamenti non interrotti
 CP
BLAT match quasi esatto (+ veloce)
 MAUVE
Solo allineamenti con match esatto e unico
Num. di basi
trovate
47
Anchoring
(variante)
Problema:
Due specie “distanti”  DNA intergenico è mal conservato
Sol.1: allineamento più lasco  più falsi positivi
Proposta:
utilizzare il DNA codificante (meglio conservato)
ed effettuare l’allineamento a livello di proteine
(le ancore saranno i geni)
Secondo gli studi di Bourque (confronto mammiferi/polli)
i risultati con i due tipi di ancore sono consistenti.
48
Filtering
Idea: basarsi sul contesto.
1. Raggruppare le ancore
 GRIMM-SYNTENY:
 Manhattan distance < soglia
 Gruppi con almeno C coppie di basi
 CP


Raggruppa senza tenere conto dell’orientamento delle ancore
Allineamento globale dei gruppi
49
Filtering
2. Collegare le ancore
(considerando ordine e orientazione delle ancore)

Chainnet
Usa un albero a k-dimensioni
Un’ancora potrebbe appartenere a più catene
Non butta via niente ma assegna un punteggio

Mauve
Ripete i passi precedenti con parametri sempre più stringenti
Conserva le catene con più di X elementi
50
Allineamento
Si passa dalle ancore ad un unico allineamento
estendendo i gruppi/catene trovati sinora
Livelli di soglia e parametri minuziosi
=> difficile fare un confronto tra gli algoritmi
Ogni algoritmo è stato studiato per specifiche condizioni
e specifiche tipologie di studi.
51
 Concetti base
 Mutazioni e riarrangiamenti
 Processi di riparazione del DNA
 Metodi di studio dei cariotipi
 Allineamenti genomici
 Analisi delle regioni di breakpoint
Analisi delle regioni di breakpoint
 Breakpoint:
porzione di genoma che è coinvolta in un
riarrangiamento
 Regioni di breakpoint:
regione genomica tra due segmenti “corretti”
53
Analisi delle regioni di breakpoint
 Analisi puntuale
evoluzione di un breakpoint nel tempo
Es: studio malattia e sua evoluzione
 Analisi sistematica


(tutti) i breakpoint nel complesso
Più utile a livello statistico
Molti progetti nell’ultima decade per cercare
caratteristiche comuni
54
Obiettivo
Scoprire i meccanismi molecolari che regolano i
riarrangiamenti.
modello di apparizione dei breakpoint ??
 Random
 Hotspot
[Nadau & Taylor -1980]
[Pevzner, Kent, …]
(accettato per i breakpoint somatici)
55
Studi sistematici
Fenomeno:
perdita di similarità tra grandi blocchi di sintenia
Causa ?
 Errori di allineamento
 Micro-riarrangiamenti
[Trinh, Sankov, …]
[Kent, … ]
-> modello non-random
(molti rearrangement rendono quella regione più
propensa ad ulteriori rearrangement)
56
Dupliconi
Duplicazioni Segmentali (Low Copy Repeats)
- elementi molto simili (>95%)
- relativamente piccoli (1-15 kb)
Spesso sono duplicati nella stessa regione cromosomica
e sono quindi soggetti a ricombinazioni omologhe tra
due copie in differenti loci  NAHR
57
Sperimentalmente:
Duplicazione segmentale prima di un rearrangement
Associazione tra i due cambiamenti
(causa/effetto? )
[Armengol]
Dupliconi e Rearrangement sono indipendenti
 Trovati solo di recente
[Bailey]
 Caratteristici dei primati
Si trovano entrambi nelle “regioni di rottura”
58
Fragile sites
Aree del cromosoma con tendenza a rompersi in
specifiche condizioni di coltura cellulare
La loro presenza indica una zona propensa a possibili
riarrangiamenti e a rotture di tipo evoluzionistico
(80% secondo gli studi di Ruiz Herrera)
Non esiste un modello e tale correlazione (e sua
tipologia) resta in discussione.
59
Analisi puntuale
L’esplorazione più in dettaglio del singolo breakpoint
porta a modelli per spiegare il rearrangement.
Come al solito, molti studi e molti risultati diversi..
Per quanto riguarda i dupliconi i risultati sono analoghi
rispetto agli studi sistematici anche se in molti casi
non si è ancora compreso il meccanismo esatto.
60
Conclusioni
Molti aspetti riguardanti i processi di rottura dei
cromosomi sono ancora irrisolti.
Trend: combinare la potenza dell’approccio puntuale con
le ipotesi generate da analisi sistematiche.
Modello di distribuzione dei breakpoint
sembra essere quello non-random
61
References
(principali)
 A small trip in the untranquil world of genomes. A survey on the
detection and analysis of genome rearrangement breakpoints.
Claire Lemaitre, Marie-France Sagot
 Genetica in una prospettiva genomica
Hartl Daniel L. – Jones Elisabeth W.
 Introduzione alla bioinformatica
G.Valle, M.H.Citterich, M.Attimonelli, G.Pesole
62