Variabilità genoma umano

Come e quanto varia il genoma
umano?
Quali sono le conseguenze di
queste variazioni?
Se si confrontano genomi di
individui diversi li si trova identici
per > 99.5%
In che cosa consistono le
differenze tra genomi?
Variazioni su
piccola e su
larga scala
I cambiamenti su
piccola scala
interessano un solo gene
Si riteneva che le
variazioni su larga scala
fossero molto
svantaggiose e quindi
rare. Negli ultimi anni si
è invece scoperto che
sono piuttosto comuni
Scherer et al (2007)-Nat Genet. 39: S7–15.
Sequenziamento del genoma umano: 1990–2003
Studio della variabilità umana: HapMap e1000 genomi
Cambiamenti di un singolo nucleotide
Nel genoma umano sono presenti > 40 milioni di SNS
(ca.10 milioni sono polimorfiche)
2007 – genoma di Craig Venter
• 3.2 milioni di SNP
•
ca. 300 000 indel (da 1 a 571 bp) allo stato
etrozigote
• Ca. 560 000 indel (1-82 711 bp) allo stato
omozigote
• 90 grandi inversioni
• 62 varianti di sequenza a elevato no. di copie
12 291 000 bp diverse dalla sequenza
di riferimento
Genoma umano 3.2 x 109 bp  differenze con il genoma di riferimento:
12.3 x 106/3.2 x109 = 0.00386
La variazione più piccola interessa
un singolo nucleotide
(sostituzioni o
inserzioni/delezioni)
Quali effetti sul fenotipo?
Variazioni di una o poche basi che si
verificano in sequenze codificanti
 SNS-Samesense (SS) o sinonime (S)
 SNS-MisSense (MS) o non sinonime (NS)
 SNS-non senso
 Inserzioni o delezioni di poche bp
(indel)
 Inversioni di poche bp (inv)
Esempi di mutazione SS
o sinonima
AAA (Lys)  AAG (Lys)
CUA (Leu)  UUA (Leu)
Esempi di mutazione MS o Non Sinonima
Sostituzione della 1a base del codone:
AAA (Lys)  CAA (Gln)
Sostituzione della 2a base del codone:
AAA (Lys)  ACA (Thr)
Sostituzione della 3a base del codone:
AAA (Lys)  AAC (Asn)
Esempio di mutazione Non Senso
Inserzioni di pochi nt
Formazione di un codone di STOP subito a valle della
delezione di 1 nt
mRNA con codoni di STOP che cadono
prima dell’ultimo esone sono instabili e
vengono degradati  meccanismo
attraverso il quale viene impedita la
produzione di ‘monconi polipeptidici’
che potrebbero essere dannosi per la
cellula
NMD  Nonsense-Mediated Decay =
degradazione mediata da codoni non-senso
Quando gli mRNA arrivano nel citoplasma sono
ancora legati, in corrispondenza dei punti di
splicing, a complessi proteici (EJC = Exon
Junction Complex) che vengono rimossi solo
durante il primo round di traduzione. mRNA
da cui non vengano rimossi gli EJC sono
instabili e vengono degradati
Strachan e Read – Genetica Molecolare Umana, Zanichelli, 2012
Frecce verdi  formazione di codoni di STOP
prematuri prima dell’ultimo esone, mRNA instabili
> non produzione di ‘tronconi polipeptidici’
Frecce rosse  formazione di codoni di STOP
prematuri nell’ultimo esone, mRNA stabili >
produzione di ‘tronconi polipeptidici’. In genere
comportano conseguenze fenotipiche più gravi
E le SNS che interessano regioni
non codificanti?
Le conseguenze sono più difficili
da prevedere
Mutazioni che alterano il
processo di splicing
Rimozione degli introni dal trascritto
primario
Strachan e Read – Genetica Molecolare Umana, Zanichelli, 2012
Sequenze introniche importanti per lo splicing
Strachan e Read – Genetica Molecolare Umana, Zanichelli, 2012
Enahancer di splicing  esoniche o introniche
STR con effetti
fenotipici:
MALATTIE DA
ESPANSIONE
(instabile) DI BREVI
TRATTI RIPETUTI
La base molecolare di queste
malattie consiste nella
ripetizione abnorme di un
microsatellite o STR (Short
Tandem Repeat)
Cosa sono i microsatelliti o STR ?
Regioni di genoma in cui una breve
sequenza di basi (da 1 a 10 bp), detta
repeat, viene ripetuta un certo
numero di volte
Molto spesso questi loci sono
Gli alleli vengono in genere indicati con
un numero che corrisponde al numero di
ripetizioni dell’unità di base
Ad esempio, gli alleli 13 e 14 di un microsatellite del tipo CA
(vedi figura A) differiscono l’uno dall’altro per due basi: l’allele 13
presenta il dinucleotide CA ripetuto 13 volte (per un totale di 26
bp), mentre nell’allele 14 esso è ripetuto 14 volte (in totale 28 bp)
Ciascun sito STR è indicato con una sigla (D number)
D6S282
D = DNA; 6 = l’STR considerato sta sul cromosoma 6;
Probabile
meccanismo di
generazione di
nuovi alleli STR
Nelle malattie da espansione
Alleli normali  l’unità base è
presente un numero di volte limitato
(anche se variabile da allele ad
allele)
Alleli patologici  l’unità base è
presente un numero di volte molto
maggiore
Esempio: nella Corea di Huntington gli
CAG
40-120
alleli
CAG normali contengono il
CAG
trinucleotide
CAG ripetuto 11-36
CAG
gene HD
CAG
volte,
11-36 CAG gli alleli patologici lo
presentano 40-120 volte
CAG
CAG
In pedigree in cui segregano
malattie dovute ad espansioni
nucleotidiche si osservano, in
generazioni successive della
stessa famiglia,
anticipazione dell’età di
insorgenza
e
aumento della gravità dei
sintomi clinici
I
54a
1
II
56a
1
III
2
46a
41a
2
3
42a
18a
1
4
2
3
5
6
Il no. all’interno del
simbolo dei soggetti
affetti indica l’età di
insorgenza della
malattia
Entrambi i fenomeni sono spiegati
dalle seguenti osservazioni:
l’entità dell’espansione è
direttamente collegata alla gravità
della malattia e alla sua età di
insorgenza
il tratto espanso è soggetto ad
instabilità meiotica (e anche mitotica)
 i portatori di un allele espanso
producono con frequenza elevata
I
II
48/28
31/30
54a
1
28/30
III
54/31
48/30
56a
1
28/32
1
2
29/27
28/30
50/31
46a
41a
2
62/30
3
4
42a
18a
2
54/30
3
5
6
I no. accanto ai
soggetti affetti
indicano il no. di
ripetizioni
dell’unità di base
La prima dimostrazione che
l’espansione di un
microsatellite può essere
causa di patologie risale
all’inizio degli anni ’90
Oggi si conoscono una
ventina di malattie dovute a
questo meccanismo
Quali le cause dell’instabilità mitotica e meiotica? Poco note (la
lunghezza del tratto necessario per la formazione di hairpin coincide
con la lunghezza dei frammenti di Okazaki; ruolo della regione
fiancheggiante, fattori sesso-specifici, ecc.)
Le malattie da espansione
possono essere suddivise
in 3 categorie sulla base
della regione genica in cui
si trova il tratto ripetuto
(regioni codificanti o non
codificanti) e del
meccanismo molecolare
alla base della
patogenicità (perdita di
funzione, produzione di
Nat Rev Genet (2005) 6: 743-755
1. Malattie in cui il gene contiene l’espansione in una
regione NON codificante (nel 5’ UTR per FRAXA e
FRAXE e nel 1° introne per FRDA) e in cui il
meccanismo patogenetico è la perdita di funzione
 l’unità ripetuta è diversa da gene a gene
 il range di espansione patologico è molto elevato
(centinaia o addirittura migliaia di copie)
2. Malattie in cui il gene contiene l’espansione in
una regione NON codificante (nel 5’ UTR o nel 1°
introne) e il meccanismo patogenetico è la
produzione di un mRNA con nuove caratteristiche
 l’unità ripetuta è diversa da gene a gene
 il range di espansione patologico è molto elevato
(centinaia o addirittura migliaia di copie)
3. Malattie in cui il gene contiene l’espansione in una regione
codificante
 sono malattie neurodegenerative
 l’unità base ripetuta è sempre CAG (codone che codifica per
Glutamina malattie da poli-glutamine)
 sono a trasmissione Autosomica Dominante (tranne SBMA)
 il meccanismo patogenetico è l’acquisizione di funzione da
parte della proteina mutata
Variazioni su
piccola e su
larga scala
Scherer et al (2007)-Nat Genet. 39: S7–15.
A metà del primo decennio di questo
secolo si è cominciata ad indagare la
variabilità che coinvolge tratti di
genoma di > 1 kb
Risultati inattesi  questo tipo di
variabilità è piuttosto comune