Diapositiva 1 - Dipartimento di Biologia

Geni sovrapposti
Lo splicing alternativo aumenta in modo considerevole la complessità del
trascrittoma (e quindi del proteoma).
Splicing Alternativo
Oltre il 90% dei geni umani è in grado di esprimere più di un trascritto (ed è
quindi soggetto a splicing alternativo). Le diverse isoforme di splicing possono
avere specificità a livello di tessuto, di condizione fisiologica, o patologica.
17,635 Human genes
35
30
25
%
20
15
10
5
0
1
2 -5
6 -1 0
1 1 -2 0
2 1 -3 0
Number of Transcripts/ Gene
3 1 -5 0
>5 0
Uno stesso gene può esprimere proteine con funzioni
opposte: l’esempio dell’attività della Caspasi 9 (CASP9)
La forma costitutiva della proteina (CASP9, 9 esoni, 416 aa) induce
apoptosi. Essa contiene un Caspase recruitment domain (CARD) e un dominio
caspasi Peptidase_C14.
L’isoforma più corta della proteina (CASP9S, 5 esoni, 266 aa) contiene un
dominio Caspase recruitment domain (CARD) e un dominio tronco della
Peptidase_C14. Questa isoforma è priva dell’attività proteasica e agisce da
inibitore dell’apoptosi.
Uno stesso gene può codificare per proteine indirizzate a
diversi compartimenti cellulari: l’esempio del gene NFS1
La proteina codificata dal gene NFS1 fornisce zolfo inorganico ai cluster ferro-zolfo
rimuovendo lo zolfo dalla cisteina, e formando alanina nel processo. Questo gene
utilizza siti di inizio alternativi della traduzione per generare una isoforma
mitocondriale ed una isoforma citoplasmatica. La selezione del sito di inizio della
trascrizione è regolata dal pH citosolico.
L’isoforma che codifica per la proteina mitocondriale (457 aa) contiene un peptide
segnale e un dominio aminotrasnferasico.
L’altra isoforma, che deriva sa un sito di inizio alternativo della trascrizione codifica
per una proteina più corta (397 aa) priva del peptide segnale ma contenente il
dominio aminotransferasico.
Uno stesso gene può codificare trascritti soggetti ad un diverso
meccanismo di regolazione post-trascrizionale: l’esempio di SLC11A2
Il gene SLC11A2 (divalent cation transporter) codifica
isoforme, solo una delle quali risponde alla concentrazione
proteina aumentano sensibilmente in seguito alla carenza
meccanismo di regolazione è un “Iron Responsive Element
presente solo in una delle due isoforme.
per (almeno) due diverse
del ferro (i.e. i livelli della
di ferro). Responsabile del
(IRE)” nella regione 3’UTR
IRE
Nell’uomo il trascritto contenente l’IRE (16 exons) codifica per una proteina di 561 aa
(NM_000617). Il trascritto privo di IRE (17 exons) codifica per una proteina di 568
aa.
IRE
La stessa situazione si verifica nel topo, per cui l’unica entry RefSeq
corrisponde alla isoforma priva di IRE
(NM_008732). Il meccanismo di
risposta al ferro appare specifico del tipo cellulare.
Famiglie geniche
• Famiglie geniche classiche (istoni, globine)
• Geni codificanti prodotti con domini altamente
conservati (Homeobox, Paired box, Forkhead,
ecc.)
• Geni codificanti proteine contenenti corti motivi
conservati, correlati ad una comune funzione
(DEAD box, WD domain, ecc.).
• Superfamiglie (immunoglobuline,
protein coupled, ecc.) .
recettori
G
DEAD (Asp-Glu-Ala-Asp)
WD (Trp-Asp)
Superfamiglia delle Ig
09_10.jpg
Famiglie geniche
Le famiglie geniche possono essere generate attraverso diversi meccanismi:
• poliploidizzazione del genoma (famiglia dei geni omeotici)
• duplicazione di segmenti genomici
•duplicazione di un singolo gene (geni per a e b globine)
• retrotrascrizione
Duplicazioni geniche: poliploidizzazione (2R)
R2
R1
Due “Round” di duplicazioni
genomiche nei progenitori dei
vertebrati, probabilmente una
subito prima e una subito dopo
la diversificazione degli Agnatha
(lampreda e affini).
One
to
Invertebrati
four
Vertebrati
Sintenie; cluster di geni Hox
esaploidi
Duplicazioni genomiche dedotte
Duplicazioni geniche: poliploidizzazione (2R)
Successivamente alla duplicazione genomica possono intervenire eventi di
acquisto e perdita di geni che modificano la struttura dei cluster.
Famiglia dei geni omeotici
Il Cluster di geni Hox è quadruplicato nei mammiferi rispetto a Drosophila
Drosophila
Vertebrati
Evoluzione della famiglia dei geni omeotici attraverso un processo a due stadi:
1) nel primo stadio, eventi di duplicazione in cis del gene primordiale hanno
prodotto i diversi componenti del cluster negli invertebrati
2) nel secondo stadio, eventi di duplicazione in trans dell’intero cluster hanno
prodotti cluster multipli
Nei vertebrati, la duplicazione genica è stata accompagnata da perdita di geni
Famiglia dei geni per le globine
Progenitore
proto-a
Cromosoma 22
Cromosoma 16
Progenitore
proto-b
Cromosoma 11
Destino geni duplicati
Duplicazione genica
Produzione di due copie identiche di un gene
Delle due copie, una continua a svolgere la propria funzione,
l’altra può andare incontro a diversi destini
Il gene duplicato mantiene la stessa
funzione del gene ancestrale (istoni)
Gene redundancy
Il gene duplicato, non essendo sottoposto
alla stessa pressione selettiva del gene
ancestrale, può accumulare mutazioni
casuali
L’accumulo di mutazioni porta
all’inattivazione del gene duplicato,
trasformandolo in pseudogene
(pseudogeni delle a e b globine)
L’accumulo di mutazioni fa sì che il gene
duplicato possa acquisire una nuova
funzione utile per l’organismo
(le nuove funzioni acquisite possono
diventare specie-specifiche)
Una terza alternativa è che tutte le copie possono essere mantenute nella loro
forma
originale;
l’effetto
omogeneizzante
dell’evoluzione
concertata
favorisce
quest’ultima possibilità che agirebbe rallentando la diversità genetica e quindi il
divergere della funzionalità. Per esempio dall’analisi dei geni delle globine in varie
specie è emerso che questi geni inizialmente sono andati incontro a questo
fenomeno di omogeneizzazione mediante conversione genica, ma quando le sequenze
diversero
sufficientemente
per
rendere
inefficace
questo
meccanismo,
i
geni
iniziarono ad evolvere indipendentemente.
Tutti i primati hanno 2 α globine.
Assumiamo quindi che l’antenato comune dei
primati avesse due geni α-globinici.
• Se α1 e α2 della stessa specie si sono separati circa 300 milioni di anni fa
dovrebbero aver accumulato molti cambiamenti AA.
• Si osserva un’alta omogeneità intraspecifica:
la conclusione e che i geni α1 e α2 non si sono evoluti in modo indipendente, ma in
maniera concertata.
La maggior parte delle sequenze ripetute, sia codificanti che non codificanti,
presentano la capacità di evolvere in maniera concertata. Quando vengono
comparati i membri di una famiglia ripetuta, la maggiore similarità di
sequenza si trova all’interno della specie (Paralogia) piuttosto che tra le
specie (Ortologia), suggerendo che i membri della famiglia non evolvono
indipendentemente gli uni dagli altri.
Il processo molecolare che conduce alla omogenizzazione delle sequenze di
DNA appartenenti ad una data famiglia ripetuta è chiamata evoluzione
concertata. L’evoluzione concertata avviene a causa di vari meccanismi
genetici che producono scambio tra le sequenze di DNA non alleliche
all’interno di un genoma. Questi meccanismi comprendono il crossing-over
ineguale, lo scambio ineguale tra cromatidi fratelli e meccanismi simili alla
conversione genica ed amplificazione che sono particolarmente attivi nel caso
di sequenze di DNA ripetuto in tandem.
Con il termine di conversione genica si intende invece un trasferimento non
reciproco di sequenze tra una coppia di sequenze di DNA non alleliche
(conversione genica interlocus) o alleliche (conversione genica interallelica).
Delle due sequenze che interagiscono una, la sequenza donatrice, rimane
immutata, mentre l’altra, la ricevente, viene modificata.
Un possibile meccanismo ipotizza la formazione di un eteroduplex tra un
filamento della sequenza donatrice e quello complementare della ricevente,
con successiva conversione del ricevente grazie al meccanismo della riparazione
degli accoppiamenti errati: gli enzimi di riparazione del DNA riconoscono che
i
due
filamenti
correggono
la
dell’eteroduplex
sequenza
del
non
sono
ricevente
per
perfettamente
renderla
complementare alla sequenza del filamento donatore.
appaiati
e
perfettamente
EVOLUZIONE CONCERTATA
Negli eucarioti alcuni geni sono presenti in copie multiple. Negli organismi complessi,
per esempio, i geni per l’RNA ribosomale sono tipicamente presenti in centinaia o
anche migliaia di copie. Senza dubbio alcuno, queste copie si sono originate per
duplicazione. In seguito alla duplicazione ci si potrebbe attendere che ogni singola copia
di un gene acquisisca delle mutazioni e diverga. La selezione potrebbe limitare la
mutazione nelle regioni codificanti, ma, se ne esistono molte copie, ci aspetteremmo,
specie a livello delle sequenze non codificanti, che sussista un certo grado di
divergenza. Al contrario di quanto atteso, numerosi studi hanno rivelato che spesso le
sequenze nucleotidiche risultano alquanto omogenee in seno alle diverse copie di un
gene.
Inoltre, anche le sequenze non codificanti risultano omogenee, il che suggerisce che la
selezione non sia responsabile di questa purificazione. Quando gli stessi geni vengono
esaminati in una seconda specie strettamente correlata, si trova che anche le
sequenze di quest’ultima sono omogenee, ma spesso diverse dalle sequenze omogenee
trovate nella prima specie.
Queste osservazioni hanno fatto concludere che un qualche processo a livello molecolare
mantenga di continuo l’uniformità tra copie multiple della stessa sequenza all’interno
di una specie. Allo stesso tempo, il processo permette una rapida differenziazione tra
specie: il meccanismo dell’evoluzione concertata non è chiaramente compreso, ma
l’evoluzione concertata ha conseguenze importanti su come evolvano i geni e
rappresenta una forza evolutiva di cui si ignorava l’esistenza prima che alla genetica di
popolazioni fossero applicate le moderne tecniche molecolari.
Duplicazioni intra-geniche
Nuove funzioni geniche possono essere acquisite mediante riarrangiamento di segmenti
genici codificanti per domini proteici strutturali
2 meccanismi:
- duplicazione dei domini
- rimescolamento dei
domini
Duplicazioni intra-geniche
Esempio di duplicazione di domini strutturali: gene per il collagene a2 di tipo
338 ripetizioni Gly-X-Y, presenti in 42
dei 52 esoni del gene. Ogni esone
codifica per un numero completo di
ripetizioni.
Evoluzione del gene mediante
duplicazione degli esoni che ha portato
alla ripetizione di domini strutturali
Esempio di rimescolamento dei domini strutturali: gene per l’attivatore
del plasminogeno tissutale
TPA
4 esoni codificanti domini strutturali
diversi: 1° esone simile a quelli della
fibronectina, proteina che lega la
fibrina, 2° esone codifica per un
dominio tipico dei fattori di crescita
3° e 4° esone codificano per
strutture kringle (legano i coaguli di
fibrina) presenti nel gene per
plasminogeno
Pseudogeni
• Copie difettive dell’intera sequenza di un gene funzionale (o
della sua porzione codificante), o copie troncate, mancanti
di porzioni al 5’, al 3’, o frammenti interni.
Pseudogeni non processati
•
Contengono tutte le regioni funzionali del gene
•
Presentano codoni di stop inappropriati
•
Originati per duplicazione genica o crossing-over ineguale
Pseudogeni processati (retropseudogeni)
•
Contengono solo le sequenze esoniche e una sequenza oligo dA/dT
•
Copiati dall’mRNA in cDNA e reintegrati nel genoma
•
Se sono espressi sono detti retrogeni
Pseudogeni
La Trascrittasi Inversa codificata da elementi LINE può retrotrascrivere un
mRNA in cDNA che successivamente può essere integrato a caso in un
cromosoma. Se sul sito di inserimento è casualmente presente un promotore
il retrogene può essere eventualmente espresso e diventare funzionale.
Normalmente, questo non accade e lo pseudogene comincia ad accumulare
mutazioni casuali che distruggono la ORF (eventualmente) funzionale.