Geni sovrapposti Lo splicing alternativo aumenta in modo considerevole la complessità del trascrittoma (e quindi del proteoma). Splicing Alternativo Oltre il 90% dei geni umani è in grado di esprimere più di un trascritto (ed è quindi soggetto a splicing alternativo). Le diverse isoforme di splicing possono avere specificità a livello di tessuto, di condizione fisiologica, o patologica. 17,635 Human genes 35 30 25 % 20 15 10 5 0 1 2 -5 6 -1 0 1 1 -2 0 2 1 -3 0 Number of Transcripts/ Gene 3 1 -5 0 >5 0 Uno stesso gene può esprimere proteine con funzioni opposte: l’esempio dell’attività della Caspasi 9 (CASP9) La forma costitutiva della proteina (CASP9, 9 esoni, 416 aa) induce apoptosi. Essa contiene un Caspase recruitment domain (CARD) e un dominio caspasi Peptidase_C14. L’isoforma più corta della proteina (CASP9S, 5 esoni, 266 aa) contiene un dominio Caspase recruitment domain (CARD) e un dominio tronco della Peptidase_C14. Questa isoforma è priva dell’attività proteasica e agisce da inibitore dell’apoptosi. Uno stesso gene può codificare per proteine indirizzate a diversi compartimenti cellulari: l’esempio del gene NFS1 La proteina codificata dal gene NFS1 fornisce zolfo inorganico ai cluster ferro-zolfo rimuovendo lo zolfo dalla cisteina, e formando alanina nel processo. Questo gene utilizza siti di inizio alternativi della traduzione per generare una isoforma mitocondriale ed una isoforma citoplasmatica. La selezione del sito di inizio della trascrizione è regolata dal pH citosolico. L’isoforma che codifica per la proteina mitocondriale (457 aa) contiene un peptide segnale e un dominio aminotrasnferasico. L’altra isoforma, che deriva sa un sito di inizio alternativo della trascrizione codifica per una proteina più corta (397 aa) priva del peptide segnale ma contenente il dominio aminotransferasico. Uno stesso gene può codificare trascritti soggetti ad un diverso meccanismo di regolazione post-trascrizionale: l’esempio di SLC11A2 Il gene SLC11A2 (divalent cation transporter) codifica isoforme, solo una delle quali risponde alla concentrazione proteina aumentano sensibilmente in seguito alla carenza meccanismo di regolazione è un “Iron Responsive Element presente solo in una delle due isoforme. per (almeno) due diverse del ferro (i.e. i livelli della di ferro). Responsabile del (IRE)” nella regione 3’UTR IRE Nell’uomo il trascritto contenente l’IRE (16 exons) codifica per una proteina di 561 aa (NM_000617). Il trascritto privo di IRE (17 exons) codifica per una proteina di 568 aa. IRE La stessa situazione si verifica nel topo, per cui l’unica entry RefSeq corrisponde alla isoforma priva di IRE (NM_008732). Il meccanismo di risposta al ferro appare specifico del tipo cellulare. Famiglie geniche • Famiglie geniche classiche (istoni, globine) • Geni codificanti prodotti con domini altamente conservati (Homeobox, Paired box, Forkhead, ecc.) • Geni codificanti proteine contenenti corti motivi conservati, correlati ad una comune funzione (DEAD box, WD domain, ecc.). • Superfamiglie (immunoglobuline, protein coupled, ecc.) . recettori G DEAD (Asp-Glu-Ala-Asp) WD (Trp-Asp) Superfamiglia delle Ig 09_10.jpg Famiglie geniche Le famiglie geniche possono essere generate attraverso diversi meccanismi: • poliploidizzazione del genoma (famiglia dei geni omeotici) • duplicazione di segmenti genomici •duplicazione di un singolo gene (geni per a e b globine) • retrotrascrizione Duplicazioni geniche: poliploidizzazione (2R) R2 R1 Due “Round” di duplicazioni genomiche nei progenitori dei vertebrati, probabilmente una subito prima e una subito dopo la diversificazione degli Agnatha (lampreda e affini). One to Invertebrati four Vertebrati Sintenie; cluster di geni Hox esaploidi Duplicazioni genomiche dedotte Duplicazioni geniche: poliploidizzazione (2R) Successivamente alla duplicazione genomica possono intervenire eventi di acquisto e perdita di geni che modificano la struttura dei cluster. Famiglia dei geni omeotici Il Cluster di geni Hox è quadruplicato nei mammiferi rispetto a Drosophila Drosophila Vertebrati Evoluzione della famiglia dei geni omeotici attraverso un processo a due stadi: 1) nel primo stadio, eventi di duplicazione in cis del gene primordiale hanno prodotto i diversi componenti del cluster negli invertebrati 2) nel secondo stadio, eventi di duplicazione in trans dell’intero cluster hanno prodotti cluster multipli Nei vertebrati, la duplicazione genica è stata accompagnata da perdita di geni Famiglia dei geni per le globine Progenitore proto-a Cromosoma 22 Cromosoma 16 Progenitore proto-b Cromosoma 11 Destino geni duplicati Duplicazione genica Produzione di due copie identiche di un gene Delle due copie, una continua a svolgere la propria funzione, l’altra può andare incontro a diversi destini Il gene duplicato mantiene la stessa funzione del gene ancestrale (istoni) Gene redundancy Il gene duplicato, non essendo sottoposto alla stessa pressione selettiva del gene ancestrale, può accumulare mutazioni casuali L’accumulo di mutazioni porta all’inattivazione del gene duplicato, trasformandolo in pseudogene (pseudogeni delle a e b globine) L’accumulo di mutazioni fa sì che il gene duplicato possa acquisire una nuova funzione utile per l’organismo (le nuove funzioni acquisite possono diventare specie-specifiche) Una terza alternativa è che tutte le copie possono essere mantenute nella loro forma originale; l’effetto omogeneizzante dell’evoluzione concertata favorisce quest’ultima possibilità che agirebbe rallentando la diversità genetica e quindi il divergere della funzionalità. Per esempio dall’analisi dei geni delle globine in varie specie è emerso che questi geni inizialmente sono andati incontro a questo fenomeno di omogeneizzazione mediante conversione genica, ma quando le sequenze diversero sufficientemente per rendere inefficace questo meccanismo, i geni iniziarono ad evolvere indipendentemente. Tutti i primati hanno 2 α globine. Assumiamo quindi che l’antenato comune dei primati avesse due geni α-globinici. • Se α1 e α2 della stessa specie si sono separati circa 300 milioni di anni fa dovrebbero aver accumulato molti cambiamenti AA. • Si osserva un’alta omogeneità intraspecifica: la conclusione e che i geni α1 e α2 non si sono evoluti in modo indipendente, ma in maniera concertata. La maggior parte delle sequenze ripetute, sia codificanti che non codificanti, presentano la capacità di evolvere in maniera concertata. Quando vengono comparati i membri di una famiglia ripetuta, la maggiore similarità di sequenza si trova all’interno della specie (Paralogia) piuttosto che tra le specie (Ortologia), suggerendo che i membri della famiglia non evolvono indipendentemente gli uni dagli altri. Il processo molecolare che conduce alla omogenizzazione delle sequenze di DNA appartenenti ad una data famiglia ripetuta è chiamata evoluzione concertata. L’evoluzione concertata avviene a causa di vari meccanismi genetici che producono scambio tra le sequenze di DNA non alleliche all’interno di un genoma. Questi meccanismi comprendono il crossing-over ineguale, lo scambio ineguale tra cromatidi fratelli e meccanismi simili alla conversione genica ed amplificazione che sono particolarmente attivi nel caso di sequenze di DNA ripetuto in tandem. Con il termine di conversione genica si intende invece un trasferimento non reciproco di sequenze tra una coppia di sequenze di DNA non alleliche (conversione genica interlocus) o alleliche (conversione genica interallelica). Delle due sequenze che interagiscono una, la sequenza donatrice, rimane immutata, mentre l’altra, la ricevente, viene modificata. Un possibile meccanismo ipotizza la formazione di un eteroduplex tra un filamento della sequenza donatrice e quello complementare della ricevente, con successiva conversione del ricevente grazie al meccanismo della riparazione degli accoppiamenti errati: gli enzimi di riparazione del DNA riconoscono che i due filamenti correggono la dell’eteroduplex sequenza del non sono ricevente per perfettamente renderla complementare alla sequenza del filamento donatore. appaiati e perfettamente EVOLUZIONE CONCERTATA Negli eucarioti alcuni geni sono presenti in copie multiple. Negli organismi complessi, per esempio, i geni per l’RNA ribosomale sono tipicamente presenti in centinaia o anche migliaia di copie. Senza dubbio alcuno, queste copie si sono originate per duplicazione. In seguito alla duplicazione ci si potrebbe attendere che ogni singola copia di un gene acquisisca delle mutazioni e diverga. La selezione potrebbe limitare la mutazione nelle regioni codificanti, ma, se ne esistono molte copie, ci aspetteremmo, specie a livello delle sequenze non codificanti, che sussista un certo grado di divergenza. Al contrario di quanto atteso, numerosi studi hanno rivelato che spesso le sequenze nucleotidiche risultano alquanto omogenee in seno alle diverse copie di un gene. Inoltre, anche le sequenze non codificanti risultano omogenee, il che suggerisce che la selezione non sia responsabile di questa purificazione. Quando gli stessi geni vengono esaminati in una seconda specie strettamente correlata, si trova che anche le sequenze di quest’ultima sono omogenee, ma spesso diverse dalle sequenze omogenee trovate nella prima specie. Queste osservazioni hanno fatto concludere che un qualche processo a livello molecolare mantenga di continuo l’uniformità tra copie multiple della stessa sequenza all’interno di una specie. Allo stesso tempo, il processo permette una rapida differenziazione tra specie: il meccanismo dell’evoluzione concertata non è chiaramente compreso, ma l’evoluzione concertata ha conseguenze importanti su come evolvano i geni e rappresenta una forza evolutiva di cui si ignorava l’esistenza prima che alla genetica di popolazioni fossero applicate le moderne tecniche molecolari. Duplicazioni intra-geniche Nuove funzioni geniche possono essere acquisite mediante riarrangiamento di segmenti genici codificanti per domini proteici strutturali 2 meccanismi: - duplicazione dei domini - rimescolamento dei domini Duplicazioni intra-geniche Esempio di duplicazione di domini strutturali: gene per il collagene a2 di tipo 338 ripetizioni Gly-X-Y, presenti in 42 dei 52 esoni del gene. Ogni esone codifica per un numero completo di ripetizioni. Evoluzione del gene mediante duplicazione degli esoni che ha portato alla ripetizione di domini strutturali Esempio di rimescolamento dei domini strutturali: gene per l’attivatore del plasminogeno tissutale TPA 4 esoni codificanti domini strutturali diversi: 1° esone simile a quelli della fibronectina, proteina che lega la fibrina, 2° esone codifica per un dominio tipico dei fattori di crescita 3° e 4° esone codificano per strutture kringle (legano i coaguli di fibrina) presenti nel gene per plasminogeno Pseudogeni • Copie difettive dell’intera sequenza di un gene funzionale (o della sua porzione codificante), o copie troncate, mancanti di porzioni al 5’, al 3’, o frammenti interni. Pseudogeni non processati • Contengono tutte le regioni funzionali del gene • Presentano codoni di stop inappropriati • Originati per duplicazione genica o crossing-over ineguale Pseudogeni processati (retropseudogeni) • Contengono solo le sequenze esoniche e una sequenza oligo dA/dT • Copiati dall’mRNA in cDNA e reintegrati nel genoma • Se sono espressi sono detti retrogeni Pseudogeni La Trascrittasi Inversa codificata da elementi LINE può retrotrascrivere un mRNA in cDNA che successivamente può essere integrato a caso in un cromosoma. Se sul sito di inserimento è casualmente presente un promotore il retrogene può essere eventualmente espresso e diventare funzionale. Normalmente, questo non accade e lo pseudogene comincia ad accumulare mutazioni casuali che distruggono la ORF (eventualmente) funzionale.