Organizzazione del genoma umano II Lezione 7 By NA Pseudogeni I & Pseudogeni non processati : convenzionali ed espressi * Copie non funzionali del DNA genomico di un gene. Contengono esoni, introni e spesso le sequenze fiancheggianti. Data la loro somiglianza nell’organizzazione genomica, la loro natura non funzionale puo’ essere riconosciuta, a livello di sequenza, dalla presenza di codoni di stop nella regione corrispondente alla porzione codificante del gene funzionale o dalla presenza di un’elevato numero di mutazioni ognuna della quali originerebbe una molecola mutante. Sono comuni nelle famiglie di geni raggruppati % Talvolta possono venire espressi a livello di RNA o addirittura come polipeptide, che non viene utilizzato nella molecola funzionale: gene della globina- q , sicuramente viene espresso, ma non se ne riscontra la presenza nell’emoglobina funzionale By NA Pseudogeni II &Derivano da duplicazione genica, per effetto della conversione genica rendono un locus hot-spot di mutazione Raggruppamento a- ??????? 16p13 x2 Raggruppamento b- ??????? 11p15 e Raggruppamento ormone della crescita 17q23 By NA hCH-N y x1 y a2 ?Gg Ag CS- L y a1 yb CS-A a2 a1 d hCH-V q b CS-B Pseudogeni III &Derivano da duplicazione genica e accumulo progressivo di mutazioni pressione selettiva A lenta duplicazione diversificazione genica rapida A o o By NA Funzione originale Funzione A2 correlata Nessuna y A funzione Pseudogeni IV & Pseudogeni non processati sono presenti nel genoma in regioni non sinteniche con la copia codificante. & Caratteristica di questi pseudogeni e’ di essere copie troncate del gene. La loro localizzazione e’ prevalentamente pericentromerica e la loro presenza in queste viene ascritta alla plasticita’ pericentromerica che costituisce un aspetto particolare della piu’ generale plasticita’ insita nel genoma umano By NA Pseudogeni V &Pseudogeni processati : sono copie non funzionali degli esoni di un gene espresso e si ritrovano nelle famiglie dei geni interspersi. La loro origine sembrerebbe dovuta all’integrazione di una sequenza di DNA originatesi per azione di una trascrittasi inversa. * se sono copie di trascritti dalla RNApolimerasi II di solito non sono espressi perche’ privi del promotore. Possono venir espressi se integrati vicino ad un promotore, in questo caso l’espressione potrebbe non essere nello spazio e nel tempo quella originaria (espressione selettiva in un tessuto specifico e/o in uno specifico momento nello sviluppo: geni espressi nel testicolo, SRY) *se sono copie di trascritti dalla RNApolimerasi III possono avere al loro interno il promotore ed essere espressi. Possono raggiungere un elevato numero di copie (sequenze Alu e LINE-1) By NA Pseudogeni VI & Pseudogeni processati : sono copie non funzionali degli esoni di un gene espresso e si ritrovano nelle famiglie dei geni interspersi. La loro origine sembrerebbe dovuta all’integrazione di una sequenza di DNA originatesi per azione di una trascrittasi inversa. P E1 E2 E3 Trascrizione e maturazione dell’RNA 5’ E1 E2 E3 AAAA…A n 3’ mRNA 3’ By NA E1 E2 E3 TTTT…T n AAAAN n 3’ 3’ TTTTN n 5’ Integrazione nel DNA cromosomico AAAA..N 5’ 3’ Trascrittasi inversa 5’ TTTTN n TTTT.. TTTTT n 3’ 5’ Sintesi del secondo Filamento e riparazione del DNA 5 ’cDNA 5’ AAAAN n AAAAA AAAAN n 3’ 3’ TTTTN n TTTTT TTTTT n 5’ Pseudogeni VII & Geni troncati e frammenti genici: sequenze simili ad una piccola parte di un gene{frammento in 3’ o in 5’ geni troncati } o ad una regione molto piccola, anche un singolo esone (frammento genico) . Si ritrovano nelle famiglie a geni raggruppati e si formerebbero per crossing over ineguale o SCE ineguali. L a1 a2 a3 TM CIT 3’ UTS L: Sequenza leader, a: Domini extracellulari TM: sequenza transmembrana CIT: Coda citoplasmatica GENI HLA ClasseI mRNA ~2.2 Mb in 6p21 . 3 circa 20 geni B CIT C E Y A G Y F Y 3’ UTS a2 a3 ?????????????? By NA Y ??????????????? 3’ UTS ??????????? 3’ UTS 3’ UTS L ??? ?? Genoma Nucleare ~20.000 geni DNA ripetuto intersperso DNA a sequenza unica DNA ripetuto in tandem Satelliti: LCR LINE geni per proteine famiglie geniche pseudogeni By NA SINE geni per RNA Trasposoni a DNA a,b… … STR (short tandem repeat) Telomeri (TTAGGG) microsatelliti subtelom. Famiglie di DNA ripetuto non genico & DNA RIPETUTO IN TANDEM: i blocchi possono mappare su piu’ cromosomi a seconda delle dimensioni medie delle unita si suddivide in: ü DNA satellite ü DNA minisatellite ü DNA microsatellite &DNA RIPETUTO INTERSPERSO: Le singole unita’ sono sparse nel genoma. Contengono sequenze che possono essere retrotrasposte attraverso un intermedio di RNA. By NA DNA ripetuto intersperso Ø DNA RIPETUTO INTERSPERSO: Le singole unita’ sono sparse nel genoma. Contengono sequenze che possono essere retrotrasposte attraverso un intermedio di RNA. ü SINE ( Short Interspersed Nuclear Elements). Nell’uomo e negli altri primati la famiglia piu’ rappresentativa e’ costituita dalle Alu ü LINE (Long Interspersed I nterspersed Nuclear Elements). Sono condivisi anche da altri mammiferi By NA Elementi trasponibili &I membri delle famiglie di ripetizioni intersperse sono considerati elementi trasponibili & ELEMENTI TRASPONIBILI: segmenti di DNA in grado di muoversi nel genoma. Gli elementi trasponibili umani sono di regola retrotrasposoni. La sequenza trasposta si trova ,dopo la duplicazione, ad essere fiancheggiata da corte unita’ ripetute By NA 5’ AAAAA 3’ TTTTT TTTTT n AAAAN n 3’ 5’ Classificazione elementi trasponibili nell’uomo ELEMENTI TRASPONIBILI TRAMITE RNA (comune) Incapace di codificare la trascrittasi inversa Famiglia non virale Retropseudogeni (pseudogeni processati) TRAMITE DNA (rara) Capace di codificare la trascrittasi inversa Famiglia virale Posseggono le LTR e caratteristiche dei retrovirus Retrovirus endogeni e elementi simil--retrovirali simil FAMIGLIA Alu By NA TRASPOSONI FAMIGLIA HERV/RTLV FAMIGLIA THE - 1 Privi delle LTR e di altre caratteristiche dei retrovirus Retrotrasposoni FAMIGLIA LINE - 1( 1(Kpn) Kpn) Elementi trasponibili tramite RNA FAMIGLIA Alu Æ SINE di mammifero con elevato numero di copie, famiglie Alu nell’uomo e B1 nel topo Derivano da geni trascritti dalla RNA polimerasi III utilizzando un promotore interno. Le Alu si trovano circa ogni 4 kb , la sequenza completa e’ lunga 280pb, fiancheggiata da corte unita’ (6 -18pb) ripetute dirette, e’ un dimero ripetuto in tandem le cui unita’ presentano entrambe sequenza (A )/ (T ), uno dei monomeri e’ deleto di 32pb. n n Sono presenti nel genoma anche come monomeri interi o tronchi. Sarebbero pseudogeni processati del gene dell’RNA 7SL RNA7SL +1 +10 A +52 B Promotore bipartito mRNA7SL AAAAA TTTTT delezione delezione 32pb By NA 5’ 130 AAAAA TTTTT AAAAA TTTTT AAAAA TTTTT 160 AAAAA TTTTT 3’ DNA ripetuto in tandem By NA DNA ripetuto in tandem By NA Origine DNA ripetuto By NA DNA alfoide soprafamiglie By NA DNA alfoide gel By NA DNA alfoide FISH By NA DNA alfoide FISH soprafamiglie pDMX1 (3) By NA p2Xba (2) By NA