Il genoma umano
LEZIONE 6
By NA
Genoma Umano
~70%
~30%
~80%
~10%
By NA
~90%
~20%
Il DNA mitocondriale
0.0005% del genoma umano
- doppio filamento a diversa composizione:
filamento heavy (H) e light (L)
- contiene 37 geni, 28 su filamento H e 9 su filamento L
- dei 37 geni, 24 codificano per prodotti maturi ad RNA e 13
per polipeptidi dei complessi multimerici del mitocondrio (concetto
di semiautonomia)
- i geni sono estremamente compatti: privi di introni sovrapposti
parzialmente (subunita’ 6 e 8 dell’ATPasi) trascritti privi di codoni
di stop
- eredita’ matroclina
By NA
Il DNA NUCLEARE
Si distingue in:
DNA codificante (3%)
DNA non codificante (97%)
By NA
Il DNA codificante (per RNA e proteine)
- Numero di geni stimato nel genoma umano (30000), stimato
utilizzando il sequenziamento genomico e CpG
- Utilizzando sonde per CpG (56% dei geni umani hanno nei loro
promotori questi elementi di sequenza) si e’ visto una differenziale
densita’ genica sui cromosomi:
a. cromosoma 19 ricco in geni
b. cromosomi 4 e 18 poveri in geni
- di solito in unica copia
- possono appartenere a famiglie geniche originatesi per
duplicazione. In questo caso possono mantenere funzioni
correlate e possono mappare nella stessa regione genomica
By NA
Il DNA codificante
GENI CHE CODIFICANO
ORGANIZZAZIONE
Stesso prodotto
Spesso raggruppati
Isoforme proteiche o
isoenzimi tessuto-specifici
Talvolta raggruppati
talvolta non sintenici
Isoenzimi specifici per
differenti comparti cellulari
Di solito non sintenici
Enzimi della stessa
via metabolica
Di solito non sintenici
Subunita’ della stessa molecola
Di solito non sintenici
Ligando e recettore
Di solito non sintenici
By NA
ESEMPI
geni per tRNA, istoni ...
amilasi pancreatica e salivare
a-actina epatica e cardiaca
Aldeide deidrogenasi
citoplasmatica e mitocondriale
(chr9q e chr12q)
Ferritina: cat pesante chr11q
cat leggera chr22q
Geni dentro i geni
Geni all’interno di altri geni sono descritti per i genomi di
organismi semplici e nei mitocondri
Nei mammiferi sono descritti geni contenuti nei grandi introni di alcuni geni.
A differenza dei genomi piu’ semplici in questi casi spesso viene utilizzato il
filamento opposto al gene “canonico”
NF1: introne 27 (40Kb) contiene tre piccoli geni (2 esoni) che vengono
trascritti dal filamento opposto
Fattore VIII della coagulazione F8C: introne 22 contiene due geni che
utilizzano la stessa isola CpG nelle due direzioni. Il gen F8A viene
trascritto utilizzando il filamento opposto al F8C, mentre F8B non solo
va nella stessa direzione, ma sintetizza un corto mRNA che ha un esone
nuovo + gli esoni dal 23 al 26 di F8C.
RB1: introne 17 (72Kb) contiene il gene per il recettore della proteina G,
che viene trascritto in senso opposto
By NA
Geni dentro i geni
NF1
Filamento di senso
5’
Filamento antisenso
3’
Introne 26
esone 26
2.2KB
EVI2B
1
EVI2A
10 KB
F8C
4 KB
CpG
F8B
22
F8A
By NA
3’
5’
OGMP
F8
esone 27
23
26
Famiglie multigeniche
 40% del genoma e’ composto da gruppi di sequenze
non alleliche che mappano percio’ in locus diversi, ma sono
strettamente correlate, sono presenti cioe’ sequenze con un
numero di copie multiple.
 Tradizionalmente sulla base della cinetica di riassociazione
il genoma
 DNA
 DNA
 DNA
By NA
umano e’ suddiviso in:
a singola copia o con un numero di copie molto basso
moderatamente ripetitivo
altamente ripetuto
Famiglie multigeniche
 La definizione di famiglia e’ operativa, e’ indipendente
dalla natura delle sequenze
 Due sequenze vengono definite come appartenenti alla
stessa famiglia quando presentano omologia di sequenza anche
in una regione ristretta della sequenza
 Famiglie multigeniche: DNA ripetuto che contiene geni
funzionali
 Famiglie
By NA
di sequenze di DNA non genico
Famiglie multigeniche
 Famiglie multigeniche: DNA ripetuto
che contiene geni funzionali
Le famiglie presentano variabilita’ nell’omologia con la sequenza di riferimento
e nel grado con cui le sequenze conservate definiscono la famiglia. Ne deriva
che l’appartenenza ad una famiglia e’ data non solo dall’omologia complessiva,
ma dal presentare un dominio condiviso o organizzazione simile. Si possono
presentare raggruppati o distribuiti nel genoma. Alcuni membri possono essere
non funzionali:
pseudogeni
By NA
Pseudogeni I
 Pseudogeni non processati: convenzionali ed espressi
 Copie non funzionali del DNA genomico di un gene.
Contengono esoni, introni e spesso le sequenze fiancheggianti. Data la loro somiglianza
nell’organizzazione genomica, la loro natura non funzionale puo’ essere riconosciuta, a
livello di sequenza, dalla presenza di codoni di stop nella regione corrispondente alla
porzione codificante del gene funzionale o dalla presenza di un’elevato numero di
mutazioni ognuna della quali originerebbe una molecola mutante.
Sono comuni nelle famiglie di geni raggruppati
 Talvolta possono venir espressi a livello di RNA o addirittura come
polipeptide, che non viene utilizzato nella molecola funzionale:
gene della globina-, sicuramente viene espresso, ma non se ne riscontra
la presenza nell’emoglobina funzionale
By NA
Pseudogeni II
Pseudogeni processati : sono copie non funzionali degli
esoni di un gene espresso e si ritrovano nelle famiglie dei
geni interspersi. La loro origine sembrerebbe dovuta
all’integrazione di una sequenza di DNA originatesi per azione
di una trascrittasi inversa.
 se sono copie di trascritti dalla RNApolimerasi II di solito non sono espressi
perche’ privi del promotore. Possono venir espressi se integrati vicino ad un
promotore, in questo caso l’espressione potrebbe non essere nello spazio e
nel tempo quella originaria (espressione selettiva in un tessuto specifico e/o
in uno specifico momento nello sviluppo: geni espressi nel testicolo, SRY)
se sono copie di trascritti dalla RNApolimerasi III possono avere al loro interno
il promotore ed essere espressi. Possono raggiungere un elevato numero di copie
(sequenze Alu)
By NA
I cluster globinici
 Le LCR si trovano a monte dei raggruppamenti e la loro funzione sarebbe quella di
organizzare il raggruppamento in un dominio di cromatina attiva, agendo come enhancer.
 La cromatina attiva si presenta sensibile alla Dnasi I e grazie a questa caratteristica
sono state identificate le LCR per i due aggruppameni globinici. E’ stato anche possibile
riconoscere che questa ipersensibilita’ e’ modulata nei diversi stadi di sviluppo
HS-40
1
2
2
1
2
1
globina
HS-4 HS-3 HS-2
globina
By NA

G
A




Controllo dei cluster globinici
Gli enhancer sono brevi sequenze che agiscono in cis. Nel caso dei geni globinici
sono costituiti da sequenze di riconoscimento per fattori di trascrizione eritroido-specifici. Si ritiene che l’alternanza delle emoglobine sia legata oltre che a fenomeni
di competizione dei geni per interagire con le LCR , anche all’intervento
di silenziatori gene-specifici, modulati durante lo sviluppo.
DNA nell’embrione
G

A



DNA nel feto

G
A



DNA nell’adulto

G
A



By NA
Struttura del DNA codificante

relazione inversa tra lunghezza del gene e percentuale del
contenuto esonico
By NA
Gli introni
Entita’ eterogenee con differenti capacita’ funzionali.
Sono coinvolti nello splicing con modalita’ differenti e
pertanto classificabili in gruppi. La posizione
all’interno delle sequenze codificanti (fase intronica)
ne permette un’ulteriore suddivisione in tipi:
Introni ancestrali: presenti nei geni dei tRNA e dei r RNA
degli archeobatteri.
Introni di gruppo I e II:presenti nel genoma degli eubatteri
e degli eucarioti
Introni “spliceosomici”:introni convenzionali presenti nel genoma degli
eucarioti
By NA
Gli
introni
Taglio in
esone1GU------------A-----AG esone2
Eliminato
GU-----------------AG
esone1
RNA maturo
esone1
snRNP U1
Splicing
esone2
esone2
GU--------AG esone3
GU--------AG
Eliminato
esone3
esone3
snRNP U2
CA
esone1 GU------------A-----AG
esone1
By NA
esone2
esone2
GT--------AG
esone3
Gli introni
Fase degli introni: posizione in cui l’introne interrompe una
sequenza di DNA codificante (non si definisce la fase quando
l’introne interrompe una sequenza non tradotta).. Esistono tre
tipi: fase 0, fase 1, fase2
Fase 0: interrompono la sequenza codificante fra due codoni
adiacenti, sono i piu’ numerosi e potrebbero rappresentare la
situazione ancestrale
Fase 1: interrompono la sequenza codificante fra la prima e la
seconda base
Fase 2: interrompono la sequenza codificante fra la seconda e
la terza base
By NA
Gli
introni
Fase degli introni: posizione in cui l’introne interrompe una sequenza di DNA
codificante (non si definisce la fase quando l’introne interrompe una sequenza non
tradotta). Esistono tre tipi: fase 0, fase 1, fase2
1
5’ UTS
HBB
Val
29
30
Gly Ar
2
ATG GTG --- GGC AG
5’UTS
Fase 2
1
31
104
2 g Leu
Arg
G CTG --- AGG
80
gt--------ag
146
Leu
His
3’UTS
CCC --- CAC TAA
110
1 al
ATG ------------- CAG G
3’UTS
TG ------------ AACTAG
Fase 1
By NA
0
Fase 0
81
V 1
INS
0
105
Famiglie di DNA ripetuto non genico
 DNA RIPETUTO IN TANDEM: i blocchi possono mappare su piu’
cromosomi a seconda delle dimensioni medie delle unita si suddivide in:
 DNA satellite
 DNA minisatellite
 DNA microsatellite
DNA RIPETUTO INTERSPERSO: Le singole unita’ sono sparse nel genoma.
Contengono sequenze che possono essere retrotrasposte attraverso un
intermedio di RNA.
By NA
DNA ripetuto intersperso
DNA RIPETUTO INTERSPERSO: Le singole unita’ sono sparse nel genoma.
Contengono sequenze che possono essere retrotrasposte attraverso un
intermedio di RNA.
 SINE (Short Interspersed Nuclear Elements). Nell’uomo e negli altri primati
la famiglia piu’ rappresentativa e’ costituita dalle Alu
 LINE (Long Interspersed Nuclear Elements). Sono condivisi anche
da altri mammiferi
By NA
Classificazione elementi trasponibili nell’uomo
ELEMENTI TRASPONIBILI
TRAMITE RNA
(comune)
Incapace di
codificare la
trascrittasi inversa
Famiglia non virale
Retropseudogeni
(pseudogeni processati)
TRAMITE DNA
(rara)
Capace di
codificare la
trascrittasi inversa
Famiglia virale
Posseggono le LTR e
caratteristiche dei retrovirus
Retrovirus endogeni e elementi
simil-retrovirali
FAMIGLIA Alu
By NA
TRASPOSONI
FAMIGLIA HERV/RTLV
FAMIGLIA THE-1
Privi delle LTR e di altre
caratteristiche dei retrovirus
Retrotrasposoni
FAMIGLIA LINE-1(Kpn)
Elementi trasponibili
I membri delle famiglie di ripetizioni intersperse sono
considerati elementi trasponibili
 ELEMENTI TRASPONIBILI: segmenti di DNA in grado di muoversi nel
genoma. Gli elementi trasponibili umani sono di regola retrotrasposoni.
La sequenza trasposta si trova ,dopo la duplicazione, ad essere fiancheggiata
da corte unita’ ripetute
By NA
5’
AAAANn
AAAAA
3’
TTTTNn
TTTTT TTTTTn
AAAANn
3’
5’
Elementi trasponibili tramite RNA
FAMIGLIA Alu
 SINE di mammifero con elevato numero di copie, famiglie Alu nell’uomo e B1 nel topo
Derivano da geni trascritti dalla RNA polimerasi III utilizzando un promotore interno.
Le Alu si trovano circa ogni 4 kb , la sequenza completa e’ lunga 280pb, fiancheggiata da
corte unita’ (6-18pb) ripetute dirette, e’ un dimero ripetuto in tandem le cui unita’
presentano entrambe sequenza (A )/ (T ), uno dei monomeri e’ deleto di 32pb.
n
n
Sono presenti nel genoma anche come monomeri interi o tronchi. Sarebbero pseudogeni
processati del gene dell’RNA 7SL
RNA7SL
+1
+10
A
mRNA7SL
Promotore bipartito
5’
130
AAAAA
TTTTT
AAAAA
TTTTT
B
AAAAA
TTTTT
delezione
delezione 32pb
By NA
+52
AAAAA
TTTTT
160
AAAAA
TTTTT
3’