STRUTTURA DEL GENOMA EUCARIOTICO
Il genoma degli eucarioti è rappresentato da tutte le sequenze di
DNA nucleari e organellari, codificanti e non codificanti
presenti in un determinato organismo animale o vegetale
GRANDEZZA DEL GENOMA EUCARIOTICO: IL PARADOSSO DEL VALORE C
Gimnosperme 1010 –1011
coppie di basi bp
Uomo ca 2,7x 109 bp
E. coli 4 Mbp
Riso
0,483 Gbp
Vite
0,487 Gbp
Mais
2,30 Gbp
Girasole
3,3 Gbp
Frumento tenero 16,719 Gbp
Pino
ca 22 Gbp
Per genoma aploide 1C
Il contenuto in DNA nucleare negli eucarioti è molto variabile, in particolare nelle piante si va da 63 Mbp
di Genlisea margaretae a 150.000 Mbp (150 Gbp) di Paris japonica, fiore raro del giappone
Genlisea margaretae, pianta carnivora,
con genoma di 63 Mb. (1C)
Famiglia Lentibulariaceae Ordine Lamiales
nativa di Madagascar, Tanzania, e Zambia.
Paris japonica Monocotiledone , Ordine Liliales,
Famiglia Melanthiaceae. Ottoploide forse ibrido
allopoliploide di 4 specie, 40 cromosomi, genoma
di circa 150.000 Mbp (1C)
Il genoma di Arabidopsis è stato il primo genoma
completamente sequenziato nelle piante
Arabidopsis thaliana Dicotiledone, Ordine Capparales
Famiglia Brassicaceae (Crucifere), 5 x 2 cromosomi,
genoma aploide di 120 Mb
SPECIE CON GENOMA COMPLETAMENTE SEQUENZIATO E IN CORSO DI
SEQUENZIAMENTO
Patata
Pomodoro
Pesco
Brachipodium
M. truncatula
PRIMI STUDI SULLA ORGANIZZAZIONE DEL GENOMA EUCARIOTICO
Denaturazione del DNA
Riassociazione del DNA
CINETICA DI RIASSOCIAZIONE DEL DNA
CURVA TRIFASICA
 Negli eucarioti la cinetica di
riassociazione mostra una
curva trifasica
 Tre componenti del genoma
con diversa velocità di
riassociazione
 seq HR altamente ripetute
 seq MR mediamente ripetute
 seq U uniche
CINETICHE DI RIASSOCIAZIONE DEL DNA DI GIRASOLE
girasole
 Numero cromosomico: 2n = 34
Taglia del genoma: 3,30 pg DNA per genoma aploide
ca 3185 Mbp
E.coli
 Le cinetiche di riassociazione del DNA di girasole
indicano che le sequenze altamente ripetute
rappresentano il 10% del genoma e quelle mediamente
ripetute più del 50%.
 Ca 80% di seq ripetute dato ottenuto con analisi
genomiche recenti
PRIME CLASSIFICAZIONI DELLE SEQUENZE DEL GENOMA EUCARIOTICO
1) Classificazione delle sequenze di DNA in base alle cinetiche di riassociazione:
Sequenze altamente ripetute HR
ripetitività > 105 copie
non codificanti
Sequenze mediamente ripetute MR
ripetitività < 105 e > 102 copie
rDNA, geni per tRNA, istoni
altre sequenze non codificanti
Sequenze uniche U
ripetitività < 102 copie
in basso numero di copie
IPOTESI: ruolo nella regolazione genica ?
geni strutturali e altre sequenze
PRIME CLASSIFICAZIONI DELLE SEQUENZE DEL GENOMA EUCARIOTICO
2) Classificazione delle sequenze di DNA in base alla localizzazione nel genoma:
Sequenze ripetute :
raggruppate
disperse
Seq. ripetute raggruppate:
sono altamente o mediamente ripetute
sono ripetute “in tandem”
in certi casi formano i “DNA satellite”
sono localizzate in regioni specifiche dei cromosomi: centromeri e telomeri
alcune sono codificanti: rDNA, DNA codificante istoni
Seq. ripetute disperse:
SINE, seq. corte, disperse fra i geni strutturali,
LINE, seq. lunghe, disperse fra i geni strutturali
SCHEMA DEI TIPI DI SEQUENZE CHE COMPONGONO IL GENOMA NUCLEARE
DEI VEGETALI
Seq.
Codificanti
(Geni)
Geni ribosomali (rDNA):
geni per l’rRNA 5S con spaziatori intergenici
geni per gli rRNA 18-5,8-25S con spaz. intergenici
SEQUENZE DI DNA
RIPETUTE IN TANDEM
Seq. Non
coficanti
istoni
tRNA
COPIE CON
SEQUENZE
DEGENERATE
Geni strutturali codificano proteine
Nelle piante generalmente a basso numero
di copie (comprese le sequenze regolatrici e
gli introni)
SEQUENZE DI DNA
RIPETUTE DISPERSE
Pseudogeni
Telomeri
(ripetizione
CCCTAAA)
Trasposoni a DNA
Retrotrasposoni con LTR e
non-LTR (LINE, SINE)
Microsatelliti (1-5 pb)
Minisatelliti (fino a 50 pb)
solo-LTR
DNA satellite
 I geni strutturali generalmente sono organizzati in famiglie geniche
Es. geni per la zeina di mais si trovano sul cromosoma 7
Zm1

Zm2
Zm3
Zm4
I geni ribosomali sono sequenze ripetute in “tandem”
livello di ripetizione ca 103 copie per genoma
Zm5
Zm6
SEQUENZE RIPETUTE IN TANDEM
Il DNA telomerico
motivo 5’ TTTAGGG 3’
ripetuto più volte che viene aggiunto
alle estremità cromosomiche dalla telomerasi
Ibridazione in situ sulle regioni
telomeriche e subtelomeriche
Con sequenze radioattive
Con sequenze fluorescenti
Nothoscordum striatum (Alliaceae)
SEQUENZE DI DNA RIPETUTE IN TANDEM
 Il DNA satellite
 Minisatelliti
 Microsatelliti
si osserva nei gradienti di densità e presenta monomeri di lunghezza
variabile (140-360 pb) che si ritrovano a blocchi fino a 1 Mpb.
localizzato nelle regioni centromeriche e subtelomeriche dei cromosomi
es.
es.
(ACAAACTTTA)n
ACACACACAC….. (AC)n
ACTACTACT… (ACT)n
Al massimo 50 nucleotidi ripetuti 10-100
volte
2 nucleotidi ripetuti 10-100 volte
uniformemente distribuiti nei cromosomi
3 nucleotidi ripetuti 10-100 volte
Sono utilizzati nella genetica forense per le analisi di paternità ecc. 15 microsat + il gene per amelogenina
che si trova su cromosoma X e Y ma ha una lunghezza diversa si ha una sicurezza superiore al 97-98%
Nella genetica agraria sono utilizzati per es nel riconoscimento varietale come in olivo , vite ecc.
Nell’uomo i Micro+ Mini+ DNA satellite formano il 10% del genoma
Il DNA satellite alfa del genoma umano
E’ formato da una sequenza di 171 pb
ripetuta in tandem che si localizza nei
centromeri
In ogni centromero sono presenti da 5000
a 15000 copie di questa sequenza, le
regioni pericentromeriche sono formate da
lunghi blocchi di LINE E SINE
Sequenza ripetuta in tandem di girasole
La sequenza HAG004N15 è formata da 368 bp, sono presenti 7.800 copie per genoma aploide con
una localizzazione specifica per ogni cromosoma
SEQUENZE DI DNA RIPETUTE DISPERSE
GLI PSEUDOGENI
A : inattivati
pseudogeni generati per duplicazione e poi inattivati da mutazioni
 Es. locus della beta globina umana
 Altro esempio i geni per snRNA U1:
Ci soni 50-1000 copie funzionanti e
500-100 copie costituite da
pseudogeni
GLI PSEUDOGENI
B: “processati”
pseudogeni derivati da mRNA retrotrascritti
GLI ELEMENTI TRASPONIBILI
Sono sequenze di DNA in grado di “trasporsi” autonomamente da un
sito ad un altro nel genoma.
•
Gli elementi trasponibili sono stati scoperti da B. Mc Clintock in mais negli anni’40
•
Nel tempo sono stati individuati in tutti gli Eucarioti (1 eccezione Plsmodium falciparum)
•
Costituiscono una porzione preponderante del genoma nucleare delle piante (>70% in molti casi)
Es: linea B73 di mais solo i Retrotrasposoni costituiscono il 75% del genoma
•
Elementi trasponibili come DNA spazzatura, DNA egoista e parassita o
partners “simbiontici” del genoma vegetale?
Barbara Mc Clintock Premio Nobel 1983
I Trasposoni a DNA si spostano con un meccanismo di
trasposizione “taglia-incolla”
I Retrotrasposoni si spostano con un meccanismo di trasposizione
“copia-incolla”
Questo processo di trasposizione porta all’ incremento del numero di copie del
retrotrasposone e, di conseguenza, della grandezza del genoma.
Elementi di classe II (Trasposoni)
sottoclasse I
•
I Trasposoni possiedono sequenze terminali dette TIR (Terminal Inverted Repeats) da poche ad
alcune centinaia di basi Per es:
ATTGTCCCATAA…………………….TTATGGGACAAT
TAACAGGGTATT……………………AATACCCTGTTA
•
Codificano l’enzima Trasposasi necessario per la trasposizione
5 superfamiglie di trasposoni nelle piante (CACTA, Tc1-Mariner, hAT, Mutator, PIF-Harbinger)
MITE: Miniature Inverted repeat Transposable Elements
• Sono un gruppo eterogeneo di piccoli elementi NON autonomi, costituiti da poche
decine a poche centinaia di basi.
• Spesso si trovano vicino ai geni e negli introni, nella 5’ UTR e nella 3’ UTR
• In alcune specie sono molto numerosi, per esempio la famiglia Stowaway di riso
Trasposoni di Classe II (sottoclasse II): gli Helitron
• Non hanno TIRs, presentano TC in 5’e CTRR (R=purina) in 3’
• Codificano proteine iniziatrici della replicazione ed elicasi
• Hanno un meccanismo di trasposizione diverso da quello degli altri trasposoni a DNA
(rolling-circle)
• In mais molti helitron sono non autonomi, contengono al loro interno esoni di geni diversi
catturati tramite un meccanismo non ancora del tutto chiarito
Elementi di classe I: i Retrotrasposoni
• I retrotrasposoni hanno una struttura molto simile ai retrovirus
• Si ritiene che i retrovirus si siano originati dai retrotrasposoni in seguito ad
acquisizione della mobilità extracellulare
I RETROTRASPOSONI con LTR: 2 superfamiglie, Gypsy e Copia
Dimensioni: 4000 -15000 pb
LTR: long terminal repeats
gag: (contiene un gene per una proteina del capside (CP) e un sito di legame per gli acidi nucleici (NA))
pol: (poliproteina con un dominio proteasi (PR), uno retrotrascrittasi (RT), uno RNAsiH, uno integrasi (INT))
PBS: primer binding site
PPT: tratto polipurinico
HACRE1, un retrotrasposone Copia di girasole che si è
inserito recentemente, al max. 87000 anni fa
La reazione di trasposizione nella sequenza bersaglio è fonte di
mutazioni
Retro
LTR
LTR
LTR
LTR
LTR
LTR
Si producono duplicazioni dirette di brevi sequenze nella sequenza bersaglio
Retrotrasposoni con LTR: autonomi e non autonomi
•
Retrotrasposoni non-autonomi
non hanno la regione interna alle
LTR
•
TRIM (Terminal Repeats In
Miniature)
LARD (LArge Retrotransposon
Derivative)
Le famiglie non autonome utilizzino per replicarsi gli enzimi prodotti da quelle
autonome
SOLO-LTR (singole sequenze LTR)
Come si sono formate le solo-LTR:
• La ricombinazione tra due LTR di
un retrotrasposone porta alla
eliminazione della regione
codificante e di una LTR
• Nel genoma dell’ospite rimane una
singola LTR detta solo-LTR
•
Le solo-LTR sono il segno della presenza di un retrotrasposone che poi è stato eliminato
Retrotrasposoni senza LTR: i LINE (Long INterspersed Elements)
Dimensioni = 5000-8000 pb
Il dominio gag dei LINE codifica anche una endonucleasi (EN) – Il dominio pol contiene una sequenza che
codifica per una retrotrascrittasi (RT) e una per l’RNAsiH
• struttura simile ai retrotrasposoni con LTR
• molto numerosi nei primati e nel topo: la superfamiglia L1 costituisce il 17% di tutto il
genoma dell’uomo (In totale le LINE il 22% del genoma)
• nelle piante non sono molto frequenti rispetto ai retrotrasposoni con LTR (con
l’eccezione di vite e Lilium)
Retrotrasposoni senza LTR: i SINE (Short INterspersed Elements)
Dimensioni = 100-500 pb
Pol IIIA e Pol III B: promotori per l’RNA polimerasi III - (A)n : coda poli-A.
• Elementi non autonomi che derivano da trascritti della RNApol III che accidentalmente
sono stati retrotrascritti in DNA e inseriti nel genoma.
• Nei mammiferi sono molto frequenti (es. la famiglia Alu I nel genoma umano :1,2 x 106
copie . In totale le SINE costituiscono l’11% del genoma umano.
Locus della beta globina umana
Caratterizzazione del locus LTP di girasole
Il gene LTP codifica una Lipid Transfer Protein
Ha un solo introne
giallo : sequenza codificante
viola : introne
In girasole è una famiglia multigenica composta da
5 geni, in due geni si sono inseriti Retrotrasposoni
Le regioni a monte di ciascun gene LTP contengono sequenze
cis-promotrici diverse, indicando che, dopo la duplicazione
genica, le varie copie hanno acquisito una specificità di
regolazione.
LOCALIZZAZIONE DEI RETROTRASPOSONI
Associazione alla eterocromatina centromerica in
relazione alla funzione del centromero (i Gypsy)
Arabidopsis thaliana
Helianthus annuus
LOCALIZZAZIONE DEI RETROTRASPOSONI
I retrotrasposoni possono avere localizzazione dispersa nel genoma oppure raggruppata in
particolari regioni cromosomiche (centromeri, regioni subtelomeriche e telomeriche)
Locus Adh1 di mais
Quando i retrotrasposoni sono raggruppati, risultano spesso inseriti uno dentro l’altro (nested) in
un sito cromosomico, soprattutto in specie con genoma grande
Distribuzione dei diversi tipi di sequenze lungo un cromosoma (Beta vulgaris)
Tandem repeats
intercalari
Tandem repeats
associate al
centromero
Repeats telomeriche
e sub-telomeriche
Tandem repeats
disperse
Microsatelliti e retroelementi
dispersi
LINEs
In bianco i geni e le sequenze in poche o singola copia.
In molte specie i retrotrasposoni possono avere anche una localizzazione dispersa ma si trovano
preferenzialmente a livello di centromero e di telomero.
GLI ELEMENTI GENETICI MOBILI POSSONO
MODIFICARE L’ATTIVITA’ DEI GENI
L’inserimento di un elemento trasponibile può avvenire all’interno di un gene e/o
all’interno di un promotore. Effetti diversi
INOLTRE GLI LTR DI REs CONTENGONO SEQUENZE PROMOTRICI CHE POSSONO
INFLUENZARE LA REGOLAZIONE DI GENI VICINI
I TRASPOSONI DI MAIS DI B. Mc CLINTOCK
Ac e Ds
possono
inserirsi
nella
sequenza di
un gene e
inattivarlo
Ma in certi
momenti dello
sviluppo
possono
“saltare”
ripristinandone
la funzionalità
Un esempio di mutazione dovuta all’inserzione di un elemento trasponibile
 Mutazione da uva nera a uva bianca
GRET1 (GRAPE RETROTRASPOSON 1) è un
retrotrasposone Gypsy inseritosi vicino ad un
fattore di trascrizione (VvMybA1) fondamentale
nella regolazione della biosintesi delle antocianine,
inattivandolo.
I girasoli mutanti di Van Gogh
Il fenotipo crisantemoide è causato dalla
inserzione di un trasposone CACTA nel
promotore del gene CYCLOIDEA (Ha CyC2c)
che codifica un fattore di trascrizione che
controlla la formazione dei fiori esterni del
capolino
L’ inserimento del Trasposone impedisce che il
gene venga bloccato così funziona e si formano
fiori simili a quelli esterni nel centro del capolino
Trasposoni e RNA silencing
Poiché i trasposoni sono potenzialmente mutageni, il genoma ospite ha
sviluppato efficienti meccanismi epigenetici per controllare (inibire) la
loro proliferazione
La maggior parte dei trasposoni sono inattivi, metilati e, se trascritti,
sono silenziati da siRNA
•Silenziamento post trascrizionale tramite RNA silencing
•Alterazioni della cromatina mediate da RNA silencing
GLI ELEMENTI TRASPONIBILI SONO SILENZIATI TRAMITE
RNA SILENCING
Nelle regioni eterocromatiche, la trascrizione di RNA che vengono resi a doppio filamento da RNApolRNAdip innesca la produzione dei siRNA. Questi vanno a silenziare il DNA tramite il rimodellamento
della cromatina e la metilazione di istoni e di DNA (metilazione del DNA-RNA dipendente)
sequenze eterocromatiche
MITE e altri Elementi trasponibili se vengono trascritti sono una fonte di RNA a
doppio filamento e quindi di siRNA che vanno a silenziare se stessi.
FINE
EFFETTO DEGLI ELEMENTI GENETICI MOBILI SULLE
DIMENSIONI DEL GENOMA
Gli elementi retrotrasponibili sono, con la
poliploidia, i maggiori responsabili
dell’incremento delle dimensioni del genoma
che si osserva negli eucarioti
Nelle piante questo ruolo è stato
svolto soprattutto dai retrotrasposoni
con LTR
L’espansione del genoma è comunque
in equilibrio con altre forze che tendono
a contrastarla come la ricombinazione
omologa e le delezioni
L’espansione del genoma è comunque in equilibrio con altre forze che tendono a
contrastarla come la ricombinazione omologa ineguale e le delezioni
- Comparazioni di genomi di specie differenti indicano
che la poliploidia o (paleopoliploidia), duplicazioni
segmentali (anche di bracci di cromosomi) e
amplificazioni episodiche di Retrotrasposoni sono
responsabili dell’ aumento della grandezza dei genomi
-Diminuzione grandezza genomi: Ricombinazione
omologa ineguale può comportare la perdita di sequenze
di DNA comprese ad es. tra due LTR dello stesso RE o
di due RE della stessa famiglia.
Ricombinazione illegittima (rottura a doppio fil e
riparazione DNA che comporta piccole delezioni)
-Angiosperme con grandi genomi (mais) nel corso dell’evoluzione sono andate incontro a duplicazioni geniche,
poliploidia ed espansioni di retrotrasposoni.
-In gimnosperme del genere Pinus tutte le specie hanno 2n=24 cromosomi, e la grandezza del genoma è dovuta
principalmente all’espansione di retrotrasposoni.
LE FUNZIONI DELLA COMPONENTE RIPETITIVA DEL GENOMA SONO
SOLO IN PARTE CONOSCIUTE
Diverse ipotesi
✓ “DNA egoista e parassita (selfish DNA)”: si mantiene nel genoma senza avere alcuna
utilità per le cellule.
✓ “DNA spazzatura (junk DNA)”: porzioni di DNA prive di funzione,rappresentano un
“ricordo evolutivo”
✓ Costituisce blocchi di DNA che formano il “materiale grezzo” per l’evoluzione
di geni funzionali ( ipotesi su Helitrons) e di siti promotori
✓ Funzione strutturale per la cromatina e i cromosomi (centromero, telomeri, origini di
replicazione)
✓ Funzione di regolazione dei geni vicini per i Retrotrasposoni tramite il loro promotore