STRUTTURA DEL GENOMA EUCARIOTICO Il genoma degli eucarioti è rappresentato da tutte le sequenze di DNA nucleari e organellari, codificanti e non codificanti presenti in un determinato organismo animale o vegetale GRANDEZZA DEL GENOMA EUCARIOTICO: IL PARADOSSO DEL VALORE C Gimnosperme 1010 –1011 coppie di basi bp Uomo ca 2,7x 109 bp E. coli 4 Mbp Riso 0,483 Gbp Vite 0,487 Gbp Mais 2,30 Gbp Girasole 3,3 Gbp Frumento tenero 16,719 Gbp Pino ca 22 Gbp Per genoma aploide 1C Il contenuto in DNA nucleare negli eucarioti è molto variabile, in particolare nelle piante si va da 63 Mbp di Genlisea margaretae a 150.000 Mbp (150 Gbp) di Paris japonica, fiore raro del giappone Genlisea margaretae, pianta carnivora, con genoma di 63 Mb. (1C) Famiglia Lentibulariaceae Ordine Lamiales nativa di Madagascar, Tanzania, e Zambia. Paris japonica Monocotiledone , Ordine Liliales, Famiglia Melanthiaceae. Ottoploide forse ibrido allopoliploide di 4 specie, 40 cromosomi, genoma di circa 150.000 Mbp (1C) Il genoma di Arabidopsis è stato il primo genoma completamente sequenziato nelle piante Arabidopsis thaliana Dicotiledone, Ordine Capparales Famiglia Brassicaceae (Crucifere), 5 x 2 cromosomi, genoma aploide di 120 Mb SPECIE CON GENOMA COMPLETAMENTE SEQUENZIATO E IN CORSO DI SEQUENZIAMENTO Patata Pomodoro Pesco Brachipodium M. truncatula PRIMI STUDI SULLA ORGANIZZAZIONE DEL GENOMA EUCARIOTICO Denaturazione del DNA Riassociazione del DNA CINETICA DI RIASSOCIAZIONE DEL DNA CURVA TRIFASICA Negli eucarioti la cinetica di riassociazione mostra una curva trifasica Tre componenti del genoma con diversa velocità di riassociazione seq HR altamente ripetute seq MR mediamente ripetute seq U uniche CINETICHE DI RIASSOCIAZIONE DEL DNA DI GIRASOLE girasole Numero cromosomico: 2n = 34 Taglia del genoma: 3,30 pg DNA per genoma aploide ca 3185 Mbp E.coli Le cinetiche di riassociazione del DNA di girasole indicano che le sequenze altamente ripetute rappresentano il 10% del genoma e quelle mediamente ripetute più del 50%. Ca 80% di seq ripetute dato ottenuto con analisi genomiche recenti PRIME CLASSIFICAZIONI DELLE SEQUENZE DEL GENOMA EUCARIOTICO 1) Classificazione delle sequenze di DNA in base alle cinetiche di riassociazione: Sequenze altamente ripetute HR ripetitività > 105 copie non codificanti Sequenze mediamente ripetute MR ripetitività < 105 e > 102 copie rDNA, geni per tRNA, istoni altre sequenze non codificanti Sequenze uniche U ripetitività < 102 copie in basso numero di copie IPOTESI: ruolo nella regolazione genica ? geni strutturali e altre sequenze PRIME CLASSIFICAZIONI DELLE SEQUENZE DEL GENOMA EUCARIOTICO 2) Classificazione delle sequenze di DNA in base alla localizzazione nel genoma: Sequenze ripetute : raggruppate disperse Seq. ripetute raggruppate: sono altamente o mediamente ripetute sono ripetute “in tandem” in certi casi formano i “DNA satellite” sono localizzate in regioni specifiche dei cromosomi: centromeri e telomeri alcune sono codificanti: rDNA, DNA codificante istoni Seq. ripetute disperse: SINE, seq. corte, disperse fra i geni strutturali, LINE, seq. lunghe, disperse fra i geni strutturali SCHEMA DEI TIPI DI SEQUENZE CHE COMPONGONO IL GENOMA NUCLEARE DEI VEGETALI Seq. Codificanti (Geni) Geni ribosomali (rDNA): geni per l’rRNA 5S con spaziatori intergenici geni per gli rRNA 18-5,8-25S con spaz. intergenici SEQUENZE DI DNA RIPETUTE IN TANDEM Seq. Non coficanti istoni tRNA COPIE CON SEQUENZE DEGENERATE Geni strutturali codificano proteine Nelle piante generalmente a basso numero di copie (comprese le sequenze regolatrici e gli introni) SEQUENZE DI DNA RIPETUTE DISPERSE Pseudogeni Telomeri (ripetizione CCCTAAA) Trasposoni a DNA Retrotrasposoni con LTR e non-LTR (LINE, SINE) Microsatelliti (1-5 pb) Minisatelliti (fino a 50 pb) solo-LTR DNA satellite I geni strutturali generalmente sono organizzati in famiglie geniche Es. geni per la zeina di mais si trovano sul cromosoma 7 Zm1 Zm2 Zm3 Zm4 I geni ribosomali sono sequenze ripetute in “tandem” livello di ripetizione ca 103 copie per genoma Zm5 Zm6 SEQUENZE RIPETUTE IN TANDEM Il DNA telomerico motivo 5’ TTTAGGG 3’ ripetuto più volte che viene aggiunto alle estremità cromosomiche dalla telomerasi Ibridazione in situ sulle regioni telomeriche e subtelomeriche Con sequenze radioattive Con sequenze fluorescenti Nothoscordum striatum (Alliaceae) SEQUENZE DI DNA RIPETUTE IN TANDEM Il DNA satellite Minisatelliti Microsatelliti si osserva nei gradienti di densità e presenta monomeri di lunghezza variabile (140-360 pb) che si ritrovano a blocchi fino a 1 Mpb. localizzato nelle regioni centromeriche e subtelomeriche dei cromosomi es. es. (ACAAACTTTA)n ACACACACAC….. (AC)n ACTACTACT… (ACT)n Al massimo 50 nucleotidi ripetuti 10-100 volte 2 nucleotidi ripetuti 10-100 volte uniformemente distribuiti nei cromosomi 3 nucleotidi ripetuti 10-100 volte Sono utilizzati nella genetica forense per le analisi di paternità ecc. 15 microsat + il gene per amelogenina che si trova su cromosoma X e Y ma ha una lunghezza diversa si ha una sicurezza superiore al 97-98% Nella genetica agraria sono utilizzati per es nel riconoscimento varietale come in olivo , vite ecc. Nell’uomo i Micro+ Mini+ DNA satellite formano il 10% del genoma Il DNA satellite alfa del genoma umano E’ formato da una sequenza di 171 pb ripetuta in tandem che si localizza nei centromeri In ogni centromero sono presenti da 5000 a 15000 copie di questa sequenza, le regioni pericentromeriche sono formate da lunghi blocchi di LINE E SINE Sequenza ripetuta in tandem di girasole La sequenza HAG004N15 è formata da 368 bp, sono presenti 7.800 copie per genoma aploide con una localizzazione specifica per ogni cromosoma SEQUENZE DI DNA RIPETUTE DISPERSE GLI PSEUDOGENI A : inattivati pseudogeni generati per duplicazione e poi inattivati da mutazioni Es. locus della beta globina umana Altro esempio i geni per snRNA U1: Ci soni 50-1000 copie funzionanti e 500-100 copie costituite da pseudogeni GLI PSEUDOGENI B: “processati” pseudogeni derivati da mRNA retrotrascritti GLI ELEMENTI TRASPONIBILI Sono sequenze di DNA in grado di “trasporsi” autonomamente da un sito ad un altro nel genoma. • Gli elementi trasponibili sono stati scoperti da B. Mc Clintock in mais negli anni’40 • Nel tempo sono stati individuati in tutti gli Eucarioti (1 eccezione Plsmodium falciparum) • Costituiscono una porzione preponderante del genoma nucleare delle piante (>70% in molti casi) Es: linea B73 di mais solo i Retrotrasposoni costituiscono il 75% del genoma • Elementi trasponibili come DNA spazzatura, DNA egoista e parassita o partners “simbiontici” del genoma vegetale? Barbara Mc Clintock Premio Nobel 1983 I Trasposoni a DNA si spostano con un meccanismo di trasposizione “taglia-incolla” I Retrotrasposoni si spostano con un meccanismo di trasposizione “copia-incolla” Questo processo di trasposizione porta all’ incremento del numero di copie del retrotrasposone e, di conseguenza, della grandezza del genoma. Elementi di classe II (Trasposoni) sottoclasse I • I Trasposoni possiedono sequenze terminali dette TIR (Terminal Inverted Repeats) da poche ad alcune centinaia di basi Per es: ATTGTCCCATAA…………………….TTATGGGACAAT TAACAGGGTATT……………………AATACCCTGTTA • Codificano l’enzima Trasposasi necessario per la trasposizione 5 superfamiglie di trasposoni nelle piante (CACTA, Tc1-Mariner, hAT, Mutator, PIF-Harbinger) MITE: Miniature Inverted repeat Transposable Elements • Sono un gruppo eterogeneo di piccoli elementi NON autonomi, costituiti da poche decine a poche centinaia di basi. • Spesso si trovano vicino ai geni e negli introni, nella 5’ UTR e nella 3’ UTR • In alcune specie sono molto numerosi, per esempio la famiglia Stowaway di riso Trasposoni di Classe II (sottoclasse II): gli Helitron • Non hanno TIRs, presentano TC in 5’e CTRR (R=purina) in 3’ • Codificano proteine iniziatrici della replicazione ed elicasi • Hanno un meccanismo di trasposizione diverso da quello degli altri trasposoni a DNA (rolling-circle) • In mais molti helitron sono non autonomi, contengono al loro interno esoni di geni diversi catturati tramite un meccanismo non ancora del tutto chiarito Elementi di classe I: i Retrotrasposoni • I retrotrasposoni hanno una struttura molto simile ai retrovirus • Si ritiene che i retrovirus si siano originati dai retrotrasposoni in seguito ad acquisizione della mobilità extracellulare I RETROTRASPOSONI con LTR: 2 superfamiglie, Gypsy e Copia Dimensioni: 4000 -15000 pb LTR: long terminal repeats gag: (contiene un gene per una proteina del capside (CP) e un sito di legame per gli acidi nucleici (NA)) pol: (poliproteina con un dominio proteasi (PR), uno retrotrascrittasi (RT), uno RNAsiH, uno integrasi (INT)) PBS: primer binding site PPT: tratto polipurinico HACRE1, un retrotrasposone Copia di girasole che si è inserito recentemente, al max. 87000 anni fa La reazione di trasposizione nella sequenza bersaglio è fonte di mutazioni Retro LTR LTR LTR LTR LTR LTR Si producono duplicazioni dirette di brevi sequenze nella sequenza bersaglio Retrotrasposoni con LTR: autonomi e non autonomi • Retrotrasposoni non-autonomi non hanno la regione interna alle LTR • TRIM (Terminal Repeats In Miniature) LARD (LArge Retrotransposon Derivative) Le famiglie non autonome utilizzino per replicarsi gli enzimi prodotti da quelle autonome SOLO-LTR (singole sequenze LTR) Come si sono formate le solo-LTR: • La ricombinazione tra due LTR di un retrotrasposone porta alla eliminazione della regione codificante e di una LTR • Nel genoma dell’ospite rimane una singola LTR detta solo-LTR • Le solo-LTR sono il segno della presenza di un retrotrasposone che poi è stato eliminato Retrotrasposoni senza LTR: i LINE (Long INterspersed Elements) Dimensioni = 5000-8000 pb Il dominio gag dei LINE codifica anche una endonucleasi (EN) – Il dominio pol contiene una sequenza che codifica per una retrotrascrittasi (RT) e una per l’RNAsiH • struttura simile ai retrotrasposoni con LTR • molto numerosi nei primati e nel topo: la superfamiglia L1 costituisce il 17% di tutto il genoma dell’uomo (In totale le LINE il 22% del genoma) • nelle piante non sono molto frequenti rispetto ai retrotrasposoni con LTR (con l’eccezione di vite e Lilium) Retrotrasposoni senza LTR: i SINE (Short INterspersed Elements) Dimensioni = 100-500 pb Pol IIIA e Pol III B: promotori per l’RNA polimerasi III - (A)n : coda poli-A. • Elementi non autonomi che derivano da trascritti della RNApol III che accidentalmente sono stati retrotrascritti in DNA e inseriti nel genoma. • Nei mammiferi sono molto frequenti (es. la famiglia Alu I nel genoma umano :1,2 x 106 copie . In totale le SINE costituiscono l’11% del genoma umano. Locus della beta globina umana Caratterizzazione del locus LTP di girasole Il gene LTP codifica una Lipid Transfer Protein Ha un solo introne giallo : sequenza codificante viola : introne In girasole è una famiglia multigenica composta da 5 geni, in due geni si sono inseriti Retrotrasposoni Le regioni a monte di ciascun gene LTP contengono sequenze cis-promotrici diverse, indicando che, dopo la duplicazione genica, le varie copie hanno acquisito una specificità di regolazione. LOCALIZZAZIONE DEI RETROTRASPOSONI Associazione alla eterocromatina centromerica in relazione alla funzione del centromero (i Gypsy) Arabidopsis thaliana Helianthus annuus LOCALIZZAZIONE DEI RETROTRASPOSONI I retrotrasposoni possono avere localizzazione dispersa nel genoma oppure raggruppata in particolari regioni cromosomiche (centromeri, regioni subtelomeriche e telomeriche) Locus Adh1 di mais Quando i retrotrasposoni sono raggruppati, risultano spesso inseriti uno dentro l’altro (nested) in un sito cromosomico, soprattutto in specie con genoma grande Distribuzione dei diversi tipi di sequenze lungo un cromosoma (Beta vulgaris) Tandem repeats intercalari Tandem repeats associate al centromero Repeats telomeriche e sub-telomeriche Tandem repeats disperse Microsatelliti e retroelementi dispersi LINEs In bianco i geni e le sequenze in poche o singola copia. In molte specie i retrotrasposoni possono avere anche una localizzazione dispersa ma si trovano preferenzialmente a livello di centromero e di telomero. GLI ELEMENTI GENETICI MOBILI POSSONO MODIFICARE L’ATTIVITA’ DEI GENI L’inserimento di un elemento trasponibile può avvenire all’interno di un gene e/o all’interno di un promotore. Effetti diversi INOLTRE GLI LTR DI REs CONTENGONO SEQUENZE PROMOTRICI CHE POSSONO INFLUENZARE LA REGOLAZIONE DI GENI VICINI I TRASPOSONI DI MAIS DI B. Mc CLINTOCK Ac e Ds possono inserirsi nella sequenza di un gene e inattivarlo Ma in certi momenti dello sviluppo possono “saltare” ripristinandone la funzionalità Un esempio di mutazione dovuta all’inserzione di un elemento trasponibile Mutazione da uva nera a uva bianca GRET1 (GRAPE RETROTRASPOSON 1) è un retrotrasposone Gypsy inseritosi vicino ad un fattore di trascrizione (VvMybA1) fondamentale nella regolazione della biosintesi delle antocianine, inattivandolo. I girasoli mutanti di Van Gogh Il fenotipo crisantemoide è causato dalla inserzione di un trasposone CACTA nel promotore del gene CYCLOIDEA (Ha CyC2c) che codifica un fattore di trascrizione che controlla la formazione dei fiori esterni del capolino L’ inserimento del Trasposone impedisce che il gene venga bloccato così funziona e si formano fiori simili a quelli esterni nel centro del capolino Trasposoni e RNA silencing Poiché i trasposoni sono potenzialmente mutageni, il genoma ospite ha sviluppato efficienti meccanismi epigenetici per controllare (inibire) la loro proliferazione La maggior parte dei trasposoni sono inattivi, metilati e, se trascritti, sono silenziati da siRNA •Silenziamento post trascrizionale tramite RNA silencing •Alterazioni della cromatina mediate da RNA silencing GLI ELEMENTI TRASPONIBILI SONO SILENZIATI TRAMITE RNA SILENCING Nelle regioni eterocromatiche, la trascrizione di RNA che vengono resi a doppio filamento da RNApolRNAdip innesca la produzione dei siRNA. Questi vanno a silenziare il DNA tramite il rimodellamento della cromatina e la metilazione di istoni e di DNA (metilazione del DNA-RNA dipendente) sequenze eterocromatiche MITE e altri Elementi trasponibili se vengono trascritti sono una fonte di RNA a doppio filamento e quindi di siRNA che vanno a silenziare se stessi. FINE EFFETTO DEGLI ELEMENTI GENETICI MOBILI SULLE DIMENSIONI DEL GENOMA Gli elementi retrotrasponibili sono, con la poliploidia, i maggiori responsabili dell’incremento delle dimensioni del genoma che si osserva negli eucarioti Nelle piante questo ruolo è stato svolto soprattutto dai retrotrasposoni con LTR L’espansione del genoma è comunque in equilibrio con altre forze che tendono a contrastarla come la ricombinazione omologa e le delezioni L’espansione del genoma è comunque in equilibrio con altre forze che tendono a contrastarla come la ricombinazione omologa ineguale e le delezioni - Comparazioni di genomi di specie differenti indicano che la poliploidia o (paleopoliploidia), duplicazioni segmentali (anche di bracci di cromosomi) e amplificazioni episodiche di Retrotrasposoni sono responsabili dell’ aumento della grandezza dei genomi -Diminuzione grandezza genomi: Ricombinazione omologa ineguale può comportare la perdita di sequenze di DNA comprese ad es. tra due LTR dello stesso RE o di due RE della stessa famiglia. Ricombinazione illegittima (rottura a doppio fil e riparazione DNA che comporta piccole delezioni) -Angiosperme con grandi genomi (mais) nel corso dell’evoluzione sono andate incontro a duplicazioni geniche, poliploidia ed espansioni di retrotrasposoni. -In gimnosperme del genere Pinus tutte le specie hanno 2n=24 cromosomi, e la grandezza del genoma è dovuta principalmente all’espansione di retrotrasposoni. LE FUNZIONI DELLA COMPONENTE RIPETITIVA DEL GENOMA SONO SOLO IN PARTE CONOSCIUTE Diverse ipotesi ✓ “DNA egoista e parassita (selfish DNA)”: si mantiene nel genoma senza avere alcuna utilità per le cellule. ✓ “DNA spazzatura (junk DNA)”: porzioni di DNA prive di funzione,rappresentano un “ricordo evolutivo” ✓ Costituisce blocchi di DNA che formano il “materiale grezzo” per l’evoluzione di geni funzionali ( ipotesi su Helitrons) e di siti promotori ✓ Funzione strutturale per la cromatina e i cromosomi (centromero, telomeri, origini di replicazione) ✓ Funzione di regolazione dei geni vicini per i Retrotrasposoni tramite il loro promotore