6.geni e organizzazione genoma File - Progetto e

6. geni e organizzazione del genoma contiene materiale protetto da copyright, ad esclusivo uso personale; non è
consentita diffusione ed utilizzo di tipo commerciale
quan1 geni ci sono in un ba5erio? quan1 nella cellula di un essere umano? come sono organizza1 i geni uno rispe5o all’altro? 1 Figura 5.1 L’Albero della Vita è suddiviso in tre raggruppamen1 principali: Eucario1, Ba5eri e Archeoba5eri. Figura 5.2 Distribuzione delle dimensioni dei genomi di 526 specie di ba5eri. 2 Tabella 5.1 Dimensioni e numero di geni di alcuni genomi procario1ci. Figura 5.3 Distribuzione della composizione in GC% dei genomi di 878 specie di euba5eri e 66 archeoba5eri. 3 Figura 5.5 Gamma delle dimensioni dei genomi virali, procario1ci ed eucario1ci. Paradosso del valore C: 4 NON RIPETITIVE MODERATAMENTE RIPETITIVE RIPETITIVE 5 La percentuale di DNA ripe77vo nei genomi dei singoli organismi varia mol7ssimo: – i procario/ contengono solo DNA non ripe//vo – negli eucario/ inferiori il DNA ripe//vo è 20% – nelle cellule animali, fino a metà del DNA è ripe//vo – nelle piante e negli anfibi il DNA ripe//vo può rappresentare fino all’80% del totale. Come si iden1ficano i geni: Gli esoni sono iden*fica* in base alle ORF e alle sequenze fiancheggian* In una regione contenente un gene la cui funzione è conservata in più specie la sequenza deve : 1. avere Modulo di leMura (ORF) aperto 2. esistere, in altre specie, una sequenza correlata 6 Il numero minimo di geni necessari a un organismo aumenta con la sua complessità Nei baMeri il n dei geni è correlato alla grandezza del genoma 7 Qual’è la funzione dei vari geni? Genoma Drosophila • 2.500 enzimi; • ≈750 fa5ori di trascrizione; • ≈700 proteine con funzione di trasporto oppure canali transmembrana per gli ioni; • ≈700 proteine con funzione di trasduzione del segnale; contenuto del genoma umano • 20-­‐30-­‐40.000 geni ?? • ≈60 % maturato in maniera alterna/va. • proteoma ≈ 50.000-­‐60.000 • 1% esoni Mediamente un gene ≈ 27 Kb 9 esoni 8 In che modo i geni e le altre sequenze geniche sono distribui1 nel genoma? Quan1 1pi di geni diversi esistono? Numero di 1pi di geni = numero di geni unici + numero famiglie geniche 9 Durante l’evoluzione si è avuta l’aggiunta di geni con nuove funzioni 10 Le proteine comuni a tu_ gli eucario1 sono coinvolte in funzioni cellulari essenziali (1300 funzioni comuni) La complessità si associa a funzioni extracellulari o transmembrana é  Complessità eucario/ é  Proteine transmembrana ed extracellulari 11 Quan1 sono i geni essenziali? Nel lievito < del 20 % L’analisi sistema7ca della perdita di funzione condoDa sui geni di C.elegans mostra che solo nel 10 % dei casi si hanno effeI rilevabili sul feno7po Com’è possibile? RIDONDANZA: I geni coinvol/ sono presen/ in copie mul/ple 12 Negli eucario1 geni sono espressi a livelli diversi Il TRASCRITTOMA misura l’insieme degli RNA presen/ e la sua complessità dipende dagli mRNA Per ABBONDANZA di un mRNA si intende il suo numero medio di molecole per cellula mRNA abbondante: gruppo ridoMo di specie di mRNA ma presen/ in grande copia mRNA scarso (mRNA complesso): molte specie di mRNA con poche copie per cellula I geni housekeeping sono quelli espressi (in teoria) in ogni cellula perchè forniscono le funzioni di base necessarie al sostentamento di tub I /pi cellulari I luxury genes invece sono quelli che codificano per funzioni specializzate e sinte/zza/ per lo più in par/colari /pi cellulari Un GENE è un segmento di DNA che codifica per un polipep/de specifico. 13 25% del genoma è cos/tuito da DNA genico, per circa 800 Mbp (30.000 geni x 27 kbp/gene) 75% del genoma cos/tuisce il DNA extragenico (o intergenico) 1,5% del genoma va a formare il DNA codificante per circa 45 Mbp (30.000 geni x 1,5 kbp/gene). 98.5% del genoma umano è composto di sequenze non codifican/. Tali regioni di DNA erano indicate con il termine di junk DNA o DNA spazzatura. 14 I geni eucario1ci sono interro_ • Esoni sequenze presen/ nell’RNA maturo • Introni rimossi dal trascriMo primario 15 Alcune sequenze di DNA In mol/ casi una sequenza di DNA codifica per una sola proteina. Ci sono però casi in cui la stessa sequenza di codificano per più DNA codifica per più di una proteina. proteine Geni sovrappos1 quando un gene è parte di un altro gene. • I due prodo> proteici sono omologhi. Geni sovrappos1 leggendo la sequenza del DNA in due ≠ moduli di leDura (reading frame): 16 Splicing alterna1vo Un singolo /po di trascriMo può essere giuntato (spliced) in maniera alterna/va. In alcuni casi, un esone viene sos7tuito con un altro [ex. varian7 α e β della troponina T] 17 I geni espressi con modalità alterna*ve sono il 15% negli inse>, ma > 50% nell’uomo Come si sono evolu1 i geni interro_? Origine precoce degli introni: 2 teorie Introni sono sempre sta/ parte integrante del gene e persi, nei procario/, durante l’evoluzione Origine tardiva degli introni: Introni si sono inseri/ all’interno delle sequenze codifican/ in un secondo tempo 18 GLI INTRONI OFFRONO DUE VANTAGGI: 1)  generare mol7 trascriI e proteine differen7 a par7re da un unico gene. 2) creare nuovi geni aDraverso il rimescolamento degli esoni (exon shuffling) exon shuffling mediante crossing over illegi_mo 19 Origine di nuove proteine mediante exon shuffling. ex. faMori di coagulazione del sangue famiglie geniche (L, pep/de leader; g, dominio Gla; EGF, dominio EGF-­‐like; K, dominio kringle; pan, dominio Pan; fnI, dominio della fibronec/na di /po I; fnII, dominio della fibronec/na di /po II; P, dominio proteasico). Famiglia di geni: gruppo di geni che codificano per proteine correlate 20 Famiglia di geni GENI DELLE GLOBINE: α e β globine Ex. Topo: -­‐ Introne 2 α globina: 150 bp TOT gene: 850 bp -­‐  Introne 2 β-­‐globina: 585 bp TOT gene: 1382 bp NB variazione nella lunghezza dei geni è molto + grande variazione lunghezza mRNA (α-­‐globina=585 basi, β-­‐globina=620 basi). Famiglia di geni forma ancestrale comune delle proteine legan7 eme separa 2 esoni che in toto codificano la porzione codificata dall’esone centrale nelle globine. 21 Geni omologhi differiscono nella stru5ura: evoluzione del gene dell’ insulina Gene ancestrale PSEUDOGENI possiedono sequenze correlate a geni funzionan1 ma non possono essere trado_ in proteina funzionante 22 PSEUDOGENI non processa7 il gene inabvo è duplicato dal gene funzionale e con/ene la /pica struMura in esoni ed introni. processa7 privi di introni in quanto derivano dalla retrotrasposizione di mRNA (retropseudogeni). Pseudogeni non processa1 : convenzionali ed espressi riconosciu/ a livello di sequenza da: a) presenza di codoni di stop nella regione corrispondente alla porzione codificante del gene funzionale b) presenza di mutazioni ognuna della quali originerebbe una molecola mutante. 23 Derivano da duplicazione genica e accumulo progressivo di mutazioni Pseudogeni processa1: 24 ALCUNE DEFINIZIONI Genoma è l’insieme completo dei geni di un organismo. Pra/camente, è definito dalla sequenza completa del suo DNA TrascriDoma è l’insieme completo dei geni espressi in par/colari condizioni. In pra/ca, è definito dall’insieme delle molecole di mRNA. NB alcuni geni sinte7zzano più di una molecola di mRNA, il trascriDoma di un organismo è più grande del suo genoma (ci sono più specie di mRNA che geni) Proteoma è l’insieme completo delle proteine. NB Le proteine possono funzionare indipendentemente come parte di un complesso mul7proteico. Bisogna conoscere le interazioni proteina-­‐proteina per definire il numero totale di unità funzionali indipenden7. 25 ESERCIZIO Hai due files sul computer, uno la sequenza genomica completa dell’E.Coli (baMerica) e l'altro contenente la sequenza completa di Drosophila melanogaster (moscerino della fruMa). Un nuovo studente in laboratorio ha faMo un errore e rinominato i due files come "A" e " B”. TuMavia, sai che il file A è 1125 kilobyte , mentre il file B è 30,5 megabyte. Senza aprire il file ed esaminare la sequenza, si può prevedere quela file è più probabile che contenga la sequenza genomica per E. coli e quale file con/ene la sequenza genomica di Drosophila ? Spiega. ESERCIZIO Sei in laboratorio ed hai due tubi. Il tubo 1 con/ene il DNA che codifica il genoma di un essere umano e il tubo 2 con/ene il DNA che codifica il genoma di un Archea che vive adiacente a delle sorgen/ idrotermali dove la temperatura media è di 115 ° C. Un nuovo studente in laboratorio perde l'e/cheMa sui tubi. TuMavia un collega chimico è in grado grado di determinare i rappor/ percentuali molari di A e T in ques/ tubi, e trova che il DNA nella proveMa 1 è composto da 59 % A e T , mentre nel DNA nel tubo 2 è composto da 48 % A e T. Quale tubo con/ene il DNA umano e quale il tubo contenente il DNA dell’ Archae ? Spiega. 26 MAPPARE I GENOMI sequenza di una lunga molecola di DNA deve essere ricostruita da una serie di sequenze piu corte. DNA
frammenti
CAATGCCATTA…..
…...GCAGCCAATGC
sequenze
sovrapposizione corretta
MAPPARE I GENOMI Per la costruzione di una qualsiasi mappa sono necessari dei marcatori (ovvero degli elemen/ facilmente riconoscibili) -­‐ gene -­‐ specifica sequenza -­‐ mutazione pun1forme. N.B. Una sequenza ripetuta NON è un buon marcatore genomico in quanto è riscontrabile in pun/ diversi del genoma 27 Metodi per o5enere una mappa genica si dividono in 2 categorie Mappaggio Fisico determinazione della distanza fisica tra i geni (espressa in bp) usando tecniche citogene/che e molecolari. Mappaggio Gene1co ordinamento di geni sui cromosomi in accordo con la frequenza di ricombinazione fra loci iden7fica7 aDraverso marcatori (analisi di linkage) La frequenza di ricombinazione pari a 0,01 (1%) è detta Unità di Mappa Genetica (u.m.g.) o Centimorgan (cM). FR 1% = 1cM 28 Sequenze di DNA come marcatori polimorfismo esistenza di forme diverse varian/ alleliche con frequenza > 1% RFLP (Restric1on Fragment Length Polymorphism) SNP (Single Nucleo1de Polymorphism) RFLP 29 RFLP: Gel di Ele5roforesi Direzione di Migratione I frammenti più grandi migrano più lentamente rispetto a quelli più corti Costruzione di una mappa di restrizione 1. il DNA viene digerito con due diversi enzimi di restrizione separatamente 2. doppia restrizione 3. i frammen/ prodob vengono analizza/ 30 Effe_ di una delezione 31