Il completamento del genoma umano Nel 2000, era già stato annunciato il completamento del genoma umano, anche se restavano gaps ed errori. Un ulteriore passo avanti è stato segnato nel numero di Nature di ottobre 2004: metodi predittivi per l’analisi di genomi Un genoma contiene le informazioni per: regioni codificanti per proteine, regioni codificanti perRNA a funzione catalitica (rRNA, tRNA, snRNA, miRNA) regioni di controllo dell’espressione genica, regioni con funzione strutturale (telomeri, centromeri) ed altro ancora sono spesso presenti sequenze ripetute, come quelle derivate da trasposoni o retrovirus nei vertebrati le sequenze ripetute sono spesso preponderanti rispetto alle codificanti Distribuzione di sequenze nel genoma umano Genoma Umano 3200 Mb Geni e sequenze correlate 1200 Mb Geni 48 Mb Sequenze correlate 1152 Mb DNA intergenico 2000 Mb Ripetizioni intersperse 1400 Mb Altre regioni intergeniche 600 Mb Pseudogeni LINE 640 Mb Microsatelliti 90 Mb Frammenti genici SINE 420 Mb Varie 510 Mb Introni, UTR Elementi LTR 250 Mb Trasposoni DNA 90 Mb Il gene della b globina umana TATA box (-25) inizio trascrizione inizio traduzione (Met) sito "donatore" di splicing sito "accettore" di splicing fine traduzione segnale di poliadenilazione fine trascrizione Geni e Genomi Il contenuto di DNA nei vari phila ORF ed introni Elementi di controllo di un promotore di Pol II TATA box Elementi “distali o enhancer” Elementi “prossimali” Elementi “distali o enhancer” Elementi “posizionatori” nel promotore di Pol II 50 kb di genoma a confronto % Famiglie di geni nel genoma umano Fattori trascrizionali in eucarioti Crossing-over disuguale Scambio disuguale tra cromatidi fratelli Ricombinazione replicativa L’origine dei pseudogeni Esoni e domini strutturali Duplicazione di domini proteici Rimescolamento di domini proteici Un esempio di struttura modulare Frammentazione di geni Due tipi di DNA ripetitivo Le ripetizioni intersperse Retrovirus e retroelementi Il trasferimento dei retro-trasposoni Trasposizione degli elementi “Line” Line e Sine Tipi di ripetizione nel genoma umano SINE ALU MIR MIR3 1.558.000 1.090.000 393.000 75.000 Elementi LTR LINE 868.000 LINE-1 516.000 LINE-2 315.000 LINE-3 37.000 Classe I ERV Classe II ERV(K) Classe III ERV(L) MaLR Trasposoni DNA hAT Tc-I PiggyBac N.C. 443.000 112.000 8.000 83.000 240.000 240.000 195.000 75.000 2.000 22.000 I MICROSATELLITI 5’-GAGAGAGAGAGAGAGAGAGAGA-3’ 5’-TATTTATTTATTTATTTATTTATTTATT-3’ 1 base 120.000 2 basi 140.000 3 basi 37.500 4 basi 105.000 5 basi 56.000 6 basi 7 basi 8 basi 9 basi 10 basi 49.000 27.000 35.500 27.500 27.500 Microsatelliti e profilo genico