ANALISI GENOMICA DEL CROMOSOMA 21 UMANO Metodologia: 518 cloni in BAC (Bacterial Artificial Chromosome), ognuno circa 50 – 70 kb Ordinati in 5 grandi contigs mediante confronto fra sequenze terminali e sovrapposizione di STS Controllata mediante FISH la posizione dei contigs lungo il cromosoma I singoli cloni sono stati controllati almeno 5 volte Manca 0.3% della sequenza perché non sono stati completati i “buchi” fra i contigs non sovrapposti. Dimensioni: 33.8 Mb di DNA, 1% del genoma, 281 kb nel braccio corto (21p) 225 geni nel braccio lungo (21q) + uno soltanto nel braccio corto 21p (fosfatasi serinica a funzione ignota e non essenziale; il braccio corto può essere deleto senza conseguenze fenotipiche). Catalogo dei tipi di sequenze A.- 225 Sequenze Geniche: ORF, open reading frame, [CpG islands, promotore, AUG, mancanza di codici di stop per almeno 150 bp, sequenza AATAAA per la coda di polyA] 127 già descritte, 10 kinasi, 5 proteine di adesione, fattori di trascrizione, recettori e canali di membrana 13 riconoscibili, ma nuove, simili a proteine già descritte nell’uomo o in altri eucarioti 17 nuove, ma con esoni noti, codificanti per moduli proteici noti 68 anonime, completamente nuove, non somiglianti a nessun gene già descritto, ma contenenti EST e quindi sicuramente espresse 59 pseudogeni, non esprimibili, alcuni derivati dai precedenti geni, in regioni ricche di ALU B.- Sequenze ripetute intersperse: 13% di LINE, long interspersed nuclear elements, ripetizioni di 1000 – 800 bp 9.5% di SINE, short interspersed nuclear elements, ripetizioni di 200 – 300 bp, (ALU) 6% di VNTR [variable number tandem repeats], mini e micro satellite C.- Sequenze non geniche e non ripetute, attorno a 55%. Significati genetici dell’analisi delle sequenze. A.- dimensione dei geni: 1 gene di 840 kb, 22 geni > 100 kb. 23 geni più grandi occupano 3320 kb Dimensione media di 39 kb. [127 noti di 57 kb, 98 nuovi di 27 kb] Spazio genico 26% su 33,8 mb del chrom. 21: 39 kb per gene x 225 geni = 8775 kb. Spazio medio codificante e di segnale per gene: 1,7 kb su 39 kb= 4,4%: esone/introne=1/30 B.- densità genica, circa metà di quella degli altri cromosomi (ad es., chrom 22) Geni concentrati nelle porzioni mediane del braccio lungo, scarsi nei centromeri e telomeri Più densi nella metà telomerica (167 geni) che nella metà centromerica (58 geni) 10 mb della regione centromerica contengono soltanto 7 geni C.- variabilità intraspecie. Analizzati 22 genomi umani diversi nelle stesse 1,36 mb di sequenza. Una differenza (point mutation) ogni circa 800 nucleotidi. 1/500 nelle porzioni centromeriche e telomeriche, 1/1000 nelle regioni intermedie con tanti geni Una delezione o inserzione puntiforme ogni 4000 bp I diversi esseri umani, indipendentemente dalla “razza”, differiscono fra loro solo di 0,1% Identificati punti di rottura per traslocazioni cromosomiche nelle regioni peri-centromeriche. D.- eventi di ricombinazione: confronto fra la mappa genetica (distanza in uM) e quella fisica (bp) Maggiore densità di crossing over nei centromeri nelle donne e nei telomeri nei maschi E.- Evoluzione cromosomica: confronto con il chrom. 22: uguale lunghezza, 1% del genoma, 546 geni, Mini e microsatelliti con ripetizioni identiche nelle regioni centromeriche dei due cromosomi Probabile origine evolutiva comune (#21 e #22) per duplicazione di un cromosoma ancestrale. Confronto con i cromosomi del topo: origine comune con i cromosomi murini 16, 17 ed in parte 10. F.- Geni – malattia: 1.- Down, dosaggio genico triploide per il braccio lungo, geni a dosaggio critico ( fattori di trascrizione, morfogeni, proteine di adesione importanti per lo sviluppo). 2.- Alzheimer precoce famigliare. Geni senilina1 e senilina 2; precursore del β amiloide 3.- Leucemie e tumori solidi: geni oncosopressori e oncogeni coinvolti in traslocazioni.