c). Chimica del DNA
i). Forze che influenzano la stabilità della doppia elica del
DNA
•interazioni idrofobiche - stabilizzano
dentro idrofobiche e fuori idrofiliche
relativamente deboli ma aggiuntive forze di Van de
Waals
• legami idrofobi – stabilizzano
• legami idrogeno - stabilizzano
relativamente deboli ma aggiungono e facilitano
impilamento
• interazioni elettrostatiche - destabilizzano
contribuiti primariamente dai fosfati (negativi)
interessano interazioni intrafilamento e interfilamento
repulsione può essere neutralizzata da cariche positive
(es, ioni Na+ o proteine cariche positivamente)
1
3’
Fosfati idrofilici
Fosfati idrofobici
5’
3’
5’
Regione del
core idrofobica
2
Cariche repulsione
Interactions Sovrapposte
Cariche di repulsione
3
• Le nucleasi idrolizzano i legami fosfodiesterei
Esonucleasi tagliano i
nucleotidi terminali
5’
3’
es, esonucleasi proofreading
Endonucleasi tagliano interna
mente e possono tagliare su
entrambi i lati del fosfato
lasciando estremità 5’ fosfato
o 3’ fosfato in dipendenza della particolare endonucleasi.
es, endonucleasi restrizione
3’
5’
4
5
ii). Denaturazione del DNA
DNA a doppio-filamento
pH estremi o
alte temperature
Separazione dei
filamenti e
formazione di un
singolo-filamento
avvolto a caso
Regioni ricche A-T
denaturano prima
Svolgimento cooperativo
dei filamenti del DNA
6
Percento di ipercromicità
• curva di melting del DNA
100
50
0
50
70
90
Temperature oC
• Tm è la temperatura al punto-medio della transizione
7
Micrografia elettronica di DNA parzialmente fuso
DNA a doppio-filamento,
ricco in G-C che non è ancora
fuso
Regioni di DNA ricche
A-T fondono (si separano)
in una bolla a singolofilamento
• regioni ricche in
ricche in G-C
A-T fondono prima, seguite da regioni
8
Assorbanza
• Ipercromicità
Singolo-filamento
Doppio-filamento
220
260
300
L’assorbanza a 260 nm di una soluzione di DNA aumenta
quando la doppia elica è separata in singoli filamenti.
9
Percent o ipercromicità
• Tm è dipendente dal contenuto in G-C del DNA
DNA di E. coli,
che ha 50% G-C,
ha una Tm di 69 o C.
50
60
70
80
Temperature oC
•Composizione media di basi (conteuto G-C) può
essere determinata dalla temperatura melting DNA
10
11
12
a). Complessità del DNA cromosomico
DNA riassociazione (rinaturazione)
DNA a doppio-filamento
Denaturazione,
DNA a
singolo-filamento
k2
Lenta, processo di
secondo-ordine a
velocità limitante,
per trovare sequenze di
basi complementari
Più veloce,
reazione
“zippering” per
formare lunghe
molecole di
DNA a doppio
filamento
13
Cinetiche di riassociazione di DNA (per una singola specie di DNA
Cot1/2 = 1 / k2 k2 = constante di velocità di secondo-ordine
Co =concentrazione di DNA
t1/2 = tempo di metà reazione
log Cot
% DNA riassociato
0
A metà della reazione
(cioè a t ½) il 50% è
riassociato Questo
punto è il Cot al t ½
cioè quelle condizioni
che danno metà della
totale rinaturazione
50
100
Cot1/2
Ideale curva (curva Cot) di riassociazione di DNA di secondo-ordin
14
10,000
1
k2 >>>>>>>>>> k2
15
Complessità espressa come coppie di basi (bp)
100
1
101
102
103
2
104
105
106
3
107
108
109
4
1010
5
Cot1/2
10-6 10-5 10-4 10-3 10-2 10-1 100
Cot
101
102
1 = poly(dT)-poly(dA)
2 = DNA satellite umano purificato
3 = DNA batteriofago T4
4 = DNA genomico di E. coli
5 = DNA umano a singola-copia purificato
103
104
C’è una relazione
diretta tra Cot1/2
e la complessità
Tipo di DNA
% of Genoma
Include la maggior parte dei geni 1
Singola-copia (unica)
Disseminato attraverso il genoma tra e
entro i geni; include sequenze Alu 2
e VNTRs o mini (micro) satelliti
Ripetitivo (intersparso)
Satellite (tandem)
0
Caratteristiche
Altamente ripetuto, sequenze a bassa complessità
di solito localizzate nei centromeri e telomeri
veloce
2
intermedio
50
lento (singola-copia)
100
1 Alcuni
I
I
I
I
I
I
I
I
I
Le sequenze Alu sono
circa 300 bp in lunghezza
e sono ripetute circa
300,000 volte nel
genoma. Esse possono
trovarsi negli introni, adiacenti
entro i geni, o in regioni
non tradotte.
geni sono ripetuti da poche a migliaia di volte e così sono presenti nella
17
frazione di DNA ripetitivo
Cinetiche di riassociazione di DNA da una miscela di specie di DNA
k2= constante di velocità di secondo-ordine
Co = concentrazione DNA
t1/2 = tempo di metà reazione
Cot1/2 = 1 / k2
% DNA riassociato
0
50
100
Frazioni cinetiche :
veloce
intermedia
lenta
veloce (ripetute)
intermedia
(ripetute)
Cot1/2
Cot1/2
lenta (singola-copia)
Cot1/2
I
I
I
I
I
I
log Cot
I
I
I
DNA genomico umano
18
Classi di DNA ripetitivo
Ripetizioni Intersparse (disperse) (e.g., Alu sequences)
GCTGAGG
GCTGAGG
GCTGAGG
Ripetizioni Tandem (e.g., microsatelliti)
TTAGGGTTAGGGTTAGGGTTAGGG
19
Proprietà del genoma umano
Nucleare
• il genoma umano aploide ha ~3 X 109 bp di DNA
• DNA a singola-copia comprende ~75% del genoma umano
• il genoma umano contiene ~30,000 a 40,000 geni
• la maggior parte dei geni sono a singola-copia nel genoma ap
• i geni sono composti da 1 a >75 esoni
• i geni variano in lunghezza da <100 a >2,300,000 bp
• le sequenze Alu sono presenti attraverso il genoma
Mitocondriale
•genoma circolare di ~17,000 bp
• contiene <40 geni
20
b). Struttura del Gene
promoter
region
esoni (regioni nel box riempite e nonriempite)
+1
introni (tra gli esoni)
regioni tradotte
mRNA structure
5’
3’
regione tradotta
21
(esone-introne-esone)n struttura di diversi geni
istone
totale = 400 bp; 1 solo esone = 400 bp
b-globina
totale = 1,660 bp; 3 esoni = 990 bp; 2 introni
HGPRT (HPRT)
ipoxantina-guanina
totale = 42,830 bp; 9 esoni = 1263 bp
factor VIII
totale = ~186,000 bp; molti esoni = ~9,000 bp
22
Familial hypercholesterolemia
• autosomal dominant
• LDL receptor deficiency
23
Gene del recettore LDL
Ripetizioni Alu presenti entro gli introni
4
5 6
Ripetizioni Alu in esoni
crossing over ineguale
4
Alu
5
Alu
6
X
4
Alu
4
5
Alu
Alu
6
6
1 prodotto ha un esone 5 deleto
(l’altro prodotto non è mostrato)
24
25
Struttura genoma umano
Si divide in:
1,5% quello
25% GENICO
che esprime
23,5% introni e pseudogeni
50% sequenze
ripetute
75% INTRAGENICO
25% DNA
spaziatore
Sequenza di nucleotidi
simile a un gene ma non
in grado di produrre
proteine funzionali
45% ripetizioni
intersperse
5% Segmenti
Duplicati
26
Nel genoma umano le sequenze ripetute costituiscono almeno il 50% del totale
e sono suddivise in 5 classi:
• sequenze ripetute derivate da trasposoni (intersperse)
• copie inattive di geni
• ripetizioni di sequenze semplici (minisatelliti e microsatelliti): (A)n, (CA)n,
(CGG)n
• duplicazioni segmentali
• sequenze ripetute in tandem (centromeri, telomeri, cluster ribosomali)
Il 45% delle ripetizioni intersperse è dato da trasposoni e retrotrasposoni. I trasposoni
sono elementi ripetuti in grado di muoversi nel genoma, costituiti tra le 80 e le 3.000
paia di basi Le differenze tra queste due classi risiedono nella differente modalità di
inserimento della molecola di DNA: il trasposone copia gli elementi direttamente in
DNA,il retrotrasposone utilizza come intermedio una molecola di RNA convertendola in
DNA (questo processo, cioè il passaggio da una molecola di RNA ad una di DNA, nel
1975 non sembrava possibile).
I RETROTRASPOSONI si dividono in
•NON VIRALI
LINE S(Long Interdispersed Elements (6-7 kb)
SINES ( Short Interdispersed Elements (300-400 bp) ES. Alu
•VIRALI
RIPETIZIONI LTR (Long Terminal Repeats)
Le ripetizioni LTR dei retroasposoni virali sono sequenze ripetute che permettono lo
spostamento della molecola di DNA mobile, e rappresentano le porzioni terminali sia
destra che sinistra della molecola.
27
28
29
30
31
32