Lezione01 - Biology

Il dogma centrale della biologia
Aminoacil-tRNA
tRNA
Sintesi proteica
rRNA
mRNA
RBS
ATG AAA TAC
TAA
Trascrizione
Struttura
primaria
Folding
Struttura
terziaria
Struttura secondaria
Il dogma centrale della biologia (rivisto)
Il DNA, avvolto sugli istoni, deve essere reso
accessibile alla polimerasi prima di essere trascritto.
L’mRNA deve essere correttamente modificato (polyA,
CAP) perché sia poi possibile eseguire lo
Splicing, che in tessuti diversi o in momenti diversi può
produrre diverse “varianti” dello steso gene.
La traduzione è un processo “assistito” da molte
proteine che si occupano di proteggere le catene
nascenti.
Solo proteine con la giusta
strutturazione (folding +
modificazioni
post
traduzionali)
sono
funzionanti e non vengono
rimosse.
Ogni proteina è sottoposta
ad un turnover mediato da
apposite strutture cellulari.
Il gene procariotico
Nei procarioti non c’è il nucleo, quindi la
trascrizione e la traduzione possono
avvenire quasi contemporanamente:
questa
caratteristica
influenza
l’
organizzazione del gene procariotico.
Si possono riconoscere 3 regioni importanti:
1. Promotore: regioni a monte delle sequenza codificante su cui si legano fattori di
trascrizione e di repressione e determinano l’arrivo della RNA polimerasi.
2. Regioni non codificanti (UTR): posti a monte (5’) e a valle (3’) del gene, lo delimitano e
contengono i siti di attacco dei ribosomi (RBS) e i segnali per terminare la trascrizione.
3. Regione codificante, dove è contenuta l’informazione per la proteina.
Il gene eucariotico
Diversamente dai procarioti, l’organizzazione di un gene eucariotico è molto più complessa:
1. Esoni: porzioni del gene che contengono la sequenza codificante per la proteina, sono
molto piccoli rispetto al gene intero.
2. Introni: porzioni del gene che interrompono gli esoni e che non contengono
informazioni per la codifica. Costituiscono la maggior parte del gene.
3. TATA box: quattro basi canonioche a cui si lega la RNA polimerasi II e da cui inizia a
svolgere il DNA per trascriverlo.
4. Promotori: regioni a monte delle sequenza codificante a cui si legano i fattori di
trascrizione, che a loro volta chiamano la RNA polimerasi.
5. Enhancers: posti a monte e/o a valle del gene, potenziano/favoriscono l’azione dei
promotori guidando dei particolari ripiegamenti nel DNA.
Trascritto primario e splicing
Lo splicing avviene dopo che un gene è stato trascritto. Il trascritto primario è molto più lungo di
quanto serve perché contiene regioni non codificanti (introni) che vanno rimosse in modo da
mettere insieme quelle codificanti (esoni). Il complesso detto spliceasoma si occupa di questo
processo “taglia e cuci” riconoscendo sequenze specifiche sull’RNA (GT al 5’ e AG al 3’).
Strutture degli RNA
L’RNA, essendo composto da 2 copie di basi complementari come il DNA, non si trova quasi
mai nello stato di singolo filamento ma forma strutture secondarie con funzioni biologiche
basilari.
l’RNA ribosomiale assume una struttura
che guida l’assemblaggio del ribosoma,
chiama a sé le proteine ribosomiali e
costituisce il punto di aggancio per la
formazione del complesso di inizio
traduzione.
l’RNA transfer si struttura a trifoglio e in
base alla struttura assunta viene
riconosciuto da diverse aminoacil-tRNA
sintetasi che guidano la formazione del
legame ad alta energia tra Aminoacido e
RNA, fondamentale per la sintesi
proteica.
Il codice genetico
Si caratterizza come
- UNIVERSALE (…)
- DEGENERATO
- RIDONDANTE
E’ composto da 64 diversi
codoni che codificano i 20
amino acidi.
La tebella accanto mostra
il sistema di decodifica guidato
dal dal ribosoma.
Sono evidenti le
degenerazioni a carico delle
basi 2 e 3 e la ridondanza
complessiva.
Alanine
Ala
A
GC[CATG]
Cysteine
Cys
C
TG[CT]
Aspartic AciD
Asp
D
GA[CT]
Glutamic Acid
Glu
E
GA[AG]
Phenylalanine
Phe
F
TT[CT]
Glycine
Gly
G
GG[CATG]
Histidine
His
H
CA[CT]
Isoleucine
Ile
I
AT[CAT]
Lysine
Lys
K
AA[AG]
Leucine
Leu
L
CT[CATG], TT[AG]
Methionine
Met
M
ATG
AsparagiNe
Asn
N
AA[CT]
Proline
Pro
P
CC[CATG]
Glutamine
Gln
Q
CA[AG]
ARginine
Arg
R
CG[CATG], AG[AG]
Serine
Ser
S
TC[CTAG], AG[CT]
Threonine
Thr
T
AC[CATG]
Valine
Val
V
GT[CATG]
Tryptophan
Trp
W
TGG
TYrosine
Tyr
Y
TA[CT]
-
-
TA[AG], TGA
STOP
Gli amino acidi e il legame peptidico
Agli amino acidi sono composti organici chirali che
presentano almeno un gruppo carbossilico (-COOH) a
funzione acida e un gruppo aminico (-NH2) a funzione
basica.
Le proteine sono composte soltanto da α-amino acidi,
legati tra loro mediante legami amidici detti PEPTIDICI
che si instaurano tra il gruppo α-aminico e il gruppo αcarbossilico.
Ciò che diversifica i vari amino acidi
è la catena laterale legata al
carbonio α, che può conferire
all’amino
acido
caratteristiche
chimico-fisiche diverse.
Classi di amino acidi
Acidi
Polari, non carichi
Strutturali
Basici
Idrofobici
Aromatici
Folding delle proteine
I polimeri di α-amino acidi (le proteine) sono influenzati dalle caratteristiche chimico-fisiche
delle catene laterali e, in base a principi di interazioni deboli di tipo idrofobico o
elettrostatico, si possono ripiegare, fino a raggiungere la minor energia termodinamica.
Questo processo, denominato FOLDING, è alla base del
funzionamento delle proteine, visto che solo se sono
correttamente strutturate esse assumeranno la loro forma e
soprattutto la loro FUNZIONE definitiva.
Importante
La strutturazione delle proteine dipende principalmente
dalla sequenza dei residui che la compongono, oltre che
dall’ambiente in cui si strutturano
Il backbone delle proteine
Il legame peptidico ha delle caratteristiche di doppio legame e costringe i due atomi adiacenti
C=O e N-H a giacere sullo stesso piano.
La rotazione della molecola può avvenire solo intorno al carbonio α, ma non tutti gli angoli
di rotazione sono permessi a causa degli ingombri sterici delle diverse catene laterali e dello
scheletro stesso.
Struttura secondaria delle proteine
Il legame peptidico genera una polarità negli scheletri proteici per cui
si vengono a formare PONTI IDROGENO tra i gruppi amidici e i
gruppi carbonilici di aminoacidi diversi. Queste interazioni deboli
portano la struttura primaria della proteina (la sequenza dei suoi
residui) a ripiegarsi in una STRUTTURA SECONDARIA in cui sono
riconoscibili due formazioni
Alfa elica
Beta-strand
struttura compatta e avvolta in cui i legami
idrogeno sono disposti parallelamente allo
scheletro, stabilizzando aminoacidi vicini tra
loro.
struttura rilassata in cui i ponti idrogeno si
stabiliscono tra catene adiacenti che
possono essere parallele o antiparallele, a
formare i foglietti β
Il plot di Ramachandran
Nel 1963 GN Ramachandran, utilizzando un modello a sfere, gettò
le basi che permisero di interpretare la stereochimica delle proteine.
Egli propose di descrivere gli aminoacidi di una proteina in termini di
angoli torsionali del backbone: queste rotazioni dei vari angoli φ e ψ
non potevano essere arbitrarie, ma dovevano seguire delle logiche
di ingombro sterico delle catene laterali.
Dimostrò quindi che le strutture secondarie avevano tutte un
inquadramento preciso in termini di φ e ψ.
Elica α:
Foglietto β:
Φ
tra - 40° e - 100°
Ψ
tra
Φ
tra - 80° e - 120°
Ψ
tra 120° e
-40° e
-65°
170°
Regioni ordinate e regioni non ordinate
Per ottenere un ripiegamento corretto le varie
strutture secondarie si collegano tra loro
mediante sequenze in cui non ci sono ponti
idrogeno fissi e spesso nemmeno altri tipi di
interazioni intra-molecolari, definiti “random coil”,
o strutture disordinate.
In certe proteine però esistono adattamenti
strutturali specifici che contribuiscono in modo
decisivo alla strutturazione delle proteina e
quindi alla sua funzione definitiva: sono i
cosiddetti “loop” e sono stati classificati in base
al tipo di struttura secondaria che congiungono
in
alpha-alpha,
alpha-beta,
beta-beta links e beta-hairpins.
beta-alpha,
http://www.bmm.icnet.uk/loop/index.html
Strutturazioni successive
Congiungendosi, le strutture secondarie formano motivi comuni e conservati che
prendono il nome di strutture supersecondarie, dette anche MOTIVI. Tali strutture si
organizzano poi a dare le vere strutture terziarie e quaste, assemblandosi, formano le
strutture quaternarie.
β-turn-β
up-down
greca
jelly-roll
α-turn-α
super-barrel
coiled-coil
β-α-β
fold di
Rossmann
four helix
bundle
Esempi di strutture terziarie
Dominio singolo
Dominio triplo
Dominio doppio
Dominio quadruplo
Strutture quaternarie e simmetrie
Targeting delle proteine
Denaturazione del DNA: la temperatura di melting
3’-tacgacactacgactacagacgaatactacgacatacagacgactag-5’
5’-atgctgtgatgctgatgtctgcttatgatgctgtatgtctgctgatc-3’
c = 13
g = 8
a = 20
t = 7
tot = 48
tot GC = 21 (44.75%)
tot AT = 27 (56.25 %)
Tm = 74.11
Se scaldo una soluzione contenente una
molecola di DNA come quella scritta sopra
fino a 75 °C, metà dei doppi filamenti saranno
aperti. Usando il calore per svolgere il DNA
simulo l’azione delle elicasi e delle
topoisomerasi.
Tm°C = 2 × AT + 4 × GC
Tm°C = 69.3 + (0.41*GC%) – (650/N)
Alcune formule per
calcolare la Tm
I primers - inneschi 3’-OH
Supponiamo di voler amplificare un tratto di DNA con questa sequenza
3’-tacgacactacgactacagacgaatactacgacatacagacgactagtacgacatacagacgactag-5’
5’-atgctgtgatgctgatgtctgcttatgatgctgtatgtctgctgatcatgctgtatgtctgctgatc-3’
Devo creare due sequenze che si “fronteggiano” e che:
1. si leghino allo stampo (quindi devono essere complementari al DNA da copiare)
2. forniscano un 3’-OH libero nella direzione di interesse.
3’-tacgacactacgactacagacgaatactacgacatacagacgactagtacgacatacagacgactag-5’
||||||||||||||
5’-atgctgtgatgctg-3’
chiamiamolo primer diretto
chiamiamolo primer inverso
3’-tacagacgactag-5’
|||||||||||||
5’-atgctgtgatgctgatgtctgcttatgatgctgtatgtctgctgatcatgctgtatgtctgctgatc-3’
Per “disegnare” dei primers bisogna conoscere la sequenza che si vuole amplificare, e per
far questo si guardano le banche dati di DNA, cioè collezioni tratti di DNA ottenuti per
esempio dai sequenziamenti genomici.
Ottenuta la sequenza si procede alla produzione (oggi si acquistano) degli stessi.
Per ogni primer che si disegna bisogna calcolare la temperatura di melting (quindi sapere
lunghezza e composizione in basi): primer diretto e inverso infatti devono avere Tm molto
simili!
Enzimi di restrizione
Esistono tre tipi di enzimi di restrizione:
Tipo I. Riconoscono una sequenza specifica ma tagliano lontano da essa.
Tipo II. Riconoscono una sequenza specifica, spesso palindromica, e tagliano al suo interno.
Tipo III: Proprietà intermedie.
Gli enzimi di tipo II sono i più
usati.
Ne sono stati caratteizzati circa
1000 e sono commercialmente
disponibili.
La nomenclatura si basa su:
EcoRI
EcoRV
Organismo
HindIII
Ordine di
Codice
scoperta
aggiuntivo
Il clonaggio di frammenti di DNA
Il clonaggio di un gene di interesse
rappresenta oggi la tecnica di routine sia
per il suo sequenziamento sia per lo studio
delle sue funzioni.
Gli step da seguire sono:
0. Ottenimento del DNA
1. Taglio del DNA con ER.
2. Taglio di un plasmide con ER.
3. Incubazione dei due tagliati.
4. Aggiunta di ligasi
5. Inserimento in batteri
Se il sito di clonaggio si trova all’interno di una
sequenza codificante (es. il gene LacZ),
l’inserimento del gene provoca la perdita di quella
funzione.
LacZ è in grado, se c’è, di reagire con un composto
aggiunto nel terreno e dare colorazione blu.
=> Posso riconoscere i batteri con inserto.
Librerie di DNA
Sono collezioni di frammenti di DNA ottenute per esempio dalla digestione con un enzima di
restrizione di un intero genoma (librerie genomiche): se taglio anche il plasmide con lo stesso
enzima, i frammenti e il plasmide si richiuderanno uno sull’altro. I plasmidi possono poi essere
introdotti nei batteri e fatti moltiplicare.
Possono essere anche create librerie di cDNA: in questo modo nella libreria avrò i geni già
maturati, quindi più piccoli e più gestibili.
Sequenziamento del DNA
La possibilità di sequenziare il DNA è stata, una delle principali rivoluzioni per l’ingegneria
genetica: fino ad allora si era solo in grado di lavorare sui caratteri fenotipici dei geni, non
avendo modo di conoscere la loro seqerunza.
La tecnica oggi utilizzata, detta “ad interruzione di catena” fu introdotta nel 1975 da Frederick
Sanger e sfrutta la capacità della DNA polimerasi di polimerizzare nucleotidi su DNA
stampo ma solo se presente un gruppo 3’OH libero. Fondamentali sono dei nucleotidi
modificati detti di-deossi:
- nel ribosio i carboni 2 e 3 portano dei gruppi OH
- nel desosiribosio il gruppo OH in posizione 2 è assente
- del didesossiribosio anche il groppo 3-OH è rimosso
=> un dideossi-nucleotide inserito dalla polimerasi impedisce
l’allungamento della catena
ribosio
desossiribosio
didesossiribosio
DNA Microarray
E’ una tecnica relativamente nuova che permette il monitoraggio dell’espressione genica di
tutti i geni di un genoma in un singolo esperimento.
Sintesi in situ di sonde
La fotolitografia permette la costruzione di array con alto contenuto di informazione
permettendo di avere 500,000 probe in uno spazio di 1.28 cm2. Ogni singolo probe è
costituito da milioni di oligonucleotidi identici, e un singolo array di 1.28 cm2 contiene probe
set per circa 40,000 geni umani.