Applicazioni biotecnologiche in
systems biology
Lezione #6
Dr. Marco Galardini
AA 2012/2013
Gene regulation analysis
Lezione #6
Dr. Marco Galardini
AA 2012/2013
Regolazione genica
Elementi molecolari e di sequenza
Relazione Genotipo - Fenotipo
Quale parte del genotipo è correlabile col fenotipo?
•
•
•
•
Presenza/assenza di geni
Presenza/assenza di un regolatore e/o del motivo di binding
Presenza/assenza di interazione fra proteine
Regolazione non “convenzionale”: asRNA, metilazione, …
Un gene -> un fenotipo
Un genoma -> molti fenotipi
Regolazione genica
Aggiunta di una componente
dinamica al sistema cellulare
• Risposta agli stimoli esterni
• Risparmio di energia
• Espressione al momento giusto
• Assenza di interferenza fra prodotti
proteici
• Espansione delle capacita’
dell’organismo
• Paradosso C-value / G-value
• Negli organismi complessi la
differenza la fa la regolazione
Regolazione genica
La regolazione genica aggiunge
complessita’
• Una possibile spiegazione al paradosso
del G-value
• Un numero alto di geni richiede un
altissimo numero di regolatori
• Scarsa efficienza dell’organismo
A livello molecolare
Regolazione in cis
• L’elemento regolativo e’ prossimo al gene regolato
• Specifiche sequenze di DNA vengono riconosciute dai TF
• Interazione con l’RNA polimerasi
• Attivatori
• Repressori
• Il legame col dna in prossimita’ del gene e’ sufficiente ad alterare l’espressione
del gene
• Legame meno evidente negli eucarioti
• La sequenza riconosciuta dal TF e’ chiamata motivo
A livello molecolare
Domini funzionali
• Separati
• Indipendenti
Domini di legame al DNA e riconoscimento del cognate motif
• Helix-turn-helix, zinc-finger, leucine-zipper
• Gli altri domini della proteina indicano il segnale che viene ricnosciuto dal
regolatore
• Modularita’ dei domini  differente comportamento regolativo
A livello molecolare
Domini di legame al DNA e riconoscimento del cognate motif
• Helix-turn-helix, zinc-finger, leucine-zipper
• Gli altri domini della proteina indicano il segnale che viene ricnosciuto dal
regolatore
• Modularita’ dei domini  differente comportamento regolativo
Individuazione motivi
Come individuare un TF binding
motif?
• Prossimita’ ad un gene
• -400 / +100
• Sequenza piu’ variabile rispetto ad
un gene
• Non si applica la traduzione
• Il legame del TF ha una
componente termodinamica
• Variabilita’ nella forza del
legame
• Regole meno certe
nell’individuazione delle sequenze
Individuazione motivi
Come individuare un TF binding motif?
• Determinazione dei geni regolati
• Esperimenti di analisi della trascrizione (microarray, RNAseq, geni reporter, …)
• Non esiste un metodo per stabilire il motivo a partire dal dominio
• Allineamento sequenze a monte dei geni regolati
• Ricerca motivi conservati
Sequence logo
Contenuto di
informazione
Posizione nel motivo
Come individuare un TF binding motif?
• Descrive un motivo
• Alcune posizioni del motivo sono “fisse”, altre estremamente variabili
• Spesso i domini di legame al DNA sono dimerici e palindromi
Position weigth matrix (PWM)
Position specific scoring matrix (PSWM)
Come individuare un TF binding motif?
• Descrive un motivo
• Indica la frequenza (e quindi la probabilita’) di trovare un certo nucleotide ad ogni
posizione
• Utilizzato per cercare le occorrenze di un motivo all’interno di un genoma
Position weigth matrix (PWM)
Position specific scoring matrix (PSWM)
Ricerca motivo
AGTCAGTCTTGATCAAGATCAAATGC
Bassa similarita’
Ricerca PWM tramite sliding window
• Per ogni posizione nucleotidica verifico la similarita’ con il motivo
• Calcolo di uno score di similarita’ per ogni posizione
• Ottengo uno score per ogni posizione
• Scarsa similarita’: indica il “rumore di fondo” delle mie sequenze target
• Alta similarita’: score significativamente maggiore del rumore di fondo
Ricerca motivo
AGTCAGTCTTGATCAAGATCAAATGC
Alta similarita’
Ricerca PWM tramite sliding window
• Per ogni posizione nucleotidica verifico la similarita’ con il motivo
• Calcolo di uno score di similarita’ per ogni posizione
• Ottengo uno score per ogni posizione
• Scarsa similarita’: indica il “rumore di fondo” delle mie sequenze target
• Alta similarita’: score significativamente maggiore del rumore di fondo
Ricerca motivo
Score
Numero di hit
Ricerca PWM tramite sliding window
• Ottengo uno score per ogni posizione
• Scarsa similarita’: indica il “rumore di fondo” delle mie sequenze target
• Alta similarita’: score significativamente maggiore del rumore di fondo
Contenuto informativo
Differenza fra procarioti ed eucarioti
Contenuto informativo
Differenza fra procarioti ed eucarioti
Contenuto informativo
Che caratteristiche deve avere un motivo per distinguersi dal rumore di
fondo?
• Analisi del contenuto di informazione del motivo e del genoma
• Dipendenza dalla dimensione e contenuto di basi del motivo
• Dipendenza dalla dimensione e contenuto di basi del genoma
Contenuto informativo
Che caratteristiche deve avere un motivo per distinguersi dal rumore di
fondo?
• Batteri: 106 possibili siti di legame
• Eucarioti: 109 possibili siti di legame
Contenuto minimo di informazione di un motivo
Contenuto informativo
Contenuto di informazione di un motivo
Dipendenza dalla frequenza delle varie basi nel genoma
Sostanzialmente dal contenuto in GC
Contenuto informativo
Contenuto informativo
Genoma 1: Alto contenuto in GC
• Alto contenuto informativo
Genoma 2: Basso contenuto in GC
• Basso contenuto informativo
Contenuto minimo di informazione di un dominio
Che caratteristiche deve avere un
motivo per distinguersi dal rumore
di fondo?
• Nei batteri la maggior parte dei motivi
di legame e’ facilmente distinguibile dal
background
• Pochi siti di legame sono necessari
ad assicurare il legame del TF
• Negli eucarioti i motivi non sono
distinguibili dal rumore di fondo
• Molti motivi in cluster sono
necessari a garantire effetti
regolativi
Reti logiche
I sistemi cellulari come “molecular computing machines”
Oppure “molecular lego”
Reti logiche
Requisiti di un sistema regolativo:
1.Stimolo
2.Trasmissione al target
3.Risposta
4.Reset del sistema
Reti logiche
Trasduzione del segnale:
 Un singolo stimolo può indurre una o più risposte
 Una singola risposta può essere controllata da un
singolo segnale o influenzata da molti segnali
 Ciascuna risposta può essere stimolatoria o
inibitoria
 La trasmissione del segnale può smorzare o
amplificare gli stimoli
Reti logiche
Caratteristiche di una rete regolativa:
 Tende ad essere unidirezionale
 Ha un componente logico
 Produce un pattern dinamico
Reti logiche
Representation of a promoter as a logic gate
Hunziker A et al. PNAS 2010;107:12998-13003
Reti logiche
Si possono fare analogie con i circuiti integrati
per quanto riguardo il processamento del
segnale.
Importanti differenze:
• Bassa velocita’ di trasmissione del segnale
• Nei batteri la velocita’ di regolazione e’
proporzionale al tempo di generazione
• Bassa sincronicita’
• Bassa interconnessione
• I regolatori “globali” sono pochi
• Basso numero di nodi
Similarita’
• Proprieta’ ON/OFF del segnale
• Espressione basale (≈1nM)
• Attivazione espressione (≈1μM)
Reti logiche
• La regolazione puo’ essere approssimata come una funzione proporzionale alla
concentrazione del TF e della sua forza di legame al promotore
• Piu’ regolatori possono interagire assieme
• Ognuno risponde al proprio stimolo
• Fattori importanti per determinare l’effetto dell’interazione
• La forza di legame di ciascun regolatore (misurabile tramite cistanti di
dissociazione)
• L’interazione fisica (sterica) fra i regolatori e la RNA polimerasi
• Dipendente dalla distanza reciproca dei siti di legame
• Dipendente dalla distanza dei promotori dalla RNA polimerasi
Reti logiche – Operatori logici
Legame forte
Legame debole
Interazione cooperativa
• Il modo con cui i due regolatori interagiscono fra loro determina il modo con
cui viene processato il segnale ed espresso o meno il gene target
• Il posizionamento relativo dei promotori e’ importante
• Il DNA e’ a doppia elica!
Reti logiche – Operatori logici
• Lo stesso regolatore puo’ agire da
attivatore o repressore
• La differenza sta nella posizione
del motivo
• E l’interazione con altri
regolatori
• Concetti importanti in synthetic
biology
• Possibile costruire un gene che
reagisce a determinati stimoli
sfruttando i regolatori gia’
esistenti
Reti logiche – Operatori logici
• Cascate regolative
• La somma delle varie logiche
determina pattern di
espressione particolari
• Difficolta’ di predizione
• Alta dinamicita’ e modularita’ del
sistema