Applicazioni biotecnologiche in systems biology Lezione #6 Dr. Marco Galardini AA 2012/2013 Gene regulation analysis Lezione #6 Dr. Marco Galardini AA 2012/2013 Regolazione genica Elementi molecolari e di sequenza Relazione Genotipo - Fenotipo Quale parte del genotipo è correlabile col fenotipo? • • • • Presenza/assenza di geni Presenza/assenza di un regolatore e/o del motivo di binding Presenza/assenza di interazione fra proteine Regolazione non “convenzionale”: asRNA, metilazione, … Un gene -> un fenotipo Un genoma -> molti fenotipi Regolazione genica Aggiunta di una componente dinamica al sistema cellulare • Risposta agli stimoli esterni • Risparmio di energia • Espressione al momento giusto • Assenza di interferenza fra prodotti proteici • Espansione delle capacita’ dell’organismo • Paradosso C-value / G-value • Negli organismi complessi la differenza la fa la regolazione Regolazione genica La regolazione genica aggiunge complessita’ • Una possibile spiegazione al paradosso del G-value • Un numero alto di geni richiede un altissimo numero di regolatori • Scarsa efficienza dell’organismo A livello molecolare Regolazione in cis • L’elemento regolativo e’ prossimo al gene regolato • Specifiche sequenze di DNA vengono riconosciute dai TF • Interazione con l’RNA polimerasi • Attivatori • Repressori • Il legame col dna in prossimita’ del gene e’ sufficiente ad alterare l’espressione del gene • Legame meno evidente negli eucarioti • La sequenza riconosciuta dal TF e’ chiamata motivo A livello molecolare Domini funzionali • Separati • Indipendenti Domini di legame al DNA e riconoscimento del cognate motif • Helix-turn-helix, zinc-finger, leucine-zipper • Gli altri domini della proteina indicano il segnale che viene ricnosciuto dal regolatore • Modularita’ dei domini differente comportamento regolativo A livello molecolare Domini di legame al DNA e riconoscimento del cognate motif • Helix-turn-helix, zinc-finger, leucine-zipper • Gli altri domini della proteina indicano il segnale che viene ricnosciuto dal regolatore • Modularita’ dei domini differente comportamento regolativo Individuazione motivi Come individuare un TF binding motif? • Prossimita’ ad un gene • -400 / +100 • Sequenza piu’ variabile rispetto ad un gene • Non si applica la traduzione • Il legame del TF ha una componente termodinamica • Variabilita’ nella forza del legame • Regole meno certe nell’individuazione delle sequenze Individuazione motivi Come individuare un TF binding motif? • Determinazione dei geni regolati • Esperimenti di analisi della trascrizione (microarray, RNAseq, geni reporter, …) • Non esiste un metodo per stabilire il motivo a partire dal dominio • Allineamento sequenze a monte dei geni regolati • Ricerca motivi conservati Sequence logo Contenuto di informazione Posizione nel motivo Come individuare un TF binding motif? • Descrive un motivo • Alcune posizioni del motivo sono “fisse”, altre estremamente variabili • Spesso i domini di legame al DNA sono dimerici e palindromi Position weigth matrix (PWM) Position specific scoring matrix (PSWM) Come individuare un TF binding motif? • Descrive un motivo • Indica la frequenza (e quindi la probabilita’) di trovare un certo nucleotide ad ogni posizione • Utilizzato per cercare le occorrenze di un motivo all’interno di un genoma Position weigth matrix (PWM) Position specific scoring matrix (PSWM) Ricerca motivo AGTCAGTCTTGATCAAGATCAAATGC Bassa similarita’ Ricerca PWM tramite sliding window • Per ogni posizione nucleotidica verifico la similarita’ con il motivo • Calcolo di uno score di similarita’ per ogni posizione • Ottengo uno score per ogni posizione • Scarsa similarita’: indica il “rumore di fondo” delle mie sequenze target • Alta similarita’: score significativamente maggiore del rumore di fondo Ricerca motivo AGTCAGTCTTGATCAAGATCAAATGC Alta similarita’ Ricerca PWM tramite sliding window • Per ogni posizione nucleotidica verifico la similarita’ con il motivo • Calcolo di uno score di similarita’ per ogni posizione • Ottengo uno score per ogni posizione • Scarsa similarita’: indica il “rumore di fondo” delle mie sequenze target • Alta similarita’: score significativamente maggiore del rumore di fondo Ricerca motivo Score Numero di hit Ricerca PWM tramite sliding window • Ottengo uno score per ogni posizione • Scarsa similarita’: indica il “rumore di fondo” delle mie sequenze target • Alta similarita’: score significativamente maggiore del rumore di fondo Contenuto informativo Differenza fra procarioti ed eucarioti Contenuto informativo Differenza fra procarioti ed eucarioti Contenuto informativo Che caratteristiche deve avere un motivo per distinguersi dal rumore di fondo? • Analisi del contenuto di informazione del motivo e del genoma • Dipendenza dalla dimensione e contenuto di basi del motivo • Dipendenza dalla dimensione e contenuto di basi del genoma Contenuto informativo Che caratteristiche deve avere un motivo per distinguersi dal rumore di fondo? • Batteri: 106 possibili siti di legame • Eucarioti: 109 possibili siti di legame Contenuto minimo di informazione di un motivo Contenuto informativo Contenuto di informazione di un motivo Dipendenza dalla frequenza delle varie basi nel genoma Sostanzialmente dal contenuto in GC Contenuto informativo Contenuto informativo Genoma 1: Alto contenuto in GC • Alto contenuto informativo Genoma 2: Basso contenuto in GC • Basso contenuto informativo Contenuto minimo di informazione di un dominio Che caratteristiche deve avere un motivo per distinguersi dal rumore di fondo? • Nei batteri la maggior parte dei motivi di legame e’ facilmente distinguibile dal background • Pochi siti di legame sono necessari ad assicurare il legame del TF • Negli eucarioti i motivi non sono distinguibili dal rumore di fondo • Molti motivi in cluster sono necessari a garantire effetti regolativi Reti logiche I sistemi cellulari come “molecular computing machines” Oppure “molecular lego” Reti logiche Requisiti di un sistema regolativo: 1.Stimolo 2.Trasmissione al target 3.Risposta 4.Reset del sistema Reti logiche Trasduzione del segnale: Un singolo stimolo può indurre una o più risposte Una singola risposta può essere controllata da un singolo segnale o influenzata da molti segnali Ciascuna risposta può essere stimolatoria o inibitoria La trasmissione del segnale può smorzare o amplificare gli stimoli Reti logiche Caratteristiche di una rete regolativa: Tende ad essere unidirezionale Ha un componente logico Produce un pattern dinamico Reti logiche Representation of a promoter as a logic gate Hunziker A et al. PNAS 2010;107:12998-13003 Reti logiche Si possono fare analogie con i circuiti integrati per quanto riguardo il processamento del segnale. Importanti differenze: • Bassa velocita’ di trasmissione del segnale • Nei batteri la velocita’ di regolazione e’ proporzionale al tempo di generazione • Bassa sincronicita’ • Bassa interconnessione • I regolatori “globali” sono pochi • Basso numero di nodi Similarita’ • Proprieta’ ON/OFF del segnale • Espressione basale (≈1nM) • Attivazione espressione (≈1μM) Reti logiche • La regolazione puo’ essere approssimata come una funzione proporzionale alla concentrazione del TF e della sua forza di legame al promotore • Piu’ regolatori possono interagire assieme • Ognuno risponde al proprio stimolo • Fattori importanti per determinare l’effetto dell’interazione • La forza di legame di ciascun regolatore (misurabile tramite cistanti di dissociazione) • L’interazione fisica (sterica) fra i regolatori e la RNA polimerasi • Dipendente dalla distanza reciproca dei siti di legame • Dipendente dalla distanza dei promotori dalla RNA polimerasi Reti logiche – Operatori logici Legame forte Legame debole Interazione cooperativa • Il modo con cui i due regolatori interagiscono fra loro determina il modo con cui viene processato il segnale ed espresso o meno il gene target • Il posizionamento relativo dei promotori e’ importante • Il DNA e’ a doppia elica! Reti logiche – Operatori logici • Lo stesso regolatore puo’ agire da attivatore o repressore • La differenza sta nella posizione del motivo • E l’interazione con altri regolatori • Concetti importanti in synthetic biology • Possibile costruire un gene che reagisce a determinati stimoli sfruttando i regolatori gia’ esistenti Reti logiche – Operatori logici • Cascate regolative • La somma delle varie logiche determina pattern di espressione particolari • Difficolta’ di predizione • Alta dinamicita’ e modularita’ del sistema