Caccia al gene della Fibrosi Cistica Scenario e simulazione di consulenza genetica Siete un genetista medico e lavorate in un consultorio genetico. Si presenta da voi una coppia che richiede consulenza genetica. In base al racconto della storia familiare, costruite il pedigree della famiglia e impostate l’analisi del DNA da richiedere al laboratorio per rispondere alle domande poste dalla coppia. In consultorio si presenta una giovane coppia (Davide e Sofia). Hanno 2 figli, Pietro di 6 anni sano, e Maria, di 4 anni, che soffre spesso di tosse, raffreddore e infezioni polmonari. Sofia racconta che una sua sorella maggiore è morta giovane di fibrosi cistica (FC), mentre nella famiglia di Davide non ci sono casi di malattia. Sofia è in attesa di un terzo figlio (è alla fine della sesta settimana di gravidanza) e vorrebbe informazioni sul rischio di avere un figlio affettto da FC. Viene suggerito alla coppia di sottoporre Maria al test del sudore per stabilire il livello di ioni Na+ e Cl-, un test semplice di valore diagnostico per la FC, e di ritornare con i risultati delle analisi. Con i dati a vostra disposizione in questo momento costruite l’albero genealogico di questa famiglia e rispondete alle seguenti domande: • • • • quale è il rischio che Sofia sia portatrice di FC? quale è il rischio che Davide sia portatore di FC? quale è il rischio che il nascituro sia affetto da FC? che probabilità ha il nascituro di essere sano? Di essere portatore? Il test del sudore conferma la diagnosi di fibrosi cistica (livello di Na+ di 87 nmol/l, molto superiore al valore normale di 60 nmol/l). In base a questa nuova informazione, rispondete nuovamente alle domande: • • • • quale è il rischio che Sofia sia portatrice di FC? quale è il rischio che Davide sia portatore di FC? quale è il rischio che il nascituro sia affetto da FC? che probabilità ha il nascituro di essere sano? Di essere portatore? 1 La FC è sempre causata da mutazioni del gene CFTR sul cromosoma 7. La malattia è recessiva e quindi se Maria è malata, devono essere mutate entrambe le copie del suo gene CFTR. NB: Le due mutazioni possono essere uguali o diverse. A questo punto il genetista suggerisce di accertare, mediante analisi del DNA, quali sono le mutazioni presenti in Maria e nei suoi genitori. Sofia deve inoltre sottoporsi ad amniocentesi, per determinare, attraverso l’analisi del DNA, il genotipo del nascituro. In prima battuta per la diagnosi genetica di fibrosi cistica si usano le tecniche che ricercano le mutazioni più frequenti del gene CFTR (vedi tabella). Soluzioni di DNA, estratto dalle cellule del paziente, sono messe su un filtro in punti definiti (dots) e, una volta denaturate, sono ibridizzate con sonde specifiche per le mutazioni frequenti, opportunamente marcate. Dopo lavaggio, per eliminare la sonda in eccesso non legata, si procede alla rilevazione per identificare quale delle sonde si è ibridata con il DNA in esame. Mutazione p.F508del p.Gly551Asp p.Gly542X c.621+1G>T c.1898+1G>A esone 10 11 11 Introne 4 Introne 12 % 81,0 3,5 1,1 1,0 0,9 Tab.1 Mutazioni più frequenti nel gene CFTR; p e c indicano rispettivamente che la mutazione è descritta nella proteina o nel cDNA; > significa “cambia in”, X significa un codone di stop; +1 significa che è coinvolto il primo nucleotide dell’introne successivo all’esone che termina con il nucleotide indicato dal numero che precede il segno +. Risultati del Dot Blot. I tre campioni di DNA (dei genitori e di Maria) ibridano con la stessa sonda; Il DNA dei genitori ibrida anche con la sonda di controllo (gene wild type); Il DNA di Maria non ibrida con la sonda di controllo; Il DNA del feto (ottenuto in seguito ad amniocentesi) ibrida con una sonda specifica (la stessa dei genitori e di Maria) e con la sonda di controllo. Interpretate i risultati del Dot Blot. • • • Quale è il genotipo dei genitori? Quale è il genotipo di Maria? Quale è il genotipo del feto? 2 Scheda: la Fibrosi Cistica (CF) La fibrosi cistica è una malattia ereditaria, autosomica recessiva che interessa molteplici funzioni, dalla respirazione, alla funzione digestiva, a quella riproduttiva; interessa sia maschi che femmine ed è caratterizzata da un’anomala regolazione del trasporto degli elettroliti da parte degli epiteli e quindi da una conseguente alterazione della secrezione delle ghiandole esocrine. È la malattia ereditaria più comune nella popolazione caucasica di razza bianca con una incidenza di circa 1/2500-3500 individui. La frequenza dell’eterozigote è di 1/25-30. È causata da mutazioni nel gene che codifica per una proteina chiamata: cystic fibrosis transmembrane regulator (CFTR), che regola la secrezione di cloro, sodio, bicarbonato nei tessuti epiteliali (spesso nella fibrosi cistica si ha la completa perdita Fig.1. Il gene della CF; la proteina CFTR è localizzata nella di funzione del canale del cloro che causa la membrana plasmatica della cellula e regola il movimento degli ioni cloro tra I due lati della membrana. Nella presenza di secrezioni disidratate). Questo maggior parte dei casi di CF la proteina è priva della porta alla presenza di muco denso nei regione 1 di legame. bronchi, all’ispessimento del succo pancreatico e ai caratteristici elevati livelli di cloro nel sudore. Il gene si trova sul cromosoma 7, nella posizione 7q31.2, è molto grande costituito da 27 esoni sparsi su 1888 kb del cromosoma 7. Le mutazioni che causano la fibrosi cistica sono più di 1000 mutazioni diverse e possono trovarsi in qualunque punto del gene; tutte le mutazioni Fig. 2. Immagine composta dal cromosoma che è coinvolto nella CF, dalla struttura in 3D della sono cambiamenti di un proteina con la posizione dell’amminoacido mancante nel caso di mutazione, dalla funzionalità singolo nucleotide o di della proteina di membrana e dalla sequenza nucleotidica e amminoacidica interessate dalla mutazione più comune nei casi di CF. un piccolo numero di nucleotidi adiacenti. Per descrivere una mutazione, si usa una nomenclatura particolare; una mutazione può essere descritta in termini di cambiamento nel DNA genomico (g.), 3 nel cDNA (c.) o nella proteina codificata (p.). Ad esempio, p.F508del significa che la mutazione riguarda la delezione del residuo amminoacidico 508, fenilalanina (F). Sebbene nei pazienti affetti da fibrosi cistica siano state descritte più di 1000 mutazioni nel gene CFTR, il numero delle mutazioni più comuni e diffuso nella popolazione è piuttosto basso. La mutazione p.F508del è la più comune nella popolazione nordeuropea e costituisce il 70/80% di tutte le mutazioni della fibrosi cistica in molte popolazioni. Come abbiamo detto, la malattia è autosomica recessiva e quindi un soggetto malato ha entrambe le copie del suo gene CFTR mutate. Le due mutazioni possono essere uguali o diverse. Fig. 3. Gli apparati corporei colpiti dalla CF. In tutti gli individui colpiti, le ghiandole sudoripare producono un eccesso di sale. Il muco inspessito blocca il trasporto degli enzimi digestivi nel pancreas e il pancreas lentamente si distrugge. Il muco denso e vischioso congestiona i condotti respiratori rendendo difficile la respirazione. Nei maschi il muco blocca i dotti che portano lo sperma e solo il 2/3% dei maschi colpiti è fertile. 4 Identificazione della mutazione presente nella famiglia in esame Sequenza della sonda che ibrida con il DNA dei membri della famiglia esaminati: 5’- CACCATTAAAGAAAATATCATCGGTGTTTCCTATGATGA -3’ Iniziate la vostra ricerca al sito del National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/ Nella home page del sito della NCBI scegliete la voce BLAST (sulla barra verticale nella parte destra della pagina). BLAST (Basic Local Alignment Search Tool) è un programma euristico per la ricerca di omologie locali di sequenza, dove con euristica si intende “ogni principio o espediente che contribuisca a ridurre la quantità di ricerca media necessaria per la soluzione di un problema”. Il software BLAST in realtà è composto da diversi algoritmi che consentono di allineare non solo sequenze nucleotidiche con sequenze nucleotidiche, ma anche sequenze proteiche fra di loro, sequenze nucleotidiche con sequenze proteiche e viceversa, ovviamente utilizzando le regole del codice genetico per passare dalle sequenze nucleotidiche a quelle aminoacidiche. Nella pagina seguente, fra le opzioni Basic Blast, scegliete nucleotide blast. 5 Vi apparirà una schermata con un campo vuoto (search) dove è possibile “incollare” la sequenza che si intende confrontare con la banca dati. Incollate nel campo “search” la sequenza della sonda che vi è stata data. In Choose search set, scegliete la voce Nucleotide collection nr/nt (nr = non redundant) che contiene tutte le sequenze depositate non ridondanti; in realtà questa è solo una definizione “storica” in quanto oggi molte delle informazioni contenute sono ridondanti. In molti casi potreste preferire un allineamento solo con le sequenze di un particolare organismo. 6 Ognuna delle voci sottolineate è un hyperlink che vi rimanda ad una breve definizione del campo in questione. Potete quindi ottenere ulteriori spiegazioni cliccando le varie voci. Per semplicità utilizziamo un’analisi standard senza utilizzare le opzioni di ricerca avanzate. Una volta incollata la vostra sequenza, cliccate sul tasto “BLAST!”. Identificazione della sequenza con il miglior punteggio di allineamento La pagina dei risultati è divisa in cinque parti. La prima parte fornisce informazioni: • sul database BLASTN; • sulla sequenza in esame, chiamata “query” di cui fornisce la lunghezza in basi (letters). La seconda parte è una rappresentazione grafica delle sequenze che hanno ottenuto i migliori punteggi nell’allineamento con la sequenza “query”: • la linea rossa spessa rappresenta la sequenza “query”; • i numeri sotto di essa si riferiscono alla lunghezza in basi; ciascuna delle linee sottili sottostanti, di diverso colore, indica un allineamento della suddetta sequenza con una sequenza del database nucleotidico; il codice dei colori impiegato nel rappresentare le sequenze riflette il punteggio ottenuto nell’allineamento che dipende a sua volta dalla percentuale di identità calcolata fra le due sequenze. 7 Se provate a passare con il puntatore sui diversi segmenti colorati vedrete che compariranno il nome e il numero di accesso della sequenza corrispondente; se provate a cliccare su uno dei segmenti verrete portati all’allineamento di sequenza corrispondente. La terza parte, al di sotto dello schema grafico, consiste nell’elenco delle sequenze nucleotidiche del database più simili alla sequenza query, ordinate per significatività dell’allineamento; vengono, cioè, calcolati dal software un punteggio (score) e un valore di significatività statistica (E) che indica la probabilità di ottenere un allineamento, come quello identificato, solo per caso o confrontando due sequenze non correlate. Tanto più è piccolo il valore di “E”, tanto più l’allineamento sarà significativo. 8 La quarta parte visualizza gli allineamenti significativi della sequenza "query" con le sequenze, identificate come più simili all’interno del database (sequenze “subject”). Per ciascun allineamento sono indicate le seguenti proprietà: • Score, cioè il punteggio dell'allineamento; • Expect, corrispondente di “E value” nell'allineamento; • Identities che indica il rapporto tra il numero di basi identiche (nell'esempio sono 1264) e la lunghezza dell'allineamento in questione (nell'esempio è 1264 basi); tra parentesi è indicata la risultante percentuale di identità fra le due sequenze nella regione allineata (nell'esempio è il 100%); • Gaps indica il rapporto tra il numero di interruzioni presenti nell'allineamento (nell'esempio 0) e la lunghezza dell'allineamento in questione; tra parentesi è indicata la percentuale totale di gap (nell'esempio è lo 0%); • Strand indica l'orientamento della sequenza "query" rispetto alla sequenza del database con cui si allinea (Plus/Plus significa che la sequenza “query” ha lo stesso orientamento di quella presente nel database, invece, Plus/Minus indica che le due sequenze hanno orientamento opposto). Segue l'allineamento vero e proprio tra la sequenza "query" e la sequenza del database in questione, denominata " sbjct". I numeri indicano la posizione delle basi all'interno delle rispettive sequenze e quando, in una data posizione dell'allineamento, la base della sequenza "query" e quella del database coincidono. compare tra le due righe il carattere "|". Quando tale carattere non è presente significa che, in quella posizione dell'allineamento, la base nella sequenza "query" non corrisponde della sequenza del database sono diverse oppure che una delle due sequenze presenta un gap, come risulta dall’analisi degli allineamenti caratterizzati da basse percentuali di identità. Cliccate sul link corrispondente a NM_000492.3 e si aprirà una pagina della banca dati contenente le informazioni relative alla sequenza che avete scelto. Avete identificato di che mutazione si tratta? 9 Alla scoperta del gene della Fibrosi Cistica Ritornate alla Home Page di NCBI http://www.ncbi.nlm.nih.gov/ Delimitate la vostra ricerca. Nel campo Search scegliete Nucleotide e nel campo for digitate NM_000492.3. Cliccate su GO. Si aprirà una pagina che contiene moltissime informazioni, strutturate secondo uno schema fisso che prevede diverse voci (LOCUS, DEFINITION, ACCESSION ecc). Nella pagina sono presenti anche informazioni sugli articoli scientifici relativi alla sequenza stessa (REFERENCE), nonché le FEATURES ovvero una serie di informazioni sui principali elementi di sequenza con significato funzionale noto (predetto o dimostrato sperimentalmente). Per ottenere la sequenza del cDNA per il gene CFTR, cliccate nel campo Display e selezionate la voce FASTA, poi cliccate sul campo Show alla voce Send to selezionando Text. Nella pagina web che si è aperta, trovate tutta la sequenza nucleotidica del cDNA, nel formato utilizzabile per proseguire la vostra ricerca. Salvate la sequenza di basi su un file di testo con il nome cDNAFASTA.doc. Tornando in banca dati alla pagina con le caratteristiche di NM_000492, trova il numero identificativo della proteina prodotta dal gene, la sua sequenza di amminoacidi, copiala e salvala in un nuovo file di testo dal nome CFTRprot.doc. Prendi nota del numero di amminoacidi che costituiscono la proteina normale. 10 Adesso che hai la sequenza codificante completa (cDNA) del gene CFTR puoi cercarne la sequenza genomica usando il software BLAT (BLAST-Like Alignment Tool), un algoritmo ottimizzato per confrontare sequenze di cDNA (prive di introni) con intere sequenze genomiche (che contengono introni) e che consente di identificare la struttura in esoni ed introni del gene genomico. Vai alla pagina http://genome.ucsc.edu/cgi-bin/hgBlat?db=mm2 ed incolla la sequenza di cDNA nella finestra di BLAT. Clicca submit e quando comparirà la nuova pagina clicca su details alla sinistra del primo record in elenco (score 6106, size in nucleotides 8094, 100% identity). Il gene si trova sul cromosoma 7. Nella pagina che si apre troverai la tua sequenza di cDNA, la sequenza di DNA genomico nella quale sono evidenziati in blu scuro e con le lettere maiuscole gli esoni, in nero e con le lettere minuscole gli introni e in azzurro i siti di splicing. Clicca sui links, nella colonna 11 di sinistra, per navigare nella sequenza. Cliccando sui vari blocchi, ti appare ad inizio pagina l’esone corrispondente nella sequenza genomica; noterai che ci sono 27 esoni nel gene CFTR. Costruzione del cDNA deleto Aprite il file di testo cDNAFASTA.doc, fatene una copia che salverete con il nome cDNA deleto.doc. Modificate il cDNA wild type inserendo la delezione F508. Per fare questo, vi suggeriamo di utilizzare la funzione cerca, ricercando la sequenza nucleotidica wild type di 15 nucleotidi che trovate nella scheda, che contiene la posizione interessata dalla mutazione. Eliminate i 3 nucleotidi coinvolti nella delezione ΔF508 (TTT) e salvate la nuova sequenza. 12 Traduzione nella proteina deleta Ora bisogna usare un nuovo software per tradurre la sequenza di cDNA mutata, cDNAdeleto.doc (contenente la delezione) in sequenza di amminoacidi; vai al sito: http://arbl.cvmbs.colostate.edu/molkit/translate/index.html. Incolla la sequenza mutata nella finestra bianca e clicca translate DNA. Otterrai una immagine su fondo nero che è il risultato della traduzione della sequenza nelle 6 possibili cornici di lettura (3 per ogni elica di DNA): in verde sono rappresentati i possibili codoni di inizio e in viola i codoni di stop. Identifica la cornice di lettura detta anche “Open Reading Frame o ORF” più lunga, senza interruzioni date dai codoni di stop. Nel nostro caso la ORF più lunga è forward frame 1. Ora clicca su Text Output per visualizzare la sequenza e la sua traduzione in amminoacidi. Scegli la forward frame 1. Puoi facilmente personalizzare l’interfaccia del software scegliendo di visualizzare la sequenza amminoacidica con il codice a una o a tre lettere, con o senza la sequenza di DNA appaiata. Scegli one letter code e amino acids and DNA. Copia il contenuto della finestra in un nuovo file di Word e salvalo come proteina CFTR mutata.doc; usa come font courier new or courier, dimensione 8, nero; è necessario 13 utilizzare questo font per gli allineamenti di sequenza perché mantiene fissi e costanti gli spazi tra i caratteri. Localizzazione delle caratteristiche principali del cDNA Ora puoi localizzare le principali caratteristiche del cDNA/mRNA, per esempio: • 5’UTR (5’ UnTranslated Region) • start codon (inizio della traduzione, ATG (AUG) il codone della metionina) • CDS (CoDing Sequence) • stop codon (fine della traduzione, TAA (UAA)/ TAG (UAG) / TGA (UGA) • 3’UTR (3’ UnTranslated Region) • sito polyA (sito di poliadenilazione) costituito dalla sequenza consenso “AATAAA” generalmente localizzata 20-30 bp (max 10-35 bp) a monte dell’inizio della coda di polyA. In alcuni geni, questo sito può essere leggermente differente dalla sequenza consenso (per esempio ATTAAA). Identifica tutti gli elementi sopra elencati ed evidenziali con il colore verde e giallo. Iniziando dall’estremità 5’ della molecola, trova il codone d’inizio cioè il primo ATG, che corrisponde alla prima metionina (M, posizione 45), non seguita a breve distanza da alcun codone di stop. Una volta identificato il codone di inizio puoi cancellare la sequenza di amminoacidi che lo precede che è la regione 5’UTR, non tradotta dai ribosomi in proteina. Trovato il codone di stop (TGA) la regione che lo segue è la 3’UTR. La CDS (la sequenza tradotta in proteina) si estende dal nucleotide 133 al 4570. Identifica anche il segnale di poliadenilazione, la sequenza a valle della quale si interrompe la trascrizione e a cui viene aggiunta la coda di polyA (parte dalla posizione 7793). Quanto è lunga la proteina mutata? Confrontala con la lunghezza della proteina normale che hai annotato precedentemente. 14 Confronto tra le due proteine Visualizzazione della struttura 3D della proteina CF e confronto tra la proteina sana e quella mutata. Le strutture tridimensionali (3D) delle proteine possono essere determinate con una serie di approcci sperimentali, fra i quali i più utilizzati e in grado di fornire le informazioni più dettagliate sono la cristallografia ai raggi X e la risonanza magnetica nucleare. E’ inoltre possibile effettuare delle previsioni di struttura per proteine che mostrino un sufficiente livello di identità di sequenza con proteine la cui struttura sia stata determinata sperimentalmente. Questo tipo di analisi è ovviamente molto meno accurato ma può fornire informazioni molto importanti sulla struttura e sulla funzione di una proteina. Le coordinate tridimensionali di ogni singolo atomo vengono scritte in un file che è poi possibile visualizzare mediante diversi software. In particolare noi utilizzeremo il software Deep View. I file contenenti le coordinate molecolari delle molecole la cui struttura 3D è già stata risolta sono raccolti (in diversi formati utilizzabili con diversi tipi di software) in un database chiamato PDB (“Protein Data Bank”). Aprite il file (con estensione “.pdb” o “.ent”) contenente la struttura 3D della proteina in esame disponibile anche sul sito “Protein Data Bank” (http://www.rcsb.org/pdb/) inserendo nella casella search il riferimento 2BBO. Aprite il file con il software di visualizzazione “DeepView” (disponibile su http://www.expasy.org/spdbv/) Deep View Deep View è un potente programma di grafica, ottenibile da Expert Protein Analysis System (ExPASy) Molecular Biology Server di Ginevra. Deep View è semplice da usare e consente di vedere la struttura di una proteina e creare modelli dando una sequenza di aminoacidi; permette di vedere diverse proteine contemporaneamente e sovrapporle per comparare la loro struttura e sequenza. Per proteine di sequenze conosciute ma struttura sconosciuta, Deep View sottomette la sequenza a ExPASy per trovare analogie con altre proteine, con cui potete allineare la vostra sequenza per costruire un modello preliminare in tre dimensioni. Deep View sottopone il vostro allineamento a ExPASy, il server SWISS_MODEL costruirà un modello finale, chiamato homology model, e lo invierà al vostro indirizzo email. Utilizzando il software Deep View, imparerete a: • Osservare la struttura terziaria della proteina, identificare domini e strutture secondarie • Familiarizzare con le diverse visualizzazioni: ribbon diagram, backbone e sidechains • Identificare, all’interno della struttura, i residui eventualmente interessati da mutazioni patologiche (es: F508del) • Confrontare le strutture 3D della proteina sana e di quella mutata. 15 Aprite DeepView, comparirà la seguente finestra. Per inserire la proteina da analizzare, andate su File, cliccate su Open PDB File, scegliete un file con estensione pdb e apritelo. Automaticamente la struttura della proteina verrà inserita in una finestra posta sotto la precedente. Centra Informazioni sulla proteina Trascina nana zoom ruota Finestra in cui viene mostrata la struttura della proteina La finestra superiore dà accesso al menu e ai più comuni strumenti utili per manipolare la proteina mentre la finestra posta in basso mostra la struttura della proteina. Manipolazione della proteina Le icone poste sotto il menu della prima finestra consentono di manipolare la proteina. L’icona schermo. posta all’estrema sinistra consente di portare la proteina al centro dello 16 Le tre icone successive, poste sopra la scritta Move all, servono a trascinare, zoomare e ruotare la proteina. Una volta che l’icona è selezionata, (cliccando su di essa con il mouse) si può manipolare la proteina, mostrata nella finestra sottostante, muovendo il mouse tenendo premuto il pulsante destro. Le icone del terzo gruppo, poste a destra, permettono di compiere alcune operazioni di misura come ad esempio la distanza tra atomi, gli angoli tra atomi, ecc. di cui però non ci occupiamo. Cliccando sull’icona a forma di pagina scritta, situata in basso, vicino alla scritta Move all, si apre un’altra finestra dove sono elencate molte informazioni sulla proteina, compresa la sua sequenza aminoacidica. Control Panel Si può aprire la finestra del Control Panel andando sul menu, cliccando su Wind e su Control Panel, vi si aprirà sulla sinistra dello schermo, una nuova finestra. Con il mouse potete trascinare la finestra del Control Panel dove meglio ritenete più opportuno e cambiare le sue dimensioni agendo sui bordi. Si usa il Contro Panel per selezionare, osservare e nascondere parte del modello agendo sui singoli aminoacidi che sono elencati sulla sinistra della finestra. Il primo click sulla finestra l’attiva senza cambiare nulla. Quando si selezionano gli aminoacidi (group), essi diventano rossi. Si possono selezionare cliccando su ciascuno di essi o cliccando e trascinando il mouse su di essi tenendo premuto il pulsante destro. Premendo Invio sulla tastiera, gli aminoacidi scompariranno tranne quelli selezionati (in rosso). Da notare che appare, nella colonna show del Contro Panel, una accanto a ciascun aminoacido selezionato, indicando che essi sono resi visibili. Può esserci una anche nella colonna side indicando che i residui R degli aminoacidi sono visibili. A sinistra della colonna group ci sono altre due strette colonne, la prima è vuota se la proteina è formata da un unica catena, mentre se è formata da più catene in questa colonna compariranno delle lettere A, B ecc. ad indicare le varie catene presenti nel cristallo; nel Control Panel è presente una catena corrispondente ai residui aminoacidici 389-678, corrispondente al dominio funzionale NBD1 della proteina. La seconda colonna contiene una h se il residuo fa 17 parte di un alfa elica o una s se il residuo fa parte di un beta foglietto (beta sheet). Si può selezionare la catena A semplicemente cliccando su una A qualsiasi, tutti i gruppi A diventeranno rossi, premendo Invio la catena A comparirà nella finestra. La stessa cosa vale per le h o le s, premendo su una qualsiasi verranno selezionate tutte le alfa eliche (o le beta sheet). Se si vogliono selezionare due gruppi diversi, staccati tra loro, basta selezionare un gruppo e poi selezionare il secondo gruppo tenendo premuto il tasto Control, una volta selezionati premere Invio per visualizzarli. Selezionate alcuni aminoacidi e provate a cliccare sulle colonne show, side, labl, surface ( un quadrato di puntini) e ribn e guardate l’effetto. • Labl: mostra il nome degli aminoacidi selezionati. • Surface: mostra per ogni aminoacido, attraverso dei puntini, la superficie di van der Waals. Altri tipi di superficie sono ottenibli nel piccolo menu posto sotto il simbolo (triangolino nero). • Ribn: disegna la struttura tridimensionale della protena Sempre tenendo premuto il pulsante del mouse e trascinandolo lungo le colonne del Control Panel si possono selezionare o deselezionare i gruppi; si può ottenere lo stesso risultato cliccando in cima alla colonna. Ricordate che potete centrare, spostare, zoomare, ruotare la figura nella finestra del display utilizzando le apposite icone. Per visualizzare la struttura ad alfa elica (in rosso) e beta foglietti (in giallo), nel Control Panel selezionate tutti gli aminoacidi sotto la colonna ribn (tenendo cliccato control e shift sulla tastiera), dal menu Color selezionate secondary structure e dal menu display scegliete render in 3D. Colorazione (menu Color) Deep View consente di dare diversi tipi di colorazione al modello. La colorazione consente di evidenziare e rivelare le configurazioni strutturali e chimiche della proteina. Andare su menu Color e cliccate su: • • • • • Secondary Structure: le alfa-eliche verranno colorate di rosso e i beta foglietti in giallo e le altre in grigio. Contemporaneamente la colorazione apparirà anche sul Contro Panel, nella colonna in cui compaiono piccoli quadrati. Secondary Structure Succession: colora le eliche e i folglietti ma l’ordine dei colori riflette l’ordine attraverso cui le varie strutture compaiono nella proteina. Risulta così più facile seguire la formazione di strutture secondarie lungo la catena polipeptidica. Chain: colorerà di colore diversi le singole catene che possono costituire una proteina. Naturalmente, se una proteina è formata da una singola catena apparirà colorata uniformemente. Type: gli aminoacidi vengono colorati in base alle proprietà chimiche, i gruppi non polari in grigio (da notare che molti gruppi non polari sono verso l’interno perchè sono idrofobici), i gruppi acidi in rossi e basici in blu. CPK: questa operazione riporta i gruppi ai colori standard: bianco per il carbonio, rosso per l’ossigeno, blu per l’azoto e giallo per lo zolfo. 18 N.B Potete cambiare i colori scelti dal programma per indicare gli atomi, gli aminoacidi, le strutture secondarie, le catene o lo sfondo andando su Preferences e cliccando su color, si apriranno nuove finestre attraverso cui potete selezionare i colori che preferite. Menu Select Da menu Select si possono selezionare i sottomenu: • All: seleziona tutti gli aminoacidi della proteina, premendo invio verranno mostrati • Secondary structure: permette di selezionare e mostrare premendo Invio varie parti della proteina. - Helices: seleziona e mostra gli aminoacidi che formano un alfa elica, - Strand: seleziona e mostra solo le beta sheet - Coil: seleziona e mostra il resto degli aminoacidi • Group property: permette di selezionare e mostrare, sempre premendo Invio, solo gli aminoacidi basici, acidi, polari o non polari. Menu Wind Dal menu Wind si possono selezionare i sottomenu: • Ramachandran Plot: Si usa questa finestra per giudicare la qualità del modello, consente di visualizzare i residui i cui angoli conformazionali stanno fuori dal range permesso. Si possono anche cambiare gli angoli conformazionali del modello. • Layer Infos:questa tavola permette il controllo di molteplici modelli proteici, permettendo di scegliere quale modello rendere visibile, quale muovere ecc. • Alignment: La finestra alignment appare in basso, mostra la sequenza di aminoacidi delle proteina. Si usa questa finestra quando si confrontano due o più proteine. 19 Provate ora a selezionare nell’elenco degli aminoacidi la fenilalanina in posizione 508 e coloratela di blu; nell’immagine in 3D visualizzerete la posizione dell’aminoacido e nella sequenza che è comparsa sotto la figura, nella finestra Alignment, si evidenzierà l’aminoacido prescelto. Per confrontare la struttura della proteina CFTR sana con la proteina che presenta la delezione della fenilalanina nella posizione 508, aprite il file 1XMJ.pdb con il software Deep View (avete già aperta in 3D la proteina sana); le due proteine si appaieranno e, selezionando, nel Control Panel con un colore diverso, gli aminoacidi della zona intorno alla posizione 508, vi accorgerete che manca la fenilalanina. La struttura 1XMJ corrisponde ai residui aminoacidici 389-678. Per confrontare le due strutture, bisogna affiancarle nella stessa finestra. Prima avvicinare una struttura all’altra bisogna permettere il movimento ad una sola delle due, spuntando la voce can move, in Control Panel, solo in quella che si vuole muovere ed avvicinare (nel nostro caso la 1XMJ). 20 Al di sotto dell’immagine in 3D c’è l’allineamento tra le due catene aminoacidiche. Per confrontare meglio le due strutture, prima di sovrapporle colorate la proteina normale (2BBO) omogeneamente in rosa (per agire su una delle due proteine, per cambiare i colori ecc., dovete scegliere il file da modificare dal menu a tendina subito sotto Control Panel. Per sovrapporre le due strutture, selezionare dal menu Fit, la voce Magic Fit. Noterete che la struttura 3D della proteina mutata si sovrappone quasi completamente alla struttura della proteina normale. Come già detto nella Fig. 4 della scheda, la mutazione F508del causa il mancato processamento a livello del reticolo endoplasmico della proteina CFTR. La proteina non raggiunge la membrana non perché la sua struttura è drasticamente alterata dalla mutazione, ma in quanto la maturazione post-traduzionale della proteina non può essere completata a causa della mancanza di un segnale specifico in cui è coinvolta la F508. La proteina con la delezione F508 non supera il severo controllo di qualità a cui sono sottoposte tutte le proteine a livello del reticolo endoplasmico; di conseguenza, viene trasportata ai proteasomi dove viene degradata. 21