Caccia al gene della Fibrosi Cistica

Caccia al gene della Fibrosi Cistica
Scenario e simulazione di consulenza genetica
Siete un genetista medico e lavorate in un consultorio genetico. Si presenta da voi una
coppia che richiede consulenza genetica. In base al racconto della storia familiare,
costruite il pedigree della famiglia e impostate l’analisi del DNA da richiedere al
laboratorio per rispondere alle domande poste dalla coppia.
In consultorio si presenta una giovane coppia (Davide e Sofia). Hanno 2 figli, Pietro di 6
anni sano, e Maria, di 4 anni, che soffre spesso di tosse, raffreddore e infezioni
polmonari. Sofia racconta che una sua sorella maggiore è morta giovane di fibrosi cistica
(FC), mentre nella famiglia di Davide non ci sono casi di malattia. Sofia è in attesa di un
terzo figlio (è alla fine della sesta settimana di gravidanza) e vorrebbe informazioni sul
rischio di avere un figlio affettto da FC.
Viene suggerito alla coppia di sottoporre Maria al test del sudore per stabilire il livello di
ioni Na+ e Cl-, un test semplice di valore diagnostico per la FC, e di ritornare con i
risultati delle analisi.
Con i dati a vostra disposizione in questo momento costruite l’albero genealogico di
questa famiglia e rispondete alle seguenti domande:

•
•
•
•
quale è il rischio che Sofia sia portatrice di FC?
quale è il rischio che Davide sia portatore di FC?
quale è il rischio che il nascituro sia affetto da FC?
che probabilità ha il nascituro di essere sano? Di essere portatore?
Il test del sudore conferma la diagnosi di fibrosi cistica (livello di Na+ di 87 nmol/l,
molto superiore al valore normale di 60 nmol/l). In base a questa nuova informazione,
rispondete nuovamente alle domande:

•
•
•
•
quale è il rischio che Sofia sia portatrice di FC?
quale è il rischio che Davide sia portatore di FC?
quale è il rischio che il nascituro sia affetto da FC?
che probabilità ha il nascituro di essere sano? Di essere portatore?
1
La FC è sempre causata da mutazioni del gene CFTR sul cromosoma 7. La malattia è
recessiva e quindi se Maria è malata, devono essere mutate entrambe le copie del suo
gene CFTR. NB: Le due mutazioni possono essere uguali o diverse.
A questo punto il genetista suggerisce di accertare, mediante analisi del DNA, quali sono
le mutazioni presenti in Maria e nei suoi genitori. Sofia deve inoltre sottoporsi ad
amniocentesi, per determinare, attraverso l’analisi del DNA, il genotipo del nascituro.
In prima battuta per la diagnosi genetica di fibrosi
cistica si usano le tecniche che ricercano le mutazioni
più frequenti del gene CFTR (vedi tabella). Soluzioni
di DNA, estratto dalle cellule del paziente, sono messe
su un filtro in punti definiti (dots) e, una volta
denaturate, sono ibridizzate con sonde specifiche per le
mutazioni frequenti, opportunamente marcate. Dopo
lavaggio, per eliminare la sonda in eccesso non legata,
si procede alla rilevazione per identificare quale delle
sonde si è ibridata con il DNA in esame.
Mutazione
p.F508del
p.Gly551Asp
p.Gly542X
c.621+1G>T
c.1898+1G>A
esone
10
11
11
Introne 4
Introne 12
%
81,0
3,5
1,1
1,0
0,9
Tab.1 Mutazioni più frequenti nel gene CFTR; p
e c indicano rispettivamente che la mutazione è
descritta nella proteina o nel cDNA; > significa
“cambia in”, X significa un codone di stop; +1
significa che è coinvolto il primo nucleotide
dell’introne successivo all’esone che termina
con il nucleotide indicato dal numero che
precede il segno +.
Risultati del Dot Blot.
I tre campioni di DNA (dei genitori e di Maria) ibridano con la stessa sonda;
Il DNA dei genitori ibrida anche con la sonda di controllo (gene wild type);
Il DNA di Maria non ibrida con la sonda di controllo;
Il DNA del feto (ottenuto in seguito ad amniocentesi) ibrida con una sonda specifica (la
stessa dei genitori e di Maria) e con la sonda di controllo.
Interpretate i risultati del Dot Blot.

•
•
•
Quale è il genotipo dei genitori?
Quale è il genotipo di Maria?
Quale è il genotipo del feto?
2
Scheda: la Fibrosi Cistica (CF)
La fibrosi cistica è una malattia ereditaria, autosomica recessiva che interessa molteplici
funzioni, dalla respirazione, alla funzione digestiva, a quella riproduttiva; interessa sia
maschi che femmine ed è caratterizzata da un’anomala regolazione del trasporto degli
elettroliti da parte degli epiteli e quindi da una conseguente alterazione della secrezione
delle ghiandole esocrine.
È la malattia ereditaria più comune nella
popolazione caucasica di razza bianca con
una incidenza di circa 1/2500-3500
individui. La frequenza dell’eterozigote è di
1/25-30.
È causata da mutazioni nel gene che
codifica per una proteina chiamata: cystic
fibrosis transmembrane regulator (CFTR),
che regola la secrezione di cloro, sodio,
bicarbonato nei tessuti epiteliali (spesso
nella fibrosi cistica si ha la completa perdita
Fig.1. Il gene della CF; la proteina CFTR è localizzata nella
di funzione del canale del cloro che causa la
membrana plasmatica della cellula e regola il movimento
degli ioni cloro tra I due lati della membrana. Nella
presenza di secrezioni disidratate). Questo
maggior parte dei casi di CF la proteina è priva della
porta alla presenza di muco denso nei
regione 1 di legame.
bronchi, all’ispessimento del succo
pancreatico e ai caratteristici elevati livelli di cloro nel sudore.
Il gene si trova sul
cromosoma 7, nella
posizione 7q31.2, è
molto grande costituito
da 27 esoni sparsi su
1888 kb del cromosoma
7. Le mutazioni che
causano la fibrosi cistica
sono più di 1000
mutazioni diverse e
possono trovarsi in
qualunque punto del
gene; tutte le mutazioni
Fig. 2. Immagine composta dal cromosoma che è coinvolto nella CF, dalla struttura in 3D della
sono cambiamenti di un
proteina con la posizione dell’amminoacido mancante nel caso di mutazione, dalla funzionalità
singolo nucleotide o di
della proteina di membrana e dalla sequenza nucleotidica e amminoacidica interessate dalla
mutazione più comune nei casi di CF.
un piccolo numero di
nucleotidi adiacenti. Per descrivere una mutazione, si usa una nomenclatura particolare;
una mutazione può essere descritta in termini di cambiamento nel DNA genomico (g.),
3
nel cDNA (c.) o nella proteina codificata (p.). Ad esempio, p.F508del significa che la
mutazione riguarda la delezione del residuo amminoacidico 508, fenilalanina (F).
Sebbene nei pazienti affetti da fibrosi cistica siano state descritte più di 1000 mutazioni
nel gene CFTR, il numero delle mutazioni più comuni e diffuso nella popolazione è
piuttosto basso.
La mutazione p.F508del è la più comune nella popolazione nordeuropea e costituisce il
70/80% di tutte le mutazioni della fibrosi cistica in molte popolazioni.
Come abbiamo detto, la malattia è autosomica recessiva e quindi un soggetto malato ha
entrambe le copie del suo gene CFTR mutate. Le due mutazioni possono essere uguali o
diverse.
Fig. 3. Gli apparati corporei colpiti dalla CF. In
tutti gli individui colpiti, le ghiandole sudoripare
producono un eccesso di sale. Il muco inspessito
blocca il trasporto degli enzimi digestivi nel
pancreas e il pancreas lentamente si distrugge. Il
muco denso e vischioso congestiona i condotti
respiratori rendendo difficile la respirazione. Nei
maschi il muco blocca i dotti che portano lo
sperma e solo il 2/3% dei maschi colpiti è
fertile.
4
Identificazione della mutazione presente nella famiglia in esame
Sequenza della sonda che ibrida con il DNA dei membri della famiglia esaminati:
5’- CACCATTAAAGAAAATATCATCGGTGTTTCCTATGATGA -3’
Iniziate la vostra ricerca al sito del National Center for Biotechnology Information
(NCBI) http://www.ncbi.nlm.nih.gov/
Nella home page del sito della NCBI scegliete la voce BLAST (sulla barra verticale
nella parte destra della pagina).
BLAST (Basic Local Alignment Search Tool) è un programma euristico per la ricerca di omologie locali di
sequenza, dove con euristica si intende “ogni principio o espediente che contribuisca a ridurre la quantità di
ricerca media necessaria per la soluzione di un problema”.
Il software BLAST in realtà è composto da diversi algoritmi che consentono di allineare non solo sequenze
nucleotidiche con sequenze nucleotidiche, ma anche sequenze proteiche fra di loro, sequenze nucleotidiche
con sequenze proteiche e viceversa, ovviamente utilizzando le regole del codice genetico per passare dalle
sequenze nucleotidiche a quelle aminoacidiche.
Nella pagina seguente, fra le opzioni Basic Blast, scegliete nucleotide blast.
5
Vi apparirà una schermata con un campo vuoto (search) dove è possibile “incollare” la
sequenza che si intende confrontare con la banca dati.
Incollate nel campo “search” la sequenza della sonda che vi è stata data.
In Choose search set, scegliete
la voce Nucleotide collection
nr/nt (nr = non redundant) che
contiene tutte le sequenze
depositate non ridondanti; in
realtà questa è solo una
definizione “storica” in quanto
oggi molte delle informazioni
contenute sono ridondanti. In
molti casi potreste preferire un
allineamento solo con le
sequenze di un particolare
organismo.
6
Ognuna delle voci sottolineate
è un hyperlink che vi rimanda
ad una breve definizione del
campo in questione. Potete
quindi
ottenere
ulteriori
spiegazioni cliccando le varie
voci.
Per
semplicità
utilizziamo un’analisi standard
senza utilizzare le opzioni di
ricerca avanzate.
Una volta incollata la vostra
sequenza, cliccate sul tasto
“BLAST!”.
Identificazione della sequenza con il miglior punteggio di allineamento
La pagina dei risultati è divisa in cinque parti.
La prima parte fornisce informazioni:
• sul database BLASTN;
• sulla sequenza in esame, chiamata “query” di cui fornisce la lunghezza in basi
(letters).
La seconda parte è una rappresentazione grafica delle sequenze che hanno ottenuto i
migliori punteggi nell’allineamento con la sequenza “query”:
• la linea rossa spessa rappresenta la sequenza “query”;
• i numeri sotto di essa si riferiscono alla lunghezza in basi;
ciascuna delle linee sottili sottostanti, di diverso colore, indica un allineamento della
suddetta sequenza con una sequenza del database nucleotidico;
il codice dei colori impiegato nel rappresentare le sequenze riflette il punteggio ottenuto
nell’allineamento che dipende a sua volta dalla percentuale di identità calcolata fra le due
sequenze.
7
Se provate a passare con il puntatore sui diversi segmenti colorati vedrete che
compariranno il nome e il numero di accesso della sequenza corrispondente; se provate a
cliccare su uno dei segmenti verrete portati all’allineamento di sequenza corrispondente.
La terza parte, al di sotto dello schema grafico, consiste nell’elenco delle sequenze
nucleotidiche del database più simili alla sequenza query, ordinate per significatività
dell’allineamento; vengono, cioè, calcolati dal software un punteggio (score) e un valore
di significatività statistica (E) che indica la probabilità di ottenere un allineamento, come
quello identificato, solo per caso o confrontando due sequenze non correlate. Tanto più è
piccolo il valore di “E”, tanto più l’allineamento sarà significativo.
8
La quarta parte visualizza gli allineamenti significativi della sequenza "query" con le
sequenze, identificate come più simili all’interno del database (sequenze “subject”).
Per ciascun allineamento sono indicate le seguenti proprietà:
• Score, cioè il punteggio dell'allineamento;
• Expect, corrispondente di “E value” nell'allineamento;
• Identities che indica il rapporto tra il numero di basi identiche (nell'esempio sono
1264) e la lunghezza dell'allineamento in questione (nell'esempio è 1264 basi); tra
parentesi è indicata la risultante percentuale di identità fra le due sequenze nella
regione allineata (nell'esempio è il 100%);
• Gaps indica il rapporto tra il numero di interruzioni presenti nell'allineamento
(nell'esempio 0) e la lunghezza dell'allineamento in questione; tra parentesi è
indicata la percentuale totale di gap (nell'esempio è lo 0%);
• Strand indica l'orientamento della sequenza "query" rispetto alla sequenza del
database con cui si allinea (Plus/Plus significa che la sequenza “query” ha lo
stesso orientamento di quella presente nel database, invece, Plus/Minus indica che
le due sequenze hanno orientamento opposto).
Segue l'allineamento vero e proprio tra la sequenza "query" e la sequenza del database in
questione, denominata " sbjct". I numeri indicano la posizione delle basi all'interno delle
rispettive sequenze e quando, in una data posizione dell'allineamento, la base della
sequenza "query" e quella del database coincidono. compare tra le due righe il carattere
"|". Quando tale carattere non è presente significa che, in quella posizione
dell'allineamento, la base nella sequenza "query" non corrisponde della sequenza del
database sono diverse oppure che una delle due sequenze presenta un gap, come risulta
dall’analisi degli allineamenti caratterizzati da basse percentuali di identità.
Cliccate sul link corrispondente a NM_000492.3 e si aprirà una pagina della banca dati
contenente le informazioni relative alla sequenza che avete scelto.

Avete identificato di che mutazione si tratta?
9
Alla scoperta del gene della Fibrosi Cistica
Ritornate alla Home Page di NCBI
http://www.ncbi.nlm.nih.gov/
Delimitate la vostra ricerca. Nel campo Search scegliete Nucleotide e nel campo for
digitate NM_000492.3. Cliccate su GO.
Si aprirà una pagina che contiene moltissime informazioni, strutturate secondo uno
schema fisso che prevede diverse voci (LOCUS, DEFINITION, ACCESSION ecc). Nella
pagina sono presenti anche informazioni sugli articoli scientifici relativi alla sequenza
stessa (REFERENCE), nonché le FEATURES ovvero una serie di informazioni sui
principali elementi di sequenza con significato funzionale noto (predetto o dimostrato
sperimentalmente).
Per ottenere la sequenza del cDNA per il gene CFTR, cliccate nel campo Display e
selezionate la voce FASTA, poi cliccate sul campo Show alla voce Send to selezionando
Text.
Nella pagina web che si è aperta, trovate tutta la sequenza nucleotidica del cDNA, nel
formato utilizzabile per proseguire la vostra ricerca.
Salvate la sequenza di basi su un file di testo con il nome cDNAFASTA.doc.
Tornando in banca dati alla pagina con le caratteristiche di NM_000492, trova il numero
identificativo della proteina prodotta dal gene, la sua sequenza di amminoacidi, copiala e
salvala in un nuovo file di testo dal nome CFTRprot.doc. Prendi nota del numero di
amminoacidi che costituiscono la proteina normale.
10
Adesso che hai la sequenza codificante completa (cDNA) del gene CFTR puoi cercarne
la sequenza genomica usando il software BLAT (BLAST-Like Alignment Tool), un
algoritmo ottimizzato per confrontare sequenze di cDNA (prive di introni) con intere
sequenze genomiche (che contengono introni) e che consente di identificare la struttura in
esoni ed introni del gene genomico.
Vai alla pagina http://genome.ucsc.edu/cgi-bin/hgBlat?db=mm2 ed incolla la sequenza di
cDNA nella finestra di BLAT.
Clicca submit e quando comparirà la nuova pagina clicca su details alla sinistra del primo
record in elenco (score 6106, size in nucleotides 8094, 100% identity). Il gene si trova sul
cromosoma 7.
Nella pagina che si apre troverai la tua sequenza di cDNA, la sequenza di DNA genomico
nella quale sono evidenziati in blu scuro e con le lettere maiuscole gli esoni, in nero e con
le lettere minuscole gli introni e in azzurro i siti di splicing. Clicca sui links, nella colonna
11
di sinistra, per navigare nella sequenza. Cliccando sui vari blocchi, ti appare ad inizio
pagina l’esone corrispondente nella sequenza genomica; noterai che ci sono 27 esoni nel
gene CFTR.
Costruzione del cDNA deleto
Aprite il file di testo cDNAFASTA.doc, fatene una copia che salverete con il nome
cDNA deleto.doc. Modificate il cDNA wild type inserendo la delezione F508.
Per fare questo, vi suggeriamo di utilizzare la funzione cerca, ricercando la sequenza
nucleotidica wild type di 15 nucleotidi che trovate nella scheda, che contiene la posizione
interessata dalla mutazione. Eliminate i 3 nucleotidi coinvolti nella delezione ΔF508
(TTT) e salvate la nuova sequenza.
12
Traduzione nella proteina deleta
Ora bisogna usare un nuovo software per tradurre la sequenza di cDNA mutata,
cDNAdeleto.doc (contenente la delezione) in sequenza di amminoacidi; vai al sito:
http://arbl.cvmbs.colostate.edu/molkit/translate/index.html.
Incolla la sequenza mutata nella finestra bianca e clicca translate DNA.
Otterrai una immagine su
fondo nero che è il risultato
della
traduzione
della
sequenza nelle 6 possibili
cornici di lettura (3 per ogni
elica di DNA): in verde
sono rappresentati i possibili
codoni di inizio e in viola i
codoni di stop. Identifica la
cornice di lettura detta anche
“Open Reading Frame o
ORF” più lunga, senza
interruzioni date dai codoni
di stop.
Nel nostro caso la ORF più
lunga è forward frame 1.
Ora clicca su Text Output per visualizzare la sequenza e la sua traduzione in
amminoacidi. Scegli la forward frame 1.
Puoi facilmente personalizzare l’interfaccia del
software scegliendo di
visualizzare la sequenza
amminoacidica con il
codice a una o a tre lettere,
con o senza la sequenza di
DNA appaiata. Scegli one
letter code e amino acids
and DNA.
Copia il contenuto della finestra in un nuovo file di Word e salvalo come proteina CFTR
mutata.doc; usa come font courier new or courier, dimensione 8, nero; è necessario
13
utilizzare questo font per gli allineamenti di sequenza perché mantiene fissi e costanti gli
spazi tra i caratteri.
Localizzazione delle caratteristiche principali del cDNA
Ora puoi localizzare le principali caratteristiche del cDNA/mRNA, per esempio:
• 5’UTR (5’ UnTranslated Region)
• start codon (inizio della traduzione, ATG (AUG) il codone della metionina)
• CDS (CoDing Sequence)
• stop codon (fine della traduzione, TAA (UAA)/ TAG (UAG) / TGA (UGA)
• 3’UTR (3’ UnTranslated Region)
• sito polyA (sito di poliadenilazione) costituito dalla sequenza consenso
“AATAAA” generalmente localizzata 20-30 bp (max 10-35 bp) a monte
dell’inizio della coda di polyA. In alcuni geni, questo sito può essere leggermente
differente dalla sequenza consenso (per esempio ATTAAA).
Identifica tutti gli elementi sopra elencati ed evidenziali con il colore verde e giallo.
Iniziando dall’estremità 5’ della molecola, trova il codone d’inizio cioè il primo ATG,
che corrisponde alla prima metionina (M, posizione 45), non seguita a breve distanza da
alcun codone di stop. Una volta identificato il codone di inizio puoi cancellare la
sequenza di amminoacidi che lo precede che è la regione 5’UTR, non tradotta dai
ribosomi in proteina. Trovato il codone di stop (TGA) la regione che lo segue è la
3’UTR. La CDS (la sequenza tradotta in proteina) si estende dal nucleotide 133 al 4570.
Identifica anche il segnale di poliadenilazione, la sequenza a valle della quale si
interrompe la trascrizione e a cui viene aggiunta la coda di polyA (parte dalla posizione
7793).

Quanto è lunga la proteina mutata?
Confrontala con la lunghezza della proteina normale che hai annotato precedentemente.
14
Confronto tra le due proteine
Visualizzazione della struttura 3D della proteina CF e confronto tra la
proteina sana e quella mutata.
Le strutture tridimensionali (3D) delle proteine possono essere determinate con una serie
di approcci sperimentali, fra i quali i più utilizzati e in grado di fornire le informazioni
più dettagliate sono la cristallografia ai raggi X e la risonanza magnetica nucleare. E’
inoltre possibile effettuare delle previsioni di struttura per proteine che mostrino un
sufficiente livello di identità di sequenza con proteine la cui struttura sia stata determinata
sperimentalmente. Questo tipo di analisi è ovviamente molto meno accurato ma può
fornire informazioni molto importanti sulla struttura e sulla funzione di una proteina. Le
coordinate tridimensionali di ogni singolo atomo vengono scritte in un file che è poi
possibile visualizzare mediante diversi software. In particolare noi utilizzeremo il
software Deep View. I file contenenti le coordinate molecolari delle molecole la cui
struttura 3D è già stata risolta sono raccolti (in diversi formati utilizzabili con diversi tipi
di software) in un database chiamato PDB (“Protein Data Bank”).
Aprite il file (con estensione “.pdb” o “.ent”) contenente la struttura 3D della proteina in
esame disponibile anche sul sito “Protein Data Bank” (http://www.rcsb.org/pdb/)
inserendo nella casella search il riferimento 2BBO.
Aprite il file con il software di visualizzazione “DeepView” (disponibile su
http://www.expasy.org/spdbv/)
Deep View Deep View è un potente programma di grafica, ottenibile da Expert Protein Analysis System
(ExPASy) Molecular Biology Server di Ginevra.
Deep View è semplice da usare e consente di vedere la struttura di una proteina e creare modelli
dando una sequenza di aminoacidi; permette di vedere diverse proteine contemporaneamente e
sovrapporle per comparare la loro struttura e sequenza. Per proteine di sequenze conosciute ma
struttura sconosciuta, Deep View sottomette la sequenza a ExPASy per trovare analogie con altre
proteine, con cui potete allineare la vostra sequenza per costruire un modello preliminare in tre
dimensioni. Deep View sottopone il vostro allineamento a ExPASy, il server SWISS_MODEL
costruirà un modello finale, chiamato homology model, e lo invierà al vostro indirizzo email.
Utilizzando il software Deep View, imparerete a:
• Osservare la struttura terziaria della proteina, identificare domini e strutture
secondarie
•
Familiarizzare con le diverse visualizzazioni: ribbon diagram, backbone e
sidechains
•
Identificare, all’interno della struttura, i residui eventualmente interessati da
mutazioni patologiche (es: F508del)
•
Confrontare le strutture 3D della proteina sana e di quella mutata.
15
Aprite DeepView, comparirà la seguente finestra.
Per inserire la proteina da analizzare, andate su File, cliccate su Open PDB File,
scegliete un file con estensione pdb e apritelo. Automaticamente la struttura della
proteina verrà inserita in una finestra posta sotto la precedente.
Centra
Informazioni
sulla proteina
Trascina
nana
zoom
ruota
Finestra in cui viene mostrata la
struttura della proteina
La finestra superiore dà accesso al menu e ai più comuni strumenti utili per manipolare la
proteina mentre la finestra posta in basso mostra la struttura della proteina.
Manipolazione della proteina
Le icone poste sotto il menu della prima finestra consentono di manipolare la proteina.
L’icona
schermo.
posta all’estrema sinistra consente di portare la proteina al centro dello
16
Le tre icone successive,
poste sopra la scritta Move all, servono a
trascinare, zoomare e ruotare la proteina. Una volta che l’icona è selezionata, (cliccando
su di essa con il mouse) si può manipolare la proteina, mostrata nella finestra sottostante,
muovendo il mouse tenendo premuto il pulsante destro.
Le icone del terzo gruppo, poste a
destra,
permettono di compiere alcune
operazioni di misura come ad esempio la distanza tra atomi, gli angoli tra atomi, ecc. di
cui però non ci occupiamo.
Cliccando sull’icona
a forma di pagina scritta, situata in basso, vicino alla scritta
Move all, si apre un’altra finestra dove sono elencate molte informazioni sulla proteina,
compresa la sua sequenza aminoacidica.
Control Panel
Si può aprire la finestra del Control Panel andando sul menu,
cliccando su Wind e su Control Panel, vi si aprirà sulla sinistra
dello schermo, una nuova finestra.
Con il mouse potete trascinare la finestra del Control Panel dove
meglio ritenete più opportuno e cambiare le sue dimensioni agendo
sui bordi.
Si usa il Contro Panel per selezionare, osservare e nascondere parte
del modello agendo sui singoli aminoacidi che sono elencati sulla
sinistra della finestra.
Il primo click sulla finestra l’attiva senza cambiare nulla. Quando si
selezionano gli aminoacidi (group), essi diventano rossi. Si
possono selezionare cliccando su ciascuno di essi o cliccando e
trascinando il mouse su di essi tenendo premuto il pulsante destro.
Premendo Invio sulla tastiera, gli aminoacidi
scompariranno tranne quelli selezionati (in
rosso).
Da notare che appare, nella colonna show del
Contro Panel, una accanto a ciascun
aminoacido selezionato, indicando che essi
sono resi visibili. Può esserci una  anche
nella colonna side indicando che i residui R
degli aminoacidi sono visibili.
A sinistra della colonna group ci sono altre due strette colonne, la
prima è vuota se la proteina è formata da un unica catena, mentre se
è formata da più catene in questa colonna compariranno delle lettere
A, B ecc. ad indicare le varie catene presenti nel cristallo; nel
Control Panel è presente una catena corrispondente ai residui
aminoacidici 389-678, corrispondente al dominio funzionale NBD1
della proteina. La seconda colonna contiene una h se il residuo fa
17
parte di un alfa elica o una s se il residuo fa parte di un beta foglietto (beta sheet). Si può
selezionare la catena A semplicemente cliccando su una A qualsiasi, tutti i gruppi A
diventeranno rossi, premendo Invio la catena A comparirà nella finestra. La stessa cosa
vale per le h o le s, premendo su una qualsiasi verranno selezionate tutte le alfa eliche (o
le beta sheet). Se si vogliono selezionare due gruppi diversi, staccati tra loro, basta
selezionare un gruppo e poi selezionare il secondo gruppo tenendo premuto il tasto
Control, una volta selezionati premere Invio per visualizzarli.
Selezionate alcuni aminoacidi e provate a cliccare sulle colonne show, side, labl, surface
( un quadrato di puntini) e ribn e guardate l’effetto.
• Labl: mostra il nome degli aminoacidi selezionati.
• Surface: mostra per ogni aminoacido, attraverso dei puntini, la superficie di van
der Waals. Altri tipi di superficie sono ottenibli nel piccolo menu posto sotto il
simbolo (triangolino nero).
• Ribn: disegna la struttura tridimensionale della protena
Sempre tenendo premuto il pulsante del mouse e trascinandolo lungo le colonne del
Control Panel si possono selezionare o deselezionare i gruppi; si può ottenere lo stesso
risultato cliccando in cima alla colonna.
Ricordate che potete centrare, spostare, zoomare, ruotare la figura nella finestra del
display utilizzando le apposite icone.
Per visualizzare la struttura ad alfa elica (in rosso) e beta foglietti (in giallo), nel Control
Panel selezionate tutti gli aminoacidi sotto la colonna ribn (tenendo cliccato control e
shift sulla tastiera), dal menu Color selezionate secondary structure e dal menu display
scegliete render in 3D.
Colorazione (menu Color)
Deep View consente di dare diversi tipi di colorazione al modello. La colorazione
consente di evidenziare e rivelare le configurazioni strutturali e chimiche della proteina.
Andare su menu Color e cliccate su:
•
•
•
•
•
Secondary Structure: le alfa-eliche verranno colorate di rosso e i beta foglietti
in giallo e le altre in grigio. Contemporaneamente la colorazione apparirà anche
sul Contro Panel, nella colonna in cui compaiono piccoli quadrati.
Secondary Structure Succession: colora le eliche e i folglietti ma l’ordine dei
colori riflette l’ordine attraverso cui le varie strutture compaiono nella proteina.
Risulta così più facile seguire la formazione di strutture secondarie lungo la
catena polipeptidica.
Chain: colorerà di colore diversi le singole catene che possono costituire una
proteina. Naturalmente, se una proteina è formata da una singola catena apparirà
colorata uniformemente.
Type: gli aminoacidi vengono colorati in base alle proprietà chimiche, i gruppi
non polari in grigio (da notare che molti gruppi non polari sono verso l’interno
perchè sono idrofobici), i gruppi acidi in rossi e basici in blu.
CPK: questa operazione riporta i gruppi ai colori standard: bianco per il
carbonio, rosso per l’ossigeno, blu per l’azoto e giallo per lo zolfo.
18
N.B Potete cambiare i colori scelti dal programma per indicare gli atomi, gli aminoacidi,
le strutture secondarie, le catene o lo sfondo andando su Preferences e cliccando su
color, si apriranno nuove finestre attraverso cui potete selezionare i colori che preferite.
Menu Select
Da menu Select si possono selezionare i sottomenu:
• All: seleziona tutti gli aminoacidi della proteina, premendo invio verranno
mostrati
• Secondary structure: permette di selezionare e mostrare premendo Invio varie
parti della proteina.
- Helices: seleziona e mostra gli aminoacidi che formano un alfa elica,
- Strand: seleziona e mostra solo le beta sheet
- Coil: seleziona e mostra il resto degli aminoacidi
• Group property: permette di selezionare e mostrare, sempre premendo Invio,
solo gli aminoacidi basici, acidi, polari o non polari.
Menu Wind
Dal menu Wind si possono selezionare i sottomenu:
• Ramachandran Plot: Si usa questa finestra per giudicare la qualità del modello,
consente di visualizzare i residui i cui angoli conformazionali stanno fuori dal
range permesso. Si possono anche cambiare gli angoli conformazionali del
modello.
• Layer Infos:questa tavola permette il controllo di molteplici modelli proteici,
permettendo di scegliere quale modello rendere visibile, quale muovere ecc.
• Alignment: La finestra alignment appare in basso, mostra la sequenza di
aminoacidi delle proteina. Si usa questa finestra quando si confrontano due o
più proteine.
19
Provate ora a selezionare nell’elenco degli aminoacidi la fenilalanina in posizione 508 e
coloratela di blu; nell’immagine in 3D visualizzerete la posizione dell’aminoacido e nella
sequenza che è comparsa sotto la figura, nella finestra Alignment, si evidenzierà
l’aminoacido prescelto.
Per confrontare la struttura della proteina CFTR sana con la proteina che presenta la
delezione della fenilalanina nella posizione 508, aprite il file 1XMJ.pdb con il software
Deep View (avete già aperta in 3D la proteina sana); le due proteine si appaieranno e,
selezionando, nel Control Panel con un colore diverso, gli aminoacidi della zona intorno
alla posizione 508, vi accorgerete che manca la fenilalanina. La struttura 1XMJ
corrisponde ai residui aminoacidici 389-678. Per confrontare le due strutture, bisogna
affiancarle nella stessa finestra. Prima avvicinare una struttura all’altra bisogna
permettere il movimento ad una sola delle due, spuntando la voce can move, in Control
Panel, solo in quella che si vuole muovere ed avvicinare (nel nostro caso la 1XMJ).
20
Al di sotto dell’immagine in 3D c’è l’allineamento tra le due catene aminoacidiche.
Per confrontare meglio le due strutture, prima di sovrapporle colorate la proteina normale
(2BBO) omogeneamente in rosa (per agire su una delle due proteine, per cambiare i
colori ecc., dovete scegliere il file da modificare dal menu a tendina subito sotto Control
Panel.
Per
sovrapporre le due
strutture,
selezionare dal menu
Fit, la voce
Magic Fit. Noterete che
la
struttura
3D della proteina mutata
si sovrappone
quasi
completamente
alla struttura
della proteina normale.
Come già detto nella Fig. 4 della scheda, la mutazione F508del causa il mancato
processamento a livello del reticolo endoplasmico della proteina CFTR. La proteina non
raggiunge la membrana non perché la sua struttura è drasticamente alterata dalla
mutazione, ma in quanto la maturazione post-traduzionale della proteina non può essere
completata a causa della mancanza di un segnale specifico in cui è coinvolta la F508. La
proteina con la delezione F508 non supera il severo controllo di qualità a cui sono
sottoposte tutte le proteine a livello del reticolo endoplasmico; di conseguenza, viene
trasportata ai proteasomi dove viene degradata.
21