Seconda Prova Intercorso 16 dicembre 2009 Rispondete alle

Seconda Prova Intercorso 16 dicembre 2009
Rispondete alle domande ed inviate via e-mail ([email protected]) il file compilato
1. Riportare di seguito un allineamento multiplo di 6 sequenze proteiche che sono presenti in
Uniprot/SwissProt per la proteina IL-6.
Scrivere gli accession number delle 6 sequenze scelte:
Indicare quale residuo è più frequente in posizione 21 ed il nome del programma usato?
Inserire la tabella con le percentuali di identità di sequenza tra le 6 sequenze.
Costruire un albero filogenetico con radice delle sequenze proteiche.
2. Dato il seguente frammento genomico:
TCACCCTCACCCTCACCCTCACCCTCACCCTCACCCTAACCCTACCCTAACCCCTAACC
CCTAACCCCTAACCCCTAACCCTTAACCCTAACCCTAACCCTACCCTAACCCTAACCCT
AACCCCTAACCCCTAACCCCTAA
Ricercare in Ensembl/human su quale cromosoma è localizzato:
3. Ricercare la sequenza di IL-6 di cane (IL-6 dog) in UniProt/SwissProt.
Scrivere l’ Accession Number:
Scrivere il Peso Molecolare ed il nome del programma usato:
Scrivere il Punto isoelettrico ed il nome del programma usato:
Scrivere il numero di residui carichi positivamente ed il nome del programma usato:
Valutare dove l’IL-6 di cane è localizzata nella cellula mediante PSORT II:
4. Predire la struttura secondaria della sequenza di IL-6 di cane mediante Chou&Fasman e JPred3.
Scrivere il nome di un programma per predire il disordine e predire la propensità al disordine di IL6 di cane?
5. Predire la struttura tridimensionale della sequenza di IL-6 di cane mediante SWISSMODEL.
Scrivere il nome ed il codice PDB della proteina usata come riferimento nel modellamento:
Scrivere lo Z-score calcolato da Prosa per il modello ottenuto e per la struttura usata come
riferimento nel modellamento.
6. Ricercare il file PDB 1JL4.
Scrivere il numero di residui della catena A che interagiscono con la catena D ed il nome del
programma usato:
Scrivere il numero di legami ad idrogeno:
Scrivere il numero di ponti disolfuro:
Scrivere il numero di ponti salini:
Scrivere l’energia di binding tra la catena A e la catena D ed il nome del programma usato:
7. Data la seguente sequenza nucleotidica, predire il numero di geni contenuti in essa.
CTGTCAAGCCCAAGCCTCTCCGGGAGACGAGTACACCATCCTGGGTCGGACTNNNGGCTNNGGCACCAAACACTGGGTAA
GTGTGGAACGAGCTGCTCCTCGGGACACGGTGATGTCATCTAAACGCTCCTGTTCCTCAGGTAACTGAAGAGTCTCTGGT
CTACACAAACCTCCTCATATTCTCACCTCGAGTGACTCAGGACGGGCTCATTCGAATGGACGAAGCCGTCATTCCGATCG
AGTGCCAGTATGAAAGGTGCTTCTCCTGTCTATTAAATTCAAAGACGCCTCTGCTGCCGCTCACGTGTACCATGTCTCCT
CAGGAAGTACAGCCTGTCCAGCGGCTCCCTCAAGCCCACCTGGATCCCTTTCATGTCCACCCAAGCTGCGGTGGAAAACC
TGTCCTTTGACATGAAGCTTGTGTCGGGTGAGTTTTTGGCTGGCCTTAAACACTTGCTCAAACTGTACACGCCAACTACT
CCTGTTTCAGATGACTGGAACTACGAAAGAGGCTCCAACGTGTTTCACCTGGGGACCTCATCCCTGTGGAGGCCTCGGTC
AGAGTTGGGCACCACCTGGGCCTCCGGGTGTTTGTGAGCAGCTGCACGGCCACGCTTTCCCCGGACGCCCTCTCCCATC
CCAGACACGTCTTCATCGAAAATGGGTAAACGTCAGCTTGGCTCCCAGTGTTGTGGTCTGAATCTGGGGGAGGAGCTTGT
GAGGACTGAACTGTCAGGTTTGAGGTTCTTGACCCATTTCTGGCTCTTGTCGTAGGTGCTTCACTGACTCTCAGCTTCCA
GATTCAAAGTCTCAGTTCTTCCCGAGGATTCAGGATGAGAAGCTCCACATGGTCATCGGCGCCTTCAGGTTCCATAACCA
GGACAGCGGCGAGGTTTGACTCGGTTTGGTAAATCTCTCCCAGCTGTGTCTCCCTCATAAAGGCACGACCCGTCTCTCCC
GCAGCTCTACATCACATGTCACCTGACCGCTGTACCAACCAATGACCCAGAGGCACTGCCTAAGGCCTGCACATTTATGA
ACGGAAGGCAAGTGGCGCGTTGGAGACATCATTTTTAAACGGACTCGGAATAAAACTATCTATTTCCAGGTGGCGTTCGG
CCGACGGCAACGATTACTCGTGTGCCAACTGTCAGACCCACGGCGGCGCCGGTCACACCAGTCACACGAAACCCAGCACT
CCAGCCAAGTTTGGCCCTCGTGGCTTCGGGAAGCCAGAAAAACCGTGGAAGAGCATCGCCAAGACAAAAATGCGTAAGTT
CAATGACGCC
Scrivere il numero di geni predetti ed il programma usato:
8. Dato il seguente gene:
gctctcgtccacaagtatcactacgcg
Scrivere la traduzione di questa sequenza in una sequenza amminoacidica:
Scrivere la sequenza nucleotidica e la traduzione in sequenza amminoacidica per un
cambiamento di una singola base che non produce una mutazione di un amminoacido.
Scrivere la sequenza nucleotidica e la traduzione in sequenza amminoacidica per un
cambiamento di una singola base che produca una mutazione di un amminoacido.
9. Valutare la distanza di Hamming tra le due sequenze proteiche:
AGTCTDCAGAYPH
CGGTCDGTCADPH
10.Valutare la distanza di Levenshtein tra le due sequenze proteiche:
VSLIDTRKVHDFYEG
GSI-GTIK-HTGYHL