laurea specialistica in scienze biologiche

LAUREA SPECIALISTICA IN SCIENZE BIOLOGICHE
INFORMATICA
A.A. 2004/2005
Docente: Dr. Antonella Rotondo
[email protected]
Obiettivi del corso:
Il Corso di Informatica per la Laurea Specialistica in Scienze Biologiche ha come obiettivo la formazione di
esperti capaci di fronteggiare l'enorme sviluppo delle aree della BioInformatica e delle Biotecnologie
attraverso l’ausilio di software e tools di sviluppo specifici del settore.
Programmazione delle attività:
LEZIONE 1
Scenario attuale e compendio dei più diffusi software di progettazione e simulazione in ambiente
scientifico. Osservabili e archivi di dati. Le pubblicazioni elettroniche. I computer e la scienza
computazionale. Programmazione. Classificazione biologica e nomenclatura. Uso delle sequenze per la
determinazione delle relazioni filogenetiche. Uso di SINE e LINE nella derivazione di relazioni
filogenetiche.Ricerca di sequenze simili nelle banche dati: PSI-BLAST. Introduzione alla struttura delle
proteine. La natura gerarchica dell’architettura delle proteine. Classificazione delle strutture proteiche.
Predizione e ingegnerizzazione della struttura delle proteine. Valutazione critica delle predizioni di
struttura (CASP). Ingegneria proteica
LEZIONE 2
Genomica e proteomica. Intercettare la trasmissione dell’informazione genetica. Mappe a elevata
risoluzione
I geni che codificano per proteine. Le sequenze ripetute. L’RNA. Indicizzazione delle banche dati e
specificazione dei termini di ricerca. Proseguimento della ricerca. Analisi dei dati trovati. Gli archivi.
Banche dati di sequenze di acidi nucleici. Banche dati gnomiche. Banche dati di sequenze proteiche.
Banche dati di strutture. Banche dati specializzate o ‘‘boutique’’ . Banche dati di espressione e
proteomiche. Banche dati di vie metaboliche. Banche dati bibliografiche Compendi di banche dati e
server di biologia molecolare. Accesso agli archivi. Accesso alle banche dati di biologia molecolare.
Sequence Retrieval System (SRS). Protein Identification Resource (PIR). Expert Protein Analysis System
(ExPASy). Ensembl.
LEZIONE 3
Introduzione agli allineamenti di sequenze. Il dotplot. Dotplots e allineamenti di sequenze. Misura delle
similarita' di sequenza. Assegnazione del punteggio. Valutazione dell’allineamento di due sequenze.
Variazioni e generalizzazioni 159. Metodi approssimativi per lo screening veloce dei database. L’algoritmo
di programmazione dinamica per l’allineamento ottimale di coppie di sequenze. Significato degli
allineamenti. Allineamenti multipli di sequenze. Informazioni strutturali ottenibili dagli allineamenti
multipli di sequenze. Applicazioni degli allineamenti multipli di sequenze alle ricerche nei database. I
profili. PSI-BLAST. Hidden Markov Models (HMM). Filogenia. Alberi filogenetici. Metodi di
raggruppamento (clustering). Metodi cladistici. Il problema delle diverse velocita' evolutive.
Considerazioni dal punto di vista computazionale
LEZIONE 4
Stabilita' e ripiegamento delle proteine. Il grafico di Sasisekharan-Ramakrishnan per descrivere le
possibili conformazioni della catena principale. Le catene laterali. Stabilita' e denaturazione delle
proteine. Il ripiegamento delle proteine. Applicazioni dell’idrofobicita'. Sovrapposizione di strutture e
allineamenti strutturali. DALI (Distance-matrix ALIgnment). Evoluzione delle strutture proteiche.
Classificazione delle strutture proteiche. SCOP. Predizione e modelling delle strutture proteiche.
Valutazione critica delle predizioni di struttura (CASP). Predizione della struttura secondaria. Modelling
per omologia. Riconoscimento del tipo di ripiegamento. Calcolo dell’energia conformazionale e dinamica
molecolare. Scoperta e sviluppo di nuovi farmaci. Il composto guida. Progettazione dei farmaci con
l’aiuto del computer .
LEZIONE 5
L’ambiente di MatLab.
Introduzione
Calcolo matematico, analisi, visualizzazione e sviluppo di algoritmi
Rappresentazione di arrays e le matrici
Le finestre per l’editor/debugger e il command.
L’esecuzione e l’archiviazione degli script. L’helpdesk e l’help in linea.
Le regole fondamentali e la sintassi.
.
LEZIONE 6
Le costanti e le variabili numeriche e alfanumeriche.
Le funzioni matematiche di base.
La matematica degli arrays.
Le funzioni di manipolazione degli arrays
LEZIONE 7
Realizzazione di grafici bidimensionali e tridimensionali.
Le funzioni plot e mesh.
Costanti e variabili logiche.
Gli operatori e l’uso di variabili logiche.
LEZIONE 8
Gli operatori e le funzioni relazionali. Il controllo del flusso.
Le funzioni di ciclo e di condizione.
Esempi di M file.
Funzioni definite dall’utente nella Command Window
Realizzazione di function files.
La stampa e il trasferimento dei grafici in altri programmi o documenti
LEZIONE 9
L’applicativo Chem Office
Chem Finder
Analisi dei database molecolari
Chem Draw
Strumenti di disegno avanzati per la realizzazione di modelli strutture complesse.
Attribuzione di pesi.
Nomenclatura
LEZIONE 10
Laboratorio: utilizzo di database biomedici
LEZIONE 11
Laboratorio: produzione di grafici molecolari e strutture di dati aggregati. Utilizzo dei tool di ausilio
per la produzione di modelli.
LEZIONE 12
Laboratorio: implementazione di M file
Materiale elettronico di riferimento:
Avvalersi quanto più possibile degli strumenti informatici. Si consiglia la guida in linea degli applicativi
illustrati per una conoscenza dei concetti informatici di base ed i tutorial dei software Matlab e Chem Office
per la seconda parte del corso. Disponibili sul web le licenze studente necessarie per l’utilizzo dei programmi.
Testo consigliato:
Introduzione alla bioinformatica
Editore
Autore
Titolo originale
Editore
originale
Collana
Mc Graw Hill
Lesk Arthur M.
Introduction to bioinformatics
Oxford University Press
Istruzione scientifica
Pagine
Volumi
Livello
Lingua
Data
pubblicazione
ISBN
260
1
Introduttivo
Italiano
06 - 2004
8838661901
Prezzo di copertina
Euro 30,00
Presentazione
Indice
La scienza dei computer ha fornito non solo la capacita' di processare e immagazzinare i dati, ma
anche i metodi, estremamente sofisticati dal punto di vista matematico, richiesti per ottenere i
risultati. Il matrimonio tra la biologia e la scienza dei computer ha creato un nuovo campo chiamato
"Bioinformatica", considerata oggi una scienza applicativa.
Questo libro e' rivolto sia agli studenti degli ultimi anni della laurea triennale o dei primi anni della
laurea specialistica, sia ai ricercatori che necessitino di informazioni su come accedere agli archivi
di dati riguardanti genomi e proteine e che vogliano conoscere gli strumenti sviluppati per lavorare
con questi archivi. Si presume che il lettore abbia gia' qualche conoscenza della biologia molecolare
moderna e una certa dimestichezza nell’uso del computer.
Il libro e' corredato di numerosi esempi svolti e di problemi che mettono alla prova e consolidano la
comprensione di un argomento e forniscono l’opportunita' per fare pratica; sono inoltre presenti tre
tipi di problemi, tra cui gli innovativi "Weblemi", che per essere risolti implicano l’uso e la
consultazione di siti web. Nel testo si accenna anche brevemente ad aspetti di programmazione in
PERL; esempi di programmi compaiono negli esercizi o nei problemi legati agli aspetti biologici.
Modalità d’esame: compito + progetto prenotazione obbligatoria tramite mail [email protected]