LAUREA SPECIALISTICA IN SCIENZE BIOLOGICHE INFORMATICA A.A. 2004/2005 Docente: Dr. Antonella Rotondo [email protected] Obiettivi del corso: Il Corso di Informatica per la Laurea Specialistica in Scienze Biologiche ha come obiettivo la formazione di esperti capaci di fronteggiare l'enorme sviluppo delle aree della BioInformatica e delle Biotecnologie attraverso l’ausilio di software e tools di sviluppo specifici del settore. Programmazione delle attività: LEZIONE 1 Scenario attuale e compendio dei più diffusi software di progettazione e simulazione in ambiente scientifico. Osservabili e archivi di dati. Le pubblicazioni elettroniche. I computer e la scienza computazionale. Programmazione. Classificazione biologica e nomenclatura. Uso delle sequenze per la determinazione delle relazioni filogenetiche. Uso di SINE e LINE nella derivazione di relazioni filogenetiche.Ricerca di sequenze simili nelle banche dati: PSI-BLAST. Introduzione alla struttura delle proteine. La natura gerarchica dell’architettura delle proteine. Classificazione delle strutture proteiche. Predizione e ingegnerizzazione della struttura delle proteine. Valutazione critica delle predizioni di struttura (CASP). Ingegneria proteica LEZIONE 2 Genomica e proteomica. Intercettare la trasmissione dell’informazione genetica. Mappe a elevata risoluzione I geni che codificano per proteine. Le sequenze ripetute. L’RNA. Indicizzazione delle banche dati e specificazione dei termini di ricerca. Proseguimento della ricerca. Analisi dei dati trovati. Gli archivi. Banche dati di sequenze di acidi nucleici. Banche dati gnomiche. Banche dati di sequenze proteiche. Banche dati di strutture. Banche dati specializzate o ‘‘boutique’’ . Banche dati di espressione e proteomiche. Banche dati di vie metaboliche. Banche dati bibliografiche Compendi di banche dati e server di biologia molecolare. Accesso agli archivi. Accesso alle banche dati di biologia molecolare. Sequence Retrieval System (SRS). Protein Identification Resource (PIR). Expert Protein Analysis System (ExPASy). Ensembl. LEZIONE 3 Introduzione agli allineamenti di sequenze. Il dotplot. Dotplots e allineamenti di sequenze. Misura delle similarita' di sequenza. Assegnazione del punteggio. Valutazione dell’allineamento di due sequenze. Variazioni e generalizzazioni 159. Metodi approssimativi per lo screening veloce dei database. L’algoritmo di programmazione dinamica per l’allineamento ottimale di coppie di sequenze. Significato degli allineamenti. Allineamenti multipli di sequenze. Informazioni strutturali ottenibili dagli allineamenti multipli di sequenze. Applicazioni degli allineamenti multipli di sequenze alle ricerche nei database. I profili. PSI-BLAST. Hidden Markov Models (HMM). Filogenia. Alberi filogenetici. Metodi di raggruppamento (clustering). Metodi cladistici. Il problema delle diverse velocita' evolutive. Considerazioni dal punto di vista computazionale LEZIONE 4 Stabilita' e ripiegamento delle proteine. Il grafico di Sasisekharan-Ramakrishnan per descrivere le possibili conformazioni della catena principale. Le catene laterali. Stabilita' e denaturazione delle proteine. Il ripiegamento delle proteine. Applicazioni dell’idrofobicita'. Sovrapposizione di strutture e allineamenti strutturali. DALI (Distance-matrix ALIgnment). Evoluzione delle strutture proteiche. Classificazione delle strutture proteiche. SCOP. Predizione e modelling delle strutture proteiche. Valutazione critica delle predizioni di struttura (CASP). Predizione della struttura secondaria. Modelling per omologia. Riconoscimento del tipo di ripiegamento. Calcolo dell’energia conformazionale e dinamica molecolare. Scoperta e sviluppo di nuovi farmaci. Il composto guida. Progettazione dei farmaci con l’aiuto del computer . LEZIONE 5 L’ambiente di MatLab. Introduzione Calcolo matematico, analisi, visualizzazione e sviluppo di algoritmi Rappresentazione di arrays e le matrici Le finestre per l’editor/debugger e il command. L’esecuzione e l’archiviazione degli script. L’helpdesk e l’help in linea. Le regole fondamentali e la sintassi. . LEZIONE 6 Le costanti e le variabili numeriche e alfanumeriche. Le funzioni matematiche di base. La matematica degli arrays. Le funzioni di manipolazione degli arrays LEZIONE 7 Realizzazione di grafici bidimensionali e tridimensionali. Le funzioni plot e mesh. Costanti e variabili logiche. Gli operatori e l’uso di variabili logiche. LEZIONE 8 Gli operatori e le funzioni relazionali. Il controllo del flusso. Le funzioni di ciclo e di condizione. Esempi di M file. Funzioni definite dall’utente nella Command Window Realizzazione di function files. La stampa e il trasferimento dei grafici in altri programmi o documenti LEZIONE 9 L’applicativo Chem Office Chem Finder Analisi dei database molecolari Chem Draw Strumenti di disegno avanzati per la realizzazione di modelli strutture complesse. Attribuzione di pesi. Nomenclatura LEZIONE 10 Laboratorio: utilizzo di database biomedici LEZIONE 11 Laboratorio: produzione di grafici molecolari e strutture di dati aggregati. Utilizzo dei tool di ausilio per la produzione di modelli. LEZIONE 12 Laboratorio: implementazione di M file Materiale elettronico di riferimento: Avvalersi quanto più possibile degli strumenti informatici. Si consiglia la guida in linea degli applicativi illustrati per una conoscenza dei concetti informatici di base ed i tutorial dei software Matlab e Chem Office per la seconda parte del corso. Disponibili sul web le licenze studente necessarie per l’utilizzo dei programmi. Testo consigliato: Introduzione alla bioinformatica Editore Autore Titolo originale Editore originale Collana Mc Graw Hill Lesk Arthur M. Introduction to bioinformatics Oxford University Press Istruzione scientifica Pagine Volumi Livello Lingua Data pubblicazione ISBN 260 1 Introduttivo Italiano 06 - 2004 8838661901 Prezzo di copertina Euro 30,00 Presentazione Indice La scienza dei computer ha fornito non solo la capacita' di processare e immagazzinare i dati, ma anche i metodi, estremamente sofisticati dal punto di vista matematico, richiesti per ottenere i risultati. Il matrimonio tra la biologia e la scienza dei computer ha creato un nuovo campo chiamato "Bioinformatica", considerata oggi una scienza applicativa. Questo libro e' rivolto sia agli studenti degli ultimi anni della laurea triennale o dei primi anni della laurea specialistica, sia ai ricercatori che necessitino di informazioni su come accedere agli archivi di dati riguardanti genomi e proteine e che vogliano conoscere gli strumenti sviluppati per lavorare con questi archivi. Si presume che il lettore abbia gia' qualche conoscenza della biologia molecolare moderna e una certa dimestichezza nell’uso del computer. Il libro e' corredato di numerosi esempi svolti e di problemi che mettono alla prova e consolidano la comprensione di un argomento e forniscono l’opportunita' per fare pratica; sono inoltre presenti tre tipi di problemi, tra cui gli innovativi "Weblemi", che per essere risolti implicano l’uso e la consultazione di siti web. Nel testo si accenna anche brevemente ad aspetti di programmazione in PERL; esempi di programmi compaiono negli esercizi o nei problemi legati agli aspetti biologici. Modalità d’esame: compito + progetto prenotazione obbligatoria tramite mail [email protected]