Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica) Bioinformatica e banche dati biologiche (CdL. Biotecnologie) Modulo Laboratorio A.A. 2014/2015 Docente: Dr. Sergio Marin Vargas Mail: [email protected] Ufficio: Ca Vignal 1, Piano -1, Stanza: S14 (Lab. di Bioinformatica) Ricevimento: previo appuntamento via mail oppure al 0458027905 Laboratorio Giovedì dalle 11:30 alle 14:30 – Laboratorio Delta La frequenza non è obbligatoria ma vivamente consigliata. Materiale Didattico della parte di Laboratorio: http://molsim.sci.univr.it/bioinfo/web/index.php?option=com_wrapper&view=wrapper&Itemid=83 Pagine ufficiali del corso: Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica) http://www.di.univr.it/?ent=oi&cs=419&discr=&discrCd=&id=88039 Bioinformatica e banche dati biologiche (CdL. Biotecnologie) http://www.dbt.univr.it/?ent=oi&codiceCs=S21&codins=4S02701&cs=385&discr=&discrCd Per il modulo di laboratorio non sono necessari libri di testo, il consiglio e di seguire l’esercitazioni, comunque possono essere utilizzati gli stessi libri della teoria. S. Pascarella, A. Paiardini Bioinformatica Dalla sequenza alla struttura delle proteine Zanichelli Jonathan Pevsner Bioinformatics and Functional Genomics (2nd ed.) Wiley-Blackwell Arthur M. Lesk Introduzione alla bioinformatica, MgGraw Hill Anna Tramontano Bioinformatica, Zanichelli G. Valle e altri. Introduzione alla Bioinformatica , Zanichelli 4 Ci sarà un unico esame, con una parte di teoria (Prof. Alberto Ferrarini) e una parte di laboratorio, quindi ci sarà un unico voto complessivo. Le domande della parte di laboratorio saranno a risposte multiple ma riferiti ad esercizi pratici al computer, come quelli che realizzeremmo durante l’esercitazioni del corso. Per gli studenti del CdL di Biotecnologie, la verbalizzazione del voto del corso “Bioinformatica e Banche dati biologiche” verrà effettuata dal Prof. Alberto Ferrarini (6 crediti). Per gli studenti del CdL di Bioinformatica, il voto complessivo del modulo “Biochimica - LABORATORIO DI BIOINFORMATICA I” farà poi media col modulo “Elementi di Biochimica” della Prof.ssa Paola Dominici, sarà poi lei chi verbalizzerà il voto complessivo (12 crediti). Introduzione alla bioinformtica e all’utilizzo dei computer del laboratorio • Breve introduzione alla bioinformatica • Utilizzo del computer, concetti basici di linux • Utilizzo del computer, esercizi di linux Introduzione ai database bioinformatici • NCBI: l’interfaccia Entrez, Gene, Unigene, Protein • Uniprot • PubMed e Google Scholar Allineamenti a coppie • Matrici a punti • Matrici di punteggio e metodi ottimali: strumenti online ed esempi BLAST e PSI-BLAST • Risorse online per le ricerche con Blast Strumenti per gli allineamenti multipli • Banca dati Homologene e risorse online per il calcolo e la visualizzazione di allineamenti multipli Strumenti per la filogenesi: • Mobyle dell’Institut Pasteur e Phylogeny.fr Banche dati per la proteomica strutturale: • Introduzione al formato di annotazione strutturale delle proteine (PDB) • Esercizi su PDB (Protein Data Bank) • Esercizi su banche dati di strutture proteiche: SCOP, CATH Metodi per predire strutture secondarie e caratteristiche di proteine • PSI-PRED, JPRED e database di famiglie strutturali Visualizzazione di proteine, acidi nucleici e complessi • Visualizzazione e grafica molecolare: utilizzo di PyMol per visualizzazione di proteine, acidi nucleici e complessi • Visualizzazione di proteine con VMD (Visual Molecular Dynamics) Introduzione alla genomica • Introduzione al formato di annotazione di genomi (GFF3) • Esercizi su banche dati di dati genetici • Esercizi su Genome Browser (Ensembl, UCSC, NCBI e IGV) Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici con metodi informatici. La bioinformatica è la disciplina scientifica che cerca di risolvere problemi biologici mediante l’elaborazione informatica dell’informazione proveniente diretta o indirettamente da essere viventi. Tipi di informazione: Sequenze genomiche (DNA). Sequenze proteiche (Polipeptidi). Strutture 3D di proteine (NMR, Cristallografia) cioè biologia strutturale. Immagini (RX, TAC, MRI, US, ecc). Concentrazioni di proteine o altre molecole nella cellula. Concentrazioni dei diversi corpuscoli del sangue. Informazione di interazione tra geni, tra proteine, ecc (systems biology). Pulsazioni, respiri, battiti cardiaci, ecc. Qualsiasi altro dato che possa essere estratto da una forma di vita. Trascrittomica Genomica Proteomica Metabolomica La genomica è una branca della biologia molecolare che si occupa dello studio del genoma degli organismi viventi. In particolare si occupa della struttura, contenuto, funzione ed evoluzione del genoma. È una scienza che si basa sulla bioinformatica per l'elaborazione e la visualizzazione dell'enorme quantità di dati che essa produce. Estrazione e/o cattura del DNA da essere viventi. Sequenziamento del DNA tramite tecnologie NGS (Next Generation Sequencing). Assemblaggio di genomi. Ri-sequenziamento di genomi. Annotazione di genomi. Annotazione funzionale dei geni all’interno di un genoma. Analisi di espressione genica mediante sequenziamento dei trascritti (RNA-Seq). GWAS (Genome Wide Association Studies). Analisi di varianti genetiche. La trascrittomica è una branca della biologia molecolare che studia l'insieme degli RNA messaggeri di una cellula chiamato anche trascrittoma. Dagli RNA messaggeri, attraverso il processo di traduzione, derivano le proteine di cui sono costituiti gli organismi viventi. La proteomica è una branca della biologia molecolare che consiste nell'identificazione sistematica di proteine e nella loro caratterizzazione rispetto a struttura, funzione, attività, quantità e interazioni molecolari. La metabolomica è una branca della biologia molecolare che si occupa dello studio di come interagiscono metaboliti e proteine nel metabolismo della cellula. Il metaboloma rappresenta l'insieme di tutti i metaboliti di un organismo biologico, che sono i prodotti finali dell’espressione genica. E così, mentre i dati dell'espressione genica dell'mRNA e delle analisi proteomico non spiegano esaurientemente ciò che succede in una cellula, il profilo metabolico può fornire un'istantanea della fisiologia di quella cellula. La biologia di sistemi è una branca della biologia molecolare che studia gli organismi viventi in quanto sistemi che si evolvono nel tempo, ossia nell'interazione dinamica delle parti di cui sono composti. In particolare questo obiettivo viene conseguito tramite l'integrazione di modelli dinamici e dei risultati di differenti esperimenti ad alto rendimento, unendo nella pratica per esempio le conoscenze di genomica, proteomica, trascrittomica e di teoria dei sistemi dinamici. La Biologia Strutturale è una sottobranca della Proteomica che si occupa dello studio della struttura delle macromolecole biologiche, principalmente proteine e acidi nucleici. Grazie al ripiegamento delle proteine in una specifica struttura 3D, che esse, sono in grado di realizzare le loro funzioni, quindi conoscere la struttura 3D è fondamentale per capire il loro funzionamento. Metodi di caratterizzazione della struttura di una proteina: Cristallografia a RX NMR (risonanza magnetica) Predizione mediante Biologia Computazionale La Biologia Computazionale consiste nell’applicare strumenti propri delle scienze dell’informazione (es. algoritmi, intelligenza artificiale, databases) a problemi di interesse biologico, biotecnologico e biomedico. Nel caso della Biologia Strutturale, consiste nell’applicare strumenti informatici per predire la struttura 3D de una proteina o per fare una simulazione computazionale del suo comportamento dinamico, con lo scopo di caratterizzare la funzione della stessa. Metodi di biologia computazionale sono: Molecular Docking Homology Modeling Molecular Dynamics L’elaborazione di immagini biomediche è una branca della bioinformatica che si occupa della comprensione e dell'estrazione di informazione da immagini e segnali biomedici. Esso quindi analizza le caratteristiche dei segnali biologici maggiormente utilizzati nella pratica clinica e quelle delle diverse tipologie di “imaging diagnostico” (come ad esempio: RX, TAC, MRI, US, EEG, ECG, ecc). Lo scopo principale è quello di fornire strumenti di diagnosi in ambito medico.