Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica)
Bioinformatica e banche dati biologiche (CdL. Biotecnologie)
Modulo Laboratorio
A.A. 2014/2015
Docente: Dr. Sergio Marin Vargas
Mail: [email protected]
Ufficio: Ca Vignal 1, Piano -1, Stanza: S14 (Lab. di Bioinformatica)
Ricevimento: previo appuntamento via mail oppure al 0458027905
Laboratorio
Giovedì dalle 11:30 alle 14:30 – Laboratorio Delta
La frequenza non è obbligatoria ma vivamente consigliata.
Materiale Didattico della parte di Laboratorio:
http://molsim.sci.univr.it/bioinfo/web/index.php?option=com_wrapper&view=wrapper&Itemid=83
Pagine ufficiali del corso:
Biochimica - Laboratorio di Bioinformatica I (CdL. Bioinformatica)
http://www.di.univr.it/?ent=oi&cs=419&discr=&discrCd=&id=88039
Bioinformatica e banche dati biologiche (CdL. Biotecnologie)
http://www.dbt.univr.it/?ent=oi&codiceCs=S21&codins=4S02701&cs=385&discr=&discrCd
Per il modulo di laboratorio non sono necessari libri di testo, il consiglio e di seguire
l’esercitazioni, comunque possono essere utilizzati gli stessi libri della teoria.
S. Pascarella, A. Paiardini
Bioinformatica
Dalla sequenza alla struttura delle proteine
Zanichelli
Jonathan Pevsner
Bioinformatics and Functional Genomics (2nd ed.)
Wiley-Blackwell
Arthur M. Lesk
Introduzione alla bioinformatica, MgGraw Hill
Anna Tramontano
Bioinformatica, Zanichelli
G. Valle e altri.
Introduzione alla Bioinformatica , Zanichelli
4
Ci sarà un unico esame, con una parte di teoria (Prof. Alberto Ferrarini) e una
parte di laboratorio, quindi ci sarà un unico voto complessivo.
Le domande della parte di laboratorio saranno a risposte multiple ma riferiti ad
esercizi pratici al computer, come quelli che realizzeremmo durante
l’esercitazioni del corso.
Per gli studenti del CdL di Biotecnologie, la verbalizzazione del voto del corso
“Bioinformatica e Banche dati biologiche” verrà effettuata dal Prof. Alberto
Ferrarini (6 crediti).
Per gli studenti del CdL di Bioinformatica, il voto complessivo del modulo
“Biochimica - LABORATORIO DI BIOINFORMATICA I” farà poi media col
modulo “Elementi di Biochimica” della Prof.ssa Paola Dominici, sarà poi lei
chi verbalizzerà il voto complessivo (12 crediti).
Introduzione alla bioinformtica e all’utilizzo dei
computer del laboratorio
• Breve introduzione alla bioinformatica
• Utilizzo del computer, concetti basici di linux
• Utilizzo del computer, esercizi di linux
Introduzione ai database bioinformatici
• NCBI: l’interfaccia Entrez, Gene, Unigene,
Protein
• Uniprot
• PubMed e Google Scholar
Allineamenti a coppie
• Matrici a punti
• Matrici di punteggio e metodi ottimali: strumenti
online ed esempi
BLAST e PSI-BLAST
• Risorse online per le ricerche con Blast
Strumenti per gli allineamenti multipli
• Banca dati Homologene e risorse online per il
calcolo e la visualizzazione di allineamenti
multipli
Strumenti per la filogenesi:
• Mobyle dell’Institut Pasteur e Phylogeny.fr
Banche dati per la proteomica strutturale:
• Introduzione al formato di annotazione
strutturale delle proteine (PDB)
• Esercizi su PDB (Protein Data Bank)
• Esercizi su banche dati di strutture proteiche:
SCOP, CATH
Metodi per predire strutture secondarie e
caratteristiche di proteine
• PSI-PRED, JPRED e database di famiglie
strutturali
Visualizzazione di proteine, acidi nucleici e
complessi
• Visualizzazione e grafica molecolare: utilizzo di
PyMol per visualizzazione di proteine, acidi
nucleici e complessi
• Visualizzazione di proteine con VMD (Visual
Molecular Dynamics)
Introduzione alla genomica
• Introduzione al formato di annotazione di genomi
(GFF3)
• Esercizi su banche dati di dati genetici
• Esercizi su Genome Browser (Ensembl, UCSC,
NCBI e IGV)
Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione
di problemi biologici con metodi informatici.
La bioinformatica è la disciplina scientifica che cerca di risolvere problemi
biologici mediante l’elaborazione informatica dell’informazione proveniente
diretta o indirettamente da essere viventi.
Tipi di informazione:
Sequenze genomiche (DNA).
Sequenze proteiche (Polipeptidi).
Strutture 3D di proteine (NMR,
Cristallografia) cioè biologia strutturale.
Immagini (RX, TAC, MRI, US, ecc).
Concentrazioni di proteine o altre
molecole nella cellula.
Concentrazioni dei diversi corpuscoli del
sangue.
Informazione di interazione tra geni, tra
proteine, ecc (systems biology).
Pulsazioni, respiri, battiti cardiaci, ecc.
Qualsiasi altro dato che possa essere
estratto da una forma di vita.
Trascrittomica
Genomica
Proteomica
Metabolomica
La genomica è una branca della biologia molecolare che si occupa dello studio
del genoma degli organismi viventi. In particolare si occupa della struttura,
contenuto, funzione ed evoluzione del genoma. È una scienza che si basa
sulla bioinformatica per l'elaborazione e la visualizzazione dell'enorme quantità di
dati che essa produce.
Estrazione e/o cattura del DNA da essere
viventi.
Sequenziamento del DNA tramite tecnologie
NGS (Next Generation Sequencing).
Assemblaggio di genomi.
Ri-sequenziamento di genomi.
Annotazione di genomi.
Annotazione funzionale dei geni all’interno di
un genoma.
Analisi di espressione genica mediante
sequenziamento dei trascritti (RNA-Seq).
GWAS (Genome Wide Association Studies).
Analisi di varianti genetiche.
La trascrittomica è una branca della biologia molecolare che studia l'insieme
degli RNA messaggeri di una cellula chiamato anche trascrittoma. Dagli RNA
messaggeri, attraverso il processo di traduzione, derivano le proteine di cui sono
costituiti gli organismi viventi.
La proteomica è una branca della biologia molecolare che consiste
nell'identificazione sistematica di proteine e nella loro caratterizzazione rispetto
a struttura, funzione, attività, quantità e interazioni molecolari.
La metabolomica è una branca della biologia molecolare che si occupa dello
studio di come interagiscono metaboliti e proteine nel metabolismo della
cellula. Il metaboloma rappresenta l'insieme di tutti i metaboliti di un organismo
biologico, che sono i prodotti finali dell’espressione genica. E così, mentre i dati
dell'espressione genica dell'mRNA e delle analisi proteomico non spiegano
esaurientemente ciò che succede in una cellula, il profilo metabolico può fornire
un'istantanea della fisiologia di quella cellula.
La biologia di sistemi è una branca della biologia molecolare che studia gli
organismi viventi in quanto sistemi che si evolvono nel tempo, ossia
nell'interazione dinamica delle parti di cui sono composti. In particolare questo
obiettivo viene conseguito tramite l'integrazione di modelli dinamici e dei risultati
di differenti esperimenti ad alto rendimento, unendo nella pratica per esempio le
conoscenze di genomica, proteomica, trascrittomica e di teoria dei
sistemi dinamici.
La Biologia Strutturale è una sottobranca della Proteomica che si occupa dello
studio della struttura delle macromolecole biologiche, principalmente proteine e
acidi nucleici. Grazie al ripiegamento delle proteine in una specifica struttura 3D,
che esse, sono in grado di realizzare le loro funzioni, quindi conoscere la struttura
3D è fondamentale per capire il loro funzionamento.
Metodi di caratterizzazione della struttura di una proteina:
Cristallografia a RX
NMR (risonanza magnetica)
Predizione mediante Biologia Computazionale
La Biologia Computazionale consiste nell’applicare strumenti propri delle scienze dell’informazione
(es. algoritmi, intelligenza artificiale, databases) a problemi di interesse biologico, biotecnologico e
biomedico.
Nel caso della Biologia Strutturale, consiste nell’applicare strumenti informatici per predire la struttura
3D de una proteina o per fare una simulazione computazionale del suo comportamento dinamico, con
lo scopo di caratterizzare la funzione della stessa.
Metodi di biologia computazionale sono:
Molecular Docking
Homology Modeling
Molecular Dynamics
L’elaborazione di immagini biomediche è una branca della bioinformatica che si
occupa della comprensione e dell'estrazione di informazione da immagini e
segnali biomedici. Esso quindi analizza le caratteristiche dei segnali biologici
maggiormente utilizzati nella pratica clinica e quelle delle diverse tipologie di
“imaging diagnostico” (come ad esempio: RX, TAC, MRI, US, EEG, ECG, ecc). Lo
scopo principale è quello di fornire strumenti di diagnosi in ambito medico.