La bioinformatica include: • Database che raccolgono dati sperimentali prodotti nei laboratori di ricerca • Software per la navigazione in banche dati Un database biologico è un insieme organizzato di informazioni e dati che provengono da studi in laboratori di ricerca (analisi sia in vitro che in vivo), da centri di bioinformatica (analisi in silico) e da pubblicazioni scientifiche. I Database sono costituiti da “entries”. I dati sono strutturati e organizzati in modo da essere consultabili e utilizzabili nel miglior modo possibile. I Database di primo livello raccolgono sequenze nucleotidiche (DNA, RNA) o proteiche e rendono disponibili informazioni per identificare le specie da cui hanno origine le sequenze e le loro funzioni. I Database specializzati raccolgono informazioni più specifiche sulla tassonomia, le funzioni, le pubblicazioni scientifiche, le malattie correlate alle mutazioni, delle sequenze nucleotidiche. Ecco una lista dei Database utili per i laboratori di bioinformatica (puoi copiare gli indirizzi tra i preferiti). http://www.ensembl.org Ensembl (il nome ricorda la parola francese “ensemble” e al contempo “EMBL” European Molecular Biology Laboratory) è un database nato dalla collaborazione dell’ EMBL European Bioinformatics Institute (EBI) e il Wellcome Trust Sanger Institute (WTSI) per sviluppare un sistema di software che produce e gestisce in modo automatico le annotazioni su alcuni genomi eucariotici. http://www.ncbi.nlm.nih.gov/ NCBI (National Biotechnology Institute, NIH) ha creato un database pubblico e ha sviluppato software per analizzare I dati del genoma. http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM OMIM, Online Mendelian Inheritance in Man, è una raccolta dei geni umani e delle malattie ad essi correlate. Costruito e pubblicato da Dr. Victor A. McKusick e dal suo collega Johns Hopkins, e sviluppato per internet dall’NCBI, the National Center for Biotechnology Information. Il database contiene testi e pubblicazioni scientifiche sulle malattie genetiche e molti link a MEDLINE e al database di sequenze Entrez, oltre che ad altre risorse presenti nell’NCBI. http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?CMD=search&DB=pubmed PubMed, raggiungibile dal sistema dell’ NCBI Entrez è stato sviluppato dal National Center for Biotechnology Information (NCBI) e dal National Library of Medicine (NLM), che si trova nel U.S. National Institutes of Health (NIH). PubMed permette l’accesso a informazioni bibliografiche scientifiche e mediche. http://www.expasy.org/sprot/sprot-top.html http://www.uniprot.org/ Swiss Prot è un database di sequenze proteiche che contiene un gran numero di annotazioni (come la descrizione della funzione di una proteina, I suoi domini, le modificazioni posttrascrizionali, le varianti,….), un livello molto basso di ridondanza e un alto livello di integrazione con gli altri databese biologici. http://smart.embl-heidelberg.de/ SMART (Simple Modular Architecture Research Tool) è basato sul principio che le proteine in natura sono modulari, per esempio contengono moduli funzionali (I domini) che sono rintracciabili perchè si conservano evolutivamente. SMART permette di identificare I domini proteici e di analizzarne la struttura; sono stati classificati più di 500 famiglie di domini coinvolti in fattori di trascrizione, proteine associate alla cromatina o extracellulari. Tutti questi domini sono annotati rispettando la distribuzione filogenetica, la classe funzionale, la struttura terziaria e I residui funzionali più importanti http://www.ebi.ac.uk/thornton-srv/databases/pdbsum/ Il Database PDBsum e una raccolta di immagini che permette di avere una anteprima del contenuto delle srutture in 3D delle proteine che sono raccolte da Protein Data Bank (PDB). Mostra le molecole che sostengono la struttura (per esempio le catene proteiche, i ligandi o gli ioni metallici) e uno schema delle loro interazioni. http://genome.ucsc.edu/cgi-bin/hgBlat?db=mm2 BLAT (BLAST-Like Alignment Tool), è un algoritmo ottimizzato per confrontare sequenze di cDNA (senza introni) con sequebze genomiche (che contengono introni). BLAT on DNA è utile per trovare velocemente sequenze simili per più del 95% della loro lunghezza. http://arbl.cvmbs.colostate.edu/molkit/translate/index.html Questo strumento permette di inserire sequenze di acidi (i cDNA o mRNA) per ottenere tutte le possibili forme di traduzione in sequenze amminoacidiche. DeepView (disponibile su http://www.expasy.org/spdbv/) Deep View è un potente programma di grafica, ottenibile da Expert Protein Analysis System (ExPASy) Molecular Biology Server di Ginevra. Deep View è semplice da usare e consente di vedere la struttura di una proteina e creare modelli dando una sequenza di aminoacidi; permette di vedere diverse proteine contemporaneamente e sovrapporle per comparare la loro struttura e sequenza. Per proteine di sequenze conosciute ma struttura sconosciuta, Deep View sottomette la sequenza a ExPASy per trovare analogie con altre proteine, con cui potete allineare la vostra sequenza per costruire un modello preliminare in tre dimensioni. Deep View sottopone il vostro allineamento a ExPASy, il server SWISS_MODEL costruirà un modello finale, chiamato homology model, e lo invierà al vostro indirizzo email.