La bioinformatica include: • Database che raccolgono

La bioinformatica include:
• Database che raccolgono dati sperimentali prodotti nei laboratori di ricerca
• Software per la navigazione in banche dati
Un database biologico è un insieme organizzato di informazioni e dati che
provengono da studi in laboratori di ricerca (analisi sia in vitro che in vivo), da centri
di bioinformatica (analisi in silico) e da pubblicazioni scientifiche.
I Database sono costituiti da “entries”.
I dati sono strutturati e organizzati in modo da essere consultabili e utilizzabili nel
miglior modo possibile.
I Database di primo livello raccolgono sequenze nucleotidiche (DNA, RNA) o
proteiche e rendono disponibili informazioni per identificare le specie da cui hanno
origine le sequenze e le loro funzioni.
I Database specializzati raccolgono informazioni più specifiche sulla tassonomia, le
funzioni, le pubblicazioni scientifiche, le malattie correlate alle mutazioni, delle
sequenze nucleotidiche.
Ecco una lista dei Database utili per i laboratori di bioinformatica (puoi copiare gli
indirizzi tra i preferiti).
http://www.ensembl.org
Ensembl (il nome ricorda la parola francese “ensemble” e al contempo “EMBL” European
Molecular Biology Laboratory) è un database nato dalla collaborazione dell’ EMBL European Bioinformatics Institute (EBI) e il Wellcome Trust Sanger Institute (WTSI) per
sviluppare un sistema di software che produce e gestisce in modo automatico le annotazioni
su alcuni genomi eucariotici.
http://www.ncbi.nlm.nih.gov/
NCBI (National Biotechnology Institute, NIH) ha creato un database pubblico e ha sviluppato
software per analizzare I dati del genoma.
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM
OMIM, Online Mendelian Inheritance in Man, è una raccolta dei geni umani e delle malattie
ad essi correlate. Costruito e pubblicato da Dr. Victor A. McKusick e dal suo collega Johns
Hopkins, e sviluppato per internet dall’NCBI, the National Center for Biotechnology
Information. Il database contiene testi e pubblicazioni scientifiche sulle malattie genetiche e
molti link a MEDLINE e al database di sequenze Entrez, oltre che ad altre risorse presenti
nell’NCBI.
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?CMD=search&DB=pubmed
PubMed, raggiungibile dal sistema dell’ NCBI Entrez è stato sviluppato dal National Center
for Biotechnology Information (NCBI) e dal National Library of Medicine (NLM), che si
trova nel U.S. National Institutes of Health (NIH). PubMed permette l’accesso a informazioni
bibliografiche scientifiche e mediche.
http://www.expasy.org/sprot/sprot-top.html
http://www.uniprot.org/
Swiss Prot è un database di sequenze proteiche che contiene un gran numero di annotazioni
(come la descrizione della funzione di una proteina, I suoi domini, le modificazioni posttrascrizionali, le varianti,….), un livello molto basso di ridondanza e un alto livello di
integrazione con gli altri databese biologici.
http://smart.embl-heidelberg.de/
SMART (Simple Modular Architecture Research Tool) è basato sul principio che le proteine
in natura sono modulari, per esempio contengono moduli funzionali (I domini) che sono
rintracciabili perchè si conservano evolutivamente. SMART permette di identificare I domini
proteici e di analizzarne la struttura; sono stati classificati più di 500 famiglie di domini
coinvolti in fattori di trascrizione, proteine associate alla cromatina o extracellulari. Tutti
questi domini sono annotati rispettando la distribuzione filogenetica, la classe funzionale, la
struttura terziaria e I residui funzionali più importanti
http://www.ebi.ac.uk/thornton-srv/databases/pdbsum/
Il Database PDBsum e una raccolta di immagini che permette di avere una anteprima del
contenuto delle srutture in 3D delle proteine che sono raccolte da Protein Data Bank (PDB).
Mostra le molecole che sostengono la struttura (per esempio le catene proteiche, i ligandi o
gli ioni metallici) e uno schema delle loro interazioni.
http://genome.ucsc.edu/cgi-bin/hgBlat?db=mm2
BLAT (BLAST-Like Alignment Tool), è un algoritmo ottimizzato per confrontare sequenze
di cDNA (senza introni) con sequebze genomiche (che contengono introni). BLAT on DNA
è utile per trovare velocemente sequenze simili per più del 95% della loro lunghezza.
http://arbl.cvmbs.colostate.edu/molkit/translate/index.html
Questo strumento permette di inserire sequenze di acidi (i cDNA o mRNA) per ottenere tutte
le possibili forme di traduzione in sequenze amminoacidiche.
DeepView (disponibile su http://www.expasy.org/spdbv/)
Deep View è un potente programma di grafica, ottenibile da Expert Protein Analysis System
(ExPASy) Molecular Biology Server di Ginevra.
Deep View è semplice da usare e consente di vedere la struttura di una proteina e creare
modelli dando una sequenza di aminoacidi; permette di vedere diverse proteine
contemporaneamente e sovrapporle per comparare la loro struttura e sequenza. Per proteine
di sequenze conosciute ma struttura sconosciuta, Deep View sottomette la sequenza a
ExPASy per trovare analogie con altre proteine, con cui potete allineare la vostra sequenza
per costruire un modello preliminare in tre dimensioni. Deep View sottopone il vostro
allineamento a ExPASy, il server SWISS_MODEL costruirà un modello finale, chiamato
homology model, e lo invierà al vostro indirizzo email.