Fare alcuni esempi di database ospitati dal sito di NCBI

annuncio pubblicitario
FARE ALCUNI ESEMPI DI DATABASE
OSPITATI DAL SITO DI NCBI
• PubMed è l’interfaccia di accesso a MEDLINE. E’ la banca dati per la
letteratura biomedica più completa.
• Nucleotide  Database di sequenze nucleotidiche primario
•
Database di sequenze nucleotidiche secondari:
• RefSeq (sistema di identificazione)
• Unigene (sequenze raggruppate)
• Gene è orientato ai geni, ai loci
• Protein è la sezione focalizzata sulle proteine, alle quali possono
corrispondere strutture
• PubChem dedicato ai composti chimici
• Informazioni su profili di espressione genica in diverse condizioni,
modifiche post-traduzionali
• GEO (Gene Expression Omnibus) repository
• OMIM
• ….
DEFINIZIONE DI OMOLOGIA E TIPI
DI OMOLOGIA
• Similitudine attribuita a discendenti da un
antenato comune.
• Il termine OMOLOGIA indica che due
entità (es. 2 sequenze) hanno una stessa
origine filogenetica, cioè derivano da un
antenato comune.
• Si distingue dalla similitudine perché…
DIFFERENZA TRA ALLINEAMENTO
GLOBALE E ALLINEAMENTO LOCALE
• L’allineamento globale si estende da un capo
all’altro di ogni sequenza.
• L’allineamento locale trova le regioni
(sottosequenze) di due sequenze che si
allineano in modo ottimale.
SIGNIFICATO DEL VALORE ATTESO E
DI BLAST
• Il valore atteso E è il numero di allineamenti
(high scoring segment pairs o HSP) con
punteggio maggiore o uguale a un punteggio S
che dovrebbero verificarsi per caso in quella
ricerca sul database
DESCRIVERE I PASSI PRINCIPALI DI
UNA PIPELINE DI ANNOTAZIONE.
• Rilevazione e mascheramento di sequenze ripetute:
possono generare allineamenti spurii di EST, cDNA, etc…
inoltre ORF all’interno di trasposoni verrebbero identificati
da predittori ab inizio come geni codificanti proteine
• Predizione ab initio: sfrutta proprietà intrinseche della
sequenza quali la presenza di un codone di start e di stop,
la presenza di siti accettori e donatori di splicing ecc…
• Allineamento di evidenze (ESTs, cDNA, RNA-Seq, proteine di
specie affini): servono a dare supporto sperimentale alla
predizione genica
• Generazione di un consenso tra predizioni ab initio e
evidenze sperimentali: serve a selezionare un set robusto di
annotazioni
Scarica