FARE ALCUNI ESEMPI DI DATABASE OSPITATI DAL SITO DI NCBI • PubMed è l’interfaccia di accesso a MEDLINE. E’ la banca dati per la letteratura biomedica più completa. • Nucleotide Database di sequenze nucleotidiche primario • Database di sequenze nucleotidiche secondari: • RefSeq (sistema di identificazione) • Unigene (sequenze raggruppate) • Gene è orientato ai geni, ai loci • Protein è la sezione focalizzata sulle proteine, alle quali possono corrispondere strutture • PubChem dedicato ai composti chimici • Informazioni su profili di espressione genica in diverse condizioni, modifiche post-traduzionali • GEO (Gene Expression Omnibus) repository • OMIM • …. DEFINIZIONE DI OMOLOGIA E TIPI DI OMOLOGIA • Similitudine attribuita a discendenti da un antenato comune. • Il termine OMOLOGIA indica che due entità (es. 2 sequenze) hanno una stessa origine filogenetica, cioè derivano da un antenato comune. • Si distingue dalla similitudine perché… DIFFERENZA TRA ALLINEAMENTO GLOBALE E ALLINEAMENTO LOCALE • L’allineamento globale si estende da un capo all’altro di ogni sequenza. • L’allineamento locale trova le regioni (sottosequenze) di due sequenze che si allineano in modo ottimale. SIGNIFICATO DEL VALORE ATTESO E DI BLAST • Il valore atteso E è il numero di allineamenti (high scoring segment pairs o HSP) con punteggio maggiore o uguale a un punteggio S che dovrebbero verificarsi per caso in quella ricerca sul database DESCRIVERE I PASSI PRINCIPALI DI UNA PIPELINE DI ANNOTAZIONE. • Rilevazione e mascheramento di sequenze ripetute: possono generare allineamenti spurii di EST, cDNA, etc… inoltre ORF all’interno di trasposoni verrebbero identificati da predittori ab inizio come geni codificanti proteine • Predizione ab initio: sfrutta proprietà intrinseche della sequenza quali la presenza di un codone di start e di stop, la presenza di siti accettori e donatori di splicing ecc… • Allineamento di evidenze (ESTs, cDNA, RNA-Seq, proteine di specie affini): servono a dare supporto sperimentale alla predizione genica • Generazione di un consenso tra predizioni ab initio e evidenze sperimentali: serve a selezionare un set robusto di annotazioni