Bassani Emanuela Matricola 460402 RELAZIONE DI LABORATORIO DI BIOLOGIA MOLECOLARE II Descrivi l’uso e l’utilità della banca dati “Homologene” presso l’NCBI Homologene è un database biomedico la cui principale funzione è quella di classificare i geni di specie differenti mediante l’omologia di sequenza.. HomoloGene è essenzialmente un potente tool appartenente all’NCBI (National Center for Biotechnology Information) e rappresenta un sistema di rilevamento automatico di omologie tra geni provenienti da diversi genomi. Quest’ultimi sono rappresentati da genomi eucariotici che sono stati sequenziati completamente; per esempio, è in grado di analizzare l’ipotesi rappresentata da due geni appartenenti a organismi diversi e mediante l’omologia di sequenza può predire se essi sono attribuibili a un antenato comune che successivamente è stato in grado di divergere in due forme distinte, ma nelle quali la funzione è rimasta inalterata o leggermente modificata. Inoltre Homologene è in grado di trovare omologie tra sequenze geniche [geni paraloghi (geni presenti all’interno dello stesso genoma che codificano per prodotti diversi, ma originano da un unico gene ancestrale) e geni ortologhi (geni omologhi, presenti in specie diverse, ma correlate che codificano per proteine con strutture e funzioni simili)] basandosi anche sulla similarità di sequenze proteiche e permette anche di fare allineamenti multipli per trovare omologie tra le proteine. Quindi Homologene racchiude al suo interno sia sequenze aminoacidiche di diverse proteine sia genomi eucariotici di vari organismi. Il tool permette essenzialmente di praticare tre operazioni: 1) Allineamento si sequenze aminoacidiche e nucleotidiche. 2) Trovare informazioni su domini conservati. 3) Trovare informazioni fenotipiche di geni e proteine. Vi è da tenere in considerazione che le sequenze di organismi procariotici non sono presenti all’interno di questo database! Per cercare in Homologene si può inserire nel motore di ricerca la sigla di un gene (se ne si è a conoscenza) e lasciare la voce “Homologene” a sinistra, oppure selezionare Gene e immettere nella ricerca il nome del gene. Per esempio, si è scelto di ricercare il gene BCAT1 in Homologene conosciuto anche come “cytosolic leucine aminotransferase AND sapiens” alla voce Gene. In questo esempio si è usato l’operatore booleano AND per specificare all’interno della ricerca della sequenza del gene la richiesta di ottenere il gene d’interesse correlato come prima scelta all’organismo Homo Sapiens. Nella schermata che apparirà sotto la voce “Also Know as” sono annotate tutte le possibili varianti nominative di un dato gene. A fianco di tale stringa vi è il link Homologene, se si clicca su di esso appariranno sullo schermo tutti i possibili organismi in cui si può ritrovare il gene ricercato (o meglio si ritrovano i geni omologhi putativi). Ma non solo, infatti a fianco delle informazioni riguardanti il gene stesso con i corrispettivi organismi si ritrovano anche tutte le proteine codificate dai geni denominate con la propria sigla, la loro lunghezza e un disegno schematico dell’allineamento delle sequenze aminoacidiche per ricercare omologie di sequenza e di conseguenza poter trovare anche regioni conservate nella stessa proteina in organismi diversi. Cliccando sul nome del gene si possono ottenere molte informazioni partendo ovviamente dall’organismo in cui è stato ritrovato tale gene, ne sono esempio il numero e la porzione del cromosoma su cui è localizzato o la descrizione dell’azione del prodotto genico nonché le vie metaboliche in cui esso è coinvolto. Inoltre vicino alla sigla del gene vi è una freccia che permette di aprire una tendina in cui sono presenti dei links verso i quali si può accedere, per esempio, ricercare articoli in PubMed o accedere a una pagina che mostrando la regione della sequenza d’interesse ricerca gli SNPs presenti. Poi si può procedere dirigendosi sulla parte destra della schermata alla voce links dove appare un’altra tendina in cui si può selezionare, per esempio, la voce Gene da cui si accede a Entrez, un sistema di ricerca integrato tra banche dati biomediche contenenti informazioni di tipo differente. Per quanto riguarda la parte Proteins si può notare che anche ogni proteina è indicata con una sigla e vicino a questa vi è la possibilità di aprire una tendina mediante la freccia che dà la possibilità di accedere alle risorse dell’NCBI. Procedendo verso il basso si può trovare la voce “Allineamento di sequenze proteiche” (Protein Allignments) che permette di fare allineamenti multipli o allineamento di due sequenze trovando in questo modo punteggi di similarità e distanze evolutive. Questa procedura si avvale del programma Blast (sempre facente parte dell’NCBI) e appare una schermata che mette in evidenza anche il tasso di sostituzioni nucleotidiche. L’esempio sopra citato nello screenshot mostra l’allineamento di sequenze nucleotidiche in organismi diversi prendendo come sequenza di riferimento la sequenza nucleotidica del gene BCAT1 nell’uomo. Inoltre dirigendosi verso la voce Domini Conservati (conserved domains) si possono trovare domini all’interno della sequenza aminoacidica di rilevante utilità in quanto conservati. Inoltre Homologene dà la possiblità di accede a PubMed e di raccogliere tutti gli articoli associati al gene o a sequenze di interesse, mentre la voce “Risorse correlate all’omologia” (Related Homology Resources) permette di accedere a dei links per osservare e computare le informazioni di omologia in altri database. Infine alla voce Download (che si trova in alto a destra del video) vi è la possibilità di scaricare la sequenza proteica o la sequenza genomica o l’RNA messaggero in formato FASTA e di selezionare gli organismi di interesse.