Bassani_Emanuela_Relazione di laboratorio di Biologia Molecolare

Bassani Emanuela
Matricola 460402
RELAZIONE DI LABORATORIO DI BIOLOGIA MOLECOLARE II
Descrivi l’uso e l’utilità della banca dati “Homologene” presso l’NCBI
Homologene è un database biomedico la cui principale funzione è quella di classificare i geni di
specie differenti mediante l’omologia di sequenza..
HomoloGene è essenzialmente un potente tool appartenente all’NCBI (National Center for
Biotechnology Information) e rappresenta un sistema di rilevamento automatico di omologie tra
geni provenienti da diversi genomi. Quest’ultimi sono rappresentati da genomi eucariotici che sono
stati sequenziati completamente; per esempio, è in grado di analizzare l’ipotesi rappresentata da due
geni appartenenti a organismi diversi e mediante l’omologia di sequenza può predire se essi sono
attribuibili a un antenato comune che successivamente è stato in grado di divergere in due forme
distinte, ma nelle quali la funzione è rimasta inalterata o leggermente modificata.
Inoltre Homologene è in grado di trovare omologie tra sequenze geniche [geni paraloghi (geni
presenti all’interno dello stesso genoma che codificano per prodotti diversi, ma originano da un
unico gene ancestrale) e geni ortologhi (geni omologhi, presenti in specie diverse, ma correlate che
codificano per proteine con strutture e funzioni simili)] basandosi anche sulla similarità di sequenze
proteiche e permette anche di fare allineamenti multipli per trovare omologie tra le proteine. Quindi
Homologene racchiude al suo interno sia sequenze aminoacidiche di diverse proteine sia genomi
eucariotici di vari organismi. Il tool permette essenzialmente di praticare tre operazioni:
1) Allineamento si sequenze aminoacidiche e nucleotidiche.
2) Trovare informazioni su domini conservati.
3) Trovare informazioni fenotipiche di geni e proteine.
Vi è da tenere in considerazione che le sequenze di organismi procariotici non sono presenti
all’interno di questo database!
Per cercare in Homologene si può inserire nel motore di ricerca la sigla di un gene (se ne si è a
conoscenza) e lasciare la voce “Homologene” a sinistra, oppure selezionare Gene e immettere nella
ricerca il nome del gene.
Per esempio, si è scelto di ricercare il gene BCAT1 in Homologene conosciuto anche come
“cytosolic leucine aminotransferase AND sapiens” alla voce Gene.
In questo esempio si è usato l’operatore booleano AND per specificare all’interno della ricerca della
sequenza del gene la richiesta di ottenere il gene d’interesse correlato come prima scelta
all’organismo Homo Sapiens.
Nella schermata che apparirà sotto la voce “Also Know as” sono annotate tutte le possibili varianti
nominative di un dato gene. A fianco di tale stringa vi è il link Homologene, se si clicca su di esso
appariranno sullo schermo tutti i possibili organismi in cui si può ritrovare il gene ricercato (o
meglio si ritrovano i geni omologhi putativi).
Ma non solo, infatti a fianco delle informazioni riguardanti il gene stesso con i corrispettivi
organismi si ritrovano anche tutte le proteine codificate dai geni denominate con la propria sigla, la
loro lunghezza e un disegno schematico dell’allineamento delle sequenze aminoacidiche per
ricercare omologie di sequenza e di conseguenza poter trovare anche regioni conservate nella stessa
proteina in organismi diversi.
Cliccando sul nome del gene si possono ottenere molte informazioni partendo ovviamente
dall’organismo in cui è stato ritrovato tale gene, ne sono esempio il numero e la porzione del
cromosoma su cui è localizzato o la descrizione dell’azione del prodotto genico nonché le vie
metaboliche in cui esso è coinvolto. Inoltre vicino alla sigla del gene vi è una freccia che permette
di aprire una tendina in cui sono presenti dei links verso i quali si può accedere, per esempio,
ricercare articoli in PubMed o accedere a una pagina che mostrando la regione della sequenza
d’interesse ricerca gli SNPs presenti.
Poi si può procedere dirigendosi sulla parte destra della schermata alla voce links dove appare
un’altra tendina in cui si può selezionare, per esempio, la voce Gene da cui si accede a Entrez, un
sistema di ricerca integrato tra banche dati biomediche contenenti informazioni di tipo differente.
Per quanto riguarda la parte Proteins si può notare che anche ogni proteina è indicata con una sigla e
vicino a questa vi è la possibilità di aprire una tendina mediante la freccia che dà la possibilità di
accedere alle risorse dell’NCBI.
Procedendo verso il basso si può trovare la voce “Allineamento di sequenze proteiche” (Protein
Allignments) che permette di fare allineamenti multipli o allineamento di due sequenze trovando in
questo modo punteggi di similarità e distanze evolutive. Questa procedura si avvale del programma
Blast (sempre facente parte dell’NCBI) e appare una schermata che mette in evidenza anche il tasso
di sostituzioni nucleotidiche.
L’esempio sopra citato nello screenshot mostra l’allineamento di sequenze nucleotidiche in
organismi diversi prendendo come sequenza di riferimento la sequenza nucleotidica del gene
BCAT1 nell’uomo.
Inoltre dirigendosi verso la voce Domini Conservati (conserved domains) si possono trovare domini
all’interno della sequenza aminoacidica di rilevante utilità in quanto conservati.
Inoltre Homologene dà la possiblità di accede a PubMed e di raccogliere tutti gli articoli associati al
gene o a sequenze di interesse, mentre la voce “Risorse correlate all’omologia” (Related Homology
Resources) permette di accedere a dei links per osservare e computare le informazioni di omologia
in altri database.
Infine alla voce Download (che si trova in alto a destra del video) vi è la possibilità di scaricare la
sequenza proteica o la sequenza genomica o l’RNA messaggero in formato FASTA e di selezionare
gli organismi di interesse.