Laboratorio di Bioinformatica I Banche dati Parte 2 Dott. Sergio Marin Vargas (2014 / 2015) Google Scholar https://scholar.google.it/ E’ un motore di ricerca di Google, specializzato nella ricerca di articoli scientifici. Risultati Stringa di ricerca Filtro x anno Come citare Quanti hanno citato questo articolo Esercizio 1 Google Scholar Parte A: Trovare l’articolo originale nel quale Watson and Crick formularono l’ipotesi della struttura del DNA. In quale anno è stato pubblicato ? Da quanti è stato citato ? Parte B: Trovare l’articolo di Nature Genetics con DOI (Document of Interest) 10.1038/75556. A cosa è riferito l’articolo? Chi è il primo nome dell’articolo? A quale istituto appartiene (apparteneva) il primo nome ? Uniprot www.uniprot.org Swiss-Prot TrEMBL Stringa di ricerca Ricerca avanzata Uniprot – Risultato ricerca (TFR1) Filtri UNIPROT entry Swiss-Prot TrEMBL Uniprot – Protein Entry (TFR1) Sezioni Uniprot – Sezioni Function: Funzione della proteina e processi biologici. Names & Taxonomy: Diversi nomi della proteine, del gene e gli organismi. Subcellular location: Localizzazione della proteina nella cellula e topologia. Pathology & Biotech: Malattie correlate ed esperimenti di mutagenesis. PTM / Processing: Modificazioni Post-traduzionali ed eventi di processamento. Expression: Dove viene espressa la proteina. Interaction: Con cosa interagisce la proteina. Structure: Collegamenti ai database con la struttura 3D della proteina (se c’è) Family & Domains: Domini strutturali della proteina, motif, filogenetica. Sequence: Sequenza della proteina (delle diverse isoforme) Cross-references: Collegamenti ad altri database. Publications: Pubblicazioni. Entry information: Informazioni di UNIPROT sul entry. Miscellaneous: Qualsiasi altri informazione non compressa nelle precedenti. Similar proteins: Collegamento a UNIREF (cluster di UNIPROT). Esercizio 2 UNIPROT Nel database Uniprot si cerchi “hemoglobin subunit beta” limitando la ricerca (advanced search) a Homo sapiens (si noti l’autocompletamento). Si selezioni il primo record (P68871) Notare la differenza con l’entry di NCBI Proteins NP_000509.1. Come sono annotati le diverse regioni della sequenza in NCBI Proteins e in UNIPROT? In quali processi biologici è coinvolta? Quanti riferimento bibliografici sono presenti? Come sono annotate gli SNP? Quante strutture sono risolte per NMR? Si trovano facilmente informazioni su patologie mendeliane? Selezionare i cluster con identità al 90% ed analizzarlo. Esercizio 3 UNIPROT Nel database Uniprot si cerchi la proteina Transferrin receptor (TFR1) per l’uomo (P02786). Quante isoforme ha ? Ha la struttura risolta ? Se si, a partire da quale aminoacido è risolta. Quale è il nome del gene che la codifica (entrare in HGNC) Nel database Uniprot si cerchi la proteina Transferrin receptor 2 (TFR2) per l’uomo (Q9UP52). Quante isoforme ha, se ne ha più di una perche ? Ha la struttura risolta ? Se si, a partire da quale aminoacido è risolta. Quale è il nome del gene che la codifica (entrare in HGNC) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Esercizio 4 ExPASy Translate Scaricare il fasta della sequenza genomica di human hemoglobin subunit beta (NM_000518.4). Visitare il sito di ExPASy (expasy.org): Provare il tools TRANSLATE (resources A..Z) per tradurre automaticamente una sequenza genica in una proteica. Sottomettere la sequenza genomica scaricata Quale frame è corretto (confrontare la sequenza predetta con quella reale NP_000509.1)? Perché ci sono 6 frames? Esercizio 5 Individuare codice RefSeq di gene e proteina per RAC1 in Homo sapiens. Scaricare le sequenze FASTA Indicare la prima voce di funzione, processo e componente nella Gene Ontology In Uniprot individuare RAC1 in Homo sapiens. Qual è il suo codice Uniprot? Interagisce con la proteina ARFIP2? Esistono strutture risolte per NMR per la proteina? Secondo la risoluzione quale è la miglior struttura risolta? Ci sono isoforme della proteina, quante ? Esercizio 6 In PubMed individuare gli articoli con primo autore “Smith” e che hanno tra gli argomenti principali la malattia di Alzheimer e con l’incremento di ferro, pubblicati dal 2010 a oggi. Ripetere la ricerca utilizzando Google Scholar. Su quale rivista è stato pubblicato ?