DOMANDE PER ALLENARSI (D: database; A: allineamenti e BLAST; M: marcatori e predizione strutt. sec.; E, recupero esercitaz.) D1. caratteristiche comuni e differenze nella struttura e nella gestione dei database flatfile e relazionali. D2. struttura di una entry di un database biologico e suoi elementi fondamentali / importanti / particolari D3. quali tipi di rapporto client-server si possono verificare nella consultazione di database biologici? D4. dati primari e secondari in un database biologico: differenza dal punto di vista “bio” e “info”. D5. UniProt e PROSITE: punti in comune e differenze nella struttura (come db) e nei contenuti D6. cosa rende più specifiche le interrogazioni complesse? D7. DBMS: cosa è, dove lo si incontra, a cosa serve. D8. indicizzazione: in quali database è importante? (e perché) D9. Differenza tra Accession e Identificativo D10. La sequenza è un elemento sempre presente nelle schede dei database bioinformatici? A1. BLAST ed i gaps: perché ci sono (biol. molecolare) e come sono pesati (bioinformatica) A2. allineamento locale e globale: punti in comune, differenze, esempi A3. variazione settings: fornirne esempi (almeno un paio) con effetti sul risultato o solo sull’output A4. si può usare una matrice PAM con blastn? Con blastx? Con tblastn? E una BLOSUM? A5. definizione e differenze: omologia, identità, similarità, positività, compatibilità A6. matrici: tipi e loro uso negli allineamenti A7. matrici: tipi, uso, vantaggi e limiti A8. a cosa serve l’allineamento multiplo? A9. schermata grafica di BLAST: cosa indica? A cosa può servire? A10. BLAST ottimizzati per usi specifici: quali sono? Quando e come usarli? A11. score ed E value: cosa sono e cosa indicano rispettivamente A12. gap penalty, window size: cosa sono e a cosa servono negli allineamenti A13. Megablast e PSI-BLAST: a cosa servono? Quali peculiarità mostrano? A14. allineamenti di sequenze di DNA e proteine: cosa c’è in comune e cosa è differente A15. blastx e tblastn: cosa hanno in comune? In cosa differiscono? Quando usare l’uno o l’altro? A16. blastx e tblastn: quando è particolarmente utile usarli? (fornire esempi) A17. PSI-BLAST: come funziona? A cosa può servire? A18. cosa lega in qualche modo l’analisi di distribuzione tassonomica alle putative funzioni? A19. i filtri: quali tipi, quali vantaggi, quali rischi A20. A cosa serve limitare le ricerche a specifici organismi (o gruppi di)? A cosa serve escluderli dalle ricerche? M1. come si trovano i falsi negativi, dato che….sono negativi? M2. marcatori e sequenze di DNA M3. quali marcatori sono, in genere, associati rispettivamente a consensus, pattern e profili? M4. PROSITE: peculiarità, contenuti, tools associati, utilità M5. posso trovare un pattern in un profilo? E il contrario? (ragionando in termini “bio” ed “info”) M6. motif, signature, regular expression, matrix, profile, pattern, consensus: definizioni, relazioni, differenze M7. quando è più importante valutare l’indice di precisione? Quando quello di recall? M8. i marcatori ad elevata frequenza hanno bassa precisione. Sono dunque inutili? M9. informazioni ottenibili con scanprosite ma non con blast e viceversa M10: che rilevanza ha la distribuzione tassonomica nello sviluppo di marcatori funzionali M11. in quali casi si incontrano (in bioinformatica) falsi positivi? Di che tipo? Trucchi per evitarli? M12. falsi positivi: cosa sono, in quali occasioni possono essere estratti e perché M13. che importanza ha la frequenza per i marcatori funzionali? M14. perché è utile poter cercare pattern leggermente degenerati? M15. su quali basi si fonda la predizione di struttura secondaria? M16. che correlazione c’è tra marcatori funzionali e predizione della struttura secondaria? M17. perché i plot di probabilità sono più informativi di un semplice output a simboli (h, e, c)? M18. come si individuano le regioni borderline attraverso predizione di strutture secondarie? M19. a cosa può servire predire, sebbene già nota, la struttura secondaria di una proteina cristallizzata? M20. perché l’uso integrato di BLAST e marcatori fornisce sempre più informazioni rispetto a un solo approccio? E1. nota la sequenza di un cDNA da studiare, quali analisi possono fornire informazioni? Di che tipo? E2. in quali casi può essere utile blastx? E ScanProsite? E3. è stato appena sequenziato il genoma di un organismo ma non ne sono stati ancora sequenziati i trascritti. Per predire i geni e le loro funzioni quali strumenti bioinformatici posso usare? E4. due proteine che sto analizzando condividono due pattern e lo stesso profilo. Avranno la stessa funzione? E5. quali putative funzioni in particolare sono fornite dai pattern?