Ingegneria genetica e microbiologia applicata Percorso 1, lezione #4 Dr. Marco Fondi, D.ssa Elena Perrin Contact: marco.fondi@unifi.it, elena.perrin@unifi.it www.unifi.it/dblemm/ – tel. 0552288248 Dip.to di Biologia EvoluzionisFca Laboratorio di Evoluzione Microbica e Molecolare, Università di Firenze PCR sequenziatore ATGATCACGTGATCACCATCGATGTCGATCGATCTA GCTACGATCGATCGATCGTACGTAGCTAGCTAGCTA GCTAGTAGCTACGATATTATATATACGTCGCTAGAT GCATATGCAGTATACTAGCTAACGGGGACTGATGAT AATTATATATACGCGCGCTAGCTAGCTACGTACTAT ATCAGCTAGTCGATCGATGCTAGCTAGCTAGCTAGC TAGCTAGCTGCTAGCTAGCTAGCTATGCTAAATATA TATACGCGATCATGACTGCGAGTCAGCTACTGATCA GTCGATCGATCGATCG sequenza ele7roferogramma ? ? Affiliazione tassonomica ? Da cosa parBamo? FASTA format sequence file: >Btolo_sequenza (es. 16S_gruppoXXX) ATGATCACGTGATCACCATCGATGTCGATCGATCTAGCTACGATC GATCGATCGTACGTAGCTAGCTAGCTAGCTAGTAGCTACGATAT TATATATACGTCGCTAGATGCATATGCAGTATACTAGCTAACGGG GACTGATGATAATTATATATACGCGCGCTAGCTAGCTACGTACTA TATCAGCTAGTCGATCGATGCTAGCTAGCTAGCTAGCTAGCTAG CTGCTAGCTAGCTAGCTATGCTAAATATATATACGCGATCATGAC TGCGAGTCAGCTACTGATCAGTCGATCGATCGATCG Sequence similarity search DB (NCBI) (NCBI) Organismi più simili Comparazione di Sequenze BLAST Basic Local Alignment Search Tool http://www.ncbi.nlm.nih.gov/ 1 Nr 2 Non redundant database Protein Words Query:>Btolo_sequenza GTQITVEDLFYNIATRRKALKN GTQ Word size = 3 (default) Word size can only be 2 or 3 TQI QIT ITV Make a lookup table of words TVE VED EDL DLF ... Query: GTQITVEDLFYNIATRRKALKN GTQ TQI QIT ITV TVE VED EDL DLF ... DB extend extend TVEDLFRRLKIAGTQEDLRRT GGHPYTTFWWYQLMERGTQ TVEDLFRRLKIAGTQEDLRRT Query:>Btolo_sequenza GTQITVEDLFYNIATRRKALKN TVEDLFRRLKIAGTQEDLRRT GGHPYTTFWWYQLMERGTQ ….. Score Score Score Score Score Score ….. Score E-­‐value Sequenze più simili Sequenze meno simili Caso studio 2 : idenBficazione ba7eri Fasta File Sequenze 16S ignote (es. campioni ambientali, nosocomiali) Mega4 ClustalW (MSA) (phylogeneBc tree) + Sequenze 16S di riferimento Sequences BioEdit affiliazione tassonomica Filogenesi – Descrizione delle relazioni evolutive esistenti fra gli organismi (ma anche fra specie, popolazioni, geni etc.) Analisi filogenetica: – è il metodo con cui si ricercano e si stimano queste relazioni (Greek: phylon = race and genetic = birth) INPUT: Multiallineamento (ClustalW): OUTPUT: Phylogenetic tree (Albero filogenetico): Visual representaBon of evoluBonary distances between taxa A visual representaBon (a tree) to describe the assumed evoluBon occurring between and among different groups (individuals, populaBons, species, etc.) and to study the reliability of the consensus tree. >> n° specie Page from Darwin's notebooks, 1837 Ernst Haeckel in the The Evolution of Man,1879 PhylogeneBc trees Diversi modi per rappresentare lo stesso albero filogeneBco The same data can be presented also this way Anatomy of a tree Taxon, plurale = TAXA RAMO Specie (sequence) 1 95 Specie (sequence) 2 Specie (sequence) 3 NODO Specie (gene) 4 83 68 100 55 External branch or edge Specie (sequence) 5 Specie (sequence) 6 Specie (sequence) 7 Internal branch or edge Internal node CLADE/CLUSTER/GRUPPO BOOTSTRAP VALUE External node or Bp Affiliazione mediante filogenesi Genere D 95 Genere C Genere B Genere A 83 68 Genere A 100 55 Genere XXXXXXXX Genere A Affiliazione mediante filogenesi Genere D 95 Genere C Genere B Genere A 83 68 Genere A 100 55 XXXXXXXX Genere A Genere XXXXXXXX = Genere A Le vostre sequenze su: www.unifi.it/dblemm Sezione: Didaica, Esercitazione 3 Maggio 2010