Workshop BIOCRITTO 2011 Stato dell’arte sui dati genomici Roberto Bertorelli Next Generation Sequencing Facility CIBIO University of Trento DATI GENETICI - DATI GENOMICI DATI GENETICI Le informazioni relative ai caratteri ereditari degli individui ottenute mediante l'analisi degli acidi nucleici o altre analisi scientifiche (Dichiarazione internazionale sui dati genetici umani, UNESCO). DATI GENOMICI Le conoscenze relative ai sistemi informazionali degli esseri viventi (i genomi). - Annotazioni dei genomi rispetto ad elementi funzionali (geni; elementi regolativi, etc.) Annotazioni dei genomi rispetto al grado di conservazione (genomica comparativa) Genotyping • In the human genome about one in every 1,200 bases, on average will differ. – Single nucleotide polymorphism (SNP) ~107 – Insertion – Deletion • Each distinct "spelling" of a chromosomal region is called an allele, and a collection of alleles in a person's chromosomes is known as a genotype. PAR1 UMANA 1988 Sommario dei dati di Weissenbach; 1987 e Goodfellow; 1986 (Brown W.R.A.; 1988) PAR1 UMANA 2011 http://hapmap.ncbi.nlm.nih.gov/ http://genome.ucsc.edu/cgi-bin/hgGateway The UCSC Genome Browser was created by the Genome Bioinformatics Group of UC Santa Cruz. Software Copyright (c) The Regents of the University of California. All rights reserved. Sanger Sequencing • Mix DNA with dNTPs and ddNTPs • Amplify • Run in Gel- Capillary – Fragments migrate distance that is proportional to their size 11 Copy number variation A brief history of gene expression profiling Why a Revolution G20 454 LIFE SCIENCE 1975 2001 2005 HISEQ2000 5500XL 2011 The 3 phases of NGS Massive Parallel Sequencing • DNA shearing • Adapter ligation • Amplification • Anchoring template preparation Sanger like sequencing sequencing by imaging • Nucleotide addition • Fluorophor release • Deblocking • Image capturing • Base calling • Base quality evaluation • Read Alignment • Contig construction data analysis Next Generation Sequencing MICROARRAY AND NGS DATABASES (FOR RESEARCH) DATI GENETICI SENSIBILI PORZIONE CODIFICANTE (EXOMA) E REGIONI REGOLATIVE - Geni responsabili di patologie mendeliane, in eterozigosi o omozigosi (es. Corea di Huntington; DMD; Fibrosi cistica) - Geni associati a patologie complesse di tipo psichiatrico o neurodegenerativo in eterozigosi o omozigosi (es. Schizofrenia, disturbi bipolari, Alzheimer, Parkinson, SLA) - Geni associati a malattie complesse di altro tipo, in eterozigosi o omozigosi (es. cardiopatie, aterosclerosi) - Geni associati a tratti comportamentali, in eterozigosi ed in omozigosi (es. intelligenza, introversione ed estroversione, comportamenti aggressivi ed antisociali, abuso di alcool e droghe) - Geni associati in modo mendeliano o non mendeliano a tratti somatici (es. colore occhi, colore capelli, altezza) - Geni associati in modo mendeliano o non mendeliano a tratti di altro tipo PORZIONE NON CODIFICANTE - Protezione per l’impiego nella identificazione individuale http://www.unitn.it/en/cibio NGS Core Facility Veronica de Sanctis- [email protected] Roberto Bertorelli- [email protected]