Workshop BIOCRITTO 2011
Stato dell’arte sui dati genomici
Roberto Bertorelli
Next Generation Sequencing Facility
CIBIO
University of Trento
DATI GENETICI - DATI GENOMICI
DATI GENETICI
Le informazioni relative ai caratteri ereditari degli individui
ottenute mediante l'analisi degli acidi nucleici o altre analisi
scientifiche (Dichiarazione internazionale sui dati genetici umani,
UNESCO).
DATI GENOMICI
Le conoscenze relative ai sistemi informazionali degli esseri
viventi (i genomi).
-
Annotazioni dei genomi rispetto ad elementi funzionali (geni;
elementi regolativi, etc.)
Annotazioni dei genomi rispetto al grado di conservazione
(genomica comparativa)
Genotyping
•
In the human genome about one in every 1,200 bases, on average will differ.
– Single nucleotide polymorphism (SNP) ~107
– Insertion
– Deletion
•
Each distinct "spelling" of a chromosomal region is called an allele, and a collection
of alleles in a person's chromosomes is known as a genotype.
PAR1 UMANA 1988
Sommario dei dati di Weissenbach; 1987
e Goodfellow; 1986 (Brown W.R.A.; 1988)
PAR1 UMANA
2011
http://hapmap.ncbi.nlm.nih.gov/
http://genome.ucsc.edu/cgi-bin/hgGateway
The UCSC Genome Browser was created by the Genome Bioinformatics Group of UC Santa Cruz.
Software Copyright (c) The Regents of the University of California. All rights reserved.
Sanger Sequencing
• Mix DNA with dNTPs and
ddNTPs
• Amplify
• Run in Gel- Capillary
– Fragments migrate distance that is
proportional to their size
11
Copy number variation
A brief history of
gene expression profiling
Why a Revolution
G20
454 LIFE SCIENCE
1975
2001
2005
HISEQ2000
5500XL
2011
The 3 phases of NGS
Massive Parallel Sequencing
• DNA shearing
• Adapter ligation
• Amplification
• Anchoring
template
preparation
Sanger like sequencing
sequencing by
imaging
• Nucleotide addition
• Fluorophor release
• Deblocking
• Image capturing
• Base calling
• Base quality evaluation
• Read Alignment
• Contig construction
data analysis
Next Generation Sequencing
MICROARRAY AND NGS DATABASES (FOR RESEARCH)
DATI GENETICI SENSIBILI
PORZIONE CODIFICANTE (EXOMA) E REGIONI REGOLATIVE
- Geni responsabili di patologie mendeliane, in eterozigosi o omozigosi
(es. Corea di Huntington; DMD; Fibrosi cistica)
- Geni associati a patologie complesse di tipo psichiatrico o neurodegenerativo in
eterozigosi o omozigosi
(es. Schizofrenia, disturbi bipolari, Alzheimer, Parkinson, SLA)
- Geni associati a malattie complesse di altro tipo, in eterozigosi o omozigosi
(es. cardiopatie, aterosclerosi)
- Geni associati a tratti comportamentali, in eterozigosi ed in omozigosi
(es. intelligenza, introversione ed estroversione, comportamenti aggressivi
ed antisociali, abuso di alcool e droghe)
- Geni associati in modo mendeliano o non mendeliano a tratti somatici
(es. colore occhi, colore capelli, altezza)
- Geni associati in modo mendeliano o non mendeliano a tratti di altro tipo
PORZIONE NON CODIFICANTE
- Protezione per l’impiego nella identificazione individuale
http://www.unitn.it/en/cibio
NGS Core Facility
Veronica de Sanctis- [email protected]
Roberto Bertorelli- [email protected]