Gli studenti delle lauree magistrali in:
Sicurezza e qualità agroalimentare (LM-69 & LM-70)
Biotecnologie agrarie e ambientali (LM-7)
Biologia cellulare e molecolare (LM-6)
interessati al corso di
Basi Teoriche e Applicazioni delle
Nuove Tecnologie Genomiche 4 cfu
Sono invitati a contattare la titolare del corso, Silvia Bongiorni:
tel.:
0761-357429
email: [email protected]
recapito: DIBAF stanza 23A (seminterrato ex facoltà agraria)
GENOMICA STRUTTURALE:
1.
2.
3.
4.
5.
6.
7.
8.
GENOMICA FUNZIONALE:
9. Funzionamento dei genomi
Anatomia dei genomi
Modificazioni della cromatina e l’espressione del genoma
Il genoma dei procarioti
Microarray e RNA-seq
Il genoma degli eucarioti
Metil-seq
La mappatura dei genomi
Chip-seq
Mappatura genetica
Mappatura fisica
Il sequenziamento automatico del DNA
Il principio del sequenziamento secondo Sanger
Il sequenziamento su larga scala
La lettura dei tracciati di sequenziamento
Il sequenziamento del genoma
I nuovi metodi di sequenziamento
Il sequenziamento gerarchico
Il sequenziamento shogun
Piattaforme di sequenziamento di interi genomi
Assemblaggio e annotazione del genoma
Copertura del genoma
Phrap/Consed
Approccio Overlap-Layout-Consensus
La verifica delle sequenze
Le caratteristiche funzionali delle sequenze genomiche
I Progetti Genoma
La metagenomica
Genotipizzazione
Gli SNP e la variazione
La genotipizzazione degli SNP
Basi Teoriche e Applicazioni delle
Nuove Tecnologie Genomiche
Obiettivi del corso:
Lo scopo del corso è quello di fornire un’ampia panoramica
sulle tecnologie di sequenziamento di nuova generazione
emerse nell’era post-genomica.
Sequenziamento del DNA
1977 - Sanger
Sequenziamento del genoma
1996 - S. cerevisae
1998 - C. elegans
2000 - Arabidopsis thaliana
2001 - Homo sapiens
Sequenziamento 2° generazione
Roche 454
2005
Impossibile v isualizzare l'immagine. La memoria del computer potrebbe essere insufficiente per aprire l'immagine oppure l'immagine potrebbe essere danneggiata. Riav v iare il computer e
aprire di nuov o il file. Se v iene v isualizzata di nuov o la x rossa, potrebbe essere necessario eliminare l'immagine e inserirla di nuov o.
Applied Solid
2005
Illumina
2004
Sequenziamento 3° generazione
Nanopore sequencing - 2010
Ion semiconductor sequencing - 2011
Single molecule sequencing - 2012
Basi Teoriche e Applicazioni delle
Nuove Tecnologie Genomiche
Obiettivi del corso:
Il corso vuole sottolineare la rilevanza degli sviluppi
applicativi delle discipline genomiche nell’ambito delle
biotecnologie e della ricerca genetico-molecolare.
GENOMICA STRUTTURALE:
1.
2.
3.
4.
5.
6.
7.
8.
GENOMICA FUNZIONALE:
9. Funzionamento dei genomi
Anatomia dei genomi
Modificazioni della cromatina e l’espressione del genoma
Il genoma dei procarioti
Microarray e RNA-seq
Il genoma degli eucarioti
Metil-seq
La mappatura dei genomi
Chip-seq
Mappatura genetica
Mappatura fisica
Il sequenziamento automatico del DNA
Il principio del sequenziamento secondo Sanger
Il sequenziamento su larga scala
La lettura dei tracciati di sequenziamento
Il sequenziamento del genoma
I nuovi metodi di sequenziamento
Il sequenziamento gerarchico
Il sequenziamento shogun
Piattaforme di sequenziamento di interi genomi
Assemblaggio e annotazione del genoma
Copertura del genoma
Phrap/Consed
Approccio Overlap-Layout-Consensus
La verifica delle sequenze
Le caratteristiche funzionali delle sequenze genomiche
I Progetti Genoma
La metagenomica
Genotipizzazione
Gli SNP e la variazione
La genotipizzazione degli SNP
Il GENOMA è l’insieme di tutti i geni di un organismo. L’insieme di tutte
le sequenze nucleotidiche codificanti e non, di un organismo.
La sequenza completa del suo DNA
La scienza dei genomi, la GENOMICA è lo studio della struttura, del
contenuto e dell’evoluzione dei genomi
La genomica non è più limitata alla determinazione delle sequenze ma
si estende anche all’analisi dell’espressione e delle funzioni dei geni e
delle proteine
Le analisi sperimentali sono integrate strettamente da
Bioinformatica
Biologia computazionale
GENOMICA STRUTTURALE:
1. Anatomia dei genomi
Il genoma dei procarioti
Il genoma degli eucarioti
Organismo
Numero bp
Numero di geni
ΦX-174
5836
10
Mycoplasma
pneumoniae
816394
680
Helicobacter pylori
1667867 (1,66 Mb)
1589
Escherichia coli
4639221 (4,64 Mb)
4377
Saccharomyces
cerevisiae
12495682 (12,5 Mb)
5770
Caenorhabditis
elegans
100258171 (100 Mb)
19099
Drosophila
melanogaster
122653977 (122,6 Mb)
13472
Homo sapiens
3,3 x 109 (3289 Mb o 3,3 Gb)
25000
Il genoma dei procarioti
DNA batterico
DNA plasmidico
Il genoma degli eucarioti
Compattazione della cromatina
1,70m in 10µ
µm
146bp
54bp
2-6 µm
genoma
cromosoma
gene
regione intergenica
gene
Perché alcuni genomi sono così grandi?
La quantità di DNA contenuta nel
genoma aploide è una caratteristica
propria di ciascuna specie vivente ed è
definita come valore C
Il valore C varia enormemente da
<106 bp per un micoplasma a >1011
bp per anfibi ed alcune piante
La dimensione del genoma cresce con
la complessità dell’organismo. Ma in
alcuni gruppi c’è un’enorme variabilità
nel contenuto di DNA di specie simili
fra loro
Il paradosso del valore C si riferisce alla mancanza di correlazione tra le dimensioni del
genoma e la complessità biologica
I genomi eucariotici contengono
sia sequenze uniche che DNA
ripetuto
Il DNA non ripetuto è formato da
sequenze uniche: una copia nel
genoma aploide
Il DNA ripetuto è formato da sequenze
che sono presenti in più copie nel
genoma aploide
• DNA moderatamente ripetuto
(sequenze >100bp ripetute tra le
10 e le 1000 volte)
• DNA altamente ripetuto
(sequenze <100bp ripetute
migliaia di volte)
Quanti geni ci sono nei vari genomi?
Organismo
Numero bp
Numero di geni (% codificante)
ΦX-174
5836
10
Mycoplasma
pneumoniae
816394
680
Helicobacter pylori
1667867
1589
Escherichia coli
4639221 (4,64 Mb)
4377 (88%)
Saccharomyces
cerevisiae
12495682 (12,5 Mb)
5770 (70%)
Caenorhabditis
elegans
100258171 (100 Mb)
19099
Drosophila
melanogaster
122653977 (122,6 Mb)
13472
Homo sapiens
3,3 x 109 (3289 Mb)
25000 (1,3%)
non-coding DNA
Junk-DNA
Junk-DNA:
ruolo nel sileziamento genico
Silenziamento post-trascrizionale di geni attivi:
ad opera di micro-RNA (miRNA) e small
interfering RNA (siRNA) (21-23bp)
complementari
miRNA e siRNA legano l’mRNA complementare,
richiamano il complesso RISC e degradano
l’mRNA
Junk-DNA: ruolo nell’evoluzione
geni umani vs gene di scimpanzè:
•differiscono dello 0,1% del genoma (circa 20 geni)
•differenze nelle regioni non-coding sono 40 volte superiori (4%)
– il ncDNA può fare la differenza tra uomo e scimpanzè
Qual è la funzione dei vari geni?
Struttura dei geni
esone
exon
expressed region
introne
intron
intervening region
Splicing
Splicing alternativo
A
mRNA 1
mRNA 2
C
D
A B C D E
F
B
AAAAAAA
A B C E
F
AAAAAAA
A B C D
F
mRNA 3
mRNA 4
E
A B C
AAAAAAA
F
AAAAAAA
F
Analisi di sequenze genomiche
Gli introni sono abbondanti
94% uomo, 85% moscerini, 95% nematode, 95% piante
Genoma umano (25000 geni)
solo 2 - 5 volte più geni del moscerino (13472) o del nematode
(19099)
Lo splicing alternativo è frequente
~ il 75% dei geni umani trascritti subiscono splicing alternativo
Geni sovrapposti
Alcune sequenze di DNA codificano per più proteine
GENOMICA STRUTTURALE:
2.
La mappatura dei genomi
Mappatura genetica
Mappatura fisica
Il genoma come si vede?
Cromosomi politenici di Drosophila
Per poter mettere in ordine i diversi frammenti è necessario disporre di una mappa
dettagliata del genoma, ovvero la disposizione di una serie di MARCATORI lungo ciascun
cromosoma
Un marcatore rappresenta un SITO UNICO presente nel genoma
Una mappa è una rappresentazione
semplificata dello spazio che evidenzia
relazioni tra componenti (oggetti,
regioni) di quello spazio
Le mappe genomiche rivelano l’organizzazione del materiale ereditario
e derivano da due tipi di mappe:
1. Mappe genetiche: posizionano i geni sui cromosomi sulla base della
frequenza di ricombinazione
2. Mappe fisiche: usano marcatori all’interno della sequenza, che vanno
dai siti di restrizione all’analisi diretta del DNA genomico
Mappe Genetiche
descrivono l’ordine relativo dei marcatori genetici nei gruppi di associazione o LINKAGE
Marcatori = brevi sequenze ripetute di DNA (microsatelliti, Short Tandem Repeats),
polimorfismi (Single Nucleotide Polymorphism), siti di restrizione, loci genici
Le mappe genetiche sono costruite partendo dai dati di segregazione dei marcatori e dalla
loro frequenza di ricombinazione nella progenie
La distanza tra marcatori è espressa in centi-Morgan (cM), unità di misura della frequenza di
ricombinazione.
1cM = frequenza di ricombinazione dell’1% (circa 1000bp nell’uomo, 2000bp nel topo)
Due loci che presentano una frequenza di ricombinazione dell'1% sono definiti distanti 1 cM
Per fare una mappa genetica non necessariamente serve conoscere la sequenza
La distanza genetica non corrisponde direttamente alla distanza fisica (presenza di
sequenze ripetute, la frequenza di ricombinazione varia tra regioni eu/eterocromatiche)
MAPMAKER
È un programma per la costruzione
di mappe genetiche partendo dai
dati di linkage
I dati di linkage sono trasformati in
distanza di mappa tramite una
funzione di mappaggio, che
esegue aggiustamenti dei dati,
tenendo conto che la probabilità
di
ricombinazione
non
è
direttamente proporzionale alla
distanza fisica.
Mappe Fisiche
è una costellazione di frammenti di
DNA sovrapposti, ordinati e
orientati, che coprono ciascun
cromosoma di un genoma.
Le mappe fisiche sono basate
sull’analisi diretta del DNA genomico
ed indicano l’effettivo numero di
coppie di basi (bp), kilobasi (kb) o
megabasi (Mb) che separano un
marcatore
(locus)
da
quello
adiacente.
Ci sono diverse strategie per allineare i contig:
• Ibridazione (chromosome walking)
• Sequenziamento delle estremità (STS, sequence-tagged sites)
• Profili di restrizione
La mappatura dei genomi
Le mappe genetiche e fisiche possono essere correlate
Qualsiasi gene clonato
può essere mappato
geneticamente e
posizionato fisicamente
nel genoma
IL METODO PRINCIPALE PER ALLINEARE TRA LORO MAPPE GENETICHE E
MAPPE FISICHE E’ RAPPRESENTATO DALLE MAPPE CITOLOGICHE
Mappe citologiche
Le Mappe
Tutti i dati di sequenza, ricombinazione derivanti da queste mappe sono
immagazzinati in banche dati (database)
The National Center for Biotechnology Information
http://www.ncbi.nlm.nih.gov/
The European Molecular Biology Laboratory
http://www.embl.de/
DNA Data Bank of Japan
http://www.ddbj.nig.ac.jp/index-e.html