2.polimorfismi_DNA

La variabilità genetica a livello molecolare









Singole sost. nucleotidiche
Piccole inserzioni/delezioni
Microsatelliti
Minisatelliti
Altri VNTR
Inserzioni di elementi retrotrasponibili
Varianti strutturali microscopiche e submicroscopiche
Generalmente non
Variabilità nel numero di cromosomi
polimorfici
Variabilità nel numero di ploidia
(frequenza < 0.01%)
La variabilità genetica a livello molecolare
Dove si trovano le mutazioni?
Alcune mutazioni sono distribuite in
modo casuale nei cromosomi, altre
presentano una distribuzione non
omogenea
La variabilità genetica a livello molecolare
Tasso di mutazione
I differenti tipi di mutazione
differiscono circa il loro tasso di
mutazione per diversi ordini di
grandezza
Polimorfismi del DNA
DNA a sequenze ripetute
•sequenze distribuite a intervalli
regolari (ripetizioni intersperse),
•sequenze raggruppate insieme
(ripetizioni in Tandem)
Mutazioni di singole paia di basi
Inserzioni/delezioni
Polimorfismi del DNA
SNPs (polimorfismi di singoli nucleotidi)
gli SNPs comprendono gli RSP:
RSP (restriction site polymorphism) che
generano RFLP (restriction fragment length
polymorphism)
• VNTRs (variable number of tandem repeat)
(MINIsatelliti)
•
STRs (short tandem repeat) (MICROsatelliti)
Tipi di polimorfismo studiati nel DNA
1. SNP
1. SNPs
2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010)
2014: Almeno 67 milioni di SNPs nel genoma umano (Ensemble Rel. 75)
SNPs
E’ la forma di variazione del DNA più comune.
Confrontando due cromosomi umani omologhi, si osserverà una SNP
ogni mille basi
Confrontando una popolazione di cromosomi omologhi, si osserverà uno
SNP ogni 200 basi.
Le SNPs sono 10 volte più frequenti delle ins/del
Transizioni
Tranversioni
Le transizioni sono 2 volte più
frequenti delle transversioni
Le mutazioni vengono distinte in base ai loro effetti sulla
lettura della tripletta che codifica un aminoacido:
Mutazioni missenso: cambiamento aminoacido;
Mutazioni nonsenso: cambiamento da codone che
specifica per aminoacido a codone di stop;
Mutazione neutra: cambiamento di un codone il cui
aminoacido non altera la funzionalità proteica;
Mutazione silente: cambiamento codone, ma non
dell’aminoacido (degenerazione del codice);
Mutazione frameshift: origina da inserzioni o delezioni:
alterazione schema di lettura del DNA.
Il dinucleotide CpG è un
hotspot di mutazione
La maggior
parte delle SNPs
è neutra, ma in
alcuni casi si
producono
effetti
sull’espressione
dei geni
Sequence Variation and SNP
Distribution
Sequence variation (quantity of SNPs) can be measured
in nucleotide diversity:
– the number of base differences between two genomes over the
total number of bases compared.
SNP Distribution is not uniform for any of the three
categories:
– Over a complete genome (1/3 in coding, 2/3 in non-coding).
– Over all the chromosomes (fewer SNPs in sex chromosomes).
– Over a single chromosome (SNPs often concentrated around a
specific location).
Tipi di polimorfismi studiati nel DNA
1. SNP: Costruzione di aplotipi
SNPs: aplotipo
1. SNP: Restrizione
Come evidenziare il polimorfismo?
RFLP= restriction fragment length polymorphism
Enzimi di Restrizione
Sono endonucleasi di tipo II (classe delle idrolasi) in grado di tagliare
i legami fosfodiesterei del DNA per dare frammenti specifici.
L’attività endonucleasica e la funzione di metilazione del DNA sono
separate. Non hanno bisogno di ATP.
Tipo I: taglio casuale
Endonucleasi di tipo I e III: sono
enzimi bifunzionali e necessitano di
ATP come coenzima.
Tipo III: taglio in siti
specifici (24-26 coppie
di basi a valle del sito di
riconoscimento).
A volte la mutazione patogena puo’
abolire o creare direttamente un sito
di restrizione specifico (RFLP)
Mutazione che determina l’anemia falciforme, che
distrugge un sito MstII e genera un RFLP specifico per la malattia
MstII: CCTNAGG
sito di restrizione
Lewin, IL GENE VIII, Zanichelli
editore S.p.A. Copyright © 2006
Gli enzimi di restrizione possono generare diversi tipi di estremità:
coesive (sticky ends) e piatte (blunt ends)
BamHI* (Bacillus amyloliquefaciens)
0.4kb
0.7kb
1 2 3 4 5 6 7 8 9 10 1112131415 M
1.25 kb
1.1 kb
I soggetti 1, 2, 6-10, 12,
14 e 15 sono omozigoti
per la presenza del sito
0.75 kb
0.7 kb
0.4 kb
I soggetti 3, 5 e 11
sono eterozigoti per la
presenza/assenza del
sito
I soggetti 4 e 13 sono
omozigoti per
l’assenza del sito
Separazione su gel di agarosio dei frammenti originati dalla
digestione enzimatica del prodotto di PCR del DNA
proveniente da 15 diversi individui
Se le SNPs non si trovano su un sito di restrizione si
possono esaminare con:
•Sequenziamento
•HPLC (Denaturing high-performance liquid
chromatography)
•Microarray
SNPs: sequenziamento
1. SNP: Sequenziamento
Elettroferogramma
generato da un
sequenziatore automatico
individuo
omozigote
N
Sito di
eterozigosi
C/G
individuo
eterozigote
Rilevazione delle mutazioni
mediante DHPLC
Essa si basa sulla differente velocità
di migrazione, in un mezzo simile ad
un gel quale è la colonna HPLC, per
gli eteroduplex e omoduplex. Questi
duplex si formano quando un
frammento amplificato di DNA
mutato ed uno non mutato vengono
denaturati termicamente e lasciati
ricombinare (mismatch).
Una qualsiasi variazione tra la
molecola originale (wild type) e
quella
mutata porta alla formazione di un
eteroduplex (combinazione di due
catene di DNA a singola catena non
perfettamente corrispondenti,
caratterizzata dalla presenza di una
"bolla" dove c'è la mutazione).
L'eteroduplex si comporta cromatograficamente
in modo differente (solitamente più veloce)
La presenza di una mutazione si evidenzia sotto
forma di picchi ulteriori rispetto al "wild"; il grande
vantaggio per il ricercatore è che - pur non
caratterizzando la mutazione (cioè non viene
definito come è stata modificata la sequenza) - la
DHPLC è in grado di rivelarne la presenza
all'interno del frammento analizzato
Gli eteroduplex migrano
più lentamente rispetto
agli omoduplex
Tessuto della prostata,
normale
Tessuto della prostata,
tumorale
In questo esempio i cDNA
sono stati posizionati su di un
vetrino, simile ai normali
vetrini usati per l’istologia.
I microarrays
(comunemente conosciuto come gene chip, chip
a DNA, biochip o matrici ad alta densità
Un microarray è un supporto solido
(vetro, silice o plastica) sul quale
sono stati posizionati diverse
migliaia di cDNA (sonde) in spot
separati. Ciascuno spot rappresenta
un gene, in quanto contiene
numerose copie di un cDNA
corrispondente a tale gene.
I microarray sfruttano una tecnica di ibridazione inversa,
che consiste nel fissare tutti i segmenti di DNA (detti
probe o sonda) su un supporto e nel marcare invece
l'acido nucleico che vogliamo identificare (detto target). È
una tecnica che è stata sviluppata negli anni '90 e oggi
permette l'analisi dell'espressione genica monitorando in
una sola volta gli RNA prodotti da migliaia di geni.
DNA microarray: una collezione di microscopiche sonde (probe)
Ordinate
Miniaturizzate
Immobilizzate su una superficie solida (attualmente vetro)
I probe possono essere attaccati al substrato mediante:
-Legame diretto, fisico o chimico
-Legame indiretto, mediante molecole linker
Affymetrix Genome-Wide Human SNP Array 6.0
•Risoluzione di 0.7 Kb
•1.8 milioni SNPs e oligonucleotidi che coprono regioni povere di SNPs combinati insieme
Intensità di segnale rilevata da uno scanner e i dati elaborati da un software
PROTOCOLLO
Affimetrix 6.0
E’ possibile avere 500,000 probe in uno spazio di 1.28 cm2
Ogni singolo probe è costituito da milioni di oligonucleotidi identici
Il nuovo Affymetrix Genome-Wide Human SNP Array 6.0 caratterizza 1.8 milioni
di marcatori genetici, inclusi più di 906,600 single nucleotide polymorphisms
(SNPs) e più di 946,000 probes (sonde) per l’individuazione di copy number
variation (CNV). L’alto valore di rendimento dello SNP array 6.0 permette ai
ricercatori di progettare studi di associazione con un grande numero di campioni
Il recente progredire delle tecnologie array ha aperto la possibilità di genotipizzare
“economicamente” e rapidamente un intero gruppo di popolazione campione.
La disponibilità di milioni di SNPs fornisce una mappa di alta densità lungo tutto il
genoma, la quale può raggiungere adeguato potere per investigare varianti
genomiche associate con malattie multifattoriali.
I microarry rappresentano un sistema di analisi che velocizza considerevolmente
l’esplorazione genomica permettendo, infatti, di esaminare contemporaneamente
l’espressione di migliaia di geni o un ampio numero di polimorfismi genetici. Il
tutto con costi relativamente contenuti se rapportati al numero di geni o
polimorfismi analizzabili per esperimento.
Array di oligonucleotidi ad alta densità
Ibridizzazione
La scannerizzazione del
chip ci fornisce
un’immagine in cui il
grado di ibridizzazione
viene evidenziato da una
diversa intensità di
emissione nel rosso. La
rilevazione dell’immagine
infatti è possibile grazie al
legame alla biotina di un
composto fluorescente
(streptavidina-ficoeritrina)
Array di oligonucleotidi ad alta densità
Ibridizzazione
A differenza degli
array a DNA
spottato, il sistema
Affimetrix prevede
l’ibridizzazione di un
singolo campione
su ogni genechip
il microarray viene esposto ad una
sorgente di luce laser.
Gli spettri di emissione vengono
quindi raccolti da uno scanner e le
immagini monocromatiche indicanti i
livelli diversi di espressione genica
vengono pseudocolorate da un
software di acquisizione d’immagine.
De Risi J.L. et al Science 1997; 278:680-686.
Heller R.A. et al PNAS 1997; 94:2150-2155.
Principali applicazioni dei microarray
cDNA microarray: per misurare i livelli di espressione di determinati
geni
microarray SNP (“Single Nucleotide Polymorphism”) e array di
mutazione: per la genotipizzazione e identificazione di polimorfismi
(SNPs) in una popolazione.
microarray CGH (“Comparative Genomic Hybridization”): per
osservare perdite o guadagni di materiale genomico o un cambiamento
nel numero di copie di un gene particolare coinvolto in una malattia.
International HapMap Project
•Progetto iniziato nel 2002
•Si propone di “catalogare” le varianti comuni
del DNA umano in una Mappa degli Aplotipi
•Analizzati 270 soggetti
differenti gruppi etnici
obiettivo 1SNPs ogni 5Kb
Per un totale di 3.8 milioni di SNPs
provenienti
da
http://hapmap.ncbi.nlm.nih.gov/
Perché?
Oltre il 99,5% del genoma di Homo sapiens è identico in ogni
individuo. Perciò solo la restante parte contiene tutte le diversità
genomiche, alcune delle quali possono influenzare il rischio di
sviluppare malattie.
Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns
of variation. Science.
CEPH panel
Illumina Bead Chip 650K (642,690)
N = 938
genetic ancestry of each individual
individuals from the same population show
similar ancestry proportions – population
structuring robust (confirmed also by PCA)
Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns
of variation. Science.
oceania
america
maximum-likelihood tree
east asia
main result:
confirmation of the
Out of Africa
south/central asia
europe
middle east
sub-saharan africa
Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns
of variation. Science.
Alcuni risultati
PCA: I e II componente
In nero
Ogliastra,
In rosso
Trexenta
e Sulcis
Copy Number Variations (CNVs)
Segmenti di DNA con estensione maggiore di 1 Kb presenti nel genoma con un
numero variabile di copie.
Contribuiscono:
• alle differenze fenotipiche tra gli individui
• alla patogenesi di malattie, sia mendeliane che multigeniche
Essendo noi diploidi (meta' del genoma ci viene dal padre e
meta' dalla madre), di ogni tratto di DNA o di ogni gene
abbiamo sempre un numero di copie pari a 2. Se ne abbiamo
3, 4, 5 (1, 2 3 copie in piu', rispettivamente), o 1 o zero, allora
abbiamo, per quel locus, una variazione del numero di copie.
Questa variabilita' insospettata della popolazione umana e'
stata giudicata come uno dei "breakthrough" (notizia bomba)
del 2007 da parte di Science.
Copy Number Variation (CNV)
Si è stimato che circa 360 MB di DNA sono soggette a copy number
variation. Circa il 12% dell’intero genoma aploide
Essendo state trovate in individui normali, molte
di queste sembrano neutre. Pian piano, però, ha
preso corpo una lunga lista di malattie o
predisposizioni a malattie, tumori compresi.
Ma il punto più interessante, ovviamente, e'
quello evolutivo, sempre perchè "niente in
biologia ha senso se non alla luce
dell'evoluzione".
Esempio amilasi.
Trovato tra i geni presenti in numero di copie variabili
nella popolazione. Il gene per l’amilasi e’ presente
nella saliva dove inizia la digestione dell’amido.
L'amido era sicuramente presente nella dieta di
cacciatori/raccoglitori in zone aride. I ricercatori sono
andati a vedere se il numero di copie fosse da
correlare appunto alle abitudini alimentari nelle varie
popolazioni. Quale era l’ipotesi? Che le duplicazioni
avessero rappresentato un vantaggio per le
popolazioni di cacciatori/raccoglitori, con diete in cui
l'amido era ben presente. L’ipotesi era corretta!
Le duplicazioni insorgono a caso. E' il vantaggio
selettivo che le propaga poi nella popolazione, poiché i
portatori hanno maggiore probabilità di arrivare all'età
adulta e quindi di fare figli. La loro fitness e' più alta. E
per sottolineare come il vantaggio sia sempre relativo
ad un dato ambiente, veniamo ai nostri giorni. Ora il
vantaggio forse si e' ribaltato! Se il cibo, abbondante,
viene sfruttato fino in fondo, c'e' il rischio di ingrassare,
e quindi... la fitness si abbassa.
CNVs polimorfiche
Sindrome
CNV
Duplicazioni
segmentali
SNPs
Geni
Effetto
Referenza
HIV-1/AIDS
susceptibility
Comuni
Si
No
CCL3L1
Dosaggio
Gonzalez et al., 2005
Atrite
reumatoide e
Diabete di
tipo 1
Comuni
Si
No
CCL3L1
Dosaggio
McKinney et al., 2007
SLE,
Poliangite
microscopica
e
Granulomatos
i Wegener
Comuni
Si
No
FCGR3B
Dosaggio
Aitman et al., 2006;
Fanciulli et al., 2007
SLE
Comuni
Si
No
C4A/C4B
Dosaggio
Yang et al., 2004
Malattia di
Crohn
Comuni
Si
No
DEFB4
Dosaggio
Fellermann et al., 2006
Disturbo
bipolare
Comuni
No
Pochi
GSK3B
Posizionale
Lachman et al., 2007
Morbo di
Parkinson
precoce
Rare
No
Si
SNCA
Dosaggio
Ibáñez et al., 2004;
Chartier-Harlin et al.,
2004; Singleton et al.,
2003
Morbo di
Alzheimer
Rare
No
Si
APP
Dosaggio
Rovelet-Lecrux et al.,
2006; Cabrejo et al., 2006
Pancreatite
ereditaria
Rare
Si
Pochi
PRSS1
Dosaggio
Le Maréchal et al., 2006
Autismo
Comuni
Non
applicabile
Vari
Multipli
Sconosciut
o
Sebat et al., 2007b;
Szatmari et al., 2007
Cancro al
seno familiare
Comuni
No
Si
MTUS1
(esone4)
Posizionale
Frank et al., 2007
Sindrome
Ereditarietà
Posizion
e
Gene
CNV
Sindrome di Bartter
Autosomica
dominante
1p36
CLCNKA
/B
Delezione
Nozu et al., 2007
Sindrome di
Gaucher
Autosomica
recessiva
1q21
GBA
Delezione
Tayebi et al., 2003
Nefronoftisi
giovanile familiare
Autosomica
recessiva
2q13
NPHP1
Delezione
Saunier et al., 2000;
Konrad et al., 1996
Distrofia muscolare
fascio-scapolo
omerale
Autosomica
dominante
4q35
FRG1
Delezione
Petrov et al., 2008
Atrofia muscolare
spinale
Autosomica
recessiva
5q13.2
SMN
Inversione/
Duplicazion
e
Wirth et al., 1997
Iperplasia adrenale
congenita III
Autosomica
recessiva
6p21.3
CYP21
Delezione
Tusié-Luna
1995
Williams-Beuren
(WBS)
Autosomica
dominante
7q11.23
ELN/
GTF21
Delezione/
Inversione
Pérez Jurado et al., 1998;
Peoples et al., 2000
Iperaldosteronismo
familiare I
Autosomica
dominante
8q21
CYP11B
1/2
Duplicazion
e
Fardella et al., 2001
β-talassemia
Autosomica
recessiva
11p15.5
β–
globina
Delezione
Galanello et al., 2004;
Harteveld et al., 2005
Prader-Willi
(PWS)
Autosomica
dominante
15q11.2q13
SNRPN
Delezione
Christian et al., 1999;
Amos-Landgraf
et al.,
1999
Angelman
(AS)
Autosomica
dominante
15q11.2q13
OBE1A
Delezione
Christian et al., 1999;
Amos-Landgraf
et al.,
1999
α-talassemia
Autosomica
recessiva
16p13.3
αglobina
Delezione
Harteveld et al., 2005
Referenze
et
White,
16p13.3
Delezione
Harteveld et al., 2005
RAI1
Delezione
Chen et al., 1997; Slager
et al., 2003; Bi et al.,
2004; Girirajan et al.,
2005
17p11.2
?
Duplicazion
e
Potocki et al., 2000
17p12
PMP22
Duplicazion
e
Chance et al., 1994;
Lupski, 1998 ; Boerkoel
et al., 1999
PMP22
Delezione
Chance et al., 1994;
Lupski, 1998; Boerkoel et
al., 1999
17q11.2
NF1
Delezione
Dorschner et al., 2000
17q23.3
GH1
Delezione
Stankiewicz
2002
TBX1
Delezione
Edelmann et al., 1999a;
Edelmann et al., 1999b;
Shaikh et al., 2000
Xp22.32
STS
Delezione
Bonifas et al., 1987;
Conary et al., 1987;
Ballabio et Andria, 1992
X-linked
Xq28
RCP/GC
P
Delezione
Stankiewicz
2002
Incontinenza
pigmenti
X-linked
Xq28
NEMO
Delezione
International
Consortium, 2000
Distrofia muscolare
Emery-Dreifuss
X-linked
Xq28
Emery/
FLN1
Delezione/
Duplicazion
e
Small et Warren, 1998
Sindrome di Hunter
X-linked
Xq28
IDS
Delezione/
Inversione
Beck et al., 1992
α-talassemia
recessiva
Smith-Magenis
(SMS)
Autosomica
dominante
17p11.2
Potocky-Lupski
(PLS)
Autosomica
dominante
Charcot-MarieTooth 1A
(CMT1A)
Autosomica
dominante
Neuropatia
tomaculare (HNPP)
Autosomica
dominante
17p12
Neurofibromatosi 1
(NF1)
Autosomica
dominante
Nanismo pituitario
Autosomica
recessiva
Di George/
Sindrome
velocardiofacciale
(DGS/VCFS)
Autosomica
dominante
22q11.2
Ittiosi
X-linked
Daltonismo
globina
et
et
Lupski,
Lupski,
IP
Jakobsson et al., 2008. Genotype, haplotype and copy-number variation in worldwide
human populations. Nature.
SNPs
CNVs
Polimorfismi del DNA: minisatelliti e microsatelliti
Allele A TACCAAGGTACGGACGGACGGACGGGGTACCATGG
Allele B TACCAAGGTACGGACGGACGGACGGACGGGGTACCATGG
Allele A TACCAAGGTACACACACGGTACCATGG
Allele B
TACCAAGGTACACACACACGGTACCATGG
Allele C
TACCAAGGTACACACACACACGGTACCATGG
Allele D
TACCAAGGTACACACACACACACGGTACCATGG
Tipi di polimorfismo studiati nel DNA
3. Variazione del numero di copie: STR & VNTR
STRs (Short Tandem Repeats) e VNTR (Variable
Number of Tandem Repeat)
Marcatori genetici molto utilizzati nel campo della
genetica di popolazione e nel campo forense.
Gli STRs vengono classificati in base alla
lunghezza dell’unità ripetuta
dinucleotidi
trinucleotidi
Tetra, penta e esanucleotidi
I trinucleotidi, localizzati spesso negli esoni, posso essere la
causa di patologie
Scegliendo opportunamente 5 STR, la probabilità che
essi risultino uguali in individui non imparentati è < 1/1012.
Il kit per il riconoscimento di individui (identifiler) usato
in medicina forense è costituito da 15 STR
tetranucleotidi:
HUMTH01, D21S22,
D18S51, HUMVFA31,
HUMFIBRA, D8S1179,
HUMTPOX,
HUMCSF1PO,
D16S539, D7S820,
D13S317, D5S818,
D3S1358,
D19S433, D2S1338
Nomenclatura degli STR
Se il marcatore è parte di un gene, il nome del
gene è usato per la designazione (TH01)
Se il marcatore si trova al di fuori di un gene,
esso viene designato in base alla posizione
cromosomica (D16S539):
D: DNA
16: cromosoma 16
S: sito
539: 539mo locus descritto sul cromosoma 16
Test di paternità
Frequenza e localizzazione VNTR e STR
Rappresentano il 5-10% del genoma eucariotico
Le classi più rappresentate sono le ripetizioni monomeriche e
dinucleotidi
Ad eccezione dei trinucleotidi sono localizzati in regioni non
codificanti del DNA
I VNTR si trovano prevalentemente nelle regioni sottostanti il
telomero;
Gli STR sono distribuiti in modo relativamente uniforme
all’interno del genoma; anche se gli esanucleotidi si sono stati
ritrovati più frequentemente nelle regioni telomeriche.
La variabilità genetica a livello molecolare
2. microsatelliti o short tandem repeats (STRs)
I microsatelliti sono distribuiti in modo omogeneo nel genoma umano
La variabilità genetica a livello molecolare
2. microsatelliti o short tandem repeats (STRs)
perfetti
interrotti
composti
I microsatelliti possono essere perfetti, interrotti o composti e vengono ulteriormente
classificati in base alla lunghezza del motivo ripetuto (dinucleotide repeats,
trinucleotide repeats ecc..)
Ruolo DNA satellite
DNA spazzatura?????
Partecipazione alla ricombinazione meiotica?
Ruolo nel ripiegamento della cromatina?
Siti di legame per specifiche proteine
nucleari?
Origine del DNA satellite
•Scambio ineguale durate il crossing over meiotico
•Slittamento di due filamenti (stand slippage)
durate la replicazione
Perché i microsatelliti sono così polimorfici?
La variabilità genetica a livello molecolare
2. microsatelliti o short tandem repeats (STRs)
L’elevato tasso di mutazione nei microsatelliti è dovuto a
scivolamento della polimerasi in replicazione
•Tasso di mutazione molto elevato
•La mutazione avviene generalmente per
aumento o diminuzione di una singola
unità ripetitiva
•Mutazioni per aumento più frequenti di
mutazioni per diminuzione
•Il tasso di mutazione per ciascun
microsatellite è correlato con la lunghezza
dell’allele
Rosenberg et al., 2008. Genetic structure of human populations. Science.
CEPH panel; multiplex for 377 STRs
test the correspondence of predefined groups with those inferred from
individual multilocus genotypes
clustering method that identifies subgroups that have distinctive allele
frequencies
Rosenberg et al., 2008. Genetic structure of human populations. Science.
individuals from the same predefined population nearly always shared
similar membership coefficient
world-level boundaries between major clusters mostly correspond to major
physical barriers (oceans, Himalaya, Sahara)
Rosenberg et al., 2008. Genetic structure of human populations. Science.
STRUCTURE
efficiently detects
isolated and
homogeneous groups
Nord Europa
Nord Italia
Sardegna
Sicilia
Baschi
Corsica
Cambogia
Giappone
Cina
Karitiana,
Brasile
Gabon
Maya,
Messico
Zaire
Rep. Centro
Africana
Nuova
Guinea
Melanesia
Australia
Surui,
Brasile
Da: Genetic Analysis of a
Sicilian population using 15
STRs.
Basques
Calò C.M., Garofano L., Mameli
A., Pizzamiglio M., Vona G.
Lombardy
Human Biology, 75: 163-178;
2003
Alia
Morocco
Catalonia
Poland
Hungary
Andalusia
Portugal
Egypt
Tuscany
Germany
Switzerland
Siracusa
Catania
Messina
Ragusa
Caltanissetta
Agrigento
Palermo
Stutter o Shadow Bands
Un problema da affrontare
nell’analisi dei
microsatelliti è la
formazione, durante il
processo di amplificazione,
di prodotti aspecifici
chiamati“stutter o shadow
bands”
Infatti l’utilizzo di una
DNA polimerasi
termostabile con un’alta
processività può ridurre
notevolmente la formazione
di prodotti aspecifici
La formazione dei prodotti
aspecifici è legata alla
processività della Taq
Polimerasi(Lawyer F. et al.PCR
Methods Appl.,1993 May; 2 (4): 275287) piuttosto che alla
struttura secondaria del DNA
ELETTOFORETOGRAMMA
Stutter o Shadow Bands
Nel caso delle ripetizioni dinucleotidiche,la stutter band
prevalente è di 2 bp più piccola rispetto al picco
principale,con in più la formazione di statter bands di 4 e
6bp più piccole anche visibili(Murray V. et al. Nucleic Acids
Res,1993,21:2395-2398)
Questo comporta che per ciascun allele si abbia un pattern
con più bande il che rende complicata l’interpretazione dei
dati, in modo particolare per campioni di DNA che sono una
miscela di due o più individui
La tendenza, adesso, è di utilizzare marcatori tri- o tetranucleotidici che danno risultati più evidenti
Sequenze ripetute sparse
Conosciute come retrotrasposoni.
Trasposoni: frammenti di DNA che si spostano all’interno del
genoma.
Si distinguono 2 classi: LTR (con sequenze lunghe ripetute
terminali) e non LTR, tra queste ultime individuiamo:
•SINE (short interpersed repeated sequences): 100500 bp
•LINE (long interspersed repeated sequences)
DNA ripetitivo intersperso
Le singole unità ripetute non sono raggruppate ma sparse in
più punti del genoma. Gli esempi più comuni sono le sequenze
SINEs (Short Interspersed Nuclear Element) e LINEs (Long
Interspersed Nuclear Element)
Sono associate
perché tendono
povere di geni
mutazionale al
LINEs
prevalentemente a DNA genomico ricco in A/T
a posizionarsi in regioni del cromosoma
allo scopo di imporre il minimo impatto
genoma.
SINEs
Sono associate prevalentemente a DNA genomico ricco in G/C.
Perché? Sembra che tali sequenze svolgano una qualche
funzione positiva per il genoma: esse sarebbero espresse in
condizioni di stress ed i risultanti RNA legherebbero una
particolare protein chinasi PKR e bloccherebbero la sua
capacità di inattivare la traduzione.
Più frequenti nei Primati e quindi nell’uomo.
Famiglia SINE:
Polimorfismo di inserzione/delezione Alu
Si trovano negli introni e nelle regioni non tradotte
Presentano un’organizzazione dimerica: 2 sequenze
omologhe separate da una regione ricca di Adenina.
E 2 unità sono omologhe al gene 7 SL RNA da cui derivano
La mobilizzazione delle Alu all’interno del genoma è chiamata
retrotrascrizione: movimento di materiale genetico da una
posizione cromosomica ad un’altra, tramite un intermediario, la
polimerasi III del RNA
Replicazione Alu: una copia rimane nel luogo originale
(matrice) mentre l’altra si inserirà nella nuova posizione.
Questo processo potrebbe rappresentare l’espansione degli
elementi Alu nel genoma umano, ma i fattori che controllano
la retrotrascrizione non sono ancora ben chiari.
Il fatto che le Alu, pur essendo localizzate in regioni non
codificanti, sono state mantenute dalla selezione naturale,
suggerisce l’ipotesi di una loro attività funzionale.
La famiglia degli elementi Alu sono suddivisi in un certo
numero di sottofamiglie, caratterizzate da una serie
gerarchica di mutazioni, questo ci permette di individuare
sottofamiglie di differenti età.
Alu più antiche: PS (primate specific)
AS (antropoid specific)
CS (catarrine specific)
HS (human spcefic)
Le Alu più giovani sono rappresentate dalla sottofamiglia Y
(Ya e Yb)
Identificazione e tipizzazione di polimorfismi Alu
•Identificazione: ricerca in database di
elementi Alu giovani (famiglia Alu Y),
che hanno una più elevata probabilità di
essere stati trasposti durante
l’evoluzione umana e quindi di essere
polimorfici.
•Tipizzazione: tramite PCR, con primers
che fiancheggiano il sito di inserzione
ed elettroforesi su gel d’agarosio.
•Sono i polimorfismi più facili da
analizzare
Tassi medi di mutazione per vari polimorfismi
(per locus per generazione)
VNTR
10-1 – 10-2
STR
10-2 – 10-4
SNPs
10-6 – 10-8
Indel (retrovirus) 10-10 – 10-11
Nella regione ipervariabile del DNA mitocondriale,
valori fino a 5 x 10-5 per sito per generazione
MARCATORI DEL DNA
Tipo di mutazione
Proprietà
Tasso di
mutazione
SNP
Transizioni
Trasversioni
Stato
ancestrale
definito da
confronto
con outgroup
Eventi unici
o <10-9
INDEL
Inserzione/Delezione di
elementi ripetitivi del
genoma
Stato
ancestrale
noto
Eventi unici
Inserzione/Delezione di
moduli omogenei
ripetuti in tandem
Ricorrenti
Composti da
blocchi di
repeats di
2-5 bp
Tipo di marcatore
evoluzione lenta
evoluzione rapida
MICROSATELLITI
SEMPLICI
(STR)
MINISATELLITI
Inserzione/Delezione di
moduli ripetuti in
tandem
Ricorrenti
Composti da
blocchi di
repeats
>10 bp
10-3
10-2
In qualsiasi tipo di applicazione dovrete scegliere tra diversi tipi di marcatori.
Per fare questo bisogna tener conto di una serie di caratteristiche dei diversi
marcatori, che possono essere più o meno importanti a seconda dei casi:
• distribuzione sul genoma
• tasso di mutazione
• grado di eterozigosità
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
Caratteristiche biologiche
Caratteristiche tecniche
• distribuzione nel genoma: sufficiente che i geni non siano in LD per una più
facile trattazione statistica: OK tutti i marcatori
• tasso di mutazione: non rilevante
OK tutti i marcatori
• grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore
l’informazione. OK minisatelliti, STRs
• ereditarietà mendeliana: importante per una più facile trattazione statistica
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
• tipizzazione mediante PCR: fondamentale: spesso quantità di DNA minime
• possibilità di automazione su larga scala: non rilevante
• distribuzione nel genoma: sufficiente che i geni non siano in LD per una più
facile trattazione statistica: OK tutti i marcatori
• tasso di mutazione: non fondamentale ma da tenere in considerazione
OK tutti i marcatori
• grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore
l’informazione: OK minisatelliti, STR
• ereditarietà mendeliana: importante per una più facile trattazione statistica
OK STR, SNPs
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
• tipizzazione mediante PCR: non rilevante se non in relazione ai costi
• possibilità di automazione su larga scala: non rilevante
• distribuzione nel genoma: fondamentale, omogeneamente distribuiti e
comuni nel genoma: OK STRs e SNPs
• tasso di mutazione: molto importante, OK SNPs
• grado di eterozigosità: importante
OK STRs e parte degli SNPs (quelli con H elevata)
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
• possibilità di automazione su larga scala: OK SNPs
• distribuzione nel genoma: non rilevante
• tasso di mutazione: fondamentale, deve essere contenuto
OK SNPs, NO STRs
• grado di eterozigosità: non rilevante
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo
• tipizzazione mediante PCR: non rilevante se non in relazione ai costi
• distribuzione nel genoma: non rilevante
• tasso di mutazione: dipende dal contesto, possono essere usati SNPs, Alu,
STRs, ma in modo diverso
• grado di eterozigosità: +/- importante a seconda dei casi
• tempi tecnici dell’esperimento
• costi dell’attrezzatura
• costi dell’esperimento
• precisione del metodo: fondamentale
Utilizzo degli SNPs in ambito forense
Svantaggio: biallalici (poco polimorfici)
Vantaggio: necessitano di amplificati di dimensioni minori
di 100 bp (utile per DNA degradato)
Numero SNPS per ottenere risultati significativi: 25-45
Correlazione di alcuni SNPs con caratteri fenotipici
SLC24A5, TYR e SL45A2 sembrano correlati con la
pigmentazione cutanea
MC1R correla con il colore rosso dei capelli