La variabilità genetica a livello molecolare Singole sost. nucleotidiche Piccole inserzioni/delezioni Microsatelliti Minisatelliti Altri VNTR Inserzioni di elementi retrotrasponibili Varianti strutturali microscopiche e submicroscopiche Generalmente non Variabilità nel numero di cromosomi polimorfici Variabilità nel numero di ploidia (frequenza < 0.01%) La variabilità genetica a livello molecolare Dove si trovano le mutazioni? Alcune mutazioni sono distribuite in modo casuale nei cromosomi, altre presentano una distribuzione non omogenea La variabilità genetica a livello molecolare Tasso di mutazione I differenti tipi di mutazione differiscono circa il loro tasso di mutazione per diversi ordini di grandezza Polimorfismi del DNA DNA a sequenze ripetute •sequenze distribuite a intervalli regolari (ripetizioni intersperse), •sequenze raggruppate insieme (ripetizioni in Tandem) Mutazioni di singole paia di basi Inserzioni/delezioni Polimorfismi del DNA SNPs (polimorfismi di singoli nucleotidi) gli SNPs comprendono gli RSP: RSP (restriction site polymorphism) che generano RFLP (restriction fragment length polymorphism) • VNTRs (variable number of tandem repeat) (MINIsatelliti) • STRs (short tandem repeat) (MICROsatelliti) Tipi di polimorfismo studiati nel DNA 1. SNP 1. SNPs 2010: Almeno 4 milioni di SNPs nel genoma umano (Schuster et al. 2010) 2014: Almeno 67 milioni di SNPs nel genoma umano (Ensemble Rel. 75) SNPs E’ la forma di variazione del DNA più comune. Confrontando due cromosomi umani omologhi, si osserverà una SNP ogni mille basi Confrontando una popolazione di cromosomi omologhi, si osserverà uno SNP ogni 200 basi. Le SNPs sono 10 volte più frequenti delle ins/del Transizioni Tranversioni Le transizioni sono 2 volte più frequenti delle transversioni Le mutazioni vengono distinte in base ai loro effetti sulla lettura della tripletta che codifica un aminoacido: Mutazioni missenso: cambiamento aminoacido; Mutazioni nonsenso: cambiamento da codone che specifica per aminoacido a codone di stop; Mutazione neutra: cambiamento di un codone il cui aminoacido non altera la funzionalità proteica; Mutazione silente: cambiamento codone, ma non dell’aminoacido (degenerazione del codice); Mutazione frameshift: origina da inserzioni o delezioni: alterazione schema di lettura del DNA. Il dinucleotide CpG è un hotspot di mutazione La maggior parte delle SNPs è neutra, ma in alcuni casi si producono effetti sull’espressione dei geni Sequence Variation and SNP Distribution Sequence variation (quantity of SNPs) can be measured in nucleotide diversity: – the number of base differences between two genomes over the total number of bases compared. SNP Distribution is not uniform for any of the three categories: – Over a complete genome (1/3 in coding, 2/3 in non-coding). – Over all the chromosomes (fewer SNPs in sex chromosomes). – Over a single chromosome (SNPs often concentrated around a specific location). Tipi di polimorfismi studiati nel DNA 1. SNP: Costruzione di aplotipi SNPs: aplotipo 1. SNP: Restrizione Come evidenziare il polimorfismo? RFLP= restriction fragment length polymorphism Enzimi di Restrizione Sono endonucleasi di tipo II (classe delle idrolasi) in grado di tagliare i legami fosfodiesterei del DNA per dare frammenti specifici. L’attività endonucleasica e la funzione di metilazione del DNA sono separate. Non hanno bisogno di ATP. Tipo I: taglio casuale Endonucleasi di tipo I e III: sono enzimi bifunzionali e necessitano di ATP come coenzima. Tipo III: taglio in siti specifici (24-26 coppie di basi a valle del sito di riconoscimento). A volte la mutazione patogena puo’ abolire o creare direttamente un sito di restrizione specifico (RFLP) Mutazione che determina l’anemia falciforme, che distrugge un sito MstII e genera un RFLP specifico per la malattia MstII: CCTNAGG sito di restrizione Lewin, IL GENE VIII, Zanichelli editore S.p.A. Copyright © 2006 Gli enzimi di restrizione possono generare diversi tipi di estremità: coesive (sticky ends) e piatte (blunt ends) BamHI* (Bacillus amyloliquefaciens) 0.4kb 0.7kb 1 2 3 4 5 6 7 8 9 10 1112131415 M 1.25 kb 1.1 kb I soggetti 1, 2, 6-10, 12, 14 e 15 sono omozigoti per la presenza del sito 0.75 kb 0.7 kb 0.4 kb I soggetti 3, 5 e 11 sono eterozigoti per la presenza/assenza del sito I soggetti 4 e 13 sono omozigoti per l’assenza del sito Separazione su gel di agarosio dei frammenti originati dalla digestione enzimatica del prodotto di PCR del DNA proveniente da 15 diversi individui Se le SNPs non si trovano su un sito di restrizione si possono esaminare con: •Sequenziamento •HPLC (Denaturing high-performance liquid chromatography) •Microarray SNPs: sequenziamento 1. SNP: Sequenziamento Elettroferogramma generato da un sequenziatore automatico individuo omozigote N Sito di eterozigosi C/G individuo eterozigote Rilevazione delle mutazioni mediante DHPLC Essa si basa sulla differente velocità di migrazione, in un mezzo simile ad un gel quale è la colonna HPLC, per gli eteroduplex e omoduplex. Questi duplex si formano quando un frammento amplificato di DNA mutato ed uno non mutato vengono denaturati termicamente e lasciati ricombinare (mismatch). Una qualsiasi variazione tra la molecola originale (wild type) e quella mutata porta alla formazione di un eteroduplex (combinazione di due catene di DNA a singola catena non perfettamente corrispondenti, caratterizzata dalla presenza di una "bolla" dove c'è la mutazione). L'eteroduplex si comporta cromatograficamente in modo differente (solitamente più veloce) La presenza di una mutazione si evidenzia sotto forma di picchi ulteriori rispetto al "wild"; il grande vantaggio per il ricercatore è che - pur non caratterizzando la mutazione (cioè non viene definito come è stata modificata la sequenza) - la DHPLC è in grado di rivelarne la presenza all'interno del frammento analizzato Gli eteroduplex migrano più lentamente rispetto agli omoduplex Tessuto della prostata, normale Tessuto della prostata, tumorale In questo esempio i cDNA sono stati posizionati su di un vetrino, simile ai normali vetrini usati per l’istologia. I microarrays (comunemente conosciuto come gene chip, chip a DNA, biochip o matrici ad alta densità Un microarray è un supporto solido (vetro, silice o plastica) sul quale sono stati posizionati diverse migliaia di cDNA (sonde) in spot separati. Ciascuno spot rappresenta un gene, in quanto contiene numerose copie di un cDNA corrispondente a tale gene. I microarray sfruttano una tecnica di ibridazione inversa, che consiste nel fissare tutti i segmenti di DNA (detti probe o sonda) su un supporto e nel marcare invece l'acido nucleico che vogliamo identificare (detto target). È una tecnica che è stata sviluppata negli anni '90 e oggi permette l'analisi dell'espressione genica monitorando in una sola volta gli RNA prodotti da migliaia di geni. DNA microarray: una collezione di microscopiche sonde (probe) Ordinate Miniaturizzate Immobilizzate su una superficie solida (attualmente vetro) I probe possono essere attaccati al substrato mediante: -Legame diretto, fisico o chimico -Legame indiretto, mediante molecole linker Affymetrix Genome-Wide Human SNP Array 6.0 •Risoluzione di 0.7 Kb •1.8 milioni SNPs e oligonucleotidi che coprono regioni povere di SNPs combinati insieme Intensità di segnale rilevata da uno scanner e i dati elaborati da un software PROTOCOLLO Affimetrix 6.0 E’ possibile avere 500,000 probe in uno spazio di 1.28 cm2 Ogni singolo probe è costituito da milioni di oligonucleotidi identici Il nuovo Affymetrix Genome-Wide Human SNP Array 6.0 caratterizza 1.8 milioni di marcatori genetici, inclusi più di 906,600 single nucleotide polymorphisms (SNPs) e più di 946,000 probes (sonde) per l’individuazione di copy number variation (CNV). L’alto valore di rendimento dello SNP array 6.0 permette ai ricercatori di progettare studi di associazione con un grande numero di campioni Il recente progredire delle tecnologie array ha aperto la possibilità di genotipizzare “economicamente” e rapidamente un intero gruppo di popolazione campione. La disponibilità di milioni di SNPs fornisce una mappa di alta densità lungo tutto il genoma, la quale può raggiungere adeguato potere per investigare varianti genomiche associate con malattie multifattoriali. I microarry rappresentano un sistema di analisi che velocizza considerevolmente l’esplorazione genomica permettendo, infatti, di esaminare contemporaneamente l’espressione di migliaia di geni o un ampio numero di polimorfismi genetici. Il tutto con costi relativamente contenuti se rapportati al numero di geni o polimorfismi analizzabili per esperimento. Array di oligonucleotidi ad alta densità Ibridizzazione La scannerizzazione del chip ci fornisce un’immagine in cui il grado di ibridizzazione viene evidenziato da una diversa intensità di emissione nel rosso. La rilevazione dell’immagine infatti è possibile grazie al legame alla biotina di un composto fluorescente (streptavidina-ficoeritrina) Array di oligonucleotidi ad alta densità Ibridizzazione A differenza degli array a DNA spottato, il sistema Affimetrix prevede l’ibridizzazione di un singolo campione su ogni genechip il microarray viene esposto ad una sorgente di luce laser. Gli spettri di emissione vengono quindi raccolti da uno scanner e le immagini monocromatiche indicanti i livelli diversi di espressione genica vengono pseudocolorate da un software di acquisizione d’immagine. De Risi J.L. et al Science 1997; 278:680-686. Heller R.A. et al PNAS 1997; 94:2150-2155. Principali applicazioni dei microarray cDNA microarray: per misurare i livelli di espressione di determinati geni microarray SNP (“Single Nucleotide Polymorphism”) e array di mutazione: per la genotipizzazione e identificazione di polimorfismi (SNPs) in una popolazione. microarray CGH (“Comparative Genomic Hybridization”): per osservare perdite o guadagni di materiale genomico o un cambiamento nel numero di copie di un gene particolare coinvolto in una malattia. International HapMap Project •Progetto iniziato nel 2002 •Si propone di “catalogare” le varianti comuni del DNA umano in una Mappa degli Aplotipi •Analizzati 270 soggetti differenti gruppi etnici obiettivo 1SNPs ogni 5Kb Per un totale di 3.8 milioni di SNPs provenienti da http://hapmap.ncbi.nlm.nih.gov/ Perché? Oltre il 99,5% del genoma di Homo sapiens è identico in ogni individuo. Perciò solo la restante parte contiene tutte le diversità genomiche, alcune delle quali possono influenzare il rischio di sviluppare malattie. Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science. CEPH panel Illumina Bead Chip 650K (642,690) N = 938 genetic ancestry of each individual individuals from the same population show similar ancestry proportions – population structuring robust (confirmed also by PCA) Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science. oceania america maximum-likelihood tree east asia main result: confirmation of the Out of Africa south/central asia europe middle east sub-saharan africa Li et al., 2008. Worldwide human relationships inferred from genome-wide patterns of variation. Science. Alcuni risultati PCA: I e II componente In nero Ogliastra, In rosso Trexenta e Sulcis Copy Number Variations (CNVs) Segmenti di DNA con estensione maggiore di 1 Kb presenti nel genoma con un numero variabile di copie. Contribuiscono: • alle differenze fenotipiche tra gli individui • alla patogenesi di malattie, sia mendeliane che multigeniche Essendo noi diploidi (meta' del genoma ci viene dal padre e meta' dalla madre), di ogni tratto di DNA o di ogni gene abbiamo sempre un numero di copie pari a 2. Se ne abbiamo 3, 4, 5 (1, 2 3 copie in piu', rispettivamente), o 1 o zero, allora abbiamo, per quel locus, una variazione del numero di copie. Questa variabilita' insospettata della popolazione umana e' stata giudicata come uno dei "breakthrough" (notizia bomba) del 2007 da parte di Science. Copy Number Variation (CNV) Si è stimato che circa 360 MB di DNA sono soggette a copy number variation. Circa il 12% dell’intero genoma aploide Essendo state trovate in individui normali, molte di queste sembrano neutre. Pian piano, però, ha preso corpo una lunga lista di malattie o predisposizioni a malattie, tumori compresi. Ma il punto più interessante, ovviamente, e' quello evolutivo, sempre perchè "niente in biologia ha senso se non alla luce dell'evoluzione". Esempio amilasi. Trovato tra i geni presenti in numero di copie variabili nella popolazione. Il gene per l’amilasi e’ presente nella saliva dove inizia la digestione dell’amido. L'amido era sicuramente presente nella dieta di cacciatori/raccoglitori in zone aride. I ricercatori sono andati a vedere se il numero di copie fosse da correlare appunto alle abitudini alimentari nelle varie popolazioni. Quale era l’ipotesi? Che le duplicazioni avessero rappresentato un vantaggio per le popolazioni di cacciatori/raccoglitori, con diete in cui l'amido era ben presente. L’ipotesi era corretta! Le duplicazioni insorgono a caso. E' il vantaggio selettivo che le propaga poi nella popolazione, poiché i portatori hanno maggiore probabilità di arrivare all'età adulta e quindi di fare figli. La loro fitness e' più alta. E per sottolineare come il vantaggio sia sempre relativo ad un dato ambiente, veniamo ai nostri giorni. Ora il vantaggio forse si e' ribaltato! Se il cibo, abbondante, viene sfruttato fino in fondo, c'e' il rischio di ingrassare, e quindi... la fitness si abbassa. CNVs polimorfiche Sindrome CNV Duplicazioni segmentali SNPs Geni Effetto Referenza HIV-1/AIDS susceptibility Comuni Si No CCL3L1 Dosaggio Gonzalez et al., 2005 Atrite reumatoide e Diabete di tipo 1 Comuni Si No CCL3L1 Dosaggio McKinney et al., 2007 SLE, Poliangite microscopica e Granulomatos i Wegener Comuni Si No FCGR3B Dosaggio Aitman et al., 2006; Fanciulli et al., 2007 SLE Comuni Si No C4A/C4B Dosaggio Yang et al., 2004 Malattia di Crohn Comuni Si No DEFB4 Dosaggio Fellermann et al., 2006 Disturbo bipolare Comuni No Pochi GSK3B Posizionale Lachman et al., 2007 Morbo di Parkinson precoce Rare No Si SNCA Dosaggio Ibáñez et al., 2004; Chartier-Harlin et al., 2004; Singleton et al., 2003 Morbo di Alzheimer Rare No Si APP Dosaggio Rovelet-Lecrux et al., 2006; Cabrejo et al., 2006 Pancreatite ereditaria Rare Si Pochi PRSS1 Dosaggio Le Maréchal et al., 2006 Autismo Comuni Non applicabile Vari Multipli Sconosciut o Sebat et al., 2007b; Szatmari et al., 2007 Cancro al seno familiare Comuni No Si MTUS1 (esone4) Posizionale Frank et al., 2007 Sindrome Ereditarietà Posizion e Gene CNV Sindrome di Bartter Autosomica dominante 1p36 CLCNKA /B Delezione Nozu et al., 2007 Sindrome di Gaucher Autosomica recessiva 1q21 GBA Delezione Tayebi et al., 2003 Nefronoftisi giovanile familiare Autosomica recessiva 2q13 NPHP1 Delezione Saunier et al., 2000; Konrad et al., 1996 Distrofia muscolare fascio-scapolo omerale Autosomica dominante 4q35 FRG1 Delezione Petrov et al., 2008 Atrofia muscolare spinale Autosomica recessiva 5q13.2 SMN Inversione/ Duplicazion e Wirth et al., 1997 Iperplasia adrenale congenita III Autosomica recessiva 6p21.3 CYP21 Delezione Tusié-Luna 1995 Williams-Beuren (WBS) Autosomica dominante 7q11.23 ELN/ GTF21 Delezione/ Inversione Pérez Jurado et al., 1998; Peoples et al., 2000 Iperaldosteronismo familiare I Autosomica dominante 8q21 CYP11B 1/2 Duplicazion e Fardella et al., 2001 β-talassemia Autosomica recessiva 11p15.5 β– globina Delezione Galanello et al., 2004; Harteveld et al., 2005 Prader-Willi (PWS) Autosomica dominante 15q11.2q13 SNRPN Delezione Christian et al., 1999; Amos-Landgraf et al., 1999 Angelman (AS) Autosomica dominante 15q11.2q13 OBE1A Delezione Christian et al., 1999; Amos-Landgraf et al., 1999 α-talassemia Autosomica recessiva 16p13.3 αglobina Delezione Harteveld et al., 2005 Referenze et White, 16p13.3 Delezione Harteveld et al., 2005 RAI1 Delezione Chen et al., 1997; Slager et al., 2003; Bi et al., 2004; Girirajan et al., 2005 17p11.2 ? Duplicazion e Potocki et al., 2000 17p12 PMP22 Duplicazion e Chance et al., 1994; Lupski, 1998 ; Boerkoel et al., 1999 PMP22 Delezione Chance et al., 1994; Lupski, 1998; Boerkoel et al., 1999 17q11.2 NF1 Delezione Dorschner et al., 2000 17q23.3 GH1 Delezione Stankiewicz 2002 TBX1 Delezione Edelmann et al., 1999a; Edelmann et al., 1999b; Shaikh et al., 2000 Xp22.32 STS Delezione Bonifas et al., 1987; Conary et al., 1987; Ballabio et Andria, 1992 X-linked Xq28 RCP/GC P Delezione Stankiewicz 2002 Incontinenza pigmenti X-linked Xq28 NEMO Delezione International Consortium, 2000 Distrofia muscolare Emery-Dreifuss X-linked Xq28 Emery/ FLN1 Delezione/ Duplicazion e Small et Warren, 1998 Sindrome di Hunter X-linked Xq28 IDS Delezione/ Inversione Beck et al., 1992 α-talassemia recessiva Smith-Magenis (SMS) Autosomica dominante 17p11.2 Potocky-Lupski (PLS) Autosomica dominante Charcot-MarieTooth 1A (CMT1A) Autosomica dominante Neuropatia tomaculare (HNPP) Autosomica dominante 17p12 Neurofibromatosi 1 (NF1) Autosomica dominante Nanismo pituitario Autosomica recessiva Di George/ Sindrome velocardiofacciale (DGS/VCFS) Autosomica dominante 22q11.2 Ittiosi X-linked Daltonismo globina et et Lupski, Lupski, IP Jakobsson et al., 2008. Genotype, haplotype and copy-number variation in worldwide human populations. Nature. SNPs CNVs Polimorfismi del DNA: minisatelliti e microsatelliti Allele A TACCAAGGTACGGACGGACGGACGGGGTACCATGG Allele B TACCAAGGTACGGACGGACGGACGGACGGGGTACCATGG Allele A TACCAAGGTACACACACGGTACCATGG Allele B TACCAAGGTACACACACACGGTACCATGG Allele C TACCAAGGTACACACACACACGGTACCATGG Allele D TACCAAGGTACACACACACACACGGTACCATGG Tipi di polimorfismo studiati nel DNA 3. Variazione del numero di copie: STR & VNTR STRs (Short Tandem Repeats) e VNTR (Variable Number of Tandem Repeat) Marcatori genetici molto utilizzati nel campo della genetica di popolazione e nel campo forense. Gli STRs vengono classificati in base alla lunghezza dell’unità ripetuta dinucleotidi trinucleotidi Tetra, penta e esanucleotidi I trinucleotidi, localizzati spesso negli esoni, posso essere la causa di patologie Scegliendo opportunamente 5 STR, la probabilità che essi risultino uguali in individui non imparentati è < 1/1012. Il kit per il riconoscimento di individui (identifiler) usato in medicina forense è costituito da 15 STR tetranucleotidi: HUMTH01, D21S22, D18S51, HUMVFA31, HUMFIBRA, D8S1179, HUMTPOX, HUMCSF1PO, D16S539, D7S820, D13S317, D5S818, D3S1358, D19S433, D2S1338 Nomenclatura degli STR Se il marcatore è parte di un gene, il nome del gene è usato per la designazione (TH01) Se il marcatore si trova al di fuori di un gene, esso viene designato in base alla posizione cromosomica (D16S539): D: DNA 16: cromosoma 16 S: sito 539: 539mo locus descritto sul cromosoma 16 Test di paternità Frequenza e localizzazione VNTR e STR Rappresentano il 5-10% del genoma eucariotico Le classi più rappresentate sono le ripetizioni monomeriche e dinucleotidi Ad eccezione dei trinucleotidi sono localizzati in regioni non codificanti del DNA I VNTR si trovano prevalentemente nelle regioni sottostanti il telomero; Gli STR sono distribuiti in modo relativamente uniforme all’interno del genoma; anche se gli esanucleotidi si sono stati ritrovati più frequentemente nelle regioni telomeriche. La variabilità genetica a livello molecolare 2. microsatelliti o short tandem repeats (STRs) I microsatelliti sono distribuiti in modo omogeneo nel genoma umano La variabilità genetica a livello molecolare 2. microsatelliti o short tandem repeats (STRs) perfetti interrotti composti I microsatelliti possono essere perfetti, interrotti o composti e vengono ulteriormente classificati in base alla lunghezza del motivo ripetuto (dinucleotide repeats, trinucleotide repeats ecc..) Ruolo DNA satellite DNA spazzatura????? Partecipazione alla ricombinazione meiotica? Ruolo nel ripiegamento della cromatina? Siti di legame per specifiche proteine nucleari? Origine del DNA satellite •Scambio ineguale durate il crossing over meiotico •Slittamento di due filamenti (stand slippage) durate la replicazione Perché i microsatelliti sono così polimorfici? La variabilità genetica a livello molecolare 2. microsatelliti o short tandem repeats (STRs) L’elevato tasso di mutazione nei microsatelliti è dovuto a scivolamento della polimerasi in replicazione •Tasso di mutazione molto elevato •La mutazione avviene generalmente per aumento o diminuzione di una singola unità ripetitiva •Mutazioni per aumento più frequenti di mutazioni per diminuzione •Il tasso di mutazione per ciascun microsatellite è correlato con la lunghezza dell’allele Rosenberg et al., 2008. Genetic structure of human populations. Science. CEPH panel; multiplex for 377 STRs test the correspondence of predefined groups with those inferred from individual multilocus genotypes clustering method that identifies subgroups that have distinctive allele frequencies Rosenberg et al., 2008. Genetic structure of human populations. Science. individuals from the same predefined population nearly always shared similar membership coefficient world-level boundaries between major clusters mostly correspond to major physical barriers (oceans, Himalaya, Sahara) Rosenberg et al., 2008. Genetic structure of human populations. Science. STRUCTURE efficiently detects isolated and homogeneous groups Nord Europa Nord Italia Sardegna Sicilia Baschi Corsica Cambogia Giappone Cina Karitiana, Brasile Gabon Maya, Messico Zaire Rep. Centro Africana Nuova Guinea Melanesia Australia Surui, Brasile Da: Genetic Analysis of a Sicilian population using 15 STRs. Basques Calò C.M., Garofano L., Mameli A., Pizzamiglio M., Vona G. Lombardy Human Biology, 75: 163-178; 2003 Alia Morocco Catalonia Poland Hungary Andalusia Portugal Egypt Tuscany Germany Switzerland Siracusa Catania Messina Ragusa Caltanissetta Agrigento Palermo Stutter o Shadow Bands Un problema da affrontare nell’analisi dei microsatelliti è la formazione, durante il processo di amplificazione, di prodotti aspecifici chiamati“stutter o shadow bands” Infatti l’utilizzo di una DNA polimerasi termostabile con un’alta processività può ridurre notevolmente la formazione di prodotti aspecifici La formazione dei prodotti aspecifici è legata alla processività della Taq Polimerasi(Lawyer F. et al.PCR Methods Appl.,1993 May; 2 (4): 275287) piuttosto che alla struttura secondaria del DNA ELETTOFORETOGRAMMA Stutter o Shadow Bands Nel caso delle ripetizioni dinucleotidiche,la stutter band prevalente è di 2 bp più piccola rispetto al picco principale,con in più la formazione di statter bands di 4 e 6bp più piccole anche visibili(Murray V. et al. Nucleic Acids Res,1993,21:2395-2398) Questo comporta che per ciascun allele si abbia un pattern con più bande il che rende complicata l’interpretazione dei dati, in modo particolare per campioni di DNA che sono una miscela di due o più individui La tendenza, adesso, è di utilizzare marcatori tri- o tetranucleotidici che danno risultati più evidenti Sequenze ripetute sparse Conosciute come retrotrasposoni. Trasposoni: frammenti di DNA che si spostano all’interno del genoma. Si distinguono 2 classi: LTR (con sequenze lunghe ripetute terminali) e non LTR, tra queste ultime individuiamo: •SINE (short interpersed repeated sequences): 100500 bp •LINE (long interspersed repeated sequences) DNA ripetitivo intersperso Le singole unità ripetute non sono raggruppate ma sparse in più punti del genoma. Gli esempi più comuni sono le sequenze SINEs (Short Interspersed Nuclear Element) e LINEs (Long Interspersed Nuclear Element) Sono associate perché tendono povere di geni mutazionale al LINEs prevalentemente a DNA genomico ricco in A/T a posizionarsi in regioni del cromosoma allo scopo di imporre il minimo impatto genoma. SINEs Sono associate prevalentemente a DNA genomico ricco in G/C. Perché? Sembra che tali sequenze svolgano una qualche funzione positiva per il genoma: esse sarebbero espresse in condizioni di stress ed i risultanti RNA legherebbero una particolare protein chinasi PKR e bloccherebbero la sua capacità di inattivare la traduzione. Più frequenti nei Primati e quindi nell’uomo. Famiglia SINE: Polimorfismo di inserzione/delezione Alu Si trovano negli introni e nelle regioni non tradotte Presentano un’organizzazione dimerica: 2 sequenze omologhe separate da una regione ricca di Adenina. E 2 unità sono omologhe al gene 7 SL RNA da cui derivano La mobilizzazione delle Alu all’interno del genoma è chiamata retrotrascrizione: movimento di materiale genetico da una posizione cromosomica ad un’altra, tramite un intermediario, la polimerasi III del RNA Replicazione Alu: una copia rimane nel luogo originale (matrice) mentre l’altra si inserirà nella nuova posizione. Questo processo potrebbe rappresentare l’espansione degli elementi Alu nel genoma umano, ma i fattori che controllano la retrotrascrizione non sono ancora ben chiari. Il fatto che le Alu, pur essendo localizzate in regioni non codificanti, sono state mantenute dalla selezione naturale, suggerisce l’ipotesi di una loro attività funzionale. La famiglia degli elementi Alu sono suddivisi in un certo numero di sottofamiglie, caratterizzate da una serie gerarchica di mutazioni, questo ci permette di individuare sottofamiglie di differenti età. Alu più antiche: PS (primate specific) AS (antropoid specific) CS (catarrine specific) HS (human spcefic) Le Alu più giovani sono rappresentate dalla sottofamiglia Y (Ya e Yb) Identificazione e tipizzazione di polimorfismi Alu •Identificazione: ricerca in database di elementi Alu giovani (famiglia Alu Y), che hanno una più elevata probabilità di essere stati trasposti durante l’evoluzione umana e quindi di essere polimorfici. •Tipizzazione: tramite PCR, con primers che fiancheggiano il sito di inserzione ed elettroforesi su gel d’agarosio. •Sono i polimorfismi più facili da analizzare Tassi medi di mutazione per vari polimorfismi (per locus per generazione) VNTR 10-1 – 10-2 STR 10-2 – 10-4 SNPs 10-6 – 10-8 Indel (retrovirus) 10-10 – 10-11 Nella regione ipervariabile del DNA mitocondriale, valori fino a 5 x 10-5 per sito per generazione MARCATORI DEL DNA Tipo di mutazione Proprietà Tasso di mutazione SNP Transizioni Trasversioni Stato ancestrale definito da confronto con outgroup Eventi unici o <10-9 INDEL Inserzione/Delezione di elementi ripetitivi del genoma Stato ancestrale noto Eventi unici Inserzione/Delezione di moduli omogenei ripetuti in tandem Ricorrenti Composti da blocchi di repeats di 2-5 bp Tipo di marcatore evoluzione lenta evoluzione rapida MICROSATELLITI SEMPLICI (STR) MINISATELLITI Inserzione/Delezione di moduli ripetuti in tandem Ricorrenti Composti da blocchi di repeats >10 bp 10-3 10-2 In qualsiasi tipo di applicazione dovrete scegliere tra diversi tipi di marcatori. Per fare questo bisogna tener conto di una serie di caratteristiche dei diversi marcatori, che possono essere più o meno importanti a seconda dei casi: • distribuzione sul genoma • tasso di mutazione • grado di eterozigosità • tempi tecnici dell’esperimento • costi dell’attrezzatura • costi dell’esperimento • precisione del metodo Caratteristiche biologiche Caratteristiche tecniche • distribuzione nel genoma: sufficiente che i geni non siano in LD per una più facile trattazione statistica: OK tutti i marcatori • tasso di mutazione: non rilevante OK tutti i marcatori • grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore l’informazione. OK minisatelliti, STRs • ereditarietà mendeliana: importante per una più facile trattazione statistica • tempi tecnici dell’esperimento • costi dell’attrezzatura • costi dell’esperimento • precisione del metodo • tipizzazione mediante PCR: fondamentale: spesso quantità di DNA minime • possibilità di automazione su larga scala: non rilevante • distribuzione nel genoma: sufficiente che i geni non siano in LD per una più facile trattazione statistica: OK tutti i marcatori • tasso di mutazione: non fondamentale ma da tenere in considerazione OK tutti i marcatori • grado di eterozigosità: fondamentale, maggiore l’eterozigosità, maggiore l’informazione: OK minisatelliti, STR • ereditarietà mendeliana: importante per una più facile trattazione statistica OK STR, SNPs • tempi tecnici dell’esperimento • costi dell’attrezzatura • costi dell’esperimento • precisione del metodo • tipizzazione mediante PCR: non rilevante se non in relazione ai costi • possibilità di automazione su larga scala: non rilevante • distribuzione nel genoma: fondamentale, omogeneamente distribuiti e comuni nel genoma: OK STRs e SNPs • tasso di mutazione: molto importante, OK SNPs • grado di eterozigosità: importante OK STRs e parte degli SNPs (quelli con H elevata) • tempi tecnici dell’esperimento • costi dell’attrezzatura • costi dell’esperimento • precisione del metodo • possibilità di automazione su larga scala: OK SNPs • distribuzione nel genoma: non rilevante • tasso di mutazione: fondamentale, deve essere contenuto OK SNPs, NO STRs • grado di eterozigosità: non rilevante • tempi tecnici dell’esperimento • costi dell’attrezzatura • costi dell’esperimento • precisione del metodo • tipizzazione mediante PCR: non rilevante se non in relazione ai costi • distribuzione nel genoma: non rilevante • tasso di mutazione: dipende dal contesto, possono essere usati SNPs, Alu, STRs, ma in modo diverso • grado di eterozigosità: +/- importante a seconda dei casi • tempi tecnici dell’esperimento • costi dell’attrezzatura • costi dell’esperimento • precisione del metodo: fondamentale Utilizzo degli SNPs in ambito forense Svantaggio: biallalici (poco polimorfici) Vantaggio: necessitano di amplificati di dimensioni minori di 100 bp (utile per DNA degradato) Numero SNPS per ottenere risultati significativi: 25-45 Correlazione di alcuni SNPs con caratteri fenotipici SLC24A5, TYR e SL45A2 sembrano correlati con la pigmentazione cutanea MC1R correla con il colore rosso dei capelli