DNA BARCODING E BIODIVERSITÀ MOLECOLARE

DNA BARCODING E BIODIVERSITÀ MOLECOLARE
DELLE ACCIUGHE DEL MEDITERRANEO
In collaborazione con il
Laboratorio di Neurobiologia dello sviluppo
DISTAV
Prof. Mario Pestarino
Prof.ssa Simona Candiani
Coop Liguria
INDICE
Introduzione
Engraulis Encrasicolus
Pag.3
1. Morfologia
2. Le specie di Engraulis e la loro distribuzione geografica
CAP. 1 Genetica
1.1 Restriction Fragment Length Polymorphism o RFLP
1.2. Dna Barcoding e Tracciabilita’ Molecolare delle Acciughe del Mediterraneo
Pag. 4
Pag. 6
CAP. 2 Geographic structure of European anchovy: a nuclear-DNA study
Materiali e metodi
Risultati e analisi dei dati
Conclusioni
Protocollo di laboratorio
Bioinformatica
Pag. 7
Pag. 7
Pag. 9
Pag. 9
Pag. 10
Pag. 11
Siti Web consultati:
www.ncbi.nlm.nih.gov/
primer3.ut.ee/
Bibliografia:
Geographic structure of European anchovy: a nuclear-DNA study Yanis Bouchenak-Khelladi a, Jean-Dominique Durand b, Antonios
Magoulas c, Philippe Borsa d,* Journal of Sea Research 59 (2008) 269-278" DOI : 10.1016/j.seares.2008.03.001
Nuclear-DNA markers confirm the presence of two anchovy species in the Mediterranean Philippe Borsa a,b,∗, Adeline Collet a,b, JeanDominique Durand
Multiple SNP Markers Reveal Fine-Scale Population and Deep Phylogeographic Structure in European Anchovy (Engraulis
encrasicolus L.) Iratxe Zarraonaindia1*, Mikel Iriondo1, Aitor Albaina1, Miguel Angel Pardo2, Carmen Manzano1, W. Stewart Grant3, Xabier
Irigoien4°Ë, Andone Estonba
SNP Discovery in European Anchovy (Engraulis encrasicolus, L) by High-Throughput Transcriptome and Genome Sequencing Iratxe
Montes1., Darrell Conklin2,3., Aitor Albaina1, Simon Creer4, Gary R. Carvalho4, Marı´a Santos5, Andone Estonba
2
INTRODUZIONE
Engraulis encrasicolus
1. Morfologia
L’acciuga europea (Engraulis encrasicolus, Linnaeus, 1758) è la sola specie, tra gli Engraulidi, presente nel
Mediterraneo. E` un pesce pelagico di piccole dimensioni (fino a 20 cm), con corpo affusolato, ricoperto da grandi
scaglie cicloidi caduche, e ventre arrotondato. La testa allungata ha ampie aperture branchiali. La bocca, posta
inferiormente, è grande ed oltrepassa ampiamente il margine posteriore degli occhi, che sono di grandi dimensioni.
La mascella inferiore è corta e presenta piccoli denti. Il dorso del corpo è azzurro-verdastro quando è ancora viva,
ma assume una colorazione bluastra a morte avvenuta; ventralmente e lateralmente è argentea.
E’ un pesce gregario, forma banchi molto numerosi che si avvicinano alla costa in primavera ed estate, attratti dal
plancton più ricco e vario; può compiere migrazioni verticali nell'arco della giornata. Durante le ore diurne le
acciughe si riuniscono in banchi che scendono verso gli strati d'acqua più profondi, sia per trovare nutrimento sia
per sfuggire ai predatori. Durante le ore notturne, invece, e soprattutto nella stagione riproduttiva, gli individui
maturi salgono sopra il termoclino per rilasciare i gameti. La forma stessa dei loro banchi viene modificata nel
corso della giornata.
2. Le specie di Engraulis e la loro distribuzione geografica
Il genere Engraulis è ampiamente diffuso in tutti i mari. Le specie che sono oggetto di pesca industriale sono le
seguenti:
Engraulis anchoita – acciuga argentina (Atlantico Sud-Ovest)
Engraulis australis– acciuga australiana (Australia Sud-Ovest)
Engraulis capensis – acciuga sudafricana (Atlantico Sud-Est e Sud Africa -ora chiamata E. encrasicolus)
Engraulis encrasicolus – acciuga europea (Atlantico Nord-Est, Mediterraneo)
Engraulis japonicus – acciuga giapponese (Pacifico Nord-Ovest)
Engraulis mordax – acciuga californiana (Pacifico Nord-Est)
Engraulis ringens– acciuga peruana (Pacifico Sud-Est)
Sono state ipotizzate numerosissime sottospecie o razze. La razza atlantica sarebbe diversa da quella
mediterranea e, all’interno del Mediterraneo, esistono altre differenti razze (Mediterraneo occidentale e Adriatico).
Si suggeriscono ulteriori differenziazioni tra le popolazioni delle diverse coste italiane:
- il gruppo di acciughe del Golfo del Leone (Mediterraneo),
- il gruppo atlantico.
Un certo grado di differenziazione fenotipica viene riscontrato anche tra le acciughe dell'area Sud-Est del Golfo di
Biscaglia rispetto a quelle dell'area della Galizia. Le differenze morfologiche tra le acciughe atlantiche
rispecchierebbero lo sfasamento della stagione riproduttiva, che risulta più breve (marzo giugno) e con picco in
aprile in Biscaglia, mentre risulta più estesa (marzo-ottobre) e con picco in agosto in Galizia.
All’interno dell’Adriatico, studi più recenti descrivono una separazione genetica tra lo stock di acciughe localizzato
nell'Adriatico nord-occidentale rispetto allo stock della regione centro-meridionale. Tali differenze appaiono
corrispondere non solo alle differenze morfologiche, ma anche alla variazione fenotipica di colorazione: morfotipo
"argento" nelle acque meno profonde (Nord) e morfotipo "blu" nelle acque piu` profonde (Sud).
Engraulis e., nelle acque adriatiche, comprenderebbe almeno due stocks geneticamente distinti, strettamente
corrispondenti agli aspetti idrografici come la profondità, l'idrologia e la produttività.
La forte associazione di varianti genetiche con la profondità costituisce una base biologica per l'evolversi della
differenziazione genetica, dal momento che le differenze di temperatura, ad esempio, possono portare a variazioni
nel tasso di crescita, nel raggiungimento della maturità sessuale e nella stessa attività riproduttiva.
Per l’acciuga europea è stato quindi proposta la suddivione in due specie parapratiche, Engraulis albidus e E.
encrasicolus (Borsa et al., 2004):
- E. albidus presumibilmente vive nelle acque salmastre costiere e risente dell’influenza delle correnti dei fiumi nel
Mediterraneo N-W e nel Mar Adriatico
- E. encrasicolus abita le acque oceaniche della piattaforma continentale.
Si parla di speciazione parapratica quando la divergenza avviene all'interno di popolazioni che non sono
totalmente isolate geograficamente, ma possiedono una ristretta zona di contatto.
In questo lavoro, il nostro scopo è fare una valutazione della variabilità genetica del DNA nucleare dell’
acciuga europea. Per caratterizzare le popolazioni europee di acciughe del Mediterraneo, indaghiamo in
particolare la variabilità geografica delle popolazioni di E.encrasicolus tra l’Atlantico e il Mediterraneo e nell’ambito
del bacino mediterraneo, e prendiamo in considerazione come marcatore la variazione di lunghezza presso un
locus di un introne, cioè un RFLP.
3
CAP. 1
GENETICA
1. 1 RFLP (o Restriction Fragment Length Polymorphism)
Gli RFLP sono di primaria importanza negli studi di genetica, essendo utilizzati come marcatori genetici durante la
mappatura del genoma e nell’identificazione di geni particolari.
Un marcatore genetico è una sequenza di DNA conosciuta che può essere identificata mediante un semplice
saggio. Un marcatore genetico può essere costituito da una breve sequenza di DNA, come la sequenza che
circonda un polimorfismo a singolo nucleotide (SNP o single nucleotide polymorphism), o da una sequenza lunga,
come i microsatelliti.
La sigla RFLP ( Restriction Fragment Length Polymorphism - polimorfismo di lunghezza dei frammenti di
restrizione) viene utilizzata per indicare due concetti distinti:
- una caratteristica delle molecole del DNA che consente di distinguerle l'una dall'altra, grazie alle differenze
nelle sequenze di nucleotidi che le compongono, dovuta a presenza di sequenze ripetute, inserzioni o
delezioni)
- la tecnica di laboratorio che sfrutta tali caratteristiche per mettere a confronto le varie molecole di DNA.
Gli RFLP sono marcatori a singolo locus, quindi marcatori codominanti (trasmissione mendeliana).
Permettono di distinguere:
- i loci omozigoti rappresentati da una sola banda (uno o l’altro allele)
- i loci eterozigoti, rappresentati da bande diverse (entrambi gli alleli marcatori)
Analisi dei RFLP. Tecniche usate:
- Ibridazione molecolare ► Southern blot (utilizzo di sonde)
- Amplificazione del DNA (PCR)
- Approcci misti ►Digestione enzimatica e amplificazione
L’analisi delle differenze della sequenza nucleotidica studiata mediante RFLP viene realizzato in modo rapido
mediante reazione di polimerizzazione a catena o PCR. L'amplificazione può essere diretta sul sito di restrizione
alterato, ed i prodotti digeriti con l'enzima di restrizione.
Il DNA viene sezionato in frammenti di restrizione mediante enzimi di restrizione detti endonucleasi, che attuano il
taglio unicamente in corrispondenza di particolari sequenze nucleotidiche, specifiche per ogni enzima. La distanza
tra le posizioni di taglio causate dagli enzimi di restrizione (i cosiddetti siti di restrizione) è variabile tra un individuo
e l'altro, dando quindi luogo a variazioni nella lunghezza dei frammenti. L’esistenza di diverse varianti prende il
nome di polimorfismo. I frammenti di restrizione vengono quindi separati per lunghezza mediante elettroforesi su
gel di agarosio.
4
I cambiamenti nella sequenza dei frammenti ottenuti testimoniano l’eventuale scomparsa o il riarrangiamento di
alcuni geni.
SNPs (polimorfismi a singolo nucleotide) o INDELs ( inserzioni o delezioni) possono creare o abolire siti di
restrizione per gli enzimi di restrizione (RE), generando frammenti di DNA di diversa lunghezza.
L'analisi di RFLP è stata anche la base per primi metodi di fingerprinting genetico. In particolare:
1. per l'identificazione dei campioni recuperati da scene del crimine,
2. nella caratterizzazione della diversità genetica o di modelli di allevamento nelle popolazioni animali
3. per determinare le relazioni che intercorrono tra le varie specie.
4. nella determinazione della paternità. Nel caso dei test di paternità la differenza di RFLP può essere usata
per distinguere geneticamente due individui o mostrare le relazioni genetiche che intercorrono tra individui,
in quanto i figli ereditano il materiale genetico dai propri genitori.
5. per studiare malattie genetiche. Es.:
a. un RFLP all’interno del gene per la β-globina (anemia falciforme)
b. un RFLP in sequenze fiancheggianti il sito HpaI nel gene per la fenilalanina idrossilasi (fenilchetonuria)
c. DNA ripetuto – triplette di CAG - all’interno del gene (Corea di Huntington), o in sequenze regolative
(sindrome dell’X-fragile)
Fig. 1 Flow chart del protocollo di laboratorio
5
1.2. DNA barcoding e tracciabilita’ molecolare delle acciughe del Mediterraneo
L'utilizzo di una breve sequenza di DNA per standardizzare l' identificazione degli organismi è definito anche con il
termine di DNA barcoding. L' innovativa metodologia proposta si è rivelata utile nell'ambito della sicurezza
alimentare e in particolare nel settore ittico, dove la frequente sostituzione di tranci o filetti di specie ittiche pregiate
con carni di esemplari di minor valore ha messo in luce la necessità di sviluppare nuovi sistemi di tracciabilità
molecolare.
Come è possibile discriminare fra popolazioni diverse di pesci?
La tecnica su cui il consorzio europeo sta puntando maggiormente è quella dei polimorfismi a singolo nucleotide o
SNPs. Il test a base di SNPs, già testato con successo sulle diverse varietà di salmone del Pacifico, dovrebbe
permettere di distinguere fra differenti popolazioni di pesci, localizzate in diverse aree geografiche, all’interno della
stessa specie. Inoltre sembra essere il metodo più veloce, economico e utilizzabile anche su grande scala fra quelli
presi finora in considerazione.
Dallo studio di 20 popolazioni comuni nelle acque europee, i ricercatori hanno analizzato per ogni popolazione il
DNA di circa 50 pesci, trovando frequenze diverse di SNPs per ciascuna popolazione. Hanno così messo a punto
un “chip a SNP” da utilizzare per ciascuna specie.
Un segmento di circa 650 bp del gene della citocromo ossidasi I mitocondriale (COI) è stato proposto come miglior
barcode, almeno per il regno animale, dove si è potuta verificarne l'efficacia in diversi taxa, e gran parte delle
specie studiate (>94%) possiede barcode ben differenziati, con bassa variabilità intraspecifica ed alta divergenza
tra taxa strettamente imparentati.
6
Cap.2
GEOGRAPHIC STRUCTURE OF EUROPEAN ANCHOVY: A NUCLEAR-DNA STUDY
Materiali e Metodi
2.1 Campioni.
Sono stati raccolti e numerati 7 campioni di acciughe provenienti da:
1. Atlantico-Francia del Nord
2. Croazia
3. Mar Ligure/Tirreno
4. Pescara
5. San Benedetto del Tronto
6. Venezia/ S.Stino
7. Atlantico- Spagna
2.2 Preparazione del campione per l’estrazione di DNA
a. Scongelare le acciughe
a. Fissarle su piastre in paraffina mediante spilli
b. Procedere con un bisturi all’apertura dalla parte ventrale dell’animale
c. Prelevare solamente i tessuti molli
d. Scartare la pelle e tutte le lische
e. Dividere il tessuto ottenuto in piccoli pezzi (compresi tra 0,5 g e 1,5 g)
f. Conservare i campioni in eppendorf DNAse free a -20C°
2.3 Preparazione proteinasi K:
5 mg di polvere in 250 µl di di H20 per biologia molecolare (DNAse free)
2.4 Estrazione del DNA con KIT QUIAGEN
a. Scongelare il campione a temperatura ambiente (15-25C°)
b. Aggiungere 180 µl di buffer AL, direttamente nella eppendorf contenente il campione
c. Aggiungere 20 µl di proteinasi K nella eppendorf
d. Vortexare 15 secondi e lasciare in stufa a 55C° per 3 ore.
Seguire protocollo del kit Quiagen: www.qiagen QIAamp DNA Mini Kit and QIAamp DNA Blood Mini Kit.
Unica variante: nell’ultimo passaggio risospendere il DNA in 50 µl - invece di 200 µl- di elution buffer.
7
2.5 Lettura del DNA genomico al nanodrop
Vengono posizionati 2 µl di DNA sotto il lettore dello strumento. Il risultato della lettura fornisce la
concentrazione e diversi valori che indicano la qualità del DNA genomico estratto. La concentrazione di DNA
richiesta dal protocollo è di 100 ng/µl
2.6 Caratterizzazione del polimorfismo di lunghezza della regione intronica CK6-1
Sono stati disegnati i primers per amplificare con una PCR locus-specifica una regione intronica polimorfica
per lunghezza nel locus CK6-1 di una famiglia multigenica di creatina-kinasi (Borsa et al.,2004).
CK6-1F (5’ - CGACATTGTAATGATGTTACAATGA- 3’)
CK6-1R (5’ - ATTTCCTTTGGGTTGGCTCTTCTCT- 3’)
La PCR è stata fatta in 20 µL di mix di reazione, contenente 1.0 µL (5-20ng) DNA, 0.5 µM Forward primer (CK61F) 0.5 µM Reverse primer (CK6-1R), and 8.0 µL Taq-polymerase (Hot Master Mix) nel suo buffer(dnTPs, MgCl2),
10 µL di H2O.
Il programma di PCR comprende:
1. step iniziale di denaturazione di 2 min a 94 °C
2. 35 cicli di: denaturazione (35 s a 94 °C), annealing per 30 s at 53 °C ed extension (1 min at 70 °C)
3. step finale di extension di 7 min. a 70 °C
La reazione è stata fatta correre in un termociclatore.
I prodotti della PCR sono stati osservati con la tecnica dell’elettroforesi su gel di Agarosio (1,5 % ).
Le bande di DNA sono state visualizzate con UV scanner. Gli alleli ottenuti sono stati identificati con la loro misura,
524 e 320 bp.
Sono state lette anche le sequenze dei due alleli per cercare la corrispondenza con gli alleli pubblicati e
presenti nei database: GenBank AY486347- E. encrasiculus isolate SET24.2 creatine kinase (CK6) gene 524 bp,
GenBank AY486346- E. albidus isolate CUL10.4 creatine kinase (CK6) gene 406 bp.
.
Fig. 2.1 – Flow chart del DNA Barcoding: dal prelievo del muscolo all’estrazione, amplificazione, sequenziamento e analisi dei dati.
8
Risultati e Analisi dei dati genetici
Misura del polimorfismo al locus CK6-1.
Il locus CK6-1 mostra due alleli: un allele di 320 base pairs (bp), un allele di 524 base pairs (bp)
√
Omozigote x l’allele da 320 bp:
Francia ATL (1), Pescara (4)
E. albidus
√
Omozigote x l’allele da 524 bp :
Croazia (2), San Benedetto del Tronto(5),
Spagna Atlantica(7)
E. encrasicolus
√
Eterozigote per gli alleli da 320 e da 524 bp:
Mar Ligure (3) e Laguna di Venezia (6)
E.encrasicolus
Fig. 1A e 1B
Il polimorfismo di lunghezza del locus CK6-1 è di tipo mendeliano, cioè presenta non più di due bande di DNA
in ogni campione e tutte le possibili combinazioni di bande sono state osservate nel totale dei campioni.
Conclusioni
I campioni presi in esame e provenienti dalle stesse aree geografiche rispetto ai campioni esaminati nel lavoro di
Borsa (2008) concordano sull’ allele di 524 bp.
Invece non è stato trovato in nessuno dei nostri campioni l’allele di 406 bp.
Il nuovo allele di 320 bp da noi identificato non è citato in letteratura. Potrebbe quindi essere una nuova variante
genetica della specie Engraulis.
9
PROTOCOLLO DI LABORATORIO
1° STEP.
ESTRAZIONE DNA
Vedi protocollo Qiagen
2° STEP. PCR
- Mix reazione PCR:
Primer Forward
Primer Reverse
DNA templato
Taq
(Hot Master Mix)
H2 O
Vfin
0,5 µl
0,5 µl
1 µl
8 µl
10 µl
20 µl
- Programma di PCR:
STEP
1.
Denaturazione
2. Annealing/
extension
TEMP
TEMPO
CICLI
94 °C
2 min
1
94°C
53°C
70°C
30 sec
30 sec
variabile
35
70°C
7 min
1
3.
extension
finale
I prodotti di PCR vengono controllati su gel di agarosio 1,5% in TBE, con l’aggiunta di intercalante.
3. ELETTROFORESI SU GEL DI AGAROSIO
1. Sciogliere 0,9 g di agarosio in 60 ml di TBE 1X pH 8 portando ad ebollizione.
2. Raffreddare a circa 60°C.
3. Aggiungere 7 ml di bromuro di etidio (1:10000) ( oppure un altro intercalante)
4. Agitare la soluzione evitando la formazione di bolle.
5. Versare rapidamente nella cella elettroforetica.
6. Lasciare polimerizzare per almeno 30 min.
7. Preparazione dei campioni alla corsa elettroforetica:
- Prelevare i 20 µl di prodotto di PCR con la micropipetta e mescolarli con 4 µl di LD6X (loading dye 6X)
- Posizionare la soluzione in un pozzetto del gel nella camera elettroforetica
- Caricare un pozzetto con 5 µl di marcatore 100 bp addizionato con 1 µl di LD6X
8. Corsa elettroforetica
I campioni vengono fatti correre su gel a 90V per circa 30 minuti
10
BIOINFORMATICA
OBIETTIVI DELL’ ESERCITAZIONE
• Saper consultare banche dati di interesse biomedico.
• Apprendere l’utilizzo di alcuni strumenti bioinformatici.
• Saper correlare fra loro le sequenze.
• Sapere confrontare genomi di organismi differenti.
Il sito da cui partiremo per la nostra navigazione tra i genomi di specie diverse è
www.ncbi.nlm.nih.gov/
1. Trova il gene: CK6-1 Engraulis encrasicolus
La sequenza che cerchiamo si trova nell’introne 6 del gene Creatine Kinase, un gene costitutivo (housekeeping)
molto grande, comune a (quasi) tutti gli organismi viventi
In GENBANK cerchiamo:
√ l’allele di 524 bp. Accession number: AY486347. Engraulis encrasicolus isolate SET24.2 creatine kinase
(CK6) gene 524 bp. Le sequenze sono scritte con il doppio filamento di DNA.
CK6F 5’-CGACATTGTAATGATGTTACAATGA-3’
CK6R 5’-ATTTCCTTTGGTTTGGCTCTTCTCT-3’
1
101
201
301
401
501
√
CGACATTGTA
GCTGTAACAT
CTCTCTTATT
GAGAGAATAA
AATGCTATTT
TTACGATAAA
AATCTTATAA
TTAGAATATT
TGGGTATATA
ACCCATATAT
GAGAAGAGCC
CTCTTCTCGG
ATGATGTTAC
TACTACAATG
TCAAATTCCT
AGTTTAAGGA
TAATGATATT
ATTACTATAA
TCATGCTGTT
AGTACGACAA
GTTAGCAATT
CAATCGTTAA
AAACCAAAGG
TTTGGTTTCC
AATGACATGG
TTACTGTACC
GGCTATGGCC
CCGATACCGG
ATAATGACAT
TATTACTGTA
AAATTCCAAG
TTTAAGGTTC
TTAGGAAGGT
AATCCTTCCA
AAAT
TTTA
TCGACCGTAG
AGCTGGCATC
ATGTACAATG
TACATGTTAC
TATAATGGTA
ATATTACCAT
GCTTCCATGA
CGAAGGTACT
ATATTGAAAT
TATAACTTTA
CCATATTTGA
GGTATAAACT
ATGTTATATT
TACAATATAA
TAATAATGAC
ATTATTACTG
CGAGTCACCA
GCTCAGTGGT
TCCCAACCTT
AGGGTTGGAA
GGTAAGGGAG
CCATTCCCTC
TTGATAATGC
AACTATTACG
CGTTTTACAG
GCAAAATGTC
TTGATTAAAC
AACTAATTTG
TTCTGCTGGG
AAGACGACCC
GTCCGGACTG
CAGGCCTGAC
TAGTAAGCAA
ATCATTCGTT
TTTCCTCCAT
AAAGGAGGTA
GTGGCTGTGC
CACCGACACG
TATACTGCAT
ATATGACGTA
CCCTTATTTT
GGGAATAAAA
ACAGGTGATG
TGTCCACTAC
TGGTTTGTCT
ACCAAACAGA
TATTCTAAAT
ATAAGATTTA
GATCCACACA
CTAGGTGTGT
TAGAGAAAAT
ATCTCTTTTA
TGTATGCCAA
ACATACGGTT
GATTTCTTGA
CTAAAGAACT
ATTGAACAAT
TAACTTGTTA
TCGGATTGTT
AGCCTAACAA
CATATGGAAC
GTATACCTTG
GTGCAGATAT
CACGTCTATA
AAGTGATTGT
TTCACTAACA
GACTTTTAAG
CTGAAAATTC
CACAGCTCCA
GTGTCGAGGT
l’allele di 406 bp. Accession number: AY486346. Engraulis albidus isolate CUL10.4 creatine kinase
(CK6) gene 406 bp
CK6F 5’-CGACATTGTAATGATGTTACAATGA-3’
CK6R 5’-ATTTCCTTTGGTTTGGCTCTTCTCT-3’
1
101
201
301
401
11
CGACATTGTA
GCTGTAACAT
TTATAATGAC
AATATTACTG
TTAAATTCCA
AATTTAAGGT
TTTTAGGAAG
AAAATCCTTC
GGAAAT
CCTTTA
ATGATGTTAC
TACTACAATG
ATTATAATGG
TAATATTACC
AGGCTTCCAT
TCCGAAGGTA
GTATATTGAA
CATATAACTT
AATGATGTTA
TTACTACAAT
TATAATAATG
ATATTATTAC
GACGAGTCGC
CTGCTCAGCG
ATTCCCAACC
TAAGGGTTGG
TATTTTGATA
ATAAAACTAT
ACCGTTTTAC
TGGCAAAATG
CATTGATTCA
GTAACTAAGT
TTTTCTGGTG
AAAAGACCAC
ATGCTAGTAA
TACGATCATT
AGTTTCCTCC
TCAAAGGAGG
AAGTGGCTGT
TTCACCGACA
GGTATACTGC
CCATATGACG
GCAAATAGGT
CGTTTATCCA
ATTGGTTTGT
TAACCAAACA
GCTATTCTAA
CGATAAGATT
ATGATCCACA
TACTAGGTGT
GATGTGTATG
CTACACATAC
CTGATTTCTT
GACTAAAGAA
ATATTGAACA
TATAACTTGT
CATCGGATTG
GTAGCCTAAC
CCAAGTGCAG
GGTTCACGTC
GAAAGTGATT
CTTTCACTAA
ATAGCTTTTA
TATCGAAAAT
TTCACAGCTC
AAGTGTCGAG
ATAATGCTAT
TATTACGATA
GTAATCTTGT
CATTAGAACA
AGTGGGTATA
TCACCCATAT
CAGAGAAGAG
GTCTCTTCTC
TTTAATGATA
AAATTACTAT
AGTCATGCTG
TCAGTACGAC
CAGTTAGCAA
GTCAATCGTT
CCAAGCCAAA
GGTTCGGTTT
2. Geni identificati nei campioni delle sette acciughe esaminate
Nel nostro lavoro abbiamo identificato l’allele da 524 bp – uguale a quello presente nel database- e un nuovo allele
da 320 bp. Di questi due alleli sono state lette le sequenze e si è trovata una nuova delezione di 204 bp.
√
Clone 1 di 320 bp
F 5’
1
101
201
301
√
CGACATTGTA
GCTGTAACAT
TCTCTTATTT
AGAGAATAAA
TATATAGTTA
ATATATCAAT
AGAGCCAAAC
TCTCGGTTTG
ATGATGTTAC
TACTACAATG
CAAATTCCTG
GTTTAAGGAC
GCAATTTTAG
CGTTAAAATC
CAAAGGAAAT
GTTTCCTTTA
AATGACATGG
TTACTGTACC
GCTATGGCTT
CGATACCGAA
GAAGGTATAT
CTTCCATATA
TCGACCGTAG
AGCTGGCATC
CCATGACGAG
GGTACTGCTC
TGAAATTCCC
ACTTTAAGGG
CCATATATGA
GGTATATACT
TCACCATTGA
AGTGGTAACT
AACCTTTTCT
TTGGAAAAGA
GGTAAGGGAG
CCATTCCCTC
TTAAACGTGG
AATTTGCACC
GGTGGGTATA
CCACCCATAT
TTCCGGACTG
AAGGCCTGAC
CTGTGCTATT
GACACGATAA
CTGCATGATC
GACGTACTAG
CCCTTATTTT
GGGAATAAAA
CTAAATATTG
GATTTATAAC
CACACATCGG
GTGTGTAGCC
TAGAGAAAAT
ATCTCTTTTA
AACAATGGCT
TTGTTACCGA
ATTGTTCACA
TAACAAGTGT
CATAAGGACC
GTATTCCTGG
TTTAAGTGGG
AAATTCACCC
GCTCCAGAGA
CGAGGTCTCT
R 3’
AATGACATGG
TTACTGTACC
GCTATGGCCA
CGATACCGGT
TAAGGACATT
ATTCCTGTAA
AATTCCAAGG
TTAAGGTTCC
TAGGAAGGTA
ATCCTTCCAT
AAT
TTA
TCGACCGTAG
AGCTGGCATC
TGTACAATGA
ACATGTTACT
ATAATGGTAT
TATTACCATA
CTTCCATGAC
GAAGGTACTG
TATTGAAATT
ATAACTTTAA
CCATATATGA
GGTATATACT
TGTTATATTT
ACAATATAAA
AATAATGACC
TTATTACTGG
GAGTCACCAT
CTCAGTGGTA
CCCAACCTTT
GGGTTGGAAA
GGTAAGGGAG
CCATTCCCTC
TGATAATGCT
ACTATTACGA
GTTTTACAGT
CAAAATGTCA
TGATTAAACG
ACTAATTTGC
TCTGGTGGGT
AGACCACCCA
TTCCGGACTG
AAGGCCTGAC
AGTAAGCAAA
TCATTCGTTT
ATCCTCCATT
TAGGAGGTAA
TGGCTGTGCT
ACCGACACGA
ATACTGCATG
TATGACGTAC
CCCTTATTTT
GGGAATAAAA
CAGGTGATGT
GTCCACTACA
GGTTTGTCTG
CCAAACAGAC
ATTCTAAATA
TAAGATTTAT
ATCCACACAT
TAGGTGTGTA
TAGAGAAAAT
ATCTCTTTTA
GTATGCCAAG
CATACGGTTC
ATTTCTTGAA
TAAAGAACTT
TTGAACAATG
AACTTGTTAC
CGGATTGTTC
GCCTAACAAG
CATATGGACC
GTATACCTGG
TGCAGATATA
ACGTCTATAT
AGTGATTGTA
TCACTAACAT
GCTTTTAAGT
CGAAAATTCA
ACAGCTCCAG
TGTCGAGGTC
R 3’
Clone 7 di 523 bp
1
101
201
301
401
501
F 5’
CGACATTGTA
GCTGTAACAT
TCTCTTATTT
AGAGAATAAA
ATGCTATTTT
TACGATAAAA
ATCTTATAAT
TAGAATATTA
GGGTATATAG
CCCATATATC
AGAAGAGCCA
TCTTCTCGGT
ATGATGTTAC
TACTACAATG
CAAATTCCTG
GTTTAAGGAC
AATGATATTA
TTACTATAAT
CATGCTGTTA
GTACGACAAT
TTAGCAATTT
AATCGTTAAA
AACCAAAGGA
TTGGTTTCCT
3. Confrontiamo le sequenze. Allineamento delle sequenze
Consideriamo l’allineamento tra la «nuova» sequenza nucleotidica e quelle già presenti in banca dati.
L’allineamento tra sequenze nucleotidiche consente di mettere in luce l’esistenza di similarità di sequenza, che
vengono «misurate» in base alla percentuale di identità fra le due (o più) sequenze allineate.
Gli scopi per cui è utile analizzare la similarità fra due sequenze nucleotidiche sono molteplici:
• identificazione di regioni conservate: sequenze di regolazione dell’espressione genica;
• attribuzione di una funzione e/o identificazione di un nuovo gene;
• classificazione dei geni in famiglie;
• studi di filogenesi molecolare, per ricostruire le relazioni evolutive fra le specie;
• studi di genetica di popolazione (migrazioni delle popolazioni umane, relazioni fra i vari gruppi umani)
3.1
Align tra l’allele di 524 bp e il clone 7 di 524 bp.
1
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
12
50
(1) CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATTTGA
(1) CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATATGA
51
100
(51) GGTAAGGGAGGTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGAAC
(51) GGTAAGGGAGTTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGA-C
101
150
(101) CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT
(100) CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT
151
200
(151) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT
(150) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT
201
250
(201) AATGCTATTTTAATGATATTATAATGACATTATAATGGTATAATAATGAC
(200) AATGCTATTTTAATGATATTATAAGGACATTATAATGGTATAATAATGAC
251
300
(251) CGTTTTACAGTTTCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT
(250) CGTTTTACAGTATCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT
301
350
(301) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA
(300) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA
351
400
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
Engraulis encrasicolus isolate
clone7
(351) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGACTTTTAAG
(350) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGGCTTTTAAG
401
450
(401) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT
(400) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT
451
500
(451) TTCTGCTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA
(450) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA
501
524
(501) GAGAAGAGCCAAACCAAAGGAAAT
(500) GAGAAGAGCCAAACCAAAGGAAAT
3.2 Align tra l’allele di 524 bp e il clone 1 di 320 bp
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
clone1
Engraulis encrasicolus isolate
1
50
(1) CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATATGA
(1) CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATTTGA
51
100
(51) GGTAAGGGAGTTCCGGACTGCCCTTATTTTTAGAGAAAATCATAAGGA-C
(51) GGTAAGGGAGGTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGAAC
101
150
(100) CTCTCTTATTTCAAATTCCTGGCTATGG---------------------(101) CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT
151
200
(128) -------------------------------------------------(151) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT
201
250
(128) -------------------------------------------------(201) AATGCTATTTTAATGATATTATAATGACATTATAATGGTATAATAATGAC
251
300
(128) -------------------------------------------------(251) CGTTTTACAGTTTCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT
301
350
(128) -------------------------------CTTCCATGACGAGTCACCA
(301) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA
351
400
(147) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGGCTTTTAAG
(351) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGACTTTTAAG
401
450
(197) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT
(401) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT
451
500
(247) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA
(451) TTCTGCTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA
501
524
(297) GAGAAGAGCCAAACCAAAGGAAAT
(501) GAGAAGAGCCAAACCAAAGGAAAT
3.3 Align totale tra le 4 sequenze: clone 1, clone 7, E.encrasicolus, E. albidus
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
(1)
(1)
(1)
(1)
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
(51)
(19)
(51)
(51)
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
(100)
(19)
(100)
(101)
clone1
Engraulis albidus isolate
(127)
(35)
13
1
50
CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATATGA
CGACATTGTAATGATGTT-------------------------------CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATATGA
CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATTTGA
51
100
GGTAAGGGAGTTCCGGACTGCCCTTATTTTTAGAGAAAATCATAAGGA-C
-------------------------------------------------GGTAAGGGAGTTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGA-C
GGTAAGGGAGGTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGAAC
101
150
CTCTCTTATTTCAAATTCCTGGCTATG--------------------------------------------------------ACAATGATGTTATATT
CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT
CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT
151
200
-------------------------------------------------TTGATAATGCTAGTAAGCAAATAGGTGATGTGTATGCCAAGTGCAGATA-
clone7
Engraulis encrasicolus isolate
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
clone1
Engraulis albidus isolate
clone7
Engraulis encrasicolus isolate
(150) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT
(151) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT
201
250
(127) -------------------------------------------------(84) -ATGCTATTTTAATGATATTATAATGACATTATAATGGTATAATAATGAC
(200) AATGCTATTTTAATGATATTATAAGGACATTATAATGGTATAATAATGAC
(201) AATGCTATTTTAATGATATTATAATGACATTATAATGGTATAATAATGAC
251
300
(127) -------------------------------------------------(133) CGTTTTACAGTTTCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT
(250) CGTTTTACAGTATCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT
(251) CGTTTTACAGTTTCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT
301
350
(127) ------------------------------GCTTCCATGACGAGTCACCA
(183) AATCTTGTAGTCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCGCCA
(300) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA
(301) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA
351
400
(147) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGGCTTTTAAG
(233) TTGATTCAAAGTGGCTGTGCTATTCTAAATATTGAACAATAGCTTTTAAG
(350) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGGCTTTTAAG
(351) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGACTTTTAAG
401
450
(197) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT
(283) TGGGTATACAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT
(400) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT
(401) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT
451
500
(247) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA
(333) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA
(450) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA
(451) TTCTGCTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA
501
524
(297) GAGAAGAGCCAAACCAAAGGAAAT
(383) GAGAAGAGCCAAGCCAAAGGAAAT
(500) GAGAAGAGCCAAACCAAAGGAAAT
(501) GAGAAGAGCCAAACCAAAGGAAAT
Le sequenze evidenziate in giallo sono quelle conservate in tutte e quattro le isoforme alleliche, quelle in turchese
sono comuni solo a tre, poi ci sono le singole “mutazioni” in ognuna delle quattro.
4. Come si disegnano i Primers per amplificare la regione d’interesse ?
Si apre la pagina: http://www.ncbi.nlm.nih.gov/
Cercare il gene di interesse: scrivendone il nome o l'accession number e assicurarsi che nella barra a sinistra ci
sia “nucleotide”
14
Selezionare il formato FASTA in alto a destra.
Selezionare la sequenza in FASTA e trasferirla in un nuovo programma bioinformatico chiamato Primer3
Si apre questa schermata. Inserire la sequenza FASTA dove c'è la freccia nel disegno qui sotto
Scorrendo la pagina cercare la parte dove si possono settare i parametri dei primer:
15
- per primer size: non eccedere oltre 23 e stare in un ottimo di 21 nucleotidi di lunghezza del primer
- non toccare la T di melting
- i valori di GC % dei primer devono stare attorno al 50% come Optimal
Cliccare “pick primer” e attendere l'esito della ricerca
Freccia gialla : indica il primer Forward
Freccia rosa : indica il primer Reverse
Product size 318 : indica l'ampiezza del frammento che sarà amplificato.
16