DNA BARCODING E BIODIVERSITÀ MOLECOLARE DELLE ACCIUGHE DEL MEDITERRANEO In collaborazione con il Laboratorio di Neurobiologia dello sviluppo DISTAV Prof. Mario Pestarino Prof.ssa Simona Candiani Coop Liguria INDICE Introduzione Engraulis Encrasicolus Pag.3 1. Morfologia 2. Le specie di Engraulis e la loro distribuzione geografica CAP. 1 Genetica 1.1 Restriction Fragment Length Polymorphism o RFLP 1.2. Dna Barcoding e Tracciabilita’ Molecolare delle Acciughe del Mediterraneo Pag. 4 Pag. 6 CAP. 2 Geographic structure of European anchovy: a nuclear-DNA study Materiali e metodi Risultati e analisi dei dati Conclusioni Protocollo di laboratorio Bioinformatica Pag. 7 Pag. 7 Pag. 9 Pag. 9 Pag. 10 Pag. 11 Siti Web consultati: www.ncbi.nlm.nih.gov/ primer3.ut.ee/ Bibliografia: Geographic structure of European anchovy: a nuclear-DNA study Yanis Bouchenak-Khelladi a, Jean-Dominique Durand b, Antonios Magoulas c, Philippe Borsa d,* Journal of Sea Research 59 (2008) 269-278" DOI : 10.1016/j.seares.2008.03.001 Nuclear-DNA markers confirm the presence of two anchovy species in the Mediterranean Philippe Borsa a,b,∗, Adeline Collet a,b, JeanDominique Durand Multiple SNP Markers Reveal Fine-Scale Population and Deep Phylogeographic Structure in European Anchovy (Engraulis encrasicolus L.) Iratxe Zarraonaindia1*, Mikel Iriondo1, Aitor Albaina1, Miguel Angel Pardo2, Carmen Manzano1, W. Stewart Grant3, Xabier Irigoien4°Ë, Andone Estonba SNP Discovery in European Anchovy (Engraulis encrasicolus, L) by High-Throughput Transcriptome and Genome Sequencing Iratxe Montes1., Darrell Conklin2,3., Aitor Albaina1, Simon Creer4, Gary R. Carvalho4, Marı´a Santos5, Andone Estonba 2 INTRODUZIONE Engraulis encrasicolus 1. Morfologia L’acciuga europea (Engraulis encrasicolus, Linnaeus, 1758) è la sola specie, tra gli Engraulidi, presente nel Mediterraneo. E` un pesce pelagico di piccole dimensioni (fino a 20 cm), con corpo affusolato, ricoperto da grandi scaglie cicloidi caduche, e ventre arrotondato. La testa allungata ha ampie aperture branchiali. La bocca, posta inferiormente, è grande ed oltrepassa ampiamente il margine posteriore degli occhi, che sono di grandi dimensioni. La mascella inferiore è corta e presenta piccoli denti. Il dorso del corpo è azzurro-verdastro quando è ancora viva, ma assume una colorazione bluastra a morte avvenuta; ventralmente e lateralmente è argentea. E’ un pesce gregario, forma banchi molto numerosi che si avvicinano alla costa in primavera ed estate, attratti dal plancton più ricco e vario; può compiere migrazioni verticali nell'arco della giornata. Durante le ore diurne le acciughe si riuniscono in banchi che scendono verso gli strati d'acqua più profondi, sia per trovare nutrimento sia per sfuggire ai predatori. Durante le ore notturne, invece, e soprattutto nella stagione riproduttiva, gli individui maturi salgono sopra il termoclino per rilasciare i gameti. La forma stessa dei loro banchi viene modificata nel corso della giornata. 2. Le specie di Engraulis e la loro distribuzione geografica Il genere Engraulis è ampiamente diffuso in tutti i mari. Le specie che sono oggetto di pesca industriale sono le seguenti: Engraulis anchoita – acciuga argentina (Atlantico Sud-Ovest) Engraulis australis– acciuga australiana (Australia Sud-Ovest) Engraulis capensis – acciuga sudafricana (Atlantico Sud-Est e Sud Africa -ora chiamata E. encrasicolus) Engraulis encrasicolus – acciuga europea (Atlantico Nord-Est, Mediterraneo) Engraulis japonicus – acciuga giapponese (Pacifico Nord-Ovest) Engraulis mordax – acciuga californiana (Pacifico Nord-Est) Engraulis ringens– acciuga peruana (Pacifico Sud-Est) Sono state ipotizzate numerosissime sottospecie o razze. La razza atlantica sarebbe diversa da quella mediterranea e, all’interno del Mediterraneo, esistono altre differenti razze (Mediterraneo occidentale e Adriatico). Si suggeriscono ulteriori differenziazioni tra le popolazioni delle diverse coste italiane: - il gruppo di acciughe del Golfo del Leone (Mediterraneo), - il gruppo atlantico. Un certo grado di differenziazione fenotipica viene riscontrato anche tra le acciughe dell'area Sud-Est del Golfo di Biscaglia rispetto a quelle dell'area della Galizia. Le differenze morfologiche tra le acciughe atlantiche rispecchierebbero lo sfasamento della stagione riproduttiva, che risulta più breve (marzo giugno) e con picco in aprile in Biscaglia, mentre risulta più estesa (marzo-ottobre) e con picco in agosto in Galizia. All’interno dell’Adriatico, studi più recenti descrivono una separazione genetica tra lo stock di acciughe localizzato nell'Adriatico nord-occidentale rispetto allo stock della regione centro-meridionale. Tali differenze appaiono corrispondere non solo alle differenze morfologiche, ma anche alla variazione fenotipica di colorazione: morfotipo "argento" nelle acque meno profonde (Nord) e morfotipo "blu" nelle acque piu` profonde (Sud). Engraulis e., nelle acque adriatiche, comprenderebbe almeno due stocks geneticamente distinti, strettamente corrispondenti agli aspetti idrografici come la profondità, l'idrologia e la produttività. La forte associazione di varianti genetiche con la profondità costituisce una base biologica per l'evolversi della differenziazione genetica, dal momento che le differenze di temperatura, ad esempio, possono portare a variazioni nel tasso di crescita, nel raggiungimento della maturità sessuale e nella stessa attività riproduttiva. Per l’acciuga europea è stato quindi proposta la suddivione in due specie parapratiche, Engraulis albidus e E. encrasicolus (Borsa et al., 2004): - E. albidus presumibilmente vive nelle acque salmastre costiere e risente dell’influenza delle correnti dei fiumi nel Mediterraneo N-W e nel Mar Adriatico - E. encrasicolus abita le acque oceaniche della piattaforma continentale. Si parla di speciazione parapratica quando la divergenza avviene all'interno di popolazioni che non sono totalmente isolate geograficamente, ma possiedono una ristretta zona di contatto. In questo lavoro, il nostro scopo è fare una valutazione della variabilità genetica del DNA nucleare dell’ acciuga europea. Per caratterizzare le popolazioni europee di acciughe del Mediterraneo, indaghiamo in particolare la variabilità geografica delle popolazioni di E.encrasicolus tra l’Atlantico e il Mediterraneo e nell’ambito del bacino mediterraneo, e prendiamo in considerazione come marcatore la variazione di lunghezza presso un locus di un introne, cioè un RFLP. 3 CAP. 1 GENETICA 1. 1 RFLP (o Restriction Fragment Length Polymorphism) Gli RFLP sono di primaria importanza negli studi di genetica, essendo utilizzati come marcatori genetici durante la mappatura del genoma e nell’identificazione di geni particolari. Un marcatore genetico è una sequenza di DNA conosciuta che può essere identificata mediante un semplice saggio. Un marcatore genetico può essere costituito da una breve sequenza di DNA, come la sequenza che circonda un polimorfismo a singolo nucleotide (SNP o single nucleotide polymorphism), o da una sequenza lunga, come i microsatelliti. La sigla RFLP ( Restriction Fragment Length Polymorphism - polimorfismo di lunghezza dei frammenti di restrizione) viene utilizzata per indicare due concetti distinti: - una caratteristica delle molecole del DNA che consente di distinguerle l'una dall'altra, grazie alle differenze nelle sequenze di nucleotidi che le compongono, dovuta a presenza di sequenze ripetute, inserzioni o delezioni) - la tecnica di laboratorio che sfrutta tali caratteristiche per mettere a confronto le varie molecole di DNA. Gli RFLP sono marcatori a singolo locus, quindi marcatori codominanti (trasmissione mendeliana). Permettono di distinguere: - i loci omozigoti rappresentati da una sola banda (uno o l’altro allele) - i loci eterozigoti, rappresentati da bande diverse (entrambi gli alleli marcatori) Analisi dei RFLP. Tecniche usate: - Ibridazione molecolare ► Southern blot (utilizzo di sonde) - Amplificazione del DNA (PCR) - Approcci misti ►Digestione enzimatica e amplificazione L’analisi delle differenze della sequenza nucleotidica studiata mediante RFLP viene realizzato in modo rapido mediante reazione di polimerizzazione a catena o PCR. L'amplificazione può essere diretta sul sito di restrizione alterato, ed i prodotti digeriti con l'enzima di restrizione. Il DNA viene sezionato in frammenti di restrizione mediante enzimi di restrizione detti endonucleasi, che attuano il taglio unicamente in corrispondenza di particolari sequenze nucleotidiche, specifiche per ogni enzima. La distanza tra le posizioni di taglio causate dagli enzimi di restrizione (i cosiddetti siti di restrizione) è variabile tra un individuo e l'altro, dando quindi luogo a variazioni nella lunghezza dei frammenti. L’esistenza di diverse varianti prende il nome di polimorfismo. I frammenti di restrizione vengono quindi separati per lunghezza mediante elettroforesi su gel di agarosio. 4 I cambiamenti nella sequenza dei frammenti ottenuti testimoniano l’eventuale scomparsa o il riarrangiamento di alcuni geni. SNPs (polimorfismi a singolo nucleotide) o INDELs ( inserzioni o delezioni) possono creare o abolire siti di restrizione per gli enzimi di restrizione (RE), generando frammenti di DNA di diversa lunghezza. L'analisi di RFLP è stata anche la base per primi metodi di fingerprinting genetico. In particolare: 1. per l'identificazione dei campioni recuperati da scene del crimine, 2. nella caratterizzazione della diversità genetica o di modelli di allevamento nelle popolazioni animali 3. per determinare le relazioni che intercorrono tra le varie specie. 4. nella determinazione della paternità. Nel caso dei test di paternità la differenza di RFLP può essere usata per distinguere geneticamente due individui o mostrare le relazioni genetiche che intercorrono tra individui, in quanto i figli ereditano il materiale genetico dai propri genitori. 5. per studiare malattie genetiche. Es.: a. un RFLP all’interno del gene per la β-globina (anemia falciforme) b. un RFLP in sequenze fiancheggianti il sito HpaI nel gene per la fenilalanina idrossilasi (fenilchetonuria) c. DNA ripetuto – triplette di CAG - all’interno del gene (Corea di Huntington), o in sequenze regolative (sindrome dell’X-fragile) Fig. 1 Flow chart del protocollo di laboratorio 5 1.2. DNA barcoding e tracciabilita’ molecolare delle acciughe del Mediterraneo L'utilizzo di una breve sequenza di DNA per standardizzare l' identificazione degli organismi è definito anche con il termine di DNA barcoding. L' innovativa metodologia proposta si è rivelata utile nell'ambito della sicurezza alimentare e in particolare nel settore ittico, dove la frequente sostituzione di tranci o filetti di specie ittiche pregiate con carni di esemplari di minor valore ha messo in luce la necessità di sviluppare nuovi sistemi di tracciabilità molecolare. Come è possibile discriminare fra popolazioni diverse di pesci? La tecnica su cui il consorzio europeo sta puntando maggiormente è quella dei polimorfismi a singolo nucleotide o SNPs. Il test a base di SNPs, già testato con successo sulle diverse varietà di salmone del Pacifico, dovrebbe permettere di distinguere fra differenti popolazioni di pesci, localizzate in diverse aree geografiche, all’interno della stessa specie. Inoltre sembra essere il metodo più veloce, economico e utilizzabile anche su grande scala fra quelli presi finora in considerazione. Dallo studio di 20 popolazioni comuni nelle acque europee, i ricercatori hanno analizzato per ogni popolazione il DNA di circa 50 pesci, trovando frequenze diverse di SNPs per ciascuna popolazione. Hanno così messo a punto un “chip a SNP” da utilizzare per ciascuna specie. Un segmento di circa 650 bp del gene della citocromo ossidasi I mitocondriale (COI) è stato proposto come miglior barcode, almeno per il regno animale, dove si è potuta verificarne l'efficacia in diversi taxa, e gran parte delle specie studiate (>94%) possiede barcode ben differenziati, con bassa variabilità intraspecifica ed alta divergenza tra taxa strettamente imparentati. 6 Cap.2 GEOGRAPHIC STRUCTURE OF EUROPEAN ANCHOVY: A NUCLEAR-DNA STUDY Materiali e Metodi 2.1 Campioni. Sono stati raccolti e numerati 7 campioni di acciughe provenienti da: 1. Atlantico-Francia del Nord 2. Croazia 3. Mar Ligure/Tirreno 4. Pescara 5. San Benedetto del Tronto 6. Venezia/ S.Stino 7. Atlantico- Spagna 2.2 Preparazione del campione per l’estrazione di DNA a. Scongelare le acciughe a. Fissarle su piastre in paraffina mediante spilli b. Procedere con un bisturi all’apertura dalla parte ventrale dell’animale c. Prelevare solamente i tessuti molli d. Scartare la pelle e tutte le lische e. Dividere il tessuto ottenuto in piccoli pezzi (compresi tra 0,5 g e 1,5 g) f. Conservare i campioni in eppendorf DNAse free a -20C° 2.3 Preparazione proteinasi K: 5 mg di polvere in 250 µl di di H20 per biologia molecolare (DNAse free) 2.4 Estrazione del DNA con KIT QUIAGEN a. Scongelare il campione a temperatura ambiente (15-25C°) b. Aggiungere 180 µl di buffer AL, direttamente nella eppendorf contenente il campione c. Aggiungere 20 µl di proteinasi K nella eppendorf d. Vortexare 15 secondi e lasciare in stufa a 55C° per 3 ore. Seguire protocollo del kit Quiagen: www.qiagen QIAamp DNA Mini Kit and QIAamp DNA Blood Mini Kit. Unica variante: nell’ultimo passaggio risospendere il DNA in 50 µl - invece di 200 µl- di elution buffer. 7 2.5 Lettura del DNA genomico al nanodrop Vengono posizionati 2 µl di DNA sotto il lettore dello strumento. Il risultato della lettura fornisce la concentrazione e diversi valori che indicano la qualità del DNA genomico estratto. La concentrazione di DNA richiesta dal protocollo è di 100 ng/µl 2.6 Caratterizzazione del polimorfismo di lunghezza della regione intronica CK6-1 Sono stati disegnati i primers per amplificare con una PCR locus-specifica una regione intronica polimorfica per lunghezza nel locus CK6-1 di una famiglia multigenica di creatina-kinasi (Borsa et al.,2004). CK6-1F (5’ - CGACATTGTAATGATGTTACAATGA- 3’) CK6-1R (5’ - ATTTCCTTTGGGTTGGCTCTTCTCT- 3’) La PCR è stata fatta in 20 µL di mix di reazione, contenente 1.0 µL (5-20ng) DNA, 0.5 µM Forward primer (CK61F) 0.5 µM Reverse primer (CK6-1R), and 8.0 µL Taq-polymerase (Hot Master Mix) nel suo buffer(dnTPs, MgCl2), 10 µL di H2O. Il programma di PCR comprende: 1. step iniziale di denaturazione di 2 min a 94 °C 2. 35 cicli di: denaturazione (35 s a 94 °C), annealing per 30 s at 53 °C ed extension (1 min at 70 °C) 3. step finale di extension di 7 min. a 70 °C La reazione è stata fatta correre in un termociclatore. I prodotti della PCR sono stati osservati con la tecnica dell’elettroforesi su gel di Agarosio (1,5 % ). Le bande di DNA sono state visualizzate con UV scanner. Gli alleli ottenuti sono stati identificati con la loro misura, 524 e 320 bp. Sono state lette anche le sequenze dei due alleli per cercare la corrispondenza con gli alleli pubblicati e presenti nei database: GenBank AY486347- E. encrasiculus isolate SET24.2 creatine kinase (CK6) gene 524 bp, GenBank AY486346- E. albidus isolate CUL10.4 creatine kinase (CK6) gene 406 bp. . Fig. 2.1 – Flow chart del DNA Barcoding: dal prelievo del muscolo all’estrazione, amplificazione, sequenziamento e analisi dei dati. 8 Risultati e Analisi dei dati genetici Misura del polimorfismo al locus CK6-1. Il locus CK6-1 mostra due alleli: un allele di 320 base pairs (bp), un allele di 524 base pairs (bp) √ Omozigote x l’allele da 320 bp: Francia ATL (1), Pescara (4) E. albidus √ Omozigote x l’allele da 524 bp : Croazia (2), San Benedetto del Tronto(5), Spagna Atlantica(7) E. encrasicolus √ Eterozigote per gli alleli da 320 e da 524 bp: Mar Ligure (3) e Laguna di Venezia (6) E.encrasicolus Fig. 1A e 1B Il polimorfismo di lunghezza del locus CK6-1 è di tipo mendeliano, cioè presenta non più di due bande di DNA in ogni campione e tutte le possibili combinazioni di bande sono state osservate nel totale dei campioni. Conclusioni I campioni presi in esame e provenienti dalle stesse aree geografiche rispetto ai campioni esaminati nel lavoro di Borsa (2008) concordano sull’ allele di 524 bp. Invece non è stato trovato in nessuno dei nostri campioni l’allele di 406 bp. Il nuovo allele di 320 bp da noi identificato non è citato in letteratura. Potrebbe quindi essere una nuova variante genetica della specie Engraulis. 9 PROTOCOLLO DI LABORATORIO 1° STEP. ESTRAZIONE DNA Vedi protocollo Qiagen 2° STEP. PCR - Mix reazione PCR: Primer Forward Primer Reverse DNA templato Taq (Hot Master Mix) H2 O Vfin 0,5 µl 0,5 µl 1 µl 8 µl 10 µl 20 µl - Programma di PCR: STEP 1. Denaturazione 2. Annealing/ extension TEMP TEMPO CICLI 94 °C 2 min 1 94°C 53°C 70°C 30 sec 30 sec variabile 35 70°C 7 min 1 3. extension finale I prodotti di PCR vengono controllati su gel di agarosio 1,5% in TBE, con l’aggiunta di intercalante. 3. ELETTROFORESI SU GEL DI AGAROSIO 1. Sciogliere 0,9 g di agarosio in 60 ml di TBE 1X pH 8 portando ad ebollizione. 2. Raffreddare a circa 60°C. 3. Aggiungere 7 ml di bromuro di etidio (1:10000) ( oppure un altro intercalante) 4. Agitare la soluzione evitando la formazione di bolle. 5. Versare rapidamente nella cella elettroforetica. 6. Lasciare polimerizzare per almeno 30 min. 7. Preparazione dei campioni alla corsa elettroforetica: - Prelevare i 20 µl di prodotto di PCR con la micropipetta e mescolarli con 4 µl di LD6X (loading dye 6X) - Posizionare la soluzione in un pozzetto del gel nella camera elettroforetica - Caricare un pozzetto con 5 µl di marcatore 100 bp addizionato con 1 µl di LD6X 8. Corsa elettroforetica I campioni vengono fatti correre su gel a 90V per circa 30 minuti 10 BIOINFORMATICA OBIETTIVI DELL’ ESERCITAZIONE • Saper consultare banche dati di interesse biomedico. • Apprendere l’utilizzo di alcuni strumenti bioinformatici. • Saper correlare fra loro le sequenze. • Sapere confrontare genomi di organismi differenti. Il sito da cui partiremo per la nostra navigazione tra i genomi di specie diverse è www.ncbi.nlm.nih.gov/ 1. Trova il gene: CK6-1 Engraulis encrasicolus La sequenza che cerchiamo si trova nell’introne 6 del gene Creatine Kinase, un gene costitutivo (housekeeping) molto grande, comune a (quasi) tutti gli organismi viventi In GENBANK cerchiamo: √ l’allele di 524 bp. Accession number: AY486347. Engraulis encrasicolus isolate SET24.2 creatine kinase (CK6) gene 524 bp. Le sequenze sono scritte con il doppio filamento di DNA. CK6F 5’-CGACATTGTAATGATGTTACAATGA-3’ CK6R 5’-ATTTCCTTTGGTTTGGCTCTTCTCT-3’ 1 101 201 301 401 501 √ CGACATTGTA GCTGTAACAT CTCTCTTATT GAGAGAATAA AATGCTATTT TTACGATAAA AATCTTATAA TTAGAATATT TGGGTATATA ACCCATATAT GAGAAGAGCC CTCTTCTCGG ATGATGTTAC TACTACAATG TCAAATTCCT AGTTTAAGGA TAATGATATT ATTACTATAA TCATGCTGTT AGTACGACAA GTTAGCAATT CAATCGTTAA AAACCAAAGG TTTGGTTTCC AATGACATGG TTACTGTACC GGCTATGGCC CCGATACCGG ATAATGACAT TATTACTGTA AAATTCCAAG TTTAAGGTTC TTAGGAAGGT AATCCTTCCA AAAT TTTA TCGACCGTAG AGCTGGCATC ATGTACAATG TACATGTTAC TATAATGGTA ATATTACCAT GCTTCCATGA CGAAGGTACT ATATTGAAAT TATAACTTTA CCATATTTGA GGTATAAACT ATGTTATATT TACAATATAA TAATAATGAC ATTATTACTG CGAGTCACCA GCTCAGTGGT TCCCAACCTT AGGGTTGGAA GGTAAGGGAG CCATTCCCTC TTGATAATGC AACTATTACG CGTTTTACAG GCAAAATGTC TTGATTAAAC AACTAATTTG TTCTGCTGGG AAGACGACCC GTCCGGACTG CAGGCCTGAC TAGTAAGCAA ATCATTCGTT TTTCCTCCAT AAAGGAGGTA GTGGCTGTGC CACCGACACG TATACTGCAT ATATGACGTA CCCTTATTTT GGGAATAAAA ACAGGTGATG TGTCCACTAC TGGTTTGTCT ACCAAACAGA TATTCTAAAT ATAAGATTTA GATCCACACA CTAGGTGTGT TAGAGAAAAT ATCTCTTTTA TGTATGCCAA ACATACGGTT GATTTCTTGA CTAAAGAACT ATTGAACAAT TAACTTGTTA TCGGATTGTT AGCCTAACAA CATATGGAAC GTATACCTTG GTGCAGATAT CACGTCTATA AAGTGATTGT TTCACTAACA GACTTTTAAG CTGAAAATTC CACAGCTCCA GTGTCGAGGT l’allele di 406 bp. Accession number: AY486346. Engraulis albidus isolate CUL10.4 creatine kinase (CK6) gene 406 bp CK6F 5’-CGACATTGTAATGATGTTACAATGA-3’ CK6R 5’-ATTTCCTTTGGTTTGGCTCTTCTCT-3’ 1 101 201 301 401 11 CGACATTGTA GCTGTAACAT TTATAATGAC AATATTACTG TTAAATTCCA AATTTAAGGT TTTTAGGAAG AAAATCCTTC GGAAAT CCTTTA ATGATGTTAC TACTACAATG ATTATAATGG TAATATTACC AGGCTTCCAT TCCGAAGGTA GTATATTGAA CATATAACTT AATGATGTTA TTACTACAAT TATAATAATG ATATTATTAC GACGAGTCGC CTGCTCAGCG ATTCCCAACC TAAGGGTTGG TATTTTGATA ATAAAACTAT ACCGTTTTAC TGGCAAAATG CATTGATTCA GTAACTAAGT TTTTCTGGTG AAAAGACCAC ATGCTAGTAA TACGATCATT AGTTTCCTCC TCAAAGGAGG AAGTGGCTGT TTCACCGACA GGTATACTGC CCATATGACG GCAAATAGGT CGTTTATCCA ATTGGTTTGT TAACCAAACA GCTATTCTAA CGATAAGATT ATGATCCACA TACTAGGTGT GATGTGTATG CTACACATAC CTGATTTCTT GACTAAAGAA ATATTGAACA TATAACTTGT CATCGGATTG GTAGCCTAAC CCAAGTGCAG GGTTCACGTC GAAAGTGATT CTTTCACTAA ATAGCTTTTA TATCGAAAAT TTCACAGCTC AAGTGTCGAG ATAATGCTAT TATTACGATA GTAATCTTGT CATTAGAACA AGTGGGTATA TCACCCATAT CAGAGAAGAG GTCTCTTCTC TTTAATGATA AAATTACTAT AGTCATGCTG TCAGTACGAC CAGTTAGCAA GTCAATCGTT CCAAGCCAAA GGTTCGGTTT 2. Geni identificati nei campioni delle sette acciughe esaminate Nel nostro lavoro abbiamo identificato l’allele da 524 bp – uguale a quello presente nel database- e un nuovo allele da 320 bp. Di questi due alleli sono state lette le sequenze e si è trovata una nuova delezione di 204 bp. √ Clone 1 di 320 bp F 5’ 1 101 201 301 √ CGACATTGTA GCTGTAACAT TCTCTTATTT AGAGAATAAA TATATAGTTA ATATATCAAT AGAGCCAAAC TCTCGGTTTG ATGATGTTAC TACTACAATG CAAATTCCTG GTTTAAGGAC GCAATTTTAG CGTTAAAATC CAAAGGAAAT GTTTCCTTTA AATGACATGG TTACTGTACC GCTATGGCTT CGATACCGAA GAAGGTATAT CTTCCATATA TCGACCGTAG AGCTGGCATC CCATGACGAG GGTACTGCTC TGAAATTCCC ACTTTAAGGG CCATATATGA GGTATATACT TCACCATTGA AGTGGTAACT AACCTTTTCT TTGGAAAAGA GGTAAGGGAG CCATTCCCTC TTAAACGTGG AATTTGCACC GGTGGGTATA CCACCCATAT TTCCGGACTG AAGGCCTGAC CTGTGCTATT GACACGATAA CTGCATGATC GACGTACTAG CCCTTATTTT GGGAATAAAA CTAAATATTG GATTTATAAC CACACATCGG GTGTGTAGCC TAGAGAAAAT ATCTCTTTTA AACAATGGCT TTGTTACCGA ATTGTTCACA TAACAAGTGT CATAAGGACC GTATTCCTGG TTTAAGTGGG AAATTCACCC GCTCCAGAGA CGAGGTCTCT R 3’ AATGACATGG TTACTGTACC GCTATGGCCA CGATACCGGT TAAGGACATT ATTCCTGTAA AATTCCAAGG TTAAGGTTCC TAGGAAGGTA ATCCTTCCAT AAT TTA TCGACCGTAG AGCTGGCATC TGTACAATGA ACATGTTACT ATAATGGTAT TATTACCATA CTTCCATGAC GAAGGTACTG TATTGAAATT ATAACTTTAA CCATATATGA GGTATATACT TGTTATATTT ACAATATAAA AATAATGACC TTATTACTGG GAGTCACCAT CTCAGTGGTA CCCAACCTTT GGGTTGGAAA GGTAAGGGAG CCATTCCCTC TGATAATGCT ACTATTACGA GTTTTACAGT CAAAATGTCA TGATTAAACG ACTAATTTGC TCTGGTGGGT AGACCACCCA TTCCGGACTG AAGGCCTGAC AGTAAGCAAA TCATTCGTTT ATCCTCCATT TAGGAGGTAA TGGCTGTGCT ACCGACACGA ATACTGCATG TATGACGTAC CCCTTATTTT GGGAATAAAA CAGGTGATGT GTCCACTACA GGTTTGTCTG CCAAACAGAC ATTCTAAATA TAAGATTTAT ATCCACACAT TAGGTGTGTA TAGAGAAAAT ATCTCTTTTA GTATGCCAAG CATACGGTTC ATTTCTTGAA TAAAGAACTT TTGAACAATG AACTTGTTAC CGGATTGTTC GCCTAACAAG CATATGGACC GTATACCTGG TGCAGATATA ACGTCTATAT AGTGATTGTA TCACTAACAT GCTTTTAAGT CGAAAATTCA ACAGCTCCAG TGTCGAGGTC R 3’ Clone 7 di 523 bp 1 101 201 301 401 501 F 5’ CGACATTGTA GCTGTAACAT TCTCTTATTT AGAGAATAAA ATGCTATTTT TACGATAAAA ATCTTATAAT TAGAATATTA GGGTATATAG CCCATATATC AGAAGAGCCA TCTTCTCGGT ATGATGTTAC TACTACAATG CAAATTCCTG GTTTAAGGAC AATGATATTA TTACTATAAT CATGCTGTTA GTACGACAAT TTAGCAATTT AATCGTTAAA AACCAAAGGA TTGGTTTCCT 3. Confrontiamo le sequenze. Allineamento delle sequenze Consideriamo l’allineamento tra la «nuova» sequenza nucleotidica e quelle già presenti in banca dati. L’allineamento tra sequenze nucleotidiche consente di mettere in luce l’esistenza di similarità di sequenza, che vengono «misurate» in base alla percentuale di identità fra le due (o più) sequenze allineate. Gli scopi per cui è utile analizzare la similarità fra due sequenze nucleotidiche sono molteplici: • identificazione di regioni conservate: sequenze di regolazione dell’espressione genica; • attribuzione di una funzione e/o identificazione di un nuovo gene; • classificazione dei geni in famiglie; • studi di filogenesi molecolare, per ricostruire le relazioni evolutive fra le specie; • studi di genetica di popolazione (migrazioni delle popolazioni umane, relazioni fra i vari gruppi umani) 3.1 Align tra l’allele di 524 bp e il clone 7 di 524 bp. 1 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 12 50 (1) CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATTTGA (1) CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATATGA 51 100 (51) GGTAAGGGAGGTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGAAC (51) GGTAAGGGAGTTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGA-C 101 150 (101) CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT (100) CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT 151 200 (151) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT (150) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT 201 250 (201) AATGCTATTTTAATGATATTATAATGACATTATAATGGTATAATAATGAC (200) AATGCTATTTTAATGATATTATAAGGACATTATAATGGTATAATAATGAC 251 300 (251) CGTTTTACAGTTTCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT (250) CGTTTTACAGTATCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT 301 350 (301) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA (300) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA 351 400 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 Engraulis encrasicolus isolate clone7 (351) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGACTTTTAAG (350) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGGCTTTTAAG 401 450 (401) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT (400) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT 451 500 (451) TTCTGCTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA (450) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA 501 524 (501) GAGAAGAGCCAAACCAAAGGAAAT (500) GAGAAGAGCCAAACCAAAGGAAAT 3.2 Align tra l’allele di 524 bp e il clone 1 di 320 bp clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate clone1 Engraulis encrasicolus isolate 1 50 (1) CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATATGA (1) CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATTTGA 51 100 (51) GGTAAGGGAGTTCCGGACTGCCCTTATTTTTAGAGAAAATCATAAGGA-C (51) GGTAAGGGAGGTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGAAC 101 150 (100) CTCTCTTATTTCAAATTCCTGGCTATGG---------------------(101) CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT 151 200 (128) -------------------------------------------------(151) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT 201 250 (128) -------------------------------------------------(201) AATGCTATTTTAATGATATTATAATGACATTATAATGGTATAATAATGAC 251 300 (128) -------------------------------------------------(251) CGTTTTACAGTTTCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT 301 350 (128) -------------------------------CTTCCATGACGAGTCACCA (301) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA 351 400 (147) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGGCTTTTAAG (351) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGACTTTTAAG 401 450 (197) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT (401) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT 451 500 (247) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA (451) TTCTGCTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA 501 524 (297) GAGAAGAGCCAAACCAAAGGAAAT (501) GAGAAGAGCCAAACCAAAGGAAAT 3.3 Align totale tra le 4 sequenze: clone 1, clone 7, E.encrasicolus, E. albidus clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate (1) (1) (1) (1) clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate (51) (19) (51) (51) clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate (100) (19) (100) (101) clone1 Engraulis albidus isolate (127) (35) 13 1 50 CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATATGA CGACATTGTAATGATGTT-------------------------------CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATATGA CGACATTGTAATGATGTTACAATGACATGGTCGACCGTAGCCATATTTGA 51 100 GGTAAGGGAGTTCCGGACTGCCCTTATTTTTAGAGAAAATCATAAGGA-C -------------------------------------------------GGTAAGGGAGTTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGA-C GGTAAGGGAGGTCCGGACTGCCCTTATTTTTAGAGAAAATCATATGGAAC 101 150 CTCTCTTATTTCAAATTCCTGGCTATG--------------------------------------------------------ACAATGATGTTATATT CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT CTCTCTTATTTCAAATTCCTGGCTATGGCCATGTACAATGATGTTATATT 151 200 -------------------------------------------------TTGATAATGCTAGTAAGCAAATAGGTGATGTGTATGCCAAGTGCAGATA- clone7 Engraulis encrasicolus isolate clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate clone1 Engraulis albidus isolate clone7 Engraulis encrasicolus isolate (150) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT (151) TTGATAATGCTAGTAAGCAAACAGGTGATGTGTATGCCAAGTGCAGATAT 201 250 (127) -------------------------------------------------(84) -ATGCTATTTTAATGATATTATAATGACATTATAATGGTATAATAATGAC (200) AATGCTATTTTAATGATATTATAAGGACATTATAATGGTATAATAATGAC (201) AATGCTATTTTAATGATATTATAATGACATTATAATGGTATAATAATGAC 251 300 (127) -------------------------------------------------(133) CGTTTTACAGTTTCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT (250) CGTTTTACAGTATCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT (251) CGTTTTACAGTTTCCTCCATTGGTTTGTCTGATTTCTTGAAAGTGATTGT 301 350 (127) ------------------------------GCTTCCATGACGAGTCACCA (183) AATCTTGTAGTCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCGCCA (300) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA (301) AATCTTATAATCATGCTGTTAAATTCCAAGGCTTCCATGACGAGTCACCA 351 400 (147) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGGCTTTTAAG (233) TTGATTCAAAGTGGCTGTGCTATTCTAAATATTGAACAATAGCTTTTAAG (350) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGGCTTTTAAG (351) TTGATTAAACGTGGCTGTGCTATTCTAAATATTGAACAATGACTTTTAAG 401 450 (197) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT (283) TGGGTATACAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT (400) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT (401) TGGGTATATAGTTAGCAATTTTAGGAAGGTATATTGAAATTCCCAACCTT 451 500 (247) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA (333) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA (450) TTCTGGTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA (451) TTCTGCTGGGTATACTGCATGATCCACACATCGGATTGTTCACAGCTCCA 501 524 (297) GAGAAGAGCCAAACCAAAGGAAAT (383) GAGAAGAGCCAAGCCAAAGGAAAT (500) GAGAAGAGCCAAACCAAAGGAAAT (501) GAGAAGAGCCAAACCAAAGGAAAT Le sequenze evidenziate in giallo sono quelle conservate in tutte e quattro le isoforme alleliche, quelle in turchese sono comuni solo a tre, poi ci sono le singole “mutazioni” in ognuna delle quattro. 4. Come si disegnano i Primers per amplificare la regione d’interesse ? Si apre la pagina: http://www.ncbi.nlm.nih.gov/ Cercare il gene di interesse: scrivendone il nome o l'accession number e assicurarsi che nella barra a sinistra ci sia “nucleotide” 14 Selezionare il formato FASTA in alto a destra. Selezionare la sequenza in FASTA e trasferirla in un nuovo programma bioinformatico chiamato Primer3 Si apre questa schermata. Inserire la sequenza FASTA dove c'è la freccia nel disegno qui sotto Scorrendo la pagina cercare la parte dove si possono settare i parametri dei primer: 15 - per primer size: non eccedere oltre 23 e stare in un ottimo di 21 nucleotidi di lunghezza del primer - non toccare la T di melting - i valori di GC % dei primer devono stare attorno al 50% come Optimal Cliccare “pick primer” e attendere l'esito della ricerca Freccia gialla : indica il primer Forward Freccia rosa : indica il primer Reverse Product size 318 : indica l'ampiezza del frammento che sarà amplificato. 16