Il progetto “Genoma Umano” è iniziato nel 1990. E’ stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato al National Human Genome Research Institute (NHGRI) ed al Sanger Centre di Cambridge. Sviluppo dell’algoritmo BLAST per la ricerca di somiglianze. 1992: disponibilità dei BAC. BLAST (basic local alignment search tool) Gli obiettivi principali del progetto erano di: - decifrare in maniera accurata la sequenza completa delle 3 billioni coppie di basi del DNA umano; - identificare tutti i 20.000 – 25.000 geni umani. Elementi genetici unici di cui sia nota con precisione la disposizione lungo il genoma. L’insieme di questi marcatori costituisce la: mappa fisica o mappa genetica, in funzione delle modalità attraverso le quali viene determinata la disposizione spaziale relativa dei marcatori. Mappa genetica (mappa di linkage): diagramma dell’ordine dei geni su un cromosoma, in cui la distanza tra i geni adiacenti è proporzionale alla frequenza di ricombinazione fra di essi durante la meiosi. Tipo di marcatore Nome Polimorfico RFLP 393 RFLP nel genoma umano. Microsatellite Sequenza di 1-4 nucleotidi ripetuti in tanden 10 o più volte. Mappa di 814 (1992). SNP Non polimorfico Una recente mappa di SNP ne contiene 3 milioni. Sequencetagged site (STS) Un sequenza qualsiasi di DNA che è stata mappata in una posizione subcromosomica specifica e che può essere saggiata mediante amplificazione di PCR. Expressed sequence tag (EST) Un sottoinsieme di sequence-tagged site che è posizionato all’interno di sequenze di DNA note per essere trascritte. Approccio dell’assemblaggio del genoma clone per clone (CGS): molte copie del genoma sono tagliate in frammenti di circa 150.000 bp medinate digestione parziale con endonucleasi di restrizione. I grandi frammenti di DNA sono clonati in BAC ed amplificati in ospiti batterici Selezione e purificazione dei cloni digestione con endonucleasi di restrizione per produrre piccoli frammenti di ciascun clone mappatura dei siti del genoma tagliati dalle endonucleasi di restrizione (mappa fisica). I frammenti più piccoli vengono subclonati. Sequenziamento dei subcloni. Il sequenziamento finanziato privatamente sviluppato dalla Celera Genomics Corporation si è basato sull’approccio shutgun. Il progetto iniziò nel 1998 e terminò contemporaneamente a quello del consorzio pubblico. L’approccio prevede la preparazione di cloni con piccoli inserti( 2-10 kb) direttamente dal DNA genomico. Sequenziamento dei frammenti clonati. Trascriptoma Da RNA a cDNA clonaggio sequenziamento. Sequenze della lunghezza massima di 1kb che corrispondono a frammenti di trascritti maturi denominati EST (Expressed Sequence Tag). Le sequenze EST sono depositate in banche dati: NCBI e EBI. Gruppi di EST (cluster) che derivano da uno stesso gene sono depositati nella banca dati specializzata Unigene. Ricerca degli Open Reading Frame (ORF). Più facile per i genomi procariotici. Programmi bioinformatici: Pattern discovery BLAST: allineamenti “locali” tra la sequenza in esame e tutte quelle presenti in una banca dati. Confronto a livello nucleotidico od a livello proteico. Allineamento “globale”: programmi bioinformatici CLUSTAL o MUSCLE. I geni omologhi che hanno cominciato ad evolvere in modo indipendente in seguito a speciazione sono detti ortologhi. I geni che si sono generati grazie ad un evento di duplicazione genica sono detti paraloghi. Il progetto ENCODE (Enciclopedia degli elementi del DNA) ha lo scopo di fornire una rappresentazione biologicamente più informativa del genoma umano usando metodi “high-throughput” per identificare e catalogare gli elementi funzionali codificati.