Il progetto “Genoma Umano” è iniziato nel 1990. E’ stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato al National Human Genome Research Institute (NHGRI) ed al Sanger Centre di Cambridge. Sviluppo dell’algoritmo BLAST per la ricerca di somiglianze. 1992: disponibilità dei BAC. BLAST (basic local alignment search tool) Gli obiettivi principali del progetto erano di: - decifrare in maniera accurata la sequenza completa delle 3 billioni coppie di basi del DNA umano; - identificare tutti i 20.000 – 25.000 geni umani. Elementi genetici unici di cui sia nota con precisione la disposizione lungo il genoma. L’insieme di questi marcatori costituisce la: mappa fisica o mappa genetica, in funzione delle modalità attraverso le quali viene determinata la disposizione spaziale relativa dei marcatori. Approccio dell’assemblaggio del genoma clone per clone (CGS): molte copie del genoma sono tagliate in frammenti di circa 150.000 bp medinate digestione parziale con endonucleasi di restrizione. I grandi frammenti di DNA sono clonati in BAC ed amplificati in ospiti batterici Selezione e purificazione dei cloni digestione con endonucleasi di restrizione per produrre piccoli frammenti di ciascun clone mappatura dei siti del genoma tagliati dalle endonucleasi di restrizione (mappa fisica). I frammenti più piccoli vengono subclonati. Sequenziamento dei subcloni. Mappa genetica (mappa di linkage): diagramma dell’ordine dei geni su un cromosoma, in cui la distanza tra i geni adiacenti è proporzionale alla frequenza di ricombinazione fra di essi durante la meiosi. Il sequenziamento finanziato privatamente sviluppato dalla Celera Genomics Corporation si è basato sull’approccio shutgun. Il progetto iniziò nel 1998 e terminò contemporaneamente a quello del consorzio pubblico. L’approccio prevede la preparazione di cloni con piccoli inserti( 2-10 kb) direttamente dal DNA genomico. Sequenziamento dei frammenti clonati. Trascriptoma Da RNA a cDNA clonaggio sequenziamento. Sequenze della lunghezza massima di 1 kb che corrispondono a frammenti di trascritti maturi denominati EST (Expressed Sequence Tag). Le sequenze EST sono depositate in banche dati: NCBI e EBI. Gruppi di EST (cluster) che derivano da uno stesso gene sono depositati nella banca dati specializzata Unigene. Ricerca degli Open Reading Frame (ORF). Più facile per i genomi procariotici. Programmi bioinformatici: Pattern discovery BLAST: allineamenti “locali” tra la sequenza in esame e tutte quelle presenti in una banca dati. Confronto a livello nucleotidico od a livello proteico. Allineamento “globale”: programmi bioinformatici CLUSTAL o MUSCLE. I geni omologhi che hanno cominciato ad evolvere in modo indipendente in seguito a speciazione sono detti ortologhi. I geni che si sono generati grazie ad un evento di duplicazione genica sono detti paraloghi. Il progetto ENCODE (Enciclopedia degli elementi del DNA) ha lo scopo di fornire una rappresentazione biologicamente più informativa del genoma umano usando metodi “high-throughput” per identificare e catalogare gli elementi funzionali codificati.