BIOTECNOLOGIE FARMACOLOGICHE CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO LEZIONE 4 Anno Accademico 2010/11 Le sfide per il futuro del progetto genoma umano • comprendere le componenti strutturali e funzionali del genoma • capire come le reti di geni e proteine contribuiscono alla definizione del fenotipo • comprendere cosa determina le variazione nella trasmissione dei caratteri genetici • identificare le varianti genetiche che contribuiscono al mantenimento dello stato di salute • determinare strategie per identificare il rischio di malattia • stabilire strategie per l’identificazione del contributo del genoma nella determinazione delle patologie e delle risposte alla terapia • utilizzare le conoscenze genetiche per lo sviluppo di farmaci innovativi I farmaci attualmente sul mercato agiscono su circa 500 prodotti genici Considerando che il genoma umano contiene circa 20-30.000 geni che codificano per proteine, il potenziale per lo sviluppo di nuovi farmaci è evidente GENOMATICA FUNZIONALE Studio di funzione genica LA RICERCA DELLA FUNZIONE DEI GENI La tradizione: ricerca di di mutazioni per identificare perdite o acquisizione di funzioni I metodi della genetica all’incontrario: Generare nuovi organismi geneticamente modificati per studiare perdita o acquisizione di funzioni Metodologie innovative: Studio comparativo di popolazioni di prodotti genici La tradizione: ricerca e analisi di mutazioni e polimorfismi (es RFLP; SNP) del genoma stesso Siti polimorfici • 99.99 % della sequenza del DNA di due individui e’ identica • la maggioranza delle differenze (0.01%) coinvolgono singole sostituzioni Polimorfismi al taglio con enzimi di restrizione (RFLP) Single nucleotide polymorphysm (SNP) Polimorfismi al taglio con enzimi di restrizione (RFLP) Allele 1 * Allele 2 Polimorfismi al taglio con enzimi di restrizione (RFLP) associazione RLFP-patologia variab nella popol. Famiglia Patol. sani The Lod (log of odds) score is used to calculate the probability of a pedigree arising randomly or by genetic linkage. The test was developed by Newton and Morton LOD = log Probability of birth sequence with a given linkage value Probability of birth sequence with no linkage In practice, linkage is declared if the LOD score is equal to or greater than 3 (i.e. the likelihood of observing the result if the two loci are not linked is less than 1 in 1000). On the other hand, linkage can be completely excluded if the LOD score is strictly below -2. Studio di funzione genica Localizzazione posizionale di geni/malattia Studio di linkage familiare con polimorfismi Huntington, la malattia ideale per position cloning Inheritance pattern – dominant autosomal Entirely penetrant and fatal Frequency - about 1/10,000 live births Late onset - age 35 to 45 Because of late onset, many have children before symptoms appear Families with a history of Huntington's disease : Indiana University maintains a National Research Roster for Huntington's Patients Large family with a history of Huntington's disease discovered living on shore of lake Maracaibo in Venezuela For both families with a history of Huntington's disease: Blood samples taken from each member Permanent cell lines established Each family member analyzed by a neurologist for disease symptoms Paternity verified 1981 - Gusella's group started with a group of anonymous probes that uncovered RFLPs - very few available. the 12th probe they tried -called G8 - indicated linkage. Disease associated with the A haplotype in the American family and the C haplotype in the Venezuelan family. LOD Scores 1983 - G8 (also called D4S10) mapped approximately 4 cM from the HD locus. It took 10 more years to clone the gene. 1986-87 DNA markers were used and D4S10 was localized by in situ hybridization and somatic cell genetics to chromosome region 4p16.3; Further linkage studies for isolating HD Identification of Putative Coding Sequences Exon Trapping; Use trapped exons to identify candidate genes from cDNAs; Four transcripts were analyzed; IT15 - Huntingtin Gusella JF, Wexler NS, Conneally PM, Naylor SL, Anderson MSA, Tanzi RE, Walkins PC, et al (1983) A polymorphic DNA marker genetically linked to Huntington's disease. Nature 306:234-238 Huntingtin DNA, protein and uses thereof US Patent Issued on November 11, 1997 Inventor(s): Marcy E. MacDonald; Christine M. Ambrose; Mabel P. Duyao; James F. Gusella Assignee: The General Hospital Corporation Application: No. 246982 filed on 1994-05-20 Metodi di identificazione di SNP Siti polimorfici per singola sostituzione di base (SNP) polimorfismo a singolo nucleotide •di base Nel genoma umano ci sono 200.000 SNP all’interno di sequenze codificanti, alcuni di questi possono essere marcatori di patologia http://www.ncbi.nlm.nih.gov/About/primer/snps.html Siti polimorfici per singola sostituzione di base (SNP) Individuo 1 Individuo 2 Gli SNP sono la causa di circa il 90% della variabilità genetica umana ed in genere si trova uno SNP ogni 100300 pb. 2/3 SNP vedono sostituita la C con T. Perchè una variazione possa essere considerata un SNP deve essere presente in almeno l’1% della popolazione IBRIDAZIONE ALLELE-SPECIFICA REAZIONE DI ELONGAZIONE DI PRIMER FISSATO SU SUPPORTO SOLIDO Michiel J. T. van Eijk*, et al. NAR 2004 AC 3’ AT CG TAGC DNA is denatured and mixed with oligonudeotides and ligase. The ligase joins pairs of oligonudeotides annealed head to tail if they are correctly base-paired at the junction. Radioactively labeled oligonudeotides (*) are immobilized and detected by autoradiography only if ligated to biotinylated oligonucleotides (B) that can be bound to streptavidin on a solid support. LANDEGREN, et al. Science 1998 BANCHE DATI E IDENTIFICAZIONE DI SNP dbSNP sono presenti (“annotati”) in diverse banche dati quali: PubMed, genome project sequences, GenBank records, the Entrez Gene database, and the dbSTS database of sequence tagged sites. Metodologie innovative: Studio comparativo di popolazioni di prodotti genici • genomatica comparativa • generazione di arrays per lo studio comparato di espressione genica Genomatica comparativa: analisi basata sulla omologia di geni codificanti proteine a funzione nota Ortologo e paralogo • Ortologhi – geni omologi con la stessa funzione in organismi diversi • Paraloghi – geni all’interno dello stesso organismo derivanti da duplicazione genica Geni ortologhi o paraloghi ARRAY MACROARRAY MICROARRAY DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto rapresentante un singolo gene immobilizzati su un supporto (vetro, plastica o silicone) mediante legami di tipo irreversibile. Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA APPLICAZIONI DI ARRAY: • SNP detection arrays – per identificare polimorfismi di singoli nucleotidi nel genoma di diverse popolazioni • ibridazione genomica comparativa (Array CGH) – per identificare riarragiamenti coinvolgenti un numero significtativo di basi • mRNA or gene expression profiling – per studiare i livelli di espressione di migliaia di geni simultaneamente • Chromatin immunoprecipitation (chIP) studies – per determinare il legame di specifche proteine in porzioni specifiche del DNA (ChIP-on-chip technology) mRNA or gene expression profiling Genes x Cells Drugs x Cells Clustered Image Maps Genes x Drugs Database Microarray Experiment Sets Sample Profiles Genomics and bioinformatics group NCI and NIH Studio di proteine che interagiscono con DNA ChIP-on-chip (o ChIP-chip) è una tecnica che combina la immunoprecipitazione di cromatina (chromatin immunoprecipitation) "ChIP” con la tecnologia del micro array (“chip"). Chip-on-chip analysis per lo studio delle interazioni DNA proteine read-out Normalizzazione dei dati e analisi esplorativa dei dati Sito DNA “estrazione delle informazioni” arricchimento proteina di interesse