BIOTECNOLOGIE FARMACOLOGICHE
CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO
LEZIONE 4
Anno Accademico 2010/11
Le sfide per il futuro del progetto genoma umano
• comprendere le componenti strutturali e funzionali del genoma
• capire come le reti di geni e proteine contribuiscono alla
definizione del fenotipo
• comprendere cosa determina le variazione nella trasmissione dei
caratteri genetici
• identificare le varianti genetiche che contribuiscono al
mantenimento dello stato di salute
• determinare strategie per identificare il rischio di malattia
• stabilire strategie per l’identificazione del contributo del
genoma nella determinazione delle patologie e delle risposte alla
terapia
• utilizzare le conoscenze genetiche per lo sviluppo di farmaci
innovativi
I farmaci attualmente sul mercato
agiscono su circa 500 prodotti genici
Considerando che il genoma umano
contiene circa 20-30.000 geni che
codificano per proteine, il potenziale
per lo sviluppo di nuovi farmaci è
evidente
GENOMATICA FUNZIONALE
Studio di funzione genica
LA RICERCA DELLA FUNZIONE DEI GENI
La tradizione:
ricerca di di mutazioni per identificare perdite o
acquisizione di funzioni
I metodi della genetica all’incontrario:
Generare nuovi organismi geneticamente
modificati per studiare perdita o acquisizione di
funzioni
Metodologie innovative:
Studio comparativo di popolazioni di prodotti
genici
La tradizione:
ricerca e analisi di mutazioni e polimorfismi
(es RFLP; SNP) del genoma stesso
Siti polimorfici
• 99.99 % della sequenza del DNA di due
individui e’ identica
• la maggioranza delle differenze (0.01%)
coinvolgono singole sostituzioni
Polimorfismi al taglio con enzimi di restrizione (RFLP)
Single nucleotide polymorphysm (SNP)
Polimorfismi al taglio con enzimi di
restrizione (RFLP)
Allele 1
*
Allele 2
Polimorfismi al taglio con enzimi di
restrizione (RFLP)
associazione RLFP-patologia
variab nella popol.
Famiglia Patol.
sani
The Lod (log of odds) score is used to calculate the probability
of a pedigree arising randomly or by genetic linkage. The test
was developed by Newton and Morton
LOD = log
Probability of birth sequence with a given linkage value
Probability of birth sequence with no linkage
In practice, linkage is declared if the LOD score is equal to or
greater than 3 (i.e. the likelihood of observing the result if the
two loci are not linked is less than 1 in 1000). On the other
hand, linkage can be completely excluded if the LOD score is
strictly below -2.
Studio di funzione genica
Localizzazione posizionale di geni/malattia
Studio di linkage familiare con polimorfismi
Huntington, la malattia ideale per position cloning
Inheritance pattern – dominant autosomal Entirely penetrant and fatal
Frequency - about 1/10,000 live births
Late onset - age 35 to 45
Because of late onset, many have children before symptoms appear
Families with a history of Huntington's disease :
Indiana University maintains a National Research Roster for
Huntington's Patients
Large family with a history of Huntington's disease discovered living
on shore of lake Maracaibo in Venezuela
For both families with a history of Huntington's disease:
Blood samples taken from each member
Permanent cell lines established
Each family member analyzed by a neurologist for disease symptoms
Paternity verified
1981 - Gusella's group started with a group of anonymous probes that
uncovered RFLPs - very few available.
the 12th probe they tried -called G8 - indicated linkage.
Disease associated with the A haplotype in the American family and
the C haplotype in the Venezuelan family.
LOD Scores
1983 - G8 (also called D4S10) mapped approximately 4 cM from the
HD locus. It took 10 more years to clone the gene.
1986-87 DNA markers were used and D4S10 was localized by in situ
hybridization and somatic cell genetics to chromosome region 4p16.3;
Further linkage studies for isolating HD
Identification of Putative Coding Sequences
Exon Trapping; Use trapped exons to identify candidate genes from
cDNAs; Four transcripts were analyzed; IT15 - Huntingtin
Gusella JF, Wexler NS, Conneally PM, Naylor SL,
Anderson MSA, Tanzi RE, Walkins PC, et al (1983) A
polymorphic DNA marker genetically linked to
Huntington's disease. Nature 306:234-238
Huntingtin DNA, protein and uses thereof
US Patent Issued on November 11, 1997
Inventor(s): Marcy E. MacDonald; Christine M. Ambrose; Mabel P.
Duyao; James F. Gusella
Assignee: The General Hospital Corporation
Application: No. 246982 filed on 1994-05-20
Metodi di identificazione di SNP
Siti polimorfici per singola sostituzione
di base (SNP)
polimorfismo a singolo nucleotide
•di base
Nel genoma umano ci sono 200.000 SNP
all’interno di sequenze codificanti, alcuni
di questi possono essere marcatori di
patologia
http://www.ncbi.nlm.nih.gov/About/primer/snps.html
Siti polimorfici per singola sostituzione di base (SNP)
Individuo 1
Individuo 2
Gli SNP sono la causa di circa il 90% della variabilità
genetica umana ed in genere si trova uno SNP ogni 100300 pb. 2/3 SNP vedono sostituita la C con T.
Perchè una variazione possa essere considerata un SNP
deve essere presente in almeno l’1% della popolazione
IBRIDAZIONE ALLELE-SPECIFICA
REAZIONE DI ELONGAZIONE DI PRIMER
FISSATO SU SUPPORTO SOLIDO
Michiel J. T. van Eijk*, et al. NAR 2004
AC
3’
AT CG
TAGC
DNA is denatured and mixed with oligonudeotides and ligase. The
ligase joins pairs of oligonudeotides annealed head to tail if they
are correctly base-paired at the junction. Radioactively labeled
oligonudeotides (*) are immobilized and detected by
autoradiography only if ligated to biotinylated oligonucleotides (B)
that can be bound to streptavidin on a solid support.
LANDEGREN, et al. Science 1998
BANCHE DATI E IDENTIFICAZIONE DI SNP
dbSNP sono presenti (“annotati”) in diverse banche dati quali:
PubMed,
genome project sequences,
GenBank records,
the Entrez Gene database, and
the dbSTS database of sequence tagged sites.
Metodologie innovative:
Studio comparativo di popolazioni di
prodotti genici
• genomatica comparativa
• generazione di arrays per lo studio
comparato di espressione genica
Genomatica comparativa:
analisi basata sulla omologia di
geni codificanti proteine a
funzione nota
Ortologo e paralogo
• Ortologhi – geni omologi con la stessa
funzione in organismi diversi
• Paraloghi – geni all’interno dello stesso
organismo derivanti da duplicazione genica
Geni ortologhi o paraloghi
ARRAY
MACROARRAY
MICROARRAY
DNA microarray (o gene/genome chip,
DNA chip, o gene array) è una collezione di
depositi puntiformi di DNA, ciascun punto
rapresentante un singolo gene
immobilizzati su un supporto (vetro,
plastica o silicone) mediante legami di tipo
irreversibile.
Esempio di microarray con 40.000 oligo immobilizzati su
supporto solido e ibridati con cDNA
APPLICAZIONI DI ARRAY:
• SNP detection arrays – per identificare polimorfismi di
singoli nucleotidi nel genoma di diverse popolazioni
• ibridazione genomica comparativa (Array CGH) – per
identificare riarragiamenti coinvolgenti un numero
significtativo di basi
• mRNA or gene expression profiling – per studiare i livelli
di espressione di migliaia di geni simultaneamente
• Chromatin immunoprecipitation (chIP) studies – per
determinare il legame di specifche proteine in porzioni
specifiche del DNA (ChIP-on-chip technology)
mRNA or gene expression profiling
Genes x Cells
Drugs x Cells
Clustered Image Maps
Genes x Drugs
Database Microarray Experiment
Sets Sample Profiles
Genomics and bioinformatics
group NCI and NIH
Studio di proteine che interagiscono con DNA
ChIP-on-chip (o ChIP-chip) è una tecnica che combina la
immunoprecipitazione di cromatina (chromatin immunoprecipitation)
"ChIP” con la tecnologia del micro array (“chip").
Chip-on-chip analysis per lo studio
delle interazioni DNA proteine
read-out
Normalizzazione dei dati
e analisi esplorativa dei dati
Sito DNA
“estrazione delle informazioni”
arricchimento proteina di interesse