Adriana Maggi
DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHE
CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO
AA 2011/2012
Lezione 4
Le sfide per il futuro del progetto genoma umano
• comprendere le componenti strutturali e funzionali del genoma
• capire come le reti di geni e proteine contribuiscono alla
definizione del fenotipo
• comprendere cosa determina le variazione nella trasmissione
dei caratteri genetici
• identificare le varianti genetiche che contribuiscono al
mantenimento dello stato di salute
• determinare strategie per identificare il rischio di malattia
• stabilire strategie per l’identificazione del contributo del
genoma nella determinazione delle patologie e delle risposte
alla terapia
• utilizzare le conoscenze genetiche per lo sviluppo di farmaci
innovativi
Il progetto Genoma Umano si è
focalizzato sulla generazione di mappe
genomiche tramite mappe di
concatenazione e mappe fisiche.
Una mappa genomica indica l’ordine in
cui i geni e i marcatori genici si trovano
nei singoli cromosomi
Nella ricerca del gene malattia,
i ricercatori in genere trovano
un marcatore specifico che
indica il segmento di DNA nelle
vicinanze del gene di interesse,
con clonaggi posizionali e
analisis di sequenze si possono
individuare I geni responsabili
della patologia
GENOMATICA FUNZIONALE
Studio di funzione genica
LA RICERCA DELLA FUNZIONE DEI GENI
La tradizione:
ricerca di di mutazioni per identificare perdite o
acquisizione di funzioni
I metodi della genetica all’incontrario:
Analisi mutazionale in organismi modello:
Generare nuovi organismi geneticamente
modificati per studiare perdita o acquisizione di
funzioni
Metodologie innovative:
Studio comparativo di popolazioni di prodotti
genici
La tradizione:
ricerca e analisi di mutazioni e polimorfismi
(es RFLP; SNP) del genoma stesso
Siti polimorfici
• 99.99 % della sequenza del DNA di due
individui e’ identica
• la maggioranza delle differenze (0.01%)
coinvolgono singole sostituzioni
Polimorfismi al taglio con enzimi di restrizione (RFLP)
Single nucleotide polymorphysm (SNP)
Polimorfismi al taglio con enzimi di
restrizione (RFLP)
Allele 1
*
Allele 2
Polimorfismi al taglio con enzimi di
restrizione (RFLP)
associazione RLFP-patologia
variab nella popol.
Famiglia Patol.
sani
The Lod (log of odds) score is used to calculate the probability
of a pedigree arising randomly or by genetic linkage. The test
was developed by Newton and Morton
LOD = log
Probability of birth sequence with a given linkage value
Probability of birth sequence with no linkage
In practice, linkage is declared if the LOD score is equal to or
greater than 3 (i.e. the likelihood of observing the result if the
two loci are not linked is less than 1 in 1000). On the other
hand, linkage can be completely excluded if the LOD score is
strictly below -2.
Studio di funzione genica
Localizzazione posizionale di geni/malattia
Studio di linkage familiare con polimorfismi
Huntington, la malattia ideale per position cloning
Ereditarietà – autosomica dominante : penetranza 100%
Frequenza - circa 1/10,000 nati
Manifestazione clinica: 35 - 45 anni di età
La manifestazione in età adulta ne ha causato l’espandersi della malattia
Gli studi delle basi molecolari della malattia sono iniziati con la
identificazione di famiglie di grandi dimensioni i cui membri fossero
viventi: questo è stato possibile grazie al registro Nazionale dei Pazienti
con Huntington USA presso l’Università dell?Indiana e alla scoperta di
una famiglia presso il lago Maracaibo in Venezuela in cui diversi
membri erano affetti dalla malattia
Da diverse famiglie sono state prelevate cellule ematiche per la
Generazione di cellule immortalizzate
Ogni famiglia è stata seguita da neurologi e la paternità dei pazienti è
stata opportunamente verificata
1981 - Gusella's group started with a group of anonymous probes that
uncovered RFLPs - very few available.
the 12th probe they tried -called G8 - indicated linkage.
Disease associated with the A haplotype in the American family and
the C haplotype in the Venezuelan family.
LOD Scores
1983 - G8 (also called D4S10) mapped approximately 4 cM from the HD
locus. It took 10 more years to clone the gene.
1986-87 DNA markers were used and D4S10 was localized by in situ
hybridization and somatic cell genetics to chromosome region 4p16.3;
Further linkage studies for isolating HD
Identification of Putative Coding Sequences
Exon Trapping; Use trapped exons to identify candidate genes from
cDNAs; Four transcripts were analyzed; IT15 - Huntingtin
Dall’osservazione:
Gusella JF, Wexler NS, Conneally PM, Naylor SL, Anderson
MSA, Tanzi RE, Walkins PC, et al (1983) A polymorphic
DNA marker genetically linked to Huntington's disease.
Nature 306:234-238
Al brevetto:
Huntingtin DNA, protein and uses thereof
US Patent Issued on November 11, 1997
Inventor(s): Marcy E. MacDonald; Christine M. Ambrose;
Mabel P. Duyao; James F. Gusella
Assignee: The General Hospital Corporation
Application: No. 246982 filed on 1994-05-20
Metodologie innovative:
Studio comparativo di popolazioni di
prodotti genici
• genomatica comparativa
• generazione di arrays per lo studio
comparato di espressione genica
Genomatica comparata:
analisi basata sulla omologia di geni
codificanti proteine a funzione nota
Genomatica comparata
Utile per:
•
•
•
•
Identificare similarità/dissimilarità tra speci diverse
Studiare evoluzione della specie
Identificare geni codificanti e loro funzione
Identificare regioni funzionali nei genomi
Ortologo e paralogo
• Ortologhi – geni omologi con la stessa
funzione in organismi diversi
• Paraloghi – geni all’interno dello stesso
organismo derivanti da duplicazione genica
Geni ortologhi o paraloghi
Allineamento
di sequenze
generazione di arrays per lo studio
comparato di espressione genica
ARRAY
MACROARRAY
MICROARRAY
DNA microarray (o gene/genome chip,
DNA chip, o gene array) è una collezione di
depositi puntiformi di DNA, ciascun punto
rapresentante un singolo gene
immobilizzati su un supporto (vetro,
plastica o silicone) mediante legami di tipo
irreversibile.
Esempio di microarray con 40.000 oligo immobilizzati su
supporto solido e ibridati con cDNA
mRNA or gene expression profiling
Genes x Cells
Drugs x Cells
Clustered Image Maps
Genes x Drugs
I LIMITI DELLA ANALISI GENOMICA:
RIPRODUCIBILITA’
ANALISI NON QUANTITATIVA
I mRNA NON RIFLETTONO ESATTAMENTE
LE PROTEINE PRESENTI NELLA CELLULA
Come classificare
la materia vivente per comprenderla?
Il progetto GENE ONTOLOGY
Gene Ontology
http://www.geneontology.org/index.shtml
Un progetto atto a costruire un vocabolario
strutturato pensato per descrivere i geni e i
loro prodotti in qualsiasi tipo di organismo
Questo vocabolario serve per dare un
unico nome a un specifico prodotto in
modo che questi così compaia nelle
diverse banche dati e possa venire
rapidamente ritrovato
L'ontologia, una delle branche fondamentali della
filosofia, è lo studio dell'essere in quanto tale,
nonché delle sue categorie fondamentali.
Il termine deriva dal greco ὄντος, òntos (genitivo
singolare del participio presente ὤν di εἶναι, èinai,
il verbo essere) più λόγος, lògos, letteralmente
"discorso sull'essere”
Gene Ontology (GO, ontologia genica): un
vocabolario controllato e strutturato per
la descrizione di prodotti genici in termini
• di funzione molecolare,
• di ruolo biologico e
• di ubicazione cellulare
Le Ontologie differiscono dalle terminologie
controllate (Lexicon) poiché si tratta di una
struttura dati gerarchica che contiene tutte le
entità rilevanti, le relazioni esistenti fra di esse,
le regole, gli assiomi, ed i vincoli specifici del
dominio; mentre le terminologie controllate
semplicemente restringono l’insieme di parole
usate per descrivere il dominio.
Gene Ontology
http://www.geneontology.org/index.shtml
Ogni gene/proteina si contraddistingue per un
numero identificativo unico (GO:nnnnnnn) e un
nome (es: cellula, fibroblasto, fattore di crescita,
trasduttore del segnale).
Ogni termine viene assegnato a una o più delle
tre suddivisioni della banca (ontology):
1. Funzioni molecolari
2. Componenti cellulari
3. Componenti I processi biologici
Esempio di annotazione:
Il prodotto genico della citocromo-C-ossidasi puo’
essere descritto in GENE ONTOLOGY tramite:
La sua funzione molecolare: attività ossidoreduttasica
Il componente cellulare nel quale è presente: la
matrice mitocondriale o la membrana interna del
mitocondrio
Il processo biologico che causa: fosforilazione
ossidativa e induzione di morte cellulare
DAG (Grafico Acilico Diretto)
Il grafico Acilico Diretto è la forma rappresentativa
usata in GO.
Il DAG è una forma di grafico che differisce da una
normale gerarchia poichè ogni termine può avere
più padri e in cui possono esistere molteplici
percorsi da un termine qualsiasi al termine radice
Ciascun vocabolo della GO rappresenta un nodo
del DAG al quale è associato un identificativo (GO
ID).
Grafico Acilico Diretto
un termine di gene ontology molto “generico”
contiene al suo interno” più termini di gene ontology
via via più specifici. Questo fa sì che man mano che si
va “verso il basso” le definizioni diventino sempre più
precise ed i geni che soddisfano a quella descrizione
sempre meno. Questo albero può quindi essere
“letto” a più livelli, da quelli più generali, che stanno
alla radice, a quelli via via sempre più specifici che
stanno sulle foglie.
POSSIBILI UTILIZZI DI GENE ONTOLOGY
La categorizzazione con GENE ONTOLOGY può avere diversi
scopi finali:
1) comprendere in che processo/funzione/componente in cui è
coinvolto un gene
2) categorizzazione di un set di dati (gene e proteine); in formato
normale o usando un Goslim per avere una visione d'insieme dei
dati
3) categorizzare un set di dati e valutare eventuali sovrarappresentazioni (“gene enrichment”) che non siano fruttto del
caso
4) estrazione dei geni (sequenze) che sono coinvolte in un
processo, funzione, componente