Genome sequencing - CusTAG - Università degli studi di Genova

1. Do you think genome sequencing will impact on your future life? Give
examples of what you would want and what you would not want to happen
because of genome sequencing.
or
2. How can you explain human complexity when we have so few protein
coding genes, e.g. about 5,000 less than a cucumber?
Renata Bocciardi
DINOGMI - Università degli Studi di Genova
U.O.C. Genetica Medica - Istituto G. Gaslini
Genova, 3/02/2015
Teatro della Gioventù
Do you think genome sequencing will impact on your
future life?
  Che cosa conosciamo del nostro genoma?
  In che modo possono essere utili queste
conoscenze?
  Chi può avere accesso a queste informazioni e
perché?
  Conoscere o non conoscere?
  I test genetici al consumatore
Cosa sappiamo del nostro genoma?
L’inizio
■ Alla fine degli anni 90’ viene ufficialmente lanciato il Progetto Genoma
Umano; nel 2001 viene pubblicata la prima bozza della Sequenza di
riferimento del nostro genoma; nel 2003 il Progetto viene considerato
ufficialmente concluso
  Determinare la sequenza di riferimento del Genoma Umano e identificare
i geni che lo compongono
■ Depositare ed organizzare i risultati in apposite banche dati
■ Migliorare gli strumenti di analisi
■ Trasferire le tecnologie correlate a questo progetto in altri settori
■ Sequenziare 5 organismi modello
(Escherichia coli, Saccharomyces cereviasiae, Caenorhabditis elegans,
Drosophila melanogaster, Mus musculus)
■ Affrontare le questioni etiche, legali e sociali connesse alla realizzazione del
progetto
U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003
Cosa sappiamo del nostro genoma?
L’inizio
Il Progetto Genoma Umano: Partecipanti
  Settore Pubblico
Consorzio Internazionale per il Progetto Genoma
oltre 20 centri di ricerca nel mondo
•  DNA di donatori anonimi
•  Sequ di cloni già mappati
  Settore Privato
Celera di C. Venter
•  DNA di 5 donatori, tra i quali J.C. Venter
•  Sequ di entrambi gli estremi di cloni ancora da
mappare
James Watson
Francis Collins
J. Craig Venter
Cosa sappiamo del nostro genoma?
L’inizio
Il Progetto Genoma Umano: Risultati
The National Center for Biotechnology Information (NCBI)
http://www.ncbi.nlm.nih.gov/genome/
University of California Santa Cruz
UCSC Genome Browser
http://genome.ucsc.edu/
ENSEMBL Genome Browser
http://www.ensembl.org/index.html
Febbraio 2001
Il Progetto Genoma Umano: Risultati
  Il Genoma Umano contiene ~3 miliardi di basi azotate (A, C, G, T)
  Mediamente un gene è formato da 3000 basi, ma le dimensioni variano molto. Il
più grande gene conosciuto è quello della Distrofina con 2.4 milioni di basi
  Il numero totale di geni è intorno ai 25-30.000, quindi molto inferiore a quello
stimato in precedenza (80-100.000). Circa il 50% dei geni scoperti ha funzione
sconosciuta.
 Meno del 2% del nostro genoma codifica per proteine!
  Quasi il 99.9% delle basi nucleotidiche è identico in tutti gli individui
  Sono state identificate variazioni e mutazioni nel nostro DNA (ad es. circa 3
milioni di differenze di una singola base, ovvero polimorfismi o varianti a singolo
nucleotide, SNP o SNV)
U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003
Il Progetto Genoma Umano: cosa abbiamo imparato
Organismo
Dimensioni Genoma
(n basi)
N di geni
stimato
Human (Homo sapiens)
3 billion
30,000
Laboratory mouse (M. musculus)
2.6 billion
30,000
Mustard weed (A. thaliana)
100 million
25,000
Roundworm (C. elegans)
97 million
19,000
Fruit fly (D. melanogaster)
137 million
13,000
Yeast (S. cerevisiae)
12.1 million
6,000
Bacterium (E. coli)
4.6 million
3,200
Human immunodeficiency virus (HIV)
9700
9
  L’uomo è un organismo complesso: stesso numero di geni di organismi più
semplici e un numero tre volte superiore di proteine!
  Ogni gene ha più trascritti (splicing o processamenti alternativi dell’RNA)....
Il Progetto Genoma Umano: Risultati
  Il Genoma Umano contiene ~3 miliardi di basi azotate (A, C, G, T)
  Mediamente un gene è formato da 3000 basi, ma le dimensioni variano molto. Il
più grande gene conosciuto è quello della Distrofina con 2.4 milioni di basi
  Il numero totale di geni è intorno ai 25-30.000, quindi molto inferiore a quello
stimato in precedenza (80-100.000). Circa il 50% dei geni scoperti ha funzione
sconosciuta.
 Meno del 2% del nostro genoma codifica per proteine!
  Quasi il 99.9% delle basi nucleotidiche è identico in tutti gli individui
  Sono state identificate variazioni e mutazioni nel nostro DNA (ad es. circa 3
milioni di differenze di una singola base, ovvero polimorfismi o varianti a singolo
nucleotide, SNP o SNV)
U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003
Esplorare la variabilità tra gli individui:
oltre il Progetto Genoma
HapMap Project
Personal Genome Project
Progetto Genoma
Umano
Variabilità come materia prima per l’evoluzione, per la determinazione delle caratteristiche
individuali...................possibilità di sequenziare l’intero genoma di un individuo come
enorme risorsa
....dal 2003 ad oggi
Sviluppo di nuove tecnologie per il sequenziamento completo del genoma in
tempi sempre più brevi (Next Generation Sequencing, NGS o
Sequenziamento di Nuova Generazione) e a costi sempre più contenuti
Evoluzione dei costi per il sequenziamento del genoma di una persona
Topol EJ - Cell 157 (1):241–253, 2014
Il Sequenziamento di Nuova Generazione (Next Generation Sequencing, NGS)
•  Preparazione dei campioni per il sequenziamento
(Intero genoma, esoma, pannelli di geni selezionati)
•  Tempo macchina
•  Elaborazione dei dati, analisi di qualità, “chiamata delle varianti”, filtraggi
successivi delle varianti, lista varianti candidate in relazione al quesito diagnostico
  Necessità di un’importante infrastruttura informatica
Stima della variabilità ereditabile
Il numero in continua crescita dei genomi analizzati ci consente di
cominciare a stimare la quota di variabilità che ci caratterizza con una
precisione sempre maggiore
  Quasi il 99.9% delle basi nucleotidiche è identico in tutti gli
individui
  Nel genoma di un singolo individuo troviamo circa 3-4
milioni di varianti (SNV) e cambiamenti strutturali di entità
diversa (delezioni, inserzioni, inversioni)
20.000 – 30.000 si trovano in esoni codificanti
10.000 - 11.000 provocano cambiamenti nella proteina (variazioni non sinonime)...
90% di queste varianti sono cosiddette COMUNI
(frequenza >5%). Le restanti sono rare o rarissime, addirittura
in alcuni casi si parla di varianti private, ovvero che si trovano
soltanto nei membri appartenenti allo stesso gruppo familiare
 
Ma come facciamo a focalizzare l’attenzione sulle varianti che VERAMENTE
influenzano il fenotipo di una persona, le sue caratteristiche fisiche e
comportamentali, la predisposizione alla malattia, la risposta ai farmaci, la risposta
all’alimentazione................
La risposta sarà anche nel nostro DNA, il problema è che bisogna saper
porre la domanda e poi saper interpretare la risposta.....
Quesito diagnostico
  Ricerca del difetto molecolare alla base
di una malattia genetica monogenica o
monofattoriale
(difetto in un singolo gene = malattia)
•  Selezione dei pazienti
•  Sequenziamento esoma/genoma
•  Filtraggio delle varianti (troppo comuni,
riportate in soggettti normali etc)
•  Selezione delle varianti con le
caratteristiche opportune in base al tipo di
trasmissione della malattia, comuni a più
soggetti affetti dalla malattia
•  Verifica della varianti candidate
Quesito diagnostico
  Ricerca del difetto molecolare alla base
di una malattia complessa o multifattoriale
(più geni coinvolti, contributo dell’ambiente
difetto = malattia)
•  Selezione dei pazienti e individui di
controllo (necessità di grossi numeri)
•  Sequenziamento esoma/genoma
•  Filtraggio delle varianti (comuni, riportate
in soggettti normali etc)
•  Selezione delle varianti con le
caratteristiche opportune (Varianti comuni,
calcolo delle frequenze relative nei controlli
e nei pazienti, studio di associazione)
•  Verifica della varianti candidate
Quesito diagnostico: nessuno specifico, voglio conoscere il mio genoma....
Sequenziamento del genoma individuale: esempi celebri
James Watson’s genome
•  342 varianti a carico di geni schedati in “Human Gene Mutation Database (HGMD)”
•  32 con mutazioni descritte
•  12 in geni resposabili di patologie recessive (portatore)
  Sequenziamento genoma & malattie monogeniche
Informazioni riguardanti il nostro stato di portatori di una condizione autosomica
recessiva, di una malattia do,minante ad esordio tardivo
  Sequenziamento genoma & malattie multifattoriali
Informazioni riguardanti la nostra eventuale predisposizione a sviluppare malattie
multifattoriali (malattie cardiovascolari, neurodegenerative, diabete, condizioni
metaboliche etc.), a contrarre infezioni etc
James Watson e l’ipertensione
Mr Watson soffre di ipertensione, condizione molto comune specialmente dopo una
certa età...
Assume dei farmaci anti-ipertensivi tra i quali dei beta-bloccanti, ma il risultato non è
ottimale, la pressione non è sempre sotto controllo, inoltre l’assunzione pur necessaria
di questi farmaci ha fastidiosi effetti collaterali
Con il sequenziamento del suo genoma è stato possibile analizzare lo
stato di almeno 6 geni che intervengono nel metabolismo dei farmaci
Tra questi Mr Watson è risultato omozigote per una particolare variante
del gene CYP2D6, codificante per un enzima che interviene nel
metabolismo di numerosi farmaci (beta-bloccanti, anti aritmici, antipsicotci d alcuni anti-depressivi)
L’allele CYP2D6*1A codifica per un enzima non funzionale
Mr Watson è un cosiddetto metabolizzatore lento, è necessario
cambiare completamente classe di farmaci
Genotipizzazione del gene CYP2D6
metabolizzatori lenti (Poor Metabolizer ): sono
pazienti che presentano una mutazione in entrambi
gli alleli del gene, cioe’ presentano due alleli non
funzionali del gene CYP2D6
Capacità d’attivazione dei farmaci estremamente
ridotta o assente, ridotta capacità metabolica per
numerosi composti, tenderanno ad accumulare o ad
eliminare più lentamente i substrati o i farmaci che
sono maggiormente metabolizzati dal CYP2D6, più
frequentemente esposti ad effetti indesiderati se
trattati con dosi standard di questi composti.
metabolizzatori intermedi sono pazienti portatori in
eterozigosi di una mutazione, cioe’ presentano un
allele normale del gene CYP2D6 ed uno non
funzionale, per conseguire un’azione terapeutica
ottimale, un dosaggio farmacologico inferiore alla
norma.
metabolizzatori estesi sono persone dotate di un
normale metabolismo farmacologico.
metabolizzatori rapidi (Ultra-Metabolizer): sono
persone con un’aumentata espressione del gene
CYP2D6, dovuta alla presenza di tre o più alleli
funzionali (*XN), a causa di una duplicazione o multiduplicazione di un allele funzionale. I metabolizzatori
rapidi possono richiedere, per un’azione terapeutica
ottimale, un dosaggio farmacologico superiore alla
norma.
Sequenziamento genoma & Farmacogenomica*
Informazioni utili a predire la risposta individuale ai farmaci, possibilità di terapie
mirate e di sviluppo di classi di farmaci che tengano conto di questa variabilità
*Farmacogenetica/farmacogenomica ovvero come predire la propria risposta ai farmaci a partire dal nostro profilo genetico
Venter’s genome
Venter’s genome
  La genotipizzazione e l’analisi di
raggruppamento di 750 SNP unici
suggerisce che Mr Venter è per il
99.5% simile ad individui di
discendenza Europea
  Sequenziamento del genoma: le nostre origini & antropologia & evoluzione
•  Attenzione però in genetica parliamo di popolazioni, non esiste alcuna
base scientifica e genetica alla categorizzazione delle cosiddette “razze”
Tra l’altro, Mr Venter risulta eterozigote per due varianti
APOE SNP rs429358 (T/C) e APOC1 SNP rs4420638 (A/G) che
lo pongono ad “alto rischio” nella predisposizione allo sviluppo
della malattia di Alzheimer ad esordio tardivo (LOAD)
Inoltre, Mr Venter è portatore di alcune varianti che
potrebbero predisporlo al melanoma ed al altri tumori della
pelle
  Sequenziamento genoma & predisposizione a malattie
neurodegenerative (per lo più incurabili allo stato attuale) o
a particolari forme di cancro (prevenzione)
Inoltre, cominciamo a riflettere
Mr Watson ha dato il proprio assenso a che i dati riguardanti il
sequenziamento del proprio genoma fossero condivisi pubblicamente, ma
ha chiesto esplicitamente che i dati riguardanti alcuni geni le cui varianti
potrebbero predire la predisposizione allo sviluppo di malattie
neurodegenerative (e in particolare l’Alzheimer) fossero eliminati
  Ampliare e migliorare le capacità diagnostiche nelle
malattie, per trattare ove possibile, prevenire...
  Possibilità di identificare la predisposizione genetica
a malattie complesse e condizioni parafisiologiche
  Possibilità di predire la risposta individuale ai
farmaci, all’alimentazione, all’esercizio fisico/attività
sportiva.....
  Possibilità di predire caratteristiche fisiche,
fisiologiche, comportamentali
U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003
Sequenziamento del Genoma e medicina personalizzata
Topol EJ - Cell 157 (1):241–253, 2014
  Ampliare e migliorare le capacitè diagnostiche nelle malattie
  Possibilità di identificare la predisposizione genetica ad alcune malattie e condizioni
parafisiologiche (prevenzione...)
  Disegnare farmaci “personalizzati” sulla base del profilo genetico (farmacogenetica e
farmacogenomica)
  Medicina Molecolare
  Genomica microbica, patologia e ambiente
  Genetica Forense
  BioArcheologia, Antropologia, Evoluzione e migrazioni
  Agricoltura, Allevamento, conservazione delle specie
U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003
Do you think genome sequencing will impact on your future life?
Yes, but...
•  Il fatto di essere portatori di una o alcune
varianti “predisponenti” non significa che
svilupperemo la data malattia (necessità di
altri eventi molecolari, effetto
dell’ambiente...)
•  In molti casi l’associazione di varianti
con alcune situazioni patologiche o
parafisiologiche non sono state confermate
e non ci sono prove biologiche che
abbiamo veramente un impatto funzionale
•  Per moltissime varianti non sappiamo
che conclusioni trarre.....
Inoltre....
Aspetti etici, legali e sociali
  Informazione genetica privata e confidenziale
  Impatto psicologico, pericolo di stigmatizzazioni e
discriminazioni
  Impatto sulle scelte riproduttive
  Politiche sanitarie e assistenziali
  Impatto in sanità pubblica e privata (formazione
professionisti, standard di qualità, accesso ai test,
utilità dei test)
  Aspetti sanitari e ambientali (OGM)
  Implicazioni filosofiche, responsabilità
  Commercializzazione delle tecnologie e dei test .
Gestione e accesso ai risultati
U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003
Il Genetic Information Nondiscrimination Act (anche detto GINA) è una legge
adottata dal Congresso degli Stati Uniti che proibisce l'utilizzo di informazioni
genetiche nell‘assicurazione sanitaria e nel contratto di lavoro.
Essa vieta di negare la copertura sanitaria ad un individuo sano o di imporgli costi
più elevati esclusivamente sulla base di una predisposizione genetica allo sviluppo
di una malattia.
Vieta inoltre ai datori di lavoro di servirsi di informazioni genetiche di un individuo per
assumere, licenziare, trasferire o promuovere il dipendente. I
La legge contiene emendamenti all'Employee Retirement Income Security del 1974
ed all'Internal Revenue Code del 1986.
Il decreto è passato all'unanimità in Senato (95 a 0), e all'unanimità meno un voto,
quello del senatore Ron Paul, alla Camera dei rappresentanti il 24 aprile 2008.
http://it.wikipedia.org/wiki/Genetic_Information_Nondiscrimination_Act
Quindi....cosa vorresti sapere e cosa no?
Immagina di avere fatto sequenziare il tuo genoma
  Tutti i risultati, nessuno escluso
  Solo i dati relativi a varianti per le quali c’è estesa documentazione scientifica e
conferme relativamente al loro valore funzionale, diagnostico, prognostico o predittivo
  Solo i dati scientificamente “sicuri” ma relativi a condizioni curabili o per i quali
esiste un qualche tipo di intervento
 ........
Il genoma a 1000 Euro..........i siti per la genomica personalizzata
* Cofondatrice Anne Wojcicki, moglie di Sergej Brin, inventore assieme a Larry Page di Google
Fine