1. Do you think genome sequencing will impact on your future life? Give examples of what you would want and what you would not want to happen because of genome sequencing. or 2. How can you explain human complexity when we have so few protein coding genes, e.g. about 5,000 less than a cucumber? Renata Bocciardi DINOGMI - Università degli Studi di Genova U.O.C. Genetica Medica - Istituto G. Gaslini Genova, 3/02/2015 Teatro della Gioventù Do you think genome sequencing will impact on your future life? Che cosa conosciamo del nostro genoma? In che modo possono essere utili queste conoscenze? Chi può avere accesso a queste informazioni e perché? Conoscere o non conoscere? I test genetici al consumatore Cosa sappiamo del nostro genoma? L’inizio ■ Alla fine degli anni 90’ viene ufficialmente lanciato il Progetto Genoma Umano; nel 2001 viene pubblicata la prima bozza della Sequenza di riferimento del nostro genoma; nel 2003 il Progetto viene considerato ufficialmente concluso Determinare la sequenza di riferimento del Genoma Umano e identificare i geni che lo compongono ■ Depositare ed organizzare i risultati in apposite banche dati ■ Migliorare gli strumenti di analisi ■ Trasferire le tecnologie correlate a questo progetto in altri settori ■ Sequenziare 5 organismi modello (Escherichia coli, Saccharomyces cereviasiae, Caenorhabditis elegans, Drosophila melanogaster, Mus musculus) ■ Affrontare le questioni etiche, legali e sociali connesse alla realizzazione del progetto U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003 Cosa sappiamo del nostro genoma? L’inizio Il Progetto Genoma Umano: Partecipanti Settore Pubblico Consorzio Internazionale per il Progetto Genoma oltre 20 centri di ricerca nel mondo • DNA di donatori anonimi • Sequ di cloni già mappati Settore Privato Celera di C. Venter • DNA di 5 donatori, tra i quali J.C. Venter • Sequ di entrambi gli estremi di cloni ancora da mappare James Watson Francis Collins J. Craig Venter Cosa sappiamo del nostro genoma? L’inizio Il Progetto Genoma Umano: Risultati The National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/genome/ University of California Santa Cruz UCSC Genome Browser http://genome.ucsc.edu/ ENSEMBL Genome Browser http://www.ensembl.org/index.html Febbraio 2001 Il Progetto Genoma Umano: Risultati Il Genoma Umano contiene ~3 miliardi di basi azotate (A, C, G, T) Mediamente un gene è formato da 3000 basi, ma le dimensioni variano molto. Il più grande gene conosciuto è quello della Distrofina con 2.4 milioni di basi Il numero totale di geni è intorno ai 25-30.000, quindi molto inferiore a quello stimato in precedenza (80-100.000). Circa il 50% dei geni scoperti ha funzione sconosciuta. Meno del 2% del nostro genoma codifica per proteine! Quasi il 99.9% delle basi nucleotidiche è identico in tutti gli individui Sono state identificate variazioni e mutazioni nel nostro DNA (ad es. circa 3 milioni di differenze di una singola base, ovvero polimorfismi o varianti a singolo nucleotide, SNP o SNV) U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003 Il Progetto Genoma Umano: cosa abbiamo imparato Organismo Dimensioni Genoma (n basi) N di geni stimato Human (Homo sapiens) 3 billion 30,000 Laboratory mouse (M. musculus) 2.6 billion 30,000 Mustard weed (A. thaliana) 100 million 25,000 Roundworm (C. elegans) 97 million 19,000 Fruit fly (D. melanogaster) 137 million 13,000 Yeast (S. cerevisiae) 12.1 million 6,000 Bacterium (E. coli) 4.6 million 3,200 Human immunodeficiency virus (HIV) 9700 9 L’uomo è un organismo complesso: stesso numero di geni di organismi più semplici e un numero tre volte superiore di proteine! Ogni gene ha più trascritti (splicing o processamenti alternativi dell’RNA).... Il Progetto Genoma Umano: Risultati Il Genoma Umano contiene ~3 miliardi di basi azotate (A, C, G, T) Mediamente un gene è formato da 3000 basi, ma le dimensioni variano molto. Il più grande gene conosciuto è quello della Distrofina con 2.4 milioni di basi Il numero totale di geni è intorno ai 25-30.000, quindi molto inferiore a quello stimato in precedenza (80-100.000). Circa il 50% dei geni scoperti ha funzione sconosciuta. Meno del 2% del nostro genoma codifica per proteine! Quasi il 99.9% delle basi nucleotidiche è identico in tutti gli individui Sono state identificate variazioni e mutazioni nel nostro DNA (ad es. circa 3 milioni di differenze di una singola base, ovvero polimorfismi o varianti a singolo nucleotide, SNP o SNV) U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003 Esplorare la variabilità tra gli individui: oltre il Progetto Genoma HapMap Project Personal Genome Project Progetto Genoma Umano Variabilità come materia prima per l’evoluzione, per la determinazione delle caratteristiche individuali...................possibilità di sequenziare l’intero genoma di un individuo come enorme risorsa ....dal 2003 ad oggi Sviluppo di nuove tecnologie per il sequenziamento completo del genoma in tempi sempre più brevi (Next Generation Sequencing, NGS o Sequenziamento di Nuova Generazione) e a costi sempre più contenuti Evoluzione dei costi per il sequenziamento del genoma di una persona Topol EJ - Cell 157 (1):241–253, 2014 Il Sequenziamento di Nuova Generazione (Next Generation Sequencing, NGS) • Preparazione dei campioni per il sequenziamento (Intero genoma, esoma, pannelli di geni selezionati) • Tempo macchina • Elaborazione dei dati, analisi di qualità, “chiamata delle varianti”, filtraggi successivi delle varianti, lista varianti candidate in relazione al quesito diagnostico Necessità di un’importante infrastruttura informatica Stima della variabilità ereditabile Il numero in continua crescita dei genomi analizzati ci consente di cominciare a stimare la quota di variabilità che ci caratterizza con una precisione sempre maggiore Quasi il 99.9% delle basi nucleotidiche è identico in tutti gli individui Nel genoma di un singolo individuo troviamo circa 3-4 milioni di varianti (SNV) e cambiamenti strutturali di entità diversa (delezioni, inserzioni, inversioni) 20.000 – 30.000 si trovano in esoni codificanti 10.000 - 11.000 provocano cambiamenti nella proteina (variazioni non sinonime)... 90% di queste varianti sono cosiddette COMUNI (frequenza >5%). Le restanti sono rare o rarissime, addirittura in alcuni casi si parla di varianti private, ovvero che si trovano soltanto nei membri appartenenti allo stesso gruppo familiare Ma come facciamo a focalizzare l’attenzione sulle varianti che VERAMENTE influenzano il fenotipo di una persona, le sue caratteristiche fisiche e comportamentali, la predisposizione alla malattia, la risposta ai farmaci, la risposta all’alimentazione................ La risposta sarà anche nel nostro DNA, il problema è che bisogna saper porre la domanda e poi saper interpretare la risposta..... Quesito diagnostico Ricerca del difetto molecolare alla base di una malattia genetica monogenica o monofattoriale (difetto in un singolo gene = malattia) • Selezione dei pazienti • Sequenziamento esoma/genoma • Filtraggio delle varianti (troppo comuni, riportate in soggettti normali etc) • Selezione delle varianti con le caratteristiche opportune in base al tipo di trasmissione della malattia, comuni a più soggetti affetti dalla malattia • Verifica della varianti candidate Quesito diagnostico Ricerca del difetto molecolare alla base di una malattia complessa o multifattoriale (più geni coinvolti, contributo dell’ambiente difetto = malattia) • Selezione dei pazienti e individui di controllo (necessità di grossi numeri) • Sequenziamento esoma/genoma • Filtraggio delle varianti (comuni, riportate in soggettti normali etc) • Selezione delle varianti con le caratteristiche opportune (Varianti comuni, calcolo delle frequenze relative nei controlli e nei pazienti, studio di associazione) • Verifica della varianti candidate Quesito diagnostico: nessuno specifico, voglio conoscere il mio genoma.... Sequenziamento del genoma individuale: esempi celebri James Watson’s genome • 342 varianti a carico di geni schedati in “Human Gene Mutation Database (HGMD)” • 32 con mutazioni descritte • 12 in geni resposabili di patologie recessive (portatore) Sequenziamento genoma & malattie monogeniche Informazioni riguardanti il nostro stato di portatori di una condizione autosomica recessiva, di una malattia do,minante ad esordio tardivo Sequenziamento genoma & malattie multifattoriali Informazioni riguardanti la nostra eventuale predisposizione a sviluppare malattie multifattoriali (malattie cardiovascolari, neurodegenerative, diabete, condizioni metaboliche etc.), a contrarre infezioni etc James Watson e l’ipertensione Mr Watson soffre di ipertensione, condizione molto comune specialmente dopo una certa età... Assume dei farmaci anti-ipertensivi tra i quali dei beta-bloccanti, ma il risultato non è ottimale, la pressione non è sempre sotto controllo, inoltre l’assunzione pur necessaria di questi farmaci ha fastidiosi effetti collaterali Con il sequenziamento del suo genoma è stato possibile analizzare lo stato di almeno 6 geni che intervengono nel metabolismo dei farmaci Tra questi Mr Watson è risultato omozigote per una particolare variante del gene CYP2D6, codificante per un enzima che interviene nel metabolismo di numerosi farmaci (beta-bloccanti, anti aritmici, antipsicotci d alcuni anti-depressivi) L’allele CYP2D6*1A codifica per un enzima non funzionale Mr Watson è un cosiddetto metabolizzatore lento, è necessario cambiare completamente classe di farmaci Genotipizzazione del gene CYP2D6 metabolizzatori lenti (Poor Metabolizer ): sono pazienti che presentano una mutazione in entrambi gli alleli del gene, cioe’ presentano due alleli non funzionali del gene CYP2D6 Capacità d’attivazione dei farmaci estremamente ridotta o assente, ridotta capacità metabolica per numerosi composti, tenderanno ad accumulare o ad eliminare più lentamente i substrati o i farmaci che sono maggiormente metabolizzati dal CYP2D6, più frequentemente esposti ad effetti indesiderati se trattati con dosi standard di questi composti. metabolizzatori intermedi sono pazienti portatori in eterozigosi di una mutazione, cioe’ presentano un allele normale del gene CYP2D6 ed uno non funzionale, per conseguire un’azione terapeutica ottimale, un dosaggio farmacologico inferiore alla norma. metabolizzatori estesi sono persone dotate di un normale metabolismo farmacologico. metabolizzatori rapidi (Ultra-Metabolizer): sono persone con un’aumentata espressione del gene CYP2D6, dovuta alla presenza di tre o più alleli funzionali (*XN), a causa di una duplicazione o multiduplicazione di un allele funzionale. I metabolizzatori rapidi possono richiedere, per un’azione terapeutica ottimale, un dosaggio farmacologico superiore alla norma. Sequenziamento genoma & Farmacogenomica* Informazioni utili a predire la risposta individuale ai farmaci, possibilità di terapie mirate e di sviluppo di classi di farmaci che tengano conto di questa variabilità *Farmacogenetica/farmacogenomica ovvero come predire la propria risposta ai farmaci a partire dal nostro profilo genetico Venter’s genome Venter’s genome La genotipizzazione e l’analisi di raggruppamento di 750 SNP unici suggerisce che Mr Venter è per il 99.5% simile ad individui di discendenza Europea Sequenziamento del genoma: le nostre origini & antropologia & evoluzione • Attenzione però in genetica parliamo di popolazioni, non esiste alcuna base scientifica e genetica alla categorizzazione delle cosiddette “razze” Tra l’altro, Mr Venter risulta eterozigote per due varianti APOE SNP rs429358 (T/C) e APOC1 SNP rs4420638 (A/G) che lo pongono ad “alto rischio” nella predisposizione allo sviluppo della malattia di Alzheimer ad esordio tardivo (LOAD) Inoltre, Mr Venter è portatore di alcune varianti che potrebbero predisporlo al melanoma ed al altri tumori della pelle Sequenziamento genoma & predisposizione a malattie neurodegenerative (per lo più incurabili allo stato attuale) o a particolari forme di cancro (prevenzione) Inoltre, cominciamo a riflettere Mr Watson ha dato il proprio assenso a che i dati riguardanti il sequenziamento del proprio genoma fossero condivisi pubblicamente, ma ha chiesto esplicitamente che i dati riguardanti alcuni geni le cui varianti potrebbero predire la predisposizione allo sviluppo di malattie neurodegenerative (e in particolare l’Alzheimer) fossero eliminati Ampliare e migliorare le capacità diagnostiche nelle malattie, per trattare ove possibile, prevenire... Possibilità di identificare la predisposizione genetica a malattie complesse e condizioni parafisiologiche Possibilità di predire la risposta individuale ai farmaci, all’alimentazione, all’esercizio fisico/attività sportiva..... Possibilità di predire caratteristiche fisiche, fisiologiche, comportamentali U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003 Sequenziamento del Genoma e medicina personalizzata Topol EJ - Cell 157 (1):241–253, 2014 Ampliare e migliorare le capacitè diagnostiche nelle malattie Possibilità di identificare la predisposizione genetica ad alcune malattie e condizioni parafisiologiche (prevenzione...) Disegnare farmaci “personalizzati” sulla base del profilo genetico (farmacogenetica e farmacogenomica) Medicina Molecolare Genomica microbica, patologia e ambiente Genetica Forense BioArcheologia, Antropologia, Evoluzione e migrazioni Agricoltura, Allevamento, conservazione delle specie U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003 Do you think genome sequencing will impact on your future life? Yes, but... • Il fatto di essere portatori di una o alcune varianti “predisponenti” non significa che svilupperemo la data malattia (necessità di altri eventi molecolari, effetto dell’ambiente...) • In molti casi l’associazione di varianti con alcune situazioni patologiche o parafisiologiche non sono state confermate e non ci sono prove biologiche che abbiamo veramente un impatto funzionale • Per moltissime varianti non sappiamo che conclusioni trarre..... Inoltre.... Aspetti etici, legali e sociali Informazione genetica privata e confidenziale Impatto psicologico, pericolo di stigmatizzazioni e discriminazioni Impatto sulle scelte riproduttive Politiche sanitarie e assistenziali Impatto in sanità pubblica e privata (formazione professionisti, standard di qualità, accesso ai test, utilità dei test) Aspetti sanitari e ambientali (OGM) Implicazioni filosofiche, responsabilità Commercializzazione delle tecnologie e dei test . Gestione e accesso ai risultati U.S. Department of Energy Genome Programs, Genomics and Its Impact on Science and Society, 2003 Il Genetic Information Nondiscrimination Act (anche detto GINA) è una legge adottata dal Congresso degli Stati Uniti che proibisce l'utilizzo di informazioni genetiche nell‘assicurazione sanitaria e nel contratto di lavoro. Essa vieta di negare la copertura sanitaria ad un individuo sano o di imporgli costi più elevati esclusivamente sulla base di una predisposizione genetica allo sviluppo di una malattia. Vieta inoltre ai datori di lavoro di servirsi di informazioni genetiche di un individuo per assumere, licenziare, trasferire o promuovere il dipendente. I La legge contiene emendamenti all'Employee Retirement Income Security del 1974 ed all'Internal Revenue Code del 1986. Il decreto è passato all'unanimità in Senato (95 a 0), e all'unanimità meno un voto, quello del senatore Ron Paul, alla Camera dei rappresentanti il 24 aprile 2008. http://it.wikipedia.org/wiki/Genetic_Information_Nondiscrimination_Act Quindi....cosa vorresti sapere e cosa no? Immagina di avere fatto sequenziare il tuo genoma Tutti i risultati, nessuno escluso Solo i dati relativi a varianti per le quali c’è estesa documentazione scientifica e conferme relativamente al loro valore funzionale, diagnostico, prognostico o predittivo Solo i dati scientificamente “sicuri” ma relativi a condizioni curabili o per i quali esiste un qualche tipo di intervento ........ Il genoma a 1000 Euro..........i siti per la genomica personalizzata * Cofondatrice Anne Wojcicki, moglie di Sergej Brin, inventore assieme a Larry Page di Google Fine