medicina genetica

MEDICINA GENETICA
27/10/2011
FINALITA’ DEL CORSO:
- Fornire gli strumenti per poter utilizzare in medicina le nuove conoscenze della genetica
→ portare in ambito clinico quelle che sono le novità nell’ambito della ricerca
- Abituare a ragionare in termini di prevenzione per quanto riguarda una malattia genetica (rischi,
prevenzione, etc.)
Il corso è diviso in una parte di medicina genetica e in una di genetica medica:
- GENETICA MEDICA: si basa sullo studio di malattie genetiche rare (cioè malattie con una
frequenza pari o inferiore a 1/2000 nella popolazione) ereditate in modo mendeliano,
monogeniche
- MEDICINA GENETICA: implica il fatto che la genetica abbia invaso un po’ tutte le
discipline della medicina. Per molte malattie comuni (ipertensione, cancro, etc) hanno una
forte componente genetica (geni di suscettibilità + influenza ambientale → determinano
l’insorgenza della patologia).
GENETICA MEDICA
ALBERI GENEALOGICI e ANALISI DI SEGREGAZIONE
Questo albero genealogico mostra:
- una coppia in cui il marito è malato e la donna no
- questa coppia ha avuto 10 figli, di cui 3 sono malati, sia maschi che femmine
- in ogni generazione ci sono sempre individui malati
1
-
una figlia malata della prima coppia ha avuto due mariti e ha generato una figlia affetta con
il primo e una affetta anche con il secondo
→ trasmissione di tipo AUTOSOMICO DOMINANTE, basta una copia alterata del gene per avere
la manifestazione della malattia (rischio di trasmissione alla prole di un individuo malato del 50%,
se un figlio è sano, non ha ricevuto l’allele e non trasmetterà più la malattia).
Questo albero genealogico mostra:
- 5 individui malati, tutti maschi
→ legato al cromosoma X, maschio ha un solo cromosoma X, se eredita un cromosoma malato,
manifesta sicuramente la patologia, risulta malato
Il maschio della prima generazione ha una malattia LEGATA AL CROMOSOMA X (es.
daltonismo), i suoi figli maschi sono sempre sani, perché trasmette loro in cromosoma Y
(N.B: nelle patologie legate al cromosoma X non c’è MAI trasmissione da padre malato a figlio
maschio)
La figlia della prima coppia è sicuramente PORTATRICE OBBLIGATA, correrà perciò il rischio
di generare figli maschi ammalati, e infatti lo trasmette alla prima figlia, che ha due figli malati
(delle altre non posso sapere perché non hanno figli, hanno un rischio del 50% essendo la madre
portatrice obbligata).
Come si stabilisce se una donna è portatrice obbligata di una patologia legata all’X?
- E’ figlia di un individuo malato
- Ha almeno un fratello e un figlio con la stessa malattia (deve avere anche un fratello affetto,
perché se solo il figlio è affetto e la storia familiare negativa, potrebbe avere una mutazione
il nonno del bambino, mentre se ha anche un fratello malato, è sicuramente la nonna ad
essere portatrice, ne deriva che lei è portatrice obbligata)
Questa donna ha il 50% di probabilità di generare figli malati e il 50% di generare figlie portatrici.
2
Questo albero genealogico mostra:
- tutti gli affetti sono maschi
→ si tratta di una patologia LEGATA AL CROMOSOMA X
Posso determinare le femmine portatrici con i criteri di prima.
Con un’analisi di segregazione posso trarre molte informazioni da questo albero genealogico:
- come si trasmette la malattia
- stato di portatore/portatrice degli individui
Anche in questo caso tutti gli affetti sono maschi, ma il terzo individuo della prima generazione
trasmette la patologica al figlio maschio (trasmissione da maschio a maschio), quindi non è legata
all’X, è AUTOSOMICA ad espressività limitata al sesso maschile; non è legata al cromosoma Y
perché ci sono femmine che trasmettono la malattia e perché il cromosoma Y è molto piccolo e se
ha geni alterati normalmente l’uomo è infertile.
3
28/10/2011
Nelle patologie AUTOSOMICHE RECESSIVE accade che per diverse generazioni non vi siano
segnalazioni di individui affetti → patologia ricompare improvvisamente
Servono entrambi gli alleli alterati per manifestare la patologia: la mutazione può o meno essere la
stessa su entrambi i geni, con medesimo effetto finale (OMOZIGOTE RECESSIVO ed
ETEROZIGOTE COMPOSTO).
La popolazione è un serbatoio di geni recessivi
→ progetto di sequenziamento del genoma di mille individui: ognuno di noi è portatore sano di
circa dieci geni malattia
Nel 98% dei casi i figli nascono comunque sani, il rischio di un’anomalia congenita alla nascita di
figlio di una coppia “sana” è di 1-2%.
Vi sono alcune malattie più frequenti, come la fibrosi cistica (1 su 2500)
→ circa 1 individuo su 25 è portatore del gene recessivo per la fibrosi cistica. La probabilità che
incontri un altro individuo con tale mutazione è 1/25 x 1/25, poi, come in tutte le malattie recessive,
la probabilità che da due portatori nasca un individuo malato è di 1/4:
1/25 x 1/25 x 1/4 = 1/2500
→ FREQUENZA DELLA MALATTIA NELLA POPOLAZIONE
Più una malattia genetica è rara (es: 1/100000), più è facile che i genitori di un individuo malato
siano tra loro consanguinei (albero “e”: matrimonio tra cugini di primo grado).
Omozigoti recessivi in questo caso vengono detti OMOZIGOTI PER DISCESA, perché è lo stesso
allele che viene trasmesso all’individuo passando per due vie diverse.
Es: vengono in consulenza due fratelli di un individuo morto nei primi mesi di vita in conseguenza
a una patologia recessiva. Chiedono qual è la loro probabilità di essere portatori del gene recessivo.
L’individuo morto era sicuramente aa:
♀/♂
A
a
A
a
AA Aa
Aa aa
Loro non sono sicuramente “aa” perché non sono ammalati, quindi la loro probabilità di essere
portatori è 2/3.
4
Se fosse venuta la madre in gravidanza, le probabilità del bambino sarebbero state:
- 25% completamente sano
- 25% malato
- 50% portatore sano
Una volta nato il bambino, se non è malato, la sua probabilità di essere portatore sale a 2/3, perché
essendo sano si esclude l’aplotipo aa.
POLIMORFISMI
Human Genome Project → progetto di sequenziamento dell’intero DNA umano dal 1 ottobre del
1990 al 30 settembre del 2005: fu terminato con 5 anni di anticipo, nel 2000.
Occorre chiarire alcune definizioni:
GENE: unità di ereditarietà. Produce una proteina che svolge una funzione all’interno
dell’organismo
GENETICA: scienza che studia l’ereditarietà nell’uomo
GENOMA: deriva da genes e chromosomes, è il set completo di geni e cromosomi di un individuo
GENOMICA: studio strutturale e funzionale del nostro genoma.
Catalogo di tutte le malattie genetiche mendeliane → MIM (MENDELIAN INHERITANCE IN
MAN), dal ’98 solo in forma elettronica (OMIM, on-line – MIM)
5
Solo 13.693 geni sono stati completamente sequenziati.
Vi sono 3-4000 malattie di cui si conosce perfettamente l’anomalia genetica.
Il genoma umano è stato paragonato a quello di altri esseri viventi:
Microbes
S. cerevisiae
C.elegans
A. thaliana
D. melanogaster
H. sapiens
1 gene / kb
1 gene / 2 kb
1 gene / 5 kb
1 gene / 5 kb
1 gene / 13 kb
1 gene / 40 kb
90% Coding
70%
40%
20%
20%
3%
Genomica comparativa→ paragona esattamente la sequenza del nostro genoma con quello di altre
specie animali.
Questo ci consente di individuare il ruolo di alcuni geni→ es. esiste un mutante spontaneo di
Drosophila, chiamato eye-less, cioè cieca, dovuta a mutazione del gene Pax-6. Nell’uomo,
mutazioni di Pax-6 danno aniridia (assenza dell’iride) e altre mutazioni importanti che
compromettono lo sviluppo embrionale dell’occhio.
Con la genomica comparativa si può individuare meglio il ruolo di alcuni geni umani.
Non più 1 gene = 1 proteina, ma circa 25000 geni che codificano per 1 milione di proteine
→ dogma rotto dal sequenziamento del genoma.
Inoltre, nell’era post-genomica, non è importante l’analisi del singolo gene, ma è importante capire
l’interazione tra geni diversi, quindi devo comprendere il funzionamento di più geni.
Inoltre, eravamo abituati a pensare che un DNA sano portava forzatamente a un soggetto sano e un
DNA mutato portava all’espressione della malattia genetica → in realtà, ognuno ha molte mutazioni
all’interno del DNA (circa 20000 a testa), quindi vi sono molte varianti che non sono di per sé
patogene, ma sono i cosiddetti POLIMORFISMI, variazioni all’interno della sequenza del nostro
DNA con una frequenza nella popolazione superiore almeno all’1%.
Questi polimorfismi hanno aperto un nuovo concetto: quelle variazioni non danno un individuo
malato, ma possono creare una proteina che può funzionare un po’ di più o un po’ di meno, che può
favorire lo sviluppo di una malattia complessa o può proteggere da tale patologia, oppure possono
concorrere a modificare l’espressività di malattie monogeniche.
31/10/2011
Ora è possibile sequenziare tutto il genoma di un individuo in poche settimane (contro i 10 anni del
primo) grazie alle nuove strumentazioni.
Si sta facendo l’ESOMA, la sequenza di tutta la porzione codificante del genoma.
Da questi esperimenti, si vede che all’interno degli esoni ci sono circa 20000 o più varianti, molte di
queste sono dei polimorfismi di un singolo nucleotidi, alcune sono mutazioni → vanno interpretati
Il DNA è pieno di varianti e tutte queste varianti, alcune sono collegate a malattie mendeliano, altre
sono loci di suscettibilità, etc. e possono anche determinare l’espressività di malattie mendeliane.
6
POLIMORFISMI DEL DNA E LORO APPLICAZIONI ALLA GENETICA CLINICA
Definizione di POLIMORFISMO: un polimorfismo è definito dalla presenza in una popolazione di
una o più varianti (alleli) di un gene. Per essere definite polimorfismi, queste varianti devono avere
una frequenza nella popolazione di almeno l’1%. I polimorfismi possono essere:
- silenti: non hanno alcun effetto sulla proteina prodotto del gene in cui si trovano (non hanno
effetto fenotipico)
- dovuti a sostituzioni di basi (SNPs)
- dovuti a inserzioni di basi
- dovuti a delezioni di basi
- dovuti a ripetizioni in tandem e variazioni nel numero
Storicamente, i polimorfismi considerati erano i gruppi sanguigni, HLA, etc. Ora l’approccio ai
polimorfismi è differente.
RFLP: restriction fragment lenght polimorfism
VNTR: variable number of tandem repetition (minisatelliti, microsatelliti)
Sono sistemi più lunghi, ma molti più polimorfi, quindi con più alleli e più informativi.
7
RFLP
Ci sono enzimi che tagliano il DNA in determinate regioni specifiche, sequenze dette “palindromi”
(uguali in un senso e nell’altro): per esempio, EcoR1 taglia la sequenza GAATTC
→ endonucleasi che taglia il DNA in presenza della specifica sequenza GAATTC 8riconosce la
sequenza)
Il taglio può essere netto, o può creare due estremità dette “appiccicose”, utili per il clonaggio del
DNA e la biologia molecolare → se una base muta, l’enzima non digerisce più quel tratto,
polimorfismo fa perdere il sito di restrizione → poso analizzare i polimorfismi basandomi sui tagli
effettuati da questi enzimi.
8
Tecnica del Southern Blotting
Riguarda l’analisi del DNA genomico: analizza sequenze tagliate dagli enzimi di restrizione.
DNA dell’individuo viene tagliato dagli enzimi di restrizione; lo si fa migrare su gel di agarosio (i
frammenti si divideranno a seconda della loro lunghezza); viene trasferito il tutto su membrana di
nitrocellulosa utilizzando un sistema di soluzione salina e carta assorbente che trasferisce il DNA;
membrana viene poi ibridata con una sonda che riconosce una sequenza specifica del DNA.
9
A
C
B
1
A
A
C
B
C
B
2
3
Individuo 1: eterozigote
Individuo 2: omozigote per A
Individuo 3. omozigote per B
Prendiamo l’individuo 3: ha la sequenza GAATTC in tre siti di restrizione che viene tagliata da
EcoR1 ed essendo omozigote, facendo la Southern Blot, la sonda (barra rossa nel disegno)
evidenzia che l’individuo è omozigote per un frammento di dimensioni B che indica esattamente
che su entrambi gli alleli ha gli stessi tre siti di restrizione (una sola banda).
L’individuo 2 ha una variante in una delle sequenze GAATTC nel tratto di DNA considerato, che
quindi non è più riconosciuta dall’enzima di restrizione, su entrambi gli alleli (è omozigote per la
variante): facendo la Southern Blot sempre con EcoR1 e utilizzando la stessa sonda, questa mostra
l’omozigosi per un frammento A più lungo dell’individuo 3 (manca un sito di restrizione
intermedio→ una sola banda, ma più pesante).
L’individuo 1 è eterozigote: su un allele, ha la sequenza normale con tre siti di restrizione, mentre
sull’altro ha il polimorfismo, e perciò manca la sequenza di restrizione intermedia.
Facendo la Southern Blot con la solita sonda, trovo sia il frammento A che il frammento B, quindi
l’individuo è eterozigote per questo polimorfismo (due bande).
Questi sono gli RFLP, cioè POLIMORFISMI DI LUNGHEZZA DI FRAMMENTI DI
RESTRIZIONE: noi possiamo dire che 3 è omozigote per la presenza del frammento di restrizione,
che 2 è omozigote per l’assenza del frammento di restrizione e che 1 ha due lunghezze diverse,
quindi è eterozigote.
Con la PCR, si è reso possibile amplificare un tratto di DNA che contiene la sequenza di interesse
per lo studio degli RFLP, senza l’impiego delle settimane di lavoro e delle sonde radioattive
necessarie per la Southern Blot.
10
Es: per fare diagnosi di anemia falciforme
L’anemia a cellule falciformi è una patologia dovuta a una mutazione a livello della sequenza del
gene betaglobinico; in particolare, nella porzione iniziale c’è una sequenza che normalmente è
riconosciuta dall’enzima MST2 (CCTAGG) → nell’anemia falciforme, questa sequenza è mutata
per sostituzione di A con T, quindi non è riconosciuta dall’enzima di restrizione
→ si crea un unico frammento da 1,4kb
RIQUADRO→ soggetto normale presenta solo il frammento dal 1,2kb, il soggetto eterozigote
portatore presenta sia il frammento da 1,2kb che quello da 1,4kb, mentre il soggetto omozigote
malato presenta solo il frammento da 1,4kb.
Quindi, questi polimorfismi possono essere utilizzati non solo per gli studi di linkage, ma anche in
casi per cui la variante che perde o riconosce un sito nuovo di restrizione è una mutazione
responsabile di una malattia genetica, può essere utilizzato questo metodo per la diagnosi di
malattia genetica.
VNRT
Ulteriori passi avanti nello studio dei polimorfismi sono stai fatti con l’analisi dei VNRT,
minisatelliti e microsatelliti.
Sono in numero minore rispetto agli RFLP, ma presentano un numero maggiore di alleli (RFLP
sono sistemi a due soli alleli) e perciò sono più informativi.
Sono ripetizioni di 2,3 o 4 paia di basi in tandem: possono essere ripetuti tre volte, cinque,
sette…etc.
A seconda del numero di ripetizioni, ovviamente, questi frammenti possono essere più o meno
lunghi e possono essere evidenziati tramite scorrimento dell’amplificazione di quel tratto di DNA
su gel di agarosio.
11
RIQUADRO C → segregazione di un microsatellite in una famiglia: il padre ha due alleli molto
distanti tra loro, mentre la madre ha due alleli più vicini sul gel di agarosio. Si nota che i figli
prendono sempre un allele da un genitore e uno dall’altro.
E’ importante negli studi di linkage (di concatenazione) che i marcatori siano informativi, cioè che
si riesca sempre a capire qual è l’allele che un figlio prende da un genitore e quale dall’altro: questo
si può fare se i genitori sono doppi eterozigoti per alleli diversi, perché per esempio
→ entrambi i genitori sono omozigoti 1,1: i figli saranno tutti 1,1, ma non so dire quale hanno
ereditato dal padre e quale dalla madre perché non sono marcatori informativi.
I microsatelliti sono molto polimorfi e vengono usati nella genetica forense, nel riconoscimento di
paternità: questo poiché, analizzando un certo numero di questi microsatelliti, l’impronta genetica
che ne ricaviamo è praticamente unica.
Uno dei microsatelliti più usati è il CA-repeat, che si trova molto spesso nel DNA e viene utilizzato
per l’analisi di segregazione → numero particolare di ripetizioni di CA differenzia i vari genomi.
Oggi è possibile vederli facilmente marcando uno dei primer della PCR con un fluorocromo che
correndo su un sequenziatore automatico il prodotto di PCR permette di distinguere i frammenti di
DNA anche per una differenza di una sola base:
12
Famiglia informativa →
la madre è malata di una patologia dominante
che ha trasmesso al figlio, ma noi non sappiamo
ancora di quale gene si tratti. Però sappiamo
che sta su un determinato cromosoma.
In questa regione dove noi abbiamo mappato il
gene malattia c’è un marcatore polimorfico,
quindi io studio la segregazione di questo
marcatore polimorfico nella famiglia.
Questo è un microsatellite: il padre ha
frammenti di 150 e 154 paia di basi, quindi è
eterozigote in questa regione del DNA che sto
esaminando (i due cromosomi di differenziano
per 4 paia di basi, cioè per due CA-repeat). La madre invece ha due alleli che si differenziano per
sei paia di basi, 140 e 146, quindi per tre CA-repeat.
A questo punto vado a vedere la segregazione nei figli: la prima figlia prende l’allele 154 dal padre
e il 146 dalla madre, la seconda figlia prende il 150 al padre e il 146 dalla madre e il figlio malato
prende l’allele 150 dal padre e 140 dalla madre.
Se questo marcatore polimorfico è strettamente concatenato al gene-malattia, sebbene io non
conosca il gene-malattia o la sua mutazione che causa la malattia, io posso seguire la segregazione
degli alleli a questo determinato polimorfismo per capire chi nella famiglia prende il cromosoma
malattia e quindi svilupperà la patologia.
Cioè → se questo marcatore è molto vicino al gene che determina la malattia in questa donna,
significa che ogni volta che trasmette l’allele con 140 paia di basi di quel marcatore,
automaticamente insieme trasmette anche il gene malato e i figli presenteranno la patologia.
QUESTO E’ IL LINKAGE → eccezione alle leggi di Mendel: a volte qualche esperimento non
rispondeva all’idea della segregazione mendeliana, e lui scartava questi esperimenti → erano
esperimenti dove era avvenuto il linkage, o concatenazione.
La seconda legge di Mendel dice che due caratteri segregano indipendentemente: questo è vero se
due caratteri si trovano su cromosomi diversi oppure sullo stesso cromosoma ma molto distanziati
tra loro. Ma se due caratteri sono molto vicini sullo stesso cromosoma, questi tenderanno a
segregare insieme → LINKAGE.
Più vicini sono due caratteri, più è facile che i due caratteri alla meiosi vadano insieme, cioè è più
facile che non avvenga un crossing over che li divide.
E’ per questo che, pur non conoscendo il gene-malattia ma solo un polimorfismo vicino, posso
studiare la segregazione del microsatellite per determinare la presenza o meno del gene mutato,
perché questi due caratteri segregheranno sempre assieme.
N.B.: il linkage serve per mappare i difetti genetici sul nostro genoma, si parte da questo concetto di
concatenazione per arrivare a identificare la regione genomica nella quale c’è il gene-malattia
SNPs
Sono polimorfismi di un singolo nucleotide → SINGLE NUCLEOTIDE POLYMORPHISM
In alcune sequenze del genoma, almeno nell’1% della popolazione una base è mutata.
Es: CCATTGACTT
CCTTTGACTT
Possono esserci persone omozigoti per la A, per la T o eterozigoti.
13
Questi polimorfismi di un singolo nucleotide sono facilmente studiabili oggi con i sistemi di
microarray etc, sono sicuramente meno informativi dei microsatelliti, ma siccome sono in numero
molto maggiore, se ne studiamo tantissimi tutti assieme arriviamo ad avere la stessa informazione
che avremmo con meno microsatelliti.
Con il progetto Genoma Umano è stata costruita una mappa di SNPs → dbSNP: SNPdatabase
Racchiude tutti i polimorfismi che sono stati identificati nella sequenza del nostro genoma fino ad
ora (aumentano con l’analisi di nuovi genomi).
Si pensava che ci fossero circa 3 milioni di SNPs, ma ora si è visto che sono più di 4 milioni.
Il database degli SNPs fornirà la cura appropriata al paziente appropriato: se per esempio, testiamo
un farmaco su una popolazione che risponde molto bene alla terapia, mentre un’altra reagisce in
maniera negativa allo stesso farmaco, posso, comparando i diversi SNPs, capire quali sono i
polimorfismi che inducono una buona o una pessima risposta alla terapia presa in considerazione (e
quindi adattare la terapia).
Inoltre, può fornire informazioni sulla suscettibilità o la protezione verso malattie multifattoriali.
LINKAGE EQUILIBRIUM: indica una combinazione casuale di alleli a loci associati.
Consideriamo per esempio il caso di due loci associati 1 e 2 con 2 possibili alleli ciascuno (A e a
per il locus 1 e B e b per il locus 2) Gli aplotipi possibili in una determinata popolazione (AB, Ab,
aB, ab) si verificheranno con una frequenza che è il prodotto delle frequenze dei singoli alleli per
ciascun aplotipo.
LINKAGE DISEQUILIBRIUM (LD) è un termine dell'ambito genetico che indica la presenza di
associazione statistica tra specifici alleli relativi a due o più loci, che costituiscono di solito un
particolare aplotipo ancestrale, diffuso nella popolazione in cui è rilevato perché trasmesso lungo la
discendenza da un comune progenitore. Per questo motivo il linkage disequilibrium è maggiore in
popolazioni omogenee, cioè originate da un nucleo di individui fondatori come le popolazioni sarda
o finlandese. Infatti le migrazioni recenti generano substruttura ed eterogeneità genetica e aplotipi
differenti associati allo stesso tratto tendono ad abbassare i valori di significatività.
Il linkage disequilibrium è un importante strumento per individuare regioni cromosomiche di
limitata ampiezza in cui si collocano i geni per una data malattia (mappaggio ad alta risoluzione) e
si avvale dell'analisi molecolare di varianti alleliche (per lo più di SNPs o STRs) che costituiscono
aplotipi in pazienti tra loro apparentemente non imparentati. Infatti è prevedibile che pazienti che
hanno ereditato lo stesso segmento cromosomico, definito dal medesimo aplotipo, abbiano ereditato
anche la stessa mutazione in esso contenuto. Risale agli anni '80, il primo gene mappato con questo
approccio: quello della fibrosi cistica in 7q31.2.
14
02/11/2011
ANALISI DI LINKAGE
L’analisi di linkage permette:
- di determinare la posizione cromosomica di un determinato locus responsabile di una
determinata malattia/carattere genetico rispetto a marcatori polimorfici che utilizziamo e la
cui localizzazione è nota
- di seguire nella famiglia la segregazione di un allele contenuto nel tratto di genoma tipizzato
con i marcatori
L’analisi di linkage è un approccio molto utile
1) per il mappaggio e l’identificazione di geni responsabili di malattie genetiche Mendeliane
(oltre 1200 geni identificati)
2) per la diagnosi genetica indiretta (patologie di cui è nota la posizione ma non la sequenza del
gene malattia)
Linkage è un’eccezione alla seconda legge di Mendel:
Incrocio di due caratteristiche: semi gialli e lisci – semi verdi e rugosi
→ ottenne una segregazione di 9 3 3 1, cioè 9 volte su 16 ottenne semi lisci e gialli, 1 volta su 16
ottenne semi verdi e rugosi, ma 3 volte su 16 ottenne semi rugosi gialli e semi lisci verdi.
Da qui derivò il concetto dell’assortimento indipendente dei caratteri (i geni delle due caratteristiche
stavano su cromosomi diversi che potevano riassortirsi in tutte le combinazioni possibili).
Partendo da questo concetto, venne fatto uno studio su soggetti murini: partendo da due linee pure:
15
1)topo normale per un carattere fisico (colore del mantello = C) e per un carattere neurologico
(=Sh);
2)topo albino (colore mantello = c) e con fenotipo neurologico che crea problemi durante l’andatura
(=sh).
Incrociandoli tra loro, si ha una prima generazione doppio eterozigote per entrambi i caratteri, ma
saranno sempre sani perché C e Sh sono dominanti sulle varianti malate: sono portatori per i due
caratteri recessivi.
Incrociando i topi della prima generazione, per la seconda legge di Mendel, mi aspetto 4 tipi di
gameti diversi → C/Sh; C/sh; c/Sh; c/sh , ottenendo la segregazione 9 3 3 1.
I risultati invece furono differenti:
Osservati Attesi
C/Sh 192
146,7
c/Sh 9
48,9
C/sh 3
48,9
c/sh 57
16,3
Praticamente è un rapporto di tre a uno per i topi normali.
I tipi di alleli erano in sostanza due: C/Sh e c/sh, quindi non si formavano quattro tipi di gameti, ma
quasi solo due. Con questa ipotesi, si ottiene la segregazione con rapporto 3:1
C/Sh
c/sh
C/Sh CC/ShSh Cc/Shsh
c/sh Cc/Shsh cc/shsh
Ciò significa che la seconda legge di Mendel vale se i caratteri stanno su cromosomi diversi o
distanti sullo stesso cromosoma, a se questi caratteri sono vicini, è molto probabile che segreghino
assieme durante la meiosi.
Quindi:
L’ANALISI DI LINKAGE SI BASA SULLA CO-SEGREGAZIONE ALLA MEIOSI DI 2 O PIÙ LOCI PIÙ
FREQUENTEMENTE DI QUANTO CI SI ASPETTA PER CASO. SE 2 LOCI VENGONO EREDITATI
INSIEME FREQUENTEMENTE, È PROBABILE CHE SIANO LOCALIZZATI VICINI FRA DI LORO
SULLO STESSO CROMOSOMA
La frazione di ricombinazione non può mai superare il 50%: la frazione di ricombinazione indica il
numero delle meiosi ricombinanti rispetto al numero totale delle meiosi (non ricombinanti +
ricombinanti).
Al massimo, questa può quindi arrivare al 50%: quando due caratteri sono su cromosomi diversi,
possono segregare casualmente al 50%
→ per determinare se c’è concatenazione fra due loci, dobbiamo determinare con che frequenza
ricombinano tra loro, indicata con THETA (θ) che appunto è la frazione di ricombinazione.
Si avrà quindi che:
- se due loci sono su cromosomi diversi segregano indipendentemente. La probabilità che
vengano ereditati insieme è del 1/2 →  = 50% (massima probabilità)
- se due loci sono vicini fra loro sullo stesso cromosoma saranno ereditati insieme più
frequentemente →  < 50%
Tanto più sono vicini i due loci, tanto minore è la probabilità che ricombinino tra di loro: possiamo
arrivare ad avere probabilità = 0 di ricombinazione
→ la frequenza di ricombinazione θ è una misura della distanza genetica.
16
La distanza genetica corrisponde in pratica al numero atteso di crossing-over tra due loci. La sua
unità di misura è il centiMorgan (cM)→ 1cM corrisponde all’1% di ricombinazione, che in termini
di mappa fisica indica una distanza genetica (circa una megabase).
Per valori di θ < 10% c’è grossomodo una corrispondenza tra il centiMorgan e la frazione di
ricombinazione; quando θ > 10% si usano le funzioni di mappa per convertire θ in centiMorgan.
Le frazioni di ricombinazione tra loci distanti non sono additive: per esempio, se su un cromosoma
ho il locus A e il locus B che hanno tra di loro una frazione di ricombinazione pari al 30% e tra il
locus B e il locus C c’è di nuovo il 30% di ricombinazione, non è che tra il locus A e il C c’è il
60%.
A
1
B
1
A
1
B
2
Ricombinaz.
No ricombinaz
A
1
B
1
A
2
B
1
A
1
B
2
Ricombinaz.
No ricombinaz
MEIOSI
NON
INFORMATIVA
MEIOSI
INFORMATIVA
Per capire se c’è concatenazione tra due loci, occorrono due cose:
1- informatività del marcatore: ho un cromosoma con il locus A, un con il locus B e un
secondo locus concatenato a questi (1). I gameti che formerà questo individuo sono A1 o
B1, quindi noi non sappiamo dire se è avvenuta ricombinazione o no. Massima informatività
si ha quando un individuo è doppio eterozigote, come nel secondo caso → posso dire se c’è
stata ricombinazione o no
2- conosco la fase: cioè, conosco la disposizione degli alleli su due loci adiacenti nello stesso
cromosoma. Posso avere anche più di due alleli, posso averne molti: in questo caso, si parla
di APLOTIPO, cioè la disposizione di una serie di alleli in loci adiacenti su di un
cromosoma (vengono ereditati insieme).
Per conoscere la fase, noi dobbiamo avere a disposizione la generazione precedente: di solito si usa
la seconda generazione per ricostruire la fare dei marcatori e da lì in poi si conosce la fase e può
essere calcolata la frazione di ricombinazione
→ occorrono almeno tre generazioni (vedi esempio): la seconda serve per ricostruire la fase.
Per il cromosoma X è più semplice calcolare la fase perché c’è la “regola del nonno”: il nonno
trasmette sempre alle figlie femmine un X non ricombinante → quindi conosco direttamente la fase
17
Esempio:
In questo caso la madre è portatrice per due difetti: il daltonismo e la carenza di glucosio-6-fosfato
deidrogenasi. Genera quattro figli: uno con entrambe le malattie, uno completamente sano e due con
una sola delle due patologie, cioè tra questi ci sono sicuramente due ricombinanti.
Per sapere quali sono, devo andare a studiare qual era la fase del nonno:
- se il nonno presentava tutti e due i caratteri o nessuno dei due caratteri (primo esempio), i
nipoti ricombinanti sono quelli che presentano una sola patologia (la madre riceve di sicuro
il cromosoma non ricombinato);
- se invece il nonno aveva uno dei due caratteri, i ricombinanti sono i due soggetti
completamente sani o con entrambe le patologie.
INFORMATIVITA’
Aa
11
aa
22
Aa
12
NO
Aa
12
aa
12
Aa
12
NO
Aa
12
aa
34
Aa
1 2
aa
12
Aa
14
SI
Aa
22
SI
Nel primo esempio, un individuo è malato di una patologia a carattere dominante (Aa) e la moglie è
sana (aa); il marcatore concatenato che utilizziamo è segnato con i numeri → padre: 1,1; madre 2,2
Questa è una meiosi non informativa, perché non sappiamo se il cromosoma è intero o ricombinato.
Anche il secondo è non informativo, perché sia il padre che la madre hanno gli stessi alleli.
18
Nel terzo caso, la meiosi è informativa perché, essendo la ragazza ammalata omozigote 2,2,
significa che ha preso un allele 2 dal padre e un allele 2 dalla madre: pertanto, dato che noi
conosciamo la fase del padre (devo conoscere la fase della generazione precedente per determinare
la fase), possiamo dire se è ricombinante o no.
Nel quarto esempio, c’è massima informatività poiché i genitori sono doppi eterozigoti.
QUINDI → ciò che faccio con l’analisi di linkage non è altro che andare a stabilire se c’è una
concatenazione tra un marcatore specifico e un locus malattia, tra due caratteri presenti sullo stesso
cromosoma e per stabilire questo devo sapere se c’è stata ricombinazione
La tipizzazione di famiglie ampie ed informative dove segrega una specifica malattia genetica
consente di stabilire se esiste una “concatenazione” tra un marcatore specifico ed il locus malattia.
La base logica di questo metodo è molto semplice ed è dovuta al fatto che in una progenie si
possono osservare due situazioni:
- quella del riassortimento indipendente di due geni (o di un marcatore con un gene);
- quella della concatenazione degli stessi.
Per calcolare l’esistenza di un rapporto di concatenazione si utilizza il sistema del RAPPORTO DI
MASSIMA VEROSIMIGLIANZA o LOD SCORE: i lod score vengono calcolati prendendo in
considerazione una meiosi alla volta e confrontando la probabilità dei genotipi osservati nelle
ipotesi di concatenazione (linkage) o riassortimento indipendente (assenza di linkage).
Si calcolano due probabilità:
1- L0: probabilità che la progenie di quella famiglia sia generata in assenza di concatenazione,
quindi con θ = 50%;
2- L1: probabilità che la stessa progenie sia generata invece in presenza di concatenazione, cioè
con θ < 0,5%
Queste probabilità vengono più esattamente definite come verosimiglianza delle osservazioni
nelle due ipotesi di indipendenza e di linkage.
Ciò che si fa in pratica è calcolare il rapporto di verosimiglianza (L):
L = L1/L0
→ probabilità che la progenie sia generata in presenza di concatenazione rispetto alla probabilità
che quella stessa progenie sia generata in assenza di concatenazione.
e si cerca il valore di θ per cui questo rapporto sia massimo
Siccome poi, per semplicità, si usa il logaritmo in base 10 di verosimiglianza:
Z = log ( L1/L0 )
Il tutto in inglese viene chiamato lod score.
Il valore che da qui si ottiene indica la presenza o meno di concatenazione: la mappatura di una
malattia si ottiene così quando il valore di Z è uguale o superiore a 3, c’è linkage. In effetti questo
valore sta ad indicare che l’ipotesi di concatenazione per un determinato valore di  è 1000 volte
più probabile di quella di indipendenza. Per valori di Z < -2, non c’è linkage; per valori intermedi
non c’è un ipotesi certa, probabilmente quei marcatori non sono veramente informativi (dovrò
analizzare altri marcatori).
19
03/11/2011
Il linkage negli anni è stato necessario per mappare un difetto genetico nel nostro genoma, per
identificare il gene-malattia all’interno di un tratto di cromosoma: questo è fondamentale per
un’analisi diretta di malattia genetica.
Metodi utilizzati nel passato per identificare il gene-malattia:
-
-
-
clonaggio funzionale: alcune informazioni sulla funzione biochimica del prodotto del gene
(es.: malattia data dalla mancanza di un enzima) vengono sfruttate per isolare un clone del
gene. Se il prodotto genico è noto, la parziale purificazione del prodotto può permettere
l’adozione di varie strategie per identificare il gene responsabile. Alternativamente, può
essere usato un saggio funzionale per controllare la presenza del gene. Questo approccio è
stato utile solo in pochi casi;
gene candidato: posso avere un’idea sulla patogenesi molecolare del difetto, come per
esempio nella distrofia muscolare il gene-malattia sarà espresso nel tessuto muscolare;
clonaggio posizionale: isolare il gene conoscendo solo la sua localizzazione
subcromosomica, senza utilizzare alcuna informazione riguardante la patogenesi o la
funzione biochimica. La strategia è di cercare di costruire la mappa fisica e la mappa
genetica della regione, precisare la localizzazione subcromosomica e poi identificare i geni
presenti nella regione per valutarli come possibili geni patologici. Il clonaggio posizionale
rimane arduo e sta diventando sempre meno necessario per l’accumularsi di informazioni
che permettono un approccio posizionale al gene candidato;
gene candidato per posizione: terminato il sequenziamento del genoma umano, una volta
identificato il locus malattia, nei database pubblici erano presenti le sequenze di quel tratto
di genoma con tutti i geni contenuti all’interno e a quel punto si andava a cercare tra questi
quale era il miglior candidato in base a parametri funzionali.
Quindi la localizzazione del locus malattia sul nostro genoma è fondamentale per identificare un
gene-malattia, quindi la “mappatura genetica”: la mappatura genetica si fa con l’analisi di linkage.
→ l’analisi di linkage permette determinare la posizione cromosomica di un locus responsabile di
una determinata malattia/carattere genetico rispetto a marcatori polimorfici la cui localizzazione è
nota.
20
REQUISITI PER L’ANALISI DI LINKAGE DI CARATTERI MENDELIANI
Si prende una grande famiglia con una malattia (oppure famiglie più piccole all’interno delle quali
segrega la stessa malattia genetica) e li caratterizziamo per quei marcatori che sono distribuiti lungo
il nostro genoma (un certo numero di marcatori sul cromosoma 1, un certo numero di marcatori sul
cromosoma 2, etc).
Per fare questo, si utilizzano circa 400-500 microsatelliti, oppure si può arrivare fino a 50000300000 SNPs distribuiti su tutto il genoma (meno informativi, ma in numero maggiore danno
maggiore informatività).
In questi anni sono state costruite mappe dettagliate con tutta una serie di marcatori che sono
distribuiti lungo i vari cromosomi
→ esempio per il cromosoma 20:
Gli individui e le famiglie vengono quindi tipizzati per questi polimorfismi distribuiti lungo tutto il
genoma.
Esempio: locus malattia è sul cromosoma 10.
Se io vado a vedere se i marcatori del cromosoma 1 segregano con la malattia, troverò che c’è una
ricombinazione del 50%, quindi si riassortiscono in maniera casuale perché stanno su cromosomi
diversi; e così tutti i marcatori dei cromosomi 2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 13…etc.
Se io vado a vedere i marcatori del cromosoma 10, finché questi marcatori sono distanti dal locus
malattia, anche questi segregheranno in maniera indipendente, con una frazione di ricombinazione
del 50%. Ma via via che vado a utilizzare marcatori più vicini al locus malattia, vedrò che questi
tendono a segregare insieme: ci saranno frazioni di ricombinazione < al 50%, fino ad arrivare a
marcatori che, essendo strettamente concatenati al gene-malattia, potrebbero avere frazione di
ricombinazione ≈ 0.
Calcolo il lod score di quei marcatori, quei marcatori mi danno lod score >3 e identifico il locus
malattia.
Spesso i dati ricavati da una solo famiglia non sono sufficienti per stabilire presenza /assenza di
linkage. I lod score ottenuti da famiglie indipendenti (per lo stesso valore di ) si possono sommare
fra loro
21
→ esempio:
tetha 0.05 0.1
Fam 1 0.12 0.32
Fam2 -0.16 0.07
Fam3 2.23 2.04
Totale 2.19 2.43
0.2
0.42
0.21
1.63
2.26
0.3
0.36
0.22
1.17
1.75
0.4 R:NR
0.22 0:4
0.14 1:3
0.63 0:8
0.99
Per il secondo marcatore nella tabella, abbiamo l’1% di ricombinazione. Significa che questo
marcatore da il massimo valore di lod score, che ancora però non è positivo: vuol dire che
probabilmente questo marcatore non è strettamente concatenato, ma da un’indicazione che il
marcatore può essere distante circa 1 megabase, cioè 1 centiMorgan dal locus malattia.
A quel punto si utilizzano marcatori più interni per andare a trovare quelli che hanno 0 di
ricombinazione.
Esempio →
Si può calcolare anche il MULTIPOINT LOD SCORE: data una mappa di markers con posizione
nota, si calcola la likelihood (probabilità) per ogni posizione del locus malattia lungo il cromosoma.
Permette di estrarre il massimo dell’informazione data da tutti i markers sul cromosoma.
22
COSTRUZIONE DI APLOTIPI: DEFINIZIONE DELLA REGIONE CRITICA
Famiglia con patologia dominante.
Una volta trovato il marcatore di linkage che da lod score positivo, si utilizzano tutta una serie di
marcatori molto vicini a questo per determinare quindi qual è il tratto di cromosoma che segrega
sempre in tutti gli affetti all’interno di tutti gli affetti → rappresenta la regione minima dove andare
a cercare il locus del gene-malattia.
Si utilizzano marcatori che sono vicini tra di loro sullo stesso cromosoma.
Tutti gli individui malati hanno un aplotipo (riportato in nero) 6 4 3 3 2 3 6 5 → alleli del marcatore
polimorfico!
→ al marcatore D1S2722 gli individui malati hanno l’allele 6
→ al marcatore D1S211 gli individui malati hanno l’allele 4
→ …etc
La porzione in nero rappresenta un tratto di cromosoma che è sempre presente negli ammalati.
Si nota che:
- il secondo individuo della III generazione presenta una ricombinazione a livello dell’ultimo
marcatore considerato (9 invece di 5) ed è affetto: ciò significa che quello è il limite distale
della regione contente il gene-malattia;
- il primo individuo della IV generazione presenta solo i primi 4 marcatori individuati, mentre
gli altri sono ricombinanti e non è affetto dalla patologia: ciò significa che la regione critica
23
si trova obbligatoriamente tra D1S417 e D1S2742 (questa ricombinazione definisce il limite
prossimale della mutazione, mentre l’altra definiva quello distale).
Una volta si sarebbe fatto un piccolo “progetto genoma umano” per analizzare la porzione di DNA
identificata; oggi invece, avendo a disposizione in sequenziamento del genoma umano e, di
conseguenza, la sequenza di quella regione e tutti i geni in essa contenuti che verranno testati per
capire qual è quello che induce la patologia.
Geni identificati con il metodo “candidato per posizione”:
 Morbo di Alzheimer
• precursore della proteina -amiloide, apo-E
 Malattia di Charcot-Marie-Tooth di tipo 1A
• Proteina mielina zero
 Malattia di Charcot-Marie-Tooth di tipo 1B
• Proteina 22 mielina periferica
 Melanoma familiare
• P16
 Cancro del colon non associato a poliposi ereditaria
• hMSH 2, hMLH 1, hPMS 1, hPMS 2
 Ipotermia maligna
• Recettore della rianodina
 Sindrome di Marfan
• Fibrillina
 Neoplasia endocrina multipla di tipo 2A
• Recettore RET della tirosina chinasi
 Retinite pigmentosa
• Periferina e rodopsina
 Sindrome di Waardenburg di tipo 1
• Paired box gene PAX 3
Come si associa un gene malattia ad uno specifico fenotipo?
→ se si ha un fenotipo specifico in vitro (es: coltura di fibroblasti di un soggetto affetto da una
patologia di queste cellule), transfettando all’interno di quei fibroblasti una serie di geni, se la
transfezione di un gene fa sì che i fibroblasti riacquistino il fenotipo normale, significa che è il gene
responsabile della malattia (raramente)
→ si possono costruire modelli animali knock-out per il gene omologo e vedere se il fenotipo che
esprimono corrisponde alla patologia che stiamo studiando (raramente)
→ ricerca di mutazioni causative all’interno di un gene candidato per una specifica malattia
genetica in una coorte di pazienti che presentano quella malattia (metodo in uso)
Esempio:
La sindrome di Fechtner è una patologia molto rara che presenta alcune caratteristiche:
- problemi oculari (spesso cataratta);
- sordità;
- nefrite (che porta a insufficienza renale);
- macrotrombocitopenia (piastrine diminuite di numero ma aumentate di volume);
- inclusione nei PMN, chiamati doll-like bodies.
Ci sono due patologie ematologiche (Anomalia di May-Hegglin e Sindrome di Sebastian) che
hanno alcune di queste caratteristiche: la macrotrombocitopenia e le inclusioni, mentre le altre sono
assenti. Queste due malattie si distinguono per il diverso aspetto delle inclusioni nucleari al
microscopio elettronico.
24
Vi sono poi pazienti che presentano solo la macrotrombocitopenia senza inclusioni, ma
accompagnata da nefrite e sordità → Sindrome di Epstein
Ipotesi: le quattro patologie derivano tutte da un unico cromosoma
→ identificato come il cromosoma 22, si cercano marcatori per determinare la regione critica della
mutazione responsabile
25
Ricombinazioni indicate dalle frecce consentono di delimitare distalmente e prossimalmente la
regione minima: la regione ricavata è molto piccola, circa 480000 bp.
La regione contiene al suo interno solo 9 geni → 9 geni candidati per posizione.
Tra questi nove, solo uno era quello responsabile del fenotipo: il gene MYH9 codifica per la catena
pesante della miosina non muscolare di tipo IIA (NMMHC-IIA) che è espressa in alcuni tessuti
quali piastrine, rene, leucociti e coclea → gene altamente candidato perché espresso nei tessuti
colpiti dalle malattie considerate.
(Altre miosine non convenzionali sono associate a malattie nell’uomo che mostrano sordità o difetti
dell’occhio)
→ trovate mutazioni distribuite prevalentemente in alcuni esoni responsabili dei vari fenotipi.
Lo stesso gene era quindi responsabile delle stesse quattro patologie: le differenze tra i pazienti non
sono altro che variabilità nell’espressione clinica di mutazioni nello stesso gene.
A questo punto è possibile fare una diagnosi diretta di patologia genetica: se ho una famiglia affetta
da una malattia genetica cerco direttamente la mutazione.
EXOME SEQUENCING → nuova tecnologia che consente di sequenziare il genoma di un
individuo solo per le sequenze codificanti (in realtà si arriva a coprire circa il 90% delle porzioni
realmente codificanti): il problema è poi capire tra le varianti che identifichiamo quali sono
responsabili della malattia → analisi bioinformatica
Non partiamo più dalla mappatura, dal locus malattia: qua abbiamo un paziente cui si diagnostica
(non sempre, perché l’analisi bioinformatica è complessa) una patologia tramite il sequenziamento
del solo esoma.
N.B.: ogni base deve essere coperta un certo numero di volte per avere una valenza statistica,
almeno un 50x → significa che ci passo sopra almeno 50 volte per identificare una mutazione a
livello di una singola base (coverage).
Quando si fa l’esoma a un individuo, si trovano circa 20000 varianti: esclusi i vari polimorfismi,
SNPs, esclusi quelli presentati da altri individui, si arriva a circa 160 mutazioni potenzialmente
dannose (possono essere mutazioni silenti, mutazioni di geni recessivi, etc…)
Prima sindrome identificata con questo metodo: Sindrome di Miller, caratterizzata da micrognazia,
palatoschisi, etc.
C’era un solo gene responsabile della patologia, mutato in entrambi gli alleli.
26
04/11/2011
Allele: forma alternativa di un gene ad un determinato locus.
Bisogna vedere le frequenze dei genotipi rispetto ai fenotipi → genetica di popolazione.
Dobbiamo riuscire a calcolare la frequenza di alleli e di genotipi nella popolazione.
La legge che accomuna sia la frequenza genica che la frequenza genotipica è la
LEGGE DI HARDY-WEINBERG: in una popolazione in cui gli incroci sono casuali, gli alleli di
un determinato locus sono all’equilibrio di Hardy-Weinberg.
Questo significa che se l’allele A ha frequenza p e l’allele a ha frequenza q, allora
p+q=1,
cioè i due alleli insieme avranno frequenza del 100% (esempio: se A=80, a=20).
Ma, mischiando tra loro gli alleli, noi arriviamo ai genotipi, perciò avremo:
-
omozigoti AA;
omozigoti aa;
eterozigoti Aa
A a
A AA Aa
a Aa aa
Le frequenze dei genotipi saranno:
- AA = p2
- aa = q2
- Aa = 2pq
Quindi la frequenza dei genotipi non è altro che un quadrato di binomio:
(p + q)2 = 1
2
p + q2 + 2pq = 1
27
Esercizi:
I
II
III
IV
V
(1) Nell’albero riportato l’individuo III3 è affetto da una rara malattia autosomica recessiva letale
nei primi mesi di vita che presenta una frequenza nella popolazione di 1/40.000 nati.
Calcolate la probabilità per la donna V2 di avere un figlio affetto
a) se sposa suo cugino di III grado V1
b) se sposa un individuo della popolazione generale.
Se una persona sposa uno della stessa famiglia, devo calcolare il rischio tenendo conto del fatto che
l’allele segrega all’interno della famiglia, mentre se sposa un estraneo il suo rischio di essere
portatore sarà quello della popolazione generale (legge di Hardy-Weinberg)
Gli individui malati sono 1/40.000 nati e sono individui aa, cioè malattie q2: la frequenza degli
individui malati nella popolazione (q2) è quindi uguale a 1/40.000.
Per prima cosa devo calcolare le probabilità del cugino di essere portatore: i genitori dell’individuo
malato hanno probabilità di essere portatori 100%, perché sono sani e sono genitori di un individuo
malato di patologia recessiva → quindi II1 e II2 sono sicuramente Aa
La sorella sana dell’individuo malato ha probabilità di essere portatrice pari a 2/3.
Il figlio di questa donna, ha probabilità di essere portatore:
2/3 x 1/2 = 1/3
perché lei, essendo Aa, ha un 50% di probabilità (quindi 1/2) di trasmettere l’allele recessivo.
A sua volta, l’individuo V1 ha probabilità d essere portatore:
1/3 x 1/2 = 1/6
Ora devo calcolare la probabilità della donna di essere portatrice.
II2 è per forza portatrice: l’allele a le è stato trasmesso o dalla madre o dal padre e la probabilità che
uno dei due genitori abbia trasmesso l’allele anche al fratello è del 50%, quindi la probabilità di II3
di essere portatore è pari a 1/2, cioè la probabilità che il genitore portatore l’abbia trasmesso anche a
lui.
Quindi, la probabilità dell’individuo III4 è:
1/2 x 1/2 = 1/4 (*)
La probabilità dell’individuo IV4 sarà:
1/4 x 1/2 = 1/8
Perciò la probabilità della donna di essere portatrice per l’allele recessivo sarà:
1/8 x 1/2 = 1/16
In questo caso, essendo i due individui parenti dell’individuo malato, la loro probabilità di essere
portatori viene calcolata in base al loro grado di parentela, senza utilizzare la legge di HardyWeinberg → essendoci già un individuo malato in famiglia, la loro probabilità di essere portatori
sarà molto più alta rispetto a quella della popolazione generale e dipende dal legame di parentela
che hanno con l’individuo ammalato.
28
a) La probabilità che la signora, sposando il cugino di terzo grado, abbia un figlio ammalato è
dunque:
1/6 x 1/16 x 1/2 x 1/2 = 1/384
N.B.: due individui portatori hanno sempre la probabilità di 1/4 di avere un figlio malato.
b) Se invece la signora sposa un individuo della popolazione generale, devo calcolare la frequenza
di eterozigoti portatori nella popolazione (ovviamente escludo i malati e i non portatori) secondo la
legge di Hardy-Weinberg:
1/40000 = q2,
che è la frequenza della patologia nella popolazione (genotipo aa)
Significa che:
q = √1/40000
= 1/200
Posso ricavare p, poiché:
p + q = 1, avrò che p = 1 – q
p = 1 – 1/200
= 199/200
Posso approssimare p a 1 (cosa sempre fattibile quando un allele ha una frequenza molto bassa
come in questo caso -1/200- per velocizzare i calcoli)
Quindi otterremo, essendo i portatori sani Aa, quindi 2pq nell’equazione:
Frequenza eterozigoti nella popolazione = 2(1)(1/200) = 1/100
Quindi, la probabilità che la signora, sposando un individuo della popolazione generale abbia un
figlio malato è:
1/16 x 1/100 x 1/2 x 1/2 = 1/6400
(2) Se un disordine recessivo legato al cromosoma X colpisce una donna su 1.000.000 in una
popolazione, qual è la frequenza attesa dei maschi affetti? E quella delle donne portatrici?
N.B.: la donna per essere ammalata in questo caso deve essere per forza omozigote recessiva.
Donne malate → XX = q² (1/1.000.000)
Donne portatrici → XX = 2pq
Donne sane → XX = p²
Uomini sani → XY = p
Uomini malati → XY = q
In una malattia legata al cromosoma X, la frequenza dei maschi ammalati è uguale alla frequenza
dell’allele malattia.
q² = 1/1.000.000 → q = 1/1.000
Essendo l’allele q molto raro, posso considerare p = 1
(Sarebbe 999/1.000)
29
Così ora possiamo calcolare sia i maschi ammalati che le femmine portatrici.
I maschi ammalati non sono altro che la frequenza dell’allele malattia, perciò
1/1.000
Mentre le femmine portatrici sono:
2pq = 2 x 1 x 1/1.000 = 1/500
TEST GENETICO
Definizione: analisi di DNA, RNA, cromosomi, proteine o particolari metaboliti al fine di rilevare, a
fini clinici, genotipi, mutazioni, fenotipi o cariotipi correlati a malattie ereditarie
I test genetici vengono fatti per:
- conferma diagnostica di una malattia (chiarisce il sospetto clinico);
- identificare un individuo portatore sano per una patologia ereditaria;
- diagnosi prenatale di malattie ereditarie;
- diagnosi presintomatica di malattie ereditarie;
- riconoscere la suscettibilità per patologie complesse
(*) In casi come questo, non tengo conto della possibilità che anche la madre dell’individuo III4 sia
casualmente portatrice sana, perché in casi come questo, quando un patologia è molto rara, il
risultato cambierebbe di poco:
1/4 + 1/100 = 26/100 che è molto vicino a 1/4
N.B.: in questo caso devo sommare perché i due eventi che considero, e cioè che abbia ereditato
l’allele a dalla madre o dal padre, si escludono l’un l’altro, dal momento che al massimo l’individuo
può essere portatore.
30
08/11/2011
Tipi di test diagnostici:
 Test diagnostico: in presenza di un sospetto clinico di una malattia, permette di
confermarne o precisarne la diagnosi
 Test presintomatico: in una famiglia con un difetto genetico noto per una patologia a
insorgenza tardiva, permette di identificare i portatori prima dell’esordio della malattia
conclamata
 Test predittivo: in una famiglia con un difetto genetico noto che conferisce suscettibilità
a una malattia, permette di identificare i soggetti a rischio
 Test prenatale: fornisce informazioni sullo stato genetico del nascituro
Biopsia dei villi corionici e amniocentesi: la biopsia dei villi non è altro che una biopsia della
placenta, mentre nell’amniocentesi si preleva una certa quantità di liquido amniotico.
Dal prelievo dei villi, si ha subito un cariotipo mettendo a crescere le cellule e osservando la
metafase si ha una risposta in 3/4 giorni e poi vengono messi in coltura e dopo una decina di giorni
posso fare l’analisi diretta sul DNA.
Gli amniociti vanno messi per forza in coltura e abbiamo una risposta dopo circa due settimane.
La villocentesi si fa intorno all’11esima settimana, mentre l’amniocentesi intorno alla 16esima.
Da entrambe si verifica il cariotipo fetale, ma la villocentesi da più facilmente falsi positivi (0,61%), poiché una mutazione post-zigotica, che interviene dopo la formazione dello zigote, può
ancora interessare la placenta e non andare a interessare il feto.
La diagnosi molecolare può essere:
- DIRETTA: quando la sequenza del gene è nota andiamo direttamente a verificare la
sequenza del gene rispetto a quella di riferimento per identificare una mutazione nel gene
che causa malfunzionamento del suo prodotto;
- INDIRETTA: la sequenza del gene non è nota, ma è nota la sua posizione nel genoma, si fa
la diagnosi tramite l’analisi del linkage.
Mentre nella diagnosi diretta è sufficiente un campione di DNA del paziente, in quella indiretta
devo avere a disposizione campioni di tutta la famiglia allargata, sia individui sani che ammalati o
portatori, per poter seguire la segregazione: quindi è sicuramente più indaginosa e a volte non è
informativa.
Esempio: famiglia dove segrega una malattia autosomica dominante: la coppia ha già avuto figli
ammalati, chiede il rischio di un altro figlio malato  è del 50 %
Però possiamo analizzare la famiglia e, una volta individuata la mutazione, si può verificare se
l’allele malato è stato trasmesso dal genitore al feto con certezza del 100%.
31
Caso particolare: signora che si è sposata due volte, era ammalata, aveva una sorella ammalata e ha
avuto un figlio malato.
Malattia di Cowden  l’individuo III1 presenta poliposi iperplastica del colon, lesioni cutanee
verrucose, gozzo, obesità, macrocefalia e sordità, mentre la madre presentava polipi rettali,
carcinoma colonrettale, carcinoma della mammella, macrocefalia, obesità, fibromatosi uterina.
Si tratta quindi di una forma di malattia di Cowden, malattia autosomica dominante per cui ci sono
dei criteri per fare la diagnosi clinica che non sempre sono presenti in toto nell’individuo malato
 criteri maggiori per la diagnosi:
- carcinoma mammario
- carcinoma tiroideo (non midollare)
- macrocefalia
- carcinoma endometriale
 criteri minori:
-
lesioni tiroidee benigne
ritardo mentale
polipi amartomatosi intestinali
mastopatia fibrocistica
lipomi
fibromi
malformazioni e tumori urogenitali
fibromatosi uterina
 criteri patognomonici per la diagnosi:
- malattia di Lhermitte-Duclos (gangliocitoma displastico del cervelletto)
- trichilemmomi (tumore benigno della cute che origina nella parte inferiore della guaina
esterna della radice pilifera)
- cheratosi acrale
- papillomi cutanei
- papillomi mucosi
Identificata delezione di una base che determina presenza di un codone di stop prematuro nel gene
PTEN  da qui ora ho la possibilità di effettuare la diagnosi diretta sugli altri individui
appartenenti alla stessa famiglia.
32
Signora con carcinoma midollare della tiroide la cui madre è stata operata a sua volta di carcinoma
della tiroide chiede rischio per i figli di sviluppare la medesima malattia
 MEN2A(autosomica dominante): sindrome da neoplasie endocrine multiple di tipo 2° (oppure
anche carcinoma familiare midollare della tiroide)
Dovuta a mutazione del gene del recettore tirosin-kinasi RET: mutazioni a livello di alcune cisteine
nel dominio transmembrana/intracellulare.
E’ uno dei pochi casi in cui viene fatta la diagnosi presintomatica anche su minore, perché in questo
caso di può togliere la tiroide e dare la terapia sostitutiva, evitando in questo modo l’insorgenza del
tumore nei bambini.
Quindi, in questo caso, non mi limito a dire che c’è la probabilità del 50% di averlo trasmesso:
faccio diagnosi presintomatica e, nel caso, intervengo.
Aa
Aa
aa AA
Aa
aa
Carattere autosomico recessivo: in questo caso, è importante, oltre alla diagnosi, stabilire con
esattezza chi di questi individui è realmente portatore (partendo dal rischio di 2/3).
Esempio: FIBROSI CISTICA
Determinata da gene molto grande, con moltissime mutazioni possibili, più di mille descritte.
Si fa lo screening per le mutazioni più frequenti, che coprono circa l’80%, mentre l’analisi
dell’intero gene arriva al 98% di sensibilità. In questo modo riduco moltissimo il rischio che
l’individuo abbia la mutazione, ma non lo posso mai annullare completamente.
Una coppia senza storia familiare ha a priori il rischio di 1/3000 che è il rischio della popolazione
generale: se si fa il test a entrambi i genitori e risulta negativo per entrambi, il rischio passa a
1/40.000, se uno dei due è positivo, il rischio passa a circa 1/370, e in questo caso si può estendere
l’analisi nel gene dell’altro genitore per abbassare ulteriormente il rischio, se invece risultano
entrambi positivi per una o più delle mutazioni più frequenti, allora il loro rischio sarà del 25% (si
fa diagnosi prenatale  più accurata di amniocentesi o villocentesi, perché qui ricerco direttamente
una mutazione, mentre con le altre due posso individuare un’alterazione e non sapere se l’individuo
è affetto o portatore eterozigote).
33
Carattere legato all’X
E’ importante stabilire quali sono le femmine portatrici di un difetto legato al cromosoma x: è
portatrice obbligata quando il padre è ammalato e quando ha almeno un fratello e un figlio con lo
stesso difetto, ma in tutti gli altri casi non lo sappiamo.
L’individuo II2 è sicuramente portatrice per la distrofia muscolare di Duchenne: devo sapere se
anche l’individuo III1 è portatore.
In questo caso, è fondamentale conoscere lo stato di portatrice della ragazza sorella di un individuo
malato: il test che viene eseguito e molto veloce, perché il gene della distrofina è molto grande e
presenta spesso ampie delezioni
 tecnica Multiplex PCR Deletion: permette di identificare delezioni di alcune porzioni del gene.
Nella stessa provetta vengono amplificati più esoni di lunghezza diversa dello stesso gene
contemporaneamente: i più piccoli migreranno più velocemente e i più grandi più lentamente sul
supporto di gel di agarosio fino ad avere il pattern di migrazione della distrofina (primo individuo di
controllo è normale).
Il secondo individuo presenta delezione dell’esone A, mentre il terzo ha delezione degli esoni A e C
e il quarto ha deleto l’esone C  diagnosi rapida
Nella diagnosi negli uomini è semplice, perché hanno una X sola e quindi le delezioni si vedono
subito perché l’esone non c’è del tutto.
Nelle donne invece, anche se sono portatrici, l’altro cromosoma X sarà indenne e quindi avrà
sempre una banda per ogni esone  PCR quantitative permettono di determinare se
l’amplificazione deriva da due alleli o da uno solo; oppure con la diagnosi indiretta si può
determinare se ha ricevuto dalla madre lo stesso cromosoma malato del fratello.
34
Caso clinico:
Genitori sani, non consanguinei
Prima figlia deceduta dopo 6 giorni di vita per insufficienza renale (rene policistico)
Seconda gravidanza interrotta alla 20 settimana per presenza di reni iperecogeni.
RENE POLICISTICO: malattia ereditaria caratterizzata dallo sviluppo di cisti nei dotti collettori.
Spesso si associa ad un coinvolgimento epatico. Colpisce 1/40.000 bambini, mentre la prevalenza
nella popolazione generale è 1/85.000.
Patologia grave: la forma dell’adulto, autosomica dominante, insorge intorno ai 30 anni, mentre le
forme recessive più gravi sono a insorgenza a livello prenatale.
L'ecografia prenatale evidenzia reni iperecogeni, dilatati e, nei casi più gravi, oligoidramnios
(condizione patologica propria della gravidanza, caratterizzata dalla diminuzione del liquido
amniotico al di sotto di 500 ml). L'insufficienza renale costituisce la maggiore complicazione.
Dopo la nascita, oltre alla nefromegalia, sono comuni e spesso gravi l'ipertensione arteriosa e le
infezioni delle vie urinarie. Il coinvolgimento epatico può decorrere in maniera asintomatica o può
manifestarsi con ipertensione portale e infezioni del dotto biliare, con la presenza di colangiti. La
funzione epatica si mantiene normale. Il trattamento dell'insufficienza renale terminale consiste
nella dialisi e nel trapianto renale.
Il gene responsabile di questa forma recessiva è PKHD1 (mappa sul braccio corto del cromosoma 6
e contiene più di 80 esoni e codifica per una proteina, la fibrocistina o poliduttina), trovato in uno
dei due genitori, nella madre non so qual è la mutazione.
Genitori e feto (secondo) sono stati tipizzati con una serie di marcatori sul cromosoma 6:
35
Il marcatore D6S1714 non è informativo, perché entrambi i genitori sono omozigoti per l’allele da
281 basi: tuttavia, la serie degli altri marcatori identificava i due cromosomi (in rosso) che la madre
e il padre avevano trasmesso a feto malato, perciò la combinazione di quei due cromosomi produce
la malattia.
In una terza gravidanza, si ricerca sia la mutazione di origine paterna (se manca il feto è
sicuramente sano), sia la tipizzazione con gli stessi marcatori:
Il padre aveva trasmesso la mutazione, ma questa volta la madre aveva trasmesso il cromosoma
sano (cioè non quello delle precedenti gravidanze), segnato in nero: il feto è sano.
 combinazione di diagnosi diretta e indiretta: la sola diagnosi diretta in questo caso non disponeva
di entrambe le mutazioni per fare diagnosi certe.
Il quarto feto ha ricevuto di nuovo i due aplotipi malattia e la gravidanza è stata interrotta.
36
ECCEZIONI ALL’EREDITARIETA’ MENDELIANA
Rottura del dogma:
UN GENE
UNA MALATTIA
• ETEROGENEITÀ GENETICA
• SORDITÀ
• Retinite
Pigmentosa
• SERIE ALLELICHE
• PENETRANZA INCOMPLETA
• ESPRESSIVITÀ VARIABILE
• INSORGENZA TARDIVA
• ANTICIPAZIONE
 serie di fenomeni che rendono complessa la situazione durante una consulenza genetica
Esempio:
I
II
III
Due famiglie con genitori sani, in cui i figli presentano una forma di sordità neurosensoriale
congenita: i due figli vogliono sapere qual è la probabilità per loro di aver un figlio malato.
La segregazione nelle due famiglie mostra una patologica autosomica recessiva, quindi la
probabilità dei due individui di avere un figlio ammalato dovrebbe essere del 100%.
 invece hanno 4 figli, tutti che ci sentono perfettamente.
Perché?  STESSO FENOTIPO, DUE GENOTIPI DIVERSI
37
La consulenza non era errata: il 100% sarebbe corretto se i due individui fossero aa
Questi due individui invece hanno un genotipo di questo tipo:
LOCUS A
AA
LOCUS B
bb
LOCUS A
aa
LOCUS B
BB
LOCUS A
Aa
LOCUS B
Bb
I figli sono tutti doppi portatori, ma non sono affetti.
I due genitori non sono distinguibili dal punto di vista clinico, ma hanno due genotipi diversi.
Si parla di ETEROGENEITA’ GENETICA  stessa patologia causata da mutazioni in geni
differenti
Oggi questo è la regola: per alcune malattie, l’eterogeneità è talmente elevata che ci sono più di 100
geni responsabili (tra cui le sordità e la retinite pigmentosa).
Sordità  1:1000 nati presenta sordità
In circa 50% di questi pazienti la sordità è dovuta a mutazioni in un gene
2/3 presentano una modalità di trasmissione autosomica recessiva
1/3 presentano una modalità di trasmissione autosomica dominante
1-2% sono X-Linked
Esistono forme sindromiche, tuttavia la maggior parte delle sordità a trasmissione autosomica
recessiva sono non sindromiche
Ampia eterogeneità genetica:
>40 loci per le forme recessive
>40 loci per le forme dominanti
diversi loci per le forme X-Linked
Recenti acquisizioni:
67% delle sordità AR non sindromiche sono dovute al locus DFNB1 in 13q11-q12 nelle
popolazioni dell’area mediterranea. La delezione di una G 35(delG) all’interno di una sequenza
contenente 5 G nel gene codificante per la Connessina 26 è stata identificata nell’80% dei pazienti
con sordità al locus DFNB1
38