caricato da common.user1833

Genetica Mendeliana: Ereditarietà e Alberi Genealogici

Genetica dei caratteri mendeliani
Trasmissione ereditaria dei caratteri mendeliani.
 Dominante: ogni tratto o carattere che si esprima nell’ eterozigote, cioè, nel caso di
malattia, in cui sia sufficiente una sola copia del gene difettoso per esprimere il
fenotipo affetto.
 Recessivo: ogni tratto o carattere che si esprima solo nell’ omozigote, cioè, nel caso di
malattia, in cui entrambe le copie del gene difettoso devono essere presenti per
esprimere un fenotipo affetto.
 Codominante: nel caso in cui lo stato eterozigote esprima un fenotipo distinto da
quello dei due stati omozigoti, per es. gruppi sanguigni, enzimi eritrocitari, etc.
Malattie ereditarie dominanti sono causate da:
 Mutazioni che inducono un eccesso di funzione.
La mutazione produce una proteina con funzione o espressione alterata, nella
maggior parte dei casi una sovra-espressione o una espressione scorretta (nel tessuto
o nello stadio di sviluppo sbagliati) della proteina.
Per es. nella malattia di Charcot-Marie-Tooth (17p11.2), una duplicazione errata di 1.5
Mb di DNA (3 copie) sovraesprime la proteina della mielina periferica (PMP22),
causando neuropatia periferica.
 Insufficienza del corredo aploide (aploinsufficienza).
La riduzione di una copia del gene (50% ) è dannosa. Per esempio l’
ipercolesterolemia, dovuta ad una mutazione nel recettore della lipoproteina a bassa
densità (LDL), genera una diminuzione dei livelli di recettore per cui circa il doppio di
colesterolo rimane in circolo: ciò comporta un rischio maggiore di patologie
cardiovascolari.
 Mutazioni dominanti negative.
Si tratta di mutazioni che generano un prodotto proteico che non solo non funziona,
ma anche inibisce o interferisce con la funzione delle proteine normali, tipicamente
proteine multimeriche. Un esempio è l’ Osteogenesis Imperfecta.
Malattie ereditarie recessive in genere sono causate da:
 Mutazioni che inducono una perdita di funzione.
In questo caso gli eterozigoti (portatori) sono normali, una riduzione del prodotto
proteico del 50% viene tollerato se il rimanente 50% è sufficiente per una funzione
normale. Un esempio è il tratto falcemico, βA βS: gli omozigoti sono affetti perché non
viene prodotta proteina o quella che è prodotta non funziona normalmente.
Mutazioni diverse a carico di uno stesso gene possono provocare perdita o acquisizione
di funzione. È il caso del gene PAX3 che codifica per un fattore trascrizionale che regola
lo sviluppo dei melanociti. Mutazioni con perdita di funzione determinano la Sindrome di
Waardenberg, ovvero difetti di pigmentazione cutanea e sordità. Mutazioni con
acquisizione di funzione sono invece oncogene.
Lo studio dei caratteri mendeliani nell’uomo viene effettuato attraverso lo studio dei
pedigree. Il PEDIGREE o ALBERO GENEALOGICO è sostanzialmente una figura che
rappresenta in modo schematico individui con almeno un ascendente in comune, i loro
discendenti, i loro coniugi e le relazioni di parentela che intercorrono tra di essi. Dal
pedigree la trasmissione ereditaria di un carattere può essere seguita per numerose
generazioni.
Usando i principi di Mendel l’informazione del pedigree può essere analizzata per
determinare se il carattere ha una modalità di trasmissione dominante, recessiva, se il
gene in esame è localizzato su un cromosoma autosomico o sessuale.
Le principali modalità di trasmissione di un carattere mendeliano sono:
 autosomica dominante
 autosomica recessiva
 X-linked dominante
 X-linked recessiva
 Y-linked
 Mitocondriale
Caratteristiche della trasmissione ereditaria di un carattere autosomico dominante.
1. la frequenza del carattere è uguale in entrambi i sessi.
2. il carattere si manifesta in ogni generazione (trasmissione verticale).
3. ogni individuo affetto ha un genitore affetto e genitori non affetti non trasmettono il
carattere ai loro figli.
4. da un incrocio tra un individuo affetto (eterozigote) e uno normale (omozigote
recessivo) nasce un figlio affetto con una probabilità del 50%.
Caratteristiche della trasmissione ereditaria di un carattere autosomico recessivo.
1. la frequenza del carattere è uguale in entrambi i sessi.
2. il carattere può "saltare" una o più generazioni; trasmissione orizzontale.
3. nella maggior parte dei casi, un individuo affetto non ha genitori affetti (i genitori sono
eterozigoti).
4. da un incrocio tra individui eterozigoti nasce un figlio affetto con una probabilità del
25%.
5. la probabilità che genitori che non presentano il carattere generino un figlio che lo
manifesta è aumentata nel caso di matrimoni tra consanguinei.
Caratteristiche della trasmissione ereditaria di un carattere legato al sesso recessivo.
1. la frequenza del carattere è diversa nei due sessi; il carattere si manifesta quasi
esclusivamente nei maschi.
2. i maschi affetti in genere nascono da genitori che non manifestano il carattere; la
madre è in genere una portatrice asintomatica e può avere parenti maschi affetti.
3. le femmine sono affette, se il padre è affetto e la madre è una portatrice.
4. non vi è una trasmissione da maschio a maschio.
Caratteristiche della trasmissione ereditaria di un carattere legato al sesso dominante.
1. il carattere si manifesta in entrambi i sessi, ma è più frequente nelle femmine che nei
maschi
2. tutte le figlie femmine di un maschio affetto sono affette, mentre nessuno dei suoi figli
maschi è affetto
3. il figlio di una femmina affetta, indipendentemente dal sesso (se maschio o femmina)
ha il 50% di probabilità di essere affetto
Albero genealogico di un carattere legato al cromosoma Y
1. caratteri presenti solo nei maschi e trasmessi da padre a figlio.
2. ogni carattere legato a Y si esprime
3. poco più di 30 caratteri sono stati identificati (SRY necessaria per la determinazione
sessuale primaria)
Eredità non mendeliana.
Complicazioni negli alberi genealogici possono essere rappresentate da:
 Elevata frequenza dell’allele recessivo.
 Concepimento di maschi abortiti, nel caso di patologia X-linked dominante.
 Consanguineità, nell’analisi di patologia recessiva X-linked.
 Presenza di una nuova mutazione: nessuno dei genitori porta la mutazione; essa si
verifica in uno dei gameti che dà origine all’individuo affetto. Questo sembra essere il
caso di forme gravi di OI, che non sono generalmente compatibili con la riproduzione.
In questo caso il rischio di avere un altro figlio affetto e praticamente nullo, a meno
che non si tratti di mosaicismo.
 Mosaicismo somatico e/o della linea germinale: un individuo è un mosaico genetico
quando possiede due o più linee cellulari geneticamente differenti, che derivano tutte
da un unico zigote. Distinguiamo un mosaicismo “somatico” (la mutazione si verifica
nello zigote o nelle prime fasi dello sviluppo embrionale) da un mosaicismo
“germinale” (la mutazione avviene nello stadio germinale): quest’ultimo comporta un
maggiore rischio di avere un figlio affetto.
Più precocemente insorge la mutazione maggiore e il numero di cellule mutate. Esiste
un rischio di trasmissione della malattia, anche se non quantizzabile. Questo sembra
spiegare casi di famiglie con più di un figlio affetto, ma con genitori sani e non
portatori della mutazione (se nota).
 La penetranza indica la probabilità che un individuo che presenta la mutazione a
livello genotipico manifesti il carattere a livello fenotipico. La penetranza è, dunque, la
percentuale di individui che hanno il genotipo-malattia e che sono affetti.
Affermare che una malattia genetica è a penetranza incompleta equivale a dire che
esiste una certa quota di individui che non manifestano la malattia pur avendo il
genotipo-malattia: la malattia si manifesta in una proporzione di figli affetti minore di
quella attesa dalle proporzioni mendeliane. Si esprime in termini di percentuale. La
penetranza incompleta è una caratteristica maggiormente frequente nelle malattie
AD.
 L’espressività variabile si verifica quando individui portatori dello stesso allele malattia
presentano caratteristiche cliniche e gravità diverse: esprime, dunque, il grado di
gravità con cui si manifesta il fenotipo, fra individui che presentano lo stesso fenotipio.
Per le malattie X-linked l’espressività variabile, nelle femmine, può essere
particolarmente accentuata. Questo è dovuto al fenomeno di inattivazione del
cromosoma X.
L’inattivazione del cromosoma X è un processo che determina l’inattivazione selettiva
degli alleli su uno dei due cromosomi X nelle femmine. È anche detta Lyonizzazione:
essa fornisce un meccanismo di compensazione di dose, eliminando le differenze tra i
due sessi nel rapporto atteso tra la dose di geni autosomici (A) e la dose di geni sul
cromosoma X. I maschi, avendo un unico cromosoma X, sono costituzionalmente
emizigoti per i geni sul cromosoma X. Esiste quindi una differenza tra i due sessi nel
rapporto A:X di dose genica (2:1 nei maschi; 1:1 nelle femmine).
Per neutralizzare le differenze tra i sessi nella dose genica A:X, nella maggior parte
delle femmine di mammifero si attua un meccanismo di compensazione: uno dei due
cromosomi X parentali viene inattivato. L’inattivazione dell’X comporta la modifica
della struttura della cromatina, con la produzione di una struttura condensata ed
etero cromatica, il “corpo di Barr”. La maggior parte dei geni sul cromosoma X
inattivato è soggetta ad un meccanismo che li fa diventare trascrizionalmente inattivi.
Inattivando uno dei due cromosomi X parentali, quindi, le femmine dei mammiferi
diventano funzionalmente emizigoti per la maggior parte dei geni associati all’X.
Nelle fasi precoci dello sviluppo femminile, entrambi i cromosomi X sono attivi.
l’inattivazione comincia quando le cellule cominciano a differenziarsi da linee
totipotenti a linee pluripotenti, il che si verifica nella fase avanzata di blastocisti. In
ciascuna cellula che darà origine al feto femminile, uno dei due cromosomi X
parentali viene scelto per essere inattivato; ma la scelta del cromosoma da inattivare
in ciascuna cellula è casuale e quindi cambia da cellula a cellula. Dopo che in una
cellula progenitrice dell’embrione sia stato inattivato il cromosoma paterno o quello
materno, esso di solito resta inattivo in tutta la progenie cellulare che ne deriva, cioè lo
schema di inattivazione del cromosoma X viene ereditato in modo clonale.
Il processo di inattivazione del cromosoma X è complesso. Ad oggi, sono stati definiti
geneticamente due importanti meccanismi:
L’elemento di controllo dell’X (Xce) effettua la scelta tra quale cromosoma X rimanga
attivo e quale venga inattivato.
Il centro di inattivazione dell’X (Xic): è un locus cis-agente da cui parte
l’eterocromatinizzazione che si estende su tutto il cromosoma in entrambe le direzioni.
Se questo locus viene inserito in un autosoma, questo viene inattivato.
La funzione di Xic dipende da XIST (X inactive specific transcript). XIST presenta
espressione monoallelica, infatti è codificato unicamente dal cromosoma X inattivo.
Si tratta di un gene che specifica un trascritto privo di schemi di lettura, quindi un RNA
che non produce proteina (ncRNA), che ricopre il cromosoma inattivo. Si pensa,
quindi, che questo RNA recluti dei fattori proteici che organizzano la cromatina in una
conformazione serrata e inattiva dal punto di vista funzionale, mediante la metilazione
e la de-acetilazione degli istoni.
Esiste un altro gene, chiamato TSIX, che ha l’unita di trascrizione completamente
sovrapposta al gene XIST, ma sul filamento opposto. Questo gene viene espresso nelle
cellule staminali embrionali indifferenziate e nei primi stati embrionali. Ciò ha fatto
nascere l’idea che, all’inizio dell’inattivazione dell’X, TSIX possa controllare in cis
l’espressione di XIST.
 L’anticipazione è un caso particolare di espressività variabile. Consiste nella tendenza
di alcune malattie a trasmissione autosomica dominante a manifestarsi in modo più
grave e precoce nelle generazioni successive rispetto alle precedenti.
 L’influenza isoallelica su fenotipi dominanti con penetranza ridotta o con espressività
variabile. Un fenotipo patologico autosomico dominante può variare anche per
effetto di varianti funzionalmente significative dell’allele selvatico in trans (isoallele).
Alcuni isoalleli possono determinare ridotta penetranza annullando l’allele mutante. Di
conseguenza nella determinazione del fenotipo interviene non solo l’allele trasmesso
dal genitore affetto, ma anche quello proveniente dal genitore sano.
 Eterogeneità genetica. L’eterogeneità di locus è un fenomeno per cui malattie
clinicamente uguali sono dovute a mutazioni in geni diversi. Il fenotipo può essere
molto lontano dal gene e dal suo prodotto primario in quanto esso risulta
dall’interazione di prodotti genici. Uno stesso fenotipo può mostrare tipi di ereditarietà
diversa: questo immediatamente segnala la presenza di più loci. Sono esempi le
alterazioni del collagene di tipo1: ci sono 2 loci dal momento che questo collagene è
formato da un eterotrimero; il fenotipo viene comunque identificato come
Osteogenesi imperfetta.
Un particolare caso di eterogeneità di locus è l’ereditarietà digenica, fenomeno per il
quale il fenotipo dipende da alleli mutanti a due diversi loci. In generale, le interazioni
fra geni coinvolti nell’eredità digenica possono essere classificate in due categorie
principali: 1) eredità digenica con effetto sinergico, in cui i le mutazioni nei due geni
coinvolti agiscono insieme nella determinazione del fenotipo; 2) eredità digenica con
effetto additivo, in cui la mutazione nel primo gene è sufficiente a determinare il
fenotipo, ma la presenza di una mutazione nel secondo gene ne rende le
manifestazioni cliniche più gravi.
L’eterogenetià alleica è un fenomeno per il quale fenotipi diversi possono essere
originati da mutazioni in siti diversi dello stesso gene o da tipi diversi di mutazione. Un
esempio è l’ipercolesterolemia familiare, causata da mutazioni diverse a carico del
gene del recettore per le LDL: sono state identificate mutazioni non senso, inserzioni,
delezioni, etc.
 La pleiotropia si veridica quando un gene si manifesta in una varietà di effetti
fenotipici, anomalie morfologiche, biochimiche, fisiologiche o chimiche multiple. Nelle
sindromi pleiotropiche è difficile identificare una via metabolica mutata per i diversi
fenotipi; un esempio è la sindrome di Marfan.
 L’imprinting genomico consiste in una espressione uniparentale di determinate regioni
geniche, per cui si esprime il gene su uno solo dei due omologhi della coppia. In tutti i
tessuti in cui il gene viene espresso, è repressa drasticamente l’espressione o dell’allele
ereditato dal padre, o di quello ereditato dalla madre, il che determina
un’espressione monoallelica. L’espressione del carattere genetico varia a seconda se
sia stato trasmesso l’allele materno o paterno, per cui dipende dal genitore che li ha
trasmessi.
La genetica di popolazione studia l’ereditarietà di caratteri determinati da uno o pochi
geni in una popolazione mendeliana, ossia un gruppo di individui di una stessa specie in
una data area i cui membri possono accoppiarsi e che quindi condividono un insieme di
alleli (pool genico).
La struttura genetica di una popolazione viene espressa in termini sia di frequenza allelica
che genotipica.
La frequenza genotipica è la proporzione di un dato genotipo nella popolazione.
Per calcolare la frequenza genotipica basta contare gli individui con un certo fenotipo e
dividere per il totale degli individui. La somma dei diversi genotipi deve essere = 1.
E’ più vantaggioso descrivere il pool genico in termini di frequenza degli alleli.
La frequenza allelica è la proporzione relativa di un dato allele in una popolazione.
La Legge di Hardy – Weinberg afferma che in una popolazione panmittica all’equilibrio,
che non presenti selezione, mutazione, migrazione e che sia composta di un numero
elevato di individui, il rapporto tra gli alleli e tra i genotipi è costante da una generazione
all’altra.
Consideriamo una popolazione il cui pool genico contiene gli alleli A e a e indichiamo p
la frequenza dell’allele A e q la frequenza dell’allele a.
La somma degli alleli deve essere:
p+q=1
La loro distribuzione casuale sarà
AA + 2Aa + aa
p2 + 2pq + q2
Dalla legge di Hardy-Weinberg deriva che:
- Le frequenze alleliche non cambiano da una generazione all’altra
- Le frequenze genotipiche all’equilibrio non cambiano
- Le frequenze genotipiche all’equilibrio si raggiungono in una generazione
La verifica delle proporzioni di Hardy-Weinberg richiede:
1. Calcolo delle frequenze genotipiche reali
2. Determinazione delle frequenze genotipiche attese secondo le leggi di HardyWeinberg.
3. Uso del test del 𝜒2 per verificare se lo scostamento dei valori osservati da quelli
attesi è dovuto al solo caso (p>0,05).
L’equlibrio di Hardy-Weinberg è valido solo se:
- La popolazione in esame è infinitamente grande
- Non c’è flusso genico (cioè non c’è movimento di individui fra popolazioni diverse)
- Non c’è mutazione
- L’accoppiamento è casuale - non c’è selezione (i diversi genotipi hanno uguale fitness
per il carattere in esame).
Fattori che influiscono sulla struttura genetica di una popolazione sono:
- Mutazione
- Migrazione (flusso genico)
- Dimensioni della popolazione e deriva genetica casuale
- Selezione
- Sistema di accoppiamento
In assenza di mutazione, migrazione, selezione e deriva genetica le frequenze geniche
rimangono costanti di generazione in generazione e la popolazione si mantiene in uno
stato di equilibrio.
La CONSULENZA GENETICA è un processo informativo attraverso il quale i pazienti affetti
da una malattia geneticamente determinata, o i loro familiari, ricevono informazioni
relative alle caratteristiche della malattia stessa, alle modalità di trasmissione, al rischio di
ricorrenza e alle possibili terapie, incluse le opzioni riproduttive.
Condizione essenziale della consulenza genetica è la “non direttività”, intesa come
capacità del consulente di astenersi dall’esprimere giudizi personali che possano
influenzare la persona nella propria scelta, impedendone l’autonomia decisionale.
La consulenza genetica aiuta le famiglie o i singoli individui a:
- Comprendere i fattori clinici, inclusi la diagnosi, il decorso e le cure disponibili;
- Capire che tipo di ereditarietà ha la patologia in questione e quale sia il rischio che
essa ricorra a chi si rivolge al consulente ed ai loro familiari;
- Capire tutte le possibili alternative direttamente connesse con il rischio di ricorrenza;
- Identificare quei valori, quelle condizioni, quegli obiettivi e quelle relazioni che possono
essere intaccate dal rischio di sviluppare o dalla presenza della malattia;
- Programmare la strategia più appropriata per affrontare il rischio, raggiungere gli
obiettivi prefissati in base ai propri standard;
- Migliorare al massimo il decorso della patologia e ridurre al minimo il rischio di
ricorrenza, o entrambe le cose.
Sebbene la consulenza genetica debba adattarsi alle esigenze dei singoli pazienti, in
generale, un approccio può essere riassunto in diverse fasi:
 Raccolta delle informazioni, tramite la storia familiare e medica del probando. A tal
fine possono essere utili: cartelle cliniche, questionari, test e/o ulteriori accertamenti,
nonché la ricostruzione dell’albero genealogico (deve essere estesa ad almeno tre
generazioni: probando, genitori e nonni).
 Valutazioni, conseguenti alla richiesta di un esame fisico finalizzato a validare o
effettuare una diagnosi, dove possibile.
 Consulenza. È il momento in cui lo specialista in genetica medica comunica al
probando le informazioni ottenute e relative a:
- Natura e conseguenza della patologia
- Rischio di ricorrenza nelle future generazioni
- Disponibilità di ulteriori o futuri test
- Effettuare una scelta
- Riferimento ad altri specialisti, strutture sanitarie, gruppi di supporto.
 Follow-up. consiste nel continuare la valutazione clinica, specialmente se non c’è
diagnosi, facendo eventualmente riferimento ai più indicati gruppi di supporto.
Alcune delle cause più comuni di ricorso alla consulenza genetica comprendono:
- Presenza di un precedente figlio con anomalie congenite multiple, ritardo mentale o
colpito da un difetto congenito.
- Storia familiare di una condizione ereditaria a trasmissione nota (Fibrosi Cistica,
sindrome dell’X fragile).
- Diagnosi prenatale in caso di età avanzata della madre o in presenza di altre
indicazioni.
- Consanguineità.
- Esposizione ad agenti teratogeni, come nel caso di esposizione ad agenti chimici, uso
di farmaci o di alcool.
- Aborti ripetuti o infertilità.
- Anomalie o condizioni genetiche di nuova diagnosi.
- Quando si effettuano test per la suscettibilità a malattie ad insorgenza tardiva.
- Come conseguenza di un test di gravidanza positivo, come nel caso della PKU.
È possibile identificare diverse tipologie di consulenza genetica, a seconda della
differente richiesta del probando:
- Consulenza genetica preconcezionale (prima della gravidanza)
- Consulenza genetica prenatale (patologia fetale)
- Consulenza genetica neonatale
- Consulenza genetica teratologica (esposizione a sostanze teratogene)
- Consulenza genetica in età adulta (patologie mendeliane misconosciute e/o ad
insorgenza tardiva)
- Consulenza genetica in ambito oncologico
- Consulenza genetica associata al test genetico. Per test genetico si intende l’analisi a
scopo clinico di DNA,RNA, cromosomi, proteine, metaboliti o altri prodotti genici per
evidenziare genotipi, mutazioni, fenotipi o cariotipi correlati o meno con patologie
ereditabili umane.
La stima del rischio di ricorrenza è un punto fondamentale della consulenza genetica.
Teoricamente esso rappresenta la probabilità che una data condizione possa comparire
in un parente di un soggetto colpito da quella condizione.
La stima del rischio dedotta con le leggi di Mendel può essere modificata attraverso le
ANALISI DI BAYES, che tengono conto anche di informazioni sulla famiglia che potrebbero
incrementare o ridurre l’entità del rischio mendeliano precedentemente stimato.
Le analisi di Bayes sono, dunque, un metodo che si basa su informazioni fenotipiche del
pedigree per determinare la probabilità relativa che si verifichino due condizioni
alternative mutuamente esclusive.
Si possono calcolare quattro componenti per ciascuna alternativa:
1. Probabilità a priori. È la probabilità iniziale che non tiene conto di complicazioni o di
informazioni supplementari.
2. Probabilità condizionale. È la probabilità di informazioni supplementari rispetto a
ciascuna alternativa.
3. Probabilità congiunta. È il prodotto della probabilità a priori per la probabilità
condizionale.
4. Probabilità a posteriori. È la probabilità relativa che si avveri un’alternativa piuttosto
che un’altra. È data dal rapporto tra la probabilità congiunta di un’alternativa e la
somma delle due probabilità congiunte.
Dai principi di Mendel si evince che due geni si trasmettono ciascuno in modo
indipendente rispetto all’altro se sono localizzati su paia di cromosomi diversi.
Geni per i quali si verificano le previsioni mendeliane sull’assortimento indipendente sono
localizzati su diverse paia di cromosomi e sono definiti GENI INDIPENDENTI.
Geni localizzati sullo stesso cromosoma, sono fisicamente uniti e si definiscono GENI
ASSOCIATI, GENI CONCATENATI o GENI LINKED.
Geni localizzati sullo stesso cromosoma appartengono allo stesso gruppo di
concatenazione.
Consideriamo i geni associati A e B in un doppio eterozigote *. Sono possibili due diverse
configurazioni:
in cis (disposizione degli alleli in
accoppiamento)
in trans (disposizione degli alleli in
repulsione)
* I gameti prodotti dal genitore eterozigote saranno:
½ AB e ½ ab se la configurazione è in cis
½ Ab e ½ aB se la configurazione e in trans
Se i due geni sono completamente associati e quindi sono trasmessi sempre insieme si
parla di Associazione Completa. In realtà, l’associazione completa tra geni situati sullo
stesso cromosoma rappresenta un’eccezione alla norma generale, che prevede invece
una Associazione Incompleta.
Si parla di associazione incompleta quando alleli situati sullo stesso cromosoma si
separano per l’avvento del crossing-over nel tratto di cromosoma compreso tra i due
geni analizzati.
La Meiosi è un meccanismo di divisione
cellulare mediante il quale vengono prodotti
i gameti maschili e femminili (quindi un
corredo cromosomico aploide), a partire da
precursori gametici immaturi con corredo
cromosomico diploide. Consta di due
divisioni:

Meiosi I. Riduzionale che, a partire da
una cellula con 46 cromosomi, ne forma
due con 23 cromosomi, in cui ogni omologo
è rappresentato una sola volta. È preceduta
da una fase S di duplicazione del DNA, per
cui quando la cellula entra in meiosi
possiede 46 cromosomi dicromatidici.

Meiosi II. Equazionale e del tutto simile
alla divisione mitotica; comporta la
separazione dei cromatidi fratelli.
Durante la meiosi se avviene il crossing-over si ha uno scambio fisico reciproco di parti tra i
due cromosomi omologhi (tra cromatidi non fratelli) con la formazione di nuove
combinazioni alleliche (non parentali) dei geni concatenati.
Riconsiderando il doppio eterozigote AaBb, questo produrrà gameti:
AB
Ab
aB
ab
così come si potevano prevedere in base ad un assortimento indipendente dei geni, ma
le % (frequenze) saranno significativamente diverse.
L’ assetto originale degli alleli è detto Combinazione Parentale. Il nuovo assetto,
conseguente al crossing-over, è detto “Combinazione Ricombinante”.
Poiché il crossing-over non è un fenomeno frequente sono di più le meiosi in cui non
avviene il crossing-over rispetto a quelle in cui avviene e per questo motivo prevalgono i
fenotipi parentali, che sommati tra loro sono maggiori del 50%.
Quanto più due loci sullo stesso cromosoma sono distanti, tanto più alta e la probabilità
che si abbia il crossing-over e quindi il conseguente aumento del numero dei
ricombinanti. Su questo principio si basano le MAPPE DI ASSOCIAZIONE o MAPPE GENICHE.
Nelle MAPPE DI CONCATENAZIONE la percentuale di ricombinanti può essere utilizzata
come misura quantitativa della distanza tra 2 geni.
La distanza di mappa tra due geni è misurata in unità di mappa (um). Una u.m. è
l’intervallo entro il quale avviene l’1% di eventi di crossing-over.
Gli incroci genetici forniscono le Frequenze Di Ricombinazione (F.R.): vengono utilizzate
per stimare la distanza di mappa; quindi:
1 um = F.R. dell’1%
Una unità di mappa è la distanza tra 2 geni per i quali viene prodotto 1 ricombinante su
100 (F.R. tra due geni = 1 % corrisponde a 1 unità di mappa).
Le unità di mappa possono essere espresse anche in centiMorgan (cM).
La frequenza di ricombinazione è data da:
𝑁° 𝐹𝐼𝐺𝐿𝐼 𝑅𝐼𝐶𝑂𝑀𝐵𝐼𝑁𝐴𝑁𝑇𝐼
𝐹. 𝑅. =
× 100
𝑁° 𝑇𝑂𝑇𝐴𝐿𝐸 𝐷𝐸𝐼 𝐹𝐼𝐺𝐿𝐼
Esistono molti modi per arrivare all’identificazione di un gene, sia esso patologico o non.
Tutti i percorsi, comunque, passano attraverso un gene candidato, che può essere
identificato con strategie diverse:
 Clonaggio funzionale. Le basi biochimiche della patogenesi sono conosciute e
vengono sfruttate per isolare un clone del gene. Se il prodotto genico è noto, la sua
parziale purificazione può permettere l’adozione di varie strategie per identificare il
gene responsabile. Alternativamente, può essere usato un saggio funzionale per
controllare la presenza del gene.
 Clonaggio posizionale. Il gene viene identificato senza conoscere nient’altro che la
sua localizzazione sub cromosomica. La strategia è di cercare di costruire la mappa
fisica e la mappa genetica della regione, precisare la localizzazione sub cromosomica
e poi identificare i geni presenti nella regione.
 Strategie con gene candidato indipendenti dalla localizzazione. Si può sospettare che
un gene sia responsabile di un dato fenotipo senza sapere nulla della sua
localizzazione cromosomica. Ciò può avvenire se un certo fenotipo assomiglia ad un
altro fenotipo, in animali o esseri umani, per il quale si conosca il gene responsabile o
se la patogenesi molecolare suggerisce che il gene possa essere membro di una
famiglia genica nota.
 Strategie con gene candidato per posizione. Una volta che una patologia sia stata
mappata, è possibile ricorrere alla ricerca nelle banche dati per identificare i geni
candidati. La regione cromosomica del locus viene identificata tramite l’analisi del
linkare studiando una o più famiglie con la malattia.
Si riconoscono essenzialmente due tipologie di approcci sperimentali nell’identificazione
di geni patologici:
1. Genetica diretta (clonaggio funzionale).
Si tratta di un approccio di analisi che permette di risalire dal fenotipo al gene che lo
determina.
Si compone di più fasi:
 Isolamento della molecola mutante;
 Sequenziamento aminoacidico;
 Sintesi di una sonda oligonucleotidica (tenendo in considerazione la
degenerazione del codice genetico);
 Screening di una genoteca genomica o di cDNA;
 Clonaggio molecolare (e conseguente identificazione del gene);
 Analisi di sequenza e di espressione che porta all’identificazione della mutazione.
Questo tipo di approccio è stato impiegato nel 1984 per isolare il gene che codifica
per il fattore VIII della coagulazione, la cui mancanza è causa di Emofilia A. Si è
preceduto, anzitutto, con la purificazione della proteina dal maiale, cui hanno fatto
seguito il sequenziamento aminoacidico e la determinazione della sequenza
nucleotidica. Si è poi passati alla generazione di oligonucleotidi specifici da ibridare
ad una libreria di cDNA. Per ultimo, il clone isolato è stato utilizzato per isolare il gene
umano.
La metodica diretta ha trovato applicazione anche nell’identificazione del gene
betaglobinico implicato nell’insorgenza dell’Anemia falciforme, condizione patologica
caratterizzata dalla produzione di una forma anomala di emoglobina, denominata
emoglobina S. le molecole di emoglobina S tendono ad aggregarsi fra loro formando
globuli rossi con un tipico aspetto “a falce”.
In questa circostanza si è preceduto con:
- Isolamento della molecola mutante da individui con globuli rossi a falce;
- Sequenziamento aminoacidico;
- Identificazione della sostituzione Glu/Val in posizione VI della catena β;
- Generazione di oligonucleotidi specifici da ibridare ad una libreria di cDNA
genomico;
- Isolamento del clone con la sequenza desiderata;
- Mappaggio del gene sul cromosoma.
Altro esempio di applicazione dell’approccio diretto è fornito dall’identificazione dl
gene coinvolto nello sviluppo della Fenilchetonuria (PKU). Si tratta di un disordine
caratterizzato da deficit della Fenilalanina-idrossilasi (PHA), che comporta
l’impossibilità di convertire fenilalanina in tirosina. La fenilalanina tende così ad
accumularsi nel tessuto nervoso o ad essere convertita in acido fenilpiruvico. In questo
caso, la procedura è stata differente:
- Analisi del tessuto;
- Isolamento della proteina;
- Produzione di anticorpi specifici nel coniglio o nel topo;
- Utilizzo di anticorpi diretti contro la proteina come sonda per vagliare
sistematicamente una libreria di cDNA, mediante l’uso di vettori d’espressione.
Una strategia alternativa prevede l’identificazione del gene patologico
conoscendone la sua normale funzione . Si parte da un saggio di complementazione
funzionale, in cui si cercano frammenti di DNA isolati a caso che modifichino una
funzione in un organismo ricevente o in una linea cellulare difettiva.
Si riconoscono diversi sistemi modello:
 Linee cellulari di mammifero. Si impiegano linee deficitarie per una determinata
funzione; le cellule vengono trasdotte con frammenti di DNA umano; si selezionano
le linee in cui la funzione normale è ripristinata.
 Lievito. Si impiegano mutanti funzionali di lievito; per alcune proteine l’omologia di
sequenza lievito/uomo è sufficientemente elevata per cui proteine umane
possono ripristinare funzioni di lievito.
 Topi transgenici. Si incrociano topi portatori di mutazioni con topi transgenici
(portatori di un gene umano) e si valuta quale transgene sia in grado ripristinare la
normale funzione nella progenie.
2. Genetica inversa (clonaggio posizionale).
Ad oggi si contano circa 1200 patologie mappate mediante clonaggio posizionale. La
strategia è di cercare di costruire la mappa fisica e la mappa genetica della regione,
precisare la localizzazione sub cromosomica e poi identificare i geni presenti nella
regione.
Distinguiamo:
 Mappaggio fisico. Localizza i geni sui cromosomi; la distanza fisica tra i geni è
espressa come “coppie di basi”, bp. Ve ne sono di due tipi:
- A bassa risoluzione fornisce al gene un’assegnazione cromosomica e/o una
localizzazione in una regione cromosomica (braccio);
- Ad alta risoluzione consente il mappaggio fine (fino al singolo nucleotide) della
regione che contiene il gene e/o l’ordine di mappaggio.
 Mappaggio genetico. Descrive l’ordine dei geni lungo i cromosomi. Le mappe
genetiche sono costruite usando incroci genetici e, nel caso dell’uomo, attraverso
l’analisi dei pedigree o ANALISI DI LINKAGE. Quest’ultima permette di mappare un
gene sulla base dello studio della sua vicinanza ad un altro locus sullo stesso
cromosoma. Le distanze tra i geni sono espresse in centimorgan (cM).
Scopo del mappaggio genetico è, dunque, scoprire con quale frequenza due loci
vengono separati dalla ricombinazione durante la meiosi.
Il LINKAGE è la tendenza di geni o di altre sequenze di DNA in specifici loci a essere
ereditati insieme in conseguenza della loro vicinanza fisica su un singolo cromosoma.
Due geni che mappano sullo stesso cromosoma si dicono “sintenici”. Due geni sintenici
segregherebbero sempre assieme se non esistesse il crossing-over nella prima divisione
meiotica. L’evento di crossing-over da luogo alla formazione di gameti ricombinanti.
Se due loci non sono associati avremo il 50% di gameti non ricombinanti ed il 50% di
gameti ricombinanti per questi due loci. Il crossing-over separerà raramente loci che si
trovano molto vicini sullo stesso cromosoma, in quanto solo un crossing-over localizzato
esattamente nel piccolo spazio che li separa creerà dei ricombinanti. Quindi, gruppi di
alleli di loci contigui tendono ad essere trasmessi in blocco lungo le generazioni di un dato
albero genealogico. Tale blocco di alleli è detto aplotipo.
Più due loci sono distanti, più è probabile che un evento di crossing-over li separi. Si
definisce un valore detto frazione di ricombinazione (θ), che fornisce una misura della
distanza di due loci.
𝑛° 𝑚𝑒𝑖𝑜𝑠𝑖 𝑟𝑖𝑐𝑜𝑚𝑏𝑖𝑛𝑎𝑛𝑡𝑖
𝜃=
𝑛° 𝑚𝑒𝑖𝑜𝑠𝑖 𝑡𝑜𝑡𝑎𝑙𝑖
𝜃 = 0  loci molto vicini (Associati)
𝜃 = 0,5  loci molto lontani o su cromosomi diversi (Assortimento Indipendente)
La frazione di ricombinazione alla meiosi è una misura della distanza genetica.
L’unità di misura è il centimorgan cM, ossia la lunghezza genetica in cui si ha l’ 1% di
ricombinazione (θ=0,01).
Conoscendo la frazione di ricombinazione e sapendo che due loci distanti 1 cM avranno
una frazione di ricombinazione uguale a 0,01, possiamo ricavare la distanza genetica fra
due loci, ricordando che la distanza genetica non e’ uguale alla distanza fisica.
Le mappe fisiche mostrano l’ordine dei loci, corrispondenti a geni e marcatori, lungo il
cromosoma e le loro distanze in chilobasi o in megabasi; le mappe genetiche mostrano il
loro ordine e la probabilità che essi siano separati dalla ricombinazione.
La ricombinazione non è casuale. Il sesso eterogametico ha un numero di chiasmi
inferiore. I chiasmi sono più frequenti nella meiosi femminile.
Grossolanamente 1cM= 1Mb, ma ci possono essere zone di scarsissima ricombinazione
lunghe fino a 5Mb, con una ricombinazione media fra i due sessi inferiore a 0,3 cM per Mb
e viceversa zone con ricombinazione superiore a 3cM per 1Mb (hot spots). La variazione
più estrema è rappresentata dalla regione pseudoautosomica situata all’estremità del
braccio corto dei cromosomi X e Y. Nei maschi avviene un crossing-over obbligatorio
entro questa regione di 2,6Mb, per cui essa risulta lunga 50cM. Per questa ragione:
- Nei maschi 1 cM = 1,o5 Mb
- Nelle femmine 1 cM = 0,70 Mb
Ne consegue che in media 1 cM = 0,88 Mb
Ancora, nei maschi la frequenza di crossing-over è più alta in corrispondenza delle regioni
subtelomeriche rispetto a quelle centromeriche, mentre le regioni centromeriche
presentano ricombinazione nelle femmine.
L’analisi di linkage permette di determinare la posizione cromosomica di un locus
responsabile di una determinata malattia/carattere genetico rispetto a marcatori
polimorfici la cui localizzazione è nota.
locus marcatore
2 loci
locus gene-malattia
fenotipo
L'analisi si basa sulla co-segregazione, alla meiosi, di due o più loci più frequentemente di
quanto ci si aspetti nella segregazione indipendente. Se due loci vengono
frequentemente ereditati assieme è probabile che siano vicini sullo stesso cromosoma.
Obiettivo dell’analisi di linkage è identificare un segmento di DNA a localizzazione nota,
indicato da tutti i membri affetti della famiglia ma non ereditato dai membri non affetti.
Requisito essenziale è una mappa di marcatori: il marcatore è un qualsiasi carattere
mendeliano polimorfico che possa essere usato per seguire un segmento cromosomico
nelle generazioni in un dato albero genealogico.
Per mappare il gene è necessario conoscere la posizione del marcatore. Vengono
costruite per questo delle mappe genetiche dei marcatori usando un mappaggio
marcatore-marcatore.
Il linkage è un metodo statistico parametrico.
Qualsiasi carattere mendeliano e polimorfico può essere usato come marcatore: e’
meglio che il carattere possa essere individuato facilmente e a basso costo, utilizzando
materiale facilmente reperibile. Per rendere più facile il mappaggio è necessario che i
marcatori siano tanti e quanto più possibile vicini fra loro (progetto genoma).
Nei primi anni ’80, i polimorfismi del DNA hanno fornito per la prima volta un gruppo di
marcatori sufficientemente numerosi e spaziati lungo tutto il genoma.
Il Polimorfismo è definito come la presenza, nella popolazione, con frequenza maggiore
all'1%, di 2 o più forme (“alleli” o “varianti”) di un gene o di una data sequenza di DNA. I
polimorfismi possono essere silenti, ovvero non avere alcun effetto sul fenotipo. Possono
essere dovuti a sostituzione, mutazione, o delezione, di una singola base, o alla variazione
del numero di “ripetizioni tandem”. La maggior parte scompare nel tempo e alcuni si
stabilizzano, per fatti legati al caso oppure si mantiene in seguito a selezione naturale,
perché conferisce vantaggio agli individui che lo presentano. La frequenza di questa
mutazione aumenta e si può fissare nella popolazione. Il gene ancestrale scompare e
rimane il polimorfismo con frequenza superiore all’1%.
Migliaia di siti polimorfici sono stati identificati nell'ambito dell'Human Genome Project.
I polimorfismi usati nello studio delle famiglie affette da malattie genetiche sono:
 RFLP (Restriction Fragments Length Polymorphisms) Gli enzimi di restrizione tagliano il
doppio filamento di DNA a livello di specifiche sequenze palindromiche. Le sequenze
palindromiche possono venire interessate da mutazioni che alterano il sito riconosciuto
dall'enzima per cui alla digestione vengono generati frammenti di lunghezza diversa
da quella canonica. Tramite il Southern Blot (elettroforesi su gel) i frammenti generati
vengono separati in base alla loro lunghezza in bande di migrazione differenti. Gli RFLP
sono sistemi a due alleli (il sito di restrizione può esserci o non esserci).
 VNTR (Variable Number of Tandem Repeats). I microsatelliti sono ripetizioni, in numero
variabile, di 2 – 4 basi che sono sparsi nel genoma. Il numero di ripetizioni è variabile e
quindi questi sistemi sono a più alleli e sono molto informativi; sono utili per le analisi di
linkage e di segregazione. Le sequenze ripetute sono affiancate da sequenze uniche
che permettono l'identificazione delle ripetizioni stesse. I microsatelliti più usati sono i
CArepeats (...CACACACA...). Amplificandoli con la PCR e facendoli scorrere in
elettroforesi otteniamo bande di migrazione diverse in base al numero delle ripetizioni,
cioè in base alla lunghezza del frammento. Attualmente la lunghezza dei frammenti
può essere determinata automaticamente con il sequenziatore. Studiando in una
famiglia un polimorfismo situato vicino al gene di nostro interesse possiamo
determinare il genotipo dell'individuo. Per esempio, se il gene malattia nella madre è
vicino ad una ripetizione di lunghezza nota, e troviamo la stessa lunghezza di
ripetizione nel figlio, vuol dire che il gene della madre è stato ereditato dal figlio.
 SNPs (Single Nucleotide Polymorphisms). Sono variazioni di singole basi e sono sistemi a
2 alleli, ma sono molto frequenti nel genoma (circa 3'000'000 di SNPs). Sono utili per le
analisi di linkage e di segregazione. Il vantaggio degli SNP è che consentono
un’altissima resa di genotipizzazione e presentano un’elevata densità in ogni regione
del genoma; inoltre, possono essere analizzati con metodi automatici. Recentemente
si è formato un consorzio con l'obiettivo di tracciare una mappa degli SNPs per
cercare come le loro variazioni incidano sulla suscettibilità a diverse malattie.
La prima mappa genetica completa del genoma umano si basava sugli RFLP (1987). La
distanza media tra due marcatori è di 10 cM. Mappe genetiche ad alta risoluzione
ottenute mediante l’uso di micro satelliti, con risoluzione 1 cM. Con il Progetto Genoma
Umano sono stati individuati oltre 10.000 marcatori altamente distanziati e polimorfici
(risoluzione < 1cM).
Mappatura genetica a due punti.
1. Raccolta famiglie con diagnosi certa di una specifica malattia il cui locus genico è
ignoto
2. Costruzione degli alberi genealogici di tutte le famiglie
3. Determinazione del genotipo di tutti gli individui per uno o più marcatori polimorfici
4. Se la famiglia è informativa, si classificano gli individui in ricombinanti o non
ricombinanti tra il locus della malattia ed il marcatore analizzato.
Una famiglia è informativa se le meiosi nella suddetta famiglia sono informative. Una
meiosi è informativa, cioè utile per gli studi di linkage, quando si può identificare la fase
dei due loci e quindi stabilire se il gamete sia o meno ricombinante.
Perché la meiosi sia informativa il genitore deve essere doppio eterozigote per i due loci.
L’eterozigosità (H) media di un marcatore (la probabilità che una persona presa a caso
nella popolazione risulti eterozigote) è un buon indice di informatività. Se gli alleli del
marcatore A1 A2 A3 hanno frequenze p1 p2 p3 la proporzione di individui eterozigoti è:
𝐻 = 1 − (p1 2  p2 2  p3 2  …pi 2)
La tipizzazione di famiglie ampie ed informative, dove segrega una specifica malattia
genetica, consente di stabilire se esiste una “concatenazione” tra un marcatore specifico
ed il locus malattia.
L’esistenza di un rapporto di concatenazione viene dimostrata tramite vari metodi, tra cui
quello del rapporto di massima verosimiglianza (o metodo dei lod score).
Il metodo del Lod Score calcola l'indice Z, che è un rapporto tra la probabilità H0 che la
progenie di quella famiglia sia ottenuta in assenza di concatenazione ( = 0.5) e la
probabilità H1 che la stessa progenie si sia generata in presenza di concatenazione
(0 <  < 0.5). Queste probabilità vengono più esattamente definite come verosimiglianza
delle osservazioni nelle due ipotesi di indipendenza e di linkage.
Si calcola quindi il rapporto di verosimiglianza (L =H1/H0 ) e si cerca il valore di θ per cui
tale rapporto risulta massimo. Per semplicità di calcolo si usa il logaritmo in base 10 del
rapporto di verosimiglianza:
Z() = log10 [H()/H( =0.5)]
Le analisi di linkage nell'uomo utilizzano metodi basati sul calcolo della verosimiglianza o
likelihood.
Come si procede per calcolare i LOD score?
1. calcolo della verosimiglianza ‘a posteriori’ ( sulla base del risultato osservato) per una
serie di ipotesi di linkage, cioè di valori di ricombinazione i ;
2. calcolo, per ciascun valore i, dell’ODD ratio (= verosimiglianza dell’ipotesi i /
verosimiglianza dell’ipotesi di indipendenza);
3. calcolo del Logaritmo degli ODD (= LOD).
Le analisi di linkage nell'uomo utilizzano metodi basati sul calcolo della verosimiglianza o
likelihood.
𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡à 𝑐ℎ𝑒 𝑖 𝑙𝑜𝑐𝑖 𝑠𝑖𝑎𝑛𝑜 𝑎𝑠𝑠𝑜𝑐𝑖𝑎𝑡𝑖 𝑎 𝑢𝑛 𝑑𝑎𝑡𝑜 𝜃
LOD SCORE=Z(θ)= 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡à 𝑐ℎ𝑒 𝑖 𝑙𝑜𝑐𝑖 𝑛𝑜𝑛 𝑠𝑖𝑎𝑛𝑜 𝑖𝑛 𝑙𝑖𝑛𝑘𝑎𝑔𝑒 (𝜃=0,5)
Il LOD SCORE è definito come il logaritmo delle probabilità che i loci siano associati (con
frazione di ricombinazione θ) piuttosto che non associati (frazione di ricombinazione 0,5).
Conteggio ricombinanti e calcolo del lod score
PEDIGREE A FASE NOTA
 Modello di ereditarietà: deduco i genotipi per il locus malattia
 La fase è nota
 Individuo i ricombinanti
𝜃𝑅 (1−𝜃)𝑁𝑅 )
)
0,5𝑅+𝑁𝑅
LOD SCORE = Ζ = log10 (
PEDIGREE A FASE NON NOTA
 Modello di ereditarietà: deduco i genotipi per il locus malattia:
 La fase non è nota

Individuo i ricombinanti.
LOD SCORE = Ζ = log10
1
2
𝜃𝑅 (1−𝜃)𝑁𝑅 )
1
)+
0,5𝑅+𝑁𝑅
2
(
𝜃𝑁𝑅 (1−𝜃)𝑅 )
)
0,5𝑅+𝑁𝑅
(
La mappatura di una malattia si ottiene quando il valore di Z e uguale o superiore a 3. In
effetti questo valore sta ad indicare che l’ipotesi di concatenazione per un determinato
valore di θ è 1000 volte più probabile di quella di indipendenza.
Limiti di significativita:
- Z > 3 : evidenza di linkage significativa
- 2<Z<3 : suggestiva evidenza di linkage
- -2<Z<2 : linkage non informativo
- Z < -2 : si può escludere la presenza di linkage.
L’analisi di linkage è meno ambigua se viene effettuata utilizzando famiglie con un
elevato numero di figli e in cui può essere ricavato il genotipo dei membri di almeno tre
generazioni. Presso il CEPH sono state collezionate linee cellulari immortalizzate di membri
di famiglie selezionate in base alla loro struttura ideale per l’analisi di linkage. Le 40
famiglie CEPH comprendono individui di tre generazioni, con i 4 nonni, i 2 genitori e
almeno 6 figli, il cui DNA è a disposizione di tutti i ricercatori per la costruzione di mappe
genetiche. I risultati delle mappe sono disponibili in banca dati ad uso di tutti.
È possibile utilizzare le frequenze di ricombinazione per mappare un consistente numero di
loci, considerandone due alla volta.
Nel caso in cui i dati ricavati da una solo famiglia non siano sufficienti per stabilire la
presenza /assenza di linkage è possibile utilizzare i dati nel loro complesso, in quella che è
nota come analisi di linkage a più punti (Multipoint Lod Score). I lod score ottenuti da
famiglie indipendenti (per lo stesso valore di θ) si possono sommare fra loro : il valore di θ
per cui il Lod Score è massimo è la stima più probabile della frazione di ricombinazione.
Definiamo il Maximum Likelihood Score (MLS) come il valore massimo di lod score che si
ottiene al variare del parametro θ. Data una mappa di markers con posizione nota, si
calcola la likelihood per ogni posizione del locus malattia lungo il cromosoma. Permette di
estrarre il massimo dell’informazione data da tutti i markers sul cromosoma.
Mappaggio di geni malattia mediante l’analisi di linkage
Una delle applicazioni più importanti dell’analisi di linkage è rappresentata dalla
localizzazione sul cromosoma di geni malattia. A tal fine si procede, inizialmente, con
un’analisi di linkage a due punti considerando il locus malattia e una serie di loci
marcatori (considerati uno alla volta).
Nelle famiglie in esame si procede quindi ad analizzare la segregazione degli alleli al locus
marcatore rispetto a quella del fenotipo. Se il locus della malattia e il locus marcatore
sono strettamente associati, verranno trasmessi insieme alla progenie, a meno che
durante la meiosi non siano avvenuti eventi di crossing-over.
L’associazione degli alleli al locus marcatore con il locus malattia prende il nome di
“determinazione della fase”; poiché l’allele al locus marcatore non è responsabile della
malattia, la fase deve essere determinata in ogni singola famiglia.
Per poter calcolare il LOD score a due punti è necessario specificare qual è il modello
genetico della malattia in questione. Le componenti di tale modello sono:
- Il tipo di ereditarietà (dominante o recessiva, associata all’X o autosomica);
- La frequenza dell’allele malattia;
- La penetranza dell’allele malattia;
- La frequenza delle nuove mutazioni al locus malattia;
- La possibile presenza di fenocopie;
- La possibile eterogeneità genetica;
- La frequenza degli alleli al locus marcatore.
Dopo aver delineato il modello genetico, viene effettuata l’analisi statistica per stabilire la
probabilità dell’associazione tra locus marcatore e locus malattia, utilizzando le formule
per il calcolo del LOD score. Una volta identificato un LOD score significativo (Z ≥+3) tra il
locus malattia e un locus marcatore, si ricercano nelle mappe genetiche del cromosoma
implicato altri loci marcatori situati in vicinanza del primo e si tipizzano le famiglie. Si
esegue un’analisi multipoint, in cui la localizzazione del gene malattia viene considerata
in combinazione con tutti gli altri loci testati. In questo tipo di analisi, data una serie di
marcatori di cui sono noti localizzazione, ordine e spaziatura sul cromosoma, viene
determinata la migliore localizzazione del locus malattia in modo sequenziale, mettendolo
in ogni possibile intervallo della mappa genetica della regione precedentemente
individuata.
L’ipotesi di associazione tra il locus malattia e il pannello dei loci marcatori viene poi
confrontata con l’ipotesi di non associazione.
Nella figura è rappresentato il grafico di un analisi di LOD
score multipoint. L’asse delle ascisse rappresenta la
distanza genetica tra marcatori, mentre nell’asse delle
ordinate è indicato il lod score. Il valore massimo di lod
score è -6 e si ottiene tra i loci 3 e 4 e i loci 5 e 6.
Un complemento all’analisi multipoint è rappresentato dallo studio degli aplotipi, ovvero
dell’ordine degli alleli sui rispettivi cromosomi omologhi, che conduce all’identificazione
della regione critica (contenente il locus malattia). Per ricostruire gli aplotipi è necessario
identificare quale allele viene trasmesso nei gameti di ciascun genitore e localizzare gli
eventuali eventi di ricombinazione tra marcatore e marcatore o tra marcatore e malattia.
I metodi di linkage parametrici sono generalmente applicati ai tratti mendeliani; il loro
utilizzo, tuttavia, comporta una serie di limitazioni quali:
- Necessità di specificare un modello genetico esatto per la patologia (penetranza e
frequenze alleliche).
- Problemi con l’eterogeneità di loci (mutazioni su loci differenti possono dare lo stesso
fenotipo patologico); assume l’esistenza di un solo locus.
- Limiti nella risoluzione definitiva raggiungibile (circa 1 Mb).
Offre anche una serie di vantaggi:
- Statisticamente è un approccio molto più potente di ogni altro metodo non
parametrico.
- Utilizza informazioni genotipiche e fenotipiche di ogni membro della famiglia.
- Fornisce una stima della frazione di ricombinazione.
L’equilibrio di HW riguarda il modo in cui i gameti si assortiscono due a due a formare gli
individui, possiamo definirlo quindi un equilibrio diploide. L’altro importante equilibrio
genetico è un EQUILIBRIO APLOIDE e riguarda il modo con cui alleli di loci diversi
(polimorfici) si assortiscono entro i singoli gameti. Sono entrambi equilibri stabili.
Se in una popolazione i due loci A e B hanno ciascuno due alleli (A1 e A2; B1 e B2), il pool
gametico della popolazione sarà composto da 4 tipi diversi di gameti:
A1B1 A1B2 A2B1 A2B2
Ognuno caratterizzato da specifiche frequenze:
p(A1) = freq. allele A1
p(B1) = freq. allele B1
q(A2) = freq. allele A2
q(B2) = freq. allele B2
Esiste equilibrio aploide quando le frequenze gametiche sono:
fr.(A1B1) = p(A1) x p(B1)
fr.(A1B2) = p(A1) x q(B2)
fr.(A2B1) = q(A2) x p(B1)
fr.(A2B2) = q(A2) x q(B2)
Esiste quindi una sola serie di frequenze che soddisfa la condizione di equilibrio, mentre ne
possiamo immaginare molte che costituiscono condizioni di disequilibrio.
Se i loci A e B sono in disequilibrio, la probabilità di trasmettere un allele ad un locus e un
altro allele all’altro locus A e B non sono indipendenti. Per cui:
fr.(AB)  f(A) x f(B)
Supponiamo che:
locus A
p(A1) = 0.8
locus B
p(B1) = 0.7
le frequenze gametiche all’equilibrio sono:
A1B1 0.8 x 0.7 = 0.56
A1B2 0.8 x 0.3 = 0.24
A2B1 0.2 x 0.7 = 0.14
A2B2 0.2 x 0.3 = 0.06
q(A2) = 0.2
q(B2) = 0.3
gameti
A1B1
A1B2
A2B1
A2B2
freq. attese all’eq.
0.8 x 0.7 = 0.56
0.8 x 0.3 = 0.24
0.2 x 0.7 = 0.14
0.2 x 0.3 = 0.06
freq. osservate
0.65
0.15
0.05
0.15
D(oss – att)
+0.09
-0.09
-0.09
+0.09
Si definisce Disequilibrio (D) la differenza tra le frequenze gametiche osservate e quelle
attese:
D(oss) =  0.09 
D = PA1B1PA2B2  PA1B2PA2B1
Il disequilibrio osservato è grande o piccolo?
Per rispondere a questa domanda dobbiamo confrontare il D osservato con quello
massimo teoricamente possibile in questo sistema, cioè con quello che si avrebbe in caso
di associazione completa tra due alleli e conseguente assenza di una combinazione
gametica.
Esistono due diversi tipi di D(max)
- D(max) I tipo  l’allele meno comune dei 4 (in questo caso A2) sta sempre con l’allele
meno comune dell’altro sito (in questo caso B2), viene a mancare l’assortimento A2B1
(la cui freq all’equilibrio è 0.2 x 0.7 = 0.14). Quindi D(max) I tipo = 0.14
- D(max) II tipo  l’allele meno comune dei 4 (A2) sta sempre con il più comune
dell’altro sito (B1); viene a mancare l’assortimento A2B2 (la cui freq all’equilibrio è 0.2 x
0.3 = 0.06).
Quindi D(max) II tipo = 0.06
In questo caso abbiamo un D di I tipo: l’allele meno comune dei 4 (A2) è associato
preferenzialmente con il meno comune dell’altro sito (B2). Infatti:
f(A2B2) attesa all’equilibrio = 0.06
mentre
f(A2B2) osservata = 0.15
Dobbiamo quindi confrontare il D(oss) con il D(max) di I tipo (= 0.14) e calcolare il
Disequilibrio relativo (D’)
D’ = D(oss)/D(max) = 0.09/0.14 = 0.64
Dove Dmax e il massimo disequilibrio possibile per le frequenze alleliche osservate.
- Se D > 0 allora Dmax = min(PA1 PB2, PA2P B1),
- Se D < 0consideriamo il valore assoluto di D1 e Dmax = min(PA1 PB1; PA2 PB2).
Il D osservato è pari al 64% di quello massimo possibile date queste frequenze. Il
coefficiente D’ fornisce una misura degli eventi di ricombinazione nella regione
genomica.
Altro parametro utilizzato nella valutazione del LD è il coefficiente r2, che tiene conto della
frequenza dei marcatori, risultando migliore di D’:
𝐷2
𝑟2 =
𝑃𝐴1 ∙ 𝑃𝐴2 ∙ 𝑃𝐵1 ∙ 𝑃𝐵2
Quando si studiano due loci polimorfici quanto spesso li si trovano in disequilibrio aploide?
Quasi mai quando i due loci non sono associati; molto spesso, invece, quando i due loci
sono associati e tanto più i loci sono associati tanto più forte è il grado di disequilibrio
osservato.
Quando la causa del disequilibrio gametico è il linkage esso viene indicato con il termine
di Linkage Disequilibrium.
Il LINKAGE DISEQUILIBRIUM è una situazione per cui un particolare aplotipo è
statisticamente più probabile in un sottogruppo di una popolazione. Indica che la
popolazione deriva da un comune ancestore o, nel caso delle mutazioni patogene, che
la mutazione è avvenuta su un cromosoma ancestrale comune alla popolazione.
Mutazioni e ricombinazioni sono i principali fattori che rispettivamente generano e
distruggono il LD. Quando si verifica una mutazione, si genera LD tra il sito mutato e gli
alleli adiacenti. Inizialmente la mutazione sarà associata solo a quei particolari alleli, fino a
quando non interviene la ricombinazione che separa la mutazione dagli alleli a cui era
associata e la congiunge ad altre forme alleliche.
Il livello di LD decresce con il tempo e con la distanza tra i marcatori (frazione di
ricombinazione) secondo la legge:
Dt = (1 - r)t  D0
dove D0 rappresenta il LD al momento di inizio e Dt è il LD dopo t generazioni.
Per loci indipendenti r = 0.5, quindi il Disequilibrio si dimezza ad ogni generazione, sono
cioè sufficienti poche generazioni per raggiungere le frequenze di equilibrio. Quanto più i
loci sono vicini tanto più r è piccolo e quindi sono necessarie parecchie generazioni per il
linkage equilibrium.
Il linkage disequilibrium si può spiegare con l’effetto fondatore: viene mantenuta la stessa
posizione degli alleli presente al momento in cui è avvenuta la mutazione sul cromosoma
ancestrale.
Consideriamo il gene CF:
Linkage equilibrio tra A e
CF (CF può trovarsi sia in
coupling con A1 che con
A2): 50% CF-A1 e 50% CFA2.
Linkage disequilibrio tra
B1 e CF (CF si trova
sempre e solo in coupling
con B1): 100% CF-B1.
Linkage disequilibrium come strumento di mappaggio per geni malattia
Gene della Fibrosi Cistica
La Fibrosi Cistica è una patologia autosomica recessiva, che si caratterizza per
un’eccessiva produzione di secrezioni dense. Si osserva un malassorbimento cronico che
comporta incapacità di crescere normalmente (deficit della secrezione degli enzimi
pancreatici e quindi insufficiente digestione delle proteine e grassi); inoltre, si hanno
frequenti infezioni del tratto respiratorio da semplici raffreddori a polmoniti (ostruzione
delle vie respiratorie minori da parte di un muco denso e loro colonizzazione da parte di
batteri.
Caratteristica è la secrezione di NaCl nel sudore (rappresenta anche un test diagnostico).
Nel 1985 il gene della fibrosi cistica (CF) viene associato ad un polimorfismo proteico
(enzima paraossonasi) di cui si ignora la localizzazione, nediante analisi di linkage.
Per una patologia autosomica recessiva l’analisi di linkage e’ ostacolata dal fatto che
non si conosce la fase, per cui il calcolo si effettua prima considerando che i 2 loci(allele
polimorfico e locus malattia) siano in cis e poi in trans e il valore di lod score sara’ la media
tra i due valori ottenuti.
Nel 1986 furono trovati altri marcatori associati alla CF e il gene della paraossonasi viene
mappato sul cromosoma 7. Tra ognuno di questi marcatori e il gene della CF sono stati
trovati dei ricombinanti; nessuno di questi marcatori è, però, il reale responsabile della CF.
Fu identificata la regione, utilizzando gli RFLP della regione: si restringe la mappatura di CF
alla bande citogenetiche 7q31-32.
Si definirono inoltre i marcatori fiancheggianti, come l’oncogene Met prossimale e il D7S8
(clone anonimo) distale.
Dal 1986 in poi, si identificano altri polimorfismi nella regione e si fonda un consorzio per
cumulare i dati raccolti in più centri. Viene attuato prima il chromosme walking,
successivamente, per ovviare alla brevità delle sonde disponibili, si passò al chromosme
jumping.
Nel 1989, si riesce ad evidenziare la presenza di linkage disequilibrium per i marcatori
XV2.c e KM19 che risulteranno far parte del 5’ del gene . Dai dati ottenuti su 114 famiglie
britanniche con un figlio affetto: Il cromosoma CF è stato identificato perché presente
nell’affetto, il quale tende a portare gli alleli X1 e K2.
una volta clonato il gene putativo, bisogno’ dimostrare che era il gene della fibrosi cistica.
Furono pertanto esaminati gli affetti e si trovo’ che il 70% dei cromosomi CF presentavano
la delezione di una tripletta (ΔF508) senza che venisse alterata la ORF. Il prodotto del
gene e’ stato definito CFTR( cystic fibrosis transmembrane conductance regulator).
La presenza in omozigosi della ΔF508 in individui gravemente affetti non era conclusiva,
anche se molto convincente: la delezione avrebbe potuto essere un polimorfismo come
altri in linkage disequilibrium strettissimo con il gene. L’ identificazione del coinvolgimento
di CFTR nel trasporto dello ione cloro attraverso le membrane apicali e la
caratterizzazione di alcune mutazioni il cui effetto era piu’ evidente sull’espressione del
gene confermarono che CFTR era il gene della Fibrosi Cistica.
Oggi sono state descritte oltre 700 mutazioni nel gene CFTR. Molte vengono definite
mutazioni private, perché individuate in una sola famiglia. In molti casi non è certo che
siano patogene, potrebbero essere sequenze varianti in un cromosoma in cui è presente
un allele CF.
Non ci sono altre mutazioni molto frequenti, sono tutte mutazioni con frequenza che non
supera qualche punto percentuale: in media il 70% degli alleli mutati sono ΔF508; altre 12
mutazioni hanno una frequenza combinata del 15%.
La presenza di centinaia di mutazioni diverse rende molto difficili i test diagnostici per la
CF. Questi consistono in:
- Screening per PCR e successiva amplificazione
- Amplificazione specifica con primer che legano sequenze mutate
La patologia ha una frequenza di 1 affetto su 25000 individui mentre si stima che i portatori
siano 1 su 25.
Difatti, supponendo che la popolazione sia in equilibrio
di HW:
q2 = 1/2500  q=1/50
poiché
p = 1-q = 49/50
la frequenza dell’eterozigote (2pq) è pari a
2pq = 2x49/50x1/50 = 1/25
I genitori portatori hanno, dunque, il 25% di probabilità
di avere un figlio affetto e individui sani con un fratello o
sorella affetto hanno 2/3 di probabilità di essere
portatori.
I portatori di CF sono molto frequenti anche per effetto del vantaggio dell’eterozigote: gli
eterozigoti hanno un vantaggio riproduttivo rispetto agli omozigoti (potrebbe essere
dovuto al fatto che sono maggiormente resistenti alla salmonella tiphi, un batterio che
richiede Cl per crescere e riprodursi e la CF e’ causata da un difetto del canale del Cl).
Altra ipotesi è legata al fatto che gli eterozigoti per CF secernono grandi quantità di
mucopolisaccaridi nel muco polmonare che li rende maggiormente resistenti alle infezioni
batteriche. E ancora, si ritiene che il ridotto flusso d’acqua attraverso la mucosa
intestinale conferisca ali eterozigoti una maggiore capacità di sopravvivenza alle infezioni
intestinali responsabili di diarrea infantile (un tempo frequente causa di morte).
In base al tipo di approccio sperimentale, i metodi usati per la diagnosi molecolare
genetica possono essere distinti in diretti e indiretti.
La “diagnosi indiretta” è l’unico mezzo di indagine molecolare disponibile quando si
conosce solo la localizzazione del locus malattia sul genoma umano. È un tipo di indagine
possibile esclusivamente nei casi familiari (coinvolge infatti l’intera famiglia) e viene
condotta mediante studi di linkage utilizzando marcatori associati alla malattia, di cui
viene seguita la segregazione all’interno della famiglia stessa.
La “diagnosi diretta” è possibile solo dopo l’identificazione del gene malattia: in questo
caso la mutazione responsabile di una patologia viene ricercata e rilevata direttamente
su DNA, RNA o prodotto proteico del probando.
La ricerca diretta di mutazioni può essere effettuata mediante due approcci:
1. Analisi specifica di una mutazione nota. Da un punto di vista metodologico sono stati
approntati diversi metodi di indagine: analisi di restrizione, ASO (Allele Specific
Oligoprobe), ARMS (Amplification Refractory Mutation System), OLA (Oligonucleotide
Ligation Assay).
2. Ricerca aspecifica di mutazione, ignota o nota. Si conoscono differenti approcci
metodologici da usare a seconda delle dimensioni del gene in esame e del numero di
campioni da analizzare: sequenziamento del DNA, tecnica SSCP (Single Straind
Conformation Polymorphism), tecnica DGGE (Denaturing Gradient Electrophoresis),
tecnica DHPLC (Denaturing High Performance Liquid Chromatogrphy).
La scelta del metodo diagnostico per la ricerca di mutazioni dipende da fattori vari
come:
- Dimensione del gene
- Tipi di mutazione
- Eterogeneità allelica
- Materiale biologico disponibile
- Numero di campioni da testare
- Ricerca di mutazioni note o ignote.
 Analisi di restrizione. È operata da enzimi specifici, detti “endonuleasi di restrizione”,
che sono stati isolati da numerosi ceppi batterici. Questi enzimi si legano a una
sequenza di DNA, detta sito di riconoscimento o sito di restrizione, lunga solitamente 48 nucleotidi, e tagliano entrambi i filamenti di DNA.
Se una mutazione puntiforme con sostituzione anche di una sola base crea o abolisce
un sito di restrizione, può essere facilmente individuata ponendo l’amplimero all’azione
dell’enzima. La semplice elettroforesi in gel di agarosio o di poliacrilamide, seguita da
colorazione con bromuro di etidio, permette di visualizzare direttamente la presenza o
l’essenza del sito di restrizione.
Nel caso in cui la mutazione crei un sito di restrizione per uno specifico enzima, questo
taglia il DNA con la mutazione. Il prodotto della PCR viene digerito con l’enzima
appropriato: il frammento corrispondente all’allele mutato viene digerito creando due
frammenti; il frammento corrispondente all’allele normale non verrà diferito in quanto
non possiede il sito di restrizione.
Dopo elettroforesi su gel di agarosio è possibile discriminare il soggetto omozigote
normale (presenza di una banda, per l’assenza del sito di restrizione), dal soggetto
omozigote mutato (presenza di due bande, che testimoniano la digestione su
entrambi i frammenti), dal soggetto eterozigote (presenza di tre bande corrispondenti
al frammento intero e a quello digerito)
Bisogna, infine, effettuare la conta genica, tramite Equilibrio di H-W, per questo
polimorfismo.
L’errore nell’analisi di restrizione può riguardare il soggetto omozigote normale, a
seguito di una digestione enzimatica non eseguita correttamente, oppure può
interessare il soggetto eterozigote.
In quest’ultimo caso, errori nell’esecuzione della digestione enzimatica (carenza di
enzima, corsa elettroforetica lenta, poca tenuta del gel) possono produrre una
digestione parziale che risulta in un eccesso di frequenza dell’eterozigote.
Nel caso in cui la mutazione abolisca un sito di restrizione, il prodotto di PCR viene
digerito con uno specifico enzima:
- il frammento corrispondente all’allele normale verrà tagliato in due frammenti,
- il frammento corrispondente all’allele in cui la mutazione ha abolito il sito di
restrizione non verrà tagliato, producendo un unico frammento.
Dopo elettroforesi su gel di agarosio è possibile discriminare il soggetto omozigote
normale (presenza di 2 bande) dal soggetto omozigote mutato (presenza di una
banda) e dal soggetto eterozigote (presenza di tre bande corrispondenti al
frammento intero e a quello digerito).
 Se la mutazione non altera i siti di restrizione, è possibile inserire artificialmente nel
prodotto di amplificazione un sito di restrizione utilizzando un primer complementare al
sito corrispondente alla mutazione in esame. Tale primer viene modificato nella
sequenza in mood da creare un sito di restrizione nel prodotto normale mentre in
quello mutato il sito non è presente (e viceversa). Nonostante il cattivo appaiamento
indotto utilizzando un primer contenente una base non appaiata correttamente
(mismatch), in condizioni adeguate di stringenza è possibile ottenere il prodotto di
amplificazione: l’allele normale sarà tagliati, quello mutato no lo sarà (e viceversa).
 La tecnica di Ibridazione con oligonucleotidi allele-specifici (ASO probe) permette di
discriminare tra loro alleli che differiscono anche di un solo nucleotide, qualora sia
nota a priori la variazione di sequenza da identificare.
La presenza di una mutazione viene riconosciuta facendo reagire il DNA amplificato
con sonde oligonucleotidiche complementari alla sequenza mutata o normale
(separatamente). Solo in presenza del 100% di omologia tra le sequenze si avrà
l’ibridazione della sonda con il DNA.
La tecnica viene realizzata mediante:
1. Dot blot. Si realizza in più fasi:
Amplificazione del DNA
Denaturazione
Immobilizzazione DNA su filtro di nylon o nitrocellulosa
Aggiunta di oligonucleotidi di sintesi marcati con 32P e complementari alla
sequenza normale e a quella mutata
Ibridazione con la sequenza complementare di DNA
Esposizione del filtro alla lastra radiografica (autoradiografia): se la rezione di
ibridazione è avvenuta si avrà la comparsa di una macchia.
• 1 macchia con oligo mutato indica un omozigote per la mutazione
• 1 macchia con oligo normale indica un soggetto normale
• 2 macchie con oligo normale e mutato indica un eterozigote per la
mutazione
ESEMPIO: Diagnosi prenatale per b-talassemia major.
2. Reverse dot blot. Un esempio è fornito dal test per la rivelazione di mutazioni
β-talassemiche.
Il campione di DNA è amplificato con primers biotinilati. L’amplificato è poi
denaturato chimicamente e ibridato con sonde oligonucleotidiche complementari
alle sequenze normali (N) e mutate (M) per otto diverse mutazioni per la βtalassemia, immobilizzate su pozzetti di una micropiastra . Segue un lavaggio
stringente che rimuove l’amplificato legatosi in modo non specifico alla
membrana. Viene aggiunta streptavidina coniugata con una fosfatasi alcalina,
che si lega ad ogni ibrido biotilinato (amplificato-sonda) formatosi con
l’ibridazione. Dopo lavaggi ripetuti, si aggiunge un substrato contenente un
cromogeno (in questo caso la tetrametilbenzidina - TMB) che per azione della
fosfatasi alcalina forma un precipitato di color giallo/blu.
La rivelazione dell’avvenuta ibridazione è, dunque, effettuata attraverso una
reazione enzimatico-colorimetrica che indica quali sequenze, nomali o mutate,
sono presenti nel campione. La lettura è effettuata a 450 nm: la colorazione blu è
indice di positività (presenza di mutazione).
 La tecnica ARMS (amplificazione allele-specifica) prevede una PCR nella quale
vengono utilizzati separatamentemente due primer di cui uno è rappresentato da un
oligonucleotide allele-specifico costruito in modo che il nucleotide in posizioni 3’ sia
complementare o alla sequenza mutata del gene o a quella normale, mentre l’altro
primer è comune. Il DNA genomico non viene amplificato quando si usa il primer non
perfettamente complementare alla sequenza in esame. La visualizzazione dei prodotti
amplificati avviene dopo elettroforesi su gel di agarosio e colorazione con etidio di
bromuro.
ESEMPIO: rappresentazione schematica di una ARMS PCR per analisi di mutazioni note.
Per ogni campione vengono allestite due reazioni di PCR utilizzando in ogni reazione il
primer comune in combinazione con quello corrispondente rispettivamente alla
sequenza normale e a quella mutata.
Dalla lettura della corsa elettroforetica emerge che:
L’omozigote normale ha amplificato solo il filamento wild-type
L’omozigote mutato ha amplificato solo il filamento che porta la mutazione.
L’eterozigote ha amplificati entrambi i filamenti .
 La tecnica OLA (saggio di legame degli oligonucleotidi) si basa sull’uso di sonde
fluorescenti specifiche per le mutazioni analizzateSi costruiscono due oligonucleotidi
che ibridano alle due sequenze adiacenti nel DNA bersaglio, con il punto di giunzione
a livello della mutazione: dopo la reazione di ibridazione tra il DNA in esame e le
sonde, una DNA ligasi unirà i due oligonucleotidi solo se sono perfettamente ibridati.
Due sonde oligonucleotidiche sono complementari sia all’allele mutato sia a quello
normale e sono associate in posizione 5’ a modificatori di mobilità (code di ossido di
pentaetilene) di diversa lunghezza. La terza sonda utilizzata è comune ed è coniugata
con un fluoro cromo che permette la rivelazione dei prodotti ibridati dopo elettroforesi
capillare. Le sonde oligonucleotidiche vengono utilizzate per l’allestimento di una
multiplex PCR a cui segue una reazione di ligazione: la ligasi unità le due sonde solo se
sono perfettamente complementari al DNA bersaglio.
La visualizzazione dei risultati avviene con elettroforesi capillare su sequenziatore
automatico dotato di un programma che riporta il grafico della corsa elettroforetica e
di un programma che interpreta i risultati e fornisce la genotipizzazione del campione.
Le dimensioni degli oligonucleotidi, infatti, sono tali che i prodotti di ciascuna
mutazione e il corrispettivo allele wild-type possono essere differenziati per dimensione
e/o colore del marcatore.
Questa tecnica permette di analizzare contemporaneamente diverse mutazioni e
rappresenta, per esempio, una tecnica di screening di primo livello comunemente
usata nella ricerca di mutazioni del gene CFTR responsabile della fibrosi cistica.
 Il sequenziamento con Metodo a terminazione di catena, altrimenti noto come
Metodo di Sanger comporta la sintesi di nuovi filamenti di DNA, complementari ad uno
stampo a singolo filamento. La sintesi di un singolo filamento non prosegue
indefinitamente perché la miscela di reazione contiene piccole quantità di ciascuno
dei quattro dideossinucleotidi che bloccano l’allungamento.
In generale, il sequenziamento con metodo di Sanger necessita di:
 Un primer oligonucleotidico che si appai al DNA stampo (il primer svolge inoltre la
funzione critica di stabilire la regione della molecola stampo che verrà
sequenziata);
 Un DNA templato, ossia uno stampo a singolo filamento della molecola di DNA da
sequenziale;
 Una DNA polimerasi stampo-dipendente
 Una miscela di quattro deossiribonucleotidi trifosfato e un dideossinucleotide
trifosfato;
 Un marcatore fluorescente (35S o 32P) che si leghi a ciascun dideossinucleotide (per
es. 35S-dATP). Nel sequenziamento automatico, il deossinucleotide radioattivo è
stato sostituito con dideossinucleotidi fluorescenti.
Il campione di DNA da sequenziale viene clonato e, successivamente, denaturato
per ottenere lo stampo a singolo filamento. Questo è suddiviso in quattro provette di
sintesi con l'aggiunta di:
 Un primer specifico complementare al filamento da sequenziare e marcato radio
attivamente
 Una DNA polimerasi
 Una miscela dei quattro dNTP
 Un ddNTP diverso in ognuna delle quattro provette e in concentrazione 1:100
rispetto al dNTP corrispondente.
Il legame al filamento stampo guida l’incorporazione dei deossinucleotidi trifosfato:
finché viene incluso un dNTP, continua l’estensione della catena, ma
occasionalmente verrà incorporato un ddNTP e si avrà la terminazione della catena.
Ciascuna delle quattro reazioni base-specifiche genererà una serie di frammenti di
DNA marcati e di dimensioni diverse, con un’estremità 5' comune ed estremità 3'
variabili (a seconda della posizione 3' in cui è stato incorporato il ddNTP).
Anticamente, i frammenti erano visualizzati attraverso autoradiografia come bande
radioattive di lunghezze diverse. In questo caso, vengono condotte in parallelo
quattro reazioni di sintesi: al termine della reazione ogni provetta conterrà nuovi
frammenti di DNA marcati di lunghezza diversa che vengono poi caricati in 4 pozzetti
diversi e separati con elettroforesi su gel di poliacrilammide.
La sequenza del DNA viene ricostruita a partire dall'estremità 5' a quella 3' (cioè dal
frammento più corto a quello più lungo) in base alla posizione delle bande nei diversi
pozzetti, che corrisponde alla terminazione della sintesi a livello di una delle quattro
basi nucleotidiche per incorporazione di un ddNTP.
Nella tecnica di “sequenziamento automatizzato” il deossinucleotide radioattivo è
sostituito con dideossinucleotidi fluorescenti: difatti, il DNA viene marcato facendogli
incorporare un primer o ddNTP a cui sono attaccati dei fluorofori.
L’uso di fluorofori differenti per ciascuna base implica che i frammenti possano essere
caricati in un'unica corsia e, soprattutto, che la sequenza possa essere letta in modo
automatizzato. In una tipica reazione di sequenza è possibile sequenziare frammenti
di dimensioni fino a 800 paia di basi (500 bp dimensione ottimale).
All’interno della provetta, il primer si appaia all’estremità in 3’-OH del filamento di DNA
e rende disponibile il proprio terminale idrossilico per la reazione di polimerizzazione,
catalizzata dalla DNA polimerasi. Quando la catena nascente incorpora un ddNTP, la
reazione di polimerizzazione si arresta e si ha la terminazione della catena; ciò avverrà
più volte, in posizioni diverse della sequenza, generando una serie di frammenti
interrotti di lunghezza variabile.
I prodotti di reazione vengono caricati in singoli tubi capillari del diametro di circa 50
μm contenenti un polimero di corsa (elettroforesi capillare).
Durante l’attraversamento del capillare i vari frammenti di DNA vengono colpiti da un
raggio laser, focalizzato su uno specifico punto del gel. Man mano che i singoli
frammenti di DNA superano quel punto, il laser eccita i vari fluorocromi che marcano i
singoli frammenti. Ciascuno dei quattro fluorocromi emette una diversa lunghezza
d’onda. Una cellula fotoelettrica rileva sequenza, tipo e intensità delle varie emissioni
luminose e il tutto viene registrato in forma grafica. La sequenza dei picchi
corrisponde alla sequenza dei nucleotidi: il tipo, ossia il colore del picco, corrisponde
al tipo di base azotata.
Ciò permette la costruzione di un elettroferogramma, nel quale ogni picco ed ogni
colore corrisponde ad un determinato nucleotide.
La presenza di una mutazione puntiforme in eterozigosi si evidenzia per la
contemporanea presenza di due picchi nella stessa posizione.
La presenza di una mutazione puntiforme in omozigosi è evidenziabile come la
presenza di un picco singolo corrispondente all’allele mutato.
 La tecnica di analisi dei polimorfismi di conformazione dei singoli filamenti (SSCP)
sfrutta la tendenza del DNA a singolo filamento ad assumere ripiegamenti dovuti ai
legami intramolecolari che si instaurano tra basi complementari. Queste conformazioni
sono strettamente dipendenti dalla sequenza nucleotidica del campione. La mobilità
elettroforetica di una molecola di DNA a singolo filamento cambia quindi in funzione
delle sue dimensioni, della sua sequenza nucleotidica, della temperatura di analisi e
della forza ionica.
La tecnica SSCP è basata sulla differenza di mobilità elettroforetica tra DNA
mutato a singolo filamento rispetto a quello non mutato.
I singoli filamenti di DNA ottenuti mediante amplificazione in PCR, denaturati e
sottoposti a rapido raffreddamento, vengono fatti migrare su un gel di poliacrilamide
in condizioni non denaturanti, con il risultato di un cambiamento nella mobilità
elettroforetica per quei frammenti che presentano alterazioni anche di una singola
base. I frammenti di DNA sono identificabili dopo corsa elettroforetica su gel di
poliacrilamide mediante colorazione argentica: una variazione di sequenza, anche
minina, è evidenziabile come una banda anomala di migrazione, a livello del singolo
filamento edell’eteroduplex.
 La tecnica DGGE (denaturino gradient gel electrophoresis) sfrutta il principio secondo
cui la temperatura di denaturazione di una specifica sequenza di DNA (definita
“temperatura di melting” o Tm) dipende dalla sua sequenza nucleotidica ed è
caratteristica per ogni frammento. Quindi, variazioni anche di un singolo nucleotide
modificano la temperatura di denaturazione del frammento e conseguentemente la
sua mobilità elettroforetica. La DGGE è, dunque, basata sul differente
comportamento di denaturazione del DNA mutato rispetto a quello normale.
Le regioni del DNA che devono essere analizzate vengono amplificate mediante PCR,
utilizzando un primer modificato dall’aggiunta di una coda stabilizzante ricca in
guanina e citosina (detta GC clamp) che crea un dominio ad alta temperatura di
denaturazione.
Il prodotto di amplificazione viene denaturato e lasciato rinaturare lentamente in
modo da favorire la formazione di eteroduplex:
Le molecole omoduplici sono dovute all’appaiamentotra i due filamenti normali
e tra i due filamenti mutati. Le molecole eteroduplici sono dovute all’appaiamento di
un filamento normale con uno mutato.
Questi prodotti vengono sottoposti a elettroforesi su gel di poliacrilamide con
gradiente denaturante crescente di formamide-urea che induce la parziale apertura
della doppia elica del frammento e il rallentamento della corsa nel punto in cui il
frammento di DNA incontra su gel la concentrazione di denaturazione. La presenza
dell’eteroduplex destabilizza la doppia elica e induce la sua denaturazione e un
rallentamento della corsa elettroforetica: i frammenti di DNA con sostituzioni
nucleotidiche in eterozigosi e/o omozigosi sono individuati perché danno luogo a un
pattern elettroforetici diversi rispetto al DNA wild-type.
 La tecnica dHPLC (cromografia liquida ad alta risoluzione denaturante) detta anche
HPLC denaturante rappresenta l’evoluzione della DGGE verso una procedura
automatica e permette l’identificazione di varianti nucleotidiche in brevissimo tempo.
Si tratta di una cromatografia ionica in fase inversa che sfrutta, in condizioni di parziale
denaturazione, la diversa ritenzione delle molecole di DNA in assenza/presenza di
variazioni di sequenza. I frammenti di DNA vengono separati sulla base delle loro
dimensioni. L’apparecchiatura dispone di una colonna di separazione riempita con
una matrice di particelle non porose e di piccole dimensioni. Grazie al fatto che la
fase stazionaria è elettricamente neutra e idrofobica, le molecole di DNA cariche
negativamente vengono assorbite dalla matrice. Il trietil-ammonio-acetato (TEAA)
agisce da ponte tra i due perché da un lato le sue caratteristiche positive formano un
legame ionico con i gruppi fosfato del DNA (carichi negativamente) e dall’altro i
gruppi alchilici interagiscono con la matrice idrofobica della resina. Il fattore eluente è
l’acetonitrile che rompe il legame tra il TEAA e il DNA consentendo l’eluizione.
Maggiore è la lunghezza del frammento da analizzare, maggiore sarà il tempo di
ritenzione, che dipende anche dalla composizione in basi nucleotidiche del
frammento in esame: i frammenti corti di DNA verranno diluiti più velocemente rispetto
a quelli più lunghi. La separazione viene effettuata in condizioni parzialmente
denaturanti, cioè termostatando la colonna ad una determinata temperatura
(temperatura di quasi denaturazione). In presenza di una mutazione la denaturazione
e l’eluizione del frammento sarà diversa rispetto al non mutato. Alla temperatura di
quasi denaturazione gli eteroduplici mostrano una parziale denaturazione in
corrispondenza del misappaiamento mentre gli omoduplici, alla stessa temperatura,
sono ancora nella forma di doppia elica. Gli eteroduplici hanno un comportamento
cromatografico diverso rispetto all’omoduplice non mutato e generalmente vengono
eluiti più rapidamente. La presenza di una mutazione si evidenzia con la comparsa nel
cromatogramma di picchi supplementari rispetto al normale.
Eredità dei caratteri complessi
Determinati caratteri vengono trovati con maggior frequenza in alcune famiglie, non
mostrando però la normale segregazione mendeliana.
La complessità della segregazione è dovuta a due motivi, spesso anche presenti
contemporaneamente:
1. Il carattere è “multifattoriale”, cioè la sua espressione è determinata dall’interazione di
fattori genetici con fattori ambientali.
2. Il carattere è “poligenico”, cioè la sua espressione è determinata da un insieme di
fattori genetici, molti geni non allelici.
La prima grande distinzione tra le diverse malattie genetiche è legata al numero di geni
coinvolti, per cui distinguiamo:
 Malattie monogeniche. L’eredità e “unifattoriale” o “monogenica”. Il carattere
biologico è specificato da un solo gene trasmesso secondo le leggi mendeliane della
dominanza, della segregazione, dell’indipendenza. I caratteri monogenici hanno la
caratteristica di essere qualitativi.
 Malattie poligeniche. L’eredità e l’espressione del fenotipo dipende da più geni non
allelici (loci diversi) ognuno dei quali contribuisce in modo additivo all’espressione del
fenotipo. L’effetto dei geni è cumulativo e nessuno è dominante o recessivo rispetto
agli altri. Questi caratteri variano in manieri quantitativa nella popolazione e
presentano una variabilità fenotipica continua.
 Malattie multifattoriali o complesse. L’ereditarietà delle malattie complesse è
multifattoriale quando il carattere biologico è controllato da un insieme di molti geni
che agiscono in concorso con fattori ambientali (alimentazione, condizioni igieniche,
clima, attività fisica, tabagismo, etc).
I caratteri complessi possono essere
 Continui (quantitativi)
Quantitative trait loci - QTL
 Discontinui o dicotomici (qualitativi)
Loci di suscettibilità (determinano
predisposizione).
I caratteri complessi sono distinguibili solo quantitativamente e variano in maniera
continua all’interno di un determinato intervallo. L’eredità e l’espressione del fenotipo
dipende da più geni non allelici (loci diversi) ognuno dei quali contribuisce in modo
additivo all’espressione del fenotipo. L’effetto dei geni è cumulativo e nessuno è
dominante o recessivo rispetto agli altri.
Caratteri che hanno una distribuzione continua sono: statura, peso corporeo, pressione
sanguigna, colore degli occhi, statura, circonferenza cranica, intelligenza.
I caratteri complessi non seguono le leggi di ereditarietà mendeliana, ma hanno
comunque una componente ereditaria. Secondo la “teoria poligenica di Fisher per
caratteri quantitativi” (1918), il carattere è soggetto al controllo da parte di più di fattori
mendeliani indipendenti (in tal caso definiti “poligeni”) ognuno dei quali esercita un
piccolo effetto sul carattere in questione: ciascun allele intensifica o riduce l’espressione
fenotipica complessiva (effetto additivo).
La variabilità del carattere è la risultante degli effetti dei singoli loci; per cui all’aumentare
del numero dei loci la distribuzione nella popolazione si approssima ad una distribuzione
normale: le variazioni di tali caratteri risultano continue, invece che discrete , ragion per
cui si tratta di caratteri quantitativi:
Un locus contiene due alleli, A e a,
ognuno dei quali contribuisce al
fenotipo in modo diverso.
Supponendo che:
 a→0
 A → +20
Avremo tre differenti genotipi.
Allo stesso modo, due loci
contengono ognuno due alleli, A,a, B
e b, ognuno dei quali esercita un
effetto diverso sul fenotipo:
 a→0
 A → +10
 B→0
 b → +10
In questo caso otterremo cinque fenotipi.
All’aumentare delle classi la distribuzione si approssima ad una curva normale
(gaussiana); diminuiscono le differenze tra le classi fenotipiche, che vengono mascherate
dai fattori ambientali.
La genetica dei caratteri quantitativi cerca di spiegare:
 Come molti geni controllano un carattere;
 In che modo geni ed ambiente agiscono sul carattere;
 Quanti e quali sono questi geni per ogni carattere;
 Come l’evoluzione modifica la distribuzione di frequenza di questi caratteri.
La distribuzione di frequenza è definita mediante una serie di parametri statistici:
 Misure della tendenza centrale: la media.
 Misure della dispersione: la varianza e la deviazione standard.
 Misure di relazione: la correlazione e la regressione.
La MEDIA(𝑥̅ ) fornisce informazioni sul centro di una distribuzione:
𝑥̅ =
∑ 𝑥𝑖
𝑁
La VARIANZA (𝑠 2 ) è definita come la deviazione quadratica media dalla media. Essa
indica il grado di variabilità di un gruppo di fenotipi (misurazioni). Quanto maggiore è la
varianza, tanto più dispersi sono i valori di una distribuzione intorno alla media.
∑(𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑁−1
La DEVIAZIONE STANDARD (𝑠) è la radice quadrata della varianza. Essa misura la
dispersione dei dati intorno al valore atteso. Si esprime nelle stesse unità della misura
originale, pertanto descrive la variabilità di una misura.
𝑠 = √𝑠 2
Il COEFFICIENTE DI CORRELAZIONE (𝑟) è un parametro che stima la forza dell’associazione
tra due caratteri quantitativi. Il coefficiente di correlazione si ottiene dividendo la
covarianza di x e y per il prodotto delle deviazioni standard di x e y. Esso spazia da +1 a -1.
Un valore positivo indica l’esistenza di correlazione positiva fra le due variabili.
𝑐𝑜𝑣𝑥𝑦
𝑟=
𝑠𝑥 ⋅ 𝑠𝑦
La COVARIANZA di x e y (𝑐𝑜𝑣𝑥𝑦 ) è un indice che misura la "contemporaneità" della
variazione (in termini lineari) di due variabili casuali. In pratica, la covarianza di due
variabili aleatorie X e Y è il valore atteso dei prodotti delle loro distanze dalla media.
Essa può assumere sia valori positivi che negativi. Nel caso di valori positivi indica che al
crescere di una caratteristica statisticamente cresce anche l'altra, nel caso di valori
negativi accade il contrario.
∑(𝑥𝑖 − 𝑥̅ ) ⋅ (𝑦𝑖 − 𝑦̅)
𝑐𝑜𝑣𝑥𝑦 =
𝑁−1
Il COEFFICIENTE DI REGRESSIONE (𝑏) indica l’entità dell’aumento di y all’aumentare di x.
Pertanto, b consente di prevedere il valore di una variabile, dato il valore dell’altra ad
essa correlata.
𝑐𝑜𝑣𝑥𝑦
𝑏=
𝑠𝑥2
La curva di regressione è 𝑦 = 𝑎 + 𝑏𝑥
𝑎 = intercetta di 𝑦, ovvero il valore di 𝑦
quando 𝑥 = 0
𝑏 = pendenza della curva, ovvero
l’aumento medio di 𝑦 all’aumentare di 𝑥
Il coefficiente di regressione consente di
prevedere determinate
caratteristiche della progenie generata da
una data unione anche senza
conoscere i genotipi che codificano per
tale carattere.
Non tutti i caratteri complessi, però, sono di tipo quantitativo. Si parla, in questo caso, di
caratteri discontinui, dicotomici o qualitativi, ossia loci di suscettibilità che conferiscono la
predisposizione a sviluppare: cardiomiopatie congenite, diabete mellito, ipertensione,
schizofrenia, patologie dell’intestino, obesità, resistenza/sensibilità ai farmaci e alle
malattie infettive, etc.
Secondo il Modello multifattoriale a soglia (Liability Threshold Model), proposto da
Falconer (1984):
 La predisposizione genetica ad un malattia è
distribuita nella popolazione come una
distribuzione normale
 La predisposizione genetica è determinata
da un certo numero di loci, che
contribuiscono in modo additivo.
 Solo gli individui con predisposizione al di
sopra di una certa soglia sviluppano la
malattia (più fattori ambientali).
I “geni si suscettibilità” conferiscono un rischio moderato di contrarre una specifica
malattia, ma non di per se sufficiente a causare la malattia. Chi eredita geni di
suscettibilità per una data malattia, non eredita la certezza di ammalarsi, bensì un rischio
maggiore rispetto alla popolazione generale di svilupparla. Gli individui geneticamente
predisposti possono sviluppare la malattia, ma soltanto se esposti a fattori ambientali
scatenanti.
Nel caso dei caratteri quantitativi:
Fenotipo = contributo genetico + contributo ambientale
La varianza è una misura della variazione ed è definita come il valore medio del quadrato
della deviazione di un’osservazione dalla media aritmetica del campione:
∑(𝑥𝑖 − 𝑥̅ )2
𝑉 = 𝑠2 =
𝑁−1
La varianza è sempre positiva: più un’osservazione è distante dalla media, più
contribuisce alla varianza.
È possibile suddividere la varianza fenotipica dei tratti quantitativi in varianza associata
agli effetti genetici e in varianza associata agli effetti ambientali:
𝑉𝑃 = 𝑉𝐺 + 𝑉𝐸
Con:
 VP: varianza fenotipica
 VG: varianza genetica
 VE: varianza ambientale
Valori elevati di VP si possono avere sia quando la popolazione è geneticamente
omogenea e l’ambiente molto variabile sia quando l’ambiente è uniforme ma è presente
una notevole variazione genetica.
La varianza genetica può essere ulteriormente suddivisa in tre componenti:
1. Varianza genetica additiva (VA): variazione genetica ereditabile poiché passa dai
genitori ai figli.
2. Varianza genetica di dominanza (VD): alcuni alleli sono dominanti su altri e
mascherano il contributo degli alleli recessivi in quel locus.
3. Varianza genetica da interazione (VI): dovuta fondamentalmente a fenomeni di
epistasi e interazioni fra geni diversi.
La varianza genetica totale è pari a:
𝑉𝐺 = 𝑉𝐴 + 𝑉𝐷 + 𝑉𝐼
Nella realtà la varianza fenotipica non equivale alla semplice relazione
𝑉𝑃 = 𝑉𝐺 + 𝑉𝐸
Occorre considerare la covariazione del genotipo e dell’ambiente o covarianza di G e E.
Inoltre, la varianza fenotipica può essere influenzata anche dall’interazione fra il genotipo
e l’ambiente, ovvero 𝑉𝐺 × 𝐸. Tale interazione esiste se le variazioni ambientali influenzano
in modo diverso i diversi genotipi.
La varianza fenotipica è ora pari a:
𝑉𝑃 = 𝑉𝐺 + 𝑉𝐸 + 2𝐶𝑜𝑣(𝐺, 𝐸) + 𝑉𝐺 × 𝐸
L’EREDITABILITA’ è definita come la proporzione della variabilità totale di una popolazione
che può essere attribuita alla variabilità genetica. Si usa comunemente per indicare
quanto un tratto è influenzato da fattori genetici in una data popolazione. Misura,
dunque, il contributo del genotipo alla variabilità fenotipica.
Si possono avere due tipi di ereditabilità:
 Ereditabilità in senso lato (H2), ossia il rapporto tra la varianza genetica totale
(dominanza ed epistasi) e la varianza fenotipica totale:
𝐻 2 = 𝑉𝐺 ⁄𝑉𝑃
𝐻2 =
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑔𝑒𝑛𝑒𝑡𝑖𝑐𝑎
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑔𝑒𝑛𝑖𝑡𝑎
𝑉𝐺
=
=
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑡𝑜𝑡𝑎𝑙𝑒
𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑔𝑒𝑛𝑒𝑡𝑖𝑐𝑎 + 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑎𝑚𝑏𝑖𝑒𝑛𝑡𝑎𝑙𝑒 𝑉𝐺 + 𝑉𝐸
 Ereditabilità in senso stretto (h2), vale a dire il rapporto fra varianza genetica additivita
e la varianza fenotipica totale:
ℎ2 = 𝑉𝐴 ⁄𝑉𝑃
ℎ2 può variare da 0 (la variabilità del carattere dipende interamente da effetti di
natura ambientale, 𝑉𝐴 = 0) a 1 (la variabilità del carattere dipende interamente da
effetti di natura genetica, 𝑉𝐴 = 𝑉𝑃 ,) e spesso è espressa in termini percentuali.
Il calcolo dell’ereditabilità può essere effettuato con il metodo del confronto dei fenotipi
tra genitori e figli o tra individui con diversi gradi di parentela. Se i geni sono importanti nel
determinare la varianza fenotipica, allora individui imparentati dovrebbero essere più
somiglianti per un certo fenotipo, dal momento che possiedono un numero di geni più
elevato di geni in comune.
L’ereditabilità si può, dunque, calcolare dalla regressione dei valori fenotipici dei figli
rispetto ai valori medi nei genitori.
L’ereditabilità non deve, però, essere confusa con la “familiarità”: un carattere è
“familiare” se i membri della stessa famiglia lo presentano qualsiasi sia la ragione, ma è
“ereditabile” solo se la somiglianza deriva dal fatto di avere in comune i genotipi.
Concetti importanti sull’ereditarietà:
 L’ereditabilità non indica il grado in cui il carattere è genetico, ma misura la
proporzione di varianza fenotipica dovuta a fattori genetici.
 La stima dell’ereditabilità è un parametro della popolazione, non del singolo individuo.
 La stima dell’ereditabilità è specifica per la popolazione e l’ambiente che si sta
analizzando, per questo non è costante: può cambiare nel tempo perché cambia la
varianza genetica, quella ambientale o la correlazione tra varianza genetica e
ambientale.
 Un alto valore di ereditabilità non implica che il carattere non possa essere modificato
dall’ambiente.
Per ottenere una misura dell’ereditabilità dei tratti si ricorre a tre metodi:
a. Il metodo dei gemelli allevati nello stesso ambiente
b. Il metodo dei gemelli allevati separatamente
c. Il metodo dell’adozione.
Per valutare la componente genetica di una patologia complessa esistono due parametri
da osservare. Il primo è rappresentato dall’Aggregazione familiare per cui la patologia si
presenta con frequenza più elevata nei parenti di primo grado di pazienti affetti rispetto
alla frequenza riscontrata nella popolazione generale.
È importante definire la relazione genetica tra i parenti:
 Parenti di 1° grado (gemelli dizigotici; fratelli; genitori/figli) condividono 1/2 dei loro
geni.
 Parenti di 2° grado (fratellastri; zio/nipote;
nonno/nipote) condividono 1/4 dei loro geni.
 Parenti di 3° grado (primi cugini) condividono 1/8
dei loro geni.
 Parenti di 4° grado (secondi cugini) condividono
1/32 dei loror geni.
 Etc,etc…
La percentuale di parenti che cadono oltre il livello
soglia diminuisce mano a mano che si riduce il grado
di parentela e la percentuale di condivisione di geni.
Per i caratteri a soglia dicotomici l’erditarietà in senso
stretto (h2) può essere stimata dall’incidenza della malattia nei consanguinei degli affetti.
Gli studi di ricorrenza familiare vengono effettuati mediante il calcolo del Rischio Relaivo
(𝝀R), che esprime il grado di aggregazione familiare di un carattere:
𝜆𝑅 =
rischio nei parenti di un individuo affetto
rischio nella popolazione generale
Al diminuire del grado di parentela diminuisce anche la frequenza; ma se un carattere
ha una componente genetica significativa, il 𝜆 R dovrebbe diminuire all’aumentare del
grado di parentela.
𝑟𝑖𝑠𝑐ℎ𝑖𝑜 𝑑𝑖 𝑟𝑖𝑐𝑜𝑟𝑟. 𝑛𝑒𝑖 𝑓𝑟𝑎𝑡𝑒𝑙𝑙𝑖/𝑠𝑜𝑟𝑒𝑙𝑙𝑒 𝑑𝑖 𝑢𝑛 𝑎𝑓𝑓𝑒𝑡𝑡𝑜
𝑟𝑖𝑠𝑐ℎ𝑖𝑜 𝑛𝑒𝑙𝑙𝑎 𝑝𝑜𝑝𝑜𝑙𝑎𝑧𝑖𝑜𝑛𝑒 𝑔𝑒𝑛𝑒𝑟𝑎𝑙𝑒
∗
(𝜆𝑆 : la S sta per siblings, ossia fratelli).
Valori grandi di 𝜆R sono un’indicazione che il carattere ha una forte componente
genetica ma l’aggregazione familiare potrebbe essere anche dovuta a fattori ambientali
comuni.
La familiarità di un fenotipo non ne dimostra necessariamente l’ereditabilità. Individui
della stessa famiglia condividono i geni ma anche più frequentemente l’ambiente.
→ Studi di gemelli
𝜆𝑆 ∗ =
 Monozigotici (MZ) condividono il 100% del patrimonio genetico;
 Dizigotici (DZ) condividono il 50% del patrimonio genetico.
Partendo dal presupposto per cui l’esposizione alle influenze ambientali sono le stesse
per gemelli MZ e DZ, se un tratto presenta una predisposizione genetica, mi aspetto
che la contemporanea presenza della malattia in entrambi i gemelli sia più frequente
tra i MZ rispetto ai DZ.
Una maggiore concordanza (entrambi i gemelli mostrano il fenotipo in questione) in
gemelli MZ è indice di fattori genetici. Complicazioni dell’analisi:
 Tendenza a trattare i gemelli MZ in modo più simile dei DZ.
 Differenze genetiche fra gemelli MZ (geni del sistema immunitario, mutazioni
somatiche, pattern d’inattivazione dell’X) non sono perfettamente uguali.
 Ambiente condiviso.
Gli “studi di individui adottati” permettono di stabilire se l’aggregazione familiare è
dovuta all’ambiente familiare comune oppure a fattori genetici. Il materiale
sperimentale è rappresentato da fratelli adottati da famiglie diverse, sebbene gemelli
monozigotici separati alla nascita e cresciuti separatamente costituirebbero il
materiale sperimentale ideale.
È possibile svolgere due tipi di indagine:
 Trovare persone adottate che soffrano di una particolare malattia che solitamente
ricorre nelle famiglie e appurare se la condizione ricorra nella loro famiglia
biologica o in quella adottiva.
 Partire da soggetti affetti i cui figli siano stati adottati e verificare se l’essere stati
adottati abbia evitato la malattia ai figli.
Un famoso e controverso studio si è basato sul primo tipo di indagine per valutare
l’esistenza di determinanti genetici nella schizofrenia: lo studio comprende oltre 14.000
persone tra i 20 e i 40 anni adottate in Danimarca; a 47 di loro è stata diagnosticata
schizofrenia. Questi 47 individui sono stati abbinati con 47 soggetti di controllo on
schizofrenici appartenenti allo stesso gruppo di persone adottate. I risultati hanno
evidenziato una maggiore incidenza di casi di schizofrenia tra i parenti biologici
rispetto ai parenti adottivi.
Il secondo parametro che consente di stimare la componente genetica di una patologia
complessa è la variazione di incidenza della malattia in esame in gruppo etnici
differenziati.
Lo studio delle malattie multifattoriali comporta delle difficoltà legate a:
 Elevata eterogeneità genetica
 Mancanza di una correlazione semplice tra genotipo e fenotipo:
1. Non tutti coloro che hanno un gene di suscettibilità si ammalano.
2. Non tutti coloro che si ammalano hanno un particolare gene di suscettibilità.
Dal progetto Genoma Umano è emerso che esiste:
 L’1% di differenze tra uomo e scimpanzé. L’uomo condivide il 99% del suo DNA con lo
scimpanzé.
 Lo 0,1% di differenze tra due individui presi a caso nella popolazione (3x106 su 3x109).
La combinazione di queste 3x106 variabili rende ciascun individuo unico nel tempo e
nello spazio.
Sviluppo di marcatori genetici nell’uomo:
1980: RFLP
1985: minisatelliti VNTR
1989: micro satelliti STRP
2000: SNP
2005: CNV (copy number variation). Variazioni nel numero di copie di grossi segmenti del
genoma e sono associati a geni di suscettibilità.
2012: il sequenziamento di tutto il genoma.
Vi sono diversi cataloghi di varianti genetiche; relativamente agli SNP queste sono: NCBI,
Human Genome Variation Database, International HapMap Project.
L'identificazione della componente genetica delle malattie complesse viene riconosciuta
come una delle principali sfide della medicina deiprossimi anni. Esistono diverse teorie in
merito.
La prima va sotto la denominazione di Common Disease/Common Variant (CD/CV).
Secondo questa teoria, la componente genetica di un carattere complesso sarebbe
costituita da un numero relativamente ridotto di varianti a bassa penetranza. Un esempio
è il gene ApoE, caratterizzato dalla presenza di tre varianti alleliche, tra le quali E4 è
collegata alla predisposizione al morbo di Alzheimer (fr(E4) nella popolazione è pari al
15%).
Un’espansione dell’ipotesi CD/CV va sotto il nome di Common Variant/Multiple Disease
(CV/MD). Secondo tale ipotesi le stesse varianti, associate in modo differente a fattori
genetici ed ambientali, porterebbero alla comparsa di fenotipi differenti.
Questa ipotesi trova fondamento soprattutto per quelle patologie che mostrano
comorbidità, ad esempio diabete di tipo II ed obesità: sono state riconosciute varianti
comuni ad entrambe le condizioni.
Metodi usati per il mappaggio di geni di suscettibilità:
1. Conoscendo il processi fisiopatologico.
 Approccio del “gene candidato”
 Approccio “ whole-genome scan”.
2. La strategia metodologica ottimale in base alle informazioni genetiche disponibili:
 Studi di linkage
 Studi di associazione
→ Analsisi di linkage classica, di tipo parametrico (nota anche come Model based
analysis) rappresenta una metodologia statistica classica dell’analisi genetica e si
basa sull’identificazione di marcatori che segregano insieme alla malattia all’interno
di famiglie. Nello studio delle malattie complesse è pressoché inutilizzabile per una serie di
ragioni:
 Esistenza di un’eterogeneità allelica (stesso fenotipo ma varianti diverse)
 Difficoltà nello specificare un modello genetico esatto (penetranza e frequenze
alleliche);
 Errori nella definizione del fenotipo a causa di: varietà di sintomi, eziologia, età
di’insorgenza, diagnosi inappropriata, esistenza di fenocopie;
 Difficoltà nello stabilire la soglia di significatività: MLS > 3,6?
 Replicazione indipendente dei risultati positivi, per verificare, usando un altro
campione, se si ottiene o meno lo stesso risultato. Per replicare un risultato positivo è
necessario disporre di un campione di famiglie di dimensioni molto più grandi rispetto
al campione originario.
 Presenza di picchi di linkage molto larghi ed imprecisi rispetto alla posizione del locus
malattia.
Possibili alternative sono:
 Cercare famiglie in cui la malattia segreghi in modo quasi mendeliano e applicare
analisi parametrica.
Un esempio è rappresentato dall’identificazione dei geni BRCA1 e BRCA2 per il tumore
al seno.
Il carcinoma della mammella è considerabile come due malattie distinte:
Una forma mendeliana più rara ad esordio precoce
Una forma sporadica a esordio tardivo.
Relativamente alla forma familiare, è stata eseguita un’analisi di linkage di tipo
parametrico, dalla quale sono emersi i seguenti risultati: solo il15% dei casi di cancro al
seno è legato alla storia familiare (nello specifico il 30% è dovuto a mutazioni di
BRCA1, il 15% a mutazioni di BRCA2, il restante 55% ha eziologia sconosciuta); il 5% è di
tipo ereditario; il rimanente 80-85% dei casi di rischio familiare è sporadico.
 Applicare metodi di analisi di linkage non parametrici (“model-free” analysis) nei quali
non è necessario specificare il modello d’ereditarietà. Tali metodi sono basati
sull’analisi dello stato di condivisione degli alleli (allele sharing) fra due o più individui
malati in famiglie nucleari.
Fra le metodologie di analisi di linkage non parametriche, l‟analisi di coppie di fratelli
affetti (affected sib-pair method, ASP) è quella più frequentemente utilizzata, e si può
estendere anche a coppie di parenti che non siano fratelli (affected pedigree members,
APM).
Vengono studiati gli alleli identici per discendenza (IBD, identical by descent), ossia quegli
alleli che sono identici negli individui in cui è presente la patologia.
L’Affected Sib Pair Analysis (ASP) parte dall’idea base per cui se due fratelli sono entrambi
affetti da una malattia genetica, condivideranno (teoricamente) la regione
cromosomica comprendente il gene malattia. Se fratelli affetti condividono un locus
marcatore in proporzione superiore all’atteso, la regione genica conterrà il gene di
predisposizione.
Se il locus marcatore non è in linkage con il gene di suscettibilità, le coppie di fratelli affetti
condividono gli alleli secondo la probabilità casuale 25%, 50%, 25%.
Se il locus marcatore è in linkage con il gene di suscettibilità, le coppie di fratelli affetti
condividono gli alleli più frequentemente rispetto alle probabilità casuali: le nuove
proporzioni sono 40%, 55%, 5%.
Due alleli possono essere:
Identici per stato (IBS) quando non
Identici per discesa (IBD) quando
sono copie che provengono da uno
sono copie dello stesso allele,
stesso antenato identificabile.
individuabile in un antenato comune.
-
A1A2
A1A3
A1A3
A1A2
A1 è identico per stato
A1A2
A1A3
A1A3
A1A2
A1 è identico per discesa
L’evidenza del linkage può essere stimata:
 Comparando il numero osservato e quello atteso di coppie che condividono zero,
uno, due alleli identici mediante un test del 𝜒 2 con due gradi di libertà.
 Tramite il calcolo statistico del massimo LOD score non parametro, che valuta
l’incremento di condivisione allelica tra parenti affetti.
Nel mappaggio dei geni patologici umani, il linkage ha successo nell’identificare varianti
molto penetranti che causano malattie rare. L’associazione ha successo nell’identificare
varianti causali comuni (>10%) con effetto modesto.
→ Gli studi di associazione mirano all’individuazione di un’associazione tra un particolare
allele o aplotipo e la malattia. Si distinguono in associazione a livello familiare e
associazione a livello di popolazione:
 Studi di associazione nelle famiglie (family-based). Si tratta di test di associazione
marcatore/malattia tra i membri affetti e non affetti all’interno di famiglie in cui
segrega la patologia.
Il Disequilibrium Trasmission Test (TDT) si propone di identificare la trasmissione
preferenziale di un dato allele nei figli affetti di famiglie nucleari (padre, madre e
figlio).
Casi = alleli trasmessi (1 e 3)
1/2
3/4
Controlli = alleli non trasmessi (2 e 4)
1/3
Si osserva la trasmissione allelica dai genitori ai figli affetti. Si studia la deviazione dai
rapporti di segregazione mendeliana: se esiste un’associazione tra l’allele eziologico e
la malattia, si osserva una trasmissione preferenziale di tale allele nei figli affetti. Una
trasmissione maggiore del 50% indica che è presente una distorsione e verosimilmente
l’allele che si sta osservando è responsabile della patologia o comunque è in linkage
con il locus malattia.
Consideriamo n famiglie e 2n genitori:
Alleli trasmessi
Alleli non trasmessi
M1
M2
totale
M1
a
b
a+b
M2
c
d
c+d
totale
a+c
b+d
2n
La significatività dell’associazione viene valutata con un semplice test del 𝜒 2 :
(𝑂 − 𝐸)2 (𝑏 − 𝑐)2
∑
=
(𝑏 + 𝑐)
𝐸
𝑏,𝑐
Dove
 b è il numero delle volte in cui l’allele è trasmesso
 c è il numero delle volte in cui l’altro allele è trasmesso.
Il TDT utilizza un controllo interno alla famiglia, ossia la popolazione degli alleli non
trasmessi ai figli affetti dai propri genitori.
 Studi casi-controlli. Si tratta di test di associazione marcatore/malattia in un gruppo di
individui affetti e non affetti scelti casualmente nella popolazione. In uno studio casocontrollo si analizzano preferibilmente SNP e CNV.
Lo studio caso-controllo confronta la frequenza di un determinato allele tra un
campione di individui affetti (casi) e un campione di individui non affetti (controlli) tra
loro non imparentati.
La scelta dei campioni è fondamentale, soprattutto per quanto riguarda i controlli: la
numerosità dei campioni deve essere ampia; i controlli devono avere la stessa origine
dei casi; devono essere scelti per sesso e per età.
Il problema maggiore in questo tipo di studio è rappresentato dalla stratificazione
della popolazione e, quindi, dalla presenza di sottopopolazioni genetiche, con diverse
distribuzioni alleliche. La stratificazione si osserva analizzando marcatori non associati
alla malattia: se non vi sono differenze tra casi e controlli non c’è stratificazione.
Si riconoscono quattro tipi di modelli di interazione tra gli alleli:
1. Dominante: la presenza di un allele (dominante) determina il fenotipo.
2. Recessivo: il gene esprime un fenotipo solo se entrambi gli alleli sono uguali.
3. Moltiplicativo: l’effetto aumenta di un’unità per ogni allele presente.
4. Additivo: l’effetto dell’allele sul fenotipo aumenta passando dall’omozigosi
all’eterozigosi.
La misura (o quantificazione) di un’associazione rappresenta uno dei passi più importanti
da compiere nell’indagine sulle cause delle malattie.
L’esistenza di un’associazione può essere accertata attraverso studi prospettivi (studi di
coorte) o retrospettivi (studi casi-controlli):
studio retrospettivo → Odd ratio (OR)
studio prospettivo → Rischio Relatio (RR)
L’Odd ratio (OR) rappresenta il rapporto fra il numero di volte in cui l’evento si è verificato
e il numero di volte in cui l’evento non si è verificato.
Il Rischio relativo (RR) è il rapporto tra l’incidenza negli esposti e l’incidenza nei non esposti
(dove “incidenza” significa proporzione di nuovi casi).
Lo studio casi-controlli (retrospettivo) valuta l’esposizione al fattore di rischio in un gruppo
di affetti (casi) rispetto a un gruppo di non affetti (controlli):
Casi (affetti)
a
c
Allele 𝒙 presente
Allele 𝒙 assente
Controlli (non affetti)
b
d
Odds nei casi = (𝑎⁄𝑎 + 𝑐) ÷ (𝑐⁄𝑎 + 𝑐) = 𝑎⁄𝑐
Odds nei controlli = (𝑏⁄𝑏 + 𝑑) ÷ (𝑑⁄𝑏 + 𝑑) = 𝑏⁄𝑑
𝑎⁄𝑐
𝑎
𝑑
OR= 𝑏⁄𝑑 = 𝑏 ⋅ 𝑐 =
𝑎𝑑
𝑏𝑐
rapporto crociato
Il valore ottenuto indica la forza dell’associazione e può assumere valori compresi tra 0 e
+∞:
 OR <1: associazione negativa (il fattore può proteggere dalla malattia).
 OR = 1: non c’è associazione
 OR > 1: associazione positiva (il fattore può causare la malattia).
L’associazione che può emergere tra il genotipo misurato in un certo locus e il fenotipo
può essere di tre tipi:
1. Diretta: il locus è correlato causalmente alla malattia, per cui alleli diversi costituiscono
fattori di rischio differenti.
2. Indiretta: il locus non è direttamente causale, ma è sufficientemente vicino ad un
locus causale (è in linkage disequilibrium con esso).
3. Spuria: l’associazione rilevata è dovuta a fattori detti di confounding (stratificazione
della popolazione).
Le nuove prospettive per la mappatura dei geni che conferiscono suscettibilità a malattie
complesse: il progetto Hap Map e Genome-Wide Association Studies (GWAS).
Il progetto internazionale HapMap ha ampliato le prospettive degli studi di
associazione di malattie complesse in quanto ha portato alla formazione di un database
delle varianti comuni del genoma umano, determinandone frequenza e associazione.
Il progetto HapMap è nato nel 2002 con lo scopo di mappare la struttura di linkage
disequilibrium lungo tutto il genoma umano.
È stato effettuato uno studio di popolazioni con origini differenti allo scopo di:
 Includere variazioni comuni e meno comuni
 Ottenere pattern completi di LD
Il linkage disequilibrium (LD) deriva dal fatto che alleli vicini vengono più facilmente coereditati in blocchi di 1aplotipi risultando quindi associati all‟interno di una popolazione.
Siccome la probabilità di ricombinazione fra due SNPs aumenta con l‟aumentare della
distanza fisica fra i due, di norma il grado di associazione fra SNPs diminuisce
progressivamente con la distanza.
Uno dei risultati più interessanti scaturiti dal progetto HapMap è che il genoma umano
risulta essere costituito da regioni cromosomiche, dette “blocchi di aplotipi”, all‟interno
delle quali gli SNPs hanno un alto grado di associazione. Questo significa che all‟interno di
un “blocco” la diversità di una popolazione umana è rappresentata solo da pochi
aplotipi. I “blocchi di aplotipi” sono separati da regioni con un basso livello di LD ed
un‟alta diversità, che corrispondono probabilmente a “hotspot” di ricombinazione.
La conoscenza della struttura di LD e della struttura in blocchi del genoma ha dei risvolti
pratici molto importanti. ). Significa che analizzando solo alcuni SNPs opportunamente
scelti (tag SNPs) è possibile conoscere le altre varianti comuni presenti nelle vicinanze in
modo tale da rappresentare tutti gli aplotipi presenti nella regione cromosomica.
Grazie agli studi sulla variabilità del genoma, si conoscono i pattern di LD lungo ogni
cromosoma umano:
 LD è variabile: la ricombinazione non accade con uguale probabilità in tutti i punti del
genoma (ci sono “hot” e “cold” spots). LD è basso vicino ai telomeri (alto tasso di
ricombinazione) e alto vicino ai centromeri (mancanza di ricombinazione).
 LD è variabile tra le popolazioni umane: minore estensione nella popolazione africana,
un blocco ogni10 kb.
Gli studi di associazione su scale genomica (GWAS) cercano un’associazione tra
marcatore e malattia in patologie complesse senza informazioni a priori.
Oggi è possibile grazie a.
 Miglioramento dei metodi di amplificazione dell’intero genoma
 Progressi dei metodi statistici
 Tecnologia array, che ha permesso la simultanea genotipizzazione di 0,5-1 milione di
SNPs
 Progetto HapMap
Gli studi GWAS si caratterizzano per: la dimensione del campione molto grande (fino a
2000 casi e 20000 controlli); un alto livello di risoluzione; nessuna ipotesi o conoscenza a
priori; la replica dei risultati in un campione indipendente.
Comportano, tuttavia, delle problematiche legate a: la grande quantità dei dati;
controllo della qualità; correzione per la possibile stratificazione del campione; statistica.
Problema comune negli studi di associazione è il “problema dei test multipli”. Questo
deriva dal fatto che effettuando numerosi calcoli è possibile che si ottengano risultati non
reali, ma casuali (falsi positivi). Una possibile correzione consiste nel considerare come
valore di significativà 𝛼 = 0,05/𝑁 (numero dei test), anziché 𝛼 = 0,05 (Correzione di
Bonferroni).
La CITOGENETICA si occupa dello studio dei cromosomi.
Il materiale costituente i cromosomi è la cromatina: consiste in DNA complessato con
proteine basiche, in particole istoni, e proteine acide. Nella cellula la struttura di ciascun
cromosoma è accuratamente regolata e il comportamento del DNA cromosomico viene
raggiunto complessandolo con proteine che legano il DNA.
Quando nuclei non in divisione vengono esaminati al microscopio ottico, si nota un
insieme di aree colorate più o meno intensamente all’interno del nucleo. Le zone più
scure sono chiamate “eterocromatina” e contengono DNA che ha ancora
un’organizzazione relativamente compatta. Esistono due tipi di eterocromatina:
 Eterocromatina costitutiva è una caratteristica permanente di tutte le cellule e
rappresenta DNA che non contiene geni e può quindi essere sempre mantenuto in
forma compatta. Questa frazione comprende il DNA centromerico e telomerico e
anche certe regioni di particolari cromosomi (la maggior parte del cromosoma Y).
 Eterocromatina facoltativa è visibile in alcune cellule in determinati momenti. Si ritiene
che contenga geni che sono inattivi in determinate cellule o in determinati momenti
del ciclo cellulare. Quando questi geni sono inattivi, le corrispondenti regioni dei DNA
vengono compattate in etero cromatina.
Le rimanenti regioni del DNA cromo somale, quelle che contengono geni attivi, sono
meno compatte e permettono l’accesso alle proteine di espressione. Queste regioni sono
chiamate “eucromatina”.
La prima unità di impacchettamento è il nucleosoma; in zone in cui la cromatina è
particolarmente distesa si osserva una struttura a “collana di perle”. Il nucleosoma
consiste in un complesso centrale di otto proteine istoniche basiche (due di ciascuno
degli istoni H2A, H2B, H3 e H4) attorno al quale si avvolge un filamento di 146 bp di DNA a
doppio filamento compiendo 1,75 giri. I nucleosomi adiacenti sono connessi da un corto
segmento di DNA spaziatore, il DNA linker, lungo circa 60 bp: in questa regione si trova
l’istone H1(non fa parte della collana di perle), che avrebbe la funzione di promuovere e
stabilizzare un impaccamento di ordine superiore che porta alla formazione di una
struttura il cui diametro è 30 nm.
La fibra di 30 nm risulta dall’avvolgimento ad elica (struttura solenoide) della fibra di 10
nm. La fibra di 30 nm rappresenta la struttura base della cromatina interfasica e del
cromosoma mitotico. La cromatina interfasica subisce un ulteriore grado di
condensazione attraverso la formazione di anse (loop), che si attaccano ad
un’impalcatura (scaffold) di proteine acide non istoniche. Il complesso di anse e
l’impalcatura vengono ulteriormente compattati determinando la struttura del
cromatidio.
Gli elementi essenziali di un cromosoma metafasico sono:
 Centromero. È l’elemento che, agendo in cis, consente la corretta segregazione dei
cromosomi durante la mitosi e la meiosi, interagendo con i microtubuli che
costituiscono le fibre del fuso. Il centromero è composto da almeno tre domini
strutturali:
Il “cinetocoro” è una struttura cromosomica specializzata, localizzata sulla
superficie esterna di ciascun cromatidio fratello, ritenuta responsabile del
movimento dei cromosomi. Appare come un disco trilaminare composto da due
piastre esterne dense, alle quali si attaccano le fibre del fuso, separate da una
zona interna più chiara,a diretto contatto con il DNA centromerico.
Si riconoscono tre tipi di proteine centromero-specifiche: CENP-A (CENtromere
Protein A), di 17 kDA; CENP-B, di 80 kDa; CENP-C, di 140 kDa.
CENP-C e probabilmente CENP-A si trovano alla periferia del cinetocoro, mentre
la quasi totalità di CENP-B è associata all’eterocromatina centromerica
localizzata nel dominio centrale. CENP-C probabilmente è responsabile del
legame con i microtubuli ed è direttamente coinvolta nella funzionalità del
centromero: è infatti presente in quantità uguali a livello di tutti i centromeri
umani, mentre è assente dove il centromero è inattivo.
Il “dominio centrale” è costituito da cromatina centromerica (etero cromatina
costitutiva), sulla quale è ancorata il cinetocoro. La cromatina centromerica è
composta da varie famiglie di DNA altamente ripetuto (DNA satellite). Si
riconoscono diversi tipi di satellite.
 Il satellite 1 è formato da unità di 42 bp ricche in A+T ripetute in tandem e si
trova a livello del centromero di tutti i cromosomi. Si ha l’alternanza di due tipi
di ripetizioni, una di 17 bp e l’altra di 25 bp.
 I satelliti 2 e 3 sono costituiti dalla ripetizione di forme varianti del
pentanucleotide (GGAAT)n, la sequenza evolutivamente più conservata e
presente in tutti i centromeri umani. Inoltre, è in grado di legare proteine
specifiche.
 Il satellite α è formato da unità ripetute di 171 bp, presente a livello di tutti i
centromeri e contiene una sequenza di 17 bp che lega la proteina CENP-B.
Sembra quello funzionalmente più importante.
 Il satellite β è costituito da unità ripetute da 68 bp; è ricco in G+C ed è
localizzato solo su alcuni cromosomi (1,9,13,14,15,21,22,Y).
Il “dominio di appaiamento” comprende la superficie interna del centromero,
dove i cromatidi fratelli si appaiano mediante specifiche proteine, quale ad
esempio la proteina INCENP (Inner CENtromere Protein). Il dominio di
appaiamento tiene uniti i cromatidi fratelli dopo la replicazione del DNA fino alla
successiva metafase.
 Telomeri. Sono strutture specializzate che racchiudono le estremità dei cromosomi. Il
DNA telomerico è formato da una lunga sequenza di unità ripetute in tandem. I
vertebrati possiedonoun DNA telomerico a doppio filamento, nel quale la sequenza
TTAGGG è ripetuta da tre a più volte. Un filamento del DNA telomerico contiene
sequenze ricche in TG e si estende per circa 100 nucleotidi, terminando con l’estremità
3’. A livello di questa estremità forma delle anse o loops (T-loops o D-loops). A livello
dei telomeri sono presenti proteine che vanno a costituire il complesso Shelterin,
associato al DNA telomerico.
È probabile che i telomeri svolgano diverse funzioni:
Mantenere l’integrità strutturale dei cromosomi. Se viene perso un telomero
l’estremità cromosomica che si ottiene è estremamente instabile e ha la
tendenza a fondersi con l’estremità di altri cromosomi che si siano rotti.
-
Assicurare la replicazione completa delle porzioni finali delle estremità
cromosomiche, evitando l’eventuale accorciamento dei telomeri e del
cromosoma.
Il problema della replicazione delle estremità cromosomiche è stato risolto
estendendo la sintesi del filamento guida con l’impiego di un enzima specifico, la
telomerasi, una trascrittasi inversa che aggiunge ripetizioni TTAGGG alle sequenze
telomeriche.
La trascrittasi consta di due componenti principali:
TERT (Telomerase Reverse Transcriptase) è una sub unità con attività di trascrittasi
inversa, conosciuta come trascrittasi inversa telomerasica.
TERC (Telomerase RNA component) è una molecola di RNA conosciuta come il
componente a RNA della telomerasi, che funge da copia per la sintesi di nuove
ripetizioni telomeriche.
Nell’uomo l’attività telomerasica è stata riscontrata nelle cellule della linea germinale
ed in cellule embrionali, ma non nella maggior parte dei tessuti adulti: il 90% dei tumori
si caratterizza per l’attivazione della telomerasi. Inoltre, i telomeri svolgono un ruolo
nella determinazione dell’architettura del nucleo e nell’appaiamento dei cromosomi.
 Origini di replicazione. Sono necessarie per iniziare la replicazione del DNA e
mantenere il numero di coppie cromosomiche.
I neocentromeri sono centromeri ectopici che si formano occasionalmente in regioni non
centromeriche, spesso all’interno di regioni del genoma codificanti. I neocentromeri sono
caratterizzati dall’assenza del DNA satellite, tipico dei centromeri canonici. Nonostante
l’assenza di DNA α-satellite, i neocentromeri sono capaci di formare una costrizione
primaria e di assemblare un cinetocore funzionale e stabile in mitosi. Fino ad oggi sono
stati identificati circa 70 neocentromeri umani,tipicamente localizzati su cromosomi
riarrangiati che hanno perso i loro centromeri. I neocentromeri sono stati spesso individuati
anche in carcinomi umani e malattie genetiche. Nel genoma umano i neocentromeri
mostrano dei siti privilegiati di formazione, infatti esistono delle regioni cromosomiche che
sono degli “hot-spots” di neocentromerizzazione. Tali regioni sono il braccio lungo del
cromosoma 3, 13, 15 e Y e il braccio corto del cromosoma 8 e 9.
-
I cromosomi vengono analizzati alla metafase, quando si presentano come strutture
duplicate e parallele, i cromatidi, che sono uniti da una costrizione primaria, il centromero,
che separa il braccio corto (“p”) dal braccio lungo (“q”).
In base alla morfologia, i cromosomi sono definiti:
- Metacentrici, se il centromero si trova in una posizione intermedia tra il braccio corto
ed il braccio lungo (cromosomi 1,3,16,19,20).
- Submetacentrici, se il centromero è spostato e separa braccia di dimensioni diverse
(cromosomi 2,4,5-12,17,18,X).
- Acrocentrici, se il centromero è spostato tutto da un lato e separa un braccio corto di
dimensioni molto ridotte, rispetto al braccio lungo (cromosomi 13-15,21,22,Y).
I cromosomi sono anche classificati in gruppi dalla A alla G:
- Gruppo A, cromosomi 1-3;
- Gruppo B, cromosomi 4-5;
- Gruppo C, cromosomi 6-12 e X (cromosomi submetacentrici di medie dimensioni);
- Gruppo D, cromosomi 13-15 (cromosomi acro centrici di medie dimensioni);
- Gruppo E, cromosomi 16-18;
- Gruppo F, cromosomi 19-20;
- Gruppo G, coppie 21-22 e Y.
Si definisce cariotipol’ordinamento dei cromosomi di una cellula. I cromosomi vengono
classificati secondo un ordine standardizzato (ISCN, 1995), che tiene conto delle
dimensioni, del rapporto tra le braccia e, soprattutto, delle caratteristiche rilevate con il
bandeggio.
Il bandeggio dei cromosomi consiste in una serie di trattamenti blandi che denaturano
parzialmente il DNA o degradano la porzione proteica del cromosoma permettendo di
ottenere un’alternanza di bande trasversali con diverse intensità di colorazione.
Le tecniche di bandeggio cromosomico includono:
- BANDE G: trattamento con Tripsina, colorazione con Giemsa. Bande scure ricche in A
e T.
- BANDE Q: colorazione con Quinacrina (o DAPI o Hoechst), coloranti fluorescenti che si
legano preferenzialmente alle zone ricche in A e T.
- BANDE R: denaturazione al calore in soluzione salina, poi colorazione con Giemsa.
Denaturazione delle zone ricche in A e T, quindi si ottiene un pattern di bandeggio
“reverse” rispetto alle bande G.
- BANDE C: denaturazione in soluzione satura di idrossido di bario, poi colorazione
Giemsa. Mettono in evidenza l’eterocromatina costitutiva.
- BANDE T: Trattamento aggressivo con calore e colorazione Giemsa, servono a
evidenziare un gruppo di bande R localizzate in prossimità dei telomeri.
Le dimensioni di una banda sono circa 5 Mb; la risoluzione del bandeggio può essere
aumentata utilizzando cromosomi più allungati: ad esempio, al posto dei convenzionali
cromosomi metafisici è possibile utilizzare preparazioni di cromosomi prometafasici. La
rappresentazione dell’insieme completo dei cromosomi come serie di cromosomi
bandeggiati è chiamata “cariogramma”.
Il “cariotipo” è, invece, definito, come il corredo cromosomico completo: per es. 46,XX;
46,XY; 47,XY,+21; 47,XXY.
La nomenclatura dei cromosomi è stabilita dal Sistema Internazionale per la
Nomenclatura in Citogenetica Umana (ISCN). Si considera che i bracci di ciascun
cromosoma siano suddivisi in differenti regioni che vengono indicate come p1,p2,p3;
q1,q2,q3 ecc, contando dal centromero verso i telomeri. Le varie regioni sono delimitate
da “punti di riferimento” specifici, con caratteristiche morfologiche costanti e distinte, che
comprendono le estremità dei bracci cromosomici, il centromero e alcune bande. A
seconda del livello di risoluzione microscopica, le regioni vengono divise in bande
indicate come p11(uno-uno, non undici!), e in sotto-bande o in sotto-sotto-bande, con
una numerazione che va sempre sal centromero verso i telomeri. Il centromero è indicato
come “cen” e il telomero “ter”.
Una banda è, quindi, definita dai seguenti parametri:
- Numero del cromosoma
- Simbolo del braccio (p o q)
- Numero della regione (p1, p2, q1, etc)
- Numero della banda all’interno di quella regione (p11, p12)
- Numero della sottobanda (p11.1, p11.2)
- Numero della sotto-sottobanda (p11.12, p11.22)
La nomenclatura dei referti citogenetici consiste in tre parti separate da una virgola:
1. Numero totale di cromosomi individuati.
2. Costituzione dei cromosomi sessuali.
3. Eventuali anomalie riscontrate (indicate con “+”, di acquisizione, e “-“, di perdita).
Circa 1/3 della popolazione presenta variazioni morfologiche dei cromosomi. Queste
differenze trasmissibili sono definite eteromorfismi cromosomici, interessando di solito il DNA
ripetitivo, hanno una distribuzione normale e non comportano conseguenze cliniche (ad
eccezione di una zona di fragilità sul braccio lungo del cromosoma X). Gli eteromorfismi
cromosomici interessano maggiormente: centromero, braccio corto dei cromosomi
acrocentrici, regioni satellite, braccio lungo del cromosoma Y..
Si conoscono quattro classi principali di eteromorfismi cromosomici:
a. Variazioni dell’eterocromatina pericentromerica. Si tratta di variazioni che riguardano
le dimensioni e la posizione dell’eterocromatina localizzata in prossimità del
centromero. Interessano i cromosomi 1, 9 e 16 e segregano come caratteri autosomici
codominanti. Il sistema ISNC descrive le variazioni nelle dimensioni del segmento
eterocromatinico come:
qh+ oppure qh(h=eterocromatina)
per es: 46,XX,9qh+
b. Variazioni della regione eterocromatica del cromosoma Y. Circa 1/5 dei maschi ha un
cromosoma Y di dimensioni nettamente più lunghe o più corte. Le variazioni dei
questo DNA ripetitivo non determinano conseguenze cliniche. Interessano i
cromosomi: 13, 14, 15, 21 e 22.
Yqh+ oppure Yqhc. Eteromorfismi dei cromosomi acrocentrici. Il braccio corto dimostra consistenti
variazioni che riguardano l’eterocromatina centromerica, il filamento che unisce il
braccio corto ai satelliti ed i satelliti.
d. Siti fragili. Sono punti cromosomici a livello dei quali si evidenziano lacune o rotture
spontanee o indotte dal trattamenti. Hanno la stessa localizzazione in tutte le cellule di
un individuo ed in tutti i familiari, che li ereditano come caratteri codominanti. Solo il
sito fragile Xq27.3 comporta conseguenze cliniche (Sindrome dell’X fragile).
fra(16q)(q22.1)
fra(Xq)(q27.3)
Le ANOMALIE CROMOSOMICHE si distinguono in:
 Anomalie cromosomiche costituzionali: vengono riscontrate in tutte le cellule di un
individuo (omogenee) o una sostanziale porzione di esse. Possono originare durante la
gametogenesi, durante le prime fasi dello sviluppo embrionale oppure possono essere
ereditate da un genitore.
 Anomalie cromosomiche acquisite (o somatiche); sono limitate ad un tessuto o ad
una linea cellulare (mosaico genetico). Spesso sono associate a tumori (ad e.
leucemie e linfomi).
Le anomalie cromosomiche per la maggior parte rientrano in due categorie:
1. Anomalie cromosomiche numeriche implicano un cambiamento nel numero di
cromosomi, senza rotture cromosomiche.
È possibile distinguere tre classi di anomalie cromosomiche numeriche:
- Si definisce poliploidia ogni cromosoma superiore al valore diploide, che sia un
multiplo esatto del corredo aploide (n). Si riconoscono: la triploidia (3n), la
tetraploidia (4n) e la pentaploidia (5n).
-
La poliploidia più comune è la “triploidia” che è determinata dalla fecondazione di
un singolo ovulo da parte di due spermatozoi (dispermia) o dalla fecondazione
che coinvolge un gamete diploide anomalo. La “tetraploidia” di solito è dovuta al
non completamento della prima divisione zigotica: il DNA è stato replicato, ma in
seguito la divisione cellulare non avviene come di consueto.
Anche se la poliploidia costituzionale è rara, in tutti gli individui alcune cellule sono
poliploidi. Ad esempio, le cellule del fegato o di altri tessuti in rigenerazione sono
naturalmente tetraploidi a causa della reduplicazione del DNA. Un altro esempio è
fornito dai megacariociti, cellule dotate di nuclei molto grandi, che posseggono 816 volte il normale numero aploide di cromosomi. Piastrine, globuli rossi, cellule
epiteliali squamose, invece, non hanno un nucleo e sono quindi “nulliploidi”.
Il termine aneuploidia definisce invece il numero cromosomico diverso da un
multiplo esatto del corredo aploide. Il principale tipo di aneuploidia è la
“monosomia”, che consiste nella mancanza di un cromosoma in una coppia di
omologhi (2n-1): un esempio è la monosomia del cromosoma X o Sindrome di
Turner (45,X). Altro esempio è la “nullisomia”, cioè la mancanza di entrambi gli
elementi di una coppia di omologhi (2n-2).
Particolarmente frequente è la “trisomia” (2n+1), che consiste nella presenza di un
cromosoma in soprannumero in una coppia di omologhi.
Le cellule aneuploidi sono causate da.
a. Non-disgiunzione. È dovuta all’incapacità dei cromosomi appaiati di separarsi
durante la I divisione meiotica, o dei cromatidi fratelli appaiati di separarsi
durante la II divisione meiotica o durante la mitosi. I due cromosomi o cromatidi
congiunti migrano a un polo e vengono inclusi in una sola cellula figlia, mentre
l’altra avrà del materiale genetico in meno: alla meiosi si formano gameti
disomici e nullisomici, mentre alla mitosi si formano cellule trisomiche e
monosomiche.
b. Ritardo (o lag) anafasico. Questo termine descrive la mancata incorporazione di
un cromosoma nel nucleo di una delle cellule figlie dopo la divisione cellulare.
La circostanza si verifica in seguito alla ritardata migrazione del cromosoma
durante l’anafase, con conseguente perdita del cromosoma. In questo caso si
formano cellule con monosomia/diploidia.
Frequenza e posizione dei crossing-overe rappresentano fattori che possono
influenzare un evento di non-disgiunzione. Inoltre, la maggior parte delle
aneuploide cromosomiche origina da una non disgiunzione nel corso della I
divisione meiotica materna.
A tal proposito, aberrazioni cromosomiche si riscontrano in circa il 25% degli ovociti
(prevalentemente aneuplodie) e circa il 10% degli spermatozoi di maschi fertili (per
il 45% si tratta di anomalie numeriche, per il 55% di aberrazioni strutturali).
L’identificazione dell’origine parentale delle aneuploidie è effettuata mediante
l’uso dell’eteromorfismo della regione attorno il centromero e del braccio corto dei
cromosomi acrocentrici. Inoltre, è frequente l’uso di marcatori molecolari, che, per
l’elevato grado di variabilità intra- ed interindividuale, consentono di definire con
maggiore accuratezza i meccanismi attraverso i quali originano le anomalie
cromosomiche.
- La mixoploidia può verificarsi come risultato del “mosaicismo” (un individuo è un
mosaico genetico quando possiede due o più linee cellulari geneticamente
differenti, che derivano tutte da un unico zigote) o, raramente, come risultato del
“chimerismo” (una chimera ha due linee cellulari geneticamente diverse, che
originano da zigoti differenti). Il mosaicismo è dovuto a non disgiunzione o ritardo
cromosomico verificatisi in una delle divisioni mitotiche in fase embrionale precoce.
Le cellule monosomiche, di solito, muoiono dopo poco tempo.
Distinguiamo:
 Mosaicismo meiotico. Lo zigote è aneuploide (per es. trisomico), la seconda
linea cellulare diploide è prodotta per un errore mitotico successivo alla
fecondazione. Il lag anafasico è il meccanismo più frequente.
 Mosaicismo somatico. La seconda linea cellulare aneuploide ha origine,
sempre per errore mitotico, in un feto diploide. La non-disgiunzione è il
meccanismo più probabile.
Il mosaicismo può essere generalizzato o confinato (placenta o feto) e si deve
considerare: il tempo in cui si verifica l’evento mutazionale, la linea cellulare
coinvolta, la vitalità della linea cellulare mutante.
Se si verifica un errore mitotico nella I divisione post-zigotica o subito dopo, è
probabile un mosaicismo confinato alla placenta o all’embrione/feto.
Se il mosaicismo colpisce il trofoblasto o la massa cellulare interna avremo un
mosaicismo confinato; se la mutazione colpisce lo zigote, si ha un mosaicismo
generalizzato. Nel caso di mosaicismo confinato all’embrione/feto, le cellule
aneuploidi possono loro stesse determinare una morfogenesi anomala; la morte
selettiva delle cellule aneuploidi può avvenire in un certo stadio dello sviluppo e
può distruggere la normale morfogenesi. Il mosaicismo può essere presente solo in
specifici tessuti, come le gonadi, dive l’individuo può presentare alterazioni.
Tutte le deviazioni del numero dei cromosomi dal normale corredo diploide
determinano alterazioni della “dose genica”, cioè un eccesso o un difetto dei
prodotti dei geni localizzati sui cromosomi che vanno incontro a eteroploidia. In
genere, le anomalie dei cromosomi sessuali sono meno gravi rispetto a quello degli
autosomi. La principale conseguenza delle eteroploidie cromosomiche è dunque la
letalità, cioè l’alto rischio di aborto spontaneo precoce, che si verifica nel 90% dei casi
nel primo trimestre di gravidanza.
Le trisomie autosomiche, generalmente si associano a: basso peso alla nascita, ritardo
mentale, bassa statura, facies dismorfica, anomalie di mani e piedi, difetti cardiaci,
malformazioni cerebrali, malformazioni genito-urinarie.
- Trisomia 18, Sindrome di Edward. Ha una prevalenza di circa 1:6000 neonati. Circa il
90% dei pazienti presenta trisomia 18 libera, che in oltre il 95% dei casi origina da
non-disgiunzione materna, essenzialmente alla I divisione. In meno del 10% dei
pazienti la trisomia è in mosaico. Il fenotipo è caratterizzato da: ritardo della
crescita prenatale e postnatale; malformazioni multiple; micrognatia; occipite
prominente; alterazioni scheletriche; cardiopatie; difetti renali. Solo il 10%
sopravvive oltre il primo anno e presenta una grave compromissione neurologica.
- Trisomia 13, Sindrome di Patau. Ha una frequenza alla nascita di circa 1:10000 nati.
Circa l’80% delle sindromi di Patau sono dovute a trisomia 13 libera, che origina
prevalentemente per non-disgiunzione alla meiosi materna. La sindrome è
caratterizzata da: peso sotto la norma; labioschisi e palatoschisi; assenza degli
occhi; cecità e sordità; polidattilia; cardiopatie; difetti intestinali, renali e
scheletrici; ritardo mentale grave; convulsioni e crisi di apnea. Solo il 5% sopravvive
oltre il terzo anno di vita.
Le anomalie dei cromosomi sessuali includono, tra le altre:
Sindrome di Turner può essere associata a diversi cariotipi. In circa il 55% dei
pazienti è dovuta a monosomia del cromosoma X (cariotipo 45,X), che nell’80%
dei casi origina per perdita del cromosoma sessuale paterno. La seconda più
comune anomalia cromosomica associata alla sindrome di Turner è il mosaicismo
X/XX (45,X/46,XX) o X/XY (45,X/46,XY). Circa il 20% dei pazienti presenta
un’anomalia strutturale di un cromosoma X, che può essere un isocromosoma per
le braccia lunghe (cariotipo 46,X, i(Xq)). Il fenotipo è caratterizzato da: bassa
statura; infantilismo dei caratteri sessuali secondari; amenorrea primaria; gonadi
fibrose e ipoplasiche e prive di follicoli; l’intelligenza è nella norma (QI medio si
aggira intorno a 90).
Sindrome di Klinefelter si associa a cariotipo 47,XXY. È di norma dovuta a una nondisgiunzione meiotica materna. Il fenotipo è caratterizzato da: ipogonadismo;
bassi livelli di testosterone; azoospermia; sterilità; sproporzione tra lunghezza di arti
e tronco; statura superiore alla media.
2. Anomalie cromosomiche strutturali sono il risultato di rotture cromosomiche.
Si possono ottenere diversi tipi di anomalie cromosomiche strutturali, a seconda del
numero di punti di rottura cromosomici. Le anomalie cromosomiche strutturali possono
essere “bilanciate” se non c’è acquisizione o perdita netta di materiale cromosomico,
o “non bilanciate” se c’è acquisizione o perdita netta di materiale cromosomico.
Si ditinguono anche in “intercromosomiche” quando sono coinvolti cromosomi diversi
e in “intracromosomiche” quando il riarrangiamento interessa un singolo cromosoma.
L’origine delle variazioni strutturali può essere imputata a:
- Rotture del cromosoma e successiva ricongiunzione
- Errori nella replicazione del DNA
- Crossing-over ineguale nella meiosi o per difetto di appaiamento che causa
cromosomi aberranti.
Le anomalie intracromosomiche comprendono delezioni, inversioni e inserzioni
intracromosomiche.
Le “delezioni” sono perdite di tratti di cromosoma. Comprendono tre tipi di anomalia.
1. Delezione terminale. È la perdita di un tratto di cromosoma distale ad un punto di
rottura che causa la formazione di un cromosoma centrico ed un frammento
acentrico. La struttura centrica ha perso il telomero del braccio che si è rotto: in
queste condizioni l’anomalia non segrega.
Vengono indicate nel cariotipo in questo modo:
- 46,XY,del(18)(q21→qter): individuo con 46 cromosomi, maschio, con delezione
del cromosoma 18 (segmento che va dalla regione 2, banda 1 del braccio
lungo fino al telomero).
- 5p-: il segno "meno" indica una perdita, in questo caso del braccio corto del
cromosoma 5.
2. Delezioni interstizial. Consiste nella perdita di un tratto intercalare di un braccio di
cromosoma, a seguito della rottura del cromosoma in due punti. Il frammento
acentrico compreso tra i due punti di rottura si perde e le estremità adesive create
dalle due rotture si saldano, conferendo nuova continuità al braccio
cromosomico. La presenza del telomero sul braccio deleto mantiene la stabilità
della cellula e consente all’anomalia di segregare. Poiché il frammento deleto non
ha centromero (frammento acentrico) verrà perso nella successiva divisione
cellulare.
Esempio di cariotipo: 46,XY,del(12)(p13.1→p13.3): individuo con 46 cromosomi,
maschio con delezione del cromosoma 12 (segmento interno al braccio corto che
va dalla sottobanda 1 della banda 3, regione 1 fino alla sottobanda 3 della
banda 3, regione 1.
3. Cromosoma ad anello. Sono delezioni che originano da due rotture sulle braccia
opposte di un cromosoma. Alla rottura segue la perdita dei frammenti acentrici e
la chiusura delle estremità adesive del cromosoma centrico. La presenza del
centromero consente la segregazione dell’anello. Tuttavia, il crossing-over tra i
cromatidi fratelli causa, alla mitosi, la formazione di anelli di dimensioni doppie, di
centrici e perciò instabili, che si perdono. I doppi crossing-over causano la
formazione di “anelli concatenati”.
Si possono anche formare anelli acentrici, per chiusura delle estremità adesive di
segmenti acentrici. La mancanza del centromero non consente tuttavia la
segregazione di queste strutture.
Un esempio di cariotipo è: 46,XX,r(20)(p13q13)
In teoria, le delezioni interstiziali ed i cromosomi centrici ad anello segregano nel 50%
dei gameti di un individuo eterozigote. Tuttavia, la maggior parte di queste anomalie
riduce l’idoneità biologica dell’individuo, che di solito non si riproduce.
La perdita di un segmento di cromosoma elimina il crossing over nella regione deleta
e consente l’espressione di mutazioni recessive localizzate sul cromosoma selvatico,
nella regione omologa a quella deleta (pseudo dominanza genica). Lo
sbilanciamento genico causato dalla delezione ha di solito importanti effetti sul
fenotipo, che è caratterizzato da ritardo di accrescimento, deficit mentale, difetti
congeniti e dismorfismi. Sono state identificate varie sindromi da delezione:
Sindrome di Wolf-Hirschhorn è causata da una delezione del braccio corto del
cromosoma 4. Circa il 90% dei pazienti origina da una nuova mutazione, 4/5 delle
quali si verificano nella spermatogenesi; gli altri sono dovuti alla malsegregazione
di anomalie bilanciate presenti in un genitore eterozigote.
Malattia del “cri du chat” è dovuta ad una delezione del braccio corto del
cromosoma 5. Circa l’80% delle delezioni sono paterne. Il 10% dei pazienti origina
dalla malsegregazione di traslocazioni parentali.
Sindrome di Williams origina da una delezione a livello di una sottobanda del
cromosoma 7.
Le delezioni della porzione eterocromatinica del cromosoma Y non hanno
conseguenze cliniche mentre le delezioni della parte eucromatica del braccio lungo
si associano di solito ad infertilità. La delezioni della regione Yp sulla quale è
localizzato il determinante dello sviluppo maschile causa reversione sessuale.
Le “inversioni” sono le più comuni anomalie strutturali dei cromosomi umani. Le
inversioni originano da due rotture sulle braccia cromosomiche, seguite dalla
rotazione di 180° del segmento compreso tra i due punti di rottura e dalla saldatura
del segmento che è ruotato. Le inversioni vengono classificate in :
Inversioni pericentriche. Originano da rotture situate su braccia opposte e perciò
comprendono il centromero nel tratto che va incontro ad inversione.
Un esempio di cariotipo è 46,XY,inv(1)(p31q43): individuo con 46 cromosomi,
maschio, che porta una inversione nel cromosoma 1 (il segmento che va dalla
banda 1, regione 3 sul braccio corto fino alla banda 3, regione 4 sul braccio
lungo è orientato al contrario rispetto al normale andamento dall'alto verso il
basso.
Inversioni paracentriche. Originano da rotture localizzate su uno stesso braccio
cromosomico e perciò non contengono il centromero nel tratto invertito. Esempio
di cariotipo: 46,XY,inv(1)(q23q42)
La principale conseguenza delle inversioni è il rischio di produzione di “gameti
sbilanciati”.
I portatori di inversioni pericentriche possono produrre tre tipi di gameti:
Sbilanciati (con duplicazioni e delezioni)
Normali
Portatori dell’inversione
I portatori di inversioni paracentriche possono produrre gameti
Sbilanciati e instabili
Normali
Portatori dell’inversione
Le inserzioni intracromosomiche originano da tre rotture sullo stesso cromosoma. Due
rotture si verificano su un braccio ed il segmento compreso tra i due punti di rottura va
ad inserirsi a livello del terzo punto di rottura, di solito sull’altro braccio. Sono rare e
portano alla formazione di gameti sbilanciati.
Le anomalie intercromosomiche comprendono le traslocazioni reciproche e le
traslocazioni robertsoniane tra cromosomi acrocentrici, che originano da due rotture
su cromosomi diversi; le traslocazioni per inserzione, che origine da tre rotture.
Le traslocazioni reciproche hanno una frequenza di 1:600 neonati. Consistono nello
scambio di segmenti tra due cromosomi non omologhi che sono andati incontro a
rottura. I segmenti distali ai punti di rottura sono traslocati sull’altro cromosoma. I
cromosomi nella nuova configurazione vengono anche definiti “cromosomi derivati”.
Lo scambio è reciproco e perciò simmetrico, senza perdita o acquisizione di
materiale.
La principale conseguenza clinica è il rischio di produrre gameti sbilanciati.
-
Alla sinapsi della prima profase, infatti, non si formano i normali bivalenti. I cromosomi
traslocati, insieme ai loro omologhi normali, formano un quadrivalente a forma di
croce, che garantisce l’appaiamento tra i cromosomi traslocati ed i rispettivi
omologhi normali. All’anafase della I divisione meiotica, i quattro centromeri del
quadrivalente si distribuiscono nelle cellule figlie secondo combinazioni diverse,
migrando a 2:2 ai poli opposti, o, in alternativa in rapporto di 3:1 o 4:0. Di solito i
cromosomi del quadrivalente segregano nelle cellule figlie in rapporto 2:2
(segregazione 2:2). Questa segregazione dà origine a sei tipi di gameti, a seconda
che si tratti di segregazione alternata o adiacente. Nella segregazione alternata
migrano allo stesso polo i centromeri che nel quadrivalente si trovano in una posizione
non contigua. I gameti che originano sono perciò aploidi e posseggono un
complemento genetico completo. Nello zigote, i primi danno origine a un corredo
cromosomico normale e i secondi ad un corredo cromosomico eterozigote per la
traslocazione. La segregazione alternata è l’unica che produce gameti normali o
bilanciati.
Nella segregazione adiacente migrano allo stesso polo i cromosomi che si trovano in
posizione contigua nella tetrade. Questa segregazione dà origine a quattro tipi di
gameti sbilanciati. Nella segregazione adiacente-1 migrano insieme i cromosomi con
centromeri non omologhi. La segregazione adiacente-1 è un tipo di mal segregazione
e dei sei gameti prodotti dalla segregazione 2:2, uno solo è normale, uno solo è
bilanciato e quattro sono sbilanciati.
Nella segregazione 3:1 migra ad un polo un solo cromosoma del quadrivalente,
mentre all’altro polo migrano gli altri tre cromosomi. I gameti posseggono
rispettivamente 24 e 22 cromosomi e lo zigote possiede 47 o 45 cromosomi.
In genere solo i concepimenti a 47 cromosomi sono vitali. Si formano quattro gameti
contenenti rispettivamente i due cromosomi normali del quadrivalente ed un
cromosoma traslocato (trisomia terziaria), i due cromosomi traslocati ed un
cromosoma normale (trisomia ad interscambio), un solo cromosoma traslocato
(monosomia terziaria) ed un solo cromosoma normale.
Infine, gli altri quattro gameti altamente sbilanciati sono prodotti dalla segregazione
4:0, che dà origine a zigoti non vitali.
Di solito, le traslocazioni bilanciate non hanno conseguenze sul fenotipo. Tuttavia
viene attribuito un rischio empirico del 3% ai neonati che ereditato una traslocazione
da un genitore eterozigote. Il rischio può essere imputato a diverse cause:
1. Interruzione di un gene per aploinsufficienza (nel genitore l’effetto può essere
mascherato dall’allele normale)
2. Crossing-over diseguali durante le meiosi parentali che può portare a
microdelezioni o micro duplicazioni.
3. Il segmento traslocato contiene regioni sottoposte ad imprinting genomico.
Le traslocazioni reciproche “de novo”, cioè quelle che originano nella gametogenesi
parentale e non sono familiari, hanno effetti fenotipici in circa il 7% degli eterozigoti.
Questo è dovuto a:
- Rotture che ricadono all’interno di un gene, il quale viene così inattivato.
- Cambiamento di posizione di un segmento cromosomico, che potrebbe alterare
l’espressione genica o distruggere un sito di imprinting.
Le traslocazioni robertsoniane avvengono tra due cromosomi acrocentrici non
omologhi. Nell’uomo le cinque coppie di cromosomi acro centrici 13—15(gruppo D) e
21-22 (gruppo G) vanno incontro a traslocazioni robertsoniane con una frequenza di
circa 1:900 nati. In circa l’80% dei casi sono coinvolti due cromosomi del gruppo D,
soprattutto il 13 e il 14. Le altre traslocazioni riguardano in particolare i cromosomi dei
gruppi D e G; tra esse è di gran lunga più frequente la traslocazione 14;21.
I meccanismi che determinano le traslocazioni robertsoniane comprendono:
1. Fusione a livelloo del centromero dei due cromosomi (fusione centrica).
2. Rottura di un acrocentrico a livello del braccio corto e dell’altro acro centrico a
livello del braccio lungo, sotto il centromero, seguita dalla saldatura delle estremità
rotte.
3. Rottura e riunione dei due acrocentrici a livello delle braccia corte.
I primi due meccanismi portano alla formazione di cromosomi monocentrici, il terzio di
un cromosoma di centrico, che, per soppressione funzionale di un centromero, si
comporta da monocentrico.
Alla prima profase meiotica gli eterozigoti per traslocazioni robertsoniane tra
acrocentrici non omologhi (cioè che posseggono 45 cromosomi liberi) formano un
trivalente, prodotto dalla sinapsi tra il cromosoma traslocato e i due omologhi normali.
All’anafase, per segregazione 2:1 si producono sei tipi di gameti. Dallas segregazione
alternata originano gameti normali e bilanciati; la segregazione adiacente produce
solo gameti sbilanciati, in particolare due tipi di gameti disomici e due tipi di gameti
nullisomici. Gli zigoti prodotti da questi gameti sbilanciati si comportano da aneuploidi,
in quanto presentano la duplicazione, o impropriamente la trisomia, di un intero
cromosoma. Sopravvivono solo i concepimenti sbilanciati con trisomia 13 o 21.
I portatori di traslocazioni robertsoniane hanno una maggiore probabilità di produrre
gameti sbilanciati che possono essere causa di poliabortività, ridotta fertilità o
infertilità, oppure di concepire figli malati con cariotipo sbilanciato.
eterozigoti
14
14/21
21
possibili gameti
14 21
14/21
14/21 21
14
21
14 14/21
zigoti
Normale Eterozigote
Trisomia 21
Letali
bilanciato
Le traslocazioni per inserzione sono anomalie rare che originano da tre rotture, due
delle quali sullo stesso braccio cromosomico. Il segmento di cromosoma compreso tra
i due punti di rottura si integra su un altro cromosoma, a livello di un terzo punto di
rottura. L’inserzione può essere diretta se il segmento mantiene sul cromosoma
accettore lo stesso orientamento, rispetto al centromero, che aveva sul cromosoma
originario. Viceversa l’inserzione viene detta invertita.
Gli eterozigoti hanno in genere fenotipo normale. All’anafase i bivalenti segregano
normalmente e formano gameti normali, bilanciati con segmento duplicato e deleto
in proporzioni uguali. Il rischio per gli eterozigoti di avere un figlio sbilanciato dipende
dalle dimensioni del segmento inserito.
La duplicazione cromosomica consiste nella presenza di una copia in eccesso di un
segmento di cromosoma. le duplicazioni cromosomiche originano da:
- Malsegregazione in un soggetto eterozigote per una traslocazione reciproca.
- Crossing-over all’interno di un’ansa formata da un segmento di cromosoma che è
andato incontro ad inversione pericentrica.
Mal segregazione in soggetti eterozigoti per inserzioni intracromosomiche o
intercromosomiche.
- Anomalie da alterata divisione del centromero o da rottura isocromatidica.
- Crossing-over ineguale, che causa duplicazioni in tandem. Questo evento è
relativamente comune nella etero cromatina ericentromerica, dove sono
localizzate sequenze altamente ripetute. Questo spiega l’elevata frequenza con la
quale vengono identificate duplicazioni in queste regioni (cosiddette varianti
“qh+”).
Tutte le braccia cromosomiche possono andare incontro a duplicazioni parziali. Alcuni
sbilanciamenti si associano a segni clinici ricorrenti come difetti di accrescimento,
ritardo dello sviluppo psicomotorio e dimorfismi peculiari. La frequenza è di circa
1:4000 nati.
Sono state identificate anche anomalie in cui le cellule sembrano avere un cariotipo
normale, ma in cui si può mostrare che l’insieme dei cromosomi deriva da contributi
ineguali dei due genitori. La Diploidia Uniparentale determina un prodotto del
concepimento in cui tutti i cromosomi derivano da un unico genitore. La diploidia
uniparentale si riscontra nelle moli idatiformi, prodotti anomali del concepimento con
cariotipo 46,XX di origine esclusivamente paterna. I teratomi ovarici sono invece il risultato
di una diploidia uniparentale materna.
Nel caso in cui i due omologhi di una specifica coppia di cromosomi derivano da uno
solo dei due genitori si parla di Disomia Uniparentale (UDP).
Si distingue in:
- Eterodisomia: vengono ereditati i due omologhi di uno stesso genitore;
- Isodisomia: vengono ereditate le due copie di un unico omologo.
Si presume che nella diploidia uni parentale e nella disomia uni parentale i problemi siano
causati dall’espressione anomali di un piccolo numero di geni sottoposti a imprinting.
L’imprinting genomico consiste in una espressione uniparentale di determinate regioni
geniche, per cui si esprime il gene su uno solo dei due omologhi della coppia. In tutti i
tessuti in cui il gene viene espresso, è repressa drasticamente l’espressione o dell’allele
ereditato dal padre, o di quello ereditato dalla madre, il che determina un’espressione
monoallelica. L’espressione del carattere genetico varia a seconda se sia stato trasmesso
l’allele materno o paterno, per cui dipende dal genitore che li ha trasmessi.
Durante la gametogenesi, in entrambi i sessi, l’imprinting viene rimosso. Successivamente,
quando i gameti maturano, l’imprinting viene ripristinato in maniera sesso-specifica, cioè
quel gene viene bloccato in tutti i cromosomi dei gameti maschili e reso attivo in tutti
quelli femminili. Nei figli vi sarà una copia inattiva e una attiva.
È chiaro che debba esserci qualche meccanismo in grado di distinguere tra alleli ereditati
dal padre e alleli ereditati dalla madre: quando i cromosomi attraversano le linee
germinali del maschio e della femmina devono acquisire una qualche “impronta” che
segnala la differenza tra alleli paterni e materni nell’organismo. Una componente
importante, almeno per il mantenimento dello stato di imprinting, è la metilazione allelespecifica del DNA: tutti i geni soggetti ad imprinting sono caratterizzati da regioni ricche in
CG con metilazione differenziale.
La sindrome di Prader-Willi (PWS) e la sindrome di Angelman (AS) sono entrambe causate
da anomalie in geni localizzati in 15q11-q13 e sottoposti a imprinting in modo differenziale.
La PWS si presenta con ritardo mentale, ipotonia, marcata obesità, ipogenitalismo
maschile. È causata dalla perdita di funzione dei geni che sono espressi solo dai
-
cromosomi di origine paterna. La AS si manifesta con ritardo mentale, eloquio difficoltoso,
ritardo di crescita, iperattività, scoppi di ilarità inappropriata. È dovuta alla perdita di
funzione di gene strettamente associato che viene espresso solo dal cromosoma di
origine materna.
Sono diversi gli eventi che possono portare a perdere una copia paterna (PWS) o
materna (AS) delle rispettive sequenze sul cromosoma 15:
Le delezioni de novo di 4-4,5 Mb tra ripetizioni fiancheggianti in 15q-11q13 sono la causa
più comune. Le delezioni sul cromosoma paterno causano la PWS, la delezione della
stessa regione dal cromosoma di origine materna causa la AS.
La disomia uniparentale (UPD). Alcuni prodotti del concepimento hanno un cariotipo
normale 46,XY o 46,XX, ma possono avere ereditato due copie dello stesso cromosoma
da uno dei due genitori (in questo caso del cromosoma 15). Ciò può determinare due
fenotipi diversi a seconda dell’origine parentale del relativo cromosoma. Ad esempio,
individui 46,XX o 46,XY che ereditano entrambe le copie del cromosoma 15 dal proprio
padre (disomia uni parentale paterna) sviluppano la sindrome di Angelman; se entrambe
le copie sono ereditate dalla madre (disomia uni parentale materna) si ha invece la
sindrome di Prader-Willi. La causa tipica è il “recupero della triploidia”: un prodotto di
concepimento con trisomia 15 si sviluppa fino a un certo stadio, ma poi non può
procedere ulteriormente a meno che, casualmente, una non disgiunzione mitotica non
produca una cellula con soltanto due copie del cromosoma 15. La maggior parte dei
prodotti del concepimento con trisomia 15 sono 15M15M15P. una volta su tre, la perdita
casuale di un cromosoma 15 produce un feto con disomia uniparentale, 15M15M (feto
affetto dal PWS).
Sul cromosoma 15 di origine materna vengono espressi i geni UBE3A e ATPC10 (in rosso).
Sul cromosoma 15 di origine paterna questi due geni sono bloccati dall’espressione di un
lungo trascritto di RNA antisenso, la cui trascrizione inizia a livello del gene SNRPN. Sul
cromosoma di origine materna SNRPN non viene espresso perché metilato nella regione
del promotore. La AS è causata dalla mancata espressione del singolo gene UBE3A (che
può derivare dal mancato blocco di SNRPN). La PWS è causata dalla mancata
espressione di più geni, ma un ruolo di particolare rilievo è svolto da uno snoRNA che
contribuisce all’espressione di un recettore della serotonina ad alta affinità.