Lezione 6 giugno 2011 CTF I anno - Dr. S. Forte - l

Biologia Molecolare
CDLM in CTF 2010-2011 – L’analisi del genoma
L’analisi del genoma
n 
La tipizzazione del DNA
n 
La genomica e la bioinformatica
n 
La genomica funzionale
La tipizzazione del DNA
DNA Fingerprinting
- Medicina legale
- Test di paternità/maternità
- Analisi inquinanti biotici
- Tracking specie vegetali
Le basi della tipizzazione
del DNA
Lo 0,1% del DNA differisce tra gli individui
Regioni geniche: pressione selettiva
<500 bp
>500 bp
Il DNA satellite
Eterocromatina vicino
centromeri e telomeri
L’analisi dei minisatelliti
n 
Lunghezza della ripetizione: 15-50bp
Analisi multilocus
L’analisi dei microsatelliti
(STR)
n 
Lunghezza della ripetizione: 2-6bp
n 
Tecnologie amplificative (PCR)
n 
Funziona anche su DNA parzialmente degradato
L’analisi del genoma
n 
La tipizzazione del DNA
n 
La genomica e la bioinformatica
n 
La genomica funzionale
Sequenziamento dei
genomi
1975: prima sequenza di un genoma completo ΦX174 (5Kb)
1977-78: SV40 (5Kb)
1981: genoma mitocondriale umano (16Kb)
1982: Fago lambda (49Kb)
1984: Epstein-Barr (170Kb)
1985: primi organismi cellulari (Haemophilus influenzae 1,83Mb
e Mycoplasma genitalium 0,58 Mb)
2001: Pubblicazione del genoma umano (3 miliardi di basi nel
suo corredo aploide)
Sequenziamento
dei genomi
Il Paradosso del valore C
n 
Con valore C si intende la quantità di DNA per genoma; non
c’è un'ovvia correlazione fra la complessità degli organismi e
la quantità di DNA del genoma.
n 
In realtà nei genomi degli organismi meno complessi si
risparmia spazio in quanto i geni sono più vicini tra loro.
n 
Confrontando il genoma umano con quello del lievito, emerge
che l'organizzazione di quest'ultimo è molto più economica di
quella del genoma umano:
n 
n 
n 
n 
I geni sono più compatti
Le sequenze intergeniche sono più piccole
Le ripetizioni disperse e le altre sequenze non codificanti occupano
molto meno spazio
Il genoma del lievito è più "concentrato"!
Il genoma umano ed il sequenziamnto
Il Progetto Genoma
Umano
n 
Il Genoma è fatto di DNA, molecola costituita da 4
diversi tipi di nucleotidi (A, C, G, T).
n 
Obiettivo del progetto: determinare la sequenza
nucleotidica dell'intero genoma nucleare umano.
n 
Progetto pubblico, finanziato da governi e
organizzazioni di tutto il mondo.
n 
Progetto privato: Celera Genomics.
n 
Risultati pubblicati nel 2001.
n 
Ad oggi risulta sequenziato circa il’92% del genoma
umano
Stato di completamento
n 
First, the central regions of each chromosome, known as centromeres, are
highly repetitive DNA sequences that are difficult to sequence using current
technology. The centromeres are millions (possibly tens of millions) of base
pairs long, and for the most part these are entirely un-sequenced.
n 
Second, the ends of the chromosomes, called telomeres, are also highly
repetitive, and for most of the 46 chromosome ends these too are
incomplete. It is not known precisely how much sequence remains before
the telomeres of each chromosome are reached, but as with the
centromeres, current technological restraints are prohibitive.
n 
Third, there are several loci in each individual's genome that contain
members of multigene families that are difficult to disentangle with shotgun
sequencing methods – these multigene families often encode proteins
important for immune functions.
n 
Other than these regions, there remain a few dozen gaps scattered around
the genome, some of them rather large, but there is hope that all these will
be closed in the next couple of years.
Da wikipedia
Metodi di sequenziamento
dei genomi
L’analisi del genoma
n 
La tipizzazione del DNA
n 
La genomica e la bioinformatica
n 
La genomica funzionale
DNA Microarrays
Decine di migliaia di trascritti possono essere analizzati quantitativamente in un
singolo esperimento
In a typical cDNA or oligo platform, 2 different
channels can be used to identify differences in
expression profiles of two samples.
Microarray: the
hybridization (1)
Microarray: the
hybridization (2)
Gene 1
Tagged cDNA from sample
Gene 2
The hybridization is due to
Watson-Crick base paring
Gene 3
Coated glass slide
Microarray di DNA
Protein Arrays
n 
I siRNA sono piccoli RNA che operano
autosilenziamento (stesso locus)
n 
Sono di solito complementari al 100% alle sequenze
bersaglio
n 
I microRNA (o miRNA) sono coinvolti nei processi
di eterosilenziamento
n 
La complementarietà è inferiore al 100%
Protein Arrays in fase diretta
Protein Arrays in fase
inversa