Biologia Molecolare CDLM in CTF 2010-2011 – L’analisi del genoma L’analisi del genoma n La tipizzazione del DNA n La genomica e la bioinformatica n La genomica funzionale La tipizzazione del DNA DNA Fingerprinting - Medicina legale - Test di paternità/maternità - Analisi inquinanti biotici - Tracking specie vegetali Le basi della tipizzazione del DNA Lo 0,1% del DNA differisce tra gli individui Regioni geniche: pressione selettiva <500 bp >500 bp Il DNA satellite Eterocromatina vicino centromeri e telomeri L’analisi dei minisatelliti n Lunghezza della ripetizione: 15-50bp Analisi multilocus L’analisi dei microsatelliti (STR) n Lunghezza della ripetizione: 2-6bp n Tecnologie amplificative (PCR) n Funziona anche su DNA parzialmente degradato L’analisi del genoma n La tipizzazione del DNA n La genomica e la bioinformatica n La genomica funzionale Sequenziamento dei genomi 1975: prima sequenza di un genoma completo ΦX174 (5Kb) 1977-78: SV40 (5Kb) 1981: genoma mitocondriale umano (16Kb) 1982: Fago lambda (49Kb) 1984: Epstein-Barr (170Kb) 1985: primi organismi cellulari (Haemophilus influenzae 1,83Mb e Mycoplasma genitalium 0,58 Mb) 2001: Pubblicazione del genoma umano (3 miliardi di basi nel suo corredo aploide) Sequenziamento dei genomi Il Paradosso del valore C n Con valore C si intende la quantità di DNA per genoma; non c’è un'ovvia correlazione fra la complessità degli organismi e la quantità di DNA del genoma. n In realtà nei genomi degli organismi meno complessi si risparmia spazio in quanto i geni sono più vicini tra loro. n Confrontando il genoma umano con quello del lievito, emerge che l'organizzazione di quest'ultimo è molto più economica di quella del genoma umano: n n n n I geni sono più compatti Le sequenze intergeniche sono più piccole Le ripetizioni disperse e le altre sequenze non codificanti occupano molto meno spazio Il genoma del lievito è più "concentrato"! Il genoma umano ed il sequenziamnto Il Progetto Genoma Umano n Il Genoma è fatto di DNA, molecola costituita da 4 diversi tipi di nucleotidi (A, C, G, T). n Obiettivo del progetto: determinare la sequenza nucleotidica dell'intero genoma nucleare umano. n Progetto pubblico, finanziato da governi e organizzazioni di tutto il mondo. n Progetto privato: Celera Genomics. n Risultati pubblicati nel 2001. n Ad oggi risulta sequenziato circa il’92% del genoma umano Stato di completamento n First, the central regions of each chromosome, known as centromeres, are highly repetitive DNA sequences that are difficult to sequence using current technology. The centromeres are millions (possibly tens of millions) of base pairs long, and for the most part these are entirely un-sequenced. n Second, the ends of the chromosomes, called telomeres, are also highly repetitive, and for most of the 46 chromosome ends these too are incomplete. It is not known precisely how much sequence remains before the telomeres of each chromosome are reached, but as with the centromeres, current technological restraints are prohibitive. n Third, there are several loci in each individual's genome that contain members of multigene families that are difficult to disentangle with shotgun sequencing methods – these multigene families often encode proteins important for immune functions. n Other than these regions, there remain a few dozen gaps scattered around the genome, some of them rather large, but there is hope that all these will be closed in the next couple of years. Da wikipedia Metodi di sequenziamento dei genomi L’analisi del genoma n La tipizzazione del DNA n La genomica e la bioinformatica n La genomica funzionale DNA Microarrays Decine di migliaia di trascritti possono essere analizzati quantitativamente in un singolo esperimento In a typical cDNA or oligo platform, 2 different channels can be used to identify differences in expression profiles of two samples. Microarray: the hybridization (1) Microarray: the hybridization (2) Gene 1 Tagged cDNA from sample Gene 2 The hybridization is due to Watson-Crick base paring Gene 3 Coated glass slide Microarray di DNA Protein Arrays n I siRNA sono piccoli RNA che operano autosilenziamento (stesso locus) n Sono di solito complementari al 100% alle sequenze bersaglio n I microRNA (o miRNA) sono coinvolti nei processi di eterosilenziamento n La complementarietà è inferiore al 100% Protein Arrays in fase diretta Protein Arrays in fase inversa