“In molecular terms, a gene commonly is defined as the entire nucleic acid sequence that is necessary for the synthesis of a functional polypeptide. “ Lodish et al. Molecular Cell Biology “In molecular terms, a gene commonly is defined as the entire nucleic acid sequence that is necessary for the synthesis of a functional polypeptide. According to this definition, a gene includes more than the nucleotides encoding the amino acid sequence of a protein, referred to as the coding region.” “Enhancers” Nei geni degli eucarioti gli enhancers possono distare dalla regione codificante anche più di 50 Kb. Alcune sequenze di DNA sono trascritte in RNA che non codifica proteine (e.g., tRNAs and rRNAs) Geni di I classe Geni di I classe rRNA 28S, rRNA 18S, rRNA 5.8S Geni di II classe Geni di II classe mRNA, snRNAs Geni di III classe Geni di III classe rRNA5S, tRNA, snRNAU6, scRNAs International Human Genome Sequencing Consortium Nature ottobre 2004 3.08 Gb Genoma intero 2.88 Gb Componente eucromatica 34 Mb Sequenze codificanti (1,2%) 21 Mb Sequenze trascritte ma non tradotte (0.7%) International Human Genome Sequencing Consortium Nature ottobre 2004 Geni 19.438 Geni caratterizzati sperimentalmente 2.188 Geni predetti 22.287 Geni 22.214 1,54 Trascritti per gene Trascritti 34.214 Il genoma è fatto solo di geni? Genoma Umano ~70% ~30% ~80% ~10% ~90% ~20% Il genoma è fatto solo di geni? Il DNA NON CODIFICANTE RIPETUTO IN TANDEM SATELLITE, tipico delle sequenze centromeriche (a-satellite, monomero di 171 bp) MINISATELLITE, monomero 6-64bp, altamente polimorfico. Utilizzato per esami di fingerprint del DNA. Es.DNA telomerico (TTAGGG) MICROSATELLITE, 2-4 bp ripetuti in tandem. Espansioni di triplette sono responsabili patologie (Distrofia Miotonica) di alcune Il genoma è fatto solo di geni? Il DNA NON CODIFICANTE INTERSPERSO SINE, brevi elementi nucleari ripetuti (pseudogene processato di RNA7SL) Alu (300bp, 1.000.000 copie nel genoma umano) LINE, lunghi elementi nucleari ripetuti L1 (6,1Kb a lunghezza completa, 200.000-500.000 copie) Retrovirus endogeni, HERV Anatomia del Genoma Umano Paradosso del Valore C Conserved non genic sequence Emmanouil et al. (2005) Nature Reviews Genetics Conserved non genic sequence Emmanouil et al. (2005) Nature Reviews Genetics Genes Functions A B C D Create cellular complexity by differential genes expression This form of combinatorial coding endows an organism with n genes to create, in theory, 2n different cell-specific gene batteries. This rationalization provides an easy explanation for the fact that the absolute number of genes in a genome does not correlate with organismal complexity Hobert (2004) TIBS Hobert (2004) TIBS Un gene …………un enzima Un gene ………una catena polipeptidica Un gene………più catene polipeptidiche Meccanismi di Regolazione dell’espressione genica Fase Nucleare •Scelta del gene che deve essere espresso •Trascrizione •Maturazione dell’RNA •Trasferimento Nucleo Citoplasma Fase Citoplasmatica •Sintesi delle catene polipeptidiche •Modificazioni post-traduzionali •Trasferimento delle proteine nelle sedi di competenza