Genoma
La determinazione e la conoscenza
dell’intera sequenza genomica è la
condizione necessaria per comprendere
la biologia di un determinato organismo
Il genoma contiene le istruzioni (geni)
per la realizzazione di un organismo.
Fibrillina
a Sindrome di Marfan (nome inglese Marfan Sindrome) è un’alterazione del tessuto connettivo a
trasmissione autosomica dominante:
L’incidenza della patologia è di un soggetto affetto su 5.000 – 10.000 nati vivi, e va detto anche che
un certo numero di pazienti (il 25% circa) è rappresentato da casi sporadici, ossia da soggetti che non
hanno storia familiare e quindi sono portatori di una mutazione “fresca”.
Tra gli apparati colpiti dalla sindrome di Marfan vi è anzitutto quello cardiovascolare, con problemi di
aneurisma, di disseccazione dell’aorta e di prolasso della valvola mitrale. Risultano poi coinvolti anche
gli occhi (ectopia della lente, miopia) e lo scheletro (scoliosi, anomalie della gabbia toracica). La
malattia può infine interessare anche il sistema nervoso centrale, i polmoni, la pelle e i legamenti.
Nel 1992 è stato identificato uno dei geni principali che causano la sindrome di Marfan: si tratta del
gene fibrillina 1 (FBN1), localizzato sul cromosoma 15 in posizione 21.1, il quale codifica per un
microfilamento che è un importante costituente del tessuto elastico. Tale gene – e la proteina che
viene da esso codificata- risultano mutati nel 60% dei pazienti con Sindrome di Marfan. Una
mancata diagnosi e prevenzione cardiovascolare può portare alla morte improvvisa:
.
Fibrillina 1
Glicoproteina del tessuto connettivo, che interagisce con le altre proteine della matrice extracellulare;
Importante per la normale costituzione della parete dei vasi e dello scheletro.
La fibrillina è alla base del difetto molecolare di altre patologie quali:
Fenotipo MASS;
Ectopia della lente;
Aneurisma aorticotoracico familiare;
Dissezione aortica toracica familiare.
Il gene per la fibrillina 1 è sul cromosoma 15q21.
Motori di ricerca dei genomi
Ensembl è una banca dati bioinformatica allestita con lo scopo di
fornire informazioni aggiornate sui principali genomi eucariotici.
http://www.ensembl.org/Homo_sapiens/Info/Index
Gene fibrillina
Genomica
Studio del genoma degli organismi viventi
•
Il genoma di un organismo
contiene l’informazione
biologica necessaria per la
vita.
•
Il genoma e’ rappresentato dai
cromosomi e dal DNA
mitocondriale (negli eucarioti)
di una cellula
•
Ciascun cromosoma contiene
le unità funzionali del DNA,
denominate geni.
La biologia nell’era post-genomica
•
•
•
•
•
•
Bioinformatica
Genomica funzionale
Genomica comparata
Proteomica
Trascrittomica
Biologia dei sistemi (metabolomica,
trasduttomica, interactoma, ecc…)
• Farmacogenomica
Identificazione delle regioni codificanti
meantnfmcosarjthyuyifkfmnsbzvcaxqswthyujuk
bnpyoitjguryrtefdgvcbxnservejkamnsbegdfvrtty
ghjukiolmmlabnvbcvxcsdfergrtbioinformatica?g
jyiuoljpgkbidhgrtfydhsn
meantnfmcosarjthyuyifkfmnsbzvcaxqswthyujuk
bnpyoitjguryrtefdgvcbxnservejkamnsbegdfvrtty
ghjukiolmmlabnvbcvxcsdfergrtbioinformatica?
gjyiuoljpgkbidhgrtfydhsn
Genomica
Ogni persona rappresenta la realizzazione di un
progetto genomico specifico, condiviso tra gli
altri esseri umani.
Pur mantenendo costante il numero e la
tipologia di geni, il nostro genoma è costituito da
una sequenza di nucleotidi diversa da individuo
ad individuo.
Ciascun individuo è geneticamente unico.
Tipologie di sequenze nel genoma
umano
Bioinformatica e Genomica
APPLICAZIONI DELLA BIOINFORMATICA IN
BIOMEDICINA
Modelli molecolari
funzionali
Farnacogenomica
Progettazione di nuovi
farmaci
Reti neurali di
apprendimento
Genomica funzionale:
proteomica
Modelli interattivi
delle vie metaboliche
Maria Grazia Romanelli
COMPLESSITA’ BIOLOGICA
METODI DI STUDIO DELLA
COMPLESSITA’ BIOLOGICA
30.000?
Progetti
(30.000-100.000)
Genoma
Gene
mRNA
Splicing alternativo
precursore proteico
??
150.000??
Taglio della eventuale
sequenza segnale
Eventuali
modificazioni
post-traduzionali
proteina matura
(FUNZIONE)
Interazioni proteina-proteina
Network complessi
??
N.B.
Il delicato equilibrio di un
organismo dipende da una
moltitudine
di
funzioni
finemente organizzate e
regolate da una moltitudine
di proteine diverse che
interagiscono tra loro in
network
complessi
di
interazioni reversibili
OMICS
Genomica:
si occupa dello studio del
genoma degli organismi
viventi. In particolare si occupa
della struttura, contenuto,
funzione ed evoluzione del
genoma.
Trascrittomica
si occupa dell'espressione dei
geni negli RNA messaggeri di
un intero organismo o di un
particolare organo, tessuto o
cellula in un particolare
momento dello sviluppo
dell'organismo o in risposta ad
un stimolo
Proteomica si occupa
dell'insieme di tutte le proteine
di un organismo di un tessuto o
di una cellula, con l'obbiettivo di
determinarne la sequenza, la
funzione, la struttura
tecnologie
tridimensionale e Le
le interazioni
Genomica
OMICS
• Genomica funzionale
• Genomica comparata
Trascittomic
a
Proteomica
• Profili di espressione
degli RNAm (microarray)
• RNAi/miRNA
(interferomica/microRNA
omica
• Interattomica
• Epigenomica
• metabolomica
applicate alle “omiche” richiedono l’analisi bioinformatica
11
Linguaggio biologico
• Lingua italiana
• Genoma
Alfabeto: 21 lettere
4 lettere
Libretto di istruzioni biologiche
• DNA : 3.3 miliardi di nucleotidi distribuiti in
23 cromosomi
• Le informazioni sono rappresentate da
sequenze nucleotidiche in cui si ripetono
in numero e ordine diverso 4 tipi di basi
azotate Adenina (A) , guanina (G) citosina
( C) timina (T)
A caccia del gene
Genoma
Specie
Homo sapiens
Saccharomyces
cerevisiae
Drosophila
melanogaster
Dimensioni del
genoma
(milioni di basi)
3200
12.1
Numero di geni
N° geni teorico in
proporzione al
genoma umano
28 000
5800
98
180
13 600
1576
Paradosso del valore C: non equivalenza tra le dimensioni del
genoma e il numero di geni nel confronto tra gli eucarioti.
DNA codificante e non
%
4.7 Mb
12.1 Mb
100 Mb
3000 Mb
Genoma Umano
3000 Mb
Geni e sequenze associate
900 Mb
Non codificante
810 Mb
Introni
Codificante
90 Mb
Pseudogeni
Regioni di
controllo
DNA extragenico
2100 Mb
DNA unico e a
basso numero
di copie
1680 Mb
Ripetuto in tandem
Minisatelliti
Microsatelliti
Satellite
DNA ripetitivo
420 Mb
Disperso
SINE
LINE
Retroposoni
Il DNA spazzatura è veramente tale?
Il cariogramma umano
Centromero
= geni ribosomiali
Eterocromatina
costitutiva
Alberts et al. 2005
Sequenza
nucleotidica del
gene della globina
beta dell’uomo.
• Le sequenze
geniche si
possono scrivere
e leggere come
un testo.
• ORF: open
reading frame,
cornice di lettura
del gene.
Organizzazione in
esoni ed introni
I geni degli eucarioti sono
interrotti
• Esoni sono le sequenze tradotte, introni
sono le sequenze che interrompono in
segmenti di numero variabile il gene.