MODULO 1 ! Schema E/R Rappresentazione schematica di un fenomeno Prof. Stella Iezzi Università di Roma “Tor Vergata” X Schema E/R Descrizione schematica di un fenomeno 2.1. Rappresentazione schematica di un fenomeno 2.2. Il modello Entità-Relazione 2.3. Progettazione top-down e bottom-up 2.4. Esempi X Schema E/R 1.2. Il modello Entità-Relazione Il modello di rappresentazione Entità-Relazione è stato proposto da P. P. Chen nel 1976 in ambito informatico allo scopo di facilitare la progettazione di una base di dati. Come vedremo più avanti, il modello Entità-Relazione può essere utilizzato proficuamente anche per una formale e precisa descrizione qualitativa di un fenomeno collettivo complesso. Mediante tale modello si può costruire un grafico, ossia uno schema che costituisce una fotografia del fenomeno. Ciascuno schema è il risultato della composizione logica di cinque tipi di strutture di rappresentazione che si avvalgono di regole formali e di una simbologia grafica molto semplice ma estremamente chiara. Tali strutture sono: l'entità, la relazione, l'attributo, il sottoinsieme, la gerarchia di generalizzazione. Per facilitare la comprensione della denominazione informatica data alle strutture di rappresentazione affiancheremo, la terminologia statistica che individua lo stesso tipo di struttura. X Schema E/R Esaminiamo la simbologia del modello Entità-Relazione. Il rettangolo rappresenta una entità, ossia un insieme di oggetti di cui sono note alcune caratteristiche. In termini statistici, il rettangolo rappresenta un collettivo di unità statistiche, denominate nell'ambito dell'informatica, istanze dell'entità. Struttura di rappresentazione Terminologia Informatica Entità X Terminologia Statistica Collettivo, Popolazione Schema E/R e Il piccolo cerchio all'estremità di un segmento rappresenta un attributo, ossia una proprietà elementare dell'entità, normalmente collegato a un'entità (un rettangolo) in quanto rappresenta una sua caratteristica. L'attributo è in realtà una variabile statistica del fenomeno analizzato. L'insieme dei valori che può assumere un attributo è detto dominio e rappresenta l'insieme delle possibili modalità che un carattere può presentare, ossia la scala delle modalità del carattere. Struttura di rappresentazione Terminologia Informatica Terminologia Statistica Attributo di una entità Variabile o carattere Esempio 1.1. Schema E-R per collettivo occupati X Schema E/R Il rombo corrisponde ad una relazione, indicando un legame logico tra le istanze di due o più entità. Nella rappresentazione grafica, il rombo è collegato a due rettangoli (entità o collettivi). Struttura di rappresentazione Terminologia Informatica Terminologia Statistica Relazione fra due entità Relazione fra collettivi Come si può immediatamente osservare alla struttura "relazione" non corrisponde una struttura statistica, come invece risulta per l'entità e gli attributi, e quindi per essa non si intuisce immediatamente come possa aiutare a descrivere, con successivi mezzi statistici, il fenomeno in esame. La relazione invece ipotizza che tra i due collettivi e i dati ad essi associati esista un collegamento causale (relazione statistica) e che questa debba essere investigata, con le idonee metodologie statistiche. Esempio 1.2. Relazione fra prodotti e clienti X Schema E/R Un esagono che collega un rettangolo ad altri due o più rettangoli, rappresenta la gerarchia di generalizzazione, ossia una partizione del collettivo di unità statistiche in sottocollettivi omogenei secondo una o più variabili di stratificazione o di classificazione. Struttura di rappresentazione Terminologia Informatica Gerarchia di Generalizzazione tra entità Terminologia Statistica Partizione di un collettivo in sottocollettivi Nel caso della gerarchia di generalizzazione, le unità statistiche che costituiscono il collettivo posto in alto, vengono ripartite nei collettivi di unità statistiche posti in basso. Pertanto, tutti i collettivi posti in basso nella gerarchia di generalizzazione, denominati entità figlie o collettivi figli, possiedono tutte le caratteristiche del collettivo posto in alto, detto entità padre o collettivo padre. X Esempio 1.3. Gerarchia di generalizzazione Schema E/R Si noti che la variabile di stratificazione si suppone sia una delle variabili rilevate nel collettivo padre anche se nell'entità padre spesso non viene riportata esplicitamente, ma solo indicata nell’esagono. Una freccia che collega due rettangoli, rappresenta un legame di sottoinsieme tra due entità. Struttura di rappresentazione Terminologia Informatica Terminologia Statistica Sottoinsieme di un insieme Sottocollettivo di un collettivo Nel caso del sottoinsieme, diversamente dalla gerarchia di generalizzazione, non tutti gli oggetti del collettivo posto in alto fanno parte del collettivo o dei collettivi posti in basso; i collettivi figli, ossia quelli posti in basso, possiedono comunque tutte le caratteristiche del collettivo padre. Si noti che anche per identificare il sottoinsieme è necessaria una variabile di stratificazione che si suppone sia una delle variabili rilevate nel collettivo padre anche se nell'entità padre spesso non viene riportata esplicitamente. X Schema E/R Mediante il collegamento logico di questi semplici strutture di rappresentazione si perviene ad uno schema concettuale del fenomeno in esame. Vediamo lo schema che si riferisce al fenomeno “forze di lavoro” Numero componenti appartiene Relazione con il capo famiglia Condizione professionale Famiglia Numero componenti con occupazione stabile Sesso Individuo Età, Stato civile Titolo di studio Condizione Professionale Settore di attività Tipo di occupazione Ore di lavoro Posizione nella professione Occupato Non Occupato Motivo mancata occupazione Ha lavorato in passato? Seconda occupazione, Corsi formazione Qualità dei corsi Durata dei corsi Utilità dei corsi X Occupati frequentanti Corsi di formazione Occupati con seconda occupazione Settore Ore lavorate Schema E/R Si noti che in uno schema concettuale, non vi è un punto prefissato dal quale si debba iniziare la descrizione delle entità e delle relazioni coinvolte. A partire, quindi, da un arbitrario punto dello schema, navigando tra le entità e le relazioni, ossia, visitando le strutture di rappresentazione che lo compongono, si perviene alla descrizione del fenomeno collettivo in esame. X Fine Cap. 1.3 Progettazione top-down e bottom-up Schema E/R Nella definizione di uno schema concettuale atto a descrivere un fenomeno, analogamente a ciò che accade nella progettazione di un programma per computer, possiamo adottare due tipi di strategie . Nella strategia top-down, si producono descrizioni del fenomeno da analizzare mano a mano più ricche di particolari. Si inizia con uno schema concettuale contenente poche entità e relazioni attraverso le quali si descrivono i concetti principali e più generali della realtà in esame. Ad esempio il fenomeno consumo alimentare può essere descritto con il seguente schema generale Famiglia Acquista Alimento Appartiene Individuo X Consuma Schema E/R Lo schema iniziale viene raffinato aumentando il grado di dettaglio con nuove entità e i suoi attributi, relazioni, gerarchie di generalizzazioni e sottoinsiemi, generando così nuovi schemi che descrivono con più particolari la realtà esaminata. Ad esempio la parte di fenomeno che riguarda l’individuo può essere così sviluppata prende Età < 1 anno Componente Famiglia Tipo Per quanto tempo Dieta segue Individuo Tipo Posologia Farmaco Allattato al seno Durata Acquista Preparazione pasto Prepara i pasti frequenza X Si occupa di alimentazione Non prepara i pasti motivo frequenza Non si occupa di alimentazione motivo Schema E/R Nella strategia bottom-up, si procede inversamente rispetto a quella top-down. Inizialmente si producono uno o più schemi particolareggiati relativi ad alcuni aspetti del fenomeno in esame e, successivamente, si definiscono schemi più generali nei quali sono riassunti i principali collettivi e le relazioni connesse con il fenomeno in esame. Individuo Tipo Per quanto tempo Dieta prende Componente Famiglia Tipo Posologia Farmaco prende Età < 1 anno Allattato al seno Durata Acquista Preparazione pasto Prepara i pasti frequenza Si occupa di alimentazione Non prepara i pasti frequenza Non si occupa di alimentazione motivo Famiglia Acquista motivo Alimento Appartiene Individuo X Consuma Fine Cap. 1.4. . 4. Esempi 1.1. Schema E-R per collettivo occupati 1.2. Relazione fra prodotti e clienti 1.3. Gerarchia di generalizzazione X Schema E/R Esempio 1.1. Schema E-R per collettivo occupati Schema E/R Sul collettivo di unità statistiche, formato dagli individui occupati in un'attività lavorativa, si sono analizzati alcuni caratteri del fenomeno lavoro, tra i quali: le ore di lavoro effettuate in una settimana, la posizione nella professione, la branca di attività economica e alcune variabili illustrative come: sesso, età, stato civile. La rappresentazione grafica del collettivo di unità statistiche e delle variabili secondo la simbologie del modello EntitàRelazione risulta come segue: Occupati Sesso Età Stato Civile Ore di lavoro settimanale Posizione nella professione Branca di attività economica Rappresentazione schematica del collettivo degli occupati descritti da alcune variabili relative al fenomeno X Fine Esemp Esempio 1.2. Relazione fra prodotti e clienti Schema E/R I prodotti di una azienda vengono comperati da clienti. I prodotti sono descritti dalle variabili: tipologia, prezzo, composizione, peso. Il cliente è descritto dalle variabili esso, età, professione, preferenze, dove acquista. Questa situazione viene descritta con il seguente schema: Preferenze Dove acquista Cliente Sesso Età Professione acquista Peso marca Prodotti Tipologia Prezzo Composizione Rappresentazione schematica dell’acquisto di prodotti da parte di clienti X Fine Esemp Esempio 1.3. Gerarchia di generalizzazione Schema E/R Il collettivo degli individui è una generalizzazione del collettivo degli occupati e dei non occupati che sono due sottocollettivi disgiunti, dalla cui unione si ricostruisce il collettivo degli individui. La variabile di stratificazione del collettivo degli individui è la condizione unica o prevalente. Relazione con il capo famiglia Titolo di studio Individuo Sesso Età Stato Civile Condizione Professionale Posizione nella professione Branca di attività economica Ore di lavoro settimanale Seconda occupazione Occupato Non Occupato Motivo mancata occupazione Ha lavorato in passato? Rappresentazione schematica della scomposizione del collettivo degli individui in occupati e non occupati X Fine Cap.