Gestione ed analisi di base dati nell`epidemiologia delle malattie

Università degli Studi di Torino - Facoltà di Medicina Veterinaria
Laboratorio di
epidemiologia delle
malattie infettive
Scuola Specializzazione in Sanità Animale, Allevamento e Produzioni Zootecniche
Gestione ed analisi di base dati nell’epidemiologia
delle malattie infettive
Luigi Bertolotti
:: Premessa
Outline
:: 08.11 – introduzione ai db, descrizione della sua struttura,
terminologia, tipi di database e di database
management system
:: 15.11 – introduzione all’impiego dei diversi software
Microsoft Excel
:: 22.11 – introduzione all’impiego dei diversi software
Microsoft Access
:: 29.11 – Applicazioni del db a diversi campi
dell’epidemiologia: l’analisi spaziale e
l’epidemiologia molecolare
:: 30.11 – Prova in itinere
1
:: I software
Le basi dati sono gestite dai Database Management System
ovvero software che si interfacciano tra i dati e l’utente
Tra i più comuni e i più utilizzati appartengono al pacchetto
Microsoft Office:
:: MS Excel
non è un vero DBMS ma è il più
accessibile e utilizzato nella gestione dei dati
:: MS Access
DBMS in grado di gestire anche db di medie
dimensioni
Introduzione
Microsoft Excel è un foglio di calcolo, ma può essere utilizzato
come DBMS
Barre strumenti
Barra della formula
Colonne
Righe
Fogli di lavoro
2
Introduzione
E’ in grado di gestire db di piccole dimensioni
Spesso utilizzato per creare db semplici, ma è in grado di
gestire db relazionali mediante cartelle di lavoro
Utilizzato per elaborazioni di base, di tipo descrittivo
Ha la possibilità di creare report grafici
Introduzione
Cose importanti da sapere …
Ogni file di Excel possiede di default 3 fogli, creando così una
cartella di lavoro
E’ possibile creare collegamenti i diversi fogli…
3
Introduzione
Cose importanti da sapere …
il tipo di dato inserito ha un
formato preciso e definibile
i dati inseriti in formati errati
possono portare a errate
interpretazioni
Introduzione
Cose importanti da sapere …
Possibili formati:
•
•
•
•
•
•
•
•
Generale
Numero
Valuta / Contabilità
Data / Ora
Percentuale / Frazione / Scientifico
Testo
Speciale
Personalizzato
!
4
Introduzione
Cose importanti da sapere …
Particolare attenzione al formato
delle date!
Excel ha la possibilità di
trasformare le date in
formato numerico:
Introduzione
Cose utili da sapere …
Lo zoom permette di visualizzare meglio i
dati contenuti nei fogli
5
Introduzione
Cose utili da sapere …
Bloccando i riquadri le intestazioni di righe
e colonne possono essere mantenute
anche scorrendo i dati
Introduzione
Cose utili da sapere …
per copiare i dati nelle celle adiacenti si
può usare il quadratino di selezione
6
Introduzione
Cose utili da sapere …
Con lo stesso metodo si possono creare
diversi tipi di sequenze
Introduzione
Cose utili da sapere …
7
Introduzione
Cose utili da sapere …
Le formule
Rappresentano uno strumento molto potente
Permettono un alto livello di personalizzazione dei
fogli di lavoro
8
Le formule
•
•
•
•
devono cominciare sempre con ‘ = ‘
possono essere semplici formule
matematiche
possono contenere riferimenti a
diverse celle
possono contenere formule
complesse, contenute in Ms Excel
Le formule
Semplici …
dopo l’invio il risultato è
visualizzato nella cella
deve cominciare
con ‘ = ‘
può essere compilato
sia nella cella sia nella
barra della formula
9
Le formule
Semplici …
Cella di riferimento
il risultato si aggiorna automaticamente se il
valore in D3 cambia
Le formule
Semplici …
Celle di riferimento
il risultato si aggiorna automaticamente se il
valore in B4, B7 e B5 cambia
10
Le formule
Semplici …
come i dati, le formule possono essere
copiate in diverse celle ma…
!
Obiettivo:
ottenere i valori di y per
diversi valori di x [0:10]
Step 01: creare la sequenza
di valori di x
Le formule
Step 02: creare la sequenza
di valori di y, copiando la
cella relativa alla formula
Copiando la formula in celle
diverse, la formula
mantiene un
collegamento relativo
alle celle di riferimento
11
Le formule
Soluzione 01:
ricopiare i valori di a e b nelle
celle in corrispondenza
dei valori di x
Soluzione “poco raffinata” e
spesso non realizzabile!
Le formule
$
Soluzione 02:
“bloccare” i riferimenti alle
celle costanti durante la
scrittura della formula
La formula in B9:
=B4*B7+B5
diventa
=$B$4*B7+$B$5
Riferimento assoluto
12
Le formule
L’unico riferimento relativo
resta il valore di x
I valori di a e b restano
costanti
Le formule
I riferimenti possono essere
usati per collegare
Fogli diversi
Cartelle di lavoro (file) diverse
13
Le formule
Ms Excel possiede una vasta
libreria si formule, divise
in categorie
Le formule
Tutte le formule vengono richiamate usando la stessa
sintassi:
= [nome della formula] ( [parametri] )
i parametri possono essere sia valori numerici, che
riferimenti a celle
14
Le formule
Carrellata sulle formule più usate…
Matematiche
•
somma()
•
ass()
•
exp()
•
log10()
•
pi.greco()
somma
valore assoluto
esponenziale
logaritmo base 10
valore di π
•
•
•
•
elimina la parte decimale
arrotonda()
arrotonda.difetto()
arrotonda.eccesso()
tronca()
Le formule
Carrellata sulle formule più usate…
Data e ora
•
adesso()
•
giorno()
anno()
ora()
Logiche
•
se()
•
e()
•
vero()
o()
falso()
15
Le formule
Carrellata sulle formule più usate…
Statistica
dalle formule più semplici come media() e dev.st()
ai test statistici più comuni.
Le formule
identificazione dei Positivi (rif. assoluto)
media di ogni Ag (rif. relativo)
16
Le formule
media di un intervallo di valori
=media(F2:F12)
SE() effettua un test: restituisce
due valori, a seconda se il
test è VERO o FALSO
=SE(test ; vero ; falso)
Le formule
=CONTA.SE(I2:M12;"POS")
=CONTA.SE(I2:M12; "neg")
=J14/CONTA.VALORI(I2:M12)*100
=J16/CONTA.VALORI(I2:M12)*100
17
Esercitazione 02 – Ms Excel – Step #01
Un veterinario vi chiede di ricostruire i movimenti di animali dell’allevamento
Bertatti, fornendovi uno schema grafico delle entrate e delle uscite.
:: I primi dati risalgono al 1985.
:: Il numero di animali presenti prima del 1985 non è conosciuto.
:: La ricerca è ancora in corso, e ci si aspetta una grossa mole di dati.
Per questo motivo, il vostro compito è di:
1) disegnare una tabella (db piatto) in cui organizzare i dati ricevuti, sulla base
di quelli già ottenuti, utilizzando tutti i dati riportati nel grafo.
2) estrapolare, usando le formule, le seguenti informazioni:
quanti animali sono entrati in allevamento
quanti animali sono usciti dall’allevamento
qual è la media di capre macellate all’anno
quante capre sono state macellate
Esercitazione 2 – Ms Excel
1987 - 8 capre
Centro
Allevamento Caprino
1996 - 2 becchi + 10 capre
1985 - 10 capre - riproduzione
2000 - 5 agnelli
1993 - 2 becchi - riproduzione
1995 - 1 becco - riproduzione
Centro di Macellazione
Allevamento
Rossi
Allevamento
Bertatti
2003 - 5 capre - riproduzione
1 becco - riproduzione
Allevamento
Verdi
2006 - 12 agnelli - allevamento
2006 - 2 becco - riproduzione
2 capre - riproduzione
Allevamento
Rossi
18
Esercitazione 2 – Ms Excel
Dalla scorsa lezione…
chiedersi sempre
qual è l’obiettivo
qual è il soggetto
Esercitazione 2 – Ms Excel
Soluzione…
19
Esercitazione 2 – Ms Excel
Soluzione Compito 01
Esercitazione 2 – Ms Excel
Soluzione Compito 02
20
Esercitazione 2 – Ms Excel
???
???
a questo punto, dove
siamo?
Tabelle Pivot
Permettono una rapida visualizzazione
Riepilogano i dati creando nuove tabelle
21
Le tabelle pivot
nuovo foglio nella cartella
Le tabelle pivot
Le tabelle pivot permettono di riepilogare
i dati contenuti in una tabella,
rendendo più agevole l’elaborazione
dei dati
22
Le tabelle pivot
campo di riepilogo generale
campi Colonna
campi disponibili
=
campi della tabella
conteggi
campi Riga
Le tabelle pivot
Alcuni esempi
23
Le tabelle pivot
Alcuni esempi
Grafici
24
i grafici
i grafici
25
i grafici
i grafici
26
i grafici
i grafici
27
Esercitazione 02 – Ms Excel – Step #02
Utilizzate il db creato da voi per descrivere i movimenti degli animali di Bertatti
per creare un report che descriva:
gli ingressi e le uscite di capre/becchi/agnelli divisi per motivo
1) sia mediante tabella pivot
2) sia mediante un grafico a barre orizzontali
28