Università di Cassino
Corso di Laurea in Scienze Motorie
Biostatistica
Anno accademico 2011/2012
Bruno Federico
[email protected]
Cattedra di Igiene - Università degli Studi di Cassino
Le lezioni sono parte del corso integrato di Analisi dei
dati motori e sportivi (Biostatistica e Metodi
Epidemiologici).
Per gli studenti LT33 l’insegnamento Biostatistica
sostituisce il precedente Principi di Statistica
Descrittiva
Docenti
Daniela Anastasi – Metodi Epidemiologici
Bruno Federico – Biostatistica
Lezioni
Il corso (6 lezioni da 4 ore ciascuna) è articolato in
lezioni frontali ed esercitazioni, che saranno svolte sia
con carta e penna che al computer in aula informatica.
È consigliabile portare con sé una calcolatrice
Esami
L’esame integrato prevede una prova scritta con domande
aperte ed una orale
Programma del corso
Introduzione alla statistica. Statistica descrittiva.
Tabelle di frequenza. Rappresentazioni grafiche dei dati.
Indici di tendenza centrale, indici di variabilità.
Bibliografia
Fowler, Jarvis, Chevannes. STATISTICA PER LE PROFESSIONI
SANITARIE. EdiSES – Napoli 2006
Pagano, Gavreau, BIOSTATISTICA, Idelson-Gnocchi, Napoli,
2003
Il materiale del corso è disponibile su
www.docente.unicas.it/bruno_federico/didattica
1
Introduzione
La Statistica è uno strumento essenziale per la scoperta
di leggi e relazioni tra fenomeni
Svolge un ruolo fondamentale nella ricerca scientifica
La Statistica riguarda la raccolta, l’organizzazione, la
presentazione, l’analisi e l’interpretazione dei dati
numerici allo scopo di fornire un supporto per la
realizzazione di decisioni più efficaci
Quando l’interesse è rivolto alle scienze biologiche e
mediche, si usa il termine biostatistica
Alcuni esempi
Trattamento dell’obesità da parte di medici di medicina
generale
2
Attività fisica e mortalità
3
La match analysis
È il processo di osservazione e valutazione di un insieme
di comportamenti adottati dagli atleti durante una
partita al fine di:
1. Raccogliere ed elaborare i dati relativi ai diversi
aspetti di gioco
2. Presentare i dati a tutti gli interessati (allenatori,
atleti, dirigenti, giudici, …)
3. Fornire un’interpretazione dei dati utile a definire
meglio le caratteristiche specifiche della prestazione
studiata
4
Origini della disciplina
Il termine “statistica” deriva dalla parola “Stato”
Originariamente con questo termine si indicava la
raccolta dei dati demografici ed economici di interesse
per gli stati
Con la nascita dei grandi Stati europei, l’interesse ad
approfondire i fenomeni legati alle popolazioni diventa
sempre più forte
Gli Stati si dotano di Istituti centrali di statistica
deputati per legge alla raccolta, organizzazione e
diffusione dei dati sulla popolazione, sulle abitazioni,
sulle risorse economiche e su tutti gli aspetti rilevanti
della vita di una Nazione
In Italia, l’ente centrale è l’ISTAT (Istituto nazionale
di statistica)
La disciplina si è poi sviluppata in un metodo
scientifico di analisi applicato alle scienze sociali,
naturali, biomediche
La Statistica nello Sport
Una delle caratteristiche peculiari dello sport moderno è
la misurazione. Punteggi, graduatorie, prestazioni degli
atleti
La valutazione della performance di un atleta o di una
squadra può essere:
Descrittiva: utile nell’elaborazione di graduatorie
Predittiva: utile per valutare la probabilità di vittoria
della squadra o dell’atleta
Il baseball ed il basket sono esempi di discipline
sportive in cui la statistica gioca un ruolo importante
A partire dal 1993, la FIFA ha sviluppato un sistema di
ranking delle squadre nazionali che si basa su diversi
parametri (Risultato finale, Numero di goal, Se la
partita è giocata in casa o fuori, L'importanza del
5
match, La forza della squadra avversaria, Le differenze
geografiche tra i continenti)
La Statistica nelle scienze bio-mediche
Metodi statistici sono largamente utilizzati in campo
bio-medico per:
Valutare l’efficacia di un trattamento
valutare la relazione di causalità di un fenomeno
(es. le cause di una malattia)
Definizioni di Statistica
È una metodologia generale per lo studio dei fenomeni
collettivi e della variabilità di tali fenomeni
attraverso
L’osservazione dei fenomeni
La traduzione in simboli
L’evidenza di irregolarità
La verifica di ipotesi
È l’insieme di principi, procedure logiche e metodi utili
a comprendere, controllare e prevedere determinati
fenomeni
Obiettivi della statistica
Descrivere i dati
condensare anche un gran numero di dati rilevati in pochi
valori riassuntivi, capaci di indicare importanti
proprietà della popolazione o del campione oggetto di
indagine
Esplorare le relazioni
Valutare l’esistenza e la grandezza delle relazioni tra
le variabili rilevate
Fare previsioni
utilizzare i dati raccolti per prevedere i valori che ci
si aspetta di trovare nella popolazione oggetto di
indagine in particolari condizioni
6
Obiettivi della statistica - esempi
Descrivere i dati
Qual è il numero di vittorie della squadra?
Qual è la performance dell’atleta?
Esplorare le relazioni
Che relazione c’è tra adiposità in eccesso, forza e
velocità?
Fare previsioni
Qual è la probabilità di vittoria dell’atleta o della
squadra note le seguenti condizioni (stato di forma,
morale, forza dell’avversario, …)?
Nomenclatura
Popolazione: Insieme o collezione di oggetti, numeri,
misure o osservazioni.
Le popolazioni possono essere finite o infinite
Campione: Un sottoinsieme della popolazione su cui
vengono raccolti i dati
Unità statistica: Minima unità da cui si raccolgono i
dati in una indagine (Individuo, Famiglia, Regione, Gara)
Variabile: Caratteristica che può assumere valori diversi
nelle diverse unità statistiche
Altezza dei bambini di una classe
Peso degli atleti
Tipo di sport praticato
Modalità
Valore assunto da una variabile in una determinata unità
statistica
Individuo
Giorgio
Mario
Roberto
Peso
80 kg
75 kg
77 kg
7
Natura della Statistica
Statistica descrittiva: ha a che fare con la
presentazione, organizzazione e sintesi dei dati
Tabelle, grafici, indici di sintesi
Statistica Inferenziale: ci permette di generalizzare i
risultati ottenuti dai dati raccolti in un piccolo
campione ad una popolazione più ampia
Stima di parametri
Test di ipotesi
Perché studiare un campione?
Risorse limitate
Pochi dati disponibili
Impossibilità a compiere determinati test
8
Tipo di variabili
Variabile
ciò che viene osservato o misurato
Variabili numeriche discrete
I modi di essere possibili sono limitati
Variabili numeriche continue
I modi di essere possibili sono infiniti
Variabile categorica binomiale
i valori sono due categorie distinte
Variabile categorica nominale
i valori sono categorie con nomi distinti, tra le quali
non è possibile stabilire un criterio di ordinamento
logico
Variabile categorica ordinale
i valori sono una serie ordinata di categorie, ma la
differenza tra una categoria e la successiva non può
essere considerata costante
Esercitazione
Di che tipo di variabili si tratta?
Come è in generale la tua salute?
Eccellente, molto buona, buona, così così, scadente
Che tipo di attività pratichi nel tempo libero?
Pratichi sport?
Quanti esami hai superato finora?
Qual è la tua circonferenza addominale?
Qual è la tua età?
9
Dati grezzi e matrice dei dati
Quando si raccolgono dati su una popolazione o un
campione, i valori ottenuti si presentano all’inizio come
un insieme di dati disordinati (dati grezzi)
I dati vanno organizzati in righe e colonne in una
matrice. La matrice dei dati però è poco informativa, a
meno che il campione in esame non sia molto piccolo
Ogni riga rappresenta un’unità statistica
Ogni colonna rappresenta una variabile
id
1
2
3
4
5
6
V1
V2
V3
V4
V5
V6
È importante avere un codice identificativo univoco per
ogni osservazione (variabile id)
Il codice identificativo è la “chiave” che permette di
collegare le informazioni raccolte con i dati personali
dell’individuo. È univoco, ovvero ne esiste solo uno per
ogni soggetto
Il codice identificativo deve essere inserito sia sul
modulo di raccolta dati (es. sulla prima pagina del
questionario) che nell’archivio dei dati
Qualche consiglio utile
Evitare l’inserimento di testo
Per le variabili categoriche, è spesso conveniente
utilizzare dei codici numerici
Es. Maschio=1, Femmina=2
Questi codici vanno definiti prima dell’inserimento dei
dati, attraverso una legenda
10
Un esempio di archivio di dati: Football
Due identici palloni da football, uno riempito di aria ed
uno di elio, sono stati utilizzati in un campo da gioco
all’esterno dell’Università dell’Ohio in una giornata
priva di vento. Ogni pallone è stato calciato 39 volte,
alternando i due palloni. È stata misurata la distanza
percorsa per ogni calcio.
Variabili
Trial: Trial Number
Air: distance in yards for air-filled football
Helium: distance in yards for helium-filled football
. use football, clear
. list, noobs clean
trial
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
air
25
23
18
16
35
15
26
24
24
28
25
19
27
25
34
26
20
22
33
29
31
27
22
29
28
29
22
31
25
20
27
26
28
32
28
25
31
28
28
helium
25
16
25
14
23
29
25
26
22
26
12
28
28
31
22
29
23
26
35
24
31
34
39
32
14
28
30
27
33
11
26
32
30
29
30
29
29
30
26
11
Un esempio di archivio di dati: Step
An experiment was conducted by students at The Ohio State
University in the fall of 1993 to explore the nature of
the relationship between a person's heart rate and the
frequency at which that person stepped up and down on
steps of various heights.
The response variable, heart rate, was measured in beats
per minute. There were two different step heights: 5.75
inches (coded as 0), and 11.5 inches (coded as 1). There
were three rates of stepping: 14 steps/min. (coded as 0),
21 steps/min. (coded as 1), and 28 steps/min. (coded as
2). This resulted in six possible height/frequency
combinations.
Each subject performed the activity for three minutes.
Subjects were kept on pace by the beat of an electric
metronome. One experimenter counted the subject's pulse
for 20 seconds before and after each trial.
The subject always rested between trials until her or his
heart rate returned to close to the beginning rate.
Another experimenter kept track of the time spent
stepping. Each subject was always measured and timed by
the same pair of experimenters to reduce variability in
the experiment.
Each pair of experimenters was treated as a block.
Variabili
Order: the overall performance order of the trial
Block: the subject and experimenters' block number
Height: 0 if step at the low (5.75") height, 1 if at the
high (11.5") height
Frequency: the rate of stepping. 0 if slow (14
steps/min), 1 if medium (21 steps/min), 2 if high (28
steps/min)
RestHR: the resting heart rate of the subject before a
trial, in beats per minute
HR: the final heart rate of the subject after a trial, in
beats per minute
12
La frequenza
Il concetto di frequenza è uno dei più importanti nella
statistica
Frequenza assoluta: conta
quanto spesso si presenta un determinato valore o
intervallo di valori?
Frequenza relativa: proporzione
quanto spesso si presenta un determinato valore o
intervallo di valori, rispetto al totale delle
osservazioni?
Frequenza relativa = freq. assoluta/n° totale di unità
statistiche
Frequenza percentuale
quanto spesso si presenta un determinato valore o
intervallo di valori rispetto a 100 osservazioni?
Frequenza percentuale = Freq relativa * 100
. sort air
. list air, clean noobs
air
15
16
18
19
20
20
22
22
22
23
24
24
25
25
25
25
25
26
26
26
27
27
27
28
28
28
28
28
28
29
29
29
31
31
31
32
33
34
35
In 2 calci, la distanza percorsa dal pallone riempito di
aria è stata uguale a 24 yds
f(24)=2
13
p(24)=2/39=0.051
%(24)=0.051*100=5.1%
Frequenza cumulativa assoluta
Somma delle frequenze corrispondenti alle osservazioni
più piccole rispetto all’osservazione data più la
frequenza dell’osservazione stessa
Frequenza cumulativa relativa
Proporzione delle frequenze corrispondenti alle
osservazioni più piccole rispetto all’osservazione data
più la frequenza dell’osservazione stessa
Freq cum rel = Freq. cum ass/n° totale di unità
statistiche
Frequenza cumulativa percentuale
Proporzione delle frequenze corrispondenti alle
osservazioni più piccole rispetto all’osservazione data
più la frequenza dell’osservazione stessa
Freq cum perc = Freq cum rel * 100
In 12 calci, la distanza percorsa dal pallone riempito di
aria è inferiore o uguale a 24 yds
fc(24)=12
pc(24)=12/39=0.307
%c(24)=0.307*100=30.7%
14
Tabelle di frequenza
L’elaborazione di tabelle di frequenza è fondamentale per
comprendere come si presentano le variabili prese in
esame
Le Tabelle di frequenza presentano i dati in forma
sintetica, organizzati secondo righe e colonne
Sono utili per ogni tipo di variabili, sia per quelle
categoriche che per quelle numeriche
Tabelle a singola entrata
è presentata la distribuzione di frequenza di UN SOLO
carattere statistico
Tabelle a doppia entrata
è presentata la distribuzione di frequenza di DUE
caratteri statistici
Tabelle a n entrate
è presentata la distribuzione di frequenza di n caratteri
statistici
Nel caso di variabili categoriche (binomiali, nominali ed
ordinali) vengono rappresentate tutte le modalità
possibili e la frequenza di ciascuna modalità
Nel caso di variabili numeriche (discrete e continue) i
valori sono aggregati per classi. Per ciascuna classe
(intervallo) di valori è rappresentata la frequenza
15
. use infortuni_sport, clear
. li soggetto-infortuni, clean noobs
soggetto
AA
BB
CC
DD
EE
FF
GG
HH
LL
MM
NN
PP
QQ
RR
SS
TT
VV
ZZ
peso
63
75
65
75
75
80
70
65
79
80
73
66
65
70
60
77
74
75
altezza
170
180
170
175
170
185
170
165
180
175
173
163
170
178
172
177
169
181
sport
Basket
Basket
Basket
Nuoto
Atletica
Basket
Atletica
Pallavolo
Nuoto
Basket
Basket
Nuoto
Pallavolo
Pallavolo
Atletica
Basket
Pallavolo
Atletica
infort~i
3
2
1
0
0
3
0
2
2
0
0
0
3
2
1
1
1
2
Tabelle a singola entrata
. tab sport
Sport |
Freq.
Percent
Cum.
------------+----------------------------------Atletica |
4
22.22
22.22
Basket |
7
38.89
61.11
Nuoto |
3
16.67
77.78
Pallavolo |
4
22.22
100.00
------------+----------------------------------Total |
18
100.00
. tab infortuni
N° di |
infortuni |
Freq.
Percent
Cum.
------------+----------------------------------0 |
6
33.33
33.33
1 |
4
22.22
55.56
2 |
5
27.78
83.33
3 |
3
16.67
100.00
------------+----------------------------------Total |
18
100.00
. tab altezzacat
altezza |
Freq.
Percent
Cum.
------------+----------------------------------<170 cm |
3
16.67
16.67
170-174 cm |
7
38.89
55.56
175-179 cm |
4
22.22
77.78
>=180 cm |
4
22.22
100.00
------------+----------------------------------Total |
18
100.00
16
Tabelle a doppia entrata
. tab sport dueinfortuni
|
N° infortuni
Sport | meno di 2
2 o più |
Total
-----------+----------------------+---------Atletica |
3
1 |
4
Basket |
4
3 |
7
Nuoto |
2
1 |
3
Pallavolo |
1
3 |
4
-----------+----------------------+---------Total |
10
8 |
18
. tab sport dueinfortuni, row
+----------------+
| Key
|
|----------------|
|
frequency
|
| row percentage |
+----------------+
|
N° infortuni
Sport | meno di 2
2 o più |
Total
-----------+----------------------+---------Atletica |
3
1 |
4
|
75.00
25.00 |
100.00
-----------+----------------------+---------Basket |
4
3 |
7
|
57.14
42.86 |
100.00
-----------+----------------------+---------Nuoto |
2
1 |
3
|
66.67
33.33 |
100.00
-----------+----------------------+---------Pallavolo |
1
3 |
4
|
25.00
75.00 |
100.00
-----------+----------------------+---------Total |
10
8 |
18
|
55.56
44.44 |
100.00
17
Attività fisica e mortalità – follow-up dell’indagine ISTAT sulla salute del
2000
. tab1 sex eta3 edu4 region smokeint poorhealth bmicat pa dead
-> tabulation of sex
sex |
Freq.
Percent
Cum.
------------+----------------------------------male |
35,394
48.64
48.64
female |
37,368
51.36
100.00
------------+----------------------------------Total |
72,762
100.00
-> tabulation of eta3
eta3 |
Freq.
Percent
Cum.
------------+----------------------------------30-44 |
27,903
38.35
38.35
45-59 |
24,371
33.49
71.84
60-74 |
20,488
28.16
100.00
------------+----------------------------------Total |
72,762
100.00
-> tabulation of edu4
edu4 |
Freq.
Percent
Cum.
------------+----------------------------------high |
5,503
7.56
7.56
midhigh |
19,313
26.54
34.11
midlow |
20,927
28.76
62.87
low |
27,019
37.13
100.00
------------+----------------------------------Total |
72,762
100.00
-> tabulation of region
region |
Freq.
Percent
Cum.
------------+----------------------------------north |
28,053
38.55
38.55
centre |
13,744
18.89
57.44
south |
30,965
42.56
100.00
------------+----------------------------------Total |
72,762
100.00
-> tabulation of smokeint
smokeint |
Freq.
Percent
Cum.
----------------+----------------------------------never |
41,371
56.86
56.86
quit>9yrs |
8,263
11.36
68.21
quit2-9yrs |
3,824
5.26
73.47
current<=15 cig |
10,015
13.76
87.23
current>15 cig |
9,289
12.77
100.00
----------------+----------------------------------Total |
72,762
100.00
18
-> tabulation of poorhealth
poorhealth |
Freq.
Percent
Cum.
------------+----------------------------------fair/good |
67,067
92.17
92.17
poor |
5,695
7.83
100.00
------------+----------------------------------Total |
72,762
100.00
-> tabulation of bmicat
bmicat |
Freq.
Percent
Cum.
------------+----------------------------------underweight |
2,121
2.91
2.91
normal |
34,914
47.98
50.90
overweight |
27,552
37.87
88.76
obese |
8,175
11.24
100.00
------------+----------------------------------Total |
72,762
100.00
-> tabulation of pa
pa |
Freq.
Percent
Cum.
------------+----------------------------------vigorous |
6,485
8.91
8.91
regular |
11,477
15.77
24.69
light |
31,762
43.65
68.34
inactive |
23,038
31.66
100.00
------------+----------------------------------Total |
72,762
100.00
-> tabulation of dead
dead |
Freq.
Percent
Cum.
------------+----------------------------------0 |
68,670
94.38
94.38
1 |
4,092
5.62
100.00
------------+----------------------------------Total |
72,762
100.00
Quali sono i fattori associati ad una più alta mortalità?
. tab sex dead, row nokey
|
dead
sex |
0
1 |
Total
-----------+----------------------+---------male |
32,863
2,531 |
35,394
|
92.85
7.15 |
100.00
-----------+----------------------+---------female |
35,807
1,561 |
37,368
|
95.82
4.18 |
100.00
-----------+----------------------+---------Total |
68,670
4,092 |
72,762
|
94.38
5.62 |
100.00
19
. tab eta3 dead, row nokey
|
dead
eta3 |
0
1 |
Total
-----------+----------------------+---------30-44 |
27,647
256 |
27,903
|
99.08
0.92 |
100.00
-----------+----------------------+---------45-59 |
23,506
865 |
24,371
|
96.45
3.55 |
100.00
-----------+----------------------+---------60-74 |
17,517
2,971 |
20,488
|
85.50
14.50 |
100.00
-----------+----------------------+---------Total |
68,670
4,092 |
72,762
|
94.38
5.62 |
100.00
. tab edu4 dead, row nokey
|
dead
edu4 |
0
1 |
Total
-----------+----------------------+---------high |
5,365
138 |
5,503
|
97.49
2.51 |
100.00
-----------+----------------------+---------midhigh |
18,809
504 |
19,313
|
97.39
2.61 |
100.00
-----------+----------------------+---------midlow |
20,226
701 |
20,927
|
96.65
3.35 |
100.00
-----------+----------------------+---------low |
24,270
2,749 |
27,019
|
89.83
10.17 |
100.00
-----------+----------------------+---------Total |
68,670
4,092 |
72,762
|
94.38
5.62 |
100.00
. tab region dead, row nokey
|
dead
region |
0
1 |
Total
-----------+----------------------+---------north |
26,459
1,594 |
28,053
|
94.32
5.68 |
100.00
-----------+----------------------+---------centre |
12,997
747 |
13,744
|
94.56
5.44 |
100.00
-----------+----------------------+---------south |
29,214
1,751 |
30,965
|
94.35
5.65 |
100.00
-----------+----------------------+---------Total |
68,670
4,092 |
72,762
|
94.38
5.62 |
100.00
20
. tab poorhealth dead, row nokey
|
dead
poorhealth |
0
1 |
Total
-----------+----------------------+---------fair/good |
64,092
2,975 |
67,067
|
95.56
4.44 |
100.00
-----------+----------------------+---------poor |
4,578
1,117 |
5,695
|
80.39
19.61 |
100.00
-----------+----------------------+---------Total |
68,670
4,092 |
72,762
|
94.38
5.62 |
100.00
. tab bmicat dead, row nokey
|
dead
bmicat |
0
1 |
Total
------------+----------------------+---------underweight |
1,995
126 |
2,121
|
94.06
5.94 |
100.00
------------+----------------------+---------normal |
33,304
1,610 |
34,914
|
95.39
4.61 |
100.00
------------+----------------------+---------overweight |
25,819
1,733 |
27,552
|
93.71
6.29 |
100.00
------------+----------------------+---------obese |
7,552
623 |
8,175
|
92.38
7.62 |
100.00
------------+----------------------+---------Total |
68,670
4,092 |
72,762
|
94.38
5.62 |
100.00
. tab pa dead, row nokey
|
dead
pa |
0
1 |
Total
-----------+----------------------+---------vigorous |
6,383
102 |
6,485
|
98.43
1.57 |
100.00
-----------+----------------------+---------regular |
10,905
572 |
11,477
|
95.02
4.98 |
100.00
-----------+----------------------+---------light |
30,137
1,625 |
31,762
|
94.88
5.12 |
100.00
-----------+----------------------+---------inactive |
21,245
1,793 |
23,038
|
92.22
7.78 |
100.00
-----------+----------------------+---------Total |
68,670
4,092 |
72,762
|
94.38
5.62 |
100.00
21
Esercitazione
La tabella seguente riporta la distribuzione di frequenza
del numero di figli in un campione di famiglie
Qual è l’unità statistica?
Quante sono le unità statistiche?
Qual è la variabile in esame?
Che tipo di variabile è?
Quante sono le famiglie che hanno 5 figli?
Quante sono in percentuale le famiglie che hanno 5 figli?
Quante sono le famiglie che hanno al massimo 5 figli?
Quante sono in percentuale le famiglie che hanno al
massimo 5 figli?
N° figli
frequenza
0
10
1
3
2
6
3
8
4
31
5
15
6
2
Tot
75
Esercitazione
I dati seguenti rappresentano le età di 48 soggetti che
frequentano un centro di riabilitazione fisica. Utilizza
una tabella di frequenza per rappresentare in modo
sintetico i dati
32 63 33 57 35 54 38 53 42 51 42 48 43 46 61 53 12 13 16
31 30 28 28 25 23 23 22 21 17 13 30 14 29 16 28 17 27 21
24 22 23 61 55 34 42 13 26 22
22
Rappresentazioni grafiche
Oltre alle rappresentazioni tabellari, per descrivere la
frequenza delle variabili in esame sono molto utili le
rappresentazioni grafiche
Rispetto alle tabelle di frequenza, i grafici hanno il
vantaggio dell’immediatezza: riescono cioè a fornire
rapidamente ed in maniera efficace l’informazione
Le tabelle permettono d’altra parte di poter effettuare
confronti molteplici tra diversi sottogruppi del campione
Esistono molti tipi di grafici, ognuno dei quali è
utilizzato in determinate circostanze.
Grafici utili a rappresentare variabili categoriche
 Grafico a torta
 Grafico a barre
Grafici utili a rappresentare variabili numeriche
 Istogramma
 Poligono di frequenza
 Poligono di frequenza cumulativa
 Diagramma ramo-foglia
 Diagramma a scatola
 Diagramma a dispersione
Grafico a torta
Può essere rappresentato un solo carattere (qualitativo)
Le modalità sono rappresentate da spicchi della torta
L’area della torta è proporzionale alla frequenza
relativa della modalità
23
. tab sport
Sport |
Freq.
Percent
Cum.
------------+----------------------------------Atletica |
4
22.22
22.22
Basket |
7
38.89
61.11
Nuoto |
3
16.67
77.78
Pallavolo |
4
22.22
100.00
------------+----------------------------------Total |
18
100.00
Atletica
Nuoto
Basket
Pallavolo
. tab due
N° |
infortuni |
Freq.
Percent
Cum.
------------+----------------------------------meno di 2 |
10
55.56
55.56
2 o più |
8
44.44
100.00
------------+----------------------------------Total |
18
100.00
24
2 o più
meno di 2
. tab sport due, row nokey nofreq
|
N° infortuni
Sport | meno di 2
2 o più |
Total
-----------+----------------------+---------Atletica |
75.00
25.00 |
100.00
Basket |
57.14
42.86 |
100.00
Nuoto |
66.67
33.33 |
100.00
Pallavolo |
25.00
75.00 |
100.00
-----------+----------------------+---------Total |
55.56
44.44 |
100.00
25
Atletica
Basket
Nuoto
Pallavolo
2 o più
meno di 2
Graphs by Sport
Grafico a barre
Le modalità qualitative sono riportate in ascissa. L’asse
delle x è qualitativo
Sull’asse delle ordinate si può riportare la frequenza
assoluta (numero) oppure la frequenza relativa
(percentuale)
Per ogni gruppo si costruisce un rettangolo
la posizione della base del rettangolo (di larghezza
costante) è centrata sul nome della modalità
l’ area del rettangolo è proporzionale alla frequenza
rilevata per il gruppo
La scala utilizzata per gli assi deve consentire la
visualizzazione dei rettangoli interi
26
0
2
4
6
8
. graph bar (count) sportcat, over(sport)
Atletica
Basket
Nuoto
Pallavolo
. graph bar (count) sportcat, over(sport) horiz
Atletica
Basket
Nuoto
Pallavolo
0
2
4
count of sportcat
27
6
8
0
1
2
3
4
. graph bar (count) sportcat, over(due) over(sport)
meno di 2 2 o più
Atletica
meno di 2 2 o più
Basket
meno di 2 2 o più
Nuoto
28
meno di 2 2 o più
Pallavolo