Corso di Statistica – Docente: Simona Balzano
ESERCIZIO
La tabella indagineStudentiFlorida, disponibile sul sito (in formato pdf e xls), riporta i dati di un'indagine
condotta su 60 studenti laureati presso la University of Florida, relativamente alle seguenti variabili:
COLONNA
1
2
3
4
5
6
NOME VARIABILE
Id
Genere
Età
punteggioHighSchool
punteggio College
distanza Campus
7
8
9
10
11
12
13
distanza Aula
oreTVsettimana
oreSportSettimana
quotidianiPerSettimana
AH
Vegetariano
affiliazione Politica
14
ideologiaPolitica
15
Religiosità
16
opinione Aborto
17
18
azioni Discriminazione
vita Morte
DESCRIZIONE
Codice identificativo dello studente
Genere dello studente
Età (in anni compiuti)
Punteggio ottenuto alla scuola superiore (scala da 1 a 4)
Punteggio ottenuto al College (scala da 1 a 4)
Distanza (in miglia) del campus dalla città di provenienza dello
studente
Distanza (in miglia) della classe dall'attuale luogo di residenza
Numero medio di ore settimanali passate a guardare la TV
Numero medio di ore settimanali dedicate allo sport
Numero di volte per settimana che si legge un quotidiano
Numero di persone conosciute morte per AIDS o sieropositive
Regime di alimentazione vegetariano (yes, no)
Affiliazione politica (D = Democratico, R = Repubblicano, I =
Indipendente)
Ideologia politica (1 = molto liberale, 2 = liberale, 3 = leggermente
liberale, 4 = moderato, 5 = abbastanza conservatore, 6 =
conservatore, 7 = molto conservatore)
Partecipazione ad eventi religiosi (0 = mai, 1 = occasionalmente, 2 =
la maggior parte delle settimane, 3 = ogni settimana)
Opinione circa la legalità dell'aborto nei primi tre mesi di
gravidanza (yes, no)
Impegno in azioni contro le discriminazioni (si, no)
Crede nella vita dopo la morte (si –y , incerto – u , no – n)
Fonte: A. Agresti and B. Finlay, Statistical Methods
Methods for the Social Science, Prentice Hall, 2008
1) Di seguito sono riportati, per i soli 16 studenti che hanno risposto incerto alla domanda inerente la
variabile vitaMorte,
vitaMorte i valori della variabile distanzaCampus:
1200
1300
350
5000
190
1000
420
1200
316
Su tali valori, calcolare i seguenti indici di variabilità:
Differenza
media
semplice
Compito n. 3 – a.a. 2015/16
900
180
1100
360
6
80
2000
Corso di Statistica – Docente: Simona Balzano
Scostamento
semplice
medio dalla
mediana
Scostamento
semplice
medio dalla
media
Devianza
Varianza
Compito n. 3 – a.a. 2015/16
Corso di Statistica – Docente: Simona Balzano
2) La seguente tabella riporta la distribuzione di frequenza per la variabile quotidiani per settimana:
settimana
quotidiani per settimana
ni
0
4
1
6
2
9
3
13
4
4
5
9
6
3
7
9
12
1
14
2
TOT.
60
Su tali valori, calcolare:
Differenza
media
semplice
3) Sapendo che in un recipiente che a 0°C che contiene un volume di 300 cm3 di un certo gas la relazione tra
volume V e temperatura T è:
V = 300 +
300
× T.
273
e che la temperatura ha una varianza pari a 4, qual è il la varianza del volume?
Compito n. 3 – a.a. 2015/16
Corso di Statistica – Docente: Simona Balzano
4) Verificare la proprietà di decomposizione della varianza a partire dalle seguenti informazioni sulle variabili
affiliazione politica e nr di quotidiani per settimana:
Affiliazione politica
Frequenza
nr. medio di quotidiani per
Devianza
settimana
D
21
4.429
283.143
I
24
3.708
90.958
R
15
4.200
152.400
tutti gli intervistati
60
4.083
532.58
5) La seguente tabella riporta la distribuzione della variabile religiosità.
religiosità
Religiosità
0
1
2
3
TOT.
ni
15
29
7
9
60
Calcolare l’indice di eterogeneità di Gini:
Indice di
eterogeneità
di Gini
Compito n. 3 – a.a. 2015/16
Corso di Statistica – Docente: Simona Balzano
6) La seguente tabella riporta la distribuzione di frequenza per la variabile ideologia politica:
politica
ideologia politica
Molto conservatore
Conservatore
Abbastanza conservatore
Moderato
Leggermente liberale
Liberale
Molto liberale
TOT.
ni
2
4
4
10
6
24
8
60
Trattando la variabile come una variabile ordinale (dove Molto conservatore = 7 è stato gestito come il livello
più basso della scala e Molto liberale = 1 è stato gestito come il livello più alto della scala) calcolare l’indice di
eterogeneità di Gini:
Indice di
eterogeneità
di Gini
Considerando tali risultati e quelli ottenuti al punto precedente, confrontare le due variabili religiosità ed
ideologia politica in termini di eterogeneità (motivando brevemente le risposte):
Compito n. 3 – a.a. 2015/16
Corso di Statistica – Docente: Simona Balzano
7) Di seguito sono riportati i valori della variabile Quantità
Quantità di Carburante (in litri) contenuto nei serbatoi di
15 vetture::
12
13
3.5
50
1.9
10
4.2
12
3.8
Su tali valori ottenere:
Diagramma di
Lorenz
Rapporto di
concentrazione
di Gini
Compito n. 3 – a.a. 2015/16
9
1.8
11
3.6
0.8
20