(in formato pdf e xls), riporta i dati di un`indagine condott

Corso di Statistica – Docente: Simona Balzano
ESERCIZIO
La tabella indagineStudentiFlorida, disponibile sul sito (in formato pdf e xls), riporta i dati di un'indagine
condotta su 60 studenti laureati presso la University of Florida, relativamente alle seguenti variabili:
COLONNA
1
2
3
4
5
6
7
8
9
10
11
12
13
NOME VARIABILE
Id
Genere
Età
punteggioHighSchool
punteggio College
distanza Campus
distanza Aula
oreTVsettimana
oreSportSettimana
quotidianiPerSettimana
AH
Vegetariano
affiliazione Politica
14
ideologiaPolitica
15
Religiosità
16
opinione Aborto
17
18
azioni Discriminazione
vita Morte
DESCRIZIONE
Codice identificativo dello studente
Genere dello studente
Età (in anni compiuti)
Punteggio ottenuto alla scuola superiore (scala da 1 a 4)
Punteggio ottenuto al College (scala da 1 a 4)
Distanza (in miglia) del campus dalla città di provenienza dello studente
Distanza (in miglia) della classe dall'attuale luogo di residenza
Numero medio di ore settimanali passate a guardare la TV
Numero medio di ore settimanali dedicate allo sport
Numero di volte per settimana che si legge un quotidiano
Numero di persone conosciute morte per AIDS o sieropositive
Regime di alimentazione vegetariano (yes, no)
Affiliazione politica (D = Democratico, R = Repubblicano, I =
Indipendente)
Ideologia politica (1 = molto liberale, 2 = liberale, 3 = leggermente
liberale, 4 = moderato, 5 = abbastanza conservatore, 6 = conservatore, 7
= molto conservatore)
Partecipazione ad eventi religiosi (0 = mai, 1 = occasionalmente, 2 = la
maggior parte delle settimane, 3 = ogni settimana)
Opinione circa la legalità dell'aborto nei primi tre mesi di gravidanza
(yes, no)
Impegno in azioni contro le discriminazioni (si, no)
Crede nella vita dopo la morte (si –y , incerto – u , no – n)
Fonte: A. Agresti and B. Finlay, Statistical Methods for the Social Science, Prentice Hall, 2008
1) La seguente tabella riporta la distribuzione di frequenza per la variabile quotidiani per settimana:
quotidiani per settimana
ni
0
4
1
6
2
9
3
13
4
4
5
9
6
3
7
9
12
1
14
2
TOT.
60
Su tali valori, calcolare l’indice di Yule & Bowley:
Indice di
Yule & Bowley
Compito n. 4
Corso di Statistica – Docente: Simona Balzano
2) La seguente tabella riporta la distribuzione della variabile religiosità.
religiosità Ni
0
15
1
29
2
7
3
9
TOT.
60
Calcolare l’indice di Hotelling & Solomon:
Indice di
Hotelling &
Solomon
3) La seguente tabella riporta la distribuzione di frequenza per la variabile ideologia politica:
ideologia politica
ni
Molto conservatore
2
Conservatore
4
Abbastanza conservatore
4
Moderato
10
Leggermente liberale
6
Liberale
24
Molto liberale
8
TOT.
60
Calcolare l’indice di eterogeneità di Gini:
Eterogeneità
di Gini
Trattando la variabile come una variabile ordinale (dove Molto conservatore = 7 è stato gestito come il livello
più basso della scala e Molto liberale = 1 è stato gestito come il livello più alto della scala) calcolare l’indice di
Hotelling & Solomon:
Indice di
Hotelling &
Solomon
Compito n. 4
Corso di Statistica – Docente: Simona Balzano
Considerando tali risultati e quelli ottenuti al punto precedente, confronta le due variabili religiosità ed
ideologia politica in termini di forma (motivando brevemente le risposte):
4) La seguente tabella riporta una serie di indici di posizione, variabilità e forma per le due variabili eta è
quotidiani per settimana. A partire da tali valori, confrontare le due distribuzioni in termini di variabilità e
forma, motivando brevemente le risposte:
Indicatore
Età
Quotidiani
Quale delle due distribuzioni è piu
per settimana
variabile/asimmetrica?
29.17
4.08

Me
26.5
3
q1
24
2
q2
26.5
3
q3
31
5.25

8.40
2.98
 - Me
+2.67
1.08
(q3 – q2) – (q2 – q1)
2
1.25
5) Di seguito sono riportati, per i soli 16 studenti che hanno risposto incerto alla domanda inerente la variabile
vitaMorte, i valori della variabile distanzaCampus:
1200
1300
350
5000
190
1000
420
1200
Su tali valori disegnare il blxpolt:
Boxplot
Compito n. 4
316
900
180
1100
360
6
80
2000
Corso di Statistica – Docente: Simona Balzano
6) La seguente tabella riporta la distribuzione di frequenza per la variabile quotidiani per settimana:
quotidiani per settimana
ni
0
4
1
6
2
9
3
13
4
4
5
9
6
3
7
9
12
1
14
2
TOT.
60
Su tali valori disegnare il boxplot:
Boxplot
1) La tabella mostra la distribuzione doppia del numero di quotidiani letti per settimana (Y) per
affiliazione politica (X).
Affiliazione politica
Democratici
Indipendenti
Repubblicani
Totale
Quotidiani per settimana
0 -| 3
11
14
7
32
4 -| 6
4
6
6
16
più di 6
6
4
2
12
Totale
21
24
15
60
Chiudendo l’ultima classe al valore 15:
a) Chiudendo l’ultima classe al valore 15 calcolare la varianza di Y:
Varianza di
Y
b) Decomporre la varianza di Y in:
Varianza
esterna
Compito n. 4
Corso di Statistica – Docente: Simona Balzano
Varianza
interna
c)
Misurare il grado di dipendenza in media di Y da X
Y|X
Compito n. 4
Corso di Statistica – Docente: Simona Balzano
Compito n. 4