Corso di Statistica – Docente: Simona Balzano ESERCIZIO La tabella indagineStudentiFlorida, disponibile sul sito (in formato pdf e xls), riporta i dati di un'indagine condotta su 60 studenti laureati presso la University of Florida, relativamente alle seguenti variabili: COLONNA 1 2 3 4 5 6 7 8 9 10 11 12 13 NOME VARIABILE Id Genere Età punteggioHighSchool punteggio College distanza Campus distanza Aula oreTVsettimana oreSportSettimana quotidianiPerSettimana AH Vegetariano affiliazione Politica 14 ideologiaPolitica 15 Religiosità 16 opinione Aborto 17 18 azioni Discriminazione vita Morte DESCRIZIONE Codice identificativo dello studente Genere dello studente Età (in anni compiuti) Punteggio ottenuto alla scuola superiore (scala da 1 a 4) Punteggio ottenuto al College (scala da 1 a 4) Distanza (in miglia) del campus dalla città di provenienza dello studente Distanza (in miglia) della classe dall'attuale luogo di residenza Numero medio di ore settimanali passate a guardare la TV Numero medio di ore settimanali dedicate allo sport Numero di volte per settimana che si legge un quotidiano Numero di persone conosciute morte per AIDS o sieropositive Regime di alimentazione vegetariano (yes, no) Affiliazione politica (D = Democratico, R = Repubblicano, I = Indipendente) Ideologia politica (1 = molto liberale, 2 = liberale, 3 = leggermente liberale, 4 = moderato, 5 = abbastanza conservatore, 6 = conservatore, 7 = molto conservatore) Partecipazione ad eventi religiosi (0 = mai, 1 = occasionalmente, 2 = la maggior parte delle settimane, 3 = ogni settimana) Opinione circa la legalità dell'aborto nei primi tre mesi di gravidanza (yes, no) Impegno in azioni contro le discriminazioni (si, no) Crede nella vita dopo la morte (si –y , incerto – u , no – n) Fonte: A. Agresti and B. Finlay, Statistical Methods for the Social Science, Prentice Hall, 2008 1) La seguente tabella riporta la distribuzione di frequenza per la variabile quotidiani per settimana: quotidiani per settimana ni 0 4 1 6 2 9 3 13 4 4 5 9 6 3 7 9 12 1 14 2 TOT. 60 Su tali valori, calcolare l’indice di Yule & Bowley: Indice di Yule & Bowley Compito n. 4 Corso di Statistica – Docente: Simona Balzano 2) La seguente tabella riporta la distribuzione della variabile religiosità. religiosità Ni 0 15 1 29 2 7 3 9 TOT. 60 Calcolare l’indice di Hotelling & Solomon: Indice di Hotelling & Solomon 3) La seguente tabella riporta la distribuzione di frequenza per la variabile ideologia politica: ideologia politica ni Molto conservatore 2 Conservatore 4 Abbastanza conservatore 4 Moderato 10 Leggermente liberale 6 Liberale 24 Molto liberale 8 TOT. 60 Calcolare l’indice di eterogeneità di Gini: Eterogeneità di Gini Trattando la variabile come una variabile ordinale (dove Molto conservatore = 7 è stato gestito come il livello più basso della scala e Molto liberale = 1 è stato gestito come il livello più alto della scala) calcolare l’indice di Hotelling & Solomon: Indice di Hotelling & Solomon Compito n. 4 Corso di Statistica – Docente: Simona Balzano Considerando tali risultati e quelli ottenuti al punto precedente, confronta le due variabili religiosità ed ideologia politica in termini di forma (motivando brevemente le risposte): 4) La seguente tabella riporta una serie di indici di posizione, variabilità e forma per le due variabili eta è quotidiani per settimana. A partire da tali valori, confrontare le due distribuzioni in termini di variabilità e forma, motivando brevemente le risposte: Indicatore Età Quotidiani Quale delle due distribuzioni è piu per settimana variabile/asimmetrica? 29.17 4.08 Me 26.5 3 q1 24 2 q2 26.5 3 q3 31 5.25 8.40 2.98 - Me +2.67 1.08 (q3 – q2) – (q2 – q1) 2 1.25 5) Di seguito sono riportati, per i soli 16 studenti che hanno risposto incerto alla domanda inerente la variabile vitaMorte, i valori della variabile distanzaCampus: 1200 1300 350 5000 190 1000 420 1200 Su tali valori disegnare il blxpolt: Boxplot Compito n. 4 316 900 180 1100 360 6 80 2000 Corso di Statistica – Docente: Simona Balzano 6) La seguente tabella riporta la distribuzione di frequenza per la variabile quotidiani per settimana: quotidiani per settimana ni 0 4 1 6 2 9 3 13 4 4 5 9 6 3 7 9 12 1 14 2 TOT. 60 Su tali valori disegnare il boxplot: Boxplot 1) La tabella mostra la distribuzione doppia del numero di quotidiani letti per settimana (Y) per affiliazione politica (X). Affiliazione politica Democratici Indipendenti Repubblicani Totale Quotidiani per settimana 0 -| 3 11 14 7 32 4 -| 6 4 6 6 16 più di 6 6 4 2 12 Totale 21 24 15 60 Chiudendo l’ultima classe al valore 15: a) Chiudendo l’ultima classe al valore 15 calcolare la varianza di Y: Varianza di Y b) Decomporre la varianza di Y in: Varianza esterna Compito n. 4 Corso di Statistica – Docente: Simona Balzano Varianza interna c) Misurare il grado di dipendenza in media di Y da X Y|X Compito n. 4 Corso di Statistica – Docente: Simona Balzano Compito n. 4