Corso di Statistica – Docente: Simona Balzano ESERCIZIO La tabella indagineStudentiFlorida, disponibile sul sito (in formato pdf e xls), riporta i dati di un'indagine condotta su 60 studenti laureati presso la University of Florida, relativamente alle seguenti variabili: COLONNA 1 2 3 4 5 6 NOME VARIABILE Id Genere Età punteggioHighSchool punteggio College distanza Campus 7 8 9 10 11 12 13 distanza Aula oreTVsettimana oreSportSettimana quotidianiPerSettimana AH Vegetariano affiliazione Politica 14 ideologiaPolitica 15 Religiosità 16 opinione Aborto 17 18 azioni Discriminazione vita Morte DESCRIZIONE Codice identificativo dello studente Genere dello studente Età (in anni compiuti) Punteggio ottenuto alla scuola superiore (scala da 1 a 4) Punteggio ottenuto al College (scala da 1 a 4) Distanza (in miglia) del campus dalla città di provenienza dello studente Distanza (in miglia) della classe dall'attuale luogo di residenza Numero medio di ore settimanali passate a guardare la TV Numero medio di ore settimanali dedicate allo sport Numero di volte per settimana che si legge un quotidiano Numero di persone conosciute morte per AIDS o sieropositive Regime di alimentazione vegetariano (yes, no) Affiliazione politica (D = Democratico, R = Repubblicano, I = Indipendente) Ideologia politica (1 = molto liberale, 2 = liberale, 3 = leggermente liberale, 4 = moderato, 5 = abbastanza conservatore, 6 = conservatore, 7 = molto conservatore) Partecipazione ad eventi religiosi (0 = mai, 1 = occasionalmente, 2 = la maggior parte delle settimane, 3 = ogni settimana) Opinione circa la legalità dell'aborto nei primi tre mesi di gravidanza (yes, no) Impegno in azioni contro le discriminazioni (si, no) Crede nella vita dopo la morte (si –y , incerto – u , no – n) Fonte: A. Agresti and B. Finlay, Statistical Methods Methods for the Social Science, Prentice Hall, 2008 1) Di seguito sono riportati, per i soli 16 studenti che hanno risposto incerto alla domanda inerente la variabile vitaMorte, vitaMorte i valori della variabile distanzaCampus: 1200 1300 350 5000 190 1000 420 1200 316 Su tali valori, calcolare i seguenti indici di variabilità: Differenza media semplice Compito n. 3 – a.a. 2015/16 900 180 1100 360 6 80 2000 Corso di Statistica – Docente: Simona Balzano Scostamento semplice medio dalla mediana Scostamento semplice medio dalla media Devianza Varianza Compito n. 3 – a.a. 2015/16 Corso di Statistica – Docente: Simona Balzano 2) La seguente tabella riporta la distribuzione di frequenza per la variabile quotidiani per settimana: settimana quotidiani per settimana ni 0 4 1 6 2 9 3 13 4 4 5 9 6 3 7 9 12 1 14 2 TOT. 60 Su tali valori, calcolare: Differenza media semplice 3) Sapendo che in un recipiente che a 0°C che contiene un volume di 300 cm3 di un certo gas la relazione tra volume V e temperatura T è: V = 300 + 300 × T. 273 e che la temperatura ha una varianza pari a 4, qual è il la varianza del volume? Compito n. 3 – a.a. 2015/16 Corso di Statistica – Docente: Simona Balzano 4) Verificare la proprietà di decomposizione della varianza a partire dalle seguenti informazioni sulle variabili affiliazione politica e nr di quotidiani per settimana: Affiliazione politica Frequenza nr. medio di quotidiani per Devianza settimana D 21 4.429 283.143 I 24 3.708 90.958 R 15 4.200 152.400 tutti gli intervistati 60 4.083 532.58 5) La seguente tabella riporta la distribuzione della variabile religiosità. religiosità Religiosità 0 1 2 3 TOT. ni 15 29 7 9 60 Calcolare l’indice di eterogeneità di Gini: Indice di eterogeneità di Gini Compito n. 3 – a.a. 2015/16 Corso di Statistica – Docente: Simona Balzano 6) La seguente tabella riporta la distribuzione di frequenza per la variabile ideologia politica: politica ideologia politica Molto conservatore Conservatore Abbastanza conservatore Moderato Leggermente liberale Liberale Molto liberale TOT. ni 2 4 4 10 6 24 8 60 Trattando la variabile come una variabile ordinale (dove Molto conservatore = 7 è stato gestito come il livello più basso della scala e Molto liberale = 1 è stato gestito come il livello più alto della scala) calcolare l’indice di eterogeneità di Gini: Indice di eterogeneità di Gini Considerando tali risultati e quelli ottenuti al punto precedente, confrontare le due variabili religiosità ed ideologia politica in termini di eterogeneità (motivando brevemente le risposte): Compito n. 3 – a.a. 2015/16 Corso di Statistica – Docente: Simona Balzano 7) Di seguito sono riportati i valori della variabile Quantità Quantità di Carburante (in litri) contenuto nei serbatoi di 15 vetture:: 12 13 3.5 50 1.9 10 4.2 12 3.8 Su tali valori ottenere: Diagramma di Lorenz Rapporto di concentrazione di Gini Compito n. 3 – a.a. 2015/16 9 1.8 11 3.6 0.8 20