STATISTICA 1 ESERCITAZIONE 1 Dott. Giuseppe Pandolfo 6 Ottobre 2014 Popolazione statistica: insieme degli elementi oggetto dell’indagine statistica. Unità statistica: ogni elemento della popolazione statistica. Variabile casuale: il fenomeno collettivo oggetto dell’indagine statistica. Modalità: il modo in cui si presenta la variabile casuale nelle diverse unità statistiche. Osservazione: Il valore assunto dalla variabile casuale in una data unità statistica. CLASSIFICAZIONE DELLE VARIABILI CASUALI Variabile quantitativa: assume valori numerici Continua: assume valori continui in un intervallo (altezza, peso, ecc.) Discreta: assume valori discreti (numero di pazienti, numero di figli, ecc.) Variabile qualitativa: assume valori non numerici Ordinale: i dati sono in ordine (titolo di studio) Nominale: uomo/donna, basso/medio/alto, ecc. Esercizio 1 Indicare per ognuna delle seguenti variabili se sono quantitative (discrete o continue) o qualitative (nominali o ordinali). 1. Un negozio vende 3 tipi di bevande: bibite, tè e caffè 2. Il peso di una persona 3. Numero di ricoveri giornalieri in un ospedale 4. Numero di telefonate per mese 5. Sesso (Uomo/Donna) 6. Gruppo sanguigno (A, B, 0, AB) 7. Titolo di studio 8. Grado di soddisfazione Soluzione 1. Un negozio vende 3 tipi di bevande: bibite, tè e caffè 2. Il peso di una persona Variabile quantitativa continua 3. Numero di giornalieri in un ospedale 4. Numero di telefonate per mese 5. Sesso (Uomo/Donna) Variabile quantitativa discreta Variabile quantitativa discreta Variabile qualitativa nominale 6. Gruppo sanguigno (A, B, 0, AB) 7. Titolo di studio Variabile qualitativa nominale Variabile qualitativa nominale Variabile qualitativa ordinale 8. Grado di soddisfazione Variabile qualitativa ordinale Esercizio 2 I dati rilevati su n unità statistiche con riferimento a p variabili vengono raccolti in una tabella chiamata matrice dei dati. Esempio: la seguente tabella riporta i dati relativi a tre unità statistiche per tre variabili casuali. Unità statistica Marco Laura Stefania Sesso M F F Titolo di studio Laurea Diploma Laurea Età 34 24 63 Numero di chiamate giornaliere effettuate 2 5 2 Unità statistica: singola persona (3 unità statistiche). Variabili casuali: Sesso (qualitativa nominale), titolo di studio (qualitativa ordinale), età (quantitativa continuo), Numero di chiamate giornaliere effettuate. Esercizio 3 A partire dai dati grezzi riportati di seguito costruire la tabella delle frequenze assolute, relative e percentuali. Successivamente rappresentare graficamente i dati. I dati si riferiscono al numero di figli di venti coppie prese in esame. 1 1 3 3 0 2 2 3 3 1 6 2 0 1 4 0 0 5 3 2 Soluzione Vendite 𝒏𝒊 𝒇𝒊 𝒑𝒊 0 4 4/20=0,20 20% 1 4 4/20=0,20 20% 2 4 4/20=0,20 20% 3 5 5/20=0,25 25% 4 1 1/20=0,05 5% 5 1 1/20=0,05 5% 6 1 1/20=0,05 5% Totale 20 1,00 100% La variabile è data dal numero di vendite effettuate ogni giorno, si tratta quindi di una variabile discreta rappresentabile con un diagramma a bastoncini. Esercizio 4 La seguente tabella riporta il fatturato (in milioni di euro) di n imprese: Fatturato (in milioni di euro) 𝒏𝒊 1⊢5 10 5 ⊢ 10 22 10 ⊢ 20 8 20 ⊢ 40 30 40 ⊢ 70 15 Totale 85 Rappresentare graficamente. Soluzione La variabile Fatturato è una variabile quantitativa continua, lo strumento adatto per rappresentarla graficamente è l’istogramma. Poiché non tutte le classi hanno uguale ampiezza l’altezza dei rettangoli è data dalla densità di frequenza. Calcoliamo le frequenze relative per ciascuna classe. Fatturato (in milioni di euro) 𝒏𝒊 𝒇𝒊 Ampiezza (𝒘𝒊 ) Densità (𝒅𝒊 = 𝒇𝒊 /𝒘𝒊 ) 1⊢5 10 0,12 4 0,12/4=0,03 5 ⊢ 10 22 0,26 5 0,26/5=0,052 10 ⊢ 20 8 0,09 10 0,09/10=0,009 20 ⊢ 40 30 0,35 20 0,35/20=0,0175 40 ⊢ 70 15 0,18 30 0,18/30=0,006 Totale 85 1,00 0.03 0.02 0.00 0.01 Densità 0.04 0.05 Istogramma Fatturato 0 10 20 30 40 50 60 70 fatturato Esercizio 5 Nella tabella seguente figurano l'età e numero di giorni di assenza dei 100 lavoratori di un’azienda rilevati in un certo anno. Giorni di assenza Età 0 5 10 18-30 2 4 15 31-45 11 10 7 46-60 4 13 20 Determinare le frequenze marginali sia per X che per Y. Giorni di assenza Età 0 5 10 TOTALE 18-30 2 4 15 21 31-45 11 10 7 28 46-60 4 13 20 37 TOTALE 17 27 42 86 Indicare le frequenze congiunte: 2 11 4 4 10 13 15 7 20 86 Indicare le frequenze marginali della variabile Età: Età 18-30 21 31-45 28 46-60 37 TOTALE 86 Indicare le frequenze marginali della variabile Giorni di assenza: Giorni di assenza 0 5 10 Totale 17 27 42 86 Indicare le frequenze della variabile Età condizionata alla modalità 0 della variabile Giorni di assenza: Età 18-30 31-45 46-60 Totale Giorni di assenza = 0 2 11 4 17 Indicare le frequenze della variabile Età condizionata alla modalità 10 della variabile Giorni di assenza: Età 18-30 31-45 46-60 Totale Giorni di assenza = 10 15 7 20 42