FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL’ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/03/2011 ESERCIZIO 1 (2+2+2+2) La seguente tabella riporta la distribuzione della variabile "Stato Civile" per i residenti maschi della provincia di Monza-Brianza nel 2001 (fonte: Ufficio Statistica e Studi del Comune di Monza): X=Stato Civile Celibe Coniugato Divorziato Vedovo N° residenti 183.092 213.833 6.507 8.940 a) Classificare il fenomeno X e calcolarne e rappresentarne graficamente la distribuzione delle frequenze relative; b) Sintetizzare X mediante un indice di posizione, commentando il risultato. Si supponga di estrarre un campione bernoulliano di 3 residenti: c) Descrivere la variabile casuale adatta a interpretare il numero di coniugati nel campione, calcolandone valore atteso e varianza; d) Calcolare la probabilità che 2 dei 3 estratti siano coniugati. ESERCIZIO 2 (4+2) La seguente tabella riporta l'andamento del numero delle imprese registrate nella provincia di Monza-Brianza dal 2003 al 2007 (dati Unioncamere elaborati dall'Ufficio Statistica del Comune di Monza): Anno 2003 2004 2005 2006 2007 Numero 66.508 67.972 69.389 70.428 69.890 a) Valutare l'andamento temporale del fenomeno nel periodo considerato calcolando i Numeri Indice a base fissa (anno base: 2003) e a base mobile; le variazioni percentuali rispetto all'anno base e le variazioni percentuali annue, commentando i risultati; b) Calcolare il tasso di variazione medio annuo, commentando il risultato e confrontandolo con la media aritmetica delle variazione percentuali annue calcolate in a). ESERCIZIO 3 (3+2+2+3+3+3) a) Dopo aver esposto il concetto di Correlazione, definire il coefficiente di correlazione lineare ρ e discuterne i valori. Nella seguente tabella a doppia entrata sono riportati i risultati dell'osservazione congiunta delle variabili T=titolo di studio (D=diploma, L=laurea) e X=reddito annuo (in migliaia di euro) su 100 impiegati di un'azienda. T, X D L 20-|30 30 10 30-| 50 18 12 50-|100 12 18 b) Costruire le distribuzioni del reddito condizionato dal titolo di studio e, sulla base di queste e motivando la risposta, specificare se sussiste indipendenza statistica tra T e X; c) Calcolare i redditi medi condizionati al titolo di studio, cioè x | T = D e x | T = L , e il reddito medio marginale x , verificando la proprietà associativa. Si supponga ora che i 40 impiegati laureati costituiscano un campione casuale estratto da una popolazione il cui reddito è interpretabile come una variabile casuale di media incognita µ e deviazione standard σ = 15 (migliaia di euro). d) Calcolare un intervallo di confidenza al 95% per µ; e) Verificare a livello di significatività del 99% l'ipotesi nulla H 0 : µ ≥ µ 0 = 50 . f) Esporre la metodologia di costruzione di un Intervallo di Confidenza per grandi campioni esemplificando con la stima della percentuale di un fenomeno categoriale. ESERCIZIO 1 a) Il fenomeno è qualitativo sconnesso; in tabella, le frequenze relative, ottenute come pi = f i / N . X=Stato civile Celibe Coniugato Divorziato Vedovo TOTALE fi 183.092 213.833 6.507 8.940 N=412.372 pi 0.444 0.519 0.016 0.022 1 0.0 0.1 0.2 0.3 0.4 0.5 La rappresentazione grafica più adeguata è il diagramma a barre: celibe coniugato divorziato vedovo b) L'indice di posizione calcolabile è la moda, che corrisponde a "Coniugato", cioè la modalità con frequenza massima. La maggior parte dei residenti maschi della provincia di Monza-Brianza è "coniugata". c) La v.c. Y che descrive il numero di coniugati nel campione è una Binomiale con parametri n = 3 (dimensione del campione, ovvero numero di estrazioni con reinserimento) e p = 0.519 (frequenza relativa della modalità "coniugato"). Il suo valore atteso vale np = 1.557 e la sua varianza np (1 − p ) = 0.749 d) La probabilità richiesta si calcola ricordando la funzione di probabilità della Binomiale: n P (Y = y ) = p y (1 − p ) n − y y = 0,1, ..., n y e quindi: 3 3! P (Y = 2) = 0.519 2 (1 − 0.519) 3− 2 = 0.519 2 (1 − 0.519) 3− 2 = 3 ⋅ 0.519 2 (1 − 0.519) 3− 2 = 0.389 2!1! 2 ESERCIZIO 2 a) In tabella, i numeri indici a base fissa e a base mobile e le corrispondenti variazioni temporali. Anno 2003 2004 2005 2006 2007 N° imprese 66.508 67.972 69.389 70.428 69.890 NI bf 100 102.2 104.3 105.9 105.1 var % 102.2 102.1 101.5 99.2 NI bm +2.2 +4.3 +5.9 +5.1 var % +2.2 +2.1 +1.5 -0.8 b) I risultati (ultima colonna della tabella) evidenziano un aumento del numero di imprese nei primi tre anni, e quindi una leggera diminuzione passando dal 2006 al 2007. 69890 c) ν = 5−1 − 1 ⋅ 100% = +1.25% : c'è stato un incremento medio annuo pari al 1.25%. La 66508 media aritmetica delle variazioni percentuali annue è pari a (2.2 + 2.1 + 1.5 − 0.8) / 4 = +1.25% , ma solo per caso coincide col valore precedente. ESERCIZIO 3 a) Vedi appunti/libro di testo b) Nella seguente tabella, sono riportate, accanto alle frequenze congiunte, le frequenze marginali per T e X. 20-|30 30-| 50 50-|100 f i. T, X D 30 18 12 60 L 10 12 18 40 40 30 30 N=100 f. j La tabella seguente riporta le due distribuzioni condizionate dell'altezza dato il titolo di studio. Non coincidendo, si può concludere che non c'è indipendenza tra i due fenomeni. T, X D L 20-|30 0.5 0.25 30-| 50 0.3 0.3 c) Le due medie condizionate valgono: 1 x |T = D = (30 ⋅ 25 + 18 ⋅ 40 + 12 ⋅ 75) = 39.5 60 1 x |T = L = (10 ⋅ 25 + 12 ⋅ 40 + 18 ⋅ 75) = 52 40 La media marginale 50-|100 0.2 0.45 1 (40 ⋅ 25 + 30 ⋅ 40 + 30 ⋅ 75) = 44.5 100 ovvero, sfruttandone la proprietà associativa: 1 x= (60 ⋅ 39.5 + 40 ⋅ 52) = 44.5 100 d) L'intervallo di confidenza, essendo 1 − α = 0.95 → α = 0.05 → α / 2 = 0.025 → 1 − α / 2 = 0.975 → (dalle tavole della Z ) zα / 2 = 1.96 , x= σ σ 15 15 ) = 52 − 1.96 , 52 + 1.96 = (47.35, 56.65) n n 40 40 X −µ e) Il test è unilaterale, rifiuta sulla coda sinistra. La statistica test è Z = ; il test rifiuta per σ/ n valori di Z minori di − zα = − z 0.01 = −2.33 . Z, sotto l'ipotesi nulla, assume per il campione estratto il 52 − 50 = +0.843 . Essendo z oss > − z 0.01 = −2.33 , si accetta H 0 al livello del 99%. valore z oss = 15 / 40 f) Vedi appunti/libro di testo è dato da ( x − zα / 2 , x + zα / 2