FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL

FACOLTÀ DI SOCIOLOGIA
CdL in SCIENZE DELL’ORGANIZZAZIONE
SIMULAZIONE della PROVA SCRITTA di STATISTICA
23/03/2011
ESERCIZIO 1 (2+2+2+2)
La seguente tabella riporta la distribuzione della variabile "Stato Civile" per i residenti maschi della
provincia di Monza-Brianza nel 2001 (fonte: Ufficio Statistica e Studi del Comune di Monza):
X=Stato Civile
Celibe
Coniugato
Divorziato
Vedovo
N° residenti
183.092
213.833
6.507
8.940
a) Classificare il fenomeno X e calcolarne e rappresentarne graficamente la distribuzione delle
frequenze relative;
b) Sintetizzare X mediante un indice di posizione, commentando il risultato.
Si supponga di estrarre un campione bernoulliano di 3 residenti:
c) Descrivere la variabile casuale adatta a interpretare il numero di coniugati nel campione,
calcolandone valore atteso e varianza;
d) Calcolare la probabilità che 2 dei 3 estratti siano coniugati.
ESERCIZIO 2 (4+2)
La seguente tabella riporta l'andamento del numero delle imprese registrate nella provincia di
Monza-Brianza dal 2003 al 2007 (dati Unioncamere elaborati dall'Ufficio Statistica del Comune di
Monza):
Anno
2003
2004
2005
2006
2007
Numero
66.508
67.972
69.389
70.428
69.890
a) Valutare l'andamento temporale del fenomeno nel periodo considerato calcolando i Numeri
Indice a base fissa (anno base: 2003) e a base mobile; le variazioni percentuali rispetto all'anno base
e le variazioni percentuali annue, commentando i risultati;
b) Calcolare il tasso di variazione medio annuo, commentando il risultato e confrontandolo con la
media aritmetica delle variazione percentuali annue calcolate in a).
ESERCIZIO 3 (3+2+2+3+3+3)
a) Dopo aver esposto il concetto di Correlazione, definire il coefficiente di correlazione lineare ρ
e discuterne i valori.
Nella seguente tabella a doppia entrata sono riportati i risultati dell'osservazione congiunta delle
variabili T=titolo di studio (D=diploma, L=laurea) e X=reddito annuo (in migliaia di euro) su 100
impiegati di un'azienda.
T, X
D
L
20-|30
30
10
30-| 50
18
12
50-|100
12
18
b) Costruire le distribuzioni del reddito condizionato dal titolo di studio e, sulla base di queste e
motivando la risposta, specificare se sussiste indipendenza statistica tra T e X;
c) Calcolare i redditi medi condizionati al titolo di studio, cioè x | T = D e x | T = L , e il reddito
medio marginale x , verificando la proprietà associativa.
Si supponga ora che i 40 impiegati laureati costituiscano un campione casuale estratto da una
popolazione il cui reddito è interpretabile come una variabile casuale di media incognita µ e
deviazione standard σ = 15 (migliaia di euro).
d) Calcolare un intervallo di confidenza al 95% per µ;
e) Verificare a livello di significatività del 99% l'ipotesi nulla H 0 : µ ≥ µ 0 = 50 .
f) Esporre la metodologia di costruzione di un Intervallo di Confidenza per grandi campioni
esemplificando con la stima della percentuale di un fenomeno categoriale.
ESERCIZIO 1
a) Il fenomeno è qualitativo sconnesso; in tabella, le frequenze relative, ottenute come pi = f i / N .
X=Stato civile
Celibe
Coniugato
Divorziato
Vedovo
TOTALE
fi
183.092
213.833
6.507
8.940
N=412.372
pi
0.444
0.519
0.016
0.022
1
0.0
0.1
0.2
0.3
0.4
0.5
La rappresentazione grafica più adeguata è il diagramma a barre:
celibe
coniugato
divorziato
vedovo
b) L'indice di posizione calcolabile è la moda, che corrisponde a "Coniugato", cioè la modalità con
frequenza massima. La maggior parte dei residenti maschi della provincia di Monza-Brianza è
"coniugata".
c) La v.c. Y che descrive il numero di coniugati nel campione è una Binomiale con parametri n = 3
(dimensione del campione, ovvero numero di estrazioni con reinserimento) e p = 0.519 (frequenza
relativa della modalità "coniugato"). Il suo valore atteso vale np = 1.557 e la sua varianza
np (1 − p ) = 0.749
d) La probabilità richiesta si calcola ricordando la funzione di probabilità della Binomiale:
n 
P (Y = y ) =   p y (1 − p ) n − y y = 0,1, ..., n
 y
e quindi:
3 
3!
P (Y = 2) =  0.519 2 (1 − 0.519) 3− 2 =
0.519 2 (1 − 0.519) 3− 2 = 3 ⋅ 0.519 2 (1 − 0.519) 3− 2 = 0.389
2!1!
 2
ESERCIZIO 2
a) In tabella, i numeri indici a base fissa e a base mobile e le corrispondenti variazioni temporali.
Anno
2003
2004
2005
2006
2007
N° imprese
66.508
67.972
69.389
70.428
69.890
NI bf
100
102.2
104.3
105.9
105.1
var %
102.2
102.1
101.5
99.2
NI bm
+2.2
+4.3
+5.9
+5.1
var %
+2.2
+2.1
+1.5
-0.8
b) I risultati (ultima colonna della tabella) evidenziano un aumento del numero di imprese nei
primi tre anni, e quindi una leggera diminuzione passando dal 2006 al 2007.
 69890

c) ν =  5−1
− 1 ⋅ 100% = +1.25% : c'è stato un incremento medio annuo pari al 1.25%. La
 66508 
media aritmetica delle variazioni percentuali annue è pari a (2.2 + 2.1 + 1.5 − 0.8) / 4 = +1.25% ,
ma solo per caso coincide col valore precedente.
ESERCIZIO 3
a) Vedi appunti/libro di testo
b) Nella seguente tabella, sono riportate, accanto alle frequenze congiunte, le frequenze marginali
per T e X.
20-|30
30-| 50
50-|100
f i.
T, X
D
30
18
12
60
L
10
12
18
40
40
30
30
N=100
f. j
La tabella seguente riporta le due distribuzioni condizionate dell'altezza dato il titolo di studio. Non
coincidendo, si può concludere che non c'è indipendenza tra i due fenomeni.
T, X
D
L
20-|30
0.5
0.25
30-| 50
0.3
0.3
c) Le due medie condizionate valgono:
1
x |T = D =
(30 ⋅ 25 + 18 ⋅ 40 + 12 ⋅ 75) = 39.5
60
1
x |T = L =
(10 ⋅ 25 + 12 ⋅ 40 + 18 ⋅ 75) = 52
40
La media marginale
50-|100
0.2
0.45
1
(40 ⋅ 25 + 30 ⋅ 40 + 30 ⋅ 75) = 44.5
100
ovvero, sfruttandone la proprietà associativa:
1
x=
(60 ⋅ 39.5 + 40 ⋅ 52) = 44.5
100
d) L'intervallo di confidenza, essendo
1 − α = 0.95 → α = 0.05 → α / 2 = 0.025 → 1 − α / 2 = 0.975 → (dalle tavole della Z ) zα / 2 = 1.96 ,
x=
σ
σ

15
15 
) =  52 − 1.96
, 52 + 1.96
 = (47.35, 56.65)
n
n
40
40 

X −µ
e) Il test è unilaterale, rifiuta sulla coda sinistra. La statistica test è Z =
; il test rifiuta per
σ/ n
valori di Z minori di − zα = − z 0.01 = −2.33 . Z, sotto l'ipotesi nulla, assume per il campione estratto il
52 − 50
= +0.843 . Essendo z oss > − z 0.01 = −2.33 , si accetta H 0 al livello del 99%.
valore z oss =
15 / 40
f) Vedi appunti/libro di testo
è dato da ( x − zα / 2
, x + zα / 2