PROVA DI STATISTICA
27 gennaio 2016
Corso di Laurea in Economia e Gestione Aziendale
Cognome
Nome
Classe
Matricola
Firma
Riportare lo svolgimento ragionato degli esercizi e i calcoli essenziali negli appositi riquadri.
ESERCIZIO 1 (punti 8)
Un libro di statistica è in vendita esclusivamente on line su siti specializzati. La seguente tabella pone in relazione il
numero di accessi giornalieri al sito con il numero di copie vendute del libro.
Sito
Numero di accessi
Numero di libri venduti
1
Booksonline
60
9
2
Atrazon
40
4
3
Reading
40
7
4
Leggiamo
20
2
5
Statbooks
30
4
190
26
Totale
a) Quali scale di misura sono stata adottata per le variabili in tabella?
b) Stimare tramite un opportuno modello l’incremento di libri venduti in corrispondenza ad un incremento di
30 degli accessi.
c) Quale proporzione della variabilità del numero di libri venduti è spiegata dal numero degli accessi?
a) Si tratta di due variabili “di conteggio” quindi quantitative con scala a livello di rapporto (hanno senso i
rapporti tra i valori).
b) La retta di regressione del numero di libri sul numero di accessi risulta Yˆ = -1.3636 + 0.1727 X.
Ricordando l’interpretazione del coefficiente angolare la stima richiesta risulta ΔYˆ = 0.1727 × 30 = 5.181 .
Pertanto quando il numero di accessi aumenta di trenta si vendono mediamente circa cinque libri in più.
c) Tale proporzione è, per definizione, il rapporto R 2 = r 2 = 0.92332 ≈ 0.85 . Circa l’ 85 % della variabilità nel
nnumero di libri venduti è spiegata dalla variabilità nel numero degli accessi.
DOMANDA 2 (punti 6)
Un risparmiatore ha investito in due titoli, X1 e X 2 , che hanno valori di mercato indipendenti distribuiti
normalmente con medie pari ad 1 e 2 e coefficienti di variazione uguali ad uno.
a) Calcolare la probabilità che il valore di mercato complessivo dei due titoli sia minore di uno.
b) Calcolare la stessa probabilità nell’ipotesi che i valori di mercato siano correlati negativamente con
ρ = −0.5 .
c) Si dia una spiegazione intuitiva del fatto che la probabilità calcolata al punto a) è maggiore di quella
calcolata al punto b)
a) Il valore complessivo dei due titoli è la variabile casuale T = X1 + X 2 ~ N(1+ 2 , 12 + 2 2 ) . Pertanto la
⎛ T − 3 1− 3 ⎞
probabilità richiesta è P(T < 1) = P ⎜
<
⎟ = P(Z < −0.89) = 0.1868 .
⎝ 5
5⎠
b) In questo caso la variabile T ha distribuzione normale con la stessa media di prima e varianza
5 + 2 ρσ X1σ X 2 = 5 + 2(−0.5)⋅1⋅ 2 = 1 . Pertanto la probabilità richiesta è
⎛ T − 3 1− 3 ⎞
P(T < 1) = P ⎜
<
⎟ = P(Z < −2) = 0.02275 .
⎝ 1
1⎠
DOMANDA 3 (punti 5)
Sia X una variabile casuale che conta il numero di casi di influenza ogni 1000 abitanti: X ~ Po(λ = 2)
a) Calcolare la probabilità che si verifichi almeno un caso di influenza in un paese di 2000 abitanti.
b) In un paese ci sono 100 città, tutte di 1000 abitanti. Assumendo che le città siano tra loro indipendenti
si indichi la distribuzione (anche approssimata) del numero totale di casi di influenza nel paese.
a)
In un paese di 2000 abitanti la distribuzione del numero dei casi di influenza (Y) segue una Poisson di media
4 0 e−4
= 0.9816.
2+2=4. Pertanto P(Y > 1) = 1− P(Y = 0) = 1−
0!
b)
Detto Xi il numero di casi di influenza nel paese i=1,…100 si ha, per il teorema del limite centrale:
100
∑X
i
≈ N(200, 200) .
i=1
2
DOMANDA 4 (punti 7)
Prima del lancio della nuova campagna pubblicitaria la meno famosa bibita in circolazione vendeva in media
50 lattine al giorno con uno scarto quadratico medio di 5 lattine. Ad un mese dal lancio della campagna
pubblicitaria in un campione casuale di cinque giorni il numero di lattine vendute è stato il seguente:
60, 60, 45, 65, 50.
a) Calcolare la probabilità che in un giorno prima della campagna venissero vendute meno di 40 lattine (si
assuma che il numero di lattine vendute abbia distribuzione approssimativamente normale).
b) Decidere tramite un test opportuno (5% di significatività) se il numero medio di lattine vendute è
aumentato dopo la campagna pubblicitaria (ipotizzare che la varianza sia rimasta la stessa).
c) Si rappresenti graficamente il pvalue del test (non è necessario calcolarlo).
a)
⎛
40 − 50 ⎞
P(X < 40) = P ⎜ Z <
⎟ = 0.02275.
⎝
5 ⎠
b)
Dal momento che la campagna ha un costo e va giustificata è ragionevole supporre, a meno di forte evidenza
contraria, che le vendite medie siano rimaste le stesse e quindi l’ipotesi nulla è H 0 : µ = 50 contro H1 : µ > 50 .
Rifiuteremo per valori “grandi” della media campionaria. In particolare, una regola di decisione con livello
x − µ0
di significatività 5% è quella di rifiutare l’ipotesi nulla se
> z0.05 . Sostituendo abbiamo
σ n
x − µ0 56 − 50
=
= 2.683 che risulta essere maggiore di z0.05 = 1.645 e pertanto c’è sufficiente evidenza
σ n
5 5
empirica per ritenere che la campagna pubblicitaria abbia inciso sulle vendite.
DOMANDA 5 (punti 4)
Disuguaglianza di Tcebicheff e regola empirica.
Si veda il libro di testo.
3