Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015
STATISTICA ─ 29.01.15 - PROVA GENERALE (STANDARD)
Modalità B
(A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità si può anche andare
fuori dai margini che delimitano i riquadri.
(B) nello svolgimento del compito si utilizzino almeno tre cifre decimali.
COGNOME………………………….NOME….……………………..MATR………………..
ESERCIZIO 1 (4 punti)
Per descrivere il guadagno giornaliero di un negozio A (in centinaia di euro) si assume una distribuzione gaussiana con media 3.2
e scarto quadratico medio 0.4.
a) Si calcoli la probabilità che il guadagno giornaliero sia minore di 3 (centinaia di euro).
b) Si consideri ora il guadagno giornaliero (in centinaia di euro) di un negozio B e si supponga che abbia distribuzione normale con
media 1.8 e varianza 0.1. Si supponga inoltre che i guadagni giornalieri di A e B abbiano coefficiente di correlazione lineare pari a
0.5. Si determinino media e varianza della somma dei guadagni giornalieri di A e B.
ESERCIZIO 2 (3 punti)
Il numero di imprese di nuova apertura nel 2015 in una città segue una distribuzione di Poisson di media 5.
a) Si calcoli la probabilità che, nel 2015, aprano meno di 4 nuove imprese nella città.
b) Si calcoli lo scarto quadratico medio della variabile aleatoria Y=4X-2, dove X è il numero di nuove imprese nel 2015.
1
Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015
ESERCIZIO 3 (4 punti)
Siano X e Y variabili aleatorie indipendenti e identicamente distribuite con distribuzione binomiale di parametri 2 e 0.6.
a) Si scriva (esplicitamente o attraverso la tabella a doppia entrata) la funzione di probabilità congiunta di X e Y.
b) Si determini la funzione di probabilità della variabile aleatoria T=X-Y.
c) Si calcoli P(X>Y).
ESERCIZIO 4 (8 punti)
Viene effettuata un’indagine campionaria su 300 negozi di una regione, per ciascuno dei quali si rileva il fatturato (in migliaia di
euro) dell’ultimo mese. I dati rilevati sono riassunti dalle seguenti quantità: ∑
5480;∑
100200.
a) Si determini una stima puntuale del fatturato medio dell’ultimo mese dei negozi della regione.
b) Cosa si può dire della distribuzione dello stimatore usato per determinare la stima al punto a)?
c) Si determini una stima puntuale dello scarto quadratico medio del fatturato dell’ultimo mese dei negozi della regione.
d) Si determini un intervallo di confidenza al 95% per il fatturato medio.
e) Si stabilisca, a livello 0.05, se il fatturato medio nei negozi della regione è superiore a 18.
2
Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015
ESERCIZIO 5 (3 punti)
Attraverso un’indagine campionaria effettuata su 150 aziende si vuole stimare la proporzione di aziende, in un determinato Paese,
che hanno subito lo scorso anno una trasformazione societaria (fusione, cambio di forma giuridica, ecc). Tra le 150 aziende del
campione, 16 hanno subito una trasformazione.
a) Si determini una stima puntuale della proporzione suddetta.
b) Si determini un intervallo al 90% per la proporzione suddetta.
ESERCIZIO 6 (4 punti) (Analisi dei dati Excel, I parte - per tutti)
Un campione casuale ha dato i valori x di una variabile X con le corrispondenti frequenze assolute cumulate qui sotto
x
fr.ass.cum.
0
1
2
3
25
50
75
100
(a) Si specifichi la “tabella delle frequenze” dei dati osservati (con tutte le colonne viste nel programma svolto con Excel)
(b) Si determini il primo ed il terzo quartile dei dati osservati
(c) Si calcoli la media dei dati osservati
(d) Si calcoli la varianza dei dati osservati
ESERCIZIO 7 (4 punti) (Analisi dei dati Excel, II parte - solo per chi non ha sostenuto la prova SAS))
3
Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015
7.1 (2 punti). Al fine di testare se il saldo giornaliero medio di tutti i conti correnti dei clienti di due agenzie “X” e “Y” di una
banca sia differente al livello di significativita’ 0.05, si sono rilevati i saldi giornalieri di 20 clienti per ciascuna delle due agenzie
che si considerano come due realizzazioni campionarie (di campioni indipendenti). Si assume inoltre che il saldo giornaliero dei
clienti di ciascuna delle due agenzie “X” e “Y” sia una variabili aleatorie X e Y rispettivamente entrambe (congiuntamente)
gaussiane con varianze note pari a 9 e 16 rispettivamente. Sulla base delle due realizzazioni campionarie si e’ prodotto con Excel
uno dei due tabulati riportati in basso. Sulla base di quanto precede e facendo esplicito riferimento ai dati del tabulato appropriato,
si risponda alle seguenti domande:
(a) si esegua il test bilaterale cui fa riferimento il tabulato specificando ed utilizzando la regione di rifiuto ed indicando l’ipotesi
nulla cui si riferisce il test
(b) poiche’ il tabulato non specifica il livello di significativita’ si mostri che effettivamente la regione di rifiuto che si ottiene dal
tabulato fa riferimento al livello di significativita’ 0.05 come detto nel testo sopra.
7.2 (2 punti). Si consideri lo stesso testo dell’esercizio 7.1 precedente, ma senza l’indicazione del livello di significativita’ e con le
due variabili aleatorie X e Y le cui varianze sono non note e diverse fra loro. Sulla base delle due realizzazioni campionarie si e’
prodotto con Excel uno dei due tabulati riportati in basso. Sulla base di quanto precede e facendo esplicito riferimento ai dati del
tabulato appropriato, si risponda alle seguenti domande:
(a) si esegua il test bilaterale cui fa riferimento il tabulato specificando ed utilizzando la regione di rifiuto ed indicando l’ipotesi
nulla cui si riferisce il test
(b) poiche’ il tabulato non indica il livello di significativita’ alfa si specifichi sulla base del p-value dato dal tabulato per quali
valori di alfa si rifiuta l’ipotesi nulla.
Test z: due campioni per medie
Test t: due campioni assumendo varianze diverse
pop. X
Media
pop. Y
pop. X
pop. Y
9,336314
10,82402
Media
9,336314
10,82402
Varianza nota
9
16
Varianza
10,27206
23,37897
Osservazioni
20
20
Osservazioni
20
20
Differenza ipotizzata per le medie
z
0
Differenza ipotizzata per le medie
0
-1,33064
gdl
33
P(Z<=z) una coda
0,091654
Stat t
-1,14692
z critico una coda
1,644854
P(T<=t) una coda
0,129832
P(Z<=z) due code
0,183307
t critico una coda
1,69236
z critico due code
1,959964
P(T<=t) due code
0,259664
t critico due code
2,034515
4
Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015
STATISTICA ─ 29.01.15 - II PROVA PARZIALE (STANDARD)
Modalità B
(A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità si può anche andare
fuori dai margini che delimitano i riquadri.
(B) nello svolgimento del compito si utilizzino almeno tre cifre decimali.
COGNOME………………………….NOME….……………………..MATR………………..
ESERCIZIO 1 (8 punti)
Viene effettuata un’indagine campionaria su 300 negozi di una regione, per ciascuno dei quali si rileva il fatturato (in migliaia di
euro) dell’ultimo mese. I dati rilevati sono riassunti dalle seguenti quantità: ∑
5480;∑
100200.
a) Si determini una stima puntuale del fatturato medio dell’ultimo mese dei negozi della regione.
b) Cosa si può dire della distribuzione dello stimatore usato per determinare la stima al punto a)?
c) Si determini una stima puntuale dello scarto quadratico medio del fatturato dell’ultimo mese dei negozi della regione.
d) Si determini un intervallo di confidenza al 95% per il fatturato medio.
e) Si stabilisca, a livello 0.05, se il fatturato medio nei negozi della regione è inferiore a 19.
5
Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015
ESERCIZIO 2 (5 punti)
Attraverso un’indagine campionaria effettuata su 150 aziende si vuole stimare la proporzione di aziende, in un determinato Paese,
che hanno subito lo scorso anno una trasformazione societaria (fusione, cambio di forma giuridica, ecc). Tra le 150 aziende del
campione, 16 hanno subito una trasformazione.
a) Si determini una stima puntuale della proporzione suddetta.
b) Si determini un intervallo al 90% per la proporzione suddetta.
c) Si verifichi, a livello 0.01, se la proporzione di aziende che hanno subito una trasformazione, nel Paese, è maggiore di 0.1.
ESERCIZIO 3 (5 punti)
Si consideri una variabile aleatoria con distribuzione gaussiana con scarto quadratico medio 3. Per stimare la media della variabile
aleatoria si estrae un campione di dimensione 20 da essa, ottenendo una media pari a 4.
a) Si determini un intervallo di confidenza al 99% per la media della variabile aleatoria in esame.
b) Si determini la lunghezza dell’intervallo ottenuto al punto precedente.
c) Si determini la più piccola dimensione campionaria che garantisce un intervallo al 99% per la media con lunghezza non
superiore a 3.
6
Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015
ESERCIZIO 4 (4 punti)
Attraverso un’analisi effettuata su un campione di 18 famiglie si vuole stimare la spesa media sostenuta dalle famiglie di una certa
regione per le vacanze estive. Si assume un modello gaussiano per descrivere la spesa per le vacanze estive nella regione in esame.
I dati rilevati sul campione di 18 famiglie hanno fornito una spesa media pari a 1280 euro, con una deviazione standard (scarto
quadratico medio) pari a 120 euro.
a) Si determini un intervallo al 99% per tale spesa media.
b) Si stabilisca, mediante un test di livello 0.01, se la spesa media è diversa da 1300 euro.
ESERCIZIO 5 (8 punti) (Analisi dei dati Excel, II parte - Solo per chi non ha sostenuto la prova SAS)
5.1 (4 punti). Un campione di 500 persone e’ stato intervistato circa la sua affiliazione politica (“democratica”, “repubblicana”) e
ed il suo orientamento circa le politiche di risparmio energetico (“favorevole”, “indifferente”, “contrario”). La realizzazione
campionaria ha dato le frequenze assolute riportate nella tabella a doppia entrata qui sotto:
favor.
indiff.
contr.
dem.
rep.
138
64
83
67
64
84
285
202
150
148
215
Si proceda a testare al livello di significativita’ 0.05 se non vi sia indipendenza fra la affiliazione politica e l’orientamento circa le
politiche di risparmio energetico.
7
Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015
5.2 (2 punti). Al fine di testare se il saldo giornaliero medio di tutti i conti correnti dei clienti di due agenzie “X” e “Y” di una
banca sia differente al livello di significativita’ 0.05, si sono rilevati i saldi giornalieri di 20 clienti per ciascuna delle due agenzie
che si considerano come due realizzazioni campionarie (di campioni indipendenti). Si assume inoltre che il saldo giornaliero dei
clienti di ciascuna delle due agenzie “X” e “Y” sia una variabili aleatorie X e Y rispettivamente entrambe (congiuntamente)
gaussiane con varianze note pari a 9 e 16 rispettivamente. Sulla base delle due realizzazioni campionarie si e’ prodotto con Excel
uno dei due tabulati riportati in basso. Sulla base di quanto precede e facendo esplicito riferimento ai dati del tabulato appropriato,
si risponda alle seguenti domande:
(a) si esegua il test bilaterale cui fa riferimento il tabulato specificando ed utilizzando la regione di rifiuto ed indicando l’ipotesi
nulla cui si riferisce il test
(b) poiche’ il tabulato non specifica il livello di significativita’ si mostri che effettivamente la regione di rifiuto che si ottiene dal
tabulato fa riferimento al livello di significativita’ 0.05 come detto nel testo sopra.
5.3 (2 punti). Si consideri lo stesso testo dell’esercizio 7.1 precedente, ma senza l’indicazione del livello di significativita’ e con le
due variabili aleatorie X e Y le cui varianze sono non note e diverse fra loro. Sulla base delle due realizzazioni campionarie si e’
prodotto con Excel uno dei due tabulati riportati in basso. Sulla base di quanto precede e facendo esplicito riferimento ai dati del
tabulato appropriato, si risponda alle seguenti domande:
(a) si esegua il test bilaterale cui fa riferimento il tabulato specificando ed utilizzando la regione di rifiuto ed indicando l’ipotesi
nulla cui si riferisce il test
(b) poiche’ il tabulato non indica il livello di significativita’ alfa si specifichi sulla base del p-value dato dal tabulato per quali
valori di alfa si rifiuta l’ipotesi nulla.
Test z: due campioni per medie
Test t: due campioni assumendo varianze diverse
pop. X
Media
pop. Y
pop. X
pop. Y
9,336314
10,82402
Media
9,336314
10,82402
Varianza nota
9
16
Varianza
10,27206
23,37897
Osservazioni
20
20
Osservazioni
20
20
Differenza ipotizzata per le medie
z
0
Differenza ipotizzata per le medie
0
-1,33064
gdl
33
P(Z<=z) una coda
0,091654
Stat t
-1,14692
z critico una coda
1,644854
P(T<=t) una coda
0,129832
P(Z<=z) due code
0,183307
t critico una coda
1,69236
z critico due code
1,959964
P(T<=t) due code
0,259664
t critico due code
2,034515
8