Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015 STATISTICA ─ 29.01.15 - PROVA GENERALE (STANDARD) Modalità B (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità si può anche andare fuori dai margini che delimitano i riquadri. (B) nello svolgimento del compito si utilizzino almeno tre cifre decimali. COGNOME………………………….NOME….……………………..MATR……………….. ESERCIZIO 1 (4 punti) Per descrivere il guadagno giornaliero di un negozio A (in centinaia di euro) si assume una distribuzione gaussiana con media 3.2 e scarto quadratico medio 0.4. a) Si calcoli la probabilità che il guadagno giornaliero sia minore di 3 (centinaia di euro). b) Si consideri ora il guadagno giornaliero (in centinaia di euro) di un negozio B e si supponga che abbia distribuzione normale con media 1.8 e varianza 0.1. Si supponga inoltre che i guadagni giornalieri di A e B abbiano coefficiente di correlazione lineare pari a 0.5. Si determinino media e varianza della somma dei guadagni giornalieri di A e B. ESERCIZIO 2 (3 punti) Il numero di imprese di nuova apertura nel 2015 in una città segue una distribuzione di Poisson di media 5. a) Si calcoli la probabilità che, nel 2015, aprano meno di 4 nuove imprese nella città. b) Si calcoli lo scarto quadratico medio della variabile aleatoria Y=4X-2, dove X è il numero di nuove imprese nel 2015. 1 Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015 ESERCIZIO 3 (4 punti) Siano X e Y variabili aleatorie indipendenti e identicamente distribuite con distribuzione binomiale di parametri 2 e 0.6. a) Si scriva (esplicitamente o attraverso la tabella a doppia entrata) la funzione di probabilità congiunta di X e Y. b) Si determini la funzione di probabilità della variabile aleatoria T=X-Y. c) Si calcoli P(X>Y). ESERCIZIO 4 (8 punti) Viene effettuata un’indagine campionaria su 300 negozi di una regione, per ciascuno dei quali si rileva il fatturato (in migliaia di euro) dell’ultimo mese. I dati rilevati sono riassunti dalle seguenti quantità: ∑ 5480;∑ 100200. a) Si determini una stima puntuale del fatturato medio dell’ultimo mese dei negozi della regione. b) Cosa si può dire della distribuzione dello stimatore usato per determinare la stima al punto a)? c) Si determini una stima puntuale dello scarto quadratico medio del fatturato dell’ultimo mese dei negozi della regione. d) Si determini un intervallo di confidenza al 95% per il fatturato medio. e) Si stabilisca, a livello 0.05, se il fatturato medio nei negozi della regione è superiore a 18. 2 Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015 ESERCIZIO 5 (3 punti) Attraverso un’indagine campionaria effettuata su 150 aziende si vuole stimare la proporzione di aziende, in un determinato Paese, che hanno subito lo scorso anno una trasformazione societaria (fusione, cambio di forma giuridica, ecc). Tra le 150 aziende del campione, 16 hanno subito una trasformazione. a) Si determini una stima puntuale della proporzione suddetta. b) Si determini un intervallo al 90% per la proporzione suddetta. ESERCIZIO 6 (4 punti) (Analisi dei dati Excel, I parte - per tutti) Un campione casuale ha dato i valori x di una variabile X con le corrispondenti frequenze assolute cumulate qui sotto x fr.ass.cum. 0 1 2 3 25 50 75 100 (a) Si specifichi la “tabella delle frequenze” dei dati osservati (con tutte le colonne viste nel programma svolto con Excel) (b) Si determini il primo ed il terzo quartile dei dati osservati (c) Si calcoli la media dei dati osservati (d) Si calcoli la varianza dei dati osservati ESERCIZIO 7 (4 punti) (Analisi dei dati Excel, II parte - solo per chi non ha sostenuto la prova SAS)) 3 Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015 7.1 (2 punti). Al fine di testare se il saldo giornaliero medio di tutti i conti correnti dei clienti di due agenzie “X” e “Y” di una banca sia differente al livello di significativita’ 0.05, si sono rilevati i saldi giornalieri di 20 clienti per ciascuna delle due agenzie che si considerano come due realizzazioni campionarie (di campioni indipendenti). Si assume inoltre che il saldo giornaliero dei clienti di ciascuna delle due agenzie “X” e “Y” sia una variabili aleatorie X e Y rispettivamente entrambe (congiuntamente) gaussiane con varianze note pari a 9 e 16 rispettivamente. Sulla base delle due realizzazioni campionarie si e’ prodotto con Excel uno dei due tabulati riportati in basso. Sulla base di quanto precede e facendo esplicito riferimento ai dati del tabulato appropriato, si risponda alle seguenti domande: (a) si esegua il test bilaterale cui fa riferimento il tabulato specificando ed utilizzando la regione di rifiuto ed indicando l’ipotesi nulla cui si riferisce il test (b) poiche’ il tabulato non specifica il livello di significativita’ si mostri che effettivamente la regione di rifiuto che si ottiene dal tabulato fa riferimento al livello di significativita’ 0.05 come detto nel testo sopra. 7.2 (2 punti). Si consideri lo stesso testo dell’esercizio 7.1 precedente, ma senza l’indicazione del livello di significativita’ e con le due variabili aleatorie X e Y le cui varianze sono non note e diverse fra loro. Sulla base delle due realizzazioni campionarie si e’ prodotto con Excel uno dei due tabulati riportati in basso. Sulla base di quanto precede e facendo esplicito riferimento ai dati del tabulato appropriato, si risponda alle seguenti domande: (a) si esegua il test bilaterale cui fa riferimento il tabulato specificando ed utilizzando la regione di rifiuto ed indicando l’ipotesi nulla cui si riferisce il test (b) poiche’ il tabulato non indica il livello di significativita’ alfa si specifichi sulla base del p-value dato dal tabulato per quali valori di alfa si rifiuta l’ipotesi nulla. Test z: due campioni per medie Test t: due campioni assumendo varianze diverse pop. X Media pop. Y pop. X pop. Y 9,336314 10,82402 Media 9,336314 10,82402 Varianza nota 9 16 Varianza 10,27206 23,37897 Osservazioni 20 20 Osservazioni 20 20 Differenza ipotizzata per le medie z 0 Differenza ipotizzata per le medie 0 -1,33064 gdl 33 P(Z<=z) una coda 0,091654 Stat t -1,14692 z critico una coda 1,644854 P(T<=t) una coda 0,129832 P(Z<=z) due code 0,183307 t critico una coda 1,69236 z critico due code 1,959964 P(T<=t) due code 0,259664 t critico due code 2,034515 4 Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015 STATISTICA ─ 29.01.15 - II PROVA PARZIALE (STANDARD) Modalità B (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità si può anche andare fuori dai margini che delimitano i riquadri. (B) nello svolgimento del compito si utilizzino almeno tre cifre decimali. COGNOME………………………….NOME….……………………..MATR……………….. ESERCIZIO 1 (8 punti) Viene effettuata un’indagine campionaria su 300 negozi di una regione, per ciascuno dei quali si rileva il fatturato (in migliaia di euro) dell’ultimo mese. I dati rilevati sono riassunti dalle seguenti quantità: ∑ 5480;∑ 100200. a) Si determini una stima puntuale del fatturato medio dell’ultimo mese dei negozi della regione. b) Cosa si può dire della distribuzione dello stimatore usato per determinare la stima al punto a)? c) Si determini una stima puntuale dello scarto quadratico medio del fatturato dell’ultimo mese dei negozi della regione. d) Si determini un intervallo di confidenza al 95% per il fatturato medio. e) Si stabilisca, a livello 0.05, se il fatturato medio nei negozi della regione è inferiore a 19. 5 Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015 ESERCIZIO 2 (5 punti) Attraverso un’indagine campionaria effettuata su 150 aziende si vuole stimare la proporzione di aziende, in un determinato Paese, che hanno subito lo scorso anno una trasformazione societaria (fusione, cambio di forma giuridica, ecc). Tra le 150 aziende del campione, 16 hanno subito una trasformazione. a) Si determini una stima puntuale della proporzione suddetta. b) Si determini un intervallo al 90% per la proporzione suddetta. c) Si verifichi, a livello 0.01, se la proporzione di aziende che hanno subito una trasformazione, nel Paese, è maggiore di 0.1. ESERCIZIO 3 (5 punti) Si consideri una variabile aleatoria con distribuzione gaussiana con scarto quadratico medio 3. Per stimare la media della variabile aleatoria si estrae un campione di dimensione 20 da essa, ottenendo una media pari a 4. a) Si determini un intervallo di confidenza al 99% per la media della variabile aleatoria in esame. b) Si determini la lunghezza dell’intervallo ottenuto al punto precedente. c) Si determini la più piccola dimensione campionaria che garantisce un intervallo al 99% per la media con lunghezza non superiore a 3. 6 Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015 ESERCIZIO 4 (4 punti) Attraverso un’analisi effettuata su un campione di 18 famiglie si vuole stimare la spesa media sostenuta dalle famiglie di una certa regione per le vacanze estive. Si assume un modello gaussiano per descrivere la spesa per le vacanze estive nella regione in esame. I dati rilevati sul campione di 18 famiglie hanno fornito una spesa media pari a 1280 euro, con una deviazione standard (scarto quadratico medio) pari a 120 euro. a) Si determini un intervallo al 99% per tale spesa media. b) Si stabilisca, mediante un test di livello 0.01, se la spesa media è diversa da 1300 euro. ESERCIZIO 5 (8 punti) (Analisi dei dati Excel, II parte - Solo per chi non ha sostenuto la prova SAS) 5.1 (4 punti). Un campione di 500 persone e’ stato intervistato circa la sua affiliazione politica (“democratica”, “repubblicana”) e ed il suo orientamento circa le politiche di risparmio energetico (“favorevole”, “indifferente”, “contrario”). La realizzazione campionaria ha dato le frequenze assolute riportate nella tabella a doppia entrata qui sotto: favor. indiff. contr. dem. rep. 138 64 83 67 64 84 285 202 150 148 215 Si proceda a testare al livello di significativita’ 0.05 se non vi sia indipendenza fra la affiliazione politica e l’orientamento circa le politiche di risparmio energetico. 7 Università C. Cattaneo, Corso di Laurea in Economia Aziendale, A.A. 2014-2015 5.2 (2 punti). Al fine di testare se il saldo giornaliero medio di tutti i conti correnti dei clienti di due agenzie “X” e “Y” di una banca sia differente al livello di significativita’ 0.05, si sono rilevati i saldi giornalieri di 20 clienti per ciascuna delle due agenzie che si considerano come due realizzazioni campionarie (di campioni indipendenti). Si assume inoltre che il saldo giornaliero dei clienti di ciascuna delle due agenzie “X” e “Y” sia una variabili aleatorie X e Y rispettivamente entrambe (congiuntamente) gaussiane con varianze note pari a 9 e 16 rispettivamente. Sulla base delle due realizzazioni campionarie si e’ prodotto con Excel uno dei due tabulati riportati in basso. Sulla base di quanto precede e facendo esplicito riferimento ai dati del tabulato appropriato, si risponda alle seguenti domande: (a) si esegua il test bilaterale cui fa riferimento il tabulato specificando ed utilizzando la regione di rifiuto ed indicando l’ipotesi nulla cui si riferisce il test (b) poiche’ il tabulato non specifica il livello di significativita’ si mostri che effettivamente la regione di rifiuto che si ottiene dal tabulato fa riferimento al livello di significativita’ 0.05 come detto nel testo sopra. 5.3 (2 punti). Si consideri lo stesso testo dell’esercizio 7.1 precedente, ma senza l’indicazione del livello di significativita’ e con le due variabili aleatorie X e Y le cui varianze sono non note e diverse fra loro. Sulla base delle due realizzazioni campionarie si e’ prodotto con Excel uno dei due tabulati riportati in basso. Sulla base di quanto precede e facendo esplicito riferimento ai dati del tabulato appropriato, si risponda alle seguenti domande: (a) si esegua il test bilaterale cui fa riferimento il tabulato specificando ed utilizzando la regione di rifiuto ed indicando l’ipotesi nulla cui si riferisce il test (b) poiche’ il tabulato non indica il livello di significativita’ alfa si specifichi sulla base del p-value dato dal tabulato per quali valori di alfa si rifiuta l’ipotesi nulla. Test z: due campioni per medie Test t: due campioni assumendo varianze diverse pop. X Media pop. Y pop. X pop. Y 9,336314 10,82402 Media 9,336314 10,82402 Varianza nota 9 16 Varianza 10,27206 23,37897 Osservazioni 20 20 Osservazioni 20 20 Differenza ipotizzata per le medie z 0 Differenza ipotizzata per le medie 0 -1,33064 gdl 33 P(Z<=z) una coda 0,091654 Stat t -1,14692 z critico una coda 1,644854 P(T<=t) una coda 0,129832 P(Z<=z) due code 0,183307 t critico una coda 1,69236 z critico due code 1,959964 P(T<=t) due code 0,259664 t critico due code 2,034515 8