Esercitazione - Dipartimento di Economia, Finanza e Statistica

STATISTICA (I MODULO – INFERENZA STATISTICA)
Esercitazione I 27/4/2007
Esercizio A.
In una scatola contenente 10 pezzi di un articolo elettronico 2 risultano essere difettosi. Si estraggono a caso due pezzi, uno
alla volta senza reimmissione. Quale è la probabilità che:
1. il primo sia difettoso e il secondo sia buono?
2. che il primo sia buono e il secondo difettoso?
3. che uno sia difettoso e l’altro buono?
4. che entrambi siano difettosi?
5. che entrambi siano buoni?
Esercizio B.
Si supponga di prendere un aereo della compagnia X per andare da Roma a Milano e un aereo della compagnia Y per il
viaggio di ritorno. Si definiscano gli eventi A={compagnia X perde il mio bagaglio} e B={compagnia Y perde il mio
bagaglio}. Se A e B sono eventi indipendenti con P(A)>P(B), P(A∩B)=0.0002 e P(A∪B)=0.03, determinare P(A) e P(B).
Esercizio C.
Ad un individuo vengono offerti tre bicchieri di vino (indicati con A, B e C), quindi gli viene chiesto di ordinarli secondo le
proprie preferenze.
1. Quali sono gli eventi possibili in questo esperimento e quale probabilità è possibile assegnare a ciascuno di essi
sapendo che in realtà i tre bicchieri contenevano lo stesso tipo di vino.
2. Qual è la probabilità che C sia classificato al primo posto della graduatoria?
3. Qual è la probabilità che C sia classificato al primo posto e A all’ultimo posto della graduatoria
Esercizio D.
In medicina, nell’ambito dei test diagnostici, la probabilità che una persona risulti positiva ad un test quando è effettivamente
malata è chiamata sensitività, mentre la probabilità che il test risulti negativo quando non è malata è detta specificità.
Si supponga che una persona si sottopone ad un test per la diagnosi di una malattia rara (la frequenza con cui si verifica nella
popolazione è pari ad 1 caso ogni 20000 persone); sapendo che il test diagnostico presenta una sensitività pari a 0.99 e una
specificità pari a 0.95, qual è la probabilità che la persona sia effettivamente malata qualora il test risulti positivo?
Esercizio E.
Sei lotti sono pronti per essere consegnati da parte di un certo fornitore. Il numero di componenti difettose in ciascun lotto è il
seguente:
Lotto
Numero di difetti
1
0
2
2
3
0
4
1
5
2
6
0
Si supponga che uno di questi lotti venga fornito ad un determinato cliente, e si definisca la variabile casuale X che esprime il
numero di difetti presenti in un lotto. Determinare:
1. la distribuzione di probabilità della variabile casuale X;
2. la funzione di ripartizione della v.c. X;
3. il valore atteso e la varianza della v.c. X.
STATISTICA (I MODULO – INFERENZA STATISTICA)
Esercitazione II 4/5/2007
Esercizio A.
Un’azienda che riceve ordini di acquisto via telefono ha 6 linee telefoniche. Si indichi con X il numero di linee utilizzate in un
dato istante di tempo, e si supponga che la distribuzione di probabilità sia la seguente:
X
0
1
2
3
4
5
6
f(x)
0.10 0.15 0.20 0.25 0.20 0.06 0.04
Si calcoli la probabilità di ciascuno dei seguenti eventi:
1. al più 3 linee sono in uso;
2. meno di 3 linee sono in uso;
3. almeno 3 linee sono in uso;
4. tra 2 e 5 linee, incluse, sono in uso;
5. tra 2 e 4 linee, incluse, non sono in uso;
6. almeno 4 linee non sono in uso.
7. si calcoli il valore atteso e la varianza della v.c. X.
Esercizio B.
Un lotto di grandi dimensioni viene consegnato ad un fornitore, il quale, per decidere se accettare o rifiutare il lotto, estrae
casualmente con ripetizione 10 pezzi dal lotto ed accetta il lotto se al massimo 1 pezzo risulta difettoso.
Si definisca la v.c. X = {numero di pezzi difettosi nel campione}. Assumendo che nel lotto siano presenti un 5% di pezzi
difettosi, calcolare:
1. la funzione di probabilità della v.c. X;
3. la probabilità che il lotto sia accettato;
4. valore atteso e varianza del numero di pezzi difettosi;
5. la la probabilità che il lotto venga rifiutato sapendo che nei primi 5 pezzi esaminati non ce n’era nessuno difettoso.
Esercizio C.
Si supponga che il numero X di tornadi osservati in una determinata regione nell’arco di un anno abbia una distribuzione di
Poisson con parametro λ=8. Si calcoli:
1. la probabilità di osservare al più 5 tornadi in una anno;
2. Pr(6≤X≤9);
3. Pr(X≥10);
4. quanti tornadi ci si può attendere di osservare nel prossimo anno e qual è la deviazione standard del numero dei
tornadi osservati?
Esercizio D.
Il tempo di reazione di un automobilista, definito come l’intervallo di tempo che impiega dal momento che si illuminano le
luci di frenata di un veicolo che lo precede al momento in cui agisce sui freni, può essere descritto da una v.c. normale con
media 1.25 secondi e deviazione standard pari a 0.46 secondi. Si calcoli:
1. la probabilità che il tempo di reazione sia inferiore ad un 1 secondo;
2. la probabilità che il tempo di reazione sia compreso tra 1 e 2 secondi;
3. si consideri il tempo di 2 secondi come il tempo massimo entro il quale è possibile evitare con certezza un incidente.
Si determini la probabilità che per un’assicurazione su 100 assicurati più di 5 individui abbiamo un incidente.
Esercizio E.
Dall’esperienza si ritiene che il diametro dei bulloni prodotti da una fabbrica segua una distribuzione gaussiana. Inoltre, il
25% dei bulloni ha un diametro inferiore a 1.4 mm mentre il 10% ha un diametro maggiore di 1.8 mm. Si determini:
1. il valore atteso del diametro dei bulloni prodotti;
2. una misura dell’inaccuratezza del processo di produzione;
3. la probabilità che il diametro di un bullone prodotto sia inferiore a 1.2 mm;
4. la probabilità che, estraendo a caso 10 bulloni, al massimo 1 di essi abbia lunghezza superiore a 2 mm.
STATISTICA (I MODULO – INFERENZA STATISTICA)
Esercitazione III 11/5/2007
Esercizio A.
Si ritiene, sulla base dell’esperienza passata, che il 10% dei clienti di un supermercato acquistino almeno un prodotto
surgelato all’interno della loro spesa. Estratto un campione casuale di 200 clienti del supermercato, calcolare:
1. la probabilità che più di 25 clienti acquistino almeno un prodotto surgelato;
2. la probabilità che il numero dei clienti che acquistano almeno un prodotto surgelato sia compreso tra 10 e 20 clienti.
Esercizio B.
2
Si supponga che il tempo di attesa (espresso in minuti) presso un ufficio postale si distribuisca come una v.c. χ con media
pari a 5. Si calcoli:
1. la probabilità di attendere più di 10 minuti;
2. la probabilità di attendere un tempo non più lungo del tempo medio;
3. il tempo medio di attesa qualora vi siano 3 individui in fila prima del nostro turno.
Esercizio C.
Si assuma che per un determinato tipo di lampadine la durata di funzionamento, espressa in giorni, possa considerarsi come
2
una v.c. χ con 20 gradi di libertà.
1. Si calcoli la probabilità che si riesca ad illuminare ininterrottamente una stanza per un periodo di almeno 1 mese.
2. Assumendo di voler illuminare una stanza ininterrottamente, usando una lampadina dopo l’altra, si calcoli la
probabilità che con 10 lampadine si riesca ad illuminare tale stanza per un periodo di almeno 6 mesi (suggerimento: si
usi il teorema del limite centrale).
3. Si calcoli la probabilità che con 10 lampadine si riesca ad illuminare una stanza ininterrottamente per un periodo
compreso tra 160 e 240 giorni.
[Suggerimento: si utilizzi il teorema del limite centrale]
Esercizio D.
Si definisca la v.c. Errore., una combinazione lineare della v.c. X, con E(X)=10 e Var(X)=2, e della v.c. Y, con E(Y)=5,
Var(Y)=1.2. Per la v.c. Z si calcoli il valore atteso e la varianza assumendo che le variabili casuali X e Y siano indipendenti.
Esercizio E.
Si supponga che
X 1 ~ N (0,4) , X 4 ~ N (1,9) , Y1 ~ χ 2 (5) e Y2 ~ χ 2 (10) variabili casuali indipendenti.
1. Calcolare
P ( X 1 − 2 X 2 > 0) ;
2. Calcolare
P( X 12 > 20) ;
3. Trovare il valore q tale che
4.
Calcolare
 X /2

P 1
> 1.5  ;
 Y /5

 1

5. Trovare il valore t tale che
6. Calcolare
P( X 12 < q ) = 0.9 ;
 X /2

P 1
> t  = 0.05 ;
 Y /5

 1

 Y /5

P 1
> 10  .
 Y2 / 10

STATISTICA (I MODULO – INFERENZA STATISTICA)
Esercitazione IV 18/5/2007
Esercizio A.
3
Il consumo giornaliero di acqua potabile in m di una famiglia italiana può essere descritto da una v.c. normale con media 12
e varianza 9.
1. Calcolare la probabilità che, estraendo un campione casuale di 100 famiglie, il consumo medio sia superiore a 12.6
m3.
2. Se si rimuove l’ipotesi di normalità per la distribuzione del consumo giornaliero di acqua potabile, il risultato
calcolato al punto precedente rimane ancora valido?
Esercizio B.
La concentrazione di metalli pesanti riscontrata nei pesci è spesso utilizzata come misura dell’inquinamento ambientale. Un
campione di 12 pesci viene perciò estratto da un lago e la concentrazione di zinco contenuta nel fegato dei pesci misurata
(µg/g):
X
9.89 10.05
9.01
8.57
9.92
6.84
9.95
8.8
8.79
7.98
9.00 11.46
Assumendo che la variabile X abbia una distribuzione normale,
1. Calcolare una stima della concentrazione media di zinco nel fegato dei pesci del lago.
2. Costruire un intervallo di confidenza al 99% per la concentrazione media di zinco nel fegato dei pesci del lago.
3. Fornire un intervallo di confidenza al 95% per la varianza.
4. Precedenti studi condotti sullo stesso lago avevano messo in evidenza che il valore di σ era pari a 1.71. Calcolare
l’intervallo di confidenza del punto 2 alla luce di questa nuova informazione.
Esercizio C.
Al fine di stimare la quantità media, espressa in litri, del consumo mensile di benzina delle famiglie del comune di Perugia,
viene condotta un’indagine su un campione di 213 famiglie ottenendo i seguenti risultati:
213
∑x
i
i =1
laddove con
213
= 34293
∑x
2
= 23583573
i =1
xi si indica il consumo mensile dell’i-esima famiglia,.
1. Utilizzando le opportuni statistiche, stimare il consumo medio mensile di benzina µ delle famiglie e la sua varianza
2. Determinare l’intervallo di confidenza al 95% per µ.
3. Determinare l’intervallo di confidenza al 90% per σ 2 (sugg. supporre che
S 2 ha distribuzione χ n2−1
σ2
n −1
)
Esercizio D.
Un’azienda acquista laminati da utilizzare nel processo produttivo. A tal fine risulta cruciale lo spessore dei laminati.
Calcolare l’errore massimo di stima che si può commettere con probabilità del 99% sulla base di un campione di 100 laminati
il cui spessore medio è pari a 1.5 mm con varianza campionaria pari a 0.01.
Esercizio E.
Un istituto finanziario estrae dal proprio portafoglio clienti un campione causale di 200 individui possessori di carta di
credito. Di questi, 23 hanno subito un addebito durante l’anno precedente in seguito a ritardi nei pagamenti. Calcolare un
intervallo di confidenza al 90% per la proporzione di clienti che hanno avuto un ritardo nei pagamenti.
STATISTICA (I MODULO – INFERENZA STATISTICA)
Esercitazione V 25/5/2007
Esercizio A.
La seguente distribuzione doppia si riferisce ad un campione di 334 immatricolati in tre Facoltà dell’Ateneo di Perugia:
Facoltà
Ingegneria
Economia
Scienze Politiche
Totale
1.
2.
3.
4.
5.
Voto alla maturità
71-80
81-100
23
59
27
66
20
9
70
134
60-70
23
72
35
130
Totale
105
165
64
334
Nell’ambito degli iscritti alla Facoltà di Economia, si determini un intervallo di confidenza al 99% per il voto medio
conseguito alla maturità.
Si stabilisca la dimensione che il campione avrebbe dovuto avere per ottenere un errore di stima del voto medio della
popolazione inferiore a 3 con probabilità pari a 0.95, supponendo che la varianza sia 91.
Si verifichi l’ipotesi che il voto medio alla maturità sia pari a 80 contro l’alternativa che sia maggiore, al livello
α=0.1.
Si verifichi l’ipotesi che la percentuale di iscritti alla Facoltà di Economia con voto di almeno 81 alla maturità sia pari
al 50% contro l’alternativa che sia minore, al livello α=0.05.
Si calcoli il livello di significatività osservato per il sistema di ipotesi del punto precedente.
Esercizio B.
Riprendendo i dati sulla concentrazione di metalli pesanti riscontrata nei pesci (Esercizio B. Esercitazione IV) e supponendo
che la distribuzione nella popolazione sia normale, si verifichi l’ipotesi che la media sia pari a 10 µg/g contro l’alternativa che
sia diversa, al livello α=0.1 e si costruisca un intervallo di confidenza al 95% per la varianza campionaria.
Esercizio C.
La seguente tabella riporta la distribuzione di un campione di 242 lavoratori classificati per classi di reddito (in migliaia di
euro annui) e tipo di impiego:
Lavoratori dipendenti
Liberi professionisti
Totale
10-20
52
22
74
20-40
58
50
108
40-80
6
54
60
Totale
116
126
242
1. Si verifichi l’ipotesi che la retribuzione media dei lavoratori dipendenti sia pari a 25 mila euro contro l’alternativa che
sia inferiore, al livello α=0.01.
2. Relativamente ai lavoratori che guadagnano tra i 20 e i 40 mila euro l’anno, si calcoli un intervallo di confidenza al
95% per la proporzione dei lavoratori dipendenti.
3. Si verifichi l’ipotesi che la proporzione di coloro che guadagnano più di 20 mila euro l’anno sia la stessa tra i liberi
professionisti e tra i lavoratori dipendenti, contro l’alternativa che sia maggiore tra i liberi professionisti, ad un livello
α=0.01.
4. Si calcoli un intervallo di confidenza al 99% per il reddito medio dei liberi professionisti.
5. Si verifichi l’ipotesi che il reddito medio sia lo stesso per i liberi professionisti e per i lavoratori dipendenti, contro
l’alternativa che sia maggiore per i liberi professionisti, ad un livello α=0.05.
STATISTICA (II MODULO – INFERENZA STATISTICA)
Esercitazione VI 1/6/2007
Esercizio A.
La seguente tabella riporta la distribuzione di un campione casuale di aziende di uno stesso settore secondo il consumo di
energia (in MW) e fatturato mensile (in migliaia di euro):
Consumo
di energia
1-5
5-20
20-50
Totale
1-5
38
78
46
162
Fatturato
5-10
2
132
84
218
10-30
0
0
20
20
Totale
40
210
150
400
1. Si verifichi l’ipotesi che il consumo energetico medio delle imprese con fatturato basso (<20) sia lo stesso delle
imprese con fatturato alto (>20), contro l’alternativa che il consumo medio sia maggiore nelle imprese con fatturato
alto, al livello α=0.05.
2. Si verifichi l’ipotesi che, tra le aziende con fatturato inferiore a 5, il 20% di queste abbia un consumo di energia
inferiore a 5, contro l’alternativa che il consumo sia maggiore, al livello α=0.05.
3. In riferimento al sistema di ipotesi del punto precedente, calcolare la potenza per l’ipotesi alternativa che la
proporzione sia pari al 25%.
4. Si verifichi l’ipotesi che la proporzione di imprese con fatturato nella classe 5-30 sia lo stesso per le imprese con
consumo di energia nella classe 5-20 e nella clase 20-50.
Esercizio B.
I dati seguenti si riferiscono alla durata (in ore) di un campione di lampadine di due diverse marche:
Tipo A
Tipo B
3165
3235
3454
3524
3322
3392
3429
3499
3430
3503
3465
3535
3368
3438
Si assuma che la distribuzione della durata di funzionamento sia normale con varianza uguale per le due tipologie.
1. Si verifichi l’ipotesi che la durata media sia la stessa per le lampadine di tipo A e di tipo B contro l’alternativa che sia
maggiore per quelle di tipo B, ad un livello α=0.01.
2. Verificare l’ipotesi che la varianza sia pari a 95 contro l’alternativa che sia maggiore, al livello α=0.05.
3. In riferimento al sistema di ipotesi del punto precedente, calcolare la potenza per l’ipotesi alternativa che la varianza
sia pari a 105.
Esercizio C.
Da una indagine condotta presso un istituto di scuola media sono state estratte casualmente 11 studentesse. I dati relativi al
peso (in kg) ed altezza (in cm) sono i seguenti:
Peso
Altezza
46
152
44
160
51
154
48
155
66
167
48
157
62
158
54
161
1. Stimare i parametri della retta di regressione del peso (Y) rispetto all’altezza (X).
2. Calcolare l’intervallo di confidenza al 95% per il coefficiente angolare;
3. Verificare l’ipotesi che la pendenza della retta sia pari a 0, contro l’alternativa che sia positiva, al livello α=0.01.
1.
a rispetto alle altre due con a=0.01.