Esercitazione n. 11

annuncio pubblicitario
STATISTICA (2) – ESERCITAZIONE 2
5.02.2014
Dott.ssa Antonella Costanzo
Esercizio 1. La v.c. Normale: uso delle tavole
E’ noto che un certo tipo di dati si distribuiscono secondo una gaussiana di media 10 e
deviazione standard pari a 2 . Calcolare:
a) 7.6 ≤ ≤ 12.4
b) 8 ≤ ≤ 10.8
c) ≥ 8.4
Determinare inoltre:
d) il primo decile
e) il primo quartile
f) il 90-esimo percentile
Soluzione
a) 7.6 ≤ ≤ 12.4 = .
≤≤
.
= −1.2 ≤ ≤ 1.2 =
= ≤ 1.2 − 1 − ≤ 1.2 = 0.8849 − 1 − 0.8849 = 0.8849 − 0.1151 =
= 0.7698
b) 8 ≤ ≤ 10.8 = ≤≤
.
= −1 ≤ ≤ 0.4 =
= ≤ 0.4 − 1 − ≤ 1 = 0.6554 − 1 − 0.8413 = 0.4967
c) ≥ 8.4 = 1 − ≤
.
= 1 − 1 − 0.7881 = 0.7881
= 1 − ≤ −0.8 = 1 − 1 − ≤ 0.8 =
1
d) Il primo decile corrisponde a:
> #. = 0.90
Per la proprietà di simmetria il primo decile corrisponde al 90-esimo percentile, per cui
dobbiamo individuare il valore dell’ascissa alla sinistra della quale si trova il 90% della
massa di probabilità:
≤ #.$ = 0.90
Dalle tavole risulta che il valore più vicino a 0.9 è compreso tra 1.28 e 1.29, per cui
#.$ =
.%.$
= 1.285 ossia #. = −1.285 per la proprietà di simmetria della v.c.
Normale
Partendo dalla versione standardizzata di X otteniamo che il primo decile corrisponde
alla seguente:
. = & + (#. = 10 + 2−1.285 = 7.43
e) Il primo quartile ossia il 25-esimo percentile corrisponde a:
> #.) = 0.75
Per la proprietà di simmetria ≤ #.) = 0.75
Dalle tavole risulta che il valore più vicino a 0.75 è compreso tra 0.67 e 0.68, per cui
#.) =
.%.
= 0.675ossia #.) = −0.675per la proprietà di simmetria della v.c.
Normale
Partendo dalla versione standardizzata di X otteniamo che il primo quartile corrisponde
alla seguente:
.) = & + (#.) = 10 + 2−0.675 = 8.65
f) Il 90-esimo percentile corrisponde al primo decile.
2
Esercizio 2. La v.c. Normale: applicazioni
La durata delle gomme per auto segue una distribuzione normale di media 70000 km e
deviazione standard 8000 km.
a) Qual è la proporzione delle gomme che durano meno di 60000 km?
b) La pubblicità dichiara che “il 90% delle nostre gomme durano più di x km.”
Qual è il valore di x?
Soluzione
a)
~+& = 70000, ( = 8000
Occorre prima di tutto ricondurre la distribuzione della durata delle gomme ad una
distribuzione normale standardizzata.
< 60000 = . <
60000 − 70000
/ = < −1.25 = 0.1056
8000
b) Occorre trovare il percentile della distribuzione standardizzata e poi applicare la
trasformazione inversa alla standardizzazione, ossia:
≥ #. = 0.90
che equivale a calcolare #.$ :
#.$ =
1.28 + 1.29
= 1.285
2
per la proprietà di simmetria otteniamo che: #. = −1.285
. = & + (#. = 70000 + 8000−1.285 = 59760
3
Esercizio 3. Applicazioni del Teorema di Chebyshev
Supponiamo che una banca riceva in media 70 clienti al giorno con uno scarto di 10. Si
vuole calcolare:
a) la probabilità che nella giornata di domani, la banca riceverà meno di 40 clienti
oppure più di 100 clienti
b) la probabilità che nella giornata di domani, la banca riceverà tra i 55 ed gli 85
clienti.
Supponiamo ora che il numero di clienti che riceve la banca si distribuisca secondo una
legge normale con stessa media e stesso scarto. Calcolare:
c) la probabilità che nella giornata di domani, la banca riceverà tra i 55 e gli 85
clienti
Soluzione
Enunciato [1] – Il Teorema di Chebyshev
Se una distribuzione di probabilità ha media µ e scarto quadratico medio σ, allora la
probabilità che il valore di una variabile casuale con tale distribuzione differisca da µ
per più di kσ è inferiore a 0 1 .
In particolare:
< & − 2(3 > & + 2( <
01
in forma compatta: | − &| > 2( < 0 1
(a)
a) In questo caso dobbiamo determinare < 40 ∪ > 100
Utilizzando il risultato in (a) e sapendo che: & = 70, ( = 100 ∆= 2( = 30 da cui:
2=
∆ 30
=
=3
( 10
allora:
| − 70| > 30 <
1
3
4
b) In questo secondo caso dobbiamo determinare: 55 ≤ ≤ 85
Ragionando per complemento rispetto all’ Enunciato [1] la probabilità cercata si ricava
come segue:
& − 2( ≤ ≤ & + 2( ≥ 1 −
in forma compatta: | − &| ≤ 2( ≥ 1 −
1
2
(b)
01
a partire dal risultato in (b) Sapendo che: & = 70, ( = 100 ∆= 2( = 15 da cui:
2=
∆ 15
=
= 1.5
( 10
allora:
| − 70| ≤ 15 ≥ 1 −
1
1.5
Con una probabilità del 55% la banca riceverà domani tra i 55 e gli 85 clienti
c) Se il numero di clienti che riceve la banca si distribuisce secondo una legge normale
con media pari a 70 e scarto quadratico medio 10 allora:
~+70, 10
la probabilità che nella giornata di domani, la banca riceverà tra i 55 e gli 85 clienti è
pari a:
55 ≤ ≤ 85 = .
55 − 70
85 − 70
≤≤
/ = −1.5 ≤ ≤ 1.5 =
10
10
= ≤ 1.5 − ≤ −1.5 = 0.9332 − 0.0668 = 0.8664
5
Esercizio 4. Proprietà della combinazione lineare di v.c. Normali
Ogni giorno gli impiegati di un ministero vanno a prendere il caffè al bar vicino. Il
tempo impiegato per arrivare al bar e tornare può considerarsi una variabile casuale
normale con media 15 min e varianza 11. Il tempo trascorso al bar è anch'esso normale,
indipendente dal tempo del tragitto, con media 15 e varianza 25.
a) Calcolare la probabilità che un impiegato si assenti per più di 35 minuti.
b) Calcolare la probabilità che un impiegato passi più tempo al bar che nel tragitto.
c) Per un campione casuale di 5 impiegati calcolare la probabilità che più di 3 si
assentino per più di 35 min.
d) Per un campione casuale di 200 impiegati calcolare la probabilità che più del
25% si assentino per più di 35 min.
Soluzione
Indichiamo con X = tempo impiegato nel tragitto e Y = tempo trascorso al bar per cui:
X ~ N(15,11)
Y ~ N(15,25)
a) Definiamo il tempo di assenza una variabile casuale del tipo W=X+Y. W è quindi
una combinazione lineare di variabili casuali indipendenti distribuite normalmente. Per
la proprietà riproduttiva della Normale anche W segue una distribuzione normale con i
seguenti parametri:
78 = 7 + 79 = 15 + 15 = 30
:;<8 = :;< + :;<9 = 11 + 25 = 36,
essendo X e Y indipendenti.
Quindi W ~ N(30,36) e da ciò ne consegue che:
8 > 35 = . >
35 − 30
= 0.203
√36
/ = > 0.83 = 1 − ≤ 0.83 = 1 − 0.7967
b) In questo caso si vuole conoscere la probabilità dell'evento: Y > X. Questo evento
può essere espresso, in modo equivalente, come: Y-X > 0. La variabile B=Y-X è una
6
combinazione lineare di variabili normali, e come tale si distribuisce ancora come una
normale con parametri:
7> = 79 − 7 = 15 − 15 = 0
:;<> = :;<9 + :;< = 11 + 25 = 36,
essendo X e Y indipendenti
Quindi B ~ N(0,36). Da ciò segue:
> > 0 = . >
0−0
/ = > 0 = 1 − ≤ 0 = 1 − 0.5 = 0.5
√36
c) Per un campione di n=5 impiegati si vuole determinare la probabilità che più di 3 si
assentino per più di 35 minuti. Considerando i risultati ottenuti nel punto a) segue che:
? = 0.203 è la probabilità di assentarsi per più di 35 minuti
n=5
Indichiamo con @ le volte in cui gli impiegati si assentano per più di 35 minuti,
@~>ABB = 5, ? = 0.203
@ > 3 = @ = 4 + @ = 5 = 0.0071117
5!
5
@ = 4 = 0.203 1 − 0.203) =
0.203 0.797 = 0.006767
4
4! 5 − 4!
5!
5
@ = 5 = 0.203) 1 − 0.203)) =
0.203) = 0.0003447
0!
5
5!
7
d) Anche in questo caso A segue una distribuzione binomiale con parametri: n=200 e
p=0,203.
Siccome n è sufficientemente grande, per il Teorema del Limite Centrale, si può
considerare A come approssimativamente normale, di parametri:
& = B ∙ ? = 200 ∙ 0.203 = 40.6
( = B ∙ ?1 − ? = 200 ∙ 0.2030.797 = 32.36
@ HIJ +40.6, 32.36
EFG
Il 25% di 200=50 quindi occorre determinare:
@ > 50 = . ≥
50 − 40.6
/ = 1 − ≤ 1.65 = 1 − 0.9505 = 0.0495
√32.36
8
Esercizio 5. Interpretazione probabilistica dell’indice KL
Il funzionario addetto al reclutamento del personale sottopone i candidati ad un test
attitudinale e, se questo è superato, ad un colloquio finalizzato ad accertare la
preparazione professionale. Egli ha osservato che gli esiti sono tendenzialmente diversi
per i candidati che hanno una precedente esperienza di lavoro rispetto a coloro che sono
alla ricerca del primo impiego. Sia X una variabile casuale che assume valore 1 se il
candidato ha già lavorato in precedenza e 0 altrimenti e sia Y una variabile casuale che
assume valore 0 se il candidato non supera il test attitudinale, 1 se il candidato supera il
test attitudinale ma non il colloquio e 2 se supera anche il colloquio.
Il dirigente ha stimato alcune probabilità. In particolare, la probabilità che un candidato
abbia una precedente esperienza lavorativa è 0.40. La probabilità che un candidato
superi il test attitudinale ma non superi il colloquio è 0.37 e la probabilità che li superi
entrambi è di 0.15. La probabilità che un candidato non abbia esperienze di lavoro e non
superi il test attitudinale è 0.33, mentre la probabilità che un candidato abbia esperienze
di lavoro e superi il test attitudinale ma non il colloquio è 0.15.
a) Determinare la funzioni di probabilità congiunta di X e Y .
b) Verificare se le variabili casuali X e Y sono indipendenti
c) Calcolare le funzioni di probabilità condizionate di Y per X=0 e X=1
e
confrontarle
Soluzione
a) A partire dalle informazioni riportate nel testo completiamo la distribuzione doppia di
XeY
X | Y
0
1
2
0
0.33
0.22
0.05
0.60
1
0.15
0.15
0.10
0.40
0.48
0.37
0.15
1
9
b) Nel caso della v.c. doppia (X,Y) si dice che le due componenti sono indipendenti se
una delle seguenti Condizioni è verificata:
[1] M = NO P9 = QR S = = NO = ?O.
[2] M9 = QR P = NO S = M9 = QR S = ?.R
per ogni i,j
per ogni i,j
[3] T = NO ∩ M9 = QR SV = ?OR = = NO ∙ M9 = QR S = ?O. ∙ ?.R
A partire dalla condizione [3] costruiamo la tabella teorica sotto l’ ipotesi di
indipendenza (interpretazione probabilistica dell’indice KL ):
X | Y
0
1
2
0
0.288
0.222
0.09
0.60
1
0.192
0.148
0.06
0.40
0.48
0.37
0.15
1
due variabili X e Y sono indipendenti se la loro distribuzione congiunta può essere
espressa come prodotto delle distribuzioni marginali. In questo caso X e Y non sono
indipendenti.
c) Le funzioni di probabilità condizionate di Y per X=0,1 sono:
WX = Y|Z = [ = 0.33⁄0.60 = 0.55\3Q = 0
0.22/0.60 = 0.37\3Q = 1
0.05/0.60 = 0.08\3Q = 2
WX = Y|Z = _ = 0.15⁄0.40 = 0.375\3Q = 0
0.15/0.40 = 0.375\3Q = 1
0.10/0.40 = 0.25\3Q = 2
Come del resto verificato nella soluzione b) le variabili casuali X e Y non sono
indipendenti poiché, la condizione [2] non è verificata essendo
M9 = QR P = 0S e M9 = QR P = 1S ≠ 9 = QR Resta confermata la migliore riuscita dei candidati con esperienza lavorativa.
10
Scarica