Esercitazione di Statistica e analisi dei dati

Esercitazione di Statistica e analisi dei dati
13/1/2016
Lungo alcuni sentieri di montagna si trovano qua e là cespugli di un'altra erba rara, chiamiamola
aroma. Sia la variabile aleatoria che descrive il numero di cespugli di aroma che si incontrano
durante una passeggiata lunga un chilometro, e supponiamo che questa variabile aleatoria segua
una legge di Poisson.
Domanda 1
Si esprima, in funzione di
chilometro, la probabilità
chilometro.
numero medio di cespugli di aroma incontrati in una passeggiata di un
di incontrare cespugli durante una passeggiata di un
Risposta
Cammino su un sentiero per un chilometro e raccolgo un ramo da tutti i cespugli di aroma che
incontro. Torno in paese e vendo ogni ramo di aroma a 2€ l'uno. Sia la variabile aleatoria che
descrive il guadagno dopo una passeggiata.
Domanda 2.a
Si esprima
in funzione di
Risposta
Domanda 2.b
Si esprima
in funzione di .
Risposta
Domanda 2.c
Si esprima la varianza
Risposta
di
in funzione di
.
Domanda 2.d
Supponendo che si trovi in media un cespuglio di aroma ogni 500 metri, si calcoli la probabilità che
la passeggiata mi frutti più di 2€.
Risposta
Va notato come R metta a disposizione funzioni analoghe per tutte le principali famiglie di
distribuzioni; in particolare, per quanto riguarda le distribuzioni viste a lezione si può consultare la
tabella seguente:
Distribuzione
Densità CDF
Quantile Estrazione
Binomiale
dbinom pbinom qbinom
rbinom
Esponenziale
dexp
pexp
qexp
rexp
Geometrica
dgeom
pgeom
qgeom
rgeom
Ipergeometrica dhyper phyper qhyper
rhyper
Normale
dnorm
pqnorm qnorm
rnorm
Poisson
dpois
ppois
qpois
rpois
Uniforme cont. dunif
punif
qunif
runif
In questa tabella per ogni distribuzione sono indicate quattro funzioni:
una per la densità / massa di probabilità
una per la distribuzione cumulativa
una per il calcolo dei quantili
In [79]:
qnorm(.95, 0, 1)
Out[79]:
1.64485362695147
una per la simulazione dell'estrazione di specificazioni
In [82]:
rnorm(10, 0, 1)
Out[82]:
0.520250364720201 1.31184763727525 1.69871829721334
0.669116798379552 -0.236600523085068 -1.77336676211927
0.0434332167874422 -1.26593021425117 -0.370090874492625
0.268046102444882
Modelliamo la variabile aleatoria
che indica la distanza tra due cespugli consecutivi di aroma
come una variabile esponenziale di parametro
Domanda 3.a
Si esprima in funzione di
(misurata in chilometri).
il valore atteso della distanza tra due cespugli consecutivi di aroma
Risposta
Domanda 3.b
Si scriva, in funzione di , la densità di probabilità di
Risposta
Sto camminando su un sentiero e raccogliendo un ramo da ogni cespuglio di aroma che incontro.
Ho appena raccolto un ramo.
Domanda 3.c
Qual è la probabilità
che nei prossimi
chilometri io non incontri altri cespugli di aroma?
Risposta
Domanda 3.d
Dal momento in cui ho raccolto l'ultimo ramo di aroma ho già percorso chilometri senza incontrare
altri cespugli. Qual è la probabilità
che nei successivi chilometri io non
incontri altri cespugli?
Risposta
Durante le vacanze ho fatto 10 passeggiate di un chilometro sui sentieri intorno al paese, senza mai
tornare su un tragitto già percorso. Ho raccolto un ramo di aroma da ogni cespuglio incontrato, e
venduto i rami a 2€ l'uno. Ho annotato la somma di denaro ricavata dopo ogni passeggiata
Salviamo questi dati in un vettore dati e il numero di osservazioni nella variabile n
In [65]:
dati = c(4, 0, 8, 0, 0, 6, 6, 2, 4, 2)
n = length(dati)
# campione di Y
Domanda 4.a
Fornire una stima di
Risposta
Domanda 4.b
Fornire una stima del guadagno atteso
a seguito di una passeggiata.
Risposta
Domanda 4.c
Indicando con
la variabile aleatoria che descrive la statistica usata al punto precedente, indicare
la media e la varianza di
rispettivamente in funzione di
e di
e .
Risposta
Domanda 4.d
Utilizzando il teorema del limite centrale, fornire un'approssimazione della probabilità
in funzione di ,
, e della funzione di distribuzione cumulativa normale
standard.
Risposta
Domanda 4.e
Utilizzando l'approssimazione ottenuta al punto precedente, indicare che relazione deve sussistere
tra ,
, e la funzione di distribuzione cumulativa normale standard affinché
Risposta
Domanda 4.f
Sostituendo a il numero di passeggiate fatte e a
la stima che consegue da quanto ottenuto al
punto 4.a, determinare per quali valori di sussiste la relazione
, sfruttando
l'approssimazione del punto 4.d.
Risposta
Domanda 4.g
(opzionale)
Che conclusioni si possono trarre da quanto ottenuto nei punti da 4.d a 4.f? (Suggerimento,
immaginate di sostituire a
il valore stimato al punto 4.b)
Risposta
Domanda 5
Si determini un numero
tale che facendo almeno
passeggiate diventa non inferiore a 0.95 la
probabilità che la mia stima
disti in valore assoluto dal valore stimato meno di
.
Risposta
Domanda 6
Si determini un numero
tale che facendo almeno
passeggiate diventa non inferiore a 0.95 la
probabilità che la mia stima
disti in valore assoluto dal valore stimato meno di 10 centesimi di €.
Risposta