Esercitazione di Statistica e analisi dei dati 13/1/2016 Lungo alcuni sentieri di montagna si trovano qua e là cespugli di un'altra erba rara, chiamiamola aroma. Sia la variabile aleatoria che descrive il numero di cespugli di aroma che si incontrano durante una passeggiata lunga un chilometro, e supponiamo che questa variabile aleatoria segua una legge di Poisson. Domanda 1 Si esprima, in funzione di chilometro, la probabilità chilometro. numero medio di cespugli di aroma incontrati in una passeggiata di un di incontrare cespugli durante una passeggiata di un Risposta Cammino su un sentiero per un chilometro e raccolgo un ramo da tutti i cespugli di aroma che incontro. Torno in paese e vendo ogni ramo di aroma a 2€ l'uno. Sia la variabile aleatoria che descrive il guadagno dopo una passeggiata. Domanda 2.a Si esprima in funzione di Risposta Domanda 2.b Si esprima in funzione di . Risposta Domanda 2.c Si esprima la varianza Risposta di in funzione di . Domanda 2.d Supponendo che si trovi in media un cespuglio di aroma ogni 500 metri, si calcoli la probabilità che la passeggiata mi frutti più di 2€. Risposta Va notato come R metta a disposizione funzioni analoghe per tutte le principali famiglie di distribuzioni; in particolare, per quanto riguarda le distribuzioni viste a lezione si può consultare la tabella seguente: Distribuzione Densità CDF Quantile Estrazione Binomiale dbinom pbinom qbinom rbinom Esponenziale dexp pexp qexp rexp Geometrica dgeom pgeom qgeom rgeom Ipergeometrica dhyper phyper qhyper rhyper Normale dnorm pqnorm qnorm rnorm Poisson dpois ppois qpois rpois Uniforme cont. dunif punif qunif runif In questa tabella per ogni distribuzione sono indicate quattro funzioni: una per la densità / massa di probabilità una per la distribuzione cumulativa una per il calcolo dei quantili In [79]: qnorm(.95, 0, 1) Out[79]: 1.64485362695147 una per la simulazione dell'estrazione di specificazioni In [82]: rnorm(10, 0, 1) Out[82]: 0.520250364720201 1.31184763727525 1.69871829721334 0.669116798379552 -0.236600523085068 -1.77336676211927 0.0434332167874422 -1.26593021425117 -0.370090874492625 0.268046102444882 Modelliamo la variabile aleatoria che indica la distanza tra due cespugli consecutivi di aroma come una variabile esponenziale di parametro Domanda 3.a Si esprima in funzione di (misurata in chilometri). il valore atteso della distanza tra due cespugli consecutivi di aroma Risposta Domanda 3.b Si scriva, in funzione di , la densità di probabilità di Risposta Sto camminando su un sentiero e raccogliendo un ramo da ogni cespuglio di aroma che incontro. Ho appena raccolto un ramo. Domanda 3.c Qual è la probabilità che nei prossimi chilometri io non incontri altri cespugli di aroma? Risposta Domanda 3.d Dal momento in cui ho raccolto l'ultimo ramo di aroma ho già percorso chilometri senza incontrare altri cespugli. Qual è la probabilità che nei successivi chilometri io non incontri altri cespugli? Risposta Durante le vacanze ho fatto 10 passeggiate di un chilometro sui sentieri intorno al paese, senza mai tornare su un tragitto già percorso. Ho raccolto un ramo di aroma da ogni cespuglio incontrato, e venduto i rami a 2€ l'uno. Ho annotato la somma di denaro ricavata dopo ogni passeggiata Salviamo questi dati in un vettore dati e il numero di osservazioni nella variabile n In [65]: dati = c(4, 0, 8, 0, 0, 6, 6, 2, 4, 2) n = length(dati) # campione di Y Domanda 4.a Fornire una stima di Risposta Domanda 4.b Fornire una stima del guadagno atteso a seguito di una passeggiata. Risposta Domanda 4.c Indicando con la variabile aleatoria che descrive la statistica usata al punto precedente, indicare la media e la varianza di rispettivamente in funzione di e di e . Risposta Domanda 4.d Utilizzando il teorema del limite centrale, fornire un'approssimazione della probabilità in funzione di , , e della funzione di distribuzione cumulativa normale standard. Risposta Domanda 4.e Utilizzando l'approssimazione ottenuta al punto precedente, indicare che relazione deve sussistere tra , , e la funzione di distribuzione cumulativa normale standard affinché Risposta Domanda 4.f Sostituendo a il numero di passeggiate fatte e a la stima che consegue da quanto ottenuto al punto 4.a, determinare per quali valori di sussiste la relazione , sfruttando l'approssimazione del punto 4.d. Risposta Domanda 4.g (opzionale) Che conclusioni si possono trarre da quanto ottenuto nei punti da 4.d a 4.f? (Suggerimento, immaginate di sostituire a il valore stimato al punto 4.b) Risposta Domanda 5 Si determini un numero tale che facendo almeno passeggiate diventa non inferiore a 0.95 la probabilità che la mia stima disti in valore assoluto dal valore stimato meno di . Risposta Domanda 6 Si determini un numero tale che facendo almeno passeggiate diventa non inferiore a 0.95 la probabilità che la mia stima disti in valore assoluto dal valore stimato meno di 10 centesimi di €. Risposta