Esercizio 21-04-2005

Esercizio 21-04-2005
Esercizio 1
L'assistenza ai clienti di una società del gas intende stimare la durata media del tempo che intercorre tra la
ricezione di una richiesta di allacciamento e l'effettivo allacciamento. Viene estratto un campione casuale di
15 case, per cui si ottengono i risultati in numero di giorni di attesa che leggiamo nel foglio Eserc1.
a) Calcolate un intervallo di confidenza di livello 95% per la media del tempo di attesa.
Calcolare la media aritmetica utilizzando la funzione MEDIA (INSERISCI/FUNZIONE/STATISTICHE) e lo
scarto quadratico medio con la funzione DEV.ST (INSERISCI/FUNZIONE/STATISTICHE ) mettendo in
entrambe come riferimento le celle relative ai dati.
Poiché il campione è composto soltanto da 15 elementi e la varianza non è nota la variabile media aritmetica
campionaria si distribuisce come una t di student con 14 gdl (gradi di libertà)
Per ottenere il valore della t con 14 gdl corrispondente al 5% di probabilità utilizzare la funzione INV.T
specificando la probabilità nel notro caso 0.05 e il numero di gradi libertà (14).
Lo scarto quadratico medio della variabile aleatoria media aritmetica campionaria è dato dal rapporto dello
scarto quadratico medio calcolato sui dati campionari e dalla radice del numero degli elementi
(=G35/RADQ(15)).
L’estremo inferiore dell’intervallo verrà calcolato: =G33-B46*F48 (G33 è la cella che contiene la media
campionaria, B46 contiene la t di student e F48 lo scarto quadratico della variabile aleatoria)
L’estremo superiore: =G33-B46*F48.
L’intervallo è [87.769, 109.964]
b) Quale ipotesi si deve fare sulla distribuzione della popolazione al punto a)
Poiché il campione è piccolo e la varianza di popolazione  non è nota, l'ipotesi iniziale è quella che il
carattere X si distribuisca come una Normale. Infatti solo ammettendo la normalità distributiva di X, si ha che
la variabile aleatoria media aritmetica campionaria X ha distribuzione Normale. Inoltre solo ammettendo la
normalità distributiva di X, si ha che
(n  1)s 2
2
è distribuito come un
Infine, il rapporto tra una N(0,1) e la radice di un
2
2
con n-1 gdl.
diviso per i suoi gradi di libertà, tra loro indipendenti,
si distribuisce come una t di Student con n-1 gradi di libertà.
c) Supponete che l'ultimo valore sia 286 giorni al posto di 86. Rispondete di nuovo al punto a).
Quale effetto ha questo cambiamento sull'intervallo di confidenza?
Ricalcolare la media lo scarto quadratico medio e lo scarto quadratico della variabile aleatoria media
aritmetica campionaria. Quindi calcolo dei due estremi dell’intervallo come mostrato in precedenza.
L’intervallo è [83.42, 140.98]
Esercizio 2
Un venditore di automobili intende stimare la proporzione di clienti che possiedono ancora l'automobile
acquistata 5 anni fa. Dagli archivi del venditore viene estratto un campione casuale di 200 clienti, 82 dei
quali ancora possiedono l'automobile acquistata 5 anni fa.
a) Calcolate un intervallo di confidenza di livello 90% per stimare la proporzione di clienti del
venditore che possiedono ancora l'automobile acquistata 5 anni fa.
La variabile aleatoria frequenza relativa campionaria Fr ha media uguale alla frequenza di popolazione p
La frequenza relativa campionaria f, può essere assunta come stimatore puntuale ed è: =82/200.
Ha scarto quadratico medio [p(1-p)/n]1/2 pari a : =RADQ(F16 *(1-F16)/200) se in F16 troviamo il valore di p.
Poiché il campione è grande, la variabile aleatoria frequenza relativa campionaria si distribuisce
asintoticamente come una Normale quindi per calcolare il valore della normale z 0.95 corrispondente al valore
di probabilità 0.95 utilizziamo la funzione INV.NORM.ST(0.95).
L’estremo inferiore dell’intervallo sarà dato da: =F16-B22*C17 dove in F16 troviamo il valore di p, in B22 il
valore della statistica z e in C17 il valore dello scarto quadratico medio della variabile aleatoria frequenza
relativa campionaria.
L’estremo superiore dell’intervallo: =F16+B22*C17
L’intervallo sarà: [0.3527, 0.4672]
b) Il venditore di automobili intende valutare il livello di soddisfazione dei suoi clienti per le
macchine acquistate presso di lui. In che modo può usare i risultati del punto a)?
Il risultato ottenuto al punto a) indica che, con livello di fiducia pari al 95%, una percentuale di clienti
compresa tra il 35% e il 47% è rimasta soddisfatta dell'acquisto fatto 5 anni prima.
Esercizio 3
Uno psicologo industriale vuole studiare gli effetti incentivo sulle vendite rappresentati dalla particolare
forma di compenso corrisposto ai venditori. Viene considerato a tal fine un campione di 24 venditori, 12 dei
quali sono pagati con una quota fissa per ogni ora di lavoro (1), mentre i restanti 12 ricevono delle
commissioni sulle vendite realizzate (2). Nella foglio eserc3 sono riportati i volumi delle vendite relative ai 24
venditori del campione, opportunamente divise nei due sottocampioni considerati.
a) Lo psicologo può affermare, ad un livello di significatività   0.01 , che il pagamento per
commissioni rappresenta un incentivo al venditore che comporta un aumento delle vendite
medie?
Poiché entrambi i campioni sono di piccola numerosità, n<30, e non si conoscono le varianze in
popolazione, l'ipotesi H 0 :  1   2   viene controllata con la statistica test t di Student.
Calcolare la media relativa al primo gruppo con la funzione MEDIA ( celle A11:A22)
Calcolare la media relativa al secondo gruppo con la funzione MEDIA ( celle A23:A34)
ŝ 12 con la funzione VAR(celle A11:A22)
2
Calcolare lo scarto quadratico medio sui valori del secondo gruppo ŝ 2 con la funzione VAR(celle A23:A34)
Calcolare lo scarto quadratico medio sui valori del primo gruppo
Calcolare lo scarto quadratico come media dei primi due ŝ
rispettivamente
2
1
ŝ e in B57 ŝ
*2
=((B55*11)+(B57*11))/22. se in B55 abbiamo
2
2
Il valore di t concreto si ottiene =(B51-B53)/RADQ(B59*2/12) se in B51 abbiamo m1 e in B53 m2 e in B59 lo
scarto quadratico medio del test.
Il valore t0.01,22 teorico viene ottenuto con la funzione INV.T(0.02,22) Di default tale funzione utilizza una
probabilità corrispondente ad distribuzione t a due code per questo utilizziamo 0.02.
b) Quali ipotesi devono essere fatte al punto precedente, per giustificare l'utilizzo del test
scelto?
Per poter applicare la statistica test t quando i campioni sono di piccola numerosità e le varianze di
popolazione sono incognite, è necessario che valga la condizione di normalità distributiva per X1 "
ammontare delle vendite nella popolazione dei venditori pagati con compenso orario" e X2 "ammontare delle
vendite nella popolazione dei venditori pagati per commissione eseguita" e che le varianze di X1 e X2 siano
2
2
2
uguali  1   2  
c) Calcolare il p-value e interpretarne il significato
Il p-value può essere calcolato con la funzione DISTRIB.T(2.7467,22,1) corrispondente al test t con 22
gradi di libertà test ad 1 coda.
Stesso risultato si può ottenere utilizzando la funzione TEST.T in cui in matrice1 e matrice2 vengono
specificate le matrici dei 2 campioni, in coda quante code ha il notro test e in tipo che tipo di test effettuiamo
nel nostro caso un test per campioni accoppiati con stessa varianza (tipo=1).
Esercizio 4
Nella provincia di Nassau è stata effettuata un'indagine finalizzata ad individuare l'esistenza di eventuali
relazioni fra lo stile architettonico delle case e la posizione geografica delle stesse. I risultati sono riportati
nel foglio eserc4
a) Si può ipotizzare che lo stile architettonico sia indipendente dalla posizione geografica delle
case?
Si scelga un valore di =0.05.
Entrambi i caratteri sono qualitativi, quindi è possibile verificare esclusivamente un tipo di indipendenza
distributiva. La statistica test utilizzata è:
u
v
  
2
c
i 1 h 1
n
ih
 nih*
nih*

2
Per il calcolo della distribuzione attesa nell’ipotesi d’indipendenza riportare le intestazioni delle righe e delle
colonne della tabella a doppi a entrata quindi procedendo con la prima cella =I9*$C$14/$I$14 dove I9
contiene il valore concreto corrispondente alla prima riga e prima colonna della tabella C14 contiene il totale
di colonna infine I14 il totale complessivo dei dati.
Una volta calcolato il primo valore procediamo per colonna estendendo la formula alle altre celle.
Quindi calcoliamo la tabella degli scarti al quadrato =(C9-C36)^2/C36 (C9 contiene il valore concreto C36 il
valore nel caso d’indipendenza) estendendo tale calcolo a tutele celle della tabella.
Il valore di 2 possiamo leggerlo direttamente nella cella che contiene il totale degli scarti al quadrato.
Confrontiamo tale valore con 20.005,8 calcolata con la funzione INV.CHI corrispondente ad un livello di
probabilità pari a 0.05 ed ad un numero di gradi di libertà pari a 8.
2  2
Poiché 
si rifiuta l'ipotesi di indipendenza distributiva tra lo stile architettonico e la posizione
c
geografica delle case considerate.
Esercizio 5
Un professore di contabilità è interessato a valutare la comprensibilità dei rendiconti annuali di due società.
Come supporto nella valutazione, egli decide di reclutare 100 contabili qualificati e di assegnarli per metà
all'uno e per metà all'altro rendiconto analizzato. Basandosi su misure standard di leggibilità, 17 dei 50
contabili assegnati alla lettura del rendiconto prodotto dalla società A giudicano "leggibile" tale rendiconto; lo
stesso giudizio è attribuito al rendiconto della società B da parte di 23 dei 50 contabili coinvolti.
a) Con un livello di significatività pari a 0.1, si può affermare che esiste una differenza
significativa nella leggibilità dei rendiconti annuali?
L'ipotesi nulla è: H0:pA=pB=p . Il campione è di grandi dimensioni, n>30; la variabile aleatoria "differenza
fra due variabili frequenza relativa campionaria" converge alla Normale standardizzata.
zc 
f1  f2
f (1  f )(n1  n 2 ) / n1 n 2
Calcolare la percentuale dei contabili che reputano leggibile il rendiconto della società A: pA=17/50
Calcolare la percentuale dei contabili che reputano leggibile il rendiconto della società B: p B=23/50
Calcolo di p=(pA*50+pB*50)/100
Calcolare il valore della normale standardizzata relativo ad un livello di significatività dello 0.1
=(B24-B26)/RADQ(B28*(1-B28)*100/50*50) =-1.22
Confrontare tale valore con il valore teorico della distribuzione normale standardizzata ottenuta con la
funzione INV.NORM.ST(0.05)=-1.66
Dal momento che -1.22>-1.66 non si rifiuta l'ipotesi nulla, concludendo che non esiste una differenza
significativa fra le proporzioni di contabili che reputano leggibili i rendiconti delle due società.
b) Calcolare il p-value e interpretarne il significato.
Pvalue=DISTRIB.NORM.ST(B30) dove B30 contiene il valore di p
La probabilità di estrarre due campioni tali per cui la differenza, in valore assoluto, fra le due proporzioni
campionarie di successi è maggiore o uguale a 0.46-0.34=0.12, supponendo che l'ipotesi nulla sia vera è
0.11*2=0.22.
c) Cosa succederebbe se il numero di contabili che giudicano leggibile il rendiconto prodotto
dalla società B aumentasse a 33?
pB=33/50
p=(B24*50+B46*50)/100 B24 contiene pA e B46 pB
zc=(B24-B46)/RADQ(B49*(1-B49)*100/50*50) dove B49 contiene p
Poiché -3.2<-1.645 l'ipotesi nulla deve essere rifiutata; esiste una differenza significativa fra le due
proporzioni di contabili che reputano leggibili i rendiconti delle due società.