Compito ETR 31 gennaio - Home | Scienze Statistiche

Università degli Studi di Padova
Facoltà di Scienze Politiche
STATISTICA
Laurea: Economia internazionale
Laurea: Economia territoriale e reti d’imprese
Prova del 31/01/2006
(ETR31016.tex)
[19pt] 1) La seguente tabella riporta la consistenza del parco veicolare in alcuni comuni
della provincia di Pordenone al 31/12/2003. Fonte: Comune di Pordenone, Ufficio
di Statistica. In particolare, sono state rilevate le seguenti variabili statistiche:
1X
2X
3X
4X
5X
6X
:
:
:
:
:
:
Autovetture;
Motocicli;
Autoveicoli speciali;
Autobus;
Autocarri trasporto merci;
Motocarri trasporto merci.
Comune
1X
Aviano
5411
Budoia
1256
Casarsa della Delizia
4851
Cordenons
10723
Fontanafredda
5937
Polcenigo
1798
Prata di Pordenone
4384
Sacile
11504
San Vito al Tagliamento 8525
Sesto al Reghena
3305
Spilimbergo
7426
Vajont
883
2X
3X
542
69
150
18
381
37
1104 152
561
95
202
15
325
51
1030 145
750 1069
310
33
718 145
97
4
4X
5X
6X
4
1
18
6
13
2
1
6
8
3
14
2
506
134
337
821
759
160
613
1088
679
273
957
62
7
17
3
31
13
11
3
2
10
1
11
3
[1pt] 1.1) Qual è l’unità statistica, la natura delle variabili e su quale scala sono
misurate.
[2pt]
1.2) Calcolare la mediana e il quantile Q0.8 della variabile 3 X.
[1pt] 1.3) Determinare quante siano in percentuale le unità statistiche che presentino
un numero di autobus superiore a 5 e un numero di motocicli superiore a 500.
[2pt] 1.4) Si misurino e confrontino la variabilità della variabile 5 X, autocarri trasporto
merci e la variabile 1 X, autovetture. Commentare opportunamente.
[2pt]
1.5) Si rappresentino in un diagramma cartesiano le variabili 5 X (in ordinata) e 1 X
(in ascissa) valutando se si possano ritenere stocasticamente indipendenti. In caso
contrario si diano alcune ipotesi interpretative.
[2pt]
1.6) Si valuti l’intensità della eventuale dipendenza in media di 5 X da 1 X mediante
il rapporto di correlazione η52X/1 X , specificando accuratamente la validità di un tale
indicatore in un simile contesto.
1
[1pt]
1.7) Si determinino, nell’ambito del principio dei minimi quadrati, i parametri del
modello di regressione
5X
= α0 + α1 1 X + ε.
[2pt]
1.8) Si valuti, mediante il quadrato del coefficiente di correlazione lineare, il grado di
adattamento relativo della retta di regressione calcolata al punto precedente, con opportuni commenti critici. Inoltre, si rappresenti graficamente la retta di regressione
sul diagramma cartesiano prodotto al punto 1.5).
[2pt]
1.9) Si determini, sulla scorta del modello lineare di cui al punto 1.7), il valore teorico
del numero di autocarri per il trasporto merci calcolato per il comune di Spilimbergo,
commentando opportunamente lo scostamento rispetto al valore osservato.
[2pt]
1.10) Se si studia la regressione multipla, secondo i minimi quadrati, del carattere
5 X su alcuni dei restanti caratteri, attraverso il modello
5X
= α0 + α1 1 X + α2 2 X + α3 3 X + α4 4 X + α5 6 X + ε,
si ottengono i risultati che seguono, ove, tra parentesi tonde, figura la statistica
t: αˆ0 = 32.4557 (0.2832); αˆ1 = 0.143139 (0.8997); αˆ2 = −0.53749 (−0.3143);
αˆ3 = −0.156449 (−0.7370); αˆ4 = 2.8593 (0.2764); αˆ5 = −0.607213 (−0.0573);
con un valore di 5 X R12X,2 X,3 X,4 X,6 X pari a 0.860067. Commentare i risultati ottenuti
precisando il grado di attendibilità del modello proposto, la differente rilevanza
delle componenti esplicative adottate, valutando la possibilità di operare riduzioni
del modello.
[2pt]
1.11) Se si esclude dal modello precedente la componente relativa alla variabile 6 X
e si stima il modello
5X
= α0 + α1 1 X + α2 2 X + α3 3 X + α4 4 X + ε,
si ottengono i risultati che seguono, ove, tra parentesi tonde, figura ancora la statistica t: αˆ0 = 29.3431 (0.31395); αˆ1 = 0.150141 (1.59051); αˆ2 = −0.615332 (−0.63939);
αˆ3 = −0.159835 (−0.84647); αˆ4 = 2.77824 (0.29271); con un valore di 5 X R12X,2 X,3 X,4 X,6 X
pari a R − squared = 0.859991. Interpretare i risultati riferendosi esplicitamente
al contesto reale descritto al punto 1), precisando il grado di attendibilità del
modello ottenuto e la possibilità di operare ulteriori riduzioni nel modello stesso.
[11pt]
2) Nella seguente tabella viene riportata la distribuzione dei conducenti di veicoli
coinvolti in incidenti stradali per classe d’età e genere. Anno 2003. Fonte: Comune
di Pordenone, Ufficio di Statistica.
2
Y : Genere
X: Classe d’età Maschi Femmine Totale
0 a 17
24
2
26
17 a 25
95
34
129
25 a 60
300
148
448
60 a 80
65
22
87
Totale
484
206
690
[1pt]
2.1) Si individuino l’unità statistica, la natura e la scala di misurazione delle
variabili rilevate.
[2pt]
[3pt]
2.2) Calcolare, se possibile, moda, mediana e media aritmetica di X e Y .
2.3) Calcolare, rappresentare graficamente e confrontare le distribuzioni di frequenza relativa della variabile X, Classe d’età, per i maschi e le femmine, commentando opportunamente i risultati ottenuti.
[2pt] 2.4) Calcolare e commentare opportunamente il grado di mutabilità della variabile Genere.
[1pt] 2.5) Si valuti se la Classe d’età si possa ritenere stocasticamente indipendente
dal Genere.
[2pt] 2.6) Si quantifichi, attraverso un indice entropico, il grado di dipendenza della
Classe d’età dal Genere.
[3pt]
3) Sia data una variabile statistica doppia a componenti quantitative (X, Y ). Se il
2
rapporto di correlazione ηX|Y
e il quadrato del coefficiente di correlazione lineare di
2
Bravais-Pearson ρ sono uguali, che cosa si può affermare riguardo la relazione tra
X e Y?
[6pt]
4) Per valutare l’efficacia di una nuova campagna pubblicitaria è possibile effettuare
una valutazione del cambiamento di regime nel trend evolutivo delle vendite.
Si consideri pertanto un modello di regressione a due regimi. Se t < to , il modello
locale è Y = a + bt + ε. Se invece t ≥ to , il modello assume la forma Y = α + βt + ε0 .
Si illustri una tecnica per il controllo della significatività della differenza fra b e β.
[4pt]
5) La descrizione di una variabile statistica Y, marginale di una variabile doppia
(X, Y ), può essere circoscritta in termini approssimati ai primi due momenti ordinari
M (Y ) e M (Y 2 ), ovvero la media aritmetica µY e la varianza σY2 .
5.1) Si illustri e si provi la relazione esistente tra la funzione di regressione µY (x),
x ∈ X e la media marginale µY .
[3pt]
3
[1pt]
5.2) Si dimostri che non esiste un’analoga relazione fra varianza condizionata σY2 (x),
x ∈ X e varianza marginale σY2 .
[5pt]
6) Un’azienda che produce cereali per la prima colazione realizza confezioni da 375
grammi netti. A tutela del consumatore si prevede che non più del 2% delle confezioni abbia un contenuto netto inferiore al valore nominale. Ad un controllo, il peso
netto modale è risultato pari a 382 grammi, mentre la differenza interquartilica è di
12 grammi. Sotto le usuali assunzioni di normalità, si stabilisca se l’azienda rispetta
la soglia del 2% di confezioni sotto il peso dichiarato.
[7pt]
7) Un’azienda che effettua la consegna di acqua minerale e bevande a domicilio decide
di valutare il livello di soddisfazione s della sua clientela riguardo alla puntualità
delle consegne. A tale scopo seleziona casualmente un campione dei suoi clienti e,
attraverso un sondaggio telefonico, ottiene una stima campionaria della percentuale
di clienti soddisfatti, ŝ.
[1pt] 7.1) Si illustrino le proprietà principali dello stimatore “percentuale campionaria”.
[4pt]
7.2) Nell’ipotesi che l’errore campionario sia posto pari a cinque punti percentuali
(in entrambe le direzioni), quale deve essere la numerosità campionaria minima,
n0.95 , tale da garantire il rispetto della tolleranza prefissata con una probabilità del
95%?
[2pt]
7.3) Viceversa, nel caso in cui l’azienda effettui 300 interviste, qual è il livello di
tolleranza garantita con una probabilità del 95%?
4