Università degli Studi di Padova Facoltà di Scienze Politiche STATISTICA Laurea: Economia internazionale Laurea: Economia territoriale e reti d’imprese Prova del 31/01/2006 (ETR31016.tex) [19pt] 1) La seguente tabella riporta la consistenza del parco veicolare in alcuni comuni della provincia di Pordenone al 31/12/2003. Fonte: Comune di Pordenone, Ufficio di Statistica. In particolare, sono state rilevate le seguenti variabili statistiche: 1X 2X 3X 4X 5X 6X : : : : : : Autovetture; Motocicli; Autoveicoli speciali; Autobus; Autocarri trasporto merci; Motocarri trasporto merci. Comune 1X Aviano 5411 Budoia 1256 Casarsa della Delizia 4851 Cordenons 10723 Fontanafredda 5937 Polcenigo 1798 Prata di Pordenone 4384 Sacile 11504 San Vito al Tagliamento 8525 Sesto al Reghena 3305 Spilimbergo 7426 Vajont 883 2X 3X 542 69 150 18 381 37 1104 152 561 95 202 15 325 51 1030 145 750 1069 310 33 718 145 97 4 4X 5X 6X 4 1 18 6 13 2 1 6 8 3 14 2 506 134 337 821 759 160 613 1088 679 273 957 62 7 17 3 31 13 11 3 2 10 1 11 3 [1pt] 1.1) Qual è l’unità statistica, la natura delle variabili e su quale scala sono misurate. [2pt] 1.2) Calcolare la mediana e il quantile Q0.8 della variabile 3 X. [1pt] 1.3) Determinare quante siano in percentuale le unità statistiche che presentino un numero di autobus superiore a 5 e un numero di motocicli superiore a 500. [2pt] 1.4) Si misurino e confrontino la variabilità della variabile 5 X, autocarri trasporto merci e la variabile 1 X, autovetture. Commentare opportunamente. [2pt] 1.5) Si rappresentino in un diagramma cartesiano le variabili 5 X (in ordinata) e 1 X (in ascissa) valutando se si possano ritenere stocasticamente indipendenti. In caso contrario si diano alcune ipotesi interpretative. [2pt] 1.6) Si valuti l’intensità della eventuale dipendenza in media di 5 X da 1 X mediante il rapporto di correlazione η52X/1 X , specificando accuratamente la validità di un tale indicatore in un simile contesto. 1 [1pt] 1.7) Si determinino, nell’ambito del principio dei minimi quadrati, i parametri del modello di regressione 5X = α0 + α1 1 X + ε. [2pt] 1.8) Si valuti, mediante il quadrato del coefficiente di correlazione lineare, il grado di adattamento relativo della retta di regressione calcolata al punto precedente, con opportuni commenti critici. Inoltre, si rappresenti graficamente la retta di regressione sul diagramma cartesiano prodotto al punto 1.5). [2pt] 1.9) Si determini, sulla scorta del modello lineare di cui al punto 1.7), il valore teorico del numero di autocarri per il trasporto merci calcolato per il comune di Spilimbergo, commentando opportunamente lo scostamento rispetto al valore osservato. [2pt] 1.10) Se si studia la regressione multipla, secondo i minimi quadrati, del carattere 5 X su alcuni dei restanti caratteri, attraverso il modello 5X = α0 + α1 1 X + α2 2 X + α3 3 X + α4 4 X + α5 6 X + ε, si ottengono i risultati che seguono, ove, tra parentesi tonde, figura la statistica t: αˆ0 = 32.4557 (0.2832); αˆ1 = 0.143139 (0.8997); αˆ2 = −0.53749 (−0.3143); αˆ3 = −0.156449 (−0.7370); αˆ4 = 2.8593 (0.2764); αˆ5 = −0.607213 (−0.0573); con un valore di 5 X R12X,2 X,3 X,4 X,6 X pari a 0.860067. Commentare i risultati ottenuti precisando il grado di attendibilità del modello proposto, la differente rilevanza delle componenti esplicative adottate, valutando la possibilità di operare riduzioni del modello. [2pt] 1.11) Se si esclude dal modello precedente la componente relativa alla variabile 6 X e si stima il modello 5X = α0 + α1 1 X + α2 2 X + α3 3 X + α4 4 X + ε, si ottengono i risultati che seguono, ove, tra parentesi tonde, figura ancora la statistica t: αˆ0 = 29.3431 (0.31395); αˆ1 = 0.150141 (1.59051); αˆ2 = −0.615332 (−0.63939); αˆ3 = −0.159835 (−0.84647); αˆ4 = 2.77824 (0.29271); con un valore di 5 X R12X,2 X,3 X,4 X,6 X pari a R − squared = 0.859991. Interpretare i risultati riferendosi esplicitamente al contesto reale descritto al punto 1), precisando il grado di attendibilità del modello ottenuto e la possibilità di operare ulteriori riduzioni nel modello stesso. [11pt] 2) Nella seguente tabella viene riportata la distribuzione dei conducenti di veicoli coinvolti in incidenti stradali per classe d’età e genere. Anno 2003. Fonte: Comune di Pordenone, Ufficio di Statistica. 2 Y : Genere X: Classe d’età Maschi Femmine Totale 0 a 17 24 2 26 17 a 25 95 34 129 25 a 60 300 148 448 60 a 80 65 22 87 Totale 484 206 690 [1pt] 2.1) Si individuino l’unità statistica, la natura e la scala di misurazione delle variabili rilevate. [2pt] [3pt] 2.2) Calcolare, se possibile, moda, mediana e media aritmetica di X e Y . 2.3) Calcolare, rappresentare graficamente e confrontare le distribuzioni di frequenza relativa della variabile X, Classe d’età, per i maschi e le femmine, commentando opportunamente i risultati ottenuti. [2pt] 2.4) Calcolare e commentare opportunamente il grado di mutabilità della variabile Genere. [1pt] 2.5) Si valuti se la Classe d’età si possa ritenere stocasticamente indipendente dal Genere. [2pt] 2.6) Si quantifichi, attraverso un indice entropico, il grado di dipendenza della Classe d’età dal Genere. [3pt] 3) Sia data una variabile statistica doppia a componenti quantitative (X, Y ). Se il 2 rapporto di correlazione ηX|Y e il quadrato del coefficiente di correlazione lineare di 2 Bravais-Pearson ρ sono uguali, che cosa si può affermare riguardo la relazione tra X e Y? [6pt] 4) Per valutare l’efficacia di una nuova campagna pubblicitaria è possibile effettuare una valutazione del cambiamento di regime nel trend evolutivo delle vendite. Si consideri pertanto un modello di regressione a due regimi. Se t < to , il modello locale è Y = a + bt + ε. Se invece t ≥ to , il modello assume la forma Y = α + βt + ε0 . Si illustri una tecnica per il controllo della significatività della differenza fra b e β. [4pt] 5) La descrizione di una variabile statistica Y, marginale di una variabile doppia (X, Y ), può essere circoscritta in termini approssimati ai primi due momenti ordinari M (Y ) e M (Y 2 ), ovvero la media aritmetica µY e la varianza σY2 . 5.1) Si illustri e si provi la relazione esistente tra la funzione di regressione µY (x), x ∈ X e la media marginale µY . [3pt] 3 [1pt] 5.2) Si dimostri che non esiste un’analoga relazione fra varianza condizionata σY2 (x), x ∈ X e varianza marginale σY2 . [5pt] 6) Un’azienda che produce cereali per la prima colazione realizza confezioni da 375 grammi netti. A tutela del consumatore si prevede che non più del 2% delle confezioni abbia un contenuto netto inferiore al valore nominale. Ad un controllo, il peso netto modale è risultato pari a 382 grammi, mentre la differenza interquartilica è di 12 grammi. Sotto le usuali assunzioni di normalità, si stabilisca se l’azienda rispetta la soglia del 2% di confezioni sotto il peso dichiarato. [7pt] 7) Un’azienda che effettua la consegna di acqua minerale e bevande a domicilio decide di valutare il livello di soddisfazione s della sua clientela riguardo alla puntualità delle consegne. A tale scopo seleziona casualmente un campione dei suoi clienti e, attraverso un sondaggio telefonico, ottiene una stima campionaria della percentuale di clienti soddisfatti, ŝ. [1pt] 7.1) Si illustrino le proprietà principali dello stimatore “percentuale campionaria”. [4pt] 7.2) Nell’ipotesi che l’errore campionario sia posto pari a cinque punti percentuali (in entrambe le direzioni), quale deve essere la numerosità campionaria minima, n0.95 , tale da garantire il rispetto della tolleranza prefissata con una probabilità del 95%? [2pt] 7.3) Viceversa, nel caso in cui l’azienda effettui 300 interviste, qual è il livello di tolleranza garantita con una probabilità del 95%? 4