UNIVERSITA’ DI BOLOGNA Corso in Metodi quantitativi per l’analisi dello sviluppo Prova 21/12/2004 Soluzioni Esercizio 1 Nella tabella sono riportati i dati relativi al comportamento di acquisto per i prodotti del commercio equo e solidale nel periodo natalizio. E’ stata condotta un indagine in una bottega di bologna intervistando 110 clienti ai quali è stato chiesto di rispondere a due domande: se essi sono interessati ai problemi dei paesi in via di sviluppo, risposta (SI o NO), se sono consumatori abituali della bottega risposta (SI o NO). Interesse nello sviluppo Si No Totale Consumatori abituali Si No 40 30 70 Totale 15 25 40 55 55 110 Calcolare la probabilità che, estraendo un individuo a caso tra i 110 intervistati: a) Questo sia interessato ai problemi dello sviluppo P(Interessati)=55/110=0.5 b) Sapendo che l’individuo è interessato ai problemi dello sviluppo calcolare la probabilità che sia un consumatore abituale; P(AbitualiInteressati)=40/55=0.73 c) Cosa si intende per eventi mutuamente esclusivi: A B L’unione dei due L’intersezione dei due eventi è eventi è l’insieme vuoto e l’insieme vuoto. la probabilità dell’unione dei due eventi è uguale alla somma delle probabilità dei singoli eventi. C La probabilità dell’intersezione dei due eventi è pari ad 1. D Gli eventi tra loro sono incompatibili e non è possibile metterli in relazione Esercizio 2 Supponete in una prova scritta con 10 quesiti e tre possibili risposte (A, B e C) di cui una è quella esatta, si supera la prova se si risponde ad almeno 70% delle domande. Se in candidato risponde in maniera casuale, si calcoli: a) Probabilità di rispondere esattamente a tutte le domande; 10 P 0.3310 0.0000153 10 b) Probabilità di superare la prova; 10 10 10 10 10 10 P X 7 k 7 0.33k 0.66 nk 0.337 0.66 3 0.338 0.66 2 0.339 0.661 0.3310 0.66 0 k 7 8 9 10 120(0.000457247)(0.296296296) 45(0.000141)(0.4356) 10(0.000046)(0.66) 0.0000153 0.019662 c) Qual è la speranza matematica (valore atteso) di una distribuzione Binomiale Bin(n,p): A p B p(1-p) C np(1-p) D np Esercizio 3 Per determinare il numero medio di frutti per albero prodotti da un frutteto in una determinata regione, si conduce un indagine campionaria su 70 alberi. Dall’indagine si ottiene un valore medio di frutti per albero pari a 200 con uno scarto quadratico medio pari a 30. a) Qual’é la precisione della nostra stima campionaria con una probabilità del 95% (errore assoluto che ci aspettiamo di dover affrontare)? s Dobbiamo utilizzare la relazione P( x z 0.025 ) 0.95 n 30 intervallo [192.97 ; 207.03] con un errore di 7 unità (circa) in valore assoluto x 1.96 70 b) Quanto grande dovrebbe essere il nostro campione se vogliamo un errore di 5 unità? s s2 2 e 1.96 n 1.96 2 138 e n c) Definire i parametri di una distribuzione Normale A e B C D , e Esercizio 4 In un progetto di sviluppo rurale, si intende promuovere l’uso di una nuova macchina per la raccolta della frutta per aumentarne la raccolta media giornaliera. L’impresa produttrice sostiene che l’uso della nuova macchina aumenta la raccolta giornaliera mediamente di 100 chilogrammi. Prima di adottare la nuova macchina si intende verificare l’effettivo vantaggio della macchina, quindi si sperimenta la macchina per 30 giorni. Dalla sperimentazione ne deriva che l’incremento medio è di 90 chilogrammi con uno scarto quadratico medio di 10. Sulla base della sperimentazione dire se: a) L’affermazione dell’impresa è plausibile al 5% di significatività; L’ipotesi nulla H0: =100 e l’iporesi alternativa H1: 100 non conoscendo il valore della deviazione standard di popolazione la stimiamo con il valore campionario e utilizziamo una distribuzione normale perché abbiamo un campione sufficientemente grande n=30 Due soluzioni equivalenti: Intervallo compreso nella zona di non rifiuto con =0.05 e z / 2 1.96 è: 10 intervallo [93.58 ; 86.42] x 1.96 30 quindi rifiutiamo l’ipotesi nulla in quanto 100 nella zona di rifiuto (nella coda destra), quindi l’affermazione della impresa non è plausibile Oppure possiamo standardizzare e calcolarci la probabilità z x / n 90 100 5.47 molto maggiore del nostro 1.96 quindi rifiutiamo l’ipotesi nulla 10 / 30 b) Con gli stessi dati possiamo affermare che l’incremento medio sia al massimo di 88 chilogrammi? L’ipotesi nulla H0: =88 e l’iporesi alternativa H1: 88, è un test unidirezionale e il valore soglia della zeta è pari 1.645 Come prima posso calcolarmi l’intervallo (zona di non rifiuto) 10 intervallo [0;87] x 1.645 30 non rifiuto l’ipotesi nulla perché la media campionaria cade nella regione di non rifiuto Oppure standardizzare e calcolarci la probabilità z x / n 90 88 1.095 minore del nostro 1.645 quindi non rifiutiamo l’ipotesi nulla 10 / 30 c) Dire che cos’è α A La probabilità di rifiutare l’ipotesi nulla H0 quando essa è falsa B La probabilità di non rifiutare l’ipotesi nulla H0 quando essa è vera C La probabilità di non rifiutare l’ipotesi nulla H0 quando essa è falsa D La probabilità di rifiutare l’ipotesi H0 quando questa è vera Esercizio 5 Di seguito si riportano i dati circa il reddito (in migliaia di euro) medio di alcuni paesi in via di sviluppo e la presenza di ONG (numero di organizzazioni attive nel territorio) che si occupano di cooperazione negli stessi paesi. X (numero ONG) 80 10 Y (reddito) 130 15 160 18 180 25 100 10 130 16 160 21 120 13 110 14 90 8 130 15 120 13 180 24 Ipotizzando che ci sia una relazione tra il reddito (Y) di un paese e la presenza di ONG (X), calcolare: a) Calcolare la stima dei parametri della retta di regressione e darne una interpretazione; x n b1 j 1 j x y j y x n j 1 x 2 j Cod x; y 0.158 Dev x Ad ogni ONG in più sul territorio corrisponde un incremento medio di reddito pari a 158 euro a y bx -5.01 Ipotizzando l’assenza di ONG il reddito teorico sarebbe di meno 3000 euro circa, un risultato irrealistico in quanto i dati non sono veritieri ma inventati. b) Calcolare la bontà di adattamento dei dati e commentare il risultato sapendo che: la devianza residua (o devianza di dispersione) è pari a 61.4 e la devianza totale di Y è uguale a 331.2; R2=1-dev.disp/dev.tot=1-61.4/331.2=0.81 Circa l’80% della variabilità del reddito è spiegata dalla relazione lineare tra il numero di ONG sul territorio e la ricchezza, la retta di regressione si adatta ai dati empirici per un buon 80% c) Definire le proprietà dello stimatore ai minimi quadrati A E’ uno stimatore corretto ed efficiente B E’ uno stimatore corretto e efficiente tra la classe degli stimatori lineari C E’ il miglior stimatore corretto (Best unbiased estimator) D E’ uno stimatore efficiente tra gli stimatori lineari