Metodi quantitativi per l’analisi dello sviluppo Prova del 19/12/2006 Esercizio 1 Si considera un gruppo di 40.000 individui, classificati in base al reddito annuale e al titolo di studio. Reddito ≤25.000 € >25.000 € Titolo di studio Laureato Diplomato 8.000 14.000 22.000 13.000 5.000 18.000 21.000 19.000 40.000 Si estrae a caso un individuo. Calcolare la probabilità che : a) L’individuo estratto sia laureato P(Laureato)= 22000/40000=0,55 b) Sia diplomato ed abbia un reddito non superiore a 25.000 € P(diplomato ∩ ≤25.000 €)= 13000/40000=0,325 c) La probabilità condizionata P(A/B) è data da: 1) 2) 3) 4) P(A/B)= P(A∩B)/P(A) P(A/B)= P(A∩B)/P(B) P(A/B)=P(A)*P(B) P(A/B)= P(A∩B) Esercizio 2 Nonostante gli sforzi fatti per eliminare la malaria si è calcolato che in un paese dell’Africa la probabilità di ammalarsi di malaria è pari a 0,2. Ipotizziamo di estrarre un campione casuale di 4 individui, calcolare la probabilità che: 4 a) Nessuno sia ammalato P(X=0)= 0,200*0,84=1*1*0,4096=0,4096 0 4 b) Tre siano ammalati P(X=3)= 0,23*0,81=4*0,008*0,8=0,0256 3 c) I parametri di riferimento di una distribuzione Binomiale sono: 1) n ;p 2) p ; q 3) n ; np 4) npq ; p Esercizio 3 a) Sapendo che in Camerun la spesa familiare per medicinali si distribuisce come una Normale con media =170$ e scarto quadratico medio =90 calcolare la probabilità che estraendo un campione casuale n=100 famiglie la spesa media del campione non sia superiore a 180. P( X ≤180)=P(Z≤ b) 180 170 90 / 100 )=P(Z≤10/9)= P(Z≤1,11)=0,8665 n Il coefficiente binomiale esprime: x 1) Il numero di casi favorevoli n sui casi possibili x; 2) Il numero permutazioni di x successi e n-x insuccessi; 3) Il numero di combinazioni di n successi in x prove. Esercizio 4 a) Un’azienda di alimenti dietetici vuole studiare il consumo per famiglia di questi prodotti in un paese. La variabile in popolazione si distribuisce normalmente, con media e varianza incognite. Da una rilevazione campionaria su 200 famiglie è risultato che x =2500 e s=1500 (si intende s corretto). Si vuole costruire un intervallo di confidenza al 95%, e si è disposti a tollerare un errore pari a 230. Quale numerosità campionaria è necessario osservare? e= z /2*s/ n n= (z /2*s/e)2 n=(1,96*1500/230)2164 b) Nella determinazione dell’intervallo di confidenza, all’aumentare della numerosità campionaria, a parità di tutte le altre condizioni, la dimensione dell’intervallo di confidenza: 1) aumenta 2) diminuisce 3) resta invariato Esercizio 5 a) In un villaggio africano per studiare il problema della malnutrizione si è estratto un campione di 15 individui e si è rilevato l’apporto calorico giornaliero. E’ risultato che x =1300 calorie e s=200 (si intende s corretto). Sapendo che normalmente l’apporto calorico giornaliero in quella regione è di 1500 calorie verificare l’ipotesi che nel campione selezionato l’apporto calorico giornaliero sia inferiore a quello della regione (considerare un livello di significatività pari a 0,05). H0: =1500 H1: <1500 n=15 x =1300 s=200 t x s/ n 1300 1500 200 / 15 =-200/51,67= -3,87 t14; 0,05= -1,761 -3,87 < -1,761 Rifiuto H0. L’apporto calorico è significativamente diverso nel campione b) Nell’ambito dei test di ipotesi si considerino la probabilità di errore di I tipo e la probabilità di errore di II tipo. Possiamo affermare che: 1) Queste due probabilità sono legate da una relazione inversa, se una aumenta l’altra diminuisce. 2) Le due probabilità sono indipendenti l’una dall’altra. 3) Nell’ambito del test di ipotesi mi interessa solamente l’errore di I tipo Esercizio 5 a) In un campione di 100 donne sono state rilevati i seguenti caratteri età (X) e pressione sanguigna(Y), è stata stimata la retta di regressione ed è risultato che il coefficiente di regressione di Y su X è pari a 1,2 .Possiamo quindi dire che: 1) Per una variazione di un anno la pressione in media aumenta di 1,2; 2) Per una variazione di 1,2 anni la pressione aumenta di 1; 3) Per una variazione di 1,2 anni la pressione aumenta in media di 1. b) In cosa consiste l’ipotesi di omoschedasticità: 1) ipotizziamo che gli errori abbiano media nulla; 2) ipotizziamo che gli errori siano in correlati; 3) ipotizziamo che gli errori abbiano varianza costante c) La devianza di regressione esprime: 1) il divario tra i punti empirici e la loro media 2) La dispersione dei punti empirici attorno alla retta di regressione 3) Il divario tra la retta di regressione empirica e la retta y= y d) Si considerino le seguenti grandezze: ( x j x )( y j y ) =230 ( x j x )2 =40 j j (y j y ) 2 =30 (x j x ) =25 j Calcolare il coefficiente di regressione di Y su X (byx) byx=230/40=5,75 e) Ipotizziamo di avere un campione di n unità, in cui abbiamo rilevato due caratteri quantitativi X e Y e calcolato i parametri della retta di regressione di Y su X. Otteniamo un valore del coeffciente di regressione diverso da zero . Se effettuiamo una verifica di ipotesi, testando l’ipotesi H0:β=0 vogliamo verificare: 1) Se nel campione esiste una dipendenza lineare tra Y e X 2) Se nella popolazione da cui il campione proviene esiste una dipendenza lineare tra Y e X 3) Se nella popolazione da cui il campione proviene esiste una dipendenza non lineare tra Y e X