Esercizi di Statistica ∼ Laurea in Biologia Molecolare Francesco Caravenna Foglio 5. (10–14 maggio 2010) Esercitazione del 13 maggio 2010 Richiamo: si calcolino z0.05 , z0.025 , z0.01 , z0.005 , z0.001 [1.645, 1.960, 2.326, 2.576, 3.090]. Esercizio 1 (Reprise dalla settimana precedente). Il consumo energetico giornaliero di un’abitazione è una variabile casuale con media 13 kWh e varianza 9 kWh2 . Una centrale fornisce energia elettrica a un complesso di 2000 abitazioni. Nell’ipotesi che i consumi delle abitazioni siano indipendenti, quanto dovrebbe essere la disponibilità energetica della centrale per garantire che la probabilità di un blackout sia 0.1%? x−26000 [P (N (26000, 18000) > x) = P N (0, 1) > 134.16 = 0.001 → Φ( x−26000 ) = 0.999 → 134.16 x−26000 = 3.09 → x = 26415] 134.16 Esercizio 2. Supponiamo che la probabilità che un figlio sia femmina sia pari a 0.5. a) Dato un campione di 100 nascite, si stimi la probabilità che ci siano 55 o più femmine? [1 − Φ( 0.5·√5 100 ) = 1 − Φ(1) ≈ 15.866%; con correzione di continuità √ 1 − Φ( 0.5·4.5 ) = 1 − Φ(0.9) = 18.406%. (La probabilità esatta vale 18.410%.)] 100 b) Dato un campione di 100 nascite, si stimi la probabilità che ci siano 550 o più femmine? [1 − Φ( 0.5·√501000 ) = 1 − Φ(3.16) ≈ 0.0788%; con correzione di continuità √ 1 − Φ( 0.5·49.5 ) = 1 − Φ(3.13) = 0.0874%. (La probabilità esatta vale 0.0865%.)] 1000 c) Dato un campione di 100 nascite, si stimi la probabilità che ci siano 5500 o più femmine? [1 − Φ( 0.5·√500 ) = 1 − Φ(10) ≈ 0] 10000 Esercizio 3. Sia X1 , X2 , . . . una successione di variabili casuali i.i.d. con distribuzione Po(λ). Per quale valore di a ∈ R la statistica X 1 + X2 + . . . + X n − n · λ √ , a· n è, per n grande, approssimativamente Normale Standard? [a = √ λ] Esercizio 4. Il numero di vittime per incidenti stradali in un giorno in Italia può essere descritto con una variabile di Poisson di media 13. Assumendo che il numero di morti in giorni distinti siano indipendenti, qual è la probabilità che in un mese (30 giorni) muoiano meno di 360 persone? (Si usi l’approssimazione normale e la √ √ correzione di continuità) [P (Po(390) < 360) = P (Po(390) < 359.5) = P Po(390)−390 < 13 30 359.5−390 √ ) = Φ(−1.54) = 1 − Φ(1.54) ≈ 0.062. (La probabilità esatta vale 0.060.)] 13·30 1 2 Esercizio 5. Si sa che i chiodi prodotti da una certa ditta hanno lunghezza distribuita in modo Normale con media incognita µ e varianza nota σ 2 = 3 mm2 . Si misura un campione di 50 chiodi, ottenendo una media empirica pari a x = 26.35 mm. Si determinino gli intervalli di confidenza al 95% e al 99% per µ. [x ± zα/2 √σn → I.C. √ √ 3 3 → (25.87, 26.83), I.C. 99%: 26.35 ± z0.005 √50 → (25.72, 26.98)] 95%: 26.35 ± z0.025 √50 Esercitazione del 14 maggio 2010 Richiamo di teoria: intervallo di confidenza per la media di un campione normale con varianza ignota: x ± tn−1,α/2 √sxn . Uso delle tavole: calcolo dei percentili tα,n . Esercizio 6. Da una misurazione dei leucociti per mm3 presenti nel sangue di 18 individui di una determinata popolazione si ottiene una media campionaria pari a x = 8300 e una deviazione standard campionaria pari a 3000. Si determinino gli intervalli di confidenza al 95% e al 99% per il livello medio dei leucociti nella popolazione in √ esame. [x ± tn−1,α/2 √sn → C.I. 95%: 8300 ± 2.1098 3000 = 8300 ± 1492 → (6808, 9792); 18 √ C.I. 99%: 8300 ± 2.8982 3000 = 8300 ± 2049 = (6251, 10349).] 18 Nuove nozioni di teoria: intervallo di confidenza per una proporzione di una popolazione; ampiezza dell’intervallo di confidenza [Ross, §8.7, §8.7.1]. Esempio: “Studio di un caso” a pag. 342. Esercizio 7 (cf. Esempio 8.15 del libro di Ross). Per stimare la frazione p di studenti fumatori di una università, se ne intervistano 100, 82 dei quali si dichiarano non fumatori. √ 0.18(1−0.18) √ a) Si determini l’intervallo di confidenza al 99% per p. [0.18 ± 2.576 = 100 0.18 ± 0.10 → (0.8, 0.28) = (8%, 28%)] b) Quanti studenti occorre intervistare se si vuole che l’ampiezza dell’intervallo di confidenza al 99% sia meno del 2%? [n ≥ (z0.005 /0.02)2 = (2.576/0.02)2 = 16590] Esercizio 8 (Esercizio per casa). Un sondaggio su 100 famiglie italiane rivela che 31 tra loro passano il sabato sera davanti alla TV. a) Si determini l’intervallo di confidenza bilatero al 99% per la frazione p √di famiglie √ italiane che passano il sabato sera davanti alla TV. [0.31 ± 2.576 0.31·0.69 = 100 0.31 ± 0.12 → (0.19, 0.43)] b) Si determini quanto grande deve essere il campione perché l’ampiezza dell’in√ tervallo di confidenza al 99% per p sia minore di 0.04. [2 · z20.005 < 0.04 cioè n 2.576 2 n > ( ·0.04 ) = 4147.36 cioè n ≥ 4148] Esercizio 9. Un generatore di numeri casuali produce numeri che sono distribuiti √ “uniformemente nell’intervallo [0, 2]”. La variabile casuale X che corrisponde a uno 3 dei numeri prodotti è una variabile casuale continua la cui densità è data da ( √ c se 0 ≤ x ≤ 2 fX (x) = , 0 altrimenti dove c è un’opportuna costante. Si determini il √valore di c e si calcolino E(X) e √ R +∞ R 2 Var(X). [ −∞ f (x) dx = 1 → c = √12 ; E(X) = 0 x · √12 dx = 22 = √12 , E(X 2 ) = R √2 2 1 x √2 dx = 32 → Var(X) = E(X 2 ) − E(X)2 = 61 ] 0