Esercizio 1 Si supponga di aver assegnato ad una popolazione di N = 4 dattilografe un test e di aver ottenuto i seguenti risultati: Dattilografa A B C D N. Errori 3 2 1 4 La variabile X, il numero di errori commessi da ciascuna dattilografa, ha μ X = 2,5 e σ X2 = 1, 25 . Determinare l’universo campionario rispettivamente per n = 2, n = 3 e n = 4 immaginando di procedere con un campionamento casuale semplice (con reintroduzione). Inoltre, per i differenti valori di n determinare: 1) la distribuzione della variabile casuale media campionaria, calcolandone il valore atteso e la varianza; 2) la distribuzione della variabile casuale varianza campionaria, calcolandone il valore atteso. Svolgimento Trattandosi di campionamento con reintroduzione, l’universo campionario è pari a Nn. Per n = 2, quindi, i possibili campioni sono 42 = 16, e cioè: Campione 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Dattilografe A,A A,B A,C A,D B,A B,B B,C B,D C,A C,B C,C C,D D,A D,B D,C D,D Risultati del campione 3,3 3,2 3,1 3,4 2,3 2,2 2,1 2,4 1,3 1,2 1,1 1,4 4,3 4,2 4,1 4,4 Media Campionaria 3,0 2,5 2,0 3,5 2,5 2,0 1,5 3,0 2,0 1,5 1,0 2,5 3,5 3,0 2,5 4,0 Supponendo che ogni dattilografa ha la medesima probabilità di essere estratta nel campione e ciò che interessa è la media campionaria, cioè il numero medio di errori commessi da ogni campione, la funzione di probabilità è la seguente: P(xi) Xi 0,0625 0,125 0,1875 0,25 0,1875 0,125 0,0625 1 1,5 2 2,5 3 3,5 4 Come si può facilmente calcolare, E ( X ) = 2,5 e Var (X) = 0,625. 0,3 0,25 p 0,2 0,15 0,1 0,05 0 1 1,5 2 2,5 3 media campionaria ad ogni estrazione 3,5 4 Per determinare la distribuzione della variabile casuale varianza campionaria bisogna calcolare la 2 1 n statistica varianza campionaria S 2 = ∑ ( xi − X ) ad ogni estrazione: n i =1 Campione 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Risultati del campione 3,3 3,2 3,1 3,4 2,3 2,2 2,1 2,4 1,3 1,2 1,1 1,4 4,3 4,2 4,1 4,4 Dattilografe A,A A,B A,C A,D B,A B,B B,C B,D C,A C,B C,C C,D D,A D,B D,C D,D Media Campionaria 3,0 2,5 2,0 3,5 2,5 2,0 1,5 3,0 2,0 1,5 1,0 2,5 3,5 3,0 2,5 4,0 Varianza Campionaria 0,00 0,25 1,00 0,25 0,25 0,00 0,25 1,00 1,00 0,25 0,00 2,25 0,25 1,00 2,25 0,00 la funzione di probabilità è la seguente: P(xi) 0,25 0,375 0,25 0,125 0 0,25 1 2,25 Var(Xi) Come si può facilmente calcolare, E(Var(Xi)) = 0,625 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 0 0,25 1 Varianza campionaria ad ogni estrazione *** 2,25 Si ripete l’esercizio per n = 3, dove l’universo campionario è pari a 43 = 64, e cioè: Campione Dattilografe 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 A,A,A A,A,B A,A,C A,A,D A,B,A A,B,B A,B,C A,B,D A,C,A A,C,B A,C,C A,C,D A,D,A A.D.B A,D,C A,D,D B,A,A B,A,B B,A,C B,A,D B,B,A B,B,B B,B,C B,B,D B,C,A B,C,B B,C,C B,C,D B,D,A B,D,B B,D,C B,D,D Risultati del campione 3,3,3 3,3,2 3,3,1 3,3,4 3,2,3 3,2,2 3,2,1 3,2,4 3,1,3 3,1,2 3,1,1 3,1,4 3,4,3 3,4,2 3,4,1 3,4,4 2,3,3 2,3,2 2,3,1 2,3,4 2,2,3 2,2,2 2,2,1 2,2,4 2,1,3 2,1,2 2,1,1 2,1,4 2,4,3 2,4,2 2,4,1 2,4,4 Media Campionaria 3,000 2,667 2,333 3,333 2,667 2,333 2,000 3,000 2,333 2,000 1,667 2,667 3,333 3,000 2,667 3,667 2,667 2,333 2,000 3,000 2,333 2,000 1,667 2,667 2,000 1,667 1,333 2,333 3,000 2,667 2,333 3,333 Campione Dattilografe 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 C,A,A C,A,B C,A,C C,A,D C,B,A C,B,B C,B,C C,B,D C,C,A C,C,B C,C,C C,C,D C.D.A C.D.B C,D,C C,D,D D,A,A D,A,B D,A,C D,A,D D,B,A D,B,B D,B,C D,B,D D,C,A D,C,B D,C,C D,C,D D,D,A D,D,B D,D,C D,D,D Risultati del campione 1,3,3 1,3,2 1,3,1 1,3,4 1,2,3 1,2,2 1,2,1 1,2,4 1,1,3 1,1,2 1,1,1 1,1,4 1,4,3 1,4,2 1,4,1 1,4,4 4,3,3 4,3,2 4,3,1 4,3,4 4,2,3 4,2,2 4,2,1 4,2,4 4,1,3 4,1,2 4,1,1 4,1,4 4,4,3 4,4,2 4,4,1 4,4,4 Media Campionaria 2,333 2,000 1,667 2,667 2,000 1,667 1,333 2,333 1,667 1,333 1,000 2,000 2,667 2,333 2,000 3,000 3,333 3,000 2,667 3,667 3,000 2,667 2,333 3,333 2,667 2,333 2,000 3,000 3,667 3,333 3,000 4,000 Supponendo che ogni dattilografa ha la medesima probabilità di essere estratta nel campione e ciò che interessa è la media campionaria, cioè il numero medio di errori commessi da ogni campione, la funzione di probabilità è la seguente: P(xi) 0,015625 0,046875 Xi 1 1,333 0,09375 0,15625 0,1875 0,1875 1,667 2 2,333 2,667 Come si può facilmente calcolare, E ( X ) = 2,5 e 0,15625 0,09375 0,046875 0,015625 3 Var (X) = 0,416667. 3,333 3,667 4 P 0,2 0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 1 1,333 1,667 2 2,333 2,676 3 3,333 media campionaria per ogni campione 3,667 4 Per determinare la distribuzione della variabile casuale varianza campionaria bisogna calcolare la 2 1 n statistica varianza campionaria S 2 = ∑ ( xi − X ) ad ogni estrazione: n i =1 Camp. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 Datt. A,A,A A,A,B A,A,C A,A,D A,B,A A,B,B A,B,C A,B,D A,C,A A,C,B A,C,C A,C,D A,D,A A.D.B A,D,C A,D,D B,A,A B,A,B B,A,C B,A,D B,B,A B,B,B B,B,C B,B,D B,C,A B,C,B B,C,C B,C,D B,D,A B,D,B B,D,C B,D,D Ris 3,3,3 3,3,2 3,3,1 3,3,4 3,2,3 3,2,2 3,2,1 3,2,4 3,1,3 3,1,2 3,1,1 3,1,4 3,4,3 3,4,2 3,4,1 3,4,4 2,3,3 2,3,2 2,3,1 2,3,4 2,2,3 2,2,2 2,2,1 2,2,4 2,1,3 2,1,2 2,1,1 2,1,4 2,4,3 2,4,2 2,4,1 2,4,4 Var(X) X 3,000 2,667 2,333 3,333 2,667 2,333 2,000 3,000 2,333 2,000 1,667 2,667 3,333 3,000 2,667 3,667 2,667 2,333 2,000 3,000 2,333 2,000 1,667 2,667 2,000 1,667 1,333 2,333 3,000 2,667 2,333 3,333 0,000 0,222 0,889 0,222 0,222 0,222 0,667 0,667 0,889 0,667 0,889 1,556 0,222 0,667 1,556 0,222 0,222 0,222 0,667 0,667 0,222 0,000 0,222 0,889 0,667 0,222 0,222 1,556 0,667 0,889 1,556 0,889 Camp. 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 Datt. C,A,A C,A,B C,A,C C,A,D C,B,A C,B,B C,B,C C,B,D C,C,A C,C,B C,C,C C,C,D C.D.A C.D.B C,D,C C,D,D D,A,A D,A,B D,A,C D,A,D D,B,A D,B,B D,B,C D,B,D D,C,A D,C,B D,C,C D,C,D D,D,A D,D,B D,D,C D,D,D Ris 1,3,3 1,3,2 1,3,1 1,3,4 1,2,3 1,2,2 1,2,1 1,2,4 1,1,3 1,1,2 1,1,1 1,1,4 1,4,3 1,4,2 1,4,1 1,4,4 4,3,3 4,3,2 4,3,1 4,3,4 4,2,3 4,2,2 4,2,1 4,2,4 4,1,3 4,1,2 4,1,1 4,1,4 4,4,3 4,4,2 4,4,1 4,4,4 Var(X) X 2,333 2,000 1,667 2,667 2,000 1,667 1,333 2,333 1,667 1,333 1,000 2,000 2,667 2,333 2,000 3,000 3,333 3,000 2,667 3,667 3,000 2,667 2,333 3,333 2,667 2,333 2,000 3,000 3,667 3,333 3,000 4,000 la funzione di probabilità è la seguente: P(xi) Var(Xi) 0,0625 0,28125 0,1875 0,1875 0,09375 0 0,222222 0,666667 0,888889 1,555556 2 Come si può facilmente calcolare, E(Var(Xi)) = 0,8333 0,1875 0,889 0,667 0,889 1,556 0,667 0,222 0,222 1,556 0,889 0,222 0,000 2,000 1,556 1,556 2,000 2,000 0,222 0,667 1,556 0,222 0,667 0,889 1,556 0,889 1,556 1,556 2,000 2,000 0,222 0,889 2,000 0,000 0,3 0,25 0,2 0,15 0,1 0,05 0 0,0625 0,28125 0,1875 0,1875 0,1875 0,09375 Varianza campionaria ad ogni estrazione *** Infine, per n = 4 l’universo campionario è pari a 44 = 256. La tabella di tutti i possibili campioni sarebbe troppo grande da raffigurare, così come il calcolo della media campionaria e della varianza campionaria. Però, come è noto e come è stato possibile verificare empiricamente nei precedenti passaggi, sappiamo che E ( X ) = μ X e che Var ( X ) = σ X2 n . Infatti: 1 ⎛1 n ⎞ ⎛1 ⎞ 1 E ( X ) = E ⎜ ∑ X i ⎟ = E ⎜ S n ⎟ = E ( S n ) = nμ = μ n ⎝n ⎠ n ⎝ n i =1 ⎠ 1 σ2 ⎛1 ⎞ 1 Var ( X ) = Var ⎜ S n ⎟ = 2 Var ( S n ) = 2 nσ 2 = n n ⎝n ⎠ n Quindi, per n = 4, E ( X ) = 2,5 Var ( X ) = 1, 25 = 0,3125 4 ALL’AUMENTARE DELLA NUMEROSITA’ CAMPIONARIA LA DISPERSIONE INTORNO AL VALORE ATTESO DIMINUISCE Per quanto riguarda la V.C. varianza campionaria, si è potuto constatare che il suo valore atteso è diverso dal parametro (in questo caso supposto) incognito della popolazione, in altri termini è uno stimatore non corretto (o distorto). Tuttavia il fattore di correzione è noto, ed è pari a n . n −1 Infatti, ( ) 2 1 E S 2 = ∑ E ( X i − X ) , aggiungendo e sottraendo la costante μ si ottiene: n i 2 2⎤ 1 1 ⎡ 2 E S 2 = E ∑ ⎡⎣( X i − μ ) − ( X − μ ) ⎤⎦ = E ⎢ ∑ ( X i − μ ) − n ( X − μ ) ⎥ = n i n ⎣ i ⎦ ( ) = 1⎛ 2 σ2 ⎞ σ2 ⎛ n −1 ⎞ 2 =σ2 ⎜ ⎜ nσ − n ⎟ =σ − ⎟ n⎝ n ⎠ n ⎝ n ⎠ Quindi: 2 per n=2 si ha S 2 = 0, 625 da cui σ 2 = 0, 625 = 1, 25 ; 1 3 per n=3 si ha S 2 = 0,8333 da cui σ 2 = 0,8333 = 1, 25 ; 2 n −1 3 = 1, 25 = 0,9375 per n=4 si ha S 2 = σ 2 n 4