Laboratorio di Didattica di elaborazione dati – 4A DISTRIBUZIONI CAMPIONARIE 1. Lanciamo un dado non truccato. Qual è la media della popolazione dei sei valori possibili (o, equivalentemente la speranza matematica di un risultato di un lancio singolo)? La deviazione standard? 2. Genera un campione casuale dell'ampiezza 10, mettendo i valori nelle colonne seguenti, nella stessa riga. È possibile simulare un lancio di un dado usando CASUALE.TRA(1,6) (richiede l'Analysis Toolpak – un componente aggiuntivo, cerca nel menu come si aggiunge) o usando INT(CASUALE()*6+1)(non richiede l'Analysis Toolpak). 3. Nella colonna seguente calcola la media del campione. Una riga rappresenta un campione casuale dell'ampiezza 10 (e la sua media). Coppia la riga ed incollala 40 volte, nelle righe seguenti. Abbiamo 40 campioni dell'ampiezza 10. È normale che i valori cambino quando si aggiorna il foglio. Calcola la media e la deviazione standard delle medie dei campioni. Ci aspettiamo che la media della distribuzione campionaria delle medie (calcolata appena) sia prossima alla media della popolazione. Verifica che sia vero. La deviazione standard della distribuzione campionaria delle medie dovrebbe essere prossima alla deviazione standard della popolazione fratto 10 . Verifica che sia vero. È importante rendersi conto perchè nell'esercizio riguardante i condensatori queste relazioni sono state esattamente soddisfatte e qua i rispettivi valori sono solo quasi ugualisoluzione. Verifica che la concordanza sia migliore quando il numero dei campioni cresce (usa, per esempio, 4000 invece di 40). DISTRIBUZIONI CAMPIONARIE E LA DISTRIBUZIONE NORMALE Negli esercizi seguenti usiamo il fatto che “se la popolazione dalla quale viene estratto il campione ha una distribuzione qualsiasi con media μ e deviazione standard σ, la media campionaria X , per campioni sufficientemente grandi, ha distribuzione normale con media e deviazione standard x x dove = e = “. x x n Allora, non solo sappiamo a quali valori tendono x e x , ma anche sappiamo la forma della curva della distribuzione campionaria (per campioni sufficientemente grandi), soluzione: Nel primo caso abbiamo avuto tutti i campioni (tutte le coppie di capacità possibili). Qua abbiamo solo 40 dei 610=60466176 campioni possibili. Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic 4. Una fabbrica produce perni di 6 mm di diametro, con una deviazione standard di 0.1 mm. In una partita ci sono 50 perni. Qual è la probabilità che il diametro medio dei perni in questa partita sia a. superiore a 6.01 mm? b. inferiore a 5.98 mm? c. fra 5.999 e 6.001 mm? d. superiore a 6.05 mm? La distribuzione campionaria delle medie. Abbiamo qua un campione casuale dell'ampiezza 50. È facile calcolare la media della distribuzione campionaria delle medie ( ). La deviazione standard della distribuzione campionaria delle medie x ( x ) non è difficile neanche, usa la formula della pagina precedente. Poi usiamo il fatto che i valori reali della media del campione seguono la distribuzione normale N( x , x ). Vogliamo calcolare l'area sotto la curva di Gauss (a) a destra di x =6.01, (b) a sinistra di x =5.98, (c) compresa tra x =5.999 e x =6.001, (d) a destra di x =6.05. Ricordi come si fa? Prima dobbiamo passare alla distribuzione normale N(0, 1), cioè una con la media uguale a 0 e la deviazione standard di 1. Per questo motivo passiamo dalla variabile x x−x . Calcola i valori x di z che corrispondono a x =6.01 e x =5.98. a una nuova variabile z: z = La distribuzione della variabile z. Avendo questi valori tipicamente si legge le rispettive probabilità dalle tabelle matematiche. Le tabelle non le abbiamo, ma possiamo usare la funzione ERF(z)1, la quale valuta la funzione di errore. Usando ERF(z/ 2 ) possiamo calcolare l'area sotto la curva della distribuzione N(0, 1) compresa fra [-z, z]. Il valore z deve essere positivo. Traccia il grafico della curva di Gauss e rifletti come puoi calcolare l'area sotto la coda usando la funzione ERF(). Io ho ottenuto: a) 23.9%; b) 7.86%; c) 5.64%; d) 0.02%. 5. Una ditta farmaceutica produce un farmaco con una concentrazione desiderata di un principio attivo del 4%. La ditta applica il seguente criterio per decidere se una partita di bottiglie è ammissibile alla vendita. Un campione di 40 bottiglie del farmaco viene selezionato e si misura in laboratorio la concentrazione del principio attivo. Se la media delle misure è compresa fra 3.95% e 4.05%, tutta la partita è detta ammissibile alla vendita. Qual è la probabilità di accettare una partita avente a. la media di concentrazione uguale al 3.9% con la deviazione standard del 0.1%, b. la media di concentrazione uguale al 4% con la deviazione standard del 0.5%, 1 È anche possibile utilizzare la funzione DISTRIB.NORM() mettendo VERO l'ultimo argomento, se vuoi consulta la documentazione di Excel. Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic c. la media di concentrazione uguale a 4.8% con la deviazione standard del 1%. Cominciamo con il calcolo della media campionaria delle medie ( x ) e la sua deviazione standard ( x ), per ciascuno dei casi: a, b, c. Ricorda che la deviazione standard della popolazione (la partita delle bottigle) – – (per esempio 0.1 nel caso a)) è una cosa diversa dalla deviazione standard della distribuzione campionaria delle medie ( ), la quale è 40 volte inferiore! Poi nota che vogliamo x calcolare la probabilità che la media di un campione sia compresa fra 3.95 e 4.05, per diversi x e . Ricorda che quando passiamo alla distribuzione N(0, 1), dalla variabile x a una nuova x x−x , la transformazione cambia, perché x e x cambiano a seconda del caso a, x b, c. Finalmente calcoliamo la probabilità usando la funzione ERF(), sapendo che la distribuzione N(0, 1) è simmetrica. variabile z: z = 6. Una famiglia tipica che abita in una piccola città consuma 65 litri di benzina al mese, con la deviazione standard di 15 litri. Qual è la probabilità che il consumo medio di un campione casuale di 50 famiglie superi 70 litri al mese? 7. Una ditta di profumi confeziona sacchetti, contenenti fiori di lavanda, in modo automatico; il peso medio dei sacchetti è tarato su 25 grammi con una deviazione standard del 5%. I sacchetti sono confezionati in scatole contenenti 100 unità. Calcolare la probabilità che i sacchetti di una confezione da 100 unità abbiano un peso medio: a. superiore a 25.2 grammi, b. inferiore a 25.1 grammi, c. tra 24.8 e 25.1 grammi. Io ho ottenuto: a) 5.48%; b) 78.81%; c) 73.33%. Laboratorio di Didattica di elaborazione dati 2008-2009, Jacek Dziedzic