OD DISTRIBUZIONI DI CAMPIONAMENTO 12 OD DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d’Italia, si vuole calcolare l’età (in anni compiuti) al momento del conseguimento della laurea. Lavorare sull’intera popolazione è oneroso. ↓ Si decide di operare su un campione, costituito da 30 laureati di cui si calcola l’età media. x = 26, 5 anni ↓ Se estraessimo un altro campione (di uguale numerosità: n=30) e calcolassimo l’età media, certamente troveremmo un valore diverso. ↓ Se estraessimo 100 campioni (sempre con n=30) e calcolassimo l’età media, essa varierà da campione a campione. 13 OD LA VARIABILITÀ CAMPIONARIA Campione 1 2 3 4 … n Media (anni) 26.5 27 25.8 25.75 29 28.1 DIVERSI CAMPIONI → DIVERSE MEDIE Questa differenza nella media (e in qualsiasi altra statistica) tra un campione e l’altro è nota come VARIABILITÀ CAMPIONARIA. È conseguenza del campionamento casuale. 14 OD MEDIA CAMPIONARIA Riassumendo Da una popolazione si possono estrarre più campioni. Su ciascun campione si può calcolare la statistica di interesse. Se la statistica di interesse è la media, si parlerà di media campionaria. La media campionaria è una variabile, perché può assumere valori diversi che dipendono dal campione estratto. Della media campionaria è possibile costruire una distribuzione di frequenza, in cui compaiono tutti i possibili valori ottenuti da campioni diversi, tutti di uguale dimensione: la distribuzione di frequenza così ottenuta è detta distribuzione di campionamento della media. 15 OD DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA È la distribuzione di tutti i possibili valori assunti dalla media, calcolati su tutti i possibili campioni della stessa dimensione estratti da una data popolazione. x1 µ xn Quali caratteristiche avrà la distribuzione di campionamento di queste medie? 16 OD CARATTERISTICHE DELLA DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Se da una qualsiasi popolazione con media µ e deviazione standard σ si estraggono tutti i possibili campioni di dimensione n, la distribuzione delle medie campionarie ha le seguenti caratteristiche: 1. ha media uguale alla media della popolazione: µx = µ 2. ha varianza uguale alla varianza della popolazione divisa per la dimensione del campione: σx = 2 σ2 n 3. è distribuita normalmente se il campionamento è fatto da popolazione normale oppure se il campionamento è fatto da popolazione di qualsiasi forma funzionale, purché la numerosità campionaria n sia ≥ 30 (Teorema del Limite Centrale). 17 OD ERRORE STANDARD • La radice quadrata della varianza della media campionaria è detta errore standard. σx = σ2 n • L’errore standard è una misura della variabilità della media campionaria. • Tanto minore è la variabilità, tanto minore sarà l’errore standard e tanto più attendibile la statistica. 18 OD LE DISTRIBUZIONI DI CAMPIONAMENTO: APPLICAZIONI La conoscenza delle distribuzioni di campionamento 1. consente di calcolare la probabilità di ottenere un campione con una certa media, o con altre determinate statistiche; 2. fornisce la base teorica dell’inferenza statistica. 19 OD 1. PROBABILITÀ DI UN CAMPIONE CON DATE STATISTICHE Esempio (Daniel pag.119 5.3.2) Supponiamo che sia noto che, in una certa popolazione umana, la lunghezza del cranio sia distribuita come una normale con una media di 185.6 mm ed una deviazione standard di12.7 mm. Qual è la probabilità che un campione casuale semplice di dimensione 10, estratto da questa popolazione, abbia una media maggiore di 190? Soluzione P( x >190 mm)=? n=10 Assunzioni La distribuzione di campionamento delle medie è distribuita in modo normale. Media Popolazione Distribuzione di campionamento delle medie µ=185.6 mm µx = 185.6mm Deviazione σ=12.7 mm standard σ x = 12 . 7 10 = 4 . 0161 mm 20 OD Standardizziamo la variabile d’interesse applicando la formula seguente: z= x − µx σ = n x 190 − 185.6 = 1.10 12.7 10 La probabilità richiesta è rappresentata dall’area sotto la curva della distribuzione di campionamento a destra di z = 1.10 f (x) Pr(x>190) =1 –Pr(x<190) = ? x 0 185.6 190 Lunghezza del cranio (mm) z 0 1,10 P(x>190) =1-P(x<190)=1–P(z<1,10)= =1–0,8643=0,1357=13.57% 21 OD DISTRIBUZIONE DI CAMPIONAMENTO DI UNA PROPORZIONE: CARATTERISTICHE 1. La media della distribuzione delle proporzioni campionarie è uguale al valore vero della proporzione nella popolazione: µ p) = p 2.La varianza della distribuzione è data da: σ )2 p p (1 − p ) = n 3.La distribuzione è distribuita normalmente, se la dimensione campionaria è grande; più precisamente se: np e n(1-p) sono > 5. 22 OD Esempio (Daniel pag.127 5.5.1) Supponiamo di sapere che in una certa popolazione umana la proporzione di daltonici sia 0.08. Se, in generale, indichiamo con p una proporzione nella popolazione, nel nostro esempio sarà p = 0.08 Se scegliamo casualmente 150 individui da questa popolazione, qual è la probabilità che la proporzione di daltonici nel campione sia uguale a 0.15? Soluzione P(p=0.15)=? n=150 • La distribuzione di campionamento delle proporzioni è distribuita in modo normale perché np e n(1-p) sono entrambi maggiori di 5. np = 150 • 0.08= 12 n(1-p) =150 • 0.92 = 138 • La media della distribuzione è uguale alla proporzione nella popolazione: µ p) = p = 0 .08 • La varianza della distribuzione è calcolabile con la formula seguente: σ )2 p p (1 − p ) 0 .08 ⋅ (1 − 0 .08 ) = = = 0 .00049 n 150 23 OD La probabilità richiesta P(p≥0.15) è l’area sotto la curva di p̂ a destra di 0.15. Standardizziamo: (z = differenza tra statistica di interesse e media / errore standard) z= pˆ − p 0.15 − 0.08 0.07 = = = 3.15 p (1 − p ) 0.00049 0.0222 n dalle tavole risulta che l’area a destra di z = 3.15 è 1-0.9992 = 0.0008. Conclusione La probabilità che pˆ ≥ 0.15 è 0.0008 = 0.08%. N.B. p̂ p proporzione nel campione proporzione nella popolazione 24 OD DISTRIBUZIONE DI CAMPIONAMENTO DELLA DIFFERENZA TRA DUE MEDIE: CARATTERISTICHE Teoria Daniel pagg.122-126 DISTRIBUZIONE DI CAMPIONAMENTO DELLA DIFFERENZA TRA DUE PROPORZIONI: CARATTERISTICHE Teoria Daniel pagg.130-132 25