Introduzione Statistiche campionarie Distribuzioni campionarie Antonello Maruotti . A. Maruotti . . . . . Outline 1 Introduzione 2 Statistiche campionarie . . . . . . Introduzione Statistiche campionarie Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento a particolari caratteristiche di interesse. La popolazione viene esaminata in modo parziale, considerando un campione di unità statistiche, cioè un aggregato di unità, appartenenti alla popolazione di riferimento, selezionate mediante lesperimento di campionamento. La statistica inferenziale fornisce strumenti e metodi per ricavare dai dati campionari informazioni sulla popolazione. L’inferenza statistica studia l’analisi dei dati che costituiscono un campione casuale, cioè selezionato mediante un esperimento casuale (aleatorio). . A. Maruotti . . . . . Introduzione Statistiche campionarie Il campione Se l’obiettivo è quello di ottenere informazioni sulla popolazione utilizzando un suo sottoinsieme, il campione, allora si pone il problema di come estrarre le unità statistiche che entrano a far parte del campione medesimo. Il campione deve essere rappresentativo. La dimensione campionaria viene indicata con n. Regola di selezione di tipo probabilistico ⇒ campione casuale semplice. . A. Maruotti . . . . . Introduzione Statistiche campionarie Il campionamento casuale semplice E’ necessario disporre di una lista di campionamento che contiene tutte le unità statistiche della popolazione. Alle unità della lista viene associato un numero (etichetta). Dall’insieme dei numeri che identificano le unità statistiche ne vengono estratti casualmente n. . A. Maruotti . . . . . Introduzione Statistiche campionarie Il campione casuale semplice Le n unità sono estratte in modo tale che: ogni unità della popolazione ha la stessa probabilità di essere estratta le n estrazioni sono effettuate ognuna indipendentemente dall’altra Esistono ovviamente altri metodi di campionamento. E’ semplice dimostrare che l’operazione di estrazione di un campione casuale semplice dalla popolazione X dà luogo ad una n-pla (X1 , X2 , . . . , Xn ) a componenti indipendenti ed identicamente distribuite a X . . A. Maruotti . . . . . Introduzione Statistiche campionarie Esempio Consideriamo una popolazione di 4 individui di età: 18,20,22,24. Quali sono i possibilie campioni di numerosità 2? . A. Maruotti . . . . . Introduzione Statistiche campionarie Statistiche campionarie Una volta estratto il campione, calcoliamo su questo una o più statistiche (media campionaria, somma campionaria, varianza campionaria, etc.) utili per fare inferenza. Osservazioni Le statistiche assumono valori diversi su campioni diversi La probabilità che una statistica assuma un determinato valore dipende dalla probabilità di avere un campione con determinate caratteristiche Ogni statistica è una variabile aleatoria. La loro distribuzione è detta campionaria in quanto è generata considerando l’universo di tutti i possibili campioni . A. Maruotti . . . . . Introduzione Statistiche campionarie Media campionaria Riprendiamo l’esempio precedente della popolazione {18, 20, 22, 24}. Osserviamo che µ = 21 e σ 2 = 5. Calcoliamo ora la distribuzione campionaria della media per n uguale a 1 e 2. . A. Maruotti . . . . . Introduzione Statistiche campionarie Media campionaria . A. Maruotti . . . . . Introduzione Statistiche campionarie Media campionaria: valore atteso e varianza Si dimostra che in generale la media e la varianza della media campionaria sono legate ai corrispondenti valori della popolazione nel modo seguente E (X̄ ) = µ V (X̄ ) = σ2 n . A. Maruotti . . . . . Introduzione Statistiche campionarie Campionamento da popolazione normale Se la distribuzione della popolazione è di tipo normale allore è possibile dimostrare che anche la media campionaria ha una distribuzione di tipo normale. . A. Maruotti . . . . . Introduzione Statistiche campionarie Teorema del limite centrale Per numerosità sufficientemente elevate la distribuzione della media campionaria è ben approssimata da una normale. . A. Maruotti . . . . . Introduzione Statistiche campionarie Distribuzione campionaria La variabile X assume due soli valori, 1 e 0, con frequenza relativa, rispettivamente, p e 1 − p. E’ semplice verificare che in questo modo per la popolazione risulta µ = p, σ 2 = p(1 − p) mentre per il campione abbiamo p̂ = x̄ La particolare codifica adottata ci permette di calcolare la proporzione campionaria come la media del campione e quindi di sfruttare le proprietà che conosciamo della media campionaria. . A. Maruotti . . . . . Introduzione Statistiche campionarie Distribuzione campionaria: proprietà La media della proporzione campionaria è uguale alla proporzione nella popolazione µp̂ = µx̄ = µ = p La deviazione standard è √ σ σp̂ = σx̄ = √ = n p(1 − p) n La forma della distribuzione: per il teorema del limite centrale sappiamo che per n sufficientemente grande possiamo assumere p(1 − p) p̂ ∼ N(p, ) p . A. Maruotti . . . . .