Statistica Inferenziale Prof. Raffaella Folgieri Email: [email protected] aa 2009/2010 Prof.R.Folgieri,aa 2009-10-email [email protected] Riepilogo lezione 5 Abbiamo visto: z Modelli probabilistici nel continuo z Distribuzione uniforme continua z Distribuzione esponenziale z Distribuzione normale z Distribuzione normale standardizzata z Distribuzione T-Student z Distribuzione Chi-quadrato 1 Prof.R.Folgieri,aa 2009-10-email [email protected] Popolazione z Popolazione: totalità dei casi (unità statistiche) sede del fenomeno oggetto di studio. z Rilevazione censuaria e campionaria: data una popolazione finita un campione casuale di ampiezza n si ottiene estraendo a sorte con reimmissione n unità della popolazione z Popolazione finita e infinita (astrazione utile a fini didattici) F(x) = modello descrittivo della popolazione Prof.R.Folgieri,aa 2009-10-email [email protected] Campione z Campione casuale di ampiezza n: variabile aleatoria multipla (X1, X2, …, Xn) le componenti sono indipendenti e identicamente distribuite con distribuzione f(x), dove f(x) denota il modello descrittivo della popolazione. Indichiamo con (x1,x2,…,xn) il campione effettivamente osservato: un punto nello spazio euclideo ad n dimensioni 2 Prof.R.Folgieri,aa 2009-10-email [email protected] Spazio campionario (Ω) z Spazio campionario (Ω): insieme di tutti i possibili campioni estraibili dalla popolazione. z Spazio campionario discreto o continuo a seconda se X è discreta o continua. Prof.R.Folgieri,aa 2009-10-email [email protected] Distribuzione del campione z Distribuzione del campione: f(x1,x2,…,xn) = f(x1)f(x2)…f(xn) Questa è una funzione di probabilità (caso discreto) o di densità (caso continuo) a seconda della natura di f(x) (o, equivalentemente, di X) z INDIPENDENZA delle osservazioni campionarie 3 Esempio Prof.R.Folgieri,aa 2009-10-email [email protected] …continua alla slide successiva z Siamo interessati a studiare la composizione delle famiglie di una certa collettività. Per semplicità, immaginiamo che vi siano solo 8 famiglie, che etichettiamo con 1, 2, … 8 e che il numero di componenti per ciascuna di esse sia dato da z Il numero di componenti nella popolazione è descritto da z Esempio Prof.R.Folgieri,aa 2009-10-email [email protected] …continua alla slide successiva Il numero medio di componenti nella popolazione è E(X) = 3.625 e la varianza nella popolazione è V(X) = 0.734. z z Supponiamo ora di estrarre un campione casuale (cioè con reimmissione) di ampiezza 2 dalla popolazione descritta. z Lo spazio dei possibili dati campionari, ossia di tutte le coppie di valori del carattere “numero di componenti” che potremmo rilevare (spazio campionario) è rappresentato nella tabella (slide successiva), dove indichiamo in ogni casella sia le possibili coppie di famiglie che potremmo estrarre, sia (in grassetto) il corrispondente numero di componenti. 4 Esempio Prof.R.Folgieri,aa 2009-10-email [email protected] …continua alla slide successiva z Tabella Esempio Prof.R.Folgieri,aa 2009-10-email [email protected] …continua alla slide successiva z La distribuzione congiunta del campione (X1, X2) può essere ottenuta facilmente dalla tabella precedente, ed è descritta nella seguente tabella a doppia entrata, in cui, in ciascuna casella riportamo anche, in grassetto, il corrispondente valore della media campionaria: 5 Esempio Prof.R.Folgieri,aa 2009-10-email [email protected] …continua alla slide successiva z Notiamo che X1 e X2 sono indipendenti e identicamente distribuiti con la stessa distribuzione della popolazione X. z La definizione della media campionaria si ottiene dalla tabella precedente, e risulta: Prof.R.Folgieri,aa 2009-10-email [email protected] Esempio 6 Prof.R.Folgieri,aa 2009-10-email [email protected] Inferenza statistica z z z Parametro = ω = costante caratteristica della popolazione. Nell’esempio precedente il parametro di interesse è il numero di componenti della famiglia. Parametri scalari e vettoriali. Per esempio: – – z z Popolazione Bernoulliana: il parametro è p (scalare) Popolazione Normale: il parametro è ω = (μ,σ2) (vettoriale) Spazio dei parametri = Ω = insieme di tutti i valori plausibili per il parametro. Per esempio: Popolazione Normale: Ω = (ℜ,ℜ+) Inferenza statistica: risalire dai dati di un campione alle caratteristiche rilevanti della popolazione, o meglio di un parametro della popolazione (assunto un modello teorico per la popolazione stessa Prof.R.Folgieri,aa 2009-10-email [email protected] Inferenza statistica: concetti z Stima dei parametri (puntiale o per intervallo): sulla base del campione assegno al parametro di interesse un valore o un insieme di valori z Verifica delle ipotesi: faccio una congettura sul parametro e verifico, sulla base del campione, se essa è accettabile (non vera!) 7 Prof.R.Folgieri,aa 2009-10-email [email protected] Diversi approcci all’inferenza z Classico (Fisher, Neyman, Pearson): concezione frequentista della probabilità; fa uso unicamente delle informazioni contenute nel campione. z Bayesiano (Lindley, Savage, de Finetti): concezione soggettivista della probabilità; fa uso anche di informazioni a priori sui parametri espresse tramite distribuzioi di probabilità. z Teoria delle decisioni (Wald): tiene contro delle conseguenze di decisioni alternative espresse tramite funzioni di perdita; può fare uso anche di informazioni a priori. Prof.R.Folgieri,aa 2009-10-email [email protected] Statistiche campionarie z Statistica campionaria: una qualsiasi funzione g(X1, X2, … , Xn) del campione. z Poiché il campione è casuale, la statistica campionaria è una variabile casuale. 8 Prof.R.Folgieri,aa 2009-10-email [email protected] Prof.R.Folgieri,aa 2009-10-email [email protected] Statistiche campionarie più comuni …continua alla slide successiva Statistiche campionarie più comuni 9 Prof.R.Folgieri,aa 2009-10-email [email protected] Distribuzioni campionarie z Per una statistica campionaria Y= g(X1,X2, …, Xn) Si ha dove Distribuzione della media campionaria Prof.R.Folgieri,aa 2009-10-email [email protected] …continua alla slide successiva z In generale, indipendentemente dalla distribuzione della popolazione, se la media della popolazione è μ e la varianza della popolazione è σ2 abbiamo che: 10 Prof.R.Folgieri,aa 2009-10-email [email protected] Distribuzione della media campionaria z Nota: la varianza della distribuzione della media campionaria è tanto minore quanto maggiore è la dimensione del campione. Inoltre la varianza è tanto maggiore quanto maggiore è la varianza della popolazione (nel caso limite in cui la popolazione ha varianza nulla, anche la varianza della media campionaria è nulla). Prof.R.Folgieri,aa 2009-10-email [email protected] Popolazione Bernoulliana 11 Popolazione Normale Prof.R.Folgieri,aa 2009-10-email [email protected] …continua alla slide successiva Prof.R.Folgieri,aa 2009-10-email [email protected] Popolazione Normale z In altre parole la media campionaria, opportunamente standardizzata, si distribuisce asintoticamente come una Normale con media zero e varianza uno. Questo è il teorema del limite centrale che enunciato in altri termini dice che la media campionaria si distribuisce, asintoticamente (al crecere del campione), come una normale con media uguale alla media della popolazione e varianza pari alla varianza della popolazione divisa per m (ampiezza campionaria): 12 Prof.R.Folgieri,aa 2009-10-email [email protected] Nota bene Prof.R.Folgieri,aa 2009-10-email [email protected] Distribuzione della varianza campionaria z In generale, indipendentemente dalla distribuzione della popolazione, abbiamo che: 13 Prof.R.Folgieri,aa 2009-10-email [email protected] Distribuzione della differenza tra due medie campionarie z Da due diverse popolazioni provengono i campioni (X1, X2, …, Xn) e (Y1, Y2, … , Yn) Prof.R.Folgieri,aa 2009-10-email [email protected] Distribuzione della differenza tra due medie campionarie – casi particolari 14 Distribuzione di rapporti che coinvolgono medie e varianze campionarie Prof.R.Folgieri,aa 2009-10-email [email protected] …continua alla slide successiva Prof.R.Folgieri,aa 2009-10-email [email protected] Distribuzione di rapporti che coinvolgono medie e varianze campionarie 15 Prof.R.Folgieri,aa 2009-10-email [email protected] Riepilogo Abbiamo visto: z Definizione di popolazione, di campione e di spazio campionario z Distribuzione del campione z Inferenza statistica – definizioni e approcci all’inferenza z Statistiche campionarie z Distribuzione della media campionaria z Popolazione Bernoulliana e popolazione Normale z Distribuzione della varianza campionaria z Distribuzione della differenza tra due medie campionarie e casi particolari z Distribuzione di rapporti che coinvolgono medie e varianze campionarie 16