Lezione 14 A. Iodice disuguaglianza di Markov Lezione 14 disuguaglianza di Chebyshev Statistica Esempio 1 Stimatori puntuali Alfonso Iodice D’Enza [email protected] Statistiche campionarie media campionaria Esempio 2 Esempio 3 Università degli studi di Cassino varianza campionaria A. Iodice () Lezione 14 Statistica 1 / 29 Outline Lezione 14 A. Iodice 1 disuguaglianza di Markov disuguaglianza di Markov 2 disuguaglianza di Chebyshev Esempio 1 3 Stimatori puntuali Statistiche campionarie 4 Statistiche campionarie media campionaria 5 media campionaria Esempio 2 Esempio 3 6 varianza campionaria disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Esempio 2 Esempio 3 varianza campionaria A. Iodice () Lezione 14 Statistica 2 / 29 Importanti disuguaglianze Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Variabili casuali con distribuzioni non note Le disuguaglianze di Markov e Chebyshev sono due risultati importanti perchè consentono di porre una ’soglia’ superiore alle probabilità di eventi rari che riguardano variabili casuale di cui non si conosce la distribuzione, ma solo valore atteso oppure valore atteso e varianza. Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 disuguaglianza di Chebyshev disuguaglianza di Markov Sia X una variabile casuale mai negativa, allora per qualunque valore a>0 P (X ≥ a) ≤ varianza campionaria A. Iodice () E [X] a Sia X una variabile casuale di cui si conoscono solo la media µ e varianza σ 2 , allora dato un qualunque valore k > 0, vale la seguente relazione P (| X − µ |≥ k) ≤ Lezione 14 σ2 k2 Statistica 3 / 29 Importanti disuguaglianze Lezione 14 A. Iodice disuguaglianza di Markov Sia X una variabile casuale mai negativa, allora per qualunque valore a > 0 disuguaglianza di Markov P (X ≥ a) ≤ E [X] a disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali dimostrazione Si supponga che la v.c. X si distribuisca secondo una funzione di densità incognita f Statistiche campionarie Z ∞ E [X] = media campionaria Z ∞ Z a xf (x)dx = xf (x)dx ≥ xf (x)dx + 0 0 | a {z } | {z ≥0 Esempio 2 Esempio 3 Z ∞ ≥ varianza campionaria Z ∞ xf (x)dx ≥ a | } ≥0 Z ∞ f (x)dx = a P (X ≥ a) af (x)dx = a a {z perchè x∈[a,∞] quindi x≥a a } | {z } a è una costante dunque E [X] ≥ aP (X ≥ a) → P (X ≥ a) ≤ A. Iodice () Lezione 14 E [X] a Statistica 4 / 29 Importanti disuguaglianze Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali disuguaglianza di Chebyshev Sia X una variabile casuale di cui si conoscono solo la media µ e varianza σ 2 , allora dato un qualunque 2 valore k > 0, vale la seguente relazione P (| X − µ |≥ k) ≤ σ2 k dimostrazione Si consideri l’evento per cui vale | X − µ |≥ k: i valori di X, µ e k per cui vale la disuguaglianza sono gli stessi per cui vale la disuguaglianza (X − µ)2 ≥ k2 . La probabilità che si verifichi una delle disuguaglianze precedenti è dunque la stessa. Inoltre la variabile casuale (X − µ)2 è non negativa (essendo un quadrato), dunque si può applicare la disuguaglianza di Markov, con a = k2 , quindi Statistiche campionarie notare che = σ 2 z media campionaria 2 P (| X − µ |≥ k) = P ((X − µ) Esempio 2 Esempio 3 varianza campionaria 2 }| { h i 2 E (X − µ) ≥k )≤ | {z k2 } disuguaglianza di Markov che verifica la disuguaglianza di Chebyshev P (| X − µ |≥ k) ≤ A. Iodice () Lezione 14 σ2 k2 Statistica 5 / 29 Esempio Lezione 14 A. Iodice Il numero di automobili prodotte da una fabbrica in una settimana si distribuisce secondo una variabile casuale X con media pari a 50. Qual’è la probabilità che la produzione superi occasionalmente le 75 auto? Qual’è la probabilità che la produzione sia compresa tra 40 e 60 pezzi, sapendo che la varianza della distribuzione è pari a 25? disuguaglianza di Markov disuguaglianza di Chebyshev svolgimento Esempio 1 Poichè l’unica conoscenza della distribuzione di X è che E [X] = 50, per calcolare P (X ≥ 50) si ricorre alla disuguaglianza di Markov. Stimatori puntuali Statistiche campionarie P (X ≥ a) ≤ media campionaria E [X] a → P (X ≥ 75) ≤ 50 75 = 0.67 In questo caso, oltre alla media µ = 50, è nota anche la varianza σ 2 = 25. Si vuole la probabilità che 40 ≤ X ≥ 60, quindi | 60 − 50 |=| 40 − 50 |= 10 = k, dunque P (| X − 50 |≥ 10) rappresenta la probabilità che la produzione si discosti di più di 10 unità dalla media. Esempio 2 Esempio 3 varianza campionaria P (| X − 50 |≥ 10) ≤ 25 102 = 0.25 dunque la probabilità che la produzione si discosti di meno di 10 unità dalla media è P (40 ≤ X ≥ 60) = 1 − P (| X − 50 |≥ 10) ≥ 1 − 0.25. P (40 ≤ X ≥ 60) ≥ 0.75 A. Iodice () Lezione 14 Statistica 6 / 29 Distribuzione delle statistiche campionarie Lezione 14 A. Iodice disuguaglianza di Markov Popolazione e campione La popolazione è un insieme molto grande di oggetti a cui sono associate delle quantità misurabili. Il campione è un sottoinsieme ridotto della popolazione. L’obiettivo dell’approccio statistico è analizzare il campione per trarre da esso informazioni circa la popolazione. disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria campione casuale Per effettuare inferenze sulla popolazione in base al campione, si assume che vi sia la popolazione segua una distribuzione di probabilità F . Estraendo casualmente degli oggetti dalla popolazione per formare il campione, si assume che ciascun valore ad essi associato sia una variabile casuale caratterizzata dalla distribuzione F della popolazione. definizione Un insieme di X1 , X2 , . . . , Xn di variabili aleatorie indipendenti e distribuite secondo una distribuzione F , si definisce campione casuale della distribuzione F . A. Iodice () Lezione 14 Statistica 7 / 29 Distribuzione delle statistiche campionarie Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria Inferenza parametrica e non parametrica La distribuzione F della popolazione è non nota. In alcuni casi è tuttavia possibile che si conosca la famiglia di distribuzioni di variabili casuali a cui F appartiene, e dunque si utilizza il campione per fare inferenza sui parametri che identificano F : è il caso dell’inferenza parametrica. In altri casi non si ha alcuna informazione su F : in questi casi si fa ricorso a tecniche di inferenza non parametrica. La statistica Uno stimatore è una funzione dei dati campionari. Poichè le osservazioni campionarie sono v.c., e poichè una funzione di v.c. è a sua volta una v.c., allora lo stimatore è una v.c. funzione dei dati campionari. Una statistica è uno stimatore che utilizza i dati campionari per ottenere la stima di un parametro della distribuzione F . A. Iodice () Lezione 14 Statistica 8 / 29 Stimatori puntuali Lezione 14 A. Iodice disuguaglianza di Markov Definizione di stimatore puntuale disuguaglianza di Chebyshev Sia X sia una v.c. di cui si conosce la famiglia di distribuzione (Normale, Binomiale, Esponenziale, ...), ma di cui non si conosce il parametro θ che caratterizza la distribuzione. Esempio 1 Stimatori puntuali L’obiettivo è identificare il parametro θ, con la quale individuare la distribuzione specifica della popolazione. Statistiche campionarie Si ricorre ad un campione casuale X1 , X2 , . . . , Xn e ad una funzione nota T (.) che riceve in input il campione casuale e, in base a questo, fornisce un valore per il parametro incognito θ. media campionaria Esempio 2 Esempio 3 varianza campionaria A. Iodice () Lezione 14 Statistica 9 / 29 Stimatori puntuali Lezione 14 A. Iodice disuguaglianza di Markov Definizione di stimatore puntuale Prima di aver osservato il campione, X1 , X2 , . . . , Xn è una v.c., e T (X1 , X2 , . . . , Xn ) = Tn è a sua volta una v.c. e si definisce stimatore del parametro θ disuguaglianza di Chebyshev Esempio 1 Dopo aver osservato il campione, si hanno le osservazioni x1 , x2 , . . . , xn che, date in input a T (.), producono la stima (θ̂) del parametro incognito Stimatori puntuali Statistiche campionarie T (x1 , x2 , . . . , xn ) = θ̂ media campionaria a seconda del campione estratto, si avrà una stima (valore θ̂) diversa, dunque T (X1 , X2 , . . . , Xn ) = Tn avrà una propria distribuzione campionaria. Esempio 2 Esempio 3 varianza campionaria A. Iodice () Lezione 14 Statistica 10 / 29 Stimatori puntuali Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria A. Iodice () Lezione 14 Statistica 11 / 29 Stimatori puntuali Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria A. Iodice () Lezione 14 Statistica 12 / 29 Stimatori puntuali Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria A. Iodice () Lezione 14 Statistica 13 / 29 Stimatori puntuali Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria A. Iodice () Lezione 14 Statistica 14 / 29 Stimatori puntuali Lezione 14 A. Iodice Caratteristiche degli stimatori disuguaglianza di Markov E’ necessario definire quali sono le caratteristiche desiderabili di uno stimatore Tn di un parametro θ disuguaglianza di Chebyshev la sufficienza di uno stimatore: questa caratteristica si riferisce alla capacità dello stimatore Tn di un parametro θ di catturare tutta l’informazione riguardante θ che è presente nel campione X1 , X2 , . . . , Xn ; Esempio 1 Stimatori puntuali Statistiche campionarie - Formalemente, se X1 , X2 , . . . , Xn è un campione generato dalla v.c. X con distribuzione f (x; θ) e Tn è uno stimatore di θ, allora media campionaria Tn è sufficiente se φX x1 , x2 , . . . , xn | Tn = θ̂ NON DIPENDE DA θ Esempio 2 Esempio 3 in altre parole, una volta ottenuta la stima θ̂, l’informazione su θ inizialmente contenuta nel campione, viene interamente catturata dallo stimatore Tn . varianza campionaria A. Iodice () Lezione 14 Statistica 15 / 29 Stimatori puntuali Lezione 14 A. Iodice disuguaglianza di Markov Proprietà degli stimatori: non distorsione (unbiased estimators) disuguaglianza di Chebyshev Uno stimatore Tn è non distorto se la media delle stime che produce (il valore atteso della v.c. Tn ) coincide col parametro oggetto di stima. Formalmente: Esempio 1 Stimatori puntuali Statistiche campionarie E(Tn ) = θ la distorsione, o bias = b(Tn ), dello stimatore Tn , rappresenta dunque la differenza tra il valore atteso di Tn e il parametro θ. media campionaria b(Tn ) = E(Tn ) − θ Esempio 2 Esempio 3 varianza campionaria uno stimatore non distorto è tale che b(Tn ) = 0. A. Iodice () Lezione 14 Statistica 16 / 29 Stimatori puntuali Lezione 14 A. Iodice Proprietà degli stimatori: efficienza disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria L’efficienza di uno stimatore corrisponde al grado di dispersione della distribuzione di Tn rispetto al parametro θ oggetto di stima. Se lo stimatore Tn è non distorto allora il grado di dispersione/efficienza delle stime dipende dalla sua varianza V ar(Tn ). Quando invece lo stimatore è distorto, bisogna tenerne conto, nella misura della sua efficienza, anche del bias b(Tn ) e si ricorre al mean squared error (MSE) M SE(Tn ) = E(Tn − θ)2 = V ar(Tn ) + [b(Tn )]2 Esempio 2 Esempio 3 varianza campionaria l’MSE, in caso di stimatori non distorti, coinciderà con la varianza di Tn perché b(Tn ) = 0. A. Iodice () Lezione 14 Statistica 17 / 29 Stimatori puntuali Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Proprietà degli stimatori: efficienza (2) Dati due stimatori T1,n e T2,n si sceglierà il più efficiente, vale a dire, se M SE(T2n ) > M SE(T1n ), allora per stimare il parametro θ si sceglierà T2n ; Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Ricorrendo all’MSE si può stabilire, tra due stimatori, quale sia migliore perché più efficiente, tuttavia non si può dire che lo stimatore scelto sia il più efficiente in assoluto. la disuguaglianza di Cramer e Rao indica la varianza minima che uno stimatore non distorto può raggiungere: Esempio 2 Esempio 3 quindi, se la varianza di uno stimatore Tn , non distorto, raggiunge il limite indicato dalla disuguaglianza di Cramer e Rao, allora Tn risulta lo stimatore di θ più efficiente in assoluto. varianza campionaria A. Iodice () Lezione 14 Statistica 18 / 29 Distribuzione della media campionaria Lezione 14 A. Iodice Distribuzione della media campionaria disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Si consideri ad esempio una popolazione - ad esempio i lavoratori dipendenti - su cui sia misurata una quantità numerica - ad esempio il reddito annuo percepito -; il campione casuale estratto da tale popolazione è X1 , X2 , . . . , Xn , i valori associati agli elementi del campione sono v.c. indipendenti e identicamente distribuite (i.i.d.), tutte caratterizzate dalla stessa distribuzione F i cui parametri sono µ e σ 2 (media e varianza). Statistiche campionarie media campionaria La statistica media campionaria X̄ := Esempio 2 Esempio 3 varianza campionaria X1 + X2 + . . . + Xn n funzione delle v.c. X1 , X2 , . . . , Xn del campione: si tratta di una variabile casuale. A. Iodice () Lezione 14 Statistica 19 / 29 Distribuzione della media campionaria Lezione 14 A. Iodice La statistica media campionaria X̄ := disuguaglianza di Markov disuguaglianza di Chebyshev X1 + X2 + . . . + Xn n funzione delle v.c. X1 , X2 , . . . , Xn del campione: si tratta di una variabile casuale. Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza di X̄ valore atteso di X̄ E X̄ = E = = X1 + X2 + . . . + Xn = n E [X1 ] + E [X2 ] + . . . + E [Xn ] n µ + µ + ... + µ varianza campionaria n = nµ n =µ var X̄ = var = = var = σ2 n2 X1 n + σ2 n2 X1 + X2 + . . . + Xn + var + ... + X2 n σ2 n2 n = = + . . . + var nσ 2 n = Xn n = σ2 n nota La distribuzione di X̄ risulta quindi centrata su µ, mentre la sua varianza diminuisce all’aumentare di n. A. Iodice () Lezione 14 Statistica 20 / 29 Teorema del limite centrale Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Teorema del limite centrale (TLC) Tale teorema è un risultato molto importante della teoria della probabilità: esso afferma che la somma di un numero elevato di v.c. indipendenti si distribuisce approssimativamente secondo una normale. TLC: Se si considerano le v.c. X1 , X2 , . . . , Xn indipendenti e identicamente distribuite, tutte con media µ e varianza σ 2 , allora X1 + X2 + . . . + Xn ∼ 2 N (nµ, nσ ) Se in questione si sottrae la media nµ e si divide per lo scarto quadratico medio √ alla somma √ nσ 2 = σ n si ottiene la relazione precedente in versione standardizzata X1 + X2 + . . . + Xn − nµ √ σ n Esempio 2 Esempio 3 ∼ N (0, 1) varianza campionaria A. Iodice () Lezione 14 Statistica 21 / 29 Esempio 2 Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie Una compagnia di assicurazione ha 25000 polizze attive. Ciascun assicurato percepisce un risarcimento annuo che rappresenta una v.c. che si distribuisce con media pari a 320 euro e scarto quadratico medio pari a 540 euro. Qual’è la probabilità che la compagnia paghi complessivamente 8300000 euro? Svolgimento Il risarcimento di ciascun cliente è Xi con i = . . . , n ed n = 25000. La richiesta complessiva di P1, n risarcimento da parte di tutti i clienti è X = i=1 Xi . Poichè X è la somma delle v.c. Xi che sono i.i.d., per il teorema del limite centrale risulta che X si distribuisce √ come una normale con media nµ = 25000 × 320 = 8000000. e scarto quadratico medio σ 25000 = 85381. Si vuole dunque P (X > 8300000). In unità standard, il valore in questione è media campionaria Z = Esempio 2 Esempio 3 varianza campionaria X − nµ 8300000 − 8000000 = = 3.51 √ σ n 85381 dunque P (X > 8300000) = P (Z > 3.51) ≈ 0. A. Iodice () Lezione 14 Statistica 22 / 29 Esempio 3 Lezione 14 A. Iodice Il numero ideale di studenti di un corso del primo anno di università è 150. Il management didattico dell’università sa che, in base agli anni precedenti, solo il 30% degli iscritti frequenta effettivamente i corsi, dunque decide di accettare fino a 450 nuove iscrizioni. Qual’è la probabilità che il numero di studenti frequentanti sia superiore a 150? disuguaglianza di Markov Svolgimento disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie Si definisca la v.c. X come il numero di studenti che frequentano, ciascuno studente iscritto corrisponde ad una prova Bernulliana il cui esito può essere frequenta o non frequenta. X si distribuisce pertanto secondo una distribuzione binomiale di parametri n = 450 e la probabilità di successo (lo studente iscritto frequenta) è p = 0.3. Per il teorema del limite centrale, poichè X è la somma di n v.c. Bernoulliane Xi , ciascuna con media E [Xi ] = p e varianza pari a var (Xi ) = p(1 − p), allora X si distribuisce approssimativamente come una normale con media µ = np e varianza pari a σ 2 = np(1 − p). (Si tratta dell’approssimazione della binomiale alla normale). media campionaria Esempio 2 Esempio 3 varianza campionaria La probabilità cercata è dunque P (X > 150.5) (lo ’+0.5’ in aggiunta è dovuto alla correzione di continuità). Standardizzando il problema si ha Z = p X − np np(1 − p) = 150.5 − 450 × 0.3 150.5 − 135 = = 1.59 √ 450 × .3 × .7 9.72 da cui P (X > 150.5) = P (Z > 1.59) ≈ 0.06. A. Iodice () Lezione 14 Statistica 23 / 29 Varianza campionaria Lezione 14 A. Iodice Varianza campionaria Dato un campione casuale X1 , X2 , . . . , Xn proveniente da una distribuzione con media µ e varianza σ 2 . Sia X̄ la media campionaria. La statistica varianza campionaria è disuguaglianza di Markov S disuguaglianza di Chebyshev 2 = n X 1 Xi − X̄ n − 1 i=1 2 Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria valore atteso della varianza campionaria Pn Pn Pn 2 2 2 Ricordando la relazione per la quale i=1 (xi − x̄) = i=1 xi − nx̄ , dove x̄ = i=1 xi /n dunque ! n n X X 2 1 1 2 2 2 da cui S = Xi − X̄ = Xi − nX̄ n − 1 i=1 n − 1 i=1 Esempio 2 Esempio 3 (n − 1)S varianza campionaria 2 = n X 2 Xi − nX̄ 2 i=1 andando ad effettuare il valore atteso di entrambi i lati dell’equazione si ha h i 2 (n − 1)E S =E " n X # 2 Xi h i 2 − nE X̄ i=1 A. Iodice () Lezione 14 Statistica 24 / 29 Varianza campionaria Lezione 14 valore atteso della varianza campionaria (seconda parte) A. Iodice disuguaglianza di Markov h i 2 (n − 1)E S =E " n X # 2 Xi h i h i h i 2 2 2 − nE X̄ = nE X1 − nE X̄ i=1 disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria h i poichè per qualunque v.c. Y vale la relazione E Y 2 = var(Y ) + E [Y ]2 allora h i h i h i 2 2 2 2 2 (n − 1)E S = nE X1 − nE X̄ = n var(X1 ) + E [X1 ] − n var(X̄) + E X̄ | {z } | {z } h i 2 n E X1 h i nE X̄ 2 2 poichè sappiamo che E [X1 ] = µ, var(X1 ) = σ 2 , E X̄ = µ, var(X̄) = σn , quindi h i h i σ2 2 2 2 2 2 2 2 2 2 (n − 1)E S = nσ + nµ − n − nµ = nσ − σ = σ (n − 1) ⇒ E S =σ n il valore atteso della varianza campionaria è uguale alla varianza della popolazione (nota: ecco perchè il denominatore di S 2 è (n − 1) e non n...) A. Iodice () Lezione 14 Statistica 25 / 29 Varianza campionaria Lezione 14 valore atteso della varianza campionaria (seconda parte) A. Iodice disuguaglianza di Markov h i 2 (n − 1)E S =E " n X # 2 Xi h i h i h i 2 2 2 − nE X̄ = nE X1 − nE X̄ i=1 disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria h i poichè per qualunque v.c. Y vale la relazione E Y 2 = var(Y ) + E [Y ]2 allora h i h i h i 2 2 2 2 2 (n − 1)E S = nE X1 − nE X̄ = n var(X1 ) + E [X1 ] − n var(X̄) + E X̄ | {z } | {z } h i 2 nE X1 h i nE X̄ 2 2 poichè sappiamo che E [X1 ] = µ, var(X1 ) = σ 2 , E X̄ = µ, var(X̄) = σn , quindi h i h i σ2 2 2 2 2 2 2 2 2 2 (n − 1)E S = nσ + nµ − n − nµ = nσ − σ = σ (n − 1) ⇒ E S =σ n il valore atteso della varianza campionaria è uguale alla varianza della popolazione (nota: ecco perchè il denominatore di S 2 è (n − 1) e non n...) A. Iodice () Lezione 14 Statistica 26 / 29 Distribuzione della varianza campionaria Lezione 14 A. Iodice disuguaglianza di Markov La v.c. chi-quadrato La somma di n v.c. normali standard Z ∼ N (0, 1) al quadrato P n 2 2 i=1 Zi si distribuisce come una v.c. chi-quadro χ (n) con n gradi di libertà. disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria A. Iodice () Lezione 14 Statistica 27 / 29 Distribuzione della varianza campionaria Lezione 14 A. Iodice disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Stimatori puntuali Statistiche campionarie Il valore atteso della v.c. chi-quadrato Data una singola variabile normale standard Z, si consideri la varianza var(Z) = E[Z 2 ]−(E[Z])2 poichè E[Z] = 0 allora var(Z) = E[Z 2 ]−(0)2 = E[Z 2 ] poiché Z ∼ N (0, 1) segue che var(Z) = 1 = E[Z 2 ]. E’ dunque possibile dimostrare che il valore atteso della v.c. chi-quadrato è uguale ai suoi gradi di libertà: media campionaria " Esempio 2 Esempio 3 E n X i=1 varianza campionaria A. Iodice () # Zi2 = n X i=1 Lezione 14 n X E Zi2 = 1=n i=1 Statistica 28 / 29 Distribuzione della varianza campionaria Lezione 14 Ricordando che A. Iodice S2 = disuguaglianza di Markov disuguaglianza di Chebyshev Esempio 1 Importante relazione Vale la seguente relazione Stimatori puntuali (n − 1)S 2 = σ2 Statistiche campionarie media campionaria Esempio 2 Esempio 3 varianza campionaria n 2 1 X Xi − X̄ n − 1 i=1 Pn i=1 Xi − X̄ σ2 (X−µ)2 X−µ ∼ Z(0, 1), allora ∼ [Z(0, 1)]2 σ σ2 2 P 2 i=1 (X−µ) ∼ n i=1 [Z(0, 1)] ovvero si distribuisce σ2 perché se 2 dunque Pn secondo una v.c. chi-quadro con n gradi di libertà; se si sostituisce il parametro µ con il suo stimatore X̄, si perde un grado di libertà, dunque P n i=1 (X−X̄)2 σ2 libertà. A. Iodice () e (n−1)S 2 σ2 si distribuiscono come un chi-quadro con n − 1 gradi di Lezione 14 Statistica 29 / 29