Modelli di probabilità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di Napoli Federico II Professore supplente, Università della Basilicata a.a. 2011/2012 Prof. Roberta Siciliano Statistica 1 Obiettivo dell’unità didattica • Definire i concetti di base sulla teoria delle variabili casuali e dei modelli di probabilità discreti e continui Contenuti • Definizione di variabile casuale • Modelli discreti di probabilità • Modelli continui Prof. Roberta Siciliano Statistica 2 1 Variabile Casuale Una Variabile Casuale è una regola (funzione reale) che associa ad E (evento elementare di S) uno ed un solo numero reale Per ogni Evento dello Spazio Campionario la v.c. X assume il valore reale x E2 E1 E3 E5 E6 Prof. Roberta Siciliano R E4 S Statistica x1 x2 3 x3 Il ruolo delle variabili casuali La prova ha dato quel particolare risultato La v.c. X ha generato quel particolare valore x Sarà possibile associare una misura di probabilità allo spazio numerico della v.c. utilizzando la misura di probabilità definita sui sottoinsiemi dello spazio campionario S. "Si verifica l'evento E con probabilità P(E)" "La v.c. X assume il valore x con probabilità P(x)" Prof. Roberta Siciliano Statistica 4 2 Le variabili discrete Una v.c. X è una variabile che assume valori nello spazio dei numeri reali secondo una funzione di probabilità P(X). P[X(E)] S E 1 X(E) ! Rappresentazione grafica dello schema di costruzione di una v.c. discreta Prof. Roberta Siciliano 0 Statistica 5 Esempio: estraendo casualmente una famiglia con 3 figli e annotando il genere (Maschio, Femmina) dei 3 figli, i possibili risultati della prova sono: E1 E2 E3 E4 E5 E6 E7 E8 S={MMM,MMF,MFM,FMM,MFF,FMF,FFM,FFF} 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 Definiamo la variabile casuale X= numero dei figli maschi {E8 } {E5 ∪ E6 ∪ E7 } {E2 ∪ E3 ∪ E4 } {E1} Prof. Roberta Siciliano Statistica X 0 1 2 3 pi 1/8 3/8 3/8 1/8 6 3 Schematicamente Esempi di prove: lancio di un dado, di una moneta, estrazione di un numero al lotto. Ai k eventi possibili risultati di una prova, si associano k valori della v.c. a cui sono associate le corrispondenti probabilità. Eventi v.c.X P(X) E1 E2 x1 x2 p1 p2 E3 x3 p3 Ek xk pk Prof. Roberta Siciliano Statistica 7 Tipi di variabili casuali Il modello di probabilità è una esemplificazione della realtà e può essere descritto da una v.c. v.c. Discrete In natura Prof. Roberta Siciliano Continue discretizzate Statistica 8 4 variabili casuali discrete Una Variabile Casuale è nota se conosciamo la sua distribuzione di probabilità I valori della v.c. possono essere arbitrari, mentre le probabilità non possono essere arbitrarie perché: # p !0 i = 1,!, k % i $ " pi = 1 %& Prof. Roberta Siciliano Statistica 9 Una variabile casuale discreta può essere rappresentata graficamente pi x1 Prof. Roberta Siciliano x2 Statistica x3 xi 10 5 Valore atteso e varianza di una v.c. discreta Si definisce valore atteso di una v.c. X discreta: k E(X) = ! xi pi i=1 Si definisce varianza di una v.c. X discreta: k 2 var(X) = " ( xi ! E ( X )) pi i=1 Prof. Roberta Siciliano Statistica 11 v.c Uniforme discreta La prova che genera una v.c. Uniforme discreta si può assimilare all’estrazione di una pallina da un’urna che contiene k palline identiche e numerate da 1 a k. Ogni pallina ha la stessa probabilità di essere estratta. Esempi di prove: lancio di un dado , estrazione di una carta da un mazzo Si definisce quindi v.c. Uniforme discreta, la variabile X che assume valori x=1,2,…,k con probabilità costante pari a 1/k. Essa si indica con X~Ud(k) con P(X=x)=1/k per ogni x=1,2,…,k. La v.c. Ud è simmetrica, non presenta moda e possiede media e varianza pari a: E(X)=(k+1)/2 Prof. Roberta Siciliano Var(X)=(n2-1)/12 Statistica 12 6 Esempio Prof. Roberta Siciliano Statistica 13 v.c. Bernoulliana La v.c. di Bernoulli trae origine da una prova nella quale interessa verificare esclusivamente se un evento E si verifica (successo) oppure no (insuccesso). Si è in presenza di un modello bernoulliano ogni qual volta è possibile dicotomizzare (suddividere in due) i possibili esiti di una prova: Esempi: il verificarsi di testa o di “croce” nel lancio di una moneta, l’estrazione di una pallina bianca o nera da un’urna che ne contiene di bianche e nere, il verificarsi di un punteggio superiore al 5 nel lancio di un dado oppure inferiore o uguale a 5, etc. La v.c. di Bernoulli X assume valore 1 (il successo ) con probabilità π (pi greco) e valore 0 (l insuccesso ) con probabilità 1- π, quale possibili esiti di una prova Essa si indica con X~B(1,π) con P(X=x)= πx(1- π)1-x per x=0,1. La v.c. di Bernoulli possiede media e varianza pari a: E(X)= π (la media coincide con la probabilità di successo) Var(X)= π(1- π) (può assumere valori compresi tra 0 e 0,25, questo ultimo nel caso di massima incertezza) Prof. Roberta Siciliano Statistica 14 7 Esempio Prof. Roberta Siciliano Statistica 15 v.c. Binomiale Se si ripete, per n volte e nelle medesime condizioni, lo schema successo-insuccesso della v.c. di Bernoulli, si genera una sequenza di n sottoprove indipendenti a ciascuna delle quali si può associare una v.c. di Bernoulli. Tale modello prende il nome di v.c. Binomiale e può essere intesa come una somma di n v.c. bernoulliane. Esempio: nel lancio n volte di una moneta si è interessati al numero di volte in cui esce testa. La v.c. Binomiale rappresenta il numero di successi che si verificano in una sequenza di n sottoprove indipendenti nelle quali è costante la probabilità π di successo. La v.c. binomiale dipende da due parametri, il numero n delle sottoprove e la probabilità π. ! n $ x n'x & ! (1' ! ) Essa si indica con X~B (n,π) con P ( X = x ) = # per x=0,1,2,…,n. " x % La v.c. Binomiale possiede media e varianza pari a: E(X)= n π Var(X)= n π(1- π) (n volte la media della bernoulliana) (n volte la varianza della bernoulliana) Prof. Roberta Siciliano Statistica 16 8 Esempio Prof. Roberta Siciliano Statistica 17 Condizioni di applicazione del modello binomiale La v.c. binomiale trova applicazione in prove dove sono verificate le seguenti condizioni: • la prova è composta da n sottoprove indipendenti ovvero, il risultato di una sottoprova non modifica la probabilità della successiva. • ogni sottoprova è svolta sempre nelle medesime condizioni ovvero, la probabilità π del successo (in una singola sottoprova bernoulliana) è costante in tutte le n sottoprove. Prof. Roberta Siciliano Statistica 18 9 Variabili Casuali continue • Ammette infiniti valori, quindi non è possibile attribuire le singole probabilità ad ogni x. • Si associa ad ogni intervallo una funzione f(x) detta funzione di densità. Prof. Roberta Siciliano Statistica f(x) 19 Attenzione, f(x) non è la probabilità!!!!!! X f(x) è proporzionale (a meno di un infinitesimo) alla probabilità di un intervallo sufficientemente piccolo Prof. Roberta Siciliano Statistica 20 10 Se X è una variabile casuale che assume valori in [a,b], essa è definita se: Esiste la f (x ) tale che per ogni x 0 ∈ (a, b ) P(x0 ≤ X ≤ xo + dx ) = f (x0 )dx ⎧ f (x ) ≥ 0 Per ogni x tale che a < x < b ⎪ b ⎨ ⎪∫ f (x )dx = 1 ⎩ a Prof. Roberta Siciliano Statistica 21 Calcolo delle probabilità per v.c. continue P( x0 ! X ! x1 ) = P( X ≤ x1 ) − P( X ≤ x0 ) = = F ( x1 ) − F ( x0 ) f (x) Prof. Roberta Siciliano x0 x1 Statistica x 22 11 Valore atteso e varianza di una v.c. continua Si definisce valore atteso di una v.c. X continua: b E(X) = ! x f ( x ) dx a Si definisce varianza di una v.c. X continua: b var(X) = 2 " ( x ! E(X)) f ( x ) dx a Prof. Roberta Siciliano Statistica 23 Molti fenomeni della realtà si distribuiscono secondo il modello della curva Normale X~ N (µ, ! 2 ) f ( M e − c) = f ( M e − c) -c c ⇓ f è simmetrica M0 = Me = µ M 0 < M e < µ ! asimmetria positiva (destra) µ < M e < M 0 ! asimmetria negativa (sinistra) Prof. Roberta Siciliano Statistica 24 12 Equazione della funzione Normale o di Gauss 1 f ( x; µ ; σ ) = e σ 2Π 2 − 1 ⎛ X − µ ⎞ 2 ⎜ ⎟ ⎠ 2σ 2 ⎝ per ogni x tale che − ∞ < x < +∞ Prof. Roberta Siciliano Statistica 25 Una curva Normale è completamente rappresentata da µ e σ Gode si simmetria rispetto a µ Ha forma campanulare Le ascisse dei punti di flesso sono in µ ±σ Gli estremi della curva sono asintotici Prof. Roberta Siciliano Statistica 26 13 La conoscenza di un modello teorico corrispondente ad una distribuzione empirica consente: • Regolarizzare un istogramma • Ricostruire dati mancanti • Confrontare istogrammi basati su classi di diversa ampiezza • Descrivere sinteticamente i dati con i parametri del modello E possibile ricostruire le frequenze teoriche n̂i relative ad Una certa classe xi , xi +1 semplicemente integrando la funzione Normale su detto intervallo Prof. Roberta Siciliano Statistica 27 v.c. Normale Standardizzata X~N(0,1) ( ) Se µ = 0 e σ 2 = 1 ⇒ N µ , σ 2 = Z (0,1) 1 1 − 2 z2 f (z ) = e 2Π Relazione tra Z= X −µ σ Prof. Roberta Siciliano − ∞ ≤ z ≤ +∞ ( N µ,σ 2 ) e Z (0,1) X = µ + Zσ Statistica 28 14 X ≈ distribuzione normale → Z = X −µ σ 1 1,5 2 2,5 3 3,5 4 Distribuzi one normale standardiz zata → X = µ + Zσ N (0,1) Prof. Roberta Siciliano2 0 2 Statistica 29 z P(Z < z ) = φ (z ) = ∫ f ( y )dy −∞ Esistono le tavole dei valori di probabilità!! φ (z ) = 1 − φ (− z ) ⇒ φ (− z ) = 1 − φ (z ) φ (0) = 0.5 φz − φz φ0 = 0.5 2 0 Prof. Roberta Siciliano Statistica z1 z2 1 z 30 15 ⎡ X − µ x − µ ⎤ P( X ≤ x ) = P ⎢ ≤ = ⎥ σ σ ⎣ ⎦ x − µ ⎞ ⎛ ⎛ x − µ ⎞ P⎜ Z ≤ = φ ⎟ ⎜ ⎟ σ ⎠ ⎝ σ ⎠ ⎝ Prof. Roberta Siciliano Statistica σ 31 σ Me = M0 = µ 1) Se σ Se ↑ la curva si appiattisce σ ↓la curva si allunga 2) M e ≡ M 0 ≡ µ Prof. Roberta Siciliano Statistica 32 16 3) µ − σ e µ + σ sono due flessi 4) f (µ − x) = f (µ + x) 5) L 2 3 2 3 intervalloµ − σ , µ + σ comprende il 50% delle osservazioni L intervallo µ − σ , µ + σ comprende il 68% delle osservazioni L intervallo µ − 2σ , µ + 2σ comprende il 95% delle osservazioni L intervallo µ − 3σ , µ + 3σ comprende il 99.7% delle osservazioni Prof. Roberta Siciliano Statistica 6) Per x = µ ⇒ f (µ ) = 7)Per x → +∞ ( 33 1 2Πσ 2 = max e x → −∞ f (x ) = 0 2 ) ( ⇒ ax + b ~ N aµ + b, a 8) Se X ~ N µ , σ con a,b costanti reali. Cioè ogni trasformazione lineare di X sarà ancora Normale Prof. Roberta Siciliano Statistica σ 2) 2 34 17 Trasformazioni della v.c. Normale § v.c. Chi-quadrato con g gradi di libertà: La somma dei quadrati di g v.c. normali standardizzate e indipendenti § v.c. F-Snedecor Fisher con g e h gradi di libertà: Il rapporto tra due v.c. Chi-quadrato, indipendenti tra loro, ciascuna rapportata ai propri gradi di libertà, g ed h. § v.c. t-Student con g gradi di libertà: Il rapporto tra una v.c. normale standardizzata ed un Chi-quadrato con g gradi di libertà, tra loro indipendenti. Prof. Roberta Siciliano Statistica 35 Diseguaglianza di Cebicev La disuguaglianza di Cebicev è uno dei risultati più notevoli del calcolo delle probabilità. La disuguaglianza afferma che, per ogni v.c. X che E(X)=µ e Var(X) =σ2<+∞, si ha: P(|X- µ|)<є)≥1-(1/ є2) per ogni є>0. Ponendo є σ=k, la disuguaglianza si può esprimere nel seguente modo: P(|X- µ|)<k)≥1-(σ2 / k2) per ogni k>0. In altre parole, l’importanza di questo risultato risiede nel fatto che, noti i momenti primo e secondo di una v.c. X, è sempre possibile trovare un limite inferiore alla probabilità che la variabile assuma valori compresi in un intervallo [µ-є σ; µ+є σ]. Ciò anche quando è ignota la funzione di probabilità della variabile casuale!!! Prof. Roberta Siciliano Statistica 36 18 Prof. Roberta Siciliano Statistica 37 19