MODELLI PER VARIABILI ALEATORIE DISCRETE Tutti i modelli riportati vengono ottenuti a partire dalla v.a. di Bernoulli. Definiamo famiglia esponenziale una collezione di v.a. con funzione di densità f ( x) expa( )b( x) c( x) d ( ) In cui è un vettore dei parametri, ossia dei valori numerici della v.a., e a,b,c, sono funzioni note. La maggior parte delle distribuzioni note fa capo a questa famiglia. VARIABILE ALEATORIA UNIFORME Generiamo una v.a. uniforme discreta (o rettangolare) estraendo una pallina da un’urna di n palline numerate da 1 ad n. Il valore della v.a. X associata è pari al numero sulla pallina estratta. Dunque la funzione di probabilità della v.a. XUd(n) è del tipo 1 P( X x) n per x 1,2,..., n 0 altrove definita nello spazio campione 1,2,..., n. La funzione di ripartizione di questa v.a. è una funzione a gradini di altezza 1 per 1 x n , ossia n k F ( x) n x 1 per k x k 1 k 1,2,..., n 1 1 per x n 0 per Si ottiene per valor medio (coincide con la mediana), varianza, asimmetria e curtosi : n 1 2 n2 1 Var ( X ) 12 Asym( X ) 0 Kurt ( X ) 1.8 E( X ) VARIABILE ALEATORIA DI BERNOULLI Si tratta di una variabile dicotomica (binaria) che assume valore 0 o 1 con probabilità 1-p e p. p è la probabilità del successo e q=1-p quella dell’insuccesso. La funzione di probabilità (probabilità di successo in una sola prova) della XBer(p) è P( X x) p x (1 p)1 x E’ caso particolare per n=1 della v.a. binomiale (vedi sotto). Vale E ( X ) xi pi 1 p 0 (1 p) p Var ( X ) E ( X 2 ) [ E ( X )] 2 pi xi2 p 2 p p 2 p(1 p) 1 2 p Asym( X ) p(1 p) 2 3p 3p 1 Kurt ( X ) p(1 p) Questo modello si trova ovunque si sia interessati ad accertare se un evento E si verifica oppure no: funziona/non funziona, vivo/morto, ecc. VARIABILE ALEATORIA BINOMIALE La v.a. binomiale è generata da n eventi omogenei ed indipendenti di tipo bernoulliano, ciascuno dei quali ha probabilità p di accadere e probabilità q=1-p di non accadere. E’ quindi utilizzabile in tutti i casi in cui gli esiti di una prova sono sostanzialmente due (successo/insuccesso). Un esempio di applicazione è il controllo di qualità. Se la probabilità del singolo evento è p, la probabilità che accadano tutti gli n eventi è pn, e la probabilità che gli n eventi non accadano è (1-p)n. Per calcolare le probabilità che questa v.a. assuma i valori x=0,1,2,3…,n dobbiamo considerare ogni volta il numero di modi in cui x oggetti si possono prendere da n, ossia il numero di combinazioni di n oggetti ad x ad x: n n! = x x!(n x)! La v.a. binomiale XBin(n,p) ha funzione di distribuzione n n! P( X x) p x (1 p) x p x (1 p) n x x x ! ( n x )! La distribuzione cumulativa è k n P( X k ) p x (1 p) n x x 0 x con k=np . Esplicitamente, al fenomeno “numero di successi in n prove indipendenti” si associa la distribuzione di probabilità xi p i 0 qn 1 n n 1 pq 1 2 n 2 n2 p q 2 .... n. ... pn Di fatto questa distribuzione è la somma di n v.a. bernoulliane: quindi valor medio e varianza di questa distribuzione sono E ( X ) E ( X 1 X 2 ... X n ) p p ... p np Var ( X ) Var( X 1 X 2 .... X n ) p(1 p) p(1 p) ... p(1 p) np(1 p) Asimmetria e curtosi valgono Asym( X ) 1 2 p np(1 p) Kurt ( X ) 3 1 6 p 6 p2 np(1 p) Il grafico della funzione varia al variare di p: è simmetrico per p=0.5, asimmetrico negativo per p<0.5, asimmetrico positivo per p>0.5 . LA VARIABILE ALEATORIA IPERGEOMETRICA Partiamo da una popolazione finita di N elementi , di cui r elementi di un tipo e N-r elementi di un altro tipo. La probabilità p di trovare per estrazione senza sostituzione un elemento del primo tipo è p r N e la probabilità 1-p sarà 1 p N r N Chiamiamo v.a. ipergeometrica XH(N,n,p) la probabilità di estrarre x elementi del primo tipo da un campione di numerosità n estratto dalla popolazione di ampiezza N: r N r x n x P( X x) N n per max(0,n-N+r) x min(n,r) Questa v.a. si utilizza quando si seleziona un campione di n elementi da un lotto di n, di cui r sono diversi dagli n: x generalmente rappresenta il numero di elementi “non conformi” nel campione. Si dimostra facilmente che per N>10n ed n piccolo, questa distribuzione si approssima alla binomiale. Valor medio e varianza valgono: E( X ) Var ( X ) nr np N nr N r N n N n np(1 p) n N N 1 N 1 Asimmetria e curtosi hanno espressioni complesse. LA VARIABILE ALEATORIA GEOMETRICA Data una successione di prove indipendenti con probabilità p che si verifichi un certo evento, la v.a. geometrica XGeo(p) rappresenta il numero di sottoprove necessarie per ottenere l’evento la prima volta: P( X x) p(1 p) x 1 per x= 1,2,…,n Valor medio e varianza sono E( X ) 1 p Var ( X ) 1 p . p2 VARIABILE ALEATORIA DI POISSON E’ una variabile di fondamentale importanza per determinare il numero di volte in cui un evento casuale si verifica in un dato intervallo di tempo (o spazio). Si dice degli eventi rari perché è adatta a descrivere i fenomeni in cui, su un grande numero di prove in cui la probabilità di successo è piccola, si verificano mediamente successi. Questa distribuzione si indica come XPo() ed è il limite della distribuzione binomiale per np= e n . In effetti se p è molto piccolo, il numero medio di eventi sarà molto più piccolo di n, quindi il numero di successi x sarà estremamente più piccolo di n. Poniamo np= : x x! (1 p) / p x (1 p) x! 1/ p Ma si sa che lim (1 p)1 / p exp( ) p0 quindi n x P( X x) lim p x (1 p) n x exp( ) x! x n p0 lim n x P( X x) n p x (1 p) n x exp( ) x! p 0 x Valor medio, varianza, asimmetria e curtosi sono rispettivamente: E( X ) Var ( X ) Asym( X ) 1 Kurt ( X ) 3 1 Va sottolineato che il grafico non è simmetrico, e l’asimmetria è positiva. Diventa più simmetrico al crescere di . Funzione di distribuzione Funzione di ripartizione