modelli per variabili aleatorie discrete

annuncio pubblicitario
MODELLI PER VARIABILI ALEATORIE DISCRETE
Tutti i modelli riportati vengono ottenuti a partire dalla v.a. di Bernoulli.
Definiamo famiglia esponenziale una collezione di v.a. con funzione di densità
f ( x)  expa( )b( x)  c( x)  d ( )
In cui  è un vettore dei parametri, ossia dei valori numerici della v.a., e a,b,c, sono
funzioni note.
La maggior parte delle distribuzioni note fa capo a questa famiglia.
VARIABILE ALEATORIA UNIFORME
Generiamo una v.a. uniforme discreta (o rettangolare) estraendo una pallina da un’urna
di n palline numerate da 1 ad n.
Il valore della v.a. X associata è pari al numero sulla pallina estratta.
Dunque la funzione di probabilità della v.a. XUd(n) è del tipo
1

P( X  x)   n


per x  1,2,..., n
0
altrove





definita nello spazio campione   1,2,..., n.
La funzione di ripartizione di questa v.a. è una funzione a gradini di altezza
1
per 1  x  n , ossia
n

k
F ( x)  
n

x 1


per k  x  k  1 k  1,2,..., n  1

1 per x  n

0
per
Si ottiene per valor medio (coincide con la mediana), varianza, asimmetria e curtosi :
n 1
2
n2 1
Var ( X ) 
12
Asym( X )  0
Kurt ( X )  1.8
E( X ) 
VARIABILE ALEATORIA DI BERNOULLI
Si tratta di una variabile dicotomica (binaria) che assume valore 0 o 1 con probabilità 1-p
e p. p è la probabilità del successo e q=1-p quella dell’insuccesso.
La funzione di probabilità (probabilità di successo in una sola prova) della XBer(p) è
P( X  x)  p x (1  p)1 x
E’ caso particolare per n=1 della v.a. binomiale (vedi sotto).
Vale
E ( X )   xi pi  1  p  0  (1  p)  p
Var ( X )  E ( X 2 )  [ E ( X )] 2   pi xi2  p 2  p  p 2  p(1  p)
1 2 p
Asym( X ) 
p(1  p)
2
3p  3p 1
Kurt ( X ) 
p(1  p)
Questo modello si trova ovunque si sia interessati ad accertare se un evento E si verifica
oppure no: funziona/non funziona, vivo/morto, ecc.
VARIABILE ALEATORIA BINOMIALE
La v.a. binomiale è generata da n eventi omogenei ed indipendenti di tipo bernoulliano,
ciascuno dei quali ha probabilità p di accadere e probabilità q=1-p di non accadere.
E’ quindi utilizzabile in tutti i casi in cui gli esiti di una prova sono sostanzialmente due
(successo/insuccesso).
Un esempio di applicazione è il controllo di qualità.
Se la probabilità del singolo evento è p, la probabilità che accadano tutti gli n eventi è pn, e
la probabilità che gli n eventi non accadano è (1-p)n.
Per calcolare le probabilità che questa v.a. assuma i valori x=0,1,2,3…,n dobbiamo
considerare ogni volta il numero di modi in cui x oggetti si possono prendere da n, ossia il
numero di combinazioni di n oggetti ad x ad x:
n
n!
  =
 x  x!(n  x)!
La v.a. binomiale XBin(n,p) ha funzione di distribuzione
n
n!
P( X  x)    p x (1  p) x 
p x (1  p) n  x
x
x
!
(
n

x
)!
 
La distribuzione cumulativa è
k
 n
P( X  k )     p x (1  p) n  x
x 0  x 
con k=np .
Esplicitamente, al fenomeno “numero di successi in n prove indipendenti” si associa la
distribuzione di probabilità
 xi

p
 i

0
qn
1
 n  n 1
  pq
1
2
 n  2 n2
  p q
 2
.... n.
...
pn
Di fatto questa distribuzione è la somma di n v.a. bernoulliane: quindi valor medio e
varianza di questa distribuzione sono
E ( X )  E ( X 1  X 2  ...  X n )  p  p  ...  p  np
Var ( X )  Var( X 1  X 2  ....  X n )  p(1  p)  p(1  p)  ...  p(1  p)  np(1  p)
Asimmetria e curtosi valgono
Asym( X ) 
1 2 p
np(1  p)
Kurt ( X )  3 
1 6 p  6 p2
np(1  p)
Il grafico della funzione varia al variare di p: è simmetrico per p=0.5, asimmetrico negativo
per p<0.5, asimmetrico positivo per p>0.5 .
LA VARIABILE ALEATORIA IPERGEOMETRICA
Partiamo da una popolazione finita di N elementi , di cui r elementi di un tipo e N-r
elementi di un altro tipo.
La probabilità p di trovare per estrazione senza sostituzione un elemento del primo tipo è
p
r
N
e la probabilità 1-p sarà
1 p 
N r
N
Chiamiamo v.a. ipergeometrica XH(N,n,p) la probabilità di estrarre x elementi del primo
tipo da un campione di numerosità n estratto dalla popolazione di ampiezza N:
 r  N  r 
 

x  n  x 

P( X  x) 
N
 
n
per max(0,n-N+r)  x  min(n,r)
Questa v.a. si utilizza quando si seleziona un campione di n elementi da un lotto di n, di
cui r sono diversi dagli n: x generalmente rappresenta il numero di elementi “non conformi”
nel campione.
Si dimostra facilmente che per N>10n ed n piccolo, questa distribuzione si approssima
alla binomiale.
Valor medio e varianza valgono:
E( X ) 
Var ( X ) 
nr
 np
N
nr N  r N  n
N n
 np(1  p)
n N N 1
N 1
Asimmetria e curtosi hanno espressioni complesse.
LA VARIABILE ALEATORIA GEOMETRICA
Data una successione di prove indipendenti con probabilità p che si verifichi un certo
evento, la v.a. geometrica XGeo(p) rappresenta il numero di sottoprove necessarie per
ottenere l’evento la prima volta:
P( X  x)  p(1  p) x 1
per x= 1,2,…,n
Valor medio e varianza sono
E( X ) 
1
p
Var ( X ) 
1 p
.
p2
VARIABILE ALEATORIA DI POISSON
E’ una variabile di fondamentale importanza per determinare il numero di volte in cui un
evento casuale si verifica in un dato intervallo di tempo (o spazio). Si dice degli eventi rari
perché è adatta a descrivere i fenomeni in cui, su un grande numero di prove in cui la
probabilità di successo è piccola, si verificano mediamente  successi.
Questa distribuzione si indica come XPo() ed è il limite della distribuzione binomiale per
np= e n   .
In effetti se p è molto piccolo, il numero medio di eventi sarà molto più piccolo di n, quindi il
numero di successi x sarà estremamente più piccolo di n.
Poniamo np= :
x
x!
(1  p)  / p 
x
(1  p) 
x!
1/ p 
Ma si sa che

lim (1  p)1 / p


 exp(  )
p0
quindi
n
x
P( X  x)  lim   p x (1  p) n  x  exp(  )
x!
 x
n
p0
lim n
 
x
P( X  x)  n     p x (1  p) n  x  exp(  )
x!
p  0  x
Valor medio, varianza, asimmetria e curtosi sono rispettivamente:
E( X )  
Var ( X )  
Asym( X ) 
1

Kurt ( X )  3 
1

Va sottolineato che il grafico non è simmetrico, e l’asimmetria è positiva. Diventa più
simmetrico al crescere di  .
Funzione di distribuzione
Funzione di ripartizione
Scarica