Capitolo 5 Distribuzioni di probabilità

annuncio pubblicitario
Capitolo 5
Distribuzioni di probabilità
5.1 Variabili aleatorie
Dopo esserci occupati di calcolo delle probabilità procediamo all’introduzione di un’ulteriore
tipologia di variabile: la cosiddetta variabile aleatoria. Si tratta di un concetto di importanza
notevole in diverse applicazioni. Per comprendere cos’è una variabile aleatoria prendiamo in
considerazione la situazione concreta in cui si effettua il lancio di due dadi. Nella fattispecie
indichiamo con la lettera X la somma dei due valori che emergono dal lancio dei dadi. È evidente
che X può prendere i valori: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12. La X considerata nell’esperimento è un
esempio di variabile aleatoria. Dal punto di vista intuitivo possiamo dire che una variabile aleatoria
è una grandezza che assume i valori ottenuti da un esperimento aleatorio. Alla luce di ciò possiamo
indicare come ulteriore esempio di variabile aleatoria la grandezza C che rappresenta il numero di
“croce” che si presentano a seguito del lancio di 200 monete. Una variabile aleatoria può anche
essere pensata come una funzione. Nel caso visto in precedenza la variabile X può essere intesa
come la funzione che associa a ogni possibile risultato del lancio di due dati la somma dei valori
ottenuti. Detto ciò è possibile dare una definizione più rigorosa di variabile aleatoria.
Definizione 5.1.1
Si dice variabile aleatoria ( o variabile casuale) una funzione che associa a ogni possibile risultato
di un esperimento aleatorio (evento contenuto nello spazio campionario dell’evento) un numero
reale.
In altri termini, se  è lo spazio campionario di un esperimento aleatorio e X è una variabile
aleatoria relativa all’esperimento, è possibile vedere X come funzione che va da  in R.
Esempio 5.1.1
Consideriamo l’esperimento nell’ambito del quale si effettua il lancio di 3 monete. In tal caso
indichiamo con la X il numero di “croce” che si ottiene.
Nella fattispecie
  CCC, CCT , CTC, CTT , TCC, TCT , TTC, TTT  e i valori che la variabile prende vanno dallo 0 al
3.
Precisiamo che è possibile prendere in considerazione l'evento "X assume il valore xi" , dove i è un
numero intero compreso tra 1 ed n e calcolarne la probabilità che coincide con la somma delle
probabilità degli eventi elementari la cui immagine tramite X è uguale a xi.
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
Esempio 5.1.2
Consideriamo l’esperimento la variabile aleatoria X che indica il numero di "croce" uscite a seguito
del lancio di 3 monete. Stabiliamo la probabilità degli eventi
X = 0, X = 1, X = 2, X = 3.
•
la probabilità che sia X = 0 coincide con la probabilità dell'evento elementare TTT che è
1
pari a
8
•
la probabilità che sia X = 1 coincide con la somma delle probabilità degli eventi elementari
3
CTT, TCT e CCT che è uguale a
8
•
la probabilità che sia X = 2 coincide con la somma delle probabilità degli eventi elementari
3
CCT, CTC e TCC che è uguale a
8
•
la probabilità che sia X = 3 coincide con la somma delle probabilità dell’evento elementare
1
CCC che è uguale a
8
In definitiva:
p ( X  0) 
1
3
3
1
, p( X  1)  , p ( X  2)  e p( X  3)  .
8
8
8
8
5.2 Distribuzioni di probabilità di variabili aleatorie discrete
Partendo dal presupposto che la X sia una variabile aleatoria discreta che prende i valori x1 , x2 , …,
xn si può associare a ciascuno degli eventi X = x1 , X = x2 , …, X = xn la probabilità corrispondente.
Questa costruzione si definisce come segue:
Definizione 5.2.1
Si dice distribuzione di probabilità (o densità) di una variabile aleatoria X discreta la funzione che
associa ad ogni valore xi che la variabile aleatoria assume la rispettiva probabilità pi .
Si precisa che la distribuzione di probabilità di una variabile aleatoria discreta si presenta facendo
uso di una tabella come quella sottostante.
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
xi
p ( X  xi )
x1
p( X  x1 )
…
…
x2
p( X  x2 )
xn
p( X  x n )
Si osserva che gli eventi X = x1 , X = x2 , …, X = xn sono disgiunti e che la loro unione coincide con
l’intero spazio campionario  . Segue immediatamente che p1  p2  ...  pn  1 .
Osservazione 5.2.1
Per poter parlare di distribuzione di probabilità (o densità) di una variabile aleatoria X discreta la
variabile deve assumere i valori x1, x2, …, xn al verificarsi degli eventi aleatori E1, E2, …, En
incompatibili e complementari, eventi a cui corrispondono, rispettivamente, le probabilità p1, p2,
…, pn. Si precisa che gli eventi E1, E2, …, En sono incompatibili se disgiunti (in simboli:
Ei  E j  0 i, j con 0  i, j  n e sono complementari se E1  E2  ...  En   .
Si precisa che la distribuzione di probabilità di una variabile aleatoria discreta si presenta facendo
uso di una tabella come quella sottostante.
Esempio 5.2.2
Costruiamo la distribuzione di probabilità della variabile aleatoria X di cui all’esempio 5.1.2. In
base a quanto stabilito precedentemente si ha che:
xi
0
1
8
p ( X  xi )
Come è facile verificare:
1
3
8
2
3
8
3
1
8
1 3 3 1
    1.
8 8 8 8
Esempio 5.2.3
Costruiamo la distribuzione di probabilità della variabile aleatoria X che assume i valori 1, 2, 3, 4,
5, 6 che corrispondono ai valori ottenuti lanciando un dado cubico regolare a 6 facce. Gli eventi
corrispondenti E1: “esce la faccia con 1”, E2: “esce la faccia con 2”, E3: “esce la faccia con 3”, E4:
“esce la faccia con 4”, E5: “esce la faccia con 5”, E6: “esce la faccia con 6” . Si ha che
xi
p ( X  xi )
e:
1
1
6
2
1
6
3
1
6
4
1
6
5
1
6
1 1 1 1 1 1
      1.
6 6 6 6 6 6
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
6
1
6
5.3 Media, varianza, scarto quadratico medio e scarto quadratico assoluto di una variabile
aleatoria discreta
Prima di introdurre i concetti in questione compiamo una breve digressione. Quanto fatto in questo
contesto presenta una notevole analogia con quanto si fa in ambito statistico. Anche in statistica
dopo avere introdotto una variabile statistica discreta X che assume i valori x1,x2, …,xn si introduce
la distribuzione di frequenze relative
xi
x1
fi
f1 
x2
m1
m
f2 
m2
m
…
…
xn
fn 
mn
m
dove mi è il numero di volte che la variabile X prende il valore xi (frequenza assoluta del dato xi
mi
è la frequenza relativa del dato xi e m  m1  m2  ...  mn . Successivamente si
m
definiscono gli indici media  , varianza  2 , scarto quadratico medio o deviazione standard  e
fi 
) ,
scarto assoluto medio  come segue:

x1m1  x2 m2  ...  xn mn
m
m
m
 x1 1  x2 2  ...  xn n  x1 f1  x2 f 2  ...  xn f n ,
m
m
m
m
 2  x1   2 f1  x2   2 f 2  ...  xn   2 f n ,
x1   2 f1  x2   2 f 2  ...  xn   2 f n

e
  x1   f1  x2   f 2  ...  xn   f n .
La varianza, lo scarto quadratico medio e lo scarto assoluto medio rendono conto di quanto in
media i valori assunti dalla variabile X si discostano dalla media.
Osservazione 5.3.1
È possibile operare sull’espressione algebrica che fornisce la varianza in modo tale da ottenere una
formula ridotta che può essere utilizzata in sostituzione a quella data precedentemente. Al fine di
ottenerla sviluppiamo la formula di cui sopra. Si ha che
 2  x1   2 f1  x2   2 f 2  ...  xn   2 f n 

 



 x1  2x1   2 f1  x2  2 x2    2 f 2  ...  xn  2xn    2 f n 
2
2
2
 x1 f1  x2 f 2  ...  xn f n  2 x1 f1  2 x2 f 2  ...  2xn f n   2 f1   2 f 2  ...   2 f n 
2
2
2


 x1 f1  x2 f 2  ...  xn f n  2 x1 f1  x2 f 2  ...  xn f n )   2 ( f1  f 2  ...  f n .
2
2
2
Ora
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
x1 f1  x2 f 2  ...  xn f n  
e f1  f 2  ...  f n 
m
m1 m2
1
1

 ...  n  m1  m2  ...  mn    m  1 .
m m
m m
m
Da cui segue che
 2  x12 f1  x2 2 f 2  ...  xn 2 f n  2 x1 f1  x2 f 2  ...  xn f n )   2 ( f1  f 2  ...  f n  
 2  x12 f1  x2 2 f 2  ...  xn 2 f n  2 2   2  x12 f1  x2 2 f 2  ...  xn 2 f n   2 che
è
la
formula
ridotta annunciata.
Per analogia con gli indici visti in ambito statistico introduciamo in questo contesto la media, la
varianza e lo scarto quadratico medio di una variabile aleatoria discreta come segue:
  E ( X )  x1 p1  x2 p2  ...  xn pn ,
 2  V ( X )  x1   2 p1  x2   2 p2  ...  xn   2 pn  x12 p1  x2 2 p2  ...  xn 2 pn   2 ,
  S(X ) 
x1   2 p1  x2   2 p2  ...  xn   2 pn
  S a ( X )  x1   p1  x2   p2  ...  xn   pn .
Dal punto di vista concreto la media di una variabile aleatoria discreta fornisce un valore che si
avvicina sempre di più alla media aritmetica dei valori assunti dalla variabile man mano che il
numero di prove aumenta. La varianza, lo scarto quadratico medio e lo scarto assoluto medio invece
indicano di quanto mediamente i valori della variabile aleatoria si discostano dalla media quando si
esegue un certo numero di prove.
Esempio 5.3.1
Calcoliamo la media, la varianza, lo scarto quadratico medio e lo scarto assoluto medio della
variabile aleatoria introdotta nell’esempio 5.1.2. Come ben sappiamo la sua distribuzione di
probabilità è:
xi
0
1
8
p ( X  xi )
1
3
8
2
3
8
Se si tiene conto delle definizioni date si ha che
1
8
3
8
3
8
1
8
  E( X )  0   1  2   3  
3
2
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
3
1
8
2
1
3
3
1 3
3
  V ( X )  0   12   2 2   3 2     
8
8
8
8 2
4
2
2
  S(X )  V (X ) 
  Sa ( X )  0 
3
 0,87
4
3 1
3 3
3 3
3 1 3
  1   2    3    .
2 8
2 8
2 8
2 8 4
5.4 Giochi equi
I concetti di variabile aleatoria e di valor medio della stessa ci consentono di fornire un modello
matematico che ha la funzione di stabilire se un gioco è equo o meno. Intanto va precisato che la
variabile aleatoria può essere vista come la funzione che esprime la quantità di denaro che un
giocatore deve pagare o incassare al verificarsi di uno specifico evento. In questo caso il valor
medio della variabile aleatoria esprime la somma di denaro che il giocatore tende ad incassare o a
pagare nell’ambito di un gioco di sorte all’aumentare del numero di giocate. Risulta quindi
evidente che:



il gioco è equo se il valor medio di X è 0
il gioco è favorevole se il valor medio di X è positivo
il gioco è sfavorevole se il valor medio di X è negativo.
Esempio 5.4.1
Un giocatore lancia un dado: se esce un numero dispari deve pagare 5 €, se esce 2 vince 6 €, se
esce 4 non perde nulla, se esce 6 vince 4 €. La distribuzione di probabilità della variabile X che
rappresenta la somma che deve incassare o versare è:
xi
-5
1
2
p ( X  xi )
6
1
6
0
1
6
4
1
6
Il suo valor medio è
1
2
1
6
1
6
  E ( X )  (5)   6   0   4 
1
 5 .
6
Ne consegue che il gioco risulta essere sfavorevole. Il giocatore all’aumentare del numero delle
giocate tende a perdere 5 €.
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
5.5 Variabile aleatoria con distribuzione uniforme
Una variabile discreta X con distribuzione uniforme si presenta come segue
xi
1
1
n
p ( X  xi )
…
…
2
1
n
n
1
n
Come è facile notare la definiamo distribuzione uniforme perché tutte le probabilità sono uguali. Si
1
vede facilmente che p1  p 2  ...  p n  n  1. Calcoliamo il valor medio della suddetta
n
1
1
1
1 1 n
1 1 n
n 
variabile. Si ha che   E ( X )  1   2   ...  n   1  2  ...  n  
.
n
n
n
n
2
n
2
Osservazione 5.5.1
Facciamo notare che la somma dei primi n numeri gode di una proprietà peculiare. La si può
scoprire disponendo i numeri dapprima in ordine crescente e successivamente in ordine decrescente
come segue:
1 2
… n-1 n (ordine crescente)
n n-1 … 2
1 (ordine decrescente)
Se si esegue la somma colonna per colonna si scopre che tutte le somme coincidono con il valore
n+1. In altri termini, il doppio della somma dei primi n numeri è pari ad n volte il numero n + 1.
1 n
 n , dove con Sn si indica la somma dei primi n numeri.
Segue che S n 
2
Per confermare tale risultato consideriamo la somma dei primi 10 numeri. Si ha che
1
2 3 4 5 6 7 8 9 10
10 9 8 7 6 5 4 3 2 1
da cui si evince che 2S10  (1  10)  10 e, quindi, che S10 
(1  10)
 10  55 .
2
Qui di seguito determineremo la varianza della variabile aleatoria in questione. Si ha che
1
1
1 1 n 
  x1 p1  x 2 p 2  ...  x n p n    1   2 2   ...  n 2   
 
n
n
n  2 
2
2
1
2
2
2

 2 2  ...  n 2 
2
2
2
n  12n  1   1  n   2n 2  3n  1  1  2n  n 2 
1 1 n 





n  2 
6
6
4
 2 
2
2
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
4n 2  6n  2  3  6n  3n 2 n 2  1
.

12
12
Osservazione 5.5.2
Si precisa che la somma dei primi n quadrati è uguale a
nn  12n  1
. Poniamo
6
S  12  2 2  3 2  ...  n 2 .Osserviamo che
S  12  2 2  3 2  ...  n 2  1  1  2  2  3  3  ...  n  n  1  2
 2  3

3
3  ...  n

....
n .

2 addendi
3 addendi
naddendi
I numeri in questione possono essere disposti come segue:
1+2+3+ …+ n
2+3+… + n
3+… + n
..
n
Ora completiamo la tabella come segue:
1+2+3+ …+ n
1+2+3+… + n
1+2+3+… + n
..
..
1+2+3+ …+ n
In ognuna delle n righe dell’ultima tabella è presente la somma dei primi n numeri naturali. Dal
n( n  1)
momento che la somma dei primi n numeri naturali è uguale a
segue che
2
nn  1 n 2 n  1
S  n

 1  (1  2)  (1  2  3)  ...  (1  2  3  ...  n  1)
2
2
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)

n 2 n  1 n 1 k (k  1) n 2 n  1 1  n 1 2 n 1  n 2 n  1 1  n 2
nn  1 


   k  k  
   k  n2 

2
2
2
2 1
2
2 1
2 
1
1

n 2 n  1 1
n2 n2 n
 S


2
2
2
4 4
. In definitiva:
S
1
n3 3 2 n
S
 n 
2
2 4
4
da cui segue che
3
2n 3  3n 2  n
2n 3  3n 2  n
e che S 
da cui, scomponendo il numeratore della frazione al II
S
2
2
6
n 1
n(n  1)2n  1
k ( k  1)
membro, si ottiene S 
. Precisiamo che con l’espressione 
s’intende
6
2
1
indicare la somma con k che va da 1 ad n dei
k k  1
k k  1
, dove
, non è niente altro che la
2
2
somma dei primi k numeri naturali.
5.6 Il problema delle prove ripetute e la variabile aleatoria con distribuzione binomiale
Nel ambito degli esperimenti aleatori risulta di notevole importanza il cosiddetto problema delle
prove ripetute. Si tratta dell’esperimento in cui si considera un evento E ripetibile nell’ambito del
quale si effettuano, nelle stesse condizioni ( in ogni prova effettuata non cambia la probabilità che
l’evento si verifichi), n prove. Ci poniamo l’obiettivo di determinare la probabilità che eseguendo n
prove l’evento E si verifichi k  n volte. A tal fine indichiamo con p la probabilità associata
all’evento E e con q = 1 – p la probabilità che si verifichi l’evento contrario ad E (o meglio, che non
si verifichi l’evento E). Qui di seguito faremo vedere che la probabilità che l’evento E si verifichi k
n
volte nel corso dell’esecuzione di n prove è p n ,k     p k  q n k . Osserviamo che perché l’evento
k 
E si presenti k volte su n prove è necessario che l’evento contrario E si presenti n – k volte. Per il
teorema della probabilità composta la probabilità che l’evento E si presenti k volte è pari a
p  p  p  ...  p  p k e la probabilità che l’evento contrario si presenti n – k volte è, per lo stesso



kvolte
teorema, pari a
q  q  q  ...  q  q n  k . Ora perché si verifichi l’evento E k volte nell’ambito di n

 

n  kvolte
prove si deve verificare l’evento intersezione (E si presenta k volte )  ( E si presenta n – k volte ).
Quindi, sempre per il teorema della probabilità composta, la probabilità che si verifichi l’evento
intersezione è pari a p k  q nk . Occorre, però, precisare che p k  q nk indica la probabilità che tale
evento si verifichi relativamente ad una particolare successione degli eventi E ed E . I due eventi si
n
n
possono, però, succedere il numero di volte richiesto in   modi diversi.   è, infatti, il numero
k 
k 
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
di combinazioni possibili di n oggetti distinti di classe k. Per il teorema della probabilità dell’unione
n
degli eventi si ha che p n ,k  p k  q n k  p k  q n k  ...  p k  q n k    p k  q n k .
  k 
n
 k  volte
 
Esempio 5.6.1
Si consideri un’urna nella quale sono contenute 15 palline (5 gialle e 10 blu). Intendiamo
determinare la probabilità che estraendo 7 palline, 5 siano gialle e 2 blu. Si precisa che dopo ogni
estrazione la pallina estratta viene riposta nell’urna, cosicché le estrazioni successive avvengano
nelle medesime condizioni. In questo caso specifico si ha: E: si estrae una pallina gialla, E
: si
2
1
estrae una pallina blu, n  7 , k  5 , p  , q  . In base a quanto discusso sopra la probabilità
3
3
che estraendo 7 palline 5 siano gialle e 2 siano blu è
7 5
 7  1   2 
22
p7,5        2520  7  0,03840877914951989026063100137174 . Qui di seguito
3
 5  3   3 
descriveremo la variabile aleatoria con distribuzione binomiale e forniremo il valor medio, la
varianza e lo scarto quadratico medio. Dato l’evento E come nel contesto descritto in precedenza
possiamo introdurre la variabile aleatoria X che indica il numero di volte in cui l’evento E si
presenta in n prove. La variabile X può prendere i valori che vanno da 1 ad n e la distribuzione di
probabilità si presenta come segue:
5
xi
p ( X  xi )
0
p n,0
1
p n ,1
…
…
n
p n,n
n
 n
n
, dove si ha che : p n, 0    p 0 q n q n , p n,1    p1q n 1 npq n 1 , p n , 2    p 2 q n  2 , … ,
0
1 
2
n
n
p n ,k    p k q n  k , … , p n ,n    p n q 0  p n . La somma delle probabilità è uguale ad 1, in quanto
k 
n
 n  n  n  n 1  n  2 n2
 n
 q    pq    p q  ...    p n   p  q n  1 . Calcoliamo ora il valor medio della
0
1 
2
 n
 n
 n
n
n
variabile aleatoria X. Si ha che M ( X )  0   q n  1    pq n 1  2    p 2 q n2  ...  n    p n 
0
1 
2
n
npq n 1  nn  1 p 2 q n  2  ...  n  p n  np  (q n 1  n  1 pq n  2  ...  p n 1 )  np  q  p 
n 1
quel che riguarda la varianza e lo scarto quadratico medio si ha che:
 2  n  p  q e che   n  p  q .
Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo)
 np . Per
Scarica