Diapositiva 1 - Comune di Civitanova Marche

Prof.ssa
Nadia Cococcioni

Variabili casuali discrete

Distribuzione di probabilità di una variabile casuale discreta

Funzione di ripartizione di una variabile casuale discreta

Caratteristiche numeriche di una variabile casuale discreta

La distribuzione binomiale o di Bernoulli

La distribuzione di Poisson

La disuguaglianza di Bienayme-Cebicev

Variabili casuali continue

La funzione di densità di una variabile casuale continua

Funzione di ripartizione di una variabile casuale continua

Caratteristiche numeriche di una variabile casuale continua

Distribuzione normale o gaussiana

Distribuzione normale standardizzata
Un concetto fondamentale della teoria della probabilità
è quello di variabile aleatoria o casuale .
Si chiama variabile casuale una grandezza X
variabile in un insieme numerico tale che ad ogni
modalità xi , che essa assume, è associata la
probabilità pi che essa si verifichi .
Una variabile si dice discreta se può assumere
un numero finito o un’infinità numerabile di
valori, si dice invece continua se può assumere
gli infiniti valori di un intervallo .
M
Consideriamo le famiglie
che hanno tre figli .
La composizione di
tali famiglie, rispetto al
sesso dei
figli, può
essere rappresentata
con un diagramma ad
albero .
M
F
M
M
F
F
M
M
I casi possibili sono otto :
MMM MMF MFM MFF
FMM FMF FFM FFF
F
F
M
F
F
Prendiamo in considerazione il numero delle figlie femmine
in una famiglia con tre figli e vediamo come è possibile
elaborare un modello matematico per studiare la situazione.
Notiamo che il numero delle figlie femmine può assumere
quattro valori numerici legati ciascuno ad un valore di
probabilità secondo la seguente tabella :
N° figlie
0
1
2
3
probabilità
1\8
3\8
3\8
1\8
Questa tabella, che associa a tutti i possibili esiti del
fenomeno la relativa probabilità, è un esempio di come si
rappresenta la variabile aleatoria “Numero delle figlie
femmine in una famiglia con tre figli” .
Si chiama distribuzione di probabilità di una variabile
casuale discreta ogni relazione che stabilisce una
corrispondenza tra i valori della variabile e le probabilità ad
essi associate .
X
xi
x2
…
xi
…
xn
P(X)
pi
p2
… pi
...
pn
Nella definizione di variabile casuale
la
somma
delle probabilità è 1 in quanto vengono presi in
considerazione tutti i possibili esiti dell’evento, la cui
unione dà l’insieme universo .
La legge di distribuzione di una variabile casuale
discreta può essere rappresentata graficamente con un
diagramma a barre.
Rappresentare graficamente la variabile aleatoria X con la
seguente distribuzione di probabilità:
X
1
P(X) 0.1
1
0,9
0,8
0,7
0,6
Probabilità 0,5
0,4
0,3
0,2
0,1
0
1
2
2
3
4
5
0.2
0.2
0.3
0.2
3
Variabile casuale
4
5
Spesso nello studio di un fenomeno si è interessati alla
ricerca della probabilità in un dato intervallo .
Per esempio in un controllo di qualità che un azienda
effettua sulla propria produzione si può considerare
accettabile un numero di pezzi difettosi compreso in un
intervallo assegnato piuttosto che fissare il numero esatto
di pezzi difettosi .
Per questo si studia un’importante funzione associata ad
una variabile aleatoria: la funzione di ripartizione .
Si chiama funzione di ripartizione di probabilità della
variabile aleatoria X la funzione F(x) che fornisce la
probabilità che X non assuma un valore superiore a un
valore fissato x:
F(x) = P(X
 x)
Dalla definizione segue che il valore di F(x) si ottiene
sommando i valori di probabilità per X  xi .
X
x1
P(x)
p1
F(x)
p1
x3
…...
xn
p2
p3
…...
pn
p1  p2
p1  p2  p3
…..
1
x2
Rappresentiamo graficamente una funzione di ripartizione:
F ( xn )
F ( x2 )
La funzione di
ripartizione è una
funzione a gradini
definita su tutto
l’asse dei reali
tale che:
F ( x1 )
F(x) = 0 per
F ( x3 )
x1
x2
x3
xn
F(x) = 1
x  x1
per x  xn
Come abbiamo già detto, nel risolvere problemi
pratici relativi a variabili aleatorie è necessario
calcolare la probabilità che una variabile assuma
un valore compreso in un intervallo ( a, b ) .
Per la definizione data della funzione di ripartizione,
supposto che l’estremo destro dell’intervallo gli
appartenga e quello sinistro no , risulta :
P(a < X  b) = P(X  b) - P( X  a) = F(b) - F (a)
Possiamo dedurre, quindi ,che:
La probabilità che la variabile aleatoria
appartenga a un dato intervallo è uguale
all’incremento della funzione di ripartizione in
questo intervallo .
La seguente variabile aleatoria con relativa funzione di ripartizione
descrive i voti di una verifica di matematica in una classe .
X
3
4
5
6
7
8
P(X)
0,04
0,06
0,15
0,47
0,18
0,07
F(x)
0,04
0,1
0,25
0,72
0,9
9
0,03
0,97
1
L’insegnante è interessato a valutare :
a) la percentuale di alunni insufficienti;
b) la percentuale di alunni con voto compreso fra 6 e 7;
c) la percentuale di alunni con voto maggiore di 7 .
Le risposte sono :
a)
P( X  5)  F (5)  0,25
b) P(6  X  7)  F (7)  F (6)  P(6)  0,90  0.72  0,47  0,65
c) P( X  7)  1  F (7)  0,10
Per descrivere in modo sintetico una variabile aleatoria
è sufficiente indicare alcuni parametri numerici che la
caratterizzano .
Un valore medio intorno al quale si raggruppano i valori della
variabile, un numero che caratterizza la dispersione di questi
valori intorno al valore medio sono valori sintetici della
distribuzione che ne forniscono un’immagine riassuntiva .
Data la variabile aleatoria X :
X
P(X)
x1
p1
x2
p2
….
….
xi
pi
….
….
xn
pn
Si chiama media o speranza matematica della variabile X la
somma dei prodotti dei valori della variabile per le rispettive
probabilità:
n
M ( X )   xi pi
i 1
La varianza è la caratteristica numerica della dispersione, cioè
della deviazione dei valori della variabile casuale rispetto al
valore medio .
Si definisce varianza della variabile X la mediadel quadrato della
differenza tra la variabile X e la sua speranza matematica :
n
V ( X )   ( xi  mx ) 2 pi
i 1
Per il calcolo della varianza esiste una formula alternativa più utile :
V ( X )  M ( X 2 )  M ( X )
2
Si chiama scarto quadratico medio della variabile X la
radice quadrata della varianza :
  V (X )
Le probabilità associate ai valori che può assumere una
variabile casuale X costituiscono la distribuzione di X e vengono
elencati in una tabella , ma a volte è anche possibile formulare
una legge matematica che, al variare dei valori di X, determini i
relativi valori di probabilità .
Immaginiamo di ripetere più volte e nelle stesse condizioni una certa
prova in modo indipendente . Ogni prova può condurre ad un evento
casuale A ( detto successo ) oppure all’evento contrario A ( detto
insuccesso ) , Sia p la probabilità che l’evento A si verifichi e q=1-p la
probabilità dell’evento contrario, allora :
La probabilità che su n prove indipendenti,
l’evento A di probabilità p, si presenti x
volte è data dalla funzione di probabilità :
 n
f ( x)  P( X  x)    p x q n x
 x
La distribuzione di probabilità legata ad un problema delle prove
ripetute è detta distribuzione binomiale ( di ordine n e parametro p )
perché per x=0, 1,2, 3, … , n corrisponde ai successivi termini dello
sviluppo binomiale :
 n  n 1
 n  n2 2
 n  n 1
n
n
qp  p n1
(q  p)  q   q p   q p  ....  
1 
 2
 n  1
Questa distribuzione è anche detta bernoulliana in onore di J. Bernoulli che
la scoprì alla fine del XVIII secolo .
Se X è una variabile aleatoria bernoulliana
di ordine n e parametro p :
 il suo valore medio è dato da : M(X)=np ;
 la sua varianza è data da : V(X)=npq ;
 il suo scarto quadratico medio è dato da :
  npq  np(1  p)
Un’urna contiene 4 palline rosse e 6 palline verdi, siano p
e q le probabilità di estrarre dall’urna rispettivamente una
pallina rossa e una pallina verde . Si eseguono 4
estrazioni, riponendo ogni volta la pallina estratta
nell’urna .Si determini la distribuzione di probabilità della
variabile casuale X “ numero delle palline rosse estratte “,
il valore medio e la varianza . Si calcoli inoltre :
a. la probabilità che vengano estratte esattamente due
palline rosse
b. la probabilità che vengano estratte almeno due
palline rosse
c. La probabilità che il numero delle palline rosse
estratte sia compreso tra uno e tre .
X
0
1
2
P(X=x)
0,1296
0,3456
0,3456
M(X ) = 1,6
3
4
0,1536 0,0256
V(X) = 0,96
a. P(X=2) = 0,3456
b. P(X  2) = 0,3456 + 0,1536 + 0,0256
c. P(1 X 3) = 0,356 + 0,356 + 0,1536
Quando in una distribuzione bernoulliana il numero n delle prove
ripetute assume un valore molto alto e la probabilità p del successo
assume un valore molto piccolo , cioè se la probabilità dell’evento A
è vicina a 0 e n   , la distribuzione di Bernoulli può essere
approssimata da un’altra distribuzione che prende il nome di
distribuzione di Poisson ( dal nome del matematico che la costruì
nel 1837).
Nella distribuzione di Poisson la variabile aleatoria X assume i
valori 0, 1, 2 ... e la funzione di probabilità di X è :
f ( x)  P( X  x) 
 xe 
x!
dove  è una costante positiva che rappresenta il parametro
della distribuzione . Nel caso in cui questa distribuzione
approssima quella bernoulliana  è data dalla media np .
Si dimostra che il valore medio e la varianza di una variabile X
che ha una distribuzione di Poisson hanno lo stesso valore ed è :
M (X )  V (X )  
La distribuzione di Poisson descrive molti fenomeni naturali come
il numero di chiamate telefoniche che arrivano ad un centralino in
un certo intervallo di tempo, il numero di particelle radioattive
emesse da una sostanza nell’unità di tempo, il numero di utenti
che arrivano allo sportello di un ufficio in un’ora . . .
Il parametro  in questi casi rappresenta il numero
medio di volte che il fenomeno si verifica nell’intervallo di
tempo che prendiamo in considerazione .
In un ufficio postale transitano , per un certo sportello,
mediamente 90 persone ogni ora .
Se l’operatore si deve allontanare per 5 minuti, qual è
la probabilità che non arrivi nessuno in quei 5 minuti ?
Qual è la probabilità che arrivino 3 persone ?
= ( 90 : 60 ) x 5 = 7,5
(7,5) 0 7,5
p( X  0) 
e  5,5 104
0!
(7,5)3 7 ,5
p( X  3) 
e  0,04
3!
Fin qui abbiamo visto che, nota la distribuzione di probabilità di una
variabile casuale, è possibile determinare i due valori che la
caratterizzano: la media e la varianza . Ma spesso capita nelle
ricerche sperimentali di conoscere il valore medio e la varianza di
una variabile senza conoscere la sua distribuzione .
La disuguaglianza di Bienayme-Cebicev mette in relazione tra di
loro gli indicatori caratteristici di una distribuzione , la media e lo
scarto quadratico medio , offrendo la possibilità di avere infornazioni
sui valori di probabilità .
Per ogni variabile aleatoria X, di media e
scarto quadratico medio 
, fissato un
opportuno valore positivo K, vale la seguente
relazione :
p( X    k ) 
2
k2
La probabilità che la variabile aleatoria X
assuma valori al di fuori dell’intervallo
  k;   k  non supera il rapporto tra la
varianza e il valore di k elevato al quadrato .
Nella realtà è molto frequente lo studio di quei caratteri , che
possono assumere tutti i valori in un certo intervallo, come il peso o
l’altezza di un gruppo di individui, il tempo, la distanza e, in
generale, tutte quelle grandezze che possono essere misurate .
Sono questi caratteri continui per i quali non è possibile, nè
tantomeno interessante, trattare le modalità singolarmente :
occorre raggruppare per classi i dati di cui si dispone .
Consideriamo la tabella delle frequenze assolute e relative
delle stature di un campione di 200 individui
NUMERO
CLASSI
LIMITI
CLASSI
VALORI
CENTRALI
FREQUENZA
ASSOLUTA
FREQUENZA
RELATIVA
1
150 - 154
152
2
0,010
2
154 . 158
156
7
0,035
3
158 - 162
160
22
0,110
4
162 - 166
164
13
0,065
5
166 - 170
168
44
0,220
6
170 - 174
172
36
0,180
7
174 - 178
176
32
0,160
8
178 - 182
180
13
0,065
9
182 . 186
184
21
0,105
10
186 - 190
188
10
0,050
Tracciamo l’istogramma delle frequenze relative
0,06
0,05
0,04
0,03
0,02
0,01
0
150- 154- 158- 162- 166- 170- 174- 178- 182- 186154 158 162 166 170 174 178 182 186 190
Nell’istogramma l’area di ciascun rettangolo rappresenta la frequenza relativa
della classe, la probabilità che un elemento appartenga ad una classe .
Ciascun valore riportato sull’asse y dell’istogramma rappresenta il rapporto
tra la frequenza relativa degli individui che appartengono alla classe e
l’ampiezza della classe stessa . Tali valori rappresentano la DENSITA’ DI
FREQUENZA RELATIVA .
Consideriamo una variabile casuale discreta che assuma i valori
centrali delle classi con la seguente distribuzione di probabilità :
X
P(X)
152
156
0,010 0,035
160
164
168
0,110 0,065
172
176
180
184
188
0,220 0,180
0,160
0,065
0,105
0,050
Tracciamo la poligonale che unisce i punti aventi come ascissa i
valori centrali delle classi e come ordinata la densità di probabilità
delle varie classi .
densità di probabilità
0,06
0,05
0,04
0,03
0,02
0,01
0
152 156 160 164 168 172 176 180 184 188
variabile casuale
Al crescere del numero delle classi, la loro ampiezza diminuisce
fino a tendere ad un punto . In questo modo la variabile casuale
discreta tende ad assumere tutti i valori del dominio e può essere
considerata una variabile casuale continua .
DENSITA' DI PROBABILITA'
La poligonale può essere approssimata da una curva che
rappresenta la FUNZIONE DI DENSITA’ DI PROBABILITA’ della
variabile casuale continua .
0,06
0,05
0,04
0,03
0,02
0,01
0
150
155
160
165
170
STATURA
175
180
185
190
Nel caso della variabile casuale continua la probabilità corrispondente
ad un particolare valore assunto dalla variabile stessa è ovviamente
uguale a zero. Questo fatto si può intuire pensando che si ha il rapporto
fra un caso favorevole ed infiniti casi possibili .
E’ possibile però determinare la probabilità che questo valore particolare
cada in un intervallo (a,b) . Se teniamo presente che nell’istogramma
delle frequenze relative la probabilità che un valore della popolazione
cada in una classe è data dall’area del rettangolo costruito su di essa,
per la variabile casuale continua la probabilità
P ( a<X<b ) è data
dall’area del trapezoide delimitato dalla curva di densità, dall’asse x e
dalle rette x=a e x=b , quindi dal valore dell’integrale definito tra a e b
della funzione di densità della variabile :
b
P(a  X  b)   f ( x)dx
a
Da quanto detto si deduce che la funzione di densità di una
variabile casuale continua deve soddisfare a due condizioni :
1) è definita e non negativa per ogni valore reale della
variabile indipendente .

2)
 f ( x)dx  1

Data una variabile casuale continua X con funzione di densità f(x) si
definisce funzione di ripartizione :
x
F ( x) 
 f ( x)dx

Segue dalla definizione che la funzione di ripartizione esprime per
ogni valore di x la probabilità che la variabile assuma un valore
minore o uguale a x .
La probabilità che la variabile X assume un valore appartenente
all’intervallo (a,b) è uguale all’incremento della funzione di
ripartizione in tale intervallo :
b
P(a  X  b)   f ( x)dx 
a
b
a


 f ( x)dx   f ( x)dx  F (b)  F (a)
Possiamo osservare che la funzione di densità di probabilità f(x) e
la funzione di ripartizione corrispondente F(x) sono legate dalla
relazione :
F’(x) = f(x)
Per quanto riguarda il grafico della funzione di ripartizione di
una variabile casuale continua, essa è una funzione non
decrescente con :
lim F ( x )  1
lim F ( x)  0
x  
x  
0

F ( X )  ( x  2) 2
1

per x<2
per 2  x  3
per x>3
1,2
1
F(X)
0,8
0,6
0,4
0,2
0
0
1
2
3
X
4
5
6
Si chiama valore medio della variabile casuale continua X
l’espressione :

M (X ) 
 xf ( x)dx

Si chiama varianza di una variabile casuale X la media
dei quadrati degli scarti fra i valori della variabile e il suo
valore medio :

V (X ) 
2


x

M
(
X
)
f ( x)dx


oppure
V ( X )  M ( X 2 )  M ( X )
2
Si chiama moda il valore della variabile casuale
continua X per il quale la sua funzione di densità di
probabilità assume il valore massimo .
Si chiama mediana della variabile casuale continua X il
numero m che soddisfa la relazione :

m


f ( x)dx 

m
f ( x)dx 
1
2
La distribuzione casuale continua legata ai più importanti fenomeni
fisici, biologici o economici è la distribuzione normale o gaussiana che
ha funzione di densità :
2

1
f ( x) 
e
 2
( x )
2 2
Tale funzione è definita in R e dipende dai parametri  e  che
rappresentano la deviazione standard e la media della variabile
casuale . La curva che la rappresenta è asintotica all’asse x,
possiede un massimo per x   , due flessi per x     .
0,6
0,5
f(x)
0,4
0,3
0,2
0,1
0
0
1
2
3
x
4
5
Una distribuzione normale che ha valore medio  = 0 e scarto
quadratico medio  = 1 prende il nome di distribuzione normale
standardizzata . L’equazione della sua funzione di densità di
probabilità è :
f ( z) 
1
e
2

z2
2
avendo indicato con z la variabile normale standardizzata .
Il grafico della curva normale standardizzata è il seguente :
f(z)
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-4
-2
0
z
2
4
E’ possibile ottenere l’equazione della funzione di densità della
variabile normale standardizzata trasformando la funzione di densità
della corrispondente variabile non standardizzata, di media  e
scarto quadratico  , con un’affinità di equazioni :
x

x
'





 y '  y
Quindi è possibile passare dalla variabile aleatoria X, che ha come
media  e come scarto quadratico medio  , alla corrispondente
variabile standardizzata Z, che ha valore medio 0 e scarto
quadratico medio 1, con la formula :
Z
X 

Per la curva normale standardizzata i valori dell’area delle regioni
comprese tra la curva, l’asse x e le rette di equazione x=a e x=b ,
corrispondenti alla probabilità che la variabile standardizzata
assuma valori compresi nell’intervallo (a,b) , sono stati calcolati e
riportati in apposite tavole .
Con l’introduzione della distribuzione normale standardizzata , ogni
calcolo relativo alla probabilità di variabili aleatorie continue può
essere ricondotto al calcolo della probabilità della corrispondente
variabile standardizzata .
Infatti, tenendo conto che in una trasformazione affine il rapporto fra le
aree delle superfici corrispondenti è uguale al rapporto di affinità che
nel nostro caso è uguale a 1, si ha : P( x1  X  x2 )  P( z1  Z  z2 )
Sappiamo che il diametro effettivo delle sfere di acciaio
prodotte da una ditta può essere considerato una
variabile normale di media 5,1 cm e scarto quadratico
medio 0,08 . Calcola la probabilità che il diametro di una
sfera scelta a caso sia compreso tra 4,98 e 5,15 cm .
z1 
4,98  5,1
 1,5
0,08
z2 
5,15  5,1
 0,625
0,08
P(4,98  d  5,15)  P(1,5  z  0,63)  0,4332  0,2357  0,6689  67%