La probabilità del verificarsi di un esito di un
determinato esperimento è la percentuale di
volte che l’esito si verifica in una lunga serie
di ripetizioni dell’esperimento.
Consideriamo una variabile Y discreta che
possa assumere almeno due valori: la
distribuzione di probabilità di Y assegna ad
ogni valore di Y la probabilità che esso si
verifichi.
Ricordiamo che la probabilità di un evento è
un numero positivo minore di 1 e che la
somma delle probabilità di tutti i possibili
valori è 1.
Nel caso di variabili continue le distribuzioni
di probabilità assegnano valori a intervalli di
numeri. La probabilità che una variabile
continua assuma un valore appartenente ad un
determinato intervallo è un numero positivo
minore di 1.
La distribuzione nella popolazione di una
determinata variabile è la distribuzione della
probabilità della variabile.
Si può costruire un istogramma per
rappresentare la distribuzione di probabilità di
una variabile discreta.
La distribuzione di probabilità di una variabile
continua si rappresenta con un grafico e l’area
sotto la curva per un intervallo di valori della
variabile rappresenta la probabilità che la variabile assuma un valore in quell’intervallo.
0 ≤ P(y) ≤ 1,
∑ P(y) = 1
y
Esempio:
y
0
1
2
3
P(y)
.91
.06
.02
.01
In questo caso il rettangolo sopra un valore
della variabile ha l’altezza pari alla probabilità
di quel valore.
Istogramma
1
0,91
0,8
0,6
0,4
0,2
0,06
0,02
0,01
1
2
3
0
0
La media di una distribuzione di
probabilità di una variabile discreta Y è
data dalla formula
µ = ∑ y yP(y)
Nell’esempio
µ= 0 P(0)+1 P(1)+2 P(2)+3 P(3)=
=0(.91)+1(.06)+2(.02)+3(.01)=.13
La media si dice anche valore atteso e si
indica con E(Y).
1
Il nome riflette il fatto che la media è il
valore che uno si aspetta sia il valore
medio su una lunga serie di osservazioni.
Ricordiamo che la deviazione standard
misura la variabilità.
Varianza
N
σ2 =
Esempio: Distribuzione di probabilità del
numero di episodi di otite media nei primi 2
anni di vita
x
0
1
2
3
4
5
6
P(‘X=x’) .129 .264 .271 .185 .095 .039 .017
E(X)=0(.129)+1(.264)+2(.271)+3(.185)+
+4(.095)+5(.039)+6(.017)=2.038
Funzione di distribuzione cumulativa
La funzione di distribuzione cumulativa
(c.d.f.) di una variabile aleatoria è indicata
con F(X ) ed è definita da
i
− x)2
i=1
N −1
Deviazione standard
N
σ=
Valore atteso di una variabile
aleatoria discreta
∑ (x
∑ (x
i
− x)2
i=1
N −1
Varianza di una variabile aleatoria
discreta
∑ (y − µ)2P(y) =
= ⎡⎣ ∑ y2P(y)⎤⎦ − µ2
σ2 =
Supponiamo che Y=1 con probabilità .5,e Y=0
con probabilità .5. Calcolare σ2.
Distribuzione di probabilità continua
Si riferisce a una variabile aleatoria continua
definita su un sottoinsieme S di R:
F(x ) = P(‘X ≤ x’)
Esempio
F(x) = 0
se x < 0
F(x) = .129
se 0 ≤ x < 1
F(x) = .393
se 1 ≤ x < 2
F(x) = .664
…………..
se 2 ≤ x < 3
…………….
P(X∈A) = area sotto il grafico di f di base A
2
Una variabile continua descritta da un
grafico a campana si dice avere una
distribuzione normale di probabilità e
si chiama variabile normale.
La distribuzione normale ha un grafico
simmetrico, a forma di campana caratterizzato
dalla sua media e dalla deviazione standard. Per
essere più precisi una variabile è normale se la
formula della sua distribuzione di probabilità è
la seguente:
Distribuzione normale: formula
f (x) =
1
σ 2π
2
− (x−x)
e 2σ 2
µ indica la media della popolazione
σ indica la deviazione standard della
popolazione
Distribuzione normale: µ=3, σ=1
3