La probabilità del verificarsi di un esito di un determinato esperimento è la percentuale di volte che l’esito si verifica in una lunga serie di ripetizioni dell’esperimento. Consideriamo una variabile Y discreta che possa assumere almeno due valori: la distribuzione di probabilità di Y assegna ad ogni valore di Y la probabilità che esso si verifichi. Ricordiamo che la probabilità di un evento è un numero positivo minore di 1 e che la somma delle probabilità di tutti i possibili valori è 1. Nel caso di variabili continue le distribuzioni di probabilità assegnano valori a intervalli di numeri. La probabilità che una variabile continua assuma un valore appartenente ad un determinato intervallo è un numero positivo minore di 1. La distribuzione nella popolazione di una determinata variabile è la distribuzione della probabilità della variabile. Si può costruire un istogramma per rappresentare la distribuzione di probabilità di una variabile discreta. La distribuzione di probabilità di una variabile continua si rappresenta con un grafico e l’area sotto la curva per un intervallo di valori della variabile rappresenta la probabilità che la variabile assuma un valore in quell’intervallo. 0 ≤ P(y) ≤ 1, ∑ P(y) = 1 y Esempio: y 0 1 2 3 P(y) .91 .06 .02 .01 In questo caso il rettangolo sopra un valore della variabile ha l’altezza pari alla probabilità di quel valore. Istogramma 1 0,91 0,8 0,6 0,4 0,2 0,06 0,02 0,01 1 2 3 0 0 La media di una distribuzione di probabilità di una variabile discreta Y è data dalla formula µ = ∑ y yP(y) Nell’esempio µ= 0 P(0)+1 P(1)+2 P(2)+3 P(3)= =0(.91)+1(.06)+2(.02)+3(.01)=.13 La media si dice anche valore atteso e si indica con E(Y). 1 Il nome riflette il fatto che la media è il valore che uno si aspetta sia il valore medio su una lunga serie di osservazioni. Ricordiamo che la deviazione standard misura la variabilità. Varianza N σ2 = Esempio: Distribuzione di probabilità del numero di episodi di otite media nei primi 2 anni di vita x 0 1 2 3 4 5 6 P(‘X=x’) .129 .264 .271 .185 .095 .039 .017 E(X)=0(.129)+1(.264)+2(.271)+3(.185)+ +4(.095)+5(.039)+6(.017)=2.038 Funzione di distribuzione cumulativa La funzione di distribuzione cumulativa (c.d.f.) di una variabile aleatoria è indicata con F(X ) ed è definita da i − x)2 i=1 N −1 Deviazione standard N σ= Valore atteso di una variabile aleatoria discreta ∑ (x ∑ (x i − x)2 i=1 N −1 Varianza di una variabile aleatoria discreta ∑ (y − µ)2P(y) = = ⎡⎣ ∑ y2P(y)⎤⎦ − µ2 σ2 = Supponiamo che Y=1 con probabilità .5,e Y=0 con probabilità .5. Calcolare σ2. Distribuzione di probabilità continua Si riferisce a una variabile aleatoria continua definita su un sottoinsieme S di R: F(x ) = P(‘X ≤ x’) Esempio F(x) = 0 se x < 0 F(x) = .129 se 0 ≤ x < 1 F(x) = .393 se 1 ≤ x < 2 F(x) = .664 ………….. se 2 ≤ x < 3 ……………. P(X∈A) = area sotto il grafico di f di base A 2 Una variabile continua descritta da un grafico a campana si dice avere una distribuzione normale di probabilità e si chiama variabile normale. La distribuzione normale ha un grafico simmetrico, a forma di campana caratterizzato dalla sua media e dalla deviazione standard. Per essere più precisi una variabile è normale se la formula della sua distribuzione di probabilità è la seguente: Distribuzione normale: formula f (x) = 1 σ 2π 2 − (x−x) e 2σ 2 µ indica la media della popolazione σ indica la deviazione standard della popolazione Distribuzione normale: µ=3, σ=1 3