2.2 Variabili casuali

annuncio pubblicitario
Corso di Statistica
Variabili casuali
Distribuzioni di probabilità
Prof.ssa T. Laureti
a.a. 2013-2014
1
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
VARIABILI CASUALI O ALEATORIE
Una variabile casuale è simile a una variabile statistica
E’ definita da un insieme di modalità cui è associata una
probabilità
Variabili casuali o aleatorie
variabili aleatorie discrete
variabili aleatorie continue
P(x)
0,36
0,16
0,06
0,04
0,02
0
1
2
3
4
5
x
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
2
Definizione di variabile casuale
Una variabile casuale (v.c.) X è una funzione
definita sullo spazio campionario Ω che
associa ad ogni evento elementare ωi un
unico numero reale
X: R
V.c. discreta assume un insieme finito (al
più numerabile) di valori
V.c. continua assume tutti i valori compresi
in un intervallo reale
3
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Variabile casuale discreta
È definita da un insieme finito o numerabile di modalità cui è
associata una probabilità
Esempio
Lancio due monete bilanciate. Definisco la variabile casuale
X = numero di teste
X può assumere i valori 0, 1, 2
Infatti i possibili risultati sono
CC
X=0
P(X = 0) = 1/4
CT
TC
X=1
P(X = 1) = 2/4
TT
X=2
P(X = 2) = 1/4
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
4
Variabile casuale discreta
Si supponga di fare 3 puntate successive alla roulette.
Ogni volta si puntano 10 euro sul rosso.
Per comodità, si ipotizza che la roulette non abbia lo zero.

RNR
NRN
NNN
-30
-20
RNN
-10
NNR
0
RRN NRR
10
20
30
RRR
X
P(X=x)
variabile
3/8
casuale
“vincita”
1/8
X
-30
-20
-10
0
10
20
30
5
Variabile casuale discreta
V.C. NUMERO DI TESTE
X
0
P(X)
P(X=x)
1/4
1
2/4
2
1/4
V.C. “VINCITA”
X
P(X)
P(X=x)
-30
1/8
-10
3/8
10
3/8
30
1/8
6
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Variabile casuale discreta
Ulteriori esempi di v.c. discreta
Alla prova “lancio di un dado” la funzione che
associa ad ogni faccia (evento elementare) il
punteggio corrispondente (da 1 a 6) è una v.c.
Alla prova “lancio di due dadi” la funzione che
associa ad ogni risultato la somma dei punteggi
è una v.c. (da 2 a 12)
Anche associando ad ogni risultato il prodotto
dei punteggi (o la loro differenza) si generano
v.c.
7
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Funzione di probabilità
La f. di probabilità di una v.c. X mette in
relazione i valori assunti da X con le
corrispondenti probabilità
La f. di probabilità P associa ad ogni valore xi la
probabilità P(X=xi)
Valori della v.c. X
P(x)
x1
x 2 ........ x i ....
P(x1 ) P(x 2 ) ........ P(xi ) ....
Proprietà:
P(X  xi )  0
 P(X  x )  1
i
i
8
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Funzione di probabilità
La funzione di probabilità può essere rappresentata graficamente
In relazione agli esempi precedenti si ha:
V.C. “VINCITA”
V.C. NUMERO DI TESTE
P(X=x)
3/8
1/8
X
-30
-20
-10
0
10
20
In corrispondenza di ogni valore, la barra verticale ha
un’altezza proporzionale alla probabilità.
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
30
9
Funzione di ripartizione
E’ utile calcolare le probabilità cumulate, ossia la probabilità che
la v.c. X assuma un valore minore o uguale a un dato valore xi
P ( X  xi )
La f. di ripartizione di una v.c. X mette in
relazione i valori assunti da X con le corrispondenti
probabilità cumulate
La f. di ripartizione F associa ad ogni valore x le
probabilità cumulate
F(x)  P(X  x)   P(X  w)
w x
Proprietà:
F(x) è non decrescente
lim F(x)  0; lim F(x)  1
x  
x 
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
10
Funzione di ripartizione
V.C. “VINCITA”
V.C. NUMERO DI TESTE
X
0
1
2
P(x)
1/4
2/4
1/4
F(x)
1/4
3/4
4/4
X
P(x)
F(x)
-30
1/8
1/8
-10
3/8
4/8
10
3/8
7/8
30
1/8
8/8
Rappresentazione grafica della Funzione di ripartizione
Ha l’aspetto di una funzione a gradini.
In corrispondenza di ogni valore c’è un salto proporzionale alla
probabilità associata a quel valore
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
11
Si consideri ad esempio la seguente distribuzione di probabilità di una v.c.
discreta:
X
-3
P(x) 0,1
-1
0,3
0
0,1
2
0,2
4
0,1
5
0,2
P(x)
0,4
distribuzione di probabilità
0,3
0,2
0,1
X
0
F(x)
-3
-2
-1
0
1,0
1
2
3
4
5
0,2
0,8
0,6
0,3
0,4
funzione di ripartizione
0,2
0
-3
-2
-1
0
1
2
3
4
5
12
X
Misure sintetiche della distribuzione di probabilità
di una v.c. discreta
In analogia con le distribuzioni di frequenza, anche per le distribuzioni di
probabilità è utile avere degli indici di sintesi
 Valore medio o atteso (Expected Value)
E(X) 
 xiP(xi )
i
 Varianza
V(X) 
Confronta con la
formula della
media di una distr.
di freq. rel.
 
2
2


x

E
(
X
)
P(xi )
 i
x
K
x f
j1
K
 x
j1
j j
 x  fj
2
j
i
 Deviazione standard
SD(X) 
V(X)
Confronta con la
formula della
varianza di una distr.
di freq. rel.
13
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Calcolo dei valori caratteristici di una
distribuzione di probabilità
V.C. NUMERO DI TESTE nel lancio di due monete
X
P(x)
E ( X )   xi P ( xi )
i
0
1/4
1
2/4
 0  0,25  1 0,5  2  0,25  1
V ( X )    xi  E ( X )  P ( x i )
2
2
1/4
i
  0  1  0,25  1  1  0,5   2  1  0,25  0,5
2
2
2
SD( X )  V ( X )  0,5  0,7
14
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
V.c. continua
Una v.c. si dice continua se può assumere tutti i valori di un
determinato intervallo di numeri reali.
Una v.c. continua estende l’idea di variabile statistica continua
Misure di altezza, peso, durata, consumo, reddito, ecc.
Esempi di v.c. continua
Dall’insieme dei debiti verso i fornitori di un’azienda, il revisore
estrae casualmente un valore. Questo importo è una v.c.
continua.
Dall’elenco dei dipendenti di una ditta, l’Ufficio Stipendi ne
estrae casualmente uno e legge il suo salario. Il salario di un
dipendente estratto a caso è una v.c. continua.
15
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
V.c. continua
Consideriamo la v.c. altezza di un collettivo di
ragazzi. La v.c. assume valori tra 156 e 177. Si
suddivide l’intervallo in N piccoli intervalli
Probabilità che X assuma valori nell’intervallo
166,0 e 166,5
Area complessiva degli N rettangoli è uguale a 1
Istogramma di probabilità
Funzione di densità
Se si aumenta N (o si diminuisce
l’ampiezza degli intervalli) il profilo
del grafico tende a una curva
continua.
Modello descrittivo di una v.c.
continua che prende il nome di
funzione di densità.
La probabilità è una area sotto la curva
16
ab
P(a<X<b)
Funzione di densità
La variabile aleatoria continua è definita dalla funzione di densità f(x)
1) La funzione deve essere positiva
2) L’area totale sotto la funzione deve essere uguale a 1
f(x) funzione di densità    X  
b
f(x)
P(a  X  b)   f(x)dx
a
è l’area colorata
al di sotto della
curva compresa
tra i valori a e b
Proprietà:
f(x)  0

 f(x)dx  1

P(X  a)  0
X
17
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Funzione di ripartizione
x
Per ogni valore x posso calcolare la probabilità di non superarlo
F ( x )  P( X  x )
Si definisce in tal modo la funzione di ripartizione come
area sottesa a sinistra del valore x
18
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Funzione di ripartizione
F(x)  P(X  x) 
x
 f(w)dw

Proprietà:
F(x) è non decrescente
lim F(x)  0; lim F(x)  1
x  
F(x)
x 
1
Rappresentazione grafica
di una Funzione di
ripartizione continua
F(x1 )
P(x1  x  x 2 )
F(x1 )
0
x1 x 2
x
19
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Misure sintetiche della distribuzione di
probabilità di una v.c. continua
 Valore medio o atteso (Expected Value)
E(X) 

 xf(x)dx

 Varianza
V(X) 

2


 x  E(x) f(x)dx
Confronta con la
formula del valore
medio di una v.c.
discreta
V(X) 
E(X) 
 x P(x )
i
i
2


x

E
(
X
)
P(xi )
 i
i

 Deviazione standard
SD(X) 
V(X)
i
Confronta con la
formula della
varianza di una v.c.
discreta
Standard Deviation (SD)
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
20
VARIABILI STANDARDIZZATE E TEOREMA DI CHEBYSHEV
Se X è una v.c. con valore E(X) e SD(X) allora:
X  E( X )
Y
SD( X )
È una v.c. standardizzata con E(Y)=0 e V(Y)=1
Sia X una variabile casuale e k un valore reale positivo, allora
vale la seguente disuguaglianza:
P  X  E  X   k  SD X   2
k
1
Indipendentemente dalla distribuzione della v.c. , la probabilità
che X assuma valori distanti dalla media più di k deviazioni
standard è al più 1/k2
21
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Principali distribuzioni di
probabilità di v.c.
V.c. discrete
Bernoulli
Binomiale
Poisson
V.c. continue
Normale
Chi-quadrato
T di Student
F di Fisher
22
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Scarica