Lezione 11

annuncio pubblicitario
17/04/2016
Variabili casuali
• Una variabile casuale X e’ una funzione definita sullo spazio
campionario W che associa ad ogni evento E  W un unico
numero reale.
X
W
E6
E1
E5
E9
E8
E7
• La funzione di probabilità deve verificare le due proprietà:
P X i   0, i
 P X   1

x5
E4
• Una variabile casuale discreta X è caratterizzata dalla sua funzione
di probabilità che associa ad ognuno dei valori xi la corrispondente
probabilità P(X=xi).

x6
E3
E2
Variabili casuali discrete
i
i
• Una variabile aleatoria discreta può anche caratterizzarsi attraverso
la sua funzione di ripartizione che fa corrispondere ai valori x le
probabilità cumulate P(Xx):
x4
F  x   P X  x    P X  w
x3
x2
w x
x1
• Esempi: somma dei punteggi nel lancio di due dadi, numero di
pezzi difettosi in un lotto, variazione giornaliera nel rendimento
di un titolo, numero di prodotti di un certo tipo venduti
1
giornalmente in un particolare punto vendita
• Una variabile casuale può essere classificata come discreta o
continua.
• Una variabile casuale discreta può assumere un insieme
discreto (finito o numerabile) di numeri reali.
• La funzione di ripartizione verifica le seguenti proprietà:
 F(x) è non decrescente
F x   0 e lim F  x   1
 xlim
 
x
3
 F(x) è continua a destra
Esempio
• Corrispondenza tra eventi e valori della variabile casuale
X={somma dei punteggi}, nella prova “lancio di due dadi”
• Una variabile casuale continua può assumere tutti i valori
compresi in un intervallo reale.
W discreto
V.C. discreta
W continuo
V.C. discreta o continua
X
2
2
3
4
5
6
7
8
9
10
11
12
P(x) 136 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 136
F(x) 136 3 36 6 36 10 36 15 36 2136 2636 30 36 33 36 3536 1
4
17/04/2016
Esempio
• Rappresentazione grafica della funzione di ripartizione per
l’esempio del lancio di due dadi
• Si consideri la v.a. X che può assumere tutti i valori
dell’intervallo reale [a ; b] in modo che tutti i sottointervalli di
uguale ampiezza abbiano la stessa probabilità.
1
0,8
0,6
• La funzione di ripartizione è
0,4
Funzione di densità di probabilità
0,2
0
 1

se x  a; b
f x    b  a
 0
altrimenti
• La funzione di densità è
F(x)
1
2
3
4
5
6
7
8
9
10
11
12
13
 0 se x  a
x  a
F x   
se x  a; b
b  a
 1 se x  b
Funzione di ripartizione
x
5
7
Variabili casuali continue
• Una variabile casuale continua X è caratterizzata dalla sua funzione
di densità, f(x) tale che l’area sottesa alla funzione, in un intervallo, è
pari alla probabilità che X assuma un valore in quell’intervallo:
Pa  X  b    f x  dx
b
• La funzione di densità deve verificare le proprietà:


f x   0



a
 La probabilità che la v.c. assuma un particolare valore è 0.
• Una v.a. continua può anche caratterizzarsi attraverso la funzione di
F  x   P X  x   
x

• Il valore atteso di una v.c. X, è definito come


f  x  dx  1
ripartizione:
Valore atteso di una v.a.
f w dw
• La funzione di ripartizione verifica le proprietà già viste in
precedenza; inoltre per v.a. continue, essa è assolutamente continua.
6
E  X    x i P  xi 
EX  
i

 xf x  dx

se la v.c. è discreta
se la v.c. è continua
• Il valore atteso di una funzione Y = g(x), della v.a. X, può
essere calcolato come:
 E Y    g xi P xi  se la v.c. è discreta
 E Y  
 g x  f x  dx
i


se la v.c. è continua
8
17/04/2016
Varianza di una v.a.
Esempio v.a. discreta
• La varianza di una v.c. X, è definita come

V  X   E X  E  X 
• X={somma dei punteggi}, nella prova “lancio di due dadi”

Esempio v.a. continua
a
se la v.c. è discreta
2
i

 x  E  X  f x  dx
se la v.c. è continua
2

• La varianza può essere, in modo equivalente, definita come:
 
V  X   E X 2  E  X 
2
• Si definisce deviazione standard di X, la radice quadrata della
sua varianza
11
SD X   V  X 
Media e Varianza di una combinazione lineare
• Si consideri la v.a. X definita nell’intervallo [a ; b] vista prima
• Sia Y una combinazione lineare di una v.c. X, ossia Y = a+bX,
dove a e b sono delle costanti. Si possono allora dimostrare le
seguenti proprietà:
E Y   E a  bX   a  bE  X 
x
x2
b2  a 2 a  b
dx f  x  


ba
2b  a  a 2b  a 
2
a
b
V  X     xi  E  X  P xi 
 V X  
1
2
3
4
5
6
5
4
EX   2  3  4  5  6  7  8  9
36
36
36
36
36
36
36
36
3
2
1
 10
 11  12
7
36
36
36
9
b

• A seconda del tipo di v.a., la precedente definizione diventa
2
3
4
5
6
7
8
9
10
11
12
X
P(x) 136 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 136
F(x) 136 3 36 6 36 10 36 15 36 2136 2636 30 36 33 36 3536 1
E  X    xf  x  dx  
2
b
V Y   V a  bX   b 2V  X 
• Ponendo a = -E(X) e b = 1/SD(X), si ottiene una variabile
aleatoria Y standardizzata, ossia, con valore atteso 0 e
deviazione standard 1.
E Y   0
10
V Y   1
Y
X  EX 
SD  X 
12
17/04/2016
Modelli di v.a. discrete: v.a. di Bernoulli
Teorema di Chebyshev
• Una v.a. Bernoulliana, indicata come X  Bernoulli(p) assume
solo due valori, 1 o 0, rispettivamente con probabilità p e 1-p.
• Sia X una variabile casuale e k un valore reale positivo, allora
vale la seguente disuguaglianza:
• La funzione di probabilità di una v.a. di Bernoulli è:
1
P  X  E  X   k  SD X   2
k
P X  x   p x 1  p 
1 x
EX   p
15
Modelli di v.a. discrete: v.a. uniforme
Modelli di v.a. discrete: v.a. Binomiale
• Una v.a. uniforme discreta X assume valori interi compresi in
un certo intervallo [a,a+s-1], ciascuno con la stessa probabilità.
Viene indicata come X  UD(a,s).
• La funzione di probabilità di una uniforme discreta è:
1

se x  a; a  s  1
P x    s
 0 altrimenti
• Media e varianza di una uniforme discreta sono rispettivamente:
s 1
s2 1
EX   a 
e V X  
2
12
0,14
E  X   4,5
V  X   5,25
SD X   2,29
0,12
0,10
0,06
0,04
0,00
1
2
3
4
5
6
7
14
• La v.a. Binomiale è una distribuzione discreta che si utilizza
quando si è in presenza di n prove indipendenti (es. n
estrazioni con ripetizione o n estrazioni da una popolazione
infinita), ciascuna prova ha solo due esiti possibili, indicati
come successo e insuccesso (es. difettoso/non difettoso,
aumento/decremento, acquisto/mancato acquisto), e la
probabilità p (es. tasso di difettosità) di osservare un successo
in una singola prova rimane costante per tutte le prove.
• Una v.a. Binomiale si indica come X  Binomiale(p;n) e la sua
funzione di probabilità è:
n
n x
P X  x    p x 1  p 
x
 
0,08
0,02
e V  X   p 1  p 
• Tutte le prove che producono solo due possibili risultati
generano v.c. di Bernoulli: il lancio di una moneta, il
superamento o meno di un certo livello di inflazione, l’aumento o
meno della quotazione di un titolo, l’acquisto o meno di un certo
prodotto, la difettosità o l’integrità di un certo pezzo…
13
• Esempio: X  UD(1,8)
x  0, 1
• Media e varianza di una Bernoulliana sono rispettivamente:
Indipendentemente dalla distribuzione della v.c., la probabilità
che X assuma valori distanti dalla media più di k deviazioni
standard è al più 1/k2
P(x)
per
8
x
per
x  0, 1, , n e 0  p  1
16
17/04/2016
Esempio
• Una v.a. Binomiale può essere ottenuta considerando la somma
di v.c. di Bernoulli, indipendenti e identicamente distribuite:
X  X1  X 2    X n   X i
n
i 1
dove Xi  Bernoulli(p), indipendentemente per ogni i.
• Media e varianza di una Binomiale sono rispettivamente:
E  X   np
e V  X   np 1  p 
• Una v.a. Binomiale è caratterizzata dalle seguenti proprietà:
 Il valore atteso e la varianza crescono al crescere di n;
 Per p=0,5 la distribuzione è simmetrica rispetto al valor
medio (n/2);
 Per n→ la distribuzione tende ad essere simmetrica
rispetto al valor medio.
0,250
• Le informazioni a disposizione sono:
p = 0,05;
n = 20;
Binomiale(20;0,5)
• Vogliamo calcolare
P(X = 0),
P(X = 1)
0,150
e infine
P(X = 2).
n!
20!
n0
200
p0 1 p 
0,050 1 0,05  0,3585
0! n  0!
0! 20  0 !
n!
20!
n1
201
P( X  1) 
p1 1 p  
0,051 1  0,05  0,3774
1! n 1 !
1! 20 1 !
P( X  0) 
0,100
0,050
0,000
19
• Indichiamo con:
p la probabilità di produrre un tappo difettoso;
n il numero di tappi estratti;
X il numero di tappi difettosi tra quelli estratti.
Binomiale(7;0,5)
0,200
È più probabile che si trovi ad osservare 1 solo tappo difettoso
o nessun tappo difettoso? E qual è invece la probabilità di
osservarne 2?
17
Esempi di Binomiale
0,300
• Un’industria che produce tappi di sughero sa che il tasso di
difettosità dei macchinari a disposizione è del 5%.
Per controllare giornalmente che tale tasso rimanga invariato, il
responsabile del controllo di qualità ogni giorno estrae 20 tappi
a caso tra quelli prodotti e osserva quanti di essi risultano
difettosi.
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
18
P( X  2) 
n!
20!
n2
202
p2 1 p 
0,052 1 0,05  0,1887
20
2! n  2!
2! 20  2!
17/04/2016
Distrib u zion e d i p rob ab ilità d ella variab ile "n ° d i tap p i d ifettosi osservati"
0.4
0.35
0.3
P(X)
0.25
0.2
0.15
0.1
0.05
0
0
5
X
10
15
20
21
• In generale, una v.a. discreta che rappresenta il numero di volte
che si realizza un certo evento aleatorio in un dato intervallo (di
tempo o di spazio) può essere approssimata bene da una
Poisson se, suddividendo l’intervallo in tanti sottointervalli,
valgono le seguenti condizioni
 La probabilità di osservare esattamente un evento nel
sottointervallo è costante
 La probabilità di osservare più di un evento nel sottointervallo
è pari a zero
 Il verificarsi di un evento in un sottointervallo è indipendente
dal verificarsi di un evento in un altro sottointervallo
• Una v.a. di Poisson è caratterizzata dalle seguenti proprietà:
 Se Xi  Poisson(li) indipendentemente per ogni i = 1,…,n,
allora X  Poisson(l1+l2+…+ln), dove X = X1+X2+…+Xn.
 La v.a. Binomiale al crescere di n e per p piccolo, tende ad
una v.a. di Poisson con parametro l = np.
23
Modelli di v.a. discrete: v.a. di Poisson
• Una v.a. di Poisson, indicata come X  Poisson(l) può
assumere qualsiasi valore intero x ≥ 0.
• La funzione di probabilità di una v.a. di Poisson è:
e l lx
P X  x  
x  0, 1, 2,  0  l  
x!
• Media e varianza di una Poisson sono rispettivamente:
EX   l
e V X   l
• La distribuzione di Poisson è adeguata per approssimare v.a.
che rappresentano conteggi: il numero di persone che arrivano
ad uno sportello in un certo intervallo di tempo, il numero di
errori di battitura in una pagina, il numero di incidenti in un tratto
stradale, il numero di rimborsi chiesti in un giorno ad una
compagnia assicurativa…
22
Esempi di v.a. di Poisson
0,40
Poisson(1)
0,35
0,30
Poisson(3)
0,25
0,20
Poisson(7)
0,15
0,10
0,05
0,00
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
24
17/04/2016
Modelli di v.a. continue: v.a. uniforme
• Una v.a. Uniforme continua X, indicata come X  U(a;b), può
assumere valori sull’ intervallo reale limitato [a;b], in modo che
tutti i sottointervalli di uguale ampiezza abbiano la stessa
probabilità.
• La funzione di densità è
 1

se x  a; b
f x    b  a
 0
altrimenti
Esempi di v.a. Normali
s
0,75
0,60
N(0;1)
0,45
0,30
• Media e varianza di una uniforme sono rispettivamente:
ab
a  b 2
EX  
e V X  
2
12
s
s
0,15
0,00
-4,5
s
-3,0
-1,5
0,0
1,5
1,5
• Esempio: X  U(0;1),
4,5
m=0
m=1
m=2
m=3
m=4
m=5
0,30
f x
1,0
0,15
0,25
0,5
0,2
0,0
-0,50
-0,25
0,00
0,25
0,50
0,75
1,00
1,25
25
0,00
1,50
Modelli di v.a. continue: v.a. Normale
• Una v.a. Normale (o Gaussiana) X, indicata come X  N(m;s2),
può assumere valori su tutto l’asse reale.
• La funzione di densità è
 1  x  m 2 
1
   m   s 2  0
f x  
exp 
2

2
s
s 2p


 Ogni trasformazione lineare di una v.a. Normale è ancora una v.a.
Normale
 La somma di v.c. Normali indipendenti è ancora una v.c. Normale con
media e varianza pari, rispettivamente, alla somma delle medie e delle
varianze delle v.c. Normali.
26
0,0
1,5
3,0
4,5
6,0
27
7,5
• La funzione di densità della Normale standard è
f z  
e V X   s 2
• La Normale gode delle seguenti proprietà:
-1,5
• Se la v.a. X ha una distribuzione normale con parametri m e s2,
allora Z = (X- m)/s è ancora una v.a. Normale con media 0 e
varianza 1. La v.a. Z è nota come Normale standardizzata e si
indica come Z  N(;1).
• Media e varianza di una normale sono rispettivamente:
EX   m
0,45
3,0
1
2p
 1 
exp  z 2 
 2 
0,30
0,15
0,00
0,95
-1,96
0,00
1,96
28
17/04/2016
ESEMPIO
• La funzione di ripartizione di una v.a. Normale standard viene in
genere indicata come (•), ossia
Un’industria che produce componenti sta valutando la
possibilità di fornire una grossa ditta.
I macchinari sono settati per produrre componenti con un
diametro di 10mm, tuttavia non tutti i pezzi prodotti
hanno esattamente la stessa dimensione.
È noto invece che il diametro dei pezzi prodotti segue una
distribuzione normale con media 10mm e deviazione
standard 0,5mm.
La ditta che dovrebbe acquistare questi pezzi può utilizzare
esclusivamente componenti con un diametro compreso
tra 9 e 11 mm.
F z   P( Z  z )  z 
• I valori della funzione di ripartizione di una Normale standard
sono tabulati e questo semplifica i calcoli delle aree sottese
dalla funzione di densità.
• Esempio: Calcolo dell’area sottesa nell’intervallo [-2,2]
2   2  2  1  2  22  1  2  0,977  1  0,954
Si vuole stabilire se almeno il 90% della produzione di
componenti incontri le necessità della ditta.
29
31
Densità della variabile "diametro"
0.8
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
5
6
7
8
9
10
11
Densità standardizzata
0.8
12
13
14
15
0
-5
-4
-3
-2
-1
0
1
2
3
4
5
Indichiamo con X la variabile “diametro”:
 9  m X  m 11  m 
P  9  X  11  P 



s
s 
 s
30
11 10 
 9  10
 P
Z 
  P 2  Z  2  0,9545
0,5 
 0,5
32
17/04/2016
ESEMPIO
Un punto vendita di una catena di fast food ha cominciato ad
offrire un servizio di consegna pasti a domicilio.
Per battere la concorrenza il proprietario ha deciso di offrire il
pasto gratis ai clienti che ricevono la consegna con un ritardo
eccessivo.
Dato l’attuale margine di profitto, il proprietario conclude che è
possibile offrire un numero di pasti gratis pari al 2,5% delle
ordinazioni.
Sapendo che il tempo di consegna si distribuisce
approssimativamente in maniera normale con media pari a 20
min. e deviazione standard pari a 5 min., il proprietario vuole
determinare un livello soglia per il tempo d’attesa, oltre il quale
fornire il pasto gratis, in modo tale che il numero di pasti gratis
offerti non superi il 2,5% delle ordinazioni.
33
Perché la distribuzione normale
è così importante?
Banconota da 10 Marchi con l’immagine di Carl
Friedrich Gauss e la funzione di densità normale.
Molti fenomeni tendono naturalmente ad avere una distribuzione
campanulare ben approssimabile con una distribuzione normale.
Ossia è un modello teorico che si adatta bene a molti dati empirici.
È facilmente trattabile da un punto di vista matematico.
In molte applicazioni, conclusioni basate sull’assunzione di
normalità dei dati non sono seriamente affette da scostamenti dalla
normalità contenuti.
Ma soprattutto
Deve la sua importanza all’esistenza del teorema del limite centrale.
35
Il teorema del limite centrale
0.1
Densità della variabile "tempo di consegna"
0.4
0.09
Siano X1,…, Xn, n variabili casuali indipendenti e identicamente distribuite
(i.i.d.) con media E(Xi) = m e varianza V(Xi) = σ2 entrambe finite. Sia Sn =
X1+…+Xn, la loro somma avente media E(Sn) = nm e varianza V(Sn) = nσ2.
Allora per n → ∞, Sn tende a distribuirsi normalmente.
0.35
0.08
0.3
0.07
0.25
0.06
Un enunciato equivalente del teorema stabilisce che, posto
0.2
0.05
0.04
0.15
0,025
0.03
0.02
Xn 
0,025
0.1
0.05
0.01
0
0
Densità standardizzata
5
10
15
20
25
x=?
35
40
0
-5
-3
-1
0
1
1,96
3
5
Indichiamo con X la variabile “tempo di attesa” e con x la soglia da determinare:
xm 
 X m xm 

0,025  P  X  x   P 

 P Z 
s 
s 
 s

Dalle tavole della distribuzione normale otteniamo: 0, 025  P  Z  1,96 
Quindi
xm
s
 1,96
e
x  1,96s  m  1,96  5  20  29,8
34
1 n
 Xi
n i 1
e restando valide le condizioni enunciate sopra, si ha che la variabile
Zn
X


n
 m n
s
converge, per n → ∞, ad una Normale standard.
ESEMPIO
Siano X1,…, Xn, n variabili bernoulliane indipendenti con identica probabilità di
successo p (quindi E(X1) = p e V(X1) = p(1-p)). Abbiamo visto che la loro
somma Sn = X1+…+Xn si distribuisce come una variabile binomiale con
media E(Sn) = np e varianza V(Sn) = np(1-p). In virtù del teorema del limite
36
centrale, per n → ∞, Sn tende a distribuirsi normalmente.
17/04/2016
Esempi di v.a. Chi-quadrato
Applicazioni del teorema
c 2 4 
0,15
c 2 8
0,10
c 2 12 
c 2 20 
0,05
0,00
0,0
7,5
15,0
22,5
30,0
All’aumentare di g la distribuzione tende ad una N(g;2g)
39
37
Modelli di v.a. continue: Chi-quadrato
• Una v.a. Chi-quadrato X, indicata come X  c(g), può
assumere valori nell’intervallo [0;].
• La funzione di densità è
f x  
1
g
2  
2
g
2
g
1
x2 e

x
2
• Una v.a. t di Student T, indicata come T  Student(g), può
assumere valori nell’intervallo [- ;].
per x  0
• Media e varianza di una Chi-quadrato sono rispettivamente:
EX   g e V X   2g
• Una v.a. c(g) si può ottenere come somma dei quadrati di g
v.a. Normali standardizzate indipendenti, ossia
c g   Z  Z    Z
2
2
1
2
2
Modelli di v.a. continue: t di Student
2
g
38
• Una v.a. T  Student(g) si può ottenere come rapporto tra una
v.a. Normale standardizzata e la radice quadrata di una v.a.
Chi-quadrato divisa per i suoi gradi di libertà, ossia
T
Z
Y g
dove Z  N(0,1) e Y  c(g).
40
17/04/2016
Dove e come studiare
Cenni sulle v.a. doppie
• Una variabile aleatoria doppia (X,Y) è una funzione definita
sullo spazio campionario W, che associa a ogni risultato i una
coppia di numeri reali (x,y).
• Una v.a. doppia è completamente definita dalla sua funzione di
probabilità congiunta o dalla sua funzione di densità
congiunta, a seconda che sia discreta o continua.
• Libro di testo: S. Borra, A. Di Ciaccio (2014), Cap. 9 (escluso
paragrafo 9.8.5)
• Svolgere ‘Esercitazione 5’.
• Svolgere i restanti esercizi nel file ‘Esercizi di probabilità.xls’.
• In caso di indipendenza si deve avere:
 Caso discreto
 Caso continuo
P x, y   P x P  y 
f  x, y   f  x  f  y 
41
Media e varianza di combinazioni
lineari di v.a.
• Il valore atteso di una combinazione lineare di p v.a.
è dato da
X  a1 X 1  a 2 X 2    a p X p
E  X   a1 E  X 1   a 2 E  X 2     a p E X p 
mentre la varianza è
V  X    aiV  X i   2  a i a j Cov X i , X j 
p
dove
i 1
p

p
i 1 j i 1

Cov X i , X j   s X i , X j  E  X i  E  X i X j  E X j 
è la covarianza tra Xi e Xj.
42
43
Scarica