Lezioni sulle variabili casuali DISCRETE

VARIABILI CASUALI O ALEATORIE
Consideriamo i seguenti esempi:
1) Si lanci tre volte una moneta: il numero di "teste" che si possono presentare è uno dei
seguenti : 0 o 1 o 2 o 3 . Gli eventi sono incompatibili e necessari. Possiamo
schematizzare i risultati nel seguente modo:
Xi
0
1
2
3
Pi
1
8
3
8
3
8
1
8
dove X i rappresenta l'evento e Pi la rispettiva probabilità.
3
La somma delle probabilità degli eventi considerati è uguale a 1
∑p
i
= 1.
i= 0
2) Lancio del dado: siamo interessati ai risultati delle singole facce 1 o 2 o 3 o 4 o 5 o 6 .
Anche in questo caso gli eventi sono incompatibili e necessari. La schematizzazione è
la seguente:
Xi
1
2
3
4
5
6
Pi
1
6
1
6
1
6
1
6
1
6
1
6
Anche in questo esempio il valore che assume la variabile X i è casuale. A ciascun valore
corrisponde una ben determinata probabilità ed essendo gli eventi incompatibili e
6
necessari la somma delle probabilità è uguale a 1
∑p
i =1
i
=1
DEFINIZIONE DI VARIABILE CASUALE
Si definisce variabile casuale X una variabile che può assumere diversi valori reali
xi ,ciascuno associato agli eventi Ei , incompatibili e necessari, con rispettiva probabilità
pi e con sommatoria delle probabilità pi uguale a 1 .
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 1 di 11
VARIABILE CASUALE DISCRETA
Una variabile casuale si definisce discreta ( indicata anche con il simbolo v.c.d.) se le
determinazioni xi che essa può assumere sono in numero limitato, finito .
In generale se X è una v.c. discreta , con pi si indica la probabilità che X assuma il
valore xi , in simboli si può scrivere P( X = xi ) = pi .
La probabilità varia al variare di xi , è funzione di xi e quindi è funzione della variabile X .
Questa funzione è chiamata funzione o distribuzione di probabilità e si può così
rappresentare:
Xi
x1
x2
x3
xi
…
xn
Pi
p1
p2
p3
pi
…
pn
La v.c. può essere rappresentata anche graficamente ; in un sistema di assi cartesiani
sull'asse delle ascisse si riportano i valori xi e su quello delle ordinate le probabilità pi .
Esempio:
Si lancia 3 volte una moneta. Studiare la variabile casuale :
X = "numero di volte che si presenta testa".
Nel lancio della moneta 3 volte, la faccia testa si può presentare da un
minimo di zero volte ad un massimo di 3 volte. La v.c. si può rappresentare
secondo la tabella che segue:
Xi
Pi
0
1
8
1
3
8
2
3
8
3
1
8
3
∑p
i=0
i
Pi
3
8
1
8
=1
0
1
2
3
Xi
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 2 di 11
dove i segmenti delle ordinate in corrispondenza dei valori 0, 1, 2, 3 ,rappresentano
le probabilità.
FUNZIONE DI RIPARTIZIONE o funzione cumulativa di probabilità.
Sia X una v.c., disposti i valori xi in ordine crescente, alla funzione di probabilità si
può associare la funzione di ripartizione F ( X ) che esprime la probabilità che la v.c.
assuma un valore non superiore a xi .
F ( Xi ) = P ( X ≤ x i ) = p1 + p 2 + ...+ pi
esempio
F ( X 3 ) = P ( X ≤ x3 ) = p1 + p2 + p3
Mediante la funzione di ripartizione si può facilmente calcolare la probabilità che la
v.c. assuma un valore compreso tra due valori assegnati a < X ≤ b ( probabilità che
la variabile casuale sia maggiore di a e minore o uguale a b )
P ( a < X ≤ b ) = F (b ) − F ( a )
La funzione di ripartizione svolge lo stesso ruolo della frequenza relativa cumulata
studiata nella statistica descrittiva .
Esemplificazione con il lancio di due dadi , evento ="somma delle facce" :
Xi
2
3
4
5
6
7
8
9
10
11
12
Pi
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
F(X )
1/36
3/36
6/36
10/36 15/36 21/36 26/36 30/36 33/36 35/36 36/36
esempi:
a) F ( 3) = P ( X ≤ 3) probabilità che la somma delle facce sia minore o uguale a 3,
cioè la somma delle facce è 2 oppure 3 ed è uguale a 3/36 ;
b) P ( 3 < X ≤ 8) = F (8) − F ( 3) = 26 / 36 − 3 / 36 = 23 / 36 e rappresenta la probabilità
che la somma sia un numero compreso tra 4 e 8 , estremi inclusi.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 3 di 11
VALORE MEDIO di una variabile casuale discreta .
Nelle applicazioni interessa conoscere alcuni valori caratteristici delle variabili casuali.
Un primo valore che sintetizza i valori della distribuzione della v.c. è il VALORE MEDIO o
VALORE ATTESO
n
M ( X ) = E ( X ) = ∑ xi pi = x1 p1 + x2 p2 +...+ xn pn
i =1
Il termine E ( X ) deriva dal termine inglese EXPECTATION ( speranza, aspettativa) .
Il valore medio di una variabile casuale rappresenta il valore previsto, atteso o sperato che
si potrà ottenere in un gran numero di prove. Esso non corrisponde necessariamente ad
uno dei valori xi della distribuzione ma corrisponde solo al valore medio dopo aver
effettuato un gran numero di prove.
In generale , assegnata una variabile casuale X ,
Xi
x1
x2
x3
xi
…
xn
Pi
p1
p2
p3
pi
…
pn
il valore medio o valore atteso o speranza matematica è dato dalla somma dei prodotti di
ogni valore della variabile casuale per la rispettiva probabilità.
Esempio: in una operazione finanziaria si possono guadagnare 3.000 euro con probabilità 0,2, oppure 5.000
euro con probabilità 0,5, oppure 10.000 euro con probabilità 0,3. Calcolare il valore medio della variabile
casuale.
La variabile casuale può essere rappresentata in tabella:
valori
xi
probabilità
pi
prodotti
xi ⋅ pi
3.000
0.2
600
5.000
0.5
2.500
10.000
0.3
3.000
totali
1.0
6.100
M ( X ) = 3.000 ⋅ 0,20 + 5.000 ⋅ 0,50 + 10.000 ⋅ 0,30 = 6.100 euro. Il valore medio atteso , in un gran
numero di prove , è pertanto 6.100 euro. In una singola prova gli eventi che si possono presentare sono o
3.000 o 5.000 o 10.000; se le prove vengono ripetute sempre nelle stesse condizioni un gran numero di volte
, tenendo conto della probabilità statistica, possiamo ritenere che nel 20% dei casi si vincerà la somma di
3.000 euro, nel 50% dei casi la somma di 5.000 euro , nel 30% dei casi la somma di 10.000 euro con un
guadagno medio appunto di 6.100 euro.
Il valor medio di una variabile casuale coincide con la media aritmetica ponderata definita
nella statistica descrittiva.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 4 di 11
SCARTO di una variabile casuale discreta .
Si definiscono SCARTI di una v.c.d. le differenze tra i valori assunti dalla variabile casuale
X e la propria media Si = xi − M ( X ) .
La variabile casuale scarto avrà la seguente distribuzione di probabilità:
Si
x1 − M ( X )
x2 − M ( X )
x3 − M ( X )
xi − M ( X )
…
xn − M ( X )
Pi
p1
p2
p3
pi
…
pn
Il valore medio della variabile casuale scarto è sempre uguale a zero.
E ( X i − M ( X )) = 0
Dimostrazione:
n
n
n
n
n
i =1
i =1
i =1
i =1
i =1
E ( X i − M ( X )) = ∑ ( xi − M ( X ) ) ⋅ pi = ∑ xi ⋅ pi − M ( X ) ⋅ ∑ pi = ∑ xi ⋅ pi − ∑ xi ⋅ pi ⋅ 1 = 0 essendo
n
∑p
M ( X ) una costante e
i
=1.
i =1
La tabella della variabile scarto dell’esempio precedente sarà:
valori
probabilità
Prodotti
scarti semplici
scarti semplici ponderati
xi
pi
xi ⋅ pi
( xi − M ( X ))
(xi − M ( X )) ⋅ pi
3.000
0.2
600
-3.100
-620
5.000
0.5
2.500
-1.100
-550
10.000
0.3
3.000
3.900
1.170
totali
1.0
6.100
0
M ( X ) = 6.100
QUADRATO DELLO SCARTO di una variabile casuale discreta .
La variabile casuale quadrato dello scarto avrà la seguente distribuzione di probabilità:
(Si )2
(x1 − M ( X ) )2
(x2 − M ( X ))2
(x3 − M ( X ))2
(xi − M ( X ))2
…
(xn − M ( X ))2
Pi
p1
p2
p3
pi
…
pn
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 5 di 11
VARIANZA E SCARTO QUADRATICO MEDIO di una variabile casuale discreta .
La media è un valore sintetico della distribuzione. Più distribuzioni, anche se hanno la
stessa media, possono differire sensibilmente. Per analizzare la dispersione dei valori di
una v.c. dal valore medio si considera una nuova variabile casuale chiamata VARIANZA e
si indica con il simbolo σ2 oppure VAR(X) e si calcola con la formula:
n
VAR ( X ) = ∑ ( xi − M ( X )) pi = ( x1 − M ( X )) p1 +( x 2 − M ( X )) p2 +...+( xn − M ( X )) pn
2
2
2
2
i =1
e si definisce come il valore medio del quadrato degli scarti tra i valori e la media
E (xi − M ( X ) ) .
2
La varianza è uguale a zero quanto tutti i valori xi sono uguali tra loro e quindi non c'è
variabilità nella distribuzione. In ogni altro caso la varianza è un valore positivo, essendo
una somma di quantità quadratiche, e misura il grado di variabilità nella distribuzione;
quanto maggiore è
σ2, tanto più i valori xi sono differenti tra di loro e si disperdono
intorno alla media. Tanto minore è σ2 , tanto più i valori xi sono addensati intorno alla
media e minore è la variabilità dei dati.
La radice quadrata della varianza σ prende il nome di DEVIAZIONE STANDARD o
SCARTO QUADRATICO MEDIO della variabile casuale:
σ=
n
∑ (x
i =1
− M ( X )) p i
2
i
σ è espresso nella stessa unità di misura della v.c. e rappresenta la misura per valutare la
dispersione dei valori della variabile. Se , ad esempio, la v.c. X è espressa in metri, anche
σ è espressa in metri,mentre la varianza σ2 è espressa in metri quadrati.
Per calcolare la varianza dell'esempio precedente riguardante l'operazione finanziaria si
procede alla costruzione della seguente tabella :
valori
xi
probabilità
prodotti
scarti semplici
scarti quadratici
scarti quadratici ponderati
xi ⋅ pi
( xi − M ( X ))
( xi − M ( X ))2
( xi − M ( X )) 2 ⋅ pi
3.000
0.2
600
-3.100
9.610.000
1.922.000
5.000
0.5
2.500
-1.100
1.210.000
605.000
10.000
0.3
3.000
3.900
15.210.000
4.563.000
totali
1.0
6.100
M ( X ) = 6.100
σ2= 7.090.000
7.090.000
σ=2.662,7
ABBREVIAZIONE DEL CALCOLO DELLA VARIANZA
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 6 di 11
La varianza di una v.c.d. può essere agevolmente calcolata con la formula ridotta:
n
VAR( X ) = ∑ xi2 ⋅ pi − (M ( X ) )
2
i =1
Dimostrazione:
n
∑ (x − M ( X ))
2
i
i =1
n
n
pi =∑ xi2 ⋅ pi − 2 M ( X ) ⋅ ∑ xi ⋅ pi + (M ( X ))
i =1
i =1
valori
n
2
xi
n
xi
∑p =∑
i =1
n
2
i
2
2
i =1
i =1
probabilità
n
⋅ pi − 2(M ( X )) + (M ( X )) = ∑ xi2 ⋅ pi − (M ( X ) )
prodotti
prodotti
xi ⋅ pi
xi2 ⋅ pi
3.000
0.2
600
1.800.000
5.000
0.5
2.500
12.500.000
10.000
0.3
3.000
30.000.000
totali
1.0
6.100
44.300.000
VAR( X ) = ∑ xi2 ⋅ pi − (M ( X ) ) = 44.300.000 − (6.100 ) = 7.090.000
2
2
i =1
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 7 di 11
2
PROVE RIPETUTE e DISTRIBUZIONE BINOMIALE
Si ricorre alla distribuzione binomiale quando un fenomeno è dicotomico, cioè esso si
presenta attraverso solo due modalità o può essere ricondotto a due mediante gli eventi
contrari. ( esempio: lancio della moneta, eventi testa e croce; prodotto difettoso o non
difettoso; persone che possiedono una certa modalità ) .
La distribuzione binomiale trae la sua origine nello schema di Bernoulli delle prove ripetute
schematizzabile con estrazioni da un'urna rimettendo ogni volta la pallina estratta
nell'urna: le prove sono indipendenti e la probabilità p del verificarsi dell'evento favorevole
è costante in ogni prova.
_
Sia E un evento, con E indichiamo l'evento contrario,
-
con p indichiamo la probabilità del verificarsi dell'evento E , costante in ogni prova,
-
con q indichiamo la probabilità del verificarsi dell'evento E , q = 1 − p , costante in ogni
_
prova,
-
con n indichiamo il numero delle prove da effettuare,
-
con k indichiamo il numero delle volte che si presenta l'evento E .
La probabilità che in n prove si verifichi k volte l'evento E è data dalla formula :
 n
Pk =   p k q
k
n−k
Dimostrazione: data l'indipendenza delle prove la probabilità di ottenere in n prove l'evento E nelle prime k
_
prove e l'evento E nelle successive n-k prove si ha semplicemente moltiplicando tra loro le probabilità
(1
p4
⋅ p4
⋅2
p ⋅4
p4
⋅ ⋅ ⋅3p ) ⋅ (1
q ⋅4
q4
⋅ q2⋅ q4⋅ ⋅4
⋅3
q) = p k ⋅ q n−k .
( n − k )→ prove
k → prove
_
Per avere la probabilità di avere k volte l'evento E e n-k l'evento E qualunque sia l'ordine basta calcolare in
_
quanti modi diversi possiamo ottenere k volte E e n-k volte E , cioè le permutazioni di n elementi dove k
elementi si ripetono k volte e n-k elementi si ripetono n-k volte. Il numero possibile dei modi in cui ordinare è
dato da
 n
n!
= 
k !⋅ ( n − k )!  k 
.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 8 di 11
La distribuzione binomiale è una variabile casuale; fissato il numero delle prove n ,
l'evento E si può presentare da zero volte a n volte con le rispettive probabilità; essendo
n
gli eventi incompatibili e necessari sarà
∑
k=0
Pk = 1 .
La distribuzione binomiale si potrà rappresentare anche con la consueta tabella delle
variabili casuali:
Xi
0
1
2
i
…
n
Pi
p0
p1
p2
pi
…
pn
Oltre alla funzione di distribuzione si considera la FUNZIONE DI RIPARTIZIONE definita
dalla formula
F ( X i ) = P ( X ≤ xi ) = po + p1 + p2 + ... + pi
ed esprime la probabilità che l'evento E si verifichi 0 volte o 1 volta o 2 volte o … i volte ,
cioè la probabilità che l'evento E si verifichi non più di i volte , fino a i volte.
Esempio:
1) Da un mazzo di 40 carte si estrae per 4 volte una carta, rimettendo ogni volta la carta estratto nel
mazzo.
Studiare la variabile casuale
X = numero delle figure estratte.
Lo schema è quello bernoulliano perché la probabilità di estrarre una figura è costante in ogni prova che
vengono ripetute sempre nelle stese condizioni; indicato con :
p = probabilità di estrarre una figura da un mazzo di carte di 40 carte , p =
12
=0,30 ;
40
q = probabilità di non estrarre una figura da un mazzo di carte di 40 carte , q =0,70;
n = numero delle estrazioni effettuate, n =4;
k = numero delle volte che si presenta l'evento favorevole E = 'figura estratta', k =0,1,2,3,4.
 n
Pk =   p k q
k
n−k
la probabilità che l'evento E si verifichi esattamente k volte,
gli eventi avranno le seguenti singole probabilità Pi :
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 9 di 11
 4
P0 =   ( 0 ,3 ) 0 ⋅ ( 0 ,7 ) 4 − 0 = 0 ,2 4 0 1
 0
 4
P1 =   ( 0 , 3 ) 1 ⋅ ( 0 , 7 ) 4 − 1 = 0 , 4 1 1 6
1 
 4
P2 =   ( 0 , 3 ) 2 ⋅ ( 0 , 7 ) 4 − 2 = 0 , 2 6 4 6
 2
 4
P3 =   ( 0 , 3 ) 3 ⋅ ( 0 , 7 ) 4 − 3 = 0 , 0 7 5 6
 3
 4
P4 =   ( 0 , 3 ) 4 ⋅ ( 0 , 7 ) 4 − 4 = 0 , 0 0 8 1
 4
P3 ,ad esempio, esprime la probabilità che nell'estrazione di 4 carte da un mazzo di 40 , rimettendo le
carte estratte nel mazzo, escano esattamente 3 figure.
F2 ,ad esempio, esprime la probabilità che escano non più di due figure, cioè o zero figure, o 1 figura o
2 figure.
La variabile può essere rappresentata mediante la tabella delle v.c.d. :
Xi
0
1
2
3
4
Pi
0,2401
0,4116
0,2646
0,0756
0,0081
Se il numero delle estrazioni salisse a otto si avrebbe la seguente variabile casuale :
Xi
0
1
2
3
4
5
6
7
8
Pi
0,0576
0,1977
0,2965
0,2541
0,1361
0,0467
0,01
0,0012
0,0001
Fi
0,0576
0,2553
0,5518
0,8059
0,942
0,9887
0,9987
0,9999
1
grafico della variabile casuale con estrazione di otto carte con reimmissione nel mazzo
estrazione di otto carte da un mazzo di 40 carte
probabilità
0,4
0,3
2
0,2
0,1
3
1
4
0
0
0
5
1
2
3
4
5
6
6
7
7
8
8
evento figura
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 10 di 11
MEDIA E VARIANZA DELLA VARIABILE CASUALE BINOMIALE
La media della variabile casuale binomiale si calcola ,come per le altre v.c., mediante
somma dei prodotti delle xi ( k ) modalità per le rispettive probabilità pi :
n
M ( X ) = ∑ k ⋅ Pk = 0 ⋅ P0 + 1 ⋅ P1 +...+n ⋅ Pn
k =0
Si dimostra che la media è uguale al prodotto della probabilità p per il numero delle
prove n : M ( X ) = n ⋅ p
La varianza della variabile casuale binomiale si calcola ,come per le altre v.c.,
mediante somma dei quadrati degli scarti dei valori xi ( k ) dalla media M ( X ) .
Si dimostra che la varianza è uguale al prodotto della probabilità p per la probabilità q
per il numero delle prove n : VAR( X ) = σ 2 ( X ) = n ⋅ p ⋅ q .
Lo scarto quadratico medio si ottiene al solito calcolando la radice quadrata della
varianza: s.q.m. = σ =
n⋅ p⋅q
Esempio: un dado viene lanciato 720 volte; determinare media e varianza dell'evento faccia '6':
E = 'nel lancio di un dado si presenta la faccia 6' ;
p = probabilità dell'evento E = 1 / 6 ;
_
q =probabilità dell’evento contrario E = 5 / 6 ,
n = 720, numero delle prove indipendenti ;
a)
M (X ) = n ⋅ p =
1
⋅ 720 = 120 il valore atteso è pari a 120, cioè lanciando 720 volte un dado dovremmo
6
aspettarci che la faccia '6' esca 120 volte; questo valore è solo un risultato "atteso", di probabilità. Lanciando
effettivamente il dado 720 volte il risultato reale può ovviamente discostarsi da quello teorico anche se la
differenza , se il dado non è truccato, sarà minima.
1 5
2
b) VAR( X ) = σ ( X ) = n ⋅ p ⋅ q = 6 ⋅ 6 ⋅ 720 = 100;
s.q.m. = σ = 100 = 10
BIBLIOGRAFIA
Le lezioni hanno trovato spunto dai seguenti testi:
1. Gambotto Manzone – Consolini , matematica con applicazioni informatiche 2, Tramontana ;
2. Scaglianti, il modello non deterministico, CEDAM;
3. Spiegel, collana SCHAUM , statistica, Etas libri;
4. Trovato – Manfredi, calcolo delle probabilità e statistica inferenziale, Ghisetti e Corvi editori;
5. Girone – Sallustio, esercizi di statistica, Cacucci editore;
6. Piccinato, calcolo delle probabilità, la goliardica editrice.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
VARIABILI CASUALI DISCRETE Pagina 11 di 11