9. Le Variabili Casuali_SPS

annuncio pubblicitario
LE VARIABILI CASUALI
In termini probabilistici si parla di eventi come risultati di una prova e come insieme di descrizioni circa i
possibili risultati di un esperimento.
In termini statistici è utile “quantificare gli eventi’’, ovvero, considerare come risultati possibili di una
prova non più gli eventi, ma un insieme di numeri reali, in corrispondenza con gli eventi. Da qui si
genera il concetto di variabile casuale. Inoltre, al verificarsi di ciascun evento si associa un numero detto
probabilità.
Una variabile casuale (v.c.) è una regola, che associa ad ogni evento un numero reale, ovvero, è una
funzione reale e misurabile definita sullo spazio campionario Ω. Quando si crea una corrispondenza tra l’insieme
dei risultati di una prova e l’insieme (o un sottoinsieme) dei numeri reali assegnati, si definisce una v.c.
Esempio 1
Se nell’esperimento “lancio di un dado” facciamo corrispondere ordinatamente l’insieme dei numeri
interi naturali {1, 2, 3, 4, 5, 6} all’insieme dei sei possibili risultati {faccia con uno, due, …, sei punti}, allora
stiamo definendo una v.c. X, che assume l’insieme di valori {1, 2, 3, 4, 5, 6}, uno per ciascuno dei sei
possibili risultati del lancio.
Si supponga di condurre un esperimento composto da n = 8 lanci, con il seguente schema di risultati:
{E1, E2, E3, E4, E5, E6, E7, E8}→{1, 4, 3, 5, 4, 3, 2, 4} , così esemplificabile:
Figura 1. Schema di realizzazione di una v.c. “lancio del dado”, con n = 8 lanci.
E1
E5
E2
E4
E7
E3
E6
E8
1
2
3 4
5
Dalla figura è chiaro che la corrispondenza tra gli eventi (Ej; j = 1, 2, …, 8) e i numeri reali (xi; i = 1, 2,
3, 4, 5) è ben definita e che non deve essere necessariamente biunivoca. Inoltre, poiché gli eventi sono
tra loro indipendenti, lo saranno anche le determinazioni della v.c. X.
Infatti, agli eventi E2, E5 e E8 è associato lo stesso numero reale x4 = 4. Questo significa che tutte le
volte che si verifica uno dei tre eventi la v.c. assume sempre il valore x4. O, in altre parole, che i tre
eventi rappresentano un identico risultato del lancio.
Definiamo meglio la v.c. Dato che ciascun evento E si verifica con probabilità P(E) e che noi
associamo ad ogni evento E uno specifico valore della v.c. X, xE, allora possiamo affermare logicamente
e coerentemente che:
1. l’evento E si verifica con probabilità P(E);
2. la v.c. X assume valore xE con probabilità P(E).
Le due affermazioni sono assolutamente equivalenti, nel senso che una implica l’altra.
La distribuzione di probabilità per gli eventi dello spazio campionario Ω è la stessa distribuzione di
probabilità che si deduce per le v.c. facendo corrispondere agli eventi i numeri reali assegnati.
Sulla base di quanto esemplificato in fig.1 avremo:
1
Variabile casuale X
Valori
P(x)
v.c. X
x1
p1
x2
p7
x3
p3
x4
p2+p5+p8
x5
p4+p6
Totale
1
Spazio campionario Ω
Eventi
P(E)
E1
E2
E3
E4
E5
E6
E7
E8
Totale
p1
p2
p3
p4
p5
p6
p7
p8
1
⇒
Formalizzando:
i. P(X = x1) = P(E1) = p1;
ii. P(X = x2) = P(E7) = p7;
iii. P(X = x3) = P(E3) = p3;
iv. P(X = x4) = P(E2∪E5∪E8) = p2+ p5+p8;
v. P(X = x5) = P(E4∪E6) = p4+ p6.
Esempio 2
Esperimento: si lancino contemporaneamente 3 monete bilanciate. Lo Spazio campionario Ω sarà dato
dalla combinazione dei tre possibili risultati (uno per ogni moneta), dati gli eventi elementari {T, C}:
E1 = T∩T∩T
E2 = T∩T∩C
E3 = T∩C∩T
E4 = C∩T∩T
E5 = T∩C∩C
E6 = C∩T∩C
E7 = C∩C∩T
E8 = C∩C∩C
In Ω ciascun evento ha P(Ej) = 1/8, ∀ j = 1, 2, …, 8.
Ma se in una prova l’evento di interesse è costituito dal numero complessivo di facce risultanti, allora
possiamo definire così la v.c.: “X = numero di volte in cui esce testa (T) nel lancio congiunto di 3 monete”. Per
ogni valore di X, avremo il seguente schema:
valori di
X
0
1
2
3
E
P(E)
E8
E5∪ E6∪ E7
E2∪ E3∪ E4
E1
1/8
3/8
3/8
1/8
che rappresenta la distribuzione di probabilità della v.c. X.
Attraverso essa possiamo calcolare la probabilità degli eventi; ad esempio, che si verifichi più di una
testa, nella sequenza dei tre lanci:
P(X>1) = P[(X = 2)∪( X = 3)] = P(X = 2)+P( X = 3) = (3/8)+(1/8) = ½.
La natura di Ω dipende dalla sua cardinalità, ovvero dal fatto che gli eventi elementari siano in numero
discreto (finito o infinito numerabile), oppure un’infinità di tipo continuo.
2
Una v.c. si definisce attraverso una funzione misurabile a valori reali, definita sullo spazio campionario
Ω. Una v.c. X può essere discreta o continua. Discreta se i valori ad essa assegnati sono di tipo discreto (in
genere x∈N). Continua se i valori che assume appartengono ad un intervallo reale (x∈R).
Tali distinzioni hanno conseguenze sulla rappresentazione probabilistica delle v.c.
LE VARIABILI CASUALI DISCRETE
Una v.c. discreta si dice nota, se è nota la sua distribuzione di probabilità. Ovvero, se si conoscono i valori
che essa può assumere e le rispettive probabilità. La v.c. discreta è ben definita dal seguente prospetto:
Valori di X
Pr{X = xk}
x1, x2, …, xk, …
p1, p2, …, pk, …
Totale
Σpk = 1
Dove i “…” dopo xk e pk (seconda colonna) servono a includere sia il caso di Ω discreto finito (xk è il
max assunto dalla v.c. X), sia il caso discreto numerabile (la v.c. X non ha valore massimo finito).
La successione di valori ordinati (x1, x2, …, xk) è assolutamente arbitraria, ma, X sia un v.c. discreta, è
necessario che la successione (p1, p2, …, pk) soddisfi i due seguenti requisiti:
1. pk ≥ 0
∀ k = 1, 2, …;
2. Σk pk = 1
∀ k = 1, 2, …
La rappresentazione grafica di una v.c. discreta è un diagramma ove sulle ordinate sono poste le
probabilità.
LE VARIABILI CASUALI CONTINUE
Per le v.c. continue non è possibile ottenere una rappresentazione equivalente a quella costruita per una
v.c. discreta, perché non è possibile esprimere puntualmente i valori esatti che la v.c. X assume e quindi
attribuire loro corrispondenti valori di probabilità.
Per definire una v.c. continua si associa, a ciascun punto dell’intervallo su cui X è definita, una funzione
f(x), che è proporzionale, a meno di un infinitesimo, alla probabilità associata a un intervallo
sufficientemente piccolo.
Pertanto, un v.c. continua X, che assume valori su un dato intervallo (a, b), è ben definita quando esiste
una funzione, f(x), detta funzione di densità (f.d.) tale che:
P(x0 ≤ X < x0+dx) = f(x0)⋅⋅dx
∀ x0∈(a, b).
La funzione di densità, f(x), è così graficamente rappresentata:
f(x)
a
x0
x0 + dx
b
3
Se è nota la funzione di densità f(x) di una v.c. continua X, definita in (a, b), si possono calcolare le
probabilità di qualsiasi evento, utilizzando le nozioni elementari di calcolo integrale. Infatti, per un
qualsiasi intervallo (c, d)⊂(a, b):
P(c ≤ X ≤ d) =
∫
d
c
f ( x )dx .
f(x)
c
a
d
b
Se la f(x) è definita su (a, b) si assume che lo sia sull’intero intervallo ]–∞, +∞[, con la convenzione che:
f(x) = 0
per x < a
e
x > b.
Inoltre, è necessario che siano soddisfatte le seguenti condizioni:
1. f(x) ≥ 0
2.
∫
∀ –∞ < x < +∞,
+∞
−∞
f ( x )dx = 1
Dalla definizione di v.c. continua discende che:
i. la probabilità che la v.c. continua assuma un qualsiasi valore puntuale x0 è nulla:
P(X = x0) = P(x0 ≤ X ≤ x0) =
ii.
∫
x0
f ( x )dx = 0 ;
x0
P(X < x0) = P(X ≤ x0);
iii. P(X > x0) = 1–P(X < x0) = 1 − ∫
x0
−∞
f ( x )dx .
La funzione cumulata della funzione di densità è nota come funzione di ripartizione e si indica con F(x):
F(x0) = P(X ≤ x0) =
∫
x0
−∞
f ( x )dx
∀ –∞ < x0 < +∞.
La probabilità di qualsiasi evento è deducibile da F(x):
P(a ≤ X < b) = F(b)–F(a).
4
Scarica