LE VARIABILI CASUALI In termini probabilistici si parla di eventi come risultati di una prova e come insieme di descrizioni circa i possibili risultati di un esperimento. In termini statistici è utile “quantificare gli eventi’’, ovvero, considerare come risultati possibili di una prova non più gli eventi, ma un insieme di numeri reali, in corrispondenza con gli eventi. Da qui si genera il concetto di variabile casuale. Inoltre, al verificarsi di ciascun evento si associa un numero detto probabilità. Una variabile casuale (v.c.) è una regola, che associa ad ogni evento un numero reale, ovvero, è una funzione reale e misurabile definita sullo spazio campionario Ω. Quando si crea una corrispondenza tra l’insieme dei risultati di una prova e l’insieme (o un sottoinsieme) dei numeri reali assegnati, si definisce una v.c. Esempio 1 Se nell’esperimento “lancio di un dado” facciamo corrispondere ordinatamente l’insieme dei numeri interi naturali {1, 2, 3, 4, 5, 6} all’insieme dei sei possibili risultati {faccia con uno, due, …, sei punti}, allora stiamo definendo una v.c. X, che assume l’insieme di valori {1, 2, 3, 4, 5, 6}, uno per ciascuno dei sei possibili risultati del lancio. Si supponga di condurre un esperimento composto da n = 8 lanci, con il seguente schema di risultati: {E1, E2, E3, E4, E5, E6, E7, E8}→{1, 4, 3, 5, 4, 3, 2, 4} , così esemplificabile: Figura 1. Schema di realizzazione di una v.c. “lancio del dado”, con n = 8 lanci. E1 E5 E2 E4 E7 E3 E6 E8 1 2 3 4 5 Dalla figura è chiaro che la corrispondenza tra gli eventi (Ej; j = 1, 2, …, 8) e i numeri reali (xi; i = 1, 2, 3, 4, 5) è ben definita e che non deve essere necessariamente biunivoca. Inoltre, poiché gli eventi sono tra loro indipendenti, lo saranno anche le determinazioni della v.c. X. Infatti, agli eventi E2, E5 e E8 è associato lo stesso numero reale x4 = 4. Questo significa che tutte le volte che si verifica uno dei tre eventi la v.c. assume sempre il valore x4. O, in altre parole, che i tre eventi rappresentano un identico risultato del lancio. Definiamo meglio la v.c. Dato che ciascun evento E si verifica con probabilità P(E) e che noi associamo ad ogni evento E uno specifico valore della v.c. X, xE, allora possiamo affermare logicamente e coerentemente che: 1. l’evento E si verifica con probabilità P(E); 2. la v.c. X assume valore xE con probabilità P(E). Le due affermazioni sono assolutamente equivalenti, nel senso che una implica l’altra. La distribuzione di probabilità per gli eventi dello spazio campionario Ω è la stessa distribuzione di probabilità che si deduce per le v.c. facendo corrispondere agli eventi i numeri reali assegnati. Sulla base di quanto esemplificato in fig.1 avremo: 1 Variabile casuale X Valori P(x) v.c. X x1 p1 x2 p7 x3 p3 x4 p2+p5+p8 x5 p4+p6 Totale 1 Spazio campionario Ω Eventi P(E) E1 E2 E3 E4 E5 E6 E7 E8 Totale p1 p2 p3 p4 p5 p6 p7 p8 1 ⇒ Formalizzando: i. P(X = x1) = P(E1) = p1; ii. P(X = x2) = P(E7) = p7; iii. P(X = x3) = P(E3) = p3; iv. P(X = x4) = P(E2∪E5∪E8) = p2+ p5+p8; v. P(X = x5) = P(E4∪E6) = p4+ p6. Esempio 2 Esperimento: si lancino contemporaneamente 3 monete bilanciate. Lo Spazio campionario Ω sarà dato dalla combinazione dei tre possibili risultati (uno per ogni moneta), dati gli eventi elementari {T, C}: E1 = T∩T∩T E2 = T∩T∩C E3 = T∩C∩T E4 = C∩T∩T E5 = T∩C∩C E6 = C∩T∩C E7 = C∩C∩T E8 = C∩C∩C In Ω ciascun evento ha P(Ej) = 1/8, ∀ j = 1, 2, …, 8. Ma se in una prova l’evento di interesse è costituito dal numero complessivo di facce risultanti, allora possiamo definire così la v.c.: “X = numero di volte in cui esce testa (T) nel lancio congiunto di 3 monete”. Per ogni valore di X, avremo il seguente schema: valori di X 0 1 2 3 E P(E) E8 E5∪ E6∪ E7 E2∪ E3∪ E4 E1 1/8 3/8 3/8 1/8 che rappresenta la distribuzione di probabilità della v.c. X. Attraverso essa possiamo calcolare la probabilità degli eventi; ad esempio, che si verifichi più di una testa, nella sequenza dei tre lanci: P(X>1) = P[(X = 2)∪( X = 3)] = P(X = 2)+P( X = 3) = (3/8)+(1/8) = ½. La natura di Ω dipende dalla sua cardinalità, ovvero dal fatto che gli eventi elementari siano in numero discreto (finito o infinito numerabile), oppure un’infinità di tipo continuo. 2 Una v.c. si definisce attraverso una funzione misurabile a valori reali, definita sullo spazio campionario Ω. Una v.c. X può essere discreta o continua. Discreta se i valori ad essa assegnati sono di tipo discreto (in genere x∈N). Continua se i valori che assume appartengono ad un intervallo reale (x∈R). Tali distinzioni hanno conseguenze sulla rappresentazione probabilistica delle v.c. LE VARIABILI CASUALI DISCRETE Una v.c. discreta si dice nota, se è nota la sua distribuzione di probabilità. Ovvero, se si conoscono i valori che essa può assumere e le rispettive probabilità. La v.c. discreta è ben definita dal seguente prospetto: Valori di X Pr{X = xk} x1, x2, …, xk, … p1, p2, …, pk, … Totale Σpk = 1 Dove i “…” dopo xk e pk (seconda colonna) servono a includere sia il caso di Ω discreto finito (xk è il max assunto dalla v.c. X), sia il caso discreto numerabile (la v.c. X non ha valore massimo finito). La successione di valori ordinati (x1, x2, …, xk) è assolutamente arbitraria, ma, X sia un v.c. discreta, è necessario che la successione (p1, p2, …, pk) soddisfi i due seguenti requisiti: 1. pk ≥ 0 ∀ k = 1, 2, …; 2. Σk pk = 1 ∀ k = 1, 2, … La rappresentazione grafica di una v.c. discreta è un diagramma ove sulle ordinate sono poste le probabilità. LE VARIABILI CASUALI CONTINUE Per le v.c. continue non è possibile ottenere una rappresentazione equivalente a quella costruita per una v.c. discreta, perché non è possibile esprimere puntualmente i valori esatti che la v.c. X assume e quindi attribuire loro corrispondenti valori di probabilità. Per definire una v.c. continua si associa, a ciascun punto dell’intervallo su cui X è definita, una funzione f(x), che è proporzionale, a meno di un infinitesimo, alla probabilità associata a un intervallo sufficientemente piccolo. Pertanto, un v.c. continua X, che assume valori su un dato intervallo (a, b), è ben definita quando esiste una funzione, f(x), detta funzione di densità (f.d.) tale che: P(x0 ≤ X < x0+dx) = f(x0)⋅⋅dx ∀ x0∈(a, b). La funzione di densità, f(x), è così graficamente rappresentata: f(x) a x0 x0 + dx b 3 Se è nota la funzione di densità f(x) di una v.c. continua X, definita in (a, b), si possono calcolare le probabilità di qualsiasi evento, utilizzando le nozioni elementari di calcolo integrale. Infatti, per un qualsiasi intervallo (c, d)⊂(a, b): P(c ≤ X ≤ d) = ∫ d c f ( x )dx . f(x) c a d b Se la f(x) è definita su (a, b) si assume che lo sia sull’intero intervallo ]–∞, +∞[, con la convenzione che: f(x) = 0 per x < a e x > b. Inoltre, è necessario che siano soddisfatte le seguenti condizioni: 1. f(x) ≥ 0 2. ∫ ∀ –∞ < x < +∞, +∞ −∞ f ( x )dx = 1 Dalla definizione di v.c. continua discende che: i. la probabilità che la v.c. continua assuma un qualsiasi valore puntuale x0 è nulla: P(X = x0) = P(x0 ≤ X ≤ x0) = ii. ∫ x0 f ( x )dx = 0 ; x0 P(X < x0) = P(X ≤ x0); iii. P(X > x0) = 1–P(X < x0) = 1 − ∫ x0 −∞ f ( x )dx . La funzione cumulata della funzione di densità è nota come funzione di ripartizione e si indica con F(x): F(x0) = P(X ≤ x0) = ∫ x0 −∞ f ( x )dx ∀ –∞ < x0 < +∞. La probabilità di qualsiasi evento è deducibile da F(x): P(a ≤ X < b) = F(b)–F(a). 4