3) VARIABILI CASUALI 3.1) Significato e definizione La variabile casuale (v.c.) è un modello matematico in grado di interpretare gli esperimenti casuali. Infatti gli eventi elementari che compongono lo spazio campionario possono essere di qualunque natura (“T” e “C” nel lancio della moneta, “m” e “f” nella previsione del sesso del nascituro, “figura”, “cuori”, “fiori” nell’estrazione da un mazzo di carte ecc.). Da qui l’esigenza di uno strumento che trasformi gli eventi elementari in numeri reali x sui quali è possibile usare la matematica. Nella “trasformazione” non si deve trascurare che: a) ad ogni evento elementare è associata una probabilità; b) qualunque insieme di eventi elementari rappresenta un evento (compreso l’insieme vuoto che rappresenta l’evento impossibile) con associata la propria probabilità. La v.c. è tale strumento. IMMAGINE E CONTROIMMAGINE Ogni elemento in , tramite la funzione X(), trova una “immagine” in un punto di ascissa x della retta R . Può accadere anche che la stessa ascissa x sia l’immagine in R di più elementi di , ad esempio se più oggetti degli n precedenti hanno lo stesso numero x. Tali oggetti formano un sottoinsieme E di , che è a sua volta un elemento dell’insieme delle parti al quale la funzione P ha assegnato la probabilità P(E). L’ascissa x di R ha quindi la sua controimmagine nell’elemento E di e di conseguenza si assegna ad x la probabilità che la funzione P ha attribuito ad E, cioè: P (X = x) = P (E) Una variabile casuale verrà intesa come l’insieme delle coppie di valori: x1, x1 ,..., xi , xi ,..., x n , x n con x i 0, i 1,..., n , e n x 1, i 1 i adottando a volte anche la notazione (xi)=P(X=xi). Si dirà inoltre che la v.c. X assume i valori x1,…,xi,…,xn, dove per motivi di semplicità si pone x1<…<xi<…<xn, con “funzione di probabilità” (f.p.) (xi), (i=1,…,n). Ricordiamoci comunque che: •i valori x1,…,xi,…,xn formano lo spazio numerico indicato in precedenza con R e tale spazio rappresenta l’insieme delle immagini in R di eventi le cui controimmagini sono elementi di B. • (x) è la funzione che assume quali valori le probabilità relative all’elemento o agli elementi di B la cui immagine sull’asse R è rappresentata dall’ascissa x. Sotto il profilo grafico il comportamento della f.p. (x) è del tipo: (x) x 0 x1 x2 xi xn cioè (x) è costantemente nulla ad eccezione dei punti di ascissa x1,…,xi,…,xn in cui effettua salti pari alla probabilità (x1),…, (xi),…, (xn). La v.c. X è una funzione con dominio nello spazio campionario e codominio in . X assegna ad ogni uno ed un solo numero reale x , detto “valore o determinazione di X”; un numero reale x può avere più di una controimmagine in e l’insieme di tali controimmagini rappresenta un evento (o un evento elementare, o l’evento impossibile). Esempio 1: =lancio contemporaneo di una moneta e di un dado regolari 1T 2T 3T 4T 5T 6T 1C 2C 3C 4C 5C 6C X = “punteggio del dado - n. croci” è una v.c.. Essa ha dominio in e codominio in , poiché ad ogni evento elementare associa un numero x . 1T 2T 3T 4T 5T 6T 1C 2C 3C 4C X 1 2 3 4 5 6 0 1 2 3 5C 6C 4 5 Quindi X ha “trasformato” gli eventi elementari in numeri. In tale trasformazione ha conservato le probabilità associate a . Infatti: P (X = 0) = P (1C) = 1/12 P (X = 1) = P (1T) + P (2C) = 2/12 = 1/6 … … P (X = 5) = P (5T) + P (6C) = 2/12 = 1/6 P (X = 6) = P (6T) = 1/12 Infine qualunque numero reale x ha come controimmagine un evento (o un evento ele-mentare o l’evento impossibile). Ad esempio, la controimmagine, attraverso X, del numero 5 è l’evento {5T, 6C}= “esce 5 e T oppure esce 6 e C”; la controimmagine, attraverso X, del nu-mero 0 è l’evento elementare {1C} = “esce 1 e C”; la controimmagine, attra-verso X, del nu-mero 8 è l’evento impossibile {} = . 3.2) Funzione di ripartizione (f.r.) Definizione: ad ogni v.c. X è associata la f.r. (x) così definita: (x) = probabilità che X assuma valori inferiori o uguali al numero x = P (X x) = P{(-,x]}= ( xi ) ( x1 ) ( x2 ) ... ( x) xi x Proprietà della f.r.: 1. lim ( x) 0 x e lim ( x) 1 x infatti la definizione di (x) mette in luce che si tratta di una probabilità. 2. Fissati due numeri x e y con x < y allora (x)(y), cioè la f.r. è monotona non decrescente. (Le proprietà 1 e 2 garantiscono che la f.r. assume valori compresi tra 0 e 1). 3. La f.r. gode della proprietà matematica della continuità (puntuale). In particolare è continua (almeno) a “destra”, cioè: lim ( x ) ( x) 0 Osservazione: la f.r. è utile, ad esempio, per cal-colare la seguente probabilità: dati 2 numeri a e b, con a<b si ha: P (a<X<b) = P (Xb) - P (Xa) = (b) - (a) in quanto: P( X b) P( X a ) P(a X b) da cui: P(a X b) P( X b) P( X a ) ( b ) (a ) e graficamente: (x) 1- x 0 x1 x2 xi xn che è una funzione a gradini del tipo: 0 x 1 x1 x2 x x1 x2 ... xi x1 x2 ... xn-1 1 per - x x1 per x1 x x2 per x2 x x3 per xi x xi 1 per xn-1 x xn per xn x Osservazione: la f.r. è utile, ad esempio, per calcolare la seguente probabilità: dati 2 numeri a e b, con a<b si ha: P (a<X<b) = P (Xb) - P (Xa) = (b) - (a) 3.3) V.c. discrete e continue X è v.c. discreta se il suo dominio è un insieme finito o infinito numerabile. Caratteristiche di una v.c. discreta 1. L’insieme dei valori x assumibili dalla v.c. X è finito o infinito numerabile. 2. Generalmente le determinazioni x di X sono numeri interi. 3. Le probabilità associate alla v.c. X sono interpretate da una funzione detta di probabilità. X è v.c. continua se il suo dominio è un insieme infinito non numerabile cioè con la potenza del continuo. 1. L’insieme dei valori x assumibili dalla v.c. X è infinito non numerabile (ad esempio coincide con o con un intervallo). 2. Perdono di significato i singoli punti x ed è necessario procedere con riferimento ad intervalli. 3. Le probabilità associate alla v.c. X sono interpretate da una funzione detta di densità. Esempio 2: la v.c. dell’esempio 1 è discreta perché assume i 7 valori x = 0,1,2,3,4,5,6. La v.c. interprete del peso dei neonati che nasceranno nella prossima ora nella clinica XXX della città YYY è uin esempio di v.c. continua. Il peso dei neonati è infatti un numero x appartenente ad un intervallo di , ad esempio x (2000, 5000) grammi. V.c. continue La figura mostra un esempio di funzione di densità di probabilità, dove in ascissa ci sono le X ed in ordinata le densità associate ai valori di X. La curva continua deriva dai rettangoli facendo tendere a 0 la base degli stessi. 3.4) Funzione di probabilità (f.p.) 1. 0<p(x)1 Infatti la definizione di p(x) mette in luce che si tratta di una probabilità 2. p( x) 1 x La somma delle probabilità associate a tutti i valori x della v.c. X vale 1. Tale somma coincide, infatti, con P(). Esempio 1 (continua): la v.c. X = “punteggio del dado - n. delle croci” è v.c. discreta perché può assumere i soli valori x = 0,1,2,...,6. X ha f.p.: x 0,6 1 / 12 p( x) 2 / 12 1 / 6 x 1,...,5 con 0 p(x) 1 e 6 1 1 p ( x) 2 5 1. 12 6 x 0 X ha anche f.r.: (x) = P (Xx) = p( y ) y x Ad esempio con a = 3 e b = 5 si ha: P(a<Xb) = P(3<X5) = (5)-(3) = p( y ) p( y ) y 5 y 3 = [p(5) + p(4) + p(3) + p(2) + p(1) + p(0)] - [p(3) + p(2) + p(1) + p(0)] = p(5) + p(4) = =1/6 + 1/6 = 2/6 = 1/3 Osservazione: (3<X5) rappresenta l’evento {4T, 5C, 5T, 6C}. 3.5) Funzione di densità (f.d.) Se X è una v.c. continua, le probabilità che rimangono associate ai valori di X sono interpretate dall’area sottesa a una funzione (x) detta f.d. Esempio 3: sia X la v.c. che assume i valori x dell’intervallo [0,4]. Allora x è v.c. continua. Sia 0.25 0 x 4 ( x) altrove 0 La f.d. di X. Graficamente (x) è composta dai 3 segmenti: (x) 0.25 - 0 4 + x L’area sottesa a tali segmenti esprime la probabilità associata all’insieme di valori di X. Ad esempio: P(1X 3) = (3 - 1)0.25 = 0.5 (x) 0.25 - + x 0 1 3 4 Osservazioni: • l’area totale sottesa a (x) è pari a 1 e coincide con P(); • (1 X 3) rappresenta un evento; • poiché X è continua le probabilità puntuali sono nulle. Infatti: P(X = x) = area sottesa ad un punto di (x) = 0 poiché l’area sottesa ad un punto è, come si intuisce, nulla. È per tale motivo che nel caso continuo occorre procedere con riferimento ad intervalli; • per l’osservazione precedente gli eventi (a X b), (a X < b) e (a < X < b)hanno tutti la stessa probabilità, poiché, ad esempio, P(a X b) = P(a < X < b) + P(X = a) + P( X = b) = P(a < X < b) + 0 + 0; • anche la v.c. X continua ha associata la f.r. (x) = P(X x). Poiché i valori minori o uguali a x rappresentano l’intervallo (-, x] allora la f.r. per x continua è rappresentata dall’area sottesa alla f.d. (x) a sinistra del punto x. Esempio 3 (continua) (x) = P(X x) = (x - 0)0.25 = 0.25 x (x) 0.25 - + x 0 x 4 3.6) Valore atteso (media) di una v.c. Il valore atteso (media) di una v.c. X è un numero che informa sull’ordine di grandezza e sulla “tendenza centrale” (baricentro) di X. La media della v.c. X si calcola attraverso l’operazione E(X) che è diversa a seconda che X sia discreta o continua. Se X è discreta l’operazione E(X) consiste nel sommare tutti i prodotti fra i valori di x ed il corrispondente valore della funzione di probabilità p(x). Formalmente: E ( X ) x p( x) x P( X x). x x Se X è continua il calcolo del valore atteso richiede l’operazione di integrale che è strumento non contemplato tra gli obbiettivi di questo eserciziario. È quindi possibile scambiare tra loro i simboli e E comunque siano le v.c. Xi sommate. Esempio 1 (continua) la media della v.c. X = “punteggio del dado - n. di croci” è 6 E X x p x x 0 = 01/12 + 11/6 + 21/6 + 31/6 + 41/6 + + 51/6 + 61/12 = 36/12 = 3. 3.7) Varianza di una v.c. La varianza 2 = V(X) di una v.c. Xè un numero positivo che informa circa la dispersione dei valori X intorno alla media ed è così definita: 2 V X E X E X 2 E X 2 . V(X) si calcola attraverso l’operazione di valore atteso E. ad esempio, se X è discreta si ha: V X E X x p x . 2 2 x Esempio 1 (continua): la varianza della v.c. X = “punteggio del dado - n. di croci” è: 6 V X E X x 3 p x 2 x 0 2 = (0 - 3)21/12 + (1 - 3)21/6 + + (3 - 3)21/6 + (4 - 3)21/6 + (5 - 3)21/6 + + (6 - 3)21/12 = 38/12 = 3.16