Capitolo 5 Distribuzioni di probabilità 5.1 Variabili aleatorie Dopo esserci occupati di calcolo delle probabilità procediamo all’introduzione di un’ulteriore tipologia di variabile: la cosiddetta variabile aleatoria. Si tratta di un concetto di importanza notevole in diverse applicazioni. Per comprendere cos’è una variabile aleatoria prendiamo in considerazione la situazione concreta in cui si effettua il lancio di due dadi. Nella fattispecie indichiamo con la lettera X la somma dei due valori che emergono dal lancio dei dadi. È evidente che X può prendere i valori: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12. La X considerata nell’esperimento è un esempio di variabile aleatoria. Dal punto di vista intuitivo possiamo dire che una variabile aleatoria è una grandezza che assume i valori ottenuti da un esperimento aleatorio. Alla luce di ciò possiamo indicare come ulteriore esempio di variabile aleatoria la grandezza C che rappresenta il numero di “croce” che si presentano a seguito del lancio di 200 monete. Una variabile aleatoria può anche essere pensata come una funzione. Nel caso visto in precedenza la variabile X può essere intesa come la funzione che associa a ogni possibile risultato del lancio di due dati la somma dei valori ottenuti. Detto ciò è possibile dare una definizione più rigorosa di variabile aleatoria. Definizione 5.1.1 Si dice variabile aleatoria ( o variabile casuale) una funzione che associa a ogni possibile risultato di un esperimento aleatorio (evento contenuto nello spazio campionario dell’evento) un numero reale. In altri termini, se è lo spazio campionario di un esperimento aleatorio e X è una variabile aleatoria relativa all’esperimento, è possibile vedere X come funzione che va da in R. Esempio 5.1.1 Consideriamo l’esperimento nell’ambito del quale si effettua il lancio di 3 monete. In tal caso indichiamo con la X il numero di “croce” che si ottiene. Nella fattispecie CCC, CCT , CTC, CTT , TCC, TCT , TTC, TTT e i valori che la variabile prende vanno dallo 0 al 3. Precisiamo che è possibile prendere in considerazione l'evento "X assume il valore xi" , dove i è un numero intero compreso tra 1 ed n e calcolarne la probabilità che coincide con la somma delle probabilità degli eventi elementari la cui immagine tramite X è uguale a xi. Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) Esempio 5.1.2 Consideriamo l’esperimento la variabile aleatoria X che indica il numero di "croce" uscite a seguito del lancio di 3 monete. Stabiliamo la probabilità degli eventi X = 0, X = 1, X = 2, X = 3. • la probabilità che sia X = 0 coincide con la probabilità dell'evento elementare TTT che è 1 pari a 8 • la probabilità che sia X = 1 coincide con la somma delle probabilità degli eventi elementari 3 CTT, TCT e CCT che è uguale a 8 • la probabilità che sia X = 2 coincide con la somma delle probabilità degli eventi elementari 3 CCT, CTC e TCC che è uguale a 8 • la probabilità che sia X = 3 coincide con la somma delle probabilità dell’evento elementare 1 CCC che è uguale a 8 In definitiva: p ( X 0) 1 3 3 1 , p( X 1) , p ( X 2) e p( X 3) . 8 8 8 8 5.2 Distribuzioni di probabilità di variabili aleatorie discrete Partendo dal presupposto che la X sia una variabile aleatoria discreta che prende i valori x1 , x2 , …, xn si può associare a ciascuno degli eventi X = x1 , X = x2 , …, X = xn la probabilità corrispondente. Questa costruzione si definisce come segue: Definizione 5.2.1 Si dice distribuzione di probabilità (o densità) di una variabile aleatoria X discreta la funzione che associa ad ogni valore xi che la variabile aleatoria assume la rispettiva probabilità pi . Si precisa che la distribuzione di probabilità di una variabile aleatoria discreta si presenta facendo uso di una tabella come quella sottostante. Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) xi p ( X xi ) x1 p( X x1 ) … … x2 p( X x2 ) xn p( X x n ) Si osserva che gli eventi X = x1 , X = x2 , …, X = xn sono disgiunti e che la loro unione coincide con l’intero spazio campionario . Segue immediatamente che p1 p2 ... pn 1 . Osservazione 5.2.1 Per poter parlare di distribuzione di probabilità (o densità) di una variabile aleatoria X discreta la variabile deve assumere i valori x1, x2, …, xn al verificarsi degli eventi aleatori E1, E2, …, En incompatibili e complementari, eventi a cui corrispondono, rispettivamente, le probabilità p1, p2, …, pn. Si precisa che gli eventi E1, E2, …, En sono incompatibili se disgiunti (in simboli: Ei E j 0 i, j con 0 i, j n e sono complementari se E1 E2 ... En . Si precisa che la distribuzione di probabilità di una variabile aleatoria discreta si presenta facendo uso di una tabella come quella sottostante. Esempio 5.2.2 Costruiamo la distribuzione di probabilità della variabile aleatoria X di cui all’esempio 5.1.2. In base a quanto stabilito precedentemente si ha che: xi 0 1 8 p ( X xi ) Come è facile verificare: 1 3 8 2 3 8 3 1 8 1 3 3 1 1. 8 8 8 8 Esempio 5.2.3 Costruiamo la distribuzione di probabilità della variabile aleatoria X che assume i valori 1, 2, 3, 4, 5, 6 che corrispondono ai valori ottenuti lanciando un dado cubico regolare a 6 facce. Gli eventi corrispondenti E1: “esce la faccia con 1”, E2: “esce la faccia con 2”, E3: “esce la faccia con 3”, E4: “esce la faccia con 4”, E5: “esce la faccia con 5”, E6: “esce la faccia con 6” . Si ha che xi p ( X xi ) e: 1 1 6 2 1 6 3 1 6 4 1 6 5 1 6 1 1 1 1 1 1 1. 6 6 6 6 6 6 Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) 6 1 6 5.3 Media, varianza, scarto quadratico medio e scarto quadratico assoluto di una variabile aleatoria discreta Prima di introdurre i concetti in questione compiamo una breve digressione. Quanto fatto in questo contesto presenta una notevole analogia con quanto si fa in ambito statistico. Anche in statistica dopo avere introdotto una variabile statistica discreta X che assume i valori x1,x2, …,xn si introduce la distribuzione di frequenze relative xi x1 fi f1 x2 m1 m f2 m2 m … … xn fn mn m dove mi è il numero di volte che la variabile X prende il valore xi (frequenza assoluta del dato xi mi è la frequenza relativa del dato xi e m m1 m2 ... mn . Successivamente si m definiscono gli indici media , varianza 2 , scarto quadratico medio o deviazione standard e fi ) , scarto assoluto medio come segue: x1m1 x2 m2 ... xn mn m m m x1 1 x2 2 ... xn n x1 f1 x2 f 2 ... xn f n , m m m m 2 x1 2 f1 x2 2 f 2 ... xn 2 f n , x1 2 f1 x2 2 f 2 ... xn 2 f n e x1 f1 x2 f 2 ... xn f n . La varianza, lo scarto quadratico medio e lo scarto assoluto medio rendono conto di quanto in media i valori assunti dalla variabile X si discostano dalla media. Osservazione 5.3.1 È possibile operare sull’espressione algebrica che fornisce la varianza in modo tale da ottenere una formula ridotta che può essere utilizzata in sostituzione a quella data precedentemente. Al fine di ottenerla sviluppiamo la formula di cui sopra. Si ha che 2 x1 2 f1 x2 2 f 2 ... xn 2 f n x1 2x1 2 f1 x2 2 x2 2 f 2 ... xn 2xn 2 f n 2 2 2 x1 f1 x2 f 2 ... xn f n 2 x1 f1 2 x2 f 2 ... 2xn f n 2 f1 2 f 2 ... 2 f n 2 2 2 x1 f1 x2 f 2 ... xn f n 2 x1 f1 x2 f 2 ... xn f n ) 2 ( f1 f 2 ... f n . 2 2 2 Ora Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) x1 f1 x2 f 2 ... xn f n e f1 f 2 ... f n m m1 m2 1 1 ... n m1 m2 ... mn m 1 . m m m m m Da cui segue che 2 x12 f1 x2 2 f 2 ... xn 2 f n 2 x1 f1 x2 f 2 ... xn f n ) 2 ( f1 f 2 ... f n 2 x12 f1 x2 2 f 2 ... xn 2 f n 2 2 2 x12 f1 x2 2 f 2 ... xn 2 f n 2 che è la formula ridotta annunciata. Per analogia con gli indici visti in ambito statistico introduciamo in questo contesto la media, la varianza e lo scarto quadratico medio di una variabile aleatoria discreta come segue: E ( X ) x1 p1 x2 p2 ... xn pn , 2 V ( X ) x1 2 p1 x2 2 p2 ... xn 2 pn x12 p1 x2 2 p2 ... xn 2 pn 2 , S(X ) x1 2 p1 x2 2 p2 ... xn 2 pn S a ( X ) x1 p1 x2 p2 ... xn pn . Dal punto di vista concreto la media di una variabile aleatoria discreta fornisce un valore che si avvicina sempre di più alla media aritmetica dei valori assunti dalla variabile man mano che il numero di prove aumenta. La varianza, lo scarto quadratico medio e lo scarto assoluto medio invece indicano di quanto mediamente i valori della variabile aleatoria si discostano dalla media quando si esegue un certo numero di prove. Esempio 5.3.1 Calcoliamo la media, la varianza, lo scarto quadratico medio e lo scarto assoluto medio della variabile aleatoria introdotta nell’esempio 5.1.2. Come ben sappiamo la sua distribuzione di probabilità è: xi 0 1 8 p ( X xi ) 1 3 8 2 3 8 Se si tiene conto delle definizioni date si ha che 1 8 3 8 3 8 1 8 E( X ) 0 1 2 3 3 2 Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) 3 1 8 2 1 3 3 1 3 3 V ( X ) 0 12 2 2 3 2 8 8 8 8 2 4 2 2 S(X ) V (X ) Sa ( X ) 0 3 0,87 4 3 1 3 3 3 3 3 1 3 1 2 3 . 2 8 2 8 2 8 2 8 4 5.4 Giochi equi I concetti di variabile aleatoria e di valor medio della stessa ci consentono di fornire un modello matematico che ha la funzione di stabilire se un gioco è equo o meno. Intanto va precisato che la variabile aleatoria può essere vista come la funzione che esprime la quantità di denaro che un giocatore deve pagare o incassare al verificarsi di uno specifico evento. In questo caso il valor medio della variabile aleatoria esprime la somma di denaro che il giocatore tende ad incassare o a pagare nell’ambito di un gioco di sorte all’aumentare del numero di giocate. Risulta quindi evidente che: il gioco è equo se il valor medio di X è 0 il gioco è favorevole se il valor medio di X è positivo il gioco è sfavorevole se il valor medio di X è negativo. Esempio 5.4.1 Un giocatore lancia un dado: se esce un numero dispari deve pagare 5 €, se esce 2 vince 6 €, se esce 4 non perde nulla, se esce 6 vince 4 €. La distribuzione di probabilità della variabile X che rappresenta la somma che deve incassare o versare è: xi -5 1 2 p ( X xi ) 6 1 6 0 1 6 4 1 6 Il suo valor medio è 1 2 1 6 1 6 E ( X ) (5) 6 0 4 1 5 . 6 Ne consegue che il gioco risulta essere sfavorevole. Il giocatore all’aumentare del numero delle giocate tende a perdere 5 €. Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) 5.5 Variabile aleatoria con distribuzione uniforme Una variabile discreta X con distribuzione uniforme si presenta come segue xi 1 1 n p ( X xi ) … … 2 1 n n 1 n Come è facile notare la definiamo distribuzione uniforme perché tutte le probabilità sono uguali. Si 1 vede facilmente che p1 p 2 ... p n n 1. Calcoliamo il valor medio della suddetta n 1 1 1 1 1 n 1 1 n n variabile. Si ha che E ( X ) 1 2 ... n 1 2 ... n . n n n n 2 n 2 Osservazione 5.5.1 Facciamo notare che la somma dei primi n numeri gode di una proprietà peculiare. La si può scoprire disponendo i numeri dapprima in ordine crescente e successivamente in ordine decrescente come segue: 1 2 … n-1 n (ordine crescente) n n-1 … 2 1 (ordine decrescente) Se si esegue la somma colonna per colonna si scopre che tutte le somme coincidono con il valore n+1. In altri termini, il doppio della somma dei primi n numeri è pari ad n volte il numero n + 1. 1 n n , dove con Sn si indica la somma dei primi n numeri. Segue che S n 2 Per confermare tale risultato consideriamo la somma dei primi 10 numeri. Si ha che 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 da cui si evince che 2S10 (1 10) 10 e, quindi, che S10 (1 10) 10 55 . 2 Qui di seguito determineremo la varianza della variabile aleatoria in questione. Si ha che 1 1 1 1 n x1 p1 x 2 p 2 ... x n p n 1 2 2 ... n 2 n n n 2 2 2 1 2 2 2 2 2 ... n 2 2 2 2 n 12n 1 1 n 2n 2 3n 1 1 2n n 2 1 1 n n 2 6 6 4 2 2 2 Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) 4n 2 6n 2 3 6n 3n 2 n 2 1 . 12 12 Osservazione 5.5.2 Si precisa che la somma dei primi n quadrati è uguale a nn 12n 1 . Poniamo 6 S 12 2 2 3 2 ... n 2 .Osserviamo che S 12 2 2 3 2 ... n 2 1 1 2 2 3 3 ... n n 1 2 2 3 3 3 ... n .... n . 2 addendi 3 addendi naddendi I numeri in questione possono essere disposti come segue: 1+2+3+ …+ n 2+3+… + n 3+… + n .. n Ora completiamo la tabella come segue: 1+2+3+ …+ n 1+2+3+… + n 1+2+3+… + n .. .. 1+2+3+ …+ n In ognuna delle n righe dell’ultima tabella è presente la somma dei primi n numeri naturali. Dal n( n 1) momento che la somma dei primi n numeri naturali è uguale a segue che 2 nn 1 n 2 n 1 S n 1 (1 2) (1 2 3) ... (1 2 3 ... n 1) 2 2 Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) n 2 n 1 n 1 k (k 1) n 2 n 1 1 n 1 2 n 1 n 2 n 1 1 n 2 nn 1 k k k n2 2 2 2 2 1 2 2 1 2 1 1 n 2 n 1 1 n2 n2 n S 2 2 2 4 4 . In definitiva: S 1 n3 3 2 n S n 2 2 4 4 da cui segue che 3 2n 3 3n 2 n 2n 3 3n 2 n e che S da cui, scomponendo il numeratore della frazione al II S 2 2 6 n 1 n(n 1)2n 1 k ( k 1) membro, si ottiene S . Precisiamo che con l’espressione s’intende 6 2 1 indicare la somma con k che va da 1 ad n dei k k 1 k k 1 , dove , non è niente altro che la 2 2 somma dei primi k numeri naturali. 5.6 Il problema delle prove ripetute e la variabile aleatoria con distribuzione binomiale Nel ambito degli esperimenti aleatori risulta di notevole importanza il cosiddetto problema delle prove ripetute. Si tratta dell’esperimento in cui si considera un evento E ripetibile nell’ambito del quale si effettuano, nelle stesse condizioni ( in ogni prova effettuata non cambia la probabilità che l’evento si verifichi), n prove. Ci poniamo l’obiettivo di determinare la probabilità che eseguendo n prove l’evento E si verifichi k n volte. A tal fine indichiamo con p la probabilità associata all’evento E e con q = 1 – p la probabilità che si verifichi l’evento contrario ad E (o meglio, che non si verifichi l’evento E). Qui di seguito faremo vedere che la probabilità che l’evento E si verifichi k n volte nel corso dell’esecuzione di n prove è p n ,k p k q n k . Osserviamo che perché l’evento k E si presenti k volte su n prove è necessario che l’evento contrario E si presenti n – k volte. Per il teorema della probabilità composta la probabilità che l’evento E si presenti k volte è pari a p p p ... p p k e la probabilità che l’evento contrario si presenti n – k volte è, per lo stesso kvolte teorema, pari a q q q ... q q n k . Ora perché si verifichi l’evento E k volte nell’ambito di n n kvolte prove si deve verificare l’evento intersezione (E si presenta k volte ) ( E si presenta n – k volte ). Quindi, sempre per il teorema della probabilità composta, la probabilità che si verifichi l’evento intersezione è pari a p k q nk . Occorre, però, precisare che p k q nk indica la probabilità che tale evento si verifichi relativamente ad una particolare successione degli eventi E ed E . I due eventi si n n possono, però, succedere il numero di volte richiesto in modi diversi. è, infatti, il numero k k Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) di combinazioni possibili di n oggetti distinti di classe k. Per il teorema della probabilità dell’unione n degli eventi si ha che p n ,k p k q n k p k q n k ... p k q n k p k q n k . k n k volte Esempio 5.6.1 Si consideri un’urna nella quale sono contenute 15 palline (5 gialle e 10 blu). Intendiamo determinare la probabilità che estraendo 7 palline, 5 siano gialle e 2 blu. Si precisa che dopo ogni estrazione la pallina estratta viene riposta nell’urna, cosicché le estrazioni successive avvengano nelle medesime condizioni. In questo caso specifico si ha: E: si estrae una pallina gialla, E : si 2 1 estrae una pallina blu, n 7 , k 5 , p , q . In base a quanto discusso sopra la probabilità 3 3 che estraendo 7 palline 5 siano gialle e 2 siano blu è 7 5 7 1 2 22 p7,5 2520 7 0,03840877914951989026063100137174 . Qui di seguito 3 5 3 3 descriveremo la variabile aleatoria con distribuzione binomiale e forniremo il valor medio, la varianza e lo scarto quadratico medio. Dato l’evento E come nel contesto descritto in precedenza possiamo introdurre la variabile aleatoria X che indica il numero di volte in cui l’evento E si presenta in n prove. La variabile X può prendere i valori che vanno da 1 ad n e la distribuzione di probabilità si presenta come segue: 5 xi p ( X xi ) 0 p n,0 1 p n ,1 … … n p n,n n n n , dove si ha che : p n, 0 p 0 q n q n , p n,1 p1q n 1 npq n 1 , p n , 2 p 2 q n 2 , … , 0 1 2 n n p n ,k p k q n k , … , p n ,n p n q 0 p n . La somma delle probabilità è uguale ad 1, in quanto k n n n n n 1 n 2 n2 n q pq p q ... p n p q n 1 . Calcoliamo ora il valor medio della 0 1 2 n n n n n variabile aleatoria X. Si ha che M ( X ) 0 q n 1 pq n 1 2 p 2 q n2 ... n p n 0 1 2 n npq n 1 nn 1 p 2 q n 2 ... n p n np (q n 1 n 1 pq n 2 ... p n 1 ) np q p n 1 quel che riguarda la varianza e lo scarto quadratico medio si ha che: 2 n p q e che n p q . Autore: Siano Roberto (docente di Matematica presso l’I.I.S. Arturo Prever di Pinerolo) np . Per