Università degli Studi di Firenze Facoltà di Scienze Politiche “Cesare Alfieri” Variabili casuali discrete Luciano Matrone Aprile 2008 Variabile casuale Uniforme discreta Dato il numero intero N si definisce variabile casuale Uniforme discreta di parametro N quella che assume come valori gli N numeri interi da 1 a N ciascuno con la stessa probabilità. Variabile casuale Uniforme {1,2,3 , N } X ~U N : Pr X = x = 1 N Determiniamo ora valore atteso e varianza di questa variabile. Iniziamo con il valore atteso N 1 1 E X = ∑ m = N N m =1 N ∑m m =1 che, tenendo conto di quanto dimostrato in appendice circa la somma dei primi N numeri interi, diventa E X = 1 N N 1 N 1 = N 2 2 Per determinare la varianza ricordiamo che essa si può esprimere come valore atteso dei quadrati meno il quadrato del valore atteso, cioè 2 var X =E X 2 −[ E X ] Calcoliamo ora E X 2 N 1 1 E X = ∑ m = N N m=1 2 2 N ∑ m2 m =1 che, tenendo conto di quanto dimostrato in appendice circa la somma dei quadrati dei primi N numeri interi, diventa E X 2= 1 N [ ] 1 1 N N 12 N 1 = N 12 N 1 6 6 che sostituita nella espressione della varianza insieme a quella del valore atteso ci permette di scrivere L.Matrone, Variabili casuali discrete 2 [ ] 2 N 1 N 12 1 1 var X = N 12 N 1− = N 12 N 1− = 6 2 6 4 1 1 1 1 4 N 2−3 N −3 = N 1 2 N 1− N 1 = N 1 = 2 3 2 2 6 1 N 2−1 = N 1 N −1= 12 12 [ ] [ ] ed in conclusione quindi N 2−1 var X = 12 L.Matrone, Variabili casuali discrete 3 Variabile casuale di Bernoulli La variabile di Bernoulli costituisce un modello probabilistico idoneo a rappresentare quei fenomeni che si manifestano attraverso due sole determinazioni, per esempio il genere: femmina, maschio; il possesso di una laurea: laureato, non laureato; o più in generale il possesso o meno di un determinato attributo. Lo schema concettuale è quello di un'urna contenente palline tutte uguali di struttura(grandezza,materiale,temperatura,superficie ecc.) di due colori diversi, per esempio bianco e nero, e l'esperimento consiste nell'estrarre dall'urna una pallina. A seconda di quale delle due determinazioni (colore della pallina) è quella di interesse prevalente nella indagine si associa ad essa la denominazione di successo. In definitiva si immagina un esperimento casuale a due soli possibili risultati: successo≡S e non successo o insuccesso≡ S La variabile casuale di Bernoulli B si costruisce nel modo seguente: insuccesso si associa 0 successo si associa 1 La funzione di probabilità associata sarà così definita: { Pr B=0=Pr S =1−Pr S =1− Pr B=1= Pr S = ⇔ P B=x = x 1−1− x x=0,1 I valori che la variabile può assumere e la legge di probabilità associata possiamo indicarli come segue Variabile casuale di Bernoulli X ~B : {0,1 } Pr X = x =x 1−1−x Determiniamo ora il valore atteso e la varianza di X E X =0⋅1−1⋅= var X =0−2⋅1−1−2⋅=2⋅1−1−2⋅=⋅1−⋅[1−]=⋅1− L.Matrone, Variabili casuali discrete 4 Variabile casuale Binomiale Supponiamo di disporre di un numero finito n di urne bernoulliane tutte con la stessa probabilità di successo .............. U1 U2 U3 ............... Un e quindi, come detto nel paragrafo precedente, ciascuna urna U i è descrivibile mediante una v.c. di Bernoulli Bi ~B { Bi = 0 1 P r Bi =0=1− P r Bi =1= ∀ i=1,2 ,n L'esperimento consiste nell'estrarre da ciascuna urna una pallina; lo spazio dei risultati di una tale S ottenuti nelle singole estrazioni, prova è costituito dalle 2n successioni di n risultati elementari S o e S seguendo lo schema costruttivo ovvero delle successioni di 0 e 1 associati rispettivamente a S della bernoulliana. La v.c. Binomiale si costruisce associando a ciascuna successione il numero di successi in essa contenuti ovvero la somma dei valori 0 e 1 associati a ciascuna estrazione. Per esempio se n=5 uno dei possibili risultati della prova è la successione S , S , S , S , S numero successi=3 1,0 ,0 ,1,1 numero successi=10011=3 Con la definizione posta di v.c. Binomiale è evidente che essa può assumere solo i valori interi da 0 (nessun successo nelle n prove) a n (tutti successi nelle n prove). Per costruire la funzione di distribuzione di probabilità di questa v.c. bisognerà tener presente che: a) le singole estrazioni sono identicamente distribuite e stocasticamente indipendenti, ovvero la probabilità che in una delle estrazioni si verifichi un successo è sempre qualunque risultato si sia ottenuto in una qualunque delle altre estrazioni; b) successioni diverse possono contenere lo stesso numero di successi. In base alla considerazione a) la probabilità di ottenere una determinata successione contenente h successi 0≤h≤n è data da h 1−n −h :infatti tale probabilità, tendo conto dell'indipendenza delle singole estrazioni e del fatto che in ciascuna estrazione la probabilità di successo è , sarà L.Matrone, Variabili casuali discrete 5 data dal prodotto di h fattori pari a e da n−h fattori uguali a 1− . Così per esempio la probabilità della successione indicata prima si calcolerà, tenendo conto che ciascuna urna è descritta da una berboulliana, nel modo seguente. Pr [ 1,0 ,0 ,1 ,1 ]=Pr [ B1=1∩ B2=0∩ B3 =0∩ B4=1∩ B5=1 ]= =Pr B1=1⋅Pr B 2=0⋅Pr B 3=0⋅Pr B 4=1⋅Pr B 5=1= =⋅1−⋅1−⋅⋅=3 1−2 Per meglio mettere in evidenza il senso della b) osserviamo che in n=5 estrazioni le successioni contenenti esattamente 3 successi sono in numero di 10: esse sono evidenziate di seguito: 1,1,1 ,0 ,0≡1 1,0,0 ,1 ,1≡6 1,1,0 ,1 ,0≡2 0,1,1 ,1 ,0≡7 1,1,0 ,0 ,1≡3 0,1,0 ,1 ,1≡8 1,0,1 ,1 ,0≡ 4 0,0 ,1,1 ,1≡9 1,0,1 ,0 ,1≡5 0,1,1 ,0 ,1≡10 tali successioni hanno tutte probabilità 3 1−2 e poiché solo una di esse si può verificare come risultato della prova, sono cioè incompatibili i ∩ j=∅ ∀ i≠ j i , j=1,2 ,10 , la probabilità che si verifichi una di esse, ovvero lo loro disgiunzione, è data dalla somma delle loro probabilità: 3 2 10⋅ 1− . Formalmente si scrive Pr 3 successi in 5 prove =Pr 1∪ 2∪ 3∪ ∪10= =Pr 1Pr 2 Pr 3⋯⋯Pr 10=10⋅3 1−2 In generale per determinare la probabilità che in n estrazioni si ottengano h successi sarà dapprima necessario contare quante sono le successioni contenenti h successi e poi moltiplicare tale numero per il fattore h 1−n −h che è la probabilità del verificarsi di una qualunque delle suddette successioni. Il calcolo combinatorio ci fornisce le regole per determinare il numero di successioni richiesto, esso è dato dall'espressione n! n = h!n−h! h che va sotto il nome di coefficiente binomiale e che rappresenta il numero di combinazioni senza ripetizione di n oggetti presi ad h a h (per una trattazione estesa degli argomenti fondamentali del calcolo combinatorio si veda L.Vannucci P.L.Visani, Metodi matematici e applicazioni economicofinanziarie, vol. 1, Ed. Pitagora, Bologna.). Nell'espressione precedente n! , h! ed n−h ! si leggono rispettivamente n fattoriale, h fattoriale L.Matrone, Variabili casuali discrete 6 ed (n-h) fattoriale. In generale, dato un numero intero non negativo k, si definisce fattoriale di k o k fattoriale il prodotto dei primi k numeri interi k !=k⋅k −1⋅k −2⋯2⋅1 con la convenzione 0!=1 A questo punto possiamo scrivere compiutamente la probabilità di ottenere nelle n prove bernoulliane h successi Pr h successi in n prove bernoulliane indipendenti = n h 1−n−h h e quindi descrivere completamente la v.c. Binomiale indicando i valori da essa assumibili e la sua funzione di probabilità Variabile casuale Binomiale X ~Bin n , : {0,1 ,2 ,n} h n−h Pr X =h= n 1− h 0≤h≤n Anche se è evidente da quanto detto, osserviamo che la funzione di distribuzione di probabilità della v.c. Binomiale è univocamente individuata quando si fissano i parametri n (numero di prove) e (probabilità di successo in ogni prova). Per completare la definizione di questa v.c. resta da dimostrare che n n ∑ Pr X =h=∑ nh h 1−n−h=1 h =0 h =0 la quale deriva direttamente dallo sviluppo della potenza n−ma di un binomio n n 1=[ 1−] =∑ n h 1−n−h h=0 h A questo punto sembra opportuno mettere in evidenza che l'esperimento indicato per costruire la v.c. Binomiale è equivalente, in termini di eventi generati e probabilità associate, a quello di estrarre da una sola urna bernoulliana n palline avendo l'accortezza di rimettere nell'urna la pallina estratta dopo ogni estrazione: estrazioni con reintroduzione. Come si è visto all'inizio il numero di successi nelle n prove si può determinare come la somma dei risultati in ciascuna prova e quindi, tenendo conto che ciascuna estrazione è descritta da una bernoulliana di parametro , si potrà scrivere L.Matrone, Variabili casuali discrete 7 n X =B1 B2⋯Bn =∑ Bi i=1 ovvero essa è la somma di n v.c. di Bernoulli indipendenti ed identicamente distribuite. Da questa osservazione e dalle proprietà del valore atteso e della varianza ed omettendo per semplicità l'indicazione dei parametri n e , si possono derivare il valore atteso e la varianza della Binomiale [ ] [∑ ] ∑ var X =var n n n i=1 i =1 i=1 ∑ B i =∑ E Bi =∑ =n E X =E n Bi = i=1 n i =1 n n var Bi ∑ ∑ cov Bi B j i =1 j=1 j ≠i per l'indipendenza e conseguente incorrelazione fra Bi e B j , cioè cov B i B j =0 var X =var [ ] n n i=1 i =1 ∀ i ≠ j , si ha ∑ B i =∑ 1−=n 1− Determinano ora la moda della Binomiale che è, ricordiamolo ancora, una variabile discreta e quindi la sua moda va ricercata fra gli n1 valori 0,1,2 , ,n−1, n che può assumere, cioè bisognerà individuare quel valore, diciamolo M 0 , per il quale si ha Pr X = M 0 ≥Pr X =M 0i Pr X = M 0 ≥Pr X =M 0− j i=1,2 , j=1,2 , per almeno un valore di i e di j per i quali valga la stretta disuguaglianza. Consideriamo a tale scopo la successione delle probabilità Pr X =0 , Pr X =1 , Pr X =2 , Pr X =n−1 , Pr X =n e cerchiamo di stabilire la relazione di disuguaglianza fra due suoi termini successivi. Per fare ciò costruiamo il rapporto R k = Pr X =k Pr X =k −1 k ∈1,2 , , n−1, n e vediamo per quali valori di k esso si mantiene non inferiore ad 1, in altre parole cerchiamo quel o quei valori di k ,se esistono, per i quali si possa scrivere L.Matrone, Variabili casuali discrete 8 Pr X =k − j≤≤Pr X =k −1≤Pr X =k Pr X =k ≥Pr X =k1≥≥Pr X =k i per qualche valore di i e di j che ci permetterà di affermare che i k così determinati sono tutti mode della nostra variabile e che saranno mode anche tutti quei valori minori o maggiori di k per i quali vale il segno di uguaglianza. Esplicitiamo ora R k n 1− k R k = k −1n 1− k k −1 = n! k !n−k ! n−k 1 = = = n−k1 n! k 1− 1− k −1!n−k 1! n−k n1−k 1− k −1− k 1−k [n1−k −k k ] n1−k = =1 1−k 1−k 1−k e quindi R k =1 n1 −k ≥1 1− k ⇔ n1−k ≥0 ⇔n1−k ≥0 1−k ed in definitiva R k ≥1 cioè Pr X =k ≥Pr X =k −1 ⇔ k≤n1 che dimostra che esiste un unico numero reale n1 che suddivide la successione dei valori assumibili dalla binomiale in due successioni quella costituita dai valori non superiori ad esso e per i quali la successione delle probabilità è non decrescente e quella dei valori superiori ad esso per i quali la successione delle probabilità è non crescente. A questo punto dobbiamo distinguere due casi a seconda che n1 sia un numero intero o meno e quindi che sia o meno un valore assumibile dalla Binomiale. a) Se n1 è un numero intero allora esso è un valore assumibile dalla Binomiale per il quale si ha, tenendo conto di quanto visto per il rapporto R k , R [ n1]=1 ⇔ Pr [ X =n1]=Pr [ X =n1−1] e quindi la successione delle probabilità sarà così ordinata L.Matrone, Variabili casuali discrete 9 Pr X =0Pr X =1Pr [ X =n1−1]=Pr [ X =n1] Pr [ X =n1−1 ]= Pr [ X =n1] Pr X =n che mette in evidenza che la funzione di probabilità della Binomiale assume il massimo nei due punti M 1=[ n1−1 ]=n −1− e M 2=n1=n che rappresentano altrettante mode: la distribuzione è bimodale. Osserviamo ora che poiché il valore atteso della binomiale è n si ha M 1=[ n1−1 ]=n −1−≤n ≤n =n1=M 2 che ci permette di concludere che il valore atteso della Binomiale è compreso fra i due valori modali. b) Se n1 non è un numero intero allora esso non è un valore assumibile dalla binomiale. Se indichiamo con 〚c〛 il massimo intero contenuto nel numero reale c allora M 0=〚n1〛 è un numero intero tale che la successione delle probabilità viene così ordinata Pr X =0Pr X =1Pr X =M 0−1Pr X =M 0 Pr X = M 0 Pr X =M 01Pr X =n dalla quale si può concludere che la variabile ha una sola moda data da M 0 . Anche in questo caso cerchiamo di stabilire la posizione della moda rispetto alla media. Per fare ciò osserviamo innanzitutto che dato un qualunque numero reale 0 su può scrivere =〚〛 con 0≤1 ed inoltre che per un qualunque numero intero positivo m si ha 〚m〛=〚〚〛m〛=〚〚〛m 〛=〚〛m Si può ora scrivere L.Matrone, Variabili casuali discrete 10 n=〚n 〛 n1 =n =〚n 〛 0≤1 01 e ponendo = 02 si ha M 0=〚n1〛=〚〚n 〛〛 Per stabilire la posizione della moda rispetto alla media bisognerà analizzare le due situazioni individuate dal fatto che sia maggiore o minore di 1. ● 01 ⇔ 1− M 0=〚〚n 〛〛=〚n 〛n la moda è minore della media ● 1≤=12 ⇔ 1−≤2− 0≤1 M 0=〚〚n 〛〛=〚〚n 〛1〛=〚n 〛1n la moda è maggiore della media L.Matrone, Variabili casuali discrete 11 Variabile casuale Binomiale relativa Con una semplice trasformazione della Binomiale Y ~Bin n , si ottiene la v.c. Binomiale relativa X ~Binr n , X= Y n che descrive la proporzione di successi in n prove bernoulliane indipendenti, essa assume ovviamente i valori 0 1 2 n =0 , , , , =1 n n n n con probabilità data da Pr X = h = Pr Y =h = n h 1−n −h n h in definitiva si può scrivere Variabile casuale Binomiale relativa X ~Binr n , : {0n =0 , 1n Pr X = h h n−h = n 1− n h , } 2 n , , =1 n n 0≤h≤n Il valore atteso e la varianza di questa variabile si determinano facilmente ricordando che E Y =n e var Y =n 1− E [ X ]= E var [ X ]=var L.Matrone, Variabili casuali discrete [] Y 1 1 = E [ Y ]= n = n n n [] 1− Y 1 1 = 2 var [ Y ]= 2 n 1−= n n n n 12 Variabile casuale Ipergeometrica Supponiamo di disporre di un'urna contenente N palline di cui b sono di un certo colore, per esempio bianche, e le rimanenti r =N −b di un altro colore, per esempio rosse. L'esperimento che effettuiamo consiste nell'estrarre da tale urna n palline senza reintrodurre la pallina estratta dopo ciascuna estrazione: estrazione senza reintroduzione o in blocchi. Anche in questo caso, come per le v.c. di Bernoulli e Binomiale, possiamo indicare uno dei due possibili risultati, pallina bianca o pallina rossa, in ciascuna prova come successo≡S e l'altro come non successo o insuccesso≡ S : assumeremo come successo l'estrazione di pallina bianca. La v.c. Ipergeometrica è definita come il numero dei successi nelle n prove. Osserviamo subito che questa variabile, come la binomiale, rappresenta il conteggio dei successi nelle n prove ma, a differenza della binomiale nella quale la prova viene effettuata con reintroduzione, qui le prove vengono effettuate senza reintroduzione. Il fatto che le prove avvengano senza reintroduzione implica che: a) b) la variabile non necessariamente assume valori da zero ad n ; la probabilità di un successo cambia da estrazione ad estrazione: i risultati nelle singole prove non sono indipendenti. Con riferimento alla a) possiamo osservare che se indichiamo con x il numero dei successi nelle n prove valgono le seguenti relazioni: Se Se Se Se ⇒ 0≤ x≤n {b≥n r ≥n ⇒ 0≤ x≤b {bn r ≥n ⇒ n−r ≤x ≤n {b≥n r n ⇒ n−r ≤x ≤b {bn r n } ⇒ max 0, n−r ≤x ≤min b , n la condizione finale mette in evidenza che non per tutte le composizioni dell'urna la variabile casuale Ipergeometrica assume valori da zero ad n . Supponiamo per il momento che si abbia b≥n e r ≥n ed indichiamo con S i il successo e con S i il non successo alla i-ma estrazione. Diciamo A la seguente particolare successione delle n estrazioni contenente x successi ed n− x insuccessi: A={S 1 , S 2 , , S x , S x1 , S x2 , S n} e calcoliamo la sua probabilità L.Matrone, Variabili casuali discrete 13 Pr A= Pr S 1∩S 2∩∩S x ∩S x1∩S x2∩∩S n che sarà data dal prodotto delle seguenti n probabilità Pr S 1= b N Pr S 2 ∣ S 1= ⋮ b−1 N −1 b− x−1 N − x −1 r Pr S x1 ∣ S 1∩S 2∩∩S x = N −x ⋮ Pr S x ∣ S 1∩S 2∩∩S x −1 = Pr S n ∣ S 1∩S 2∩∩S x ∩S x1∩S x2∩∩S n−1= r−n−1− x N −n−1 ciascuna delle quali è stata determinata mediante il rapporto fra il numero di palline successo (insuccesso) presenti nell'urna ad una certa estrazione ed il numero di palline rimaste nell'urna alla medesima estrazione; ovvero come numero dei casi favorevoli diviso il numero dei casi possibili, tenendo conto che le estrazioni sono effettuate senza reintroduzione. In conclusione quindi Pr A= b− x−1 r − n−1−x b b−1 r ⋅ ⋯⋯ ⋅ ⋯⋯ N N −1 N − x −1 N − x N −n−1 Osserviamo ora che, per la proprietà commutativa del prodotto, la precedente probabilità si potrà anche scrivere Pr A= b− x−2 b− x−1 r−n−1− x r b ⋅ ⋯⋯ ⋅ ⋯⋯ N N −1 N − x −1 N −x N −n−1 che non è altro che la probabilità della successione di estrazioni B={S 1 , S 2 , , S x , S x 1 , S x2 , S n } che costituisce ancora una estrazione con x successi ed n− x insuccessi. Questa osservazione ci induce a concludere che ciascun ordinamento degli n fattori del numeratore rappresenterà la probabilità di una ben determinata successione di successi ed insuccessi ma sempre con la caratteristica di contenere x successi ed n− x insuccessi. Il numero dei diversi allineamenti contenenti x successi ed n− x insuccessi sarà dato, come nel caso della Binomiale, dal numero delle combinazioni di n oggetti a x a x . Questi diversi allineamenti costituiscono un insieme di eventi incompatibili e quindi la probabilità che si verifichi uno di essi è data dalla somma delle loro L.Matrone, Variabili casuali discrete 14 probabilità. Poiché sono equiprobabili, tale probabilità sarà data dal prodotto del loro numero per la probabilità di uno di essi. In definitiva quindi Pr x successi in n prove bernoulliane senza reintroduzione = n Pr A x Indicando ora con X ~H N , b , n la nostra v.c. Ipergeometrica possiamo dire che essa assume, nella nostra situazione ( b≥n e r ≥n ), valori interi da zero a n con una funzione di distribuzione di probabilità data da Pr X = x= n Pr A x Detti ora h e k due numeri interi positivi tali che k ≥h0 poniamo D k , h=k⋅k −1⋅k −2⋅⋯k −h−1 che rappresenta il numero delle disposizioni semplici di k oggetti ad h ad h . Moltiplichiamo ora i due membri dell'uguaglianza precedente per k −h! si avrà D k , h⋅ k−h!=k⋅k −1⋅k −2⋅⋯k −h−1⋅k −h!=k! che rappresenta il numero delle permutazioni semplici di k oggetti. Con queste notazioni possiamo scrivere Pr A= Db , x⋅D r ,n− x DN ,n e quindi D b , x⋅Dr , n−x Db , x⋅Dr , n− x n! Pr H =x = n = = D N ,n x !n−x ! DN ,n x = Db , x⋅b−x !⋅Dr , n− x⋅r −n−x ! N −n! n! = x !n−x ! D N ,n⋅ N −n! b− x !⋅r −n− x ! = n! b!⋅r ! N −n! = x !n−x ! N ! b−x !⋅r −n−x ! (1) n−r x Nn b! r! b x x!⋅b−x ! n− x !⋅r −n− x ! = = N! n!⋅ N −n ! L.Matrone, Variabili casuali discrete 15 che mette in evidenza il fatto che la probabilità calcolata è data dal rapporto fra numero dei casi favorevoli e numero dei casi possibili; infatti il denominatore della frazione rappresenta il numero delle possibili successioni (disposizioni semplici) di classe n che si possono formare con le N palline contenute nell'urna mentre il numeratore rappresenta il prodotto fra il numero di raggruppamenti (disposizioni semplici) di classe x che si possono formare con le b palline successo ed il numero di raggruppamenti (disposizioni semplici) di classe n− x che si possono formare con le r palline insuccesso e quindi in definitiva il numero di successioni contenenti x successi ed n− x insuccessi. Al fine di completare la definizione della funzione di distribuzione di probabilità bisognerà dimostrare che =1 ∑ b x n r n− x (2) N n x =0 Una dimostrazione sintetica può essere effettuata come segue mentre una dimostrazione analitica è presentata in appendice. Osserviamo che il valore x è immagine dell'evento A x ≡ H =x costituito da tutte le successioni che contengono x successi ed n−x insuccessi, tale evento ha probabilità data dalla (1). Questi n1 eventi formano una partizione dello spazio campionario in quanto Ai ∩ A j =∅ ∀ i≠ j i , j=0,1 ,2 , , n A0 ∪ A1∪⋯∪ A n−1∪ An= I ≡{ Evento certo } e di conseguenza Pr A 0∪ A1∪⋯∪ A n−1 b r x n−x ∪ A =∑ Pr A =∑ Nn n n x=0 n x x=0 ma d'altra parte si ha pure Pr A 0∪ A1∪⋯∪ A n−1∪ An =Pr I =1 e quindi la (2). Possiamo a questo punto rimuovere le condizioni poste inizialmente b≥n e r ≥n ponendo =0 ∀ ∈ℕ L.Matrone, Variabili casuali discrete 16 posizione che, con riferimento alla situazione che stiamo analizzando, verrebbe utilizzata quando si tentasse di valutare la probabilità di ottenere nelle n estrazioni un numero di successi maggiore del numero dei successi contenuti nell'urna: un tale evento è impossibile con probabilità pari a zero, così come la nostra posizione ci induce a concludere. In definitiva possiamo dire che la v.c. X è una Ipergeometrica di parametri N , b , n quando assume valori e relative probabilità come indicato qui di seguito dove si è posto r =N −b Variabile casuale Ipergeometrica X ~H N , b , n max 0, n−r ≤x ≤min b , n b r x n− x Pr X = x = Nn dove n≤N e r= N −b Come detto per la Binomiale anche la Ipergeometrica può essere rappresentata come somma di n variabili casuali Bernoulliane Bi ~B n X =B1 B2⋯ Bn=∑ Bi (3) i =1 che in questo caso, però, non sono indipendenti poiché, come si è visto, la probabilità di successo, e quindi di insuccesso, cambia da estrazione a estrazione a seconda di ciò che si è verificato nelle estrazioni precedenti; resta la condizione che esse sono identicamente distribuite con probabilità di successo =b / N : cioè la probabilità che alla i-ma estrazione si ottenga un successo qualunque cosa si sia verificata nelle altre n−1 estrazioni è data da come qui di seguito mostreremo. A tale scopo indichiamo quindi con Am una particolare successione di estrazioni nella quale alla i-ma prova si è ottenuto un successo Am ={ 1 , 2 , , i −1 , S , i , , n−1} in quest'ultima ciascun j j=1,2 , , n−1 può rappresentare sia un successo che un insuccesso. Supponiamo ora che in Am vi siano h successi e k insuccessi, tenendo conto che un successo è certamente presente, sarà ovviamente 1≤h≤n e 0≤k ≤n−1 . Utilizzando la proprietà commutativa del prodotto e ricordando quanto visto circa il calcolo della probabilità di una particolare successione di estrazioni, la probabilità di Am si potrà scrivere L.Matrone, Variabili casuali discrete 17 Pr Am =Pr 1 , 2 , , i −1 , S , i , , n−1= bb−1⋯ b−h1 r r −1⋯r −k 1 = N N −1N −2⋯ N −n1 = b N [ b−1⋯b−h1r r−1⋯r−k 1 = N −1 N −2⋯ N −n1 ] = b N [ b−1⋯b−1−h−11 r r −1⋯r−k 1 N −1 N −2⋯ N −1−n−11 ] nella quale l'espressione tra parentesi quadre rappresenta la probabilità di estrarre, in n−1 prove senza reintroduzione, da un'urna contenente N −1 palline, di cui b−1 successi ed r insuccessi, una determinata successione A*m contenente h−1 successi e k =n−1−h−1=n−h insuccessi. Osserviamo ora che le successioni Am e A*m sono in corrispondenza biunivoca ed il loro numero è dato da 2n−1 , pari cioè alle disposizioni con ripetizione di due oggetti S , S presi ad n−1 ad n−1 ; si ha inoltre A j ∩ Al =∅ ∀ j≠l 2 j , l=1,2 ,,2 n−1 n−1 A j ={alla i -ma prova nelle n estrazioni si è ottenuto un successo}={Bi =1} j =1 e j ,l=1,2 ,,2n −1 A*j ∩ A*l =∅ ∀ j≠l 2 n−1 A*j ={in n−1 estrazioni da un'urna contenente N −1 palline di cui b−1 j =1 successi si è ottenuto un qualunque numero di successi }={evento certo }=I e di conseguenza 1=Pr I =Pr ∑ 2 2 n−1 A j=1 * j n−1 = j=1 Pr A*j ed ancora Pr B i=1 =Pr ∑ 2 2 n−1 j=1 Aj = n−1 j =1 2 n −1 Pr A j =∑ j =1 b b Pr A*j = N N n −1 2 b ∑ Pr A *j = N j =1 e di conseguenza Pr B i=0=1− L.Matrone, Variabili casuali discrete b N −b r = = N N N 18 e ciò dimostra che ciascuna variabile Bi si distribuisce come una bernoulliana di parametro =b / N Utilizzando questo risultato possiamo facilmente determinare il valore atteso della variabile casuale ipergeometrica. Dalla (3) e dalle proprietà del valore atteso si ha E X =E [ ] n n n i=1 i=1 i=1 ∑ Bi =∑ E Bi =∑ =n Per determinare la varianza possiamo procedere come segue var X =var [∑ ] ∑ n Bi = i=1 n i =1 n n n n n n var Bi ∑ ∑ cov B i B j =∑ 1−∑ ∑ cov Bi B j = i =1 j=1 j ≠i i =1 i=1 j =1 j≠i n =n 1−∑ ∑ cov B i B j i =1 j =1 j ≠i ora, poiché le v.c. bernoulliane Bi e B j non sono indipendenti, non si può affermare che cov B i B j è uguale a zero e si dovrà quindi stabilire quanto essa vale. A tale scopo costruiamo la distribuzione doppia di probabilità Bi , B j Bj Bi ∣ 0 1 ∣ ---- ∣ ------------- ------------- ∣ ------------r r −1 r b r 0 ∣ ⋅ ⋅ ∣ =1− N N −1 N N −1 N b r b b−1 b 1 ∣ ⋅ ⋅ ∣ = N N −1 N N −1 N ---- ∣ ------------- ------------- ∣ ------------r b ∣ =1− = ∣ 1 N N e quindi si avrà r r −1 r b 0−E Bi 1− E B j N N −1 N N −1 b r b b−1 1−E Bi 0−E B j 1−E Bi 1− E B j = N N −1 N N −1 r−1 r =−−1− −1− N −1 N −1 r b−1 1−− 1−1− = N −1 N −1 r −1 r r b−1 =2 1− −2 1− −2 1− 1−2 = N −1 N −1 N −1 N −1 1− = [ r−1−2 r1−b−1 ] N −1 cov Bi B j = 0− E Bi 0− E B j L.Matrone, Variabili casuali discrete 19 1− [ r −−2 r b−1−b ]= N −1 1− 1− = − r −bb−1 ]= [ [−r bb−1 ]= N −1 N −1 1− 1− 1− b 1 = − N b−1]= N − − =− [ N −1 N −1 N N N −1 cov Bi B j = [ ] Possiamo a questo punto determinare la varianza della v.c. ipergeometrica: n n var X =n 1−∑ ∑ cov Bi B j =n 1−nn−1 [ i=1 j=1 j≠i =n 1− 1− L.Matrone, Variabili casuali discrete −1− = N −1 ] n−1 N −n =n 1− N −1 N −1 20 Variabile casuale Trinomiale Si consideri un'urna contenente un certo numero di palline delle quali alcune sono di colore bianco (W), altre di colore rosso (R) ed altre ancora di colore verde (G) e si ipotizzi che le singole palline sono equiprobabili. Indichiamo con p 1=Pr W p 2= Pr R p 3= Pr G =1− p 1 p 2 le probabilità di estrazione di una pallina di ciascuno dei tre colori. L'esperimento consiste nell'estrarre, con reintroduzione, n palline dall'urna e di conseguenza il risultato della prova è una successione casuale degli eventi elementari W, R e G. Un possibile risultato di un tale esperimento, che denotiamo con A, è quello di seguito indicato A≡WWW ⋯⋯W RRR ⋯⋯ R GG G ⋯⋯G x 1 volte x 3 =n − x 1 x 2 volte x 2 volte la cui probabilità, tenendo conto che le n sotto prove sono indipendenti in quanto le estrazioni avvengono con reitroduzione, è data da Pr A = p1 p2 p 3 = p 1 p 2 p3 x1 x2 x3 x1 x2 n− x 1 x 2 con x 1 x 2 x 3=n e p 1 p 2 p3=1 . Cerchiamo ora di contare il numero di eventi (successioni casuali) nei quali il numero di palline W, R e G è pari rispettivamente pari a x 1 , x 2 e x 3 . Per effettuare tale conteggio possiamo dapprima contare il numero di successioni nelle quali si presentano x 1 palline W che è dato da C n , x 1= n x1 e poi contare il numero di successioni che si possono formare da ciascuna delle C n , x 1 contenenti x 1 palline W che contengono x 2 palline R nelle n− x 1 posizioni rimanenti sotto il vincolo che x 1 x 2≤n , tale numero è dato da C n−x 1 , x 2 = n−x 1 x2 in conclusione quindi il numero di eventi (successioni casuali) nei quali il numero di palline W, R e G è pari rispettivamente pari a x 1 , x 2 e x 3 sarà dato da [ x 1 , x 2 , x 3=n− x 1 x 2 ]= x 1 , x 2 =C n , x 1C n− x 1 , x 2 = n x1 L.Matrone, Variabili casuali discrete n− x 1 x2 21 e ciascuno di questi x 1 , x 2 eventi ha probabilità uguale a quella di A e poiché sono a due a due incompatibili la probabilità che si verifichi uno di essi sarà data dalla somma delle probabilità che si verifichi uno di essi, ovvero x 1 , x 2 ∑ j =1 x1 x2 n− x 1x 2 p1 p 2 p 3 n−x 1 x x n− x x p1 p 2 p 3 x2 = n x1 1 2 1 (4) 2 ovviamente sotto la condizione che x 1 x 2≤n . Osserviamo che scambiando i ruoli di x 1 e x 2 nei coefficienti binomiali la precedente probabilità si scriverà n x2 n−x 2 x x n− x x p1 p 2 p 3 x1 1 2 1 (5) 2 e si può facilmente dimostrare che la (4) e la (5) sono uguali come d'altronde il loro stesso senso ci indica infatti rappresentano entrambe la probabilità di ottenere nelle n estrazioni x 2 palline R, x 1 palline W e n− x 1x 2 palline G. Possiamo a questo punto definire la variabile casuale Trinomiale che è una discreta doppia nel modo seguente Variabile casuale Trinomiale X 1 , X 2 ~Tr n , p 1 , p 2 { 0≤ x 1≤n n− x 1≤x 2≤n x 1 e x 2 numeri interi x 1 , x 2 ; n , p1 , p2 =Pr X 1=x 1 , X 2= x 2 = n x1 n−x 1 p x p x p n− x x 1 2 3 x2 1 2 1 2 dove p3 =1− p1 p 2 ovvero in maniera del tutto equivalente Variabile casuale Trinomiale X 1 , X 2 ~Tr n , p 1 , p 2 { 0≤ x 2≤n n− x 2≤ x 1≤n x 1 e x 2 numeri interi x 1 , x 2 ; n , p1 , p2 =Pr X 1=x 1 , X 2= x 2 = n x2 x x n− x x n−x 2 p1 p 2 p 3 x1 1 2 1 2 dove p3 =1− p1 p 2 L.Matrone, Variabili casuali discrete 22 Bisogna ora dimostrare che la funzione di distribuzione di probabilità è ben definita cioè è sempre non negativa e la somma dei suoi valori è uguale ad uno. La prima delle due condizioni è soddisfatta in quanto i valori di sono probabilità; la seconda si può dimostrare come segue n n−x 1 ∑ ∑ x 1 =0 x 2=0 n x1 n n−x 1 p x p x p n− x x = 1 2 3 x2 1 2 1 2 ∑ x 1 =0 n− x1 n px x1 1 1 p ∑ n−x x x2 2 1 n−x 1 −x 2 p3 = 2 x 2 =0 n ∑ xn p p p x1 1 x 1 =0 n−x 1 2 3 = p 1 p 2 p3 n=1n =1 1 che è quello che si voleva dimostrare. Determiniamo ora la funzione di distribuzione di probabilità della marginale X 1 n−x 1 X x 1 ; n , p 1= 1 ∑ x 2=0 n x1 n−x 1 x n− x 1 x x n− x x p1 p2 p3 = n p1 x1 x2 = n p p 2 p 3 x1 x1 1 n−x 1 1 2 1 2 = n p 1− p 1 x1 x1 1 1 ∑ n−x x p 1 x2 2 n− x 1− x 2 p3 = 2 x2 =0 n− x 1 che mette in evidenza che X 1 si distribuisce come una variabile casuale Binomiale di parametri n e p 1 : X 1~ Bin n , p1 .In maniera del tutto analoga si può dimostrare che X 2 ~Bin n , p2 e quindi si avrà E X 1 =n p 1 E X 2 =n p 2 var X 1 =n p 1 1− p 1 var X 2 =n p 2 1− p2 Costruiamo la funzione di distribuzione di probabilità della variabile condizionata X 2 / X 1= x 1 che per la definizione di distribuzione condizionata si otterrà come segue X 2 / X1 x 2= x 1 , x 2 X x 1 1 = n x1 n− x 1 x x n− x x p1 p2 p 3 x2 1 2 1 n p x 1− p n −x 1 1 x1 1 x2 n− x 1− x 2 1 2 = p2 p3 n− x 1 n− x 1 = = n− x −x x x 2 p 2 p 3 p2 p 3 x2 1 2 2 x2 n− x 1− x 2 n−x 1 p 2 p 3 = x 2 p 2 p 3 n −x p2 p2 p 3 1 x2 p3 p 2 p 3 n−x 1 −x 2 l'espressione della funzione di distribuzione di probabilità appena ottenuta mette in evidenza che la p2 variabile X 2 / X 1= x 1 si distribuisce come una Binomiale di parametri n− x 1 e se si p 2 p3 tiene conto del fatto che L.Matrone, Variabili casuali discrete 23 p3 p2 =1− p 2 p3 p 2 p 3 essa assume i valori 0,1 ,2 , ,n−x 1 e valore atteso E [ X 2 / X 1= x 1 ]=n−x 1 p2 p 2 p 3 In maniera analoga si può dimostrare che X 1 / X 2= x 2~ Bin n− x 2 , p1 p 1 p 3 La funzione di distribuzione di probabilità della Trinomiale utilizzando i risultati ottenuti si potrà scrivere x 1 , x 2 = X x 1 X 1 2 /X 1 x n−x x 2= n p1 1− p1 x1 1 1 n−x 1 x2 x2 p2 p 2 p 3 p3 p 2 p 3 n− x 1−x 2 che utilizzeremo per determinare la covarianza fra le componenti X 1 e X 2 della nostra variabile doppia. Cominciamo con il ricordare che cov X 1 , X 2= E X 1 X 2 − E X 1 E X 2 e quindi cominciamo con il calcolare n E X 1 X 2 = 1 n 2 1 n−x 1 1 x 1=0 n−x 1 1 2 x 2 =0 n ∑x 1 x 1 =0 2 x 2 =0 ∑∑x x x 1 =0 = n ∑ ∑ x x x , x =∑ ∑ x x x 1=0 = n−x 1 X1 1 1 [∑ n−x 1 1 x2 x 2=0 x 1 X 2 /X 1 x 2 = x2 =0 n p x 1− p n− x n−x 1 1 1 x1 x2 n p x 1− p n− x 1 1 x1 1 2 p2 p 2 p3 n−x 1 x2 p2 p 2 p3 x2 p3 p2 p3 x2 p3 p2 p3 n− x 1− x 2 = n− x 1− x 2 ] e tenendo conto che l'espressione in parentesi quadra è il valore atteso di [ X 2 / X 1=x 1 ] e che p 2 p 3=1− p 1 la su indicata espressione si può scrivere E [ X 2 / X 1= x 1 ]=n−x 1 p2 1− p 1 e di conseguenza si ha L.Matrone, Variabili casuali discrete 24 n E X 1 X 2 = ∑ x xn p 1 x1 1 n− x 1 1− p 1 n−x 1 1 x 1 =0 p2 = 1− p 1 n = p2 ∑ x xn p 1− p n−1− x 1 x1 1 1 1 n− x 1 1 x 1=0 osservando che per x 1=0 e x 1=n i corrispondenti termini della somma sono nulli e esplicitando il coefficiente binomiale n−1 E X 1 X 2 = p 2 n! p 1− p ∑ x x !n− x ! x 1 =1 n−1−x 1 x1 1 1 1 1 n− x 1= 1 n−1 =n n−1 p 1 p 2 n−2! p ∑ x −1!n−x −1! x 1 =1 1 x 1−1 1 1− p 1 n− x 1−1 1 ponendo ora t =x 1−1 si ha x 1=1 ⇔ t =0 x 1=n−1 ⇔ t =n−2 x 1=t 1 n− x 1−1=n−2−t e sostituendo nella somma n−2 E X 1 X 2 =n n−1 p 1 p 2 n−2! p 1− p ∑ t !n−2−t ! t 1 n −2 −t 1 =nn−1 p 1 p2 [ p 11− p 1]n−2= t=0 =n n−1 p1 p 2 ed in conclusione cov X 1 , X 2=E X 1 X 2− E X 1 E X 2= =n n−1 p 1 p 2−np1 np 2= =−n p 1 p2 L.Matrone, Variabili casuali discrete 25 Appendice Somma dei primi N numeri interi Consideriamo i numeri interi {1,2 ,3 , , N } ci riproponiamo di determinare la loro somma che indicheremo con S . Ciò posto possiamo scrivere S =123⋯ N S =N N −1 N −2⋯1 e sommando membro a membro si ha 2S=N 1[ N −12 ]⋯ N 1 2S=N 1 N 1⋯ N 1 2S=N N 1 ed in definitiva S= N N 1 2 Somma dei numeri interi da h a k Consideriamo due numeri interi hk vogliamo determinare la somma T dei numeri interi tra h e k compresi gli estremi, cioè T =hh1h2⋯k −1k tenendo conto che si può scrivere k =hk −h e h=h−11 si avrà T =[ h−11 ][h−111 ][ h−112 ]⋯[ h−11k −h−1−1]= =[ h−11 ][h−12] [ h−13 ][ h−1k −h−1]= =[ k −h−1] h−1[ 123⋯k −h−1 ] Ricordando ora l'espressione trovata per la somma dei primi N numeri interi la possiamo utilizzare per calcolare la somma dei primi [ k −h−1] che sarà data da [k −h−1][ k−h−11 ] [ k −h−1 ][ k −h2 ] 2 = 2 e quindi T diventa L.Matrone, Variabili casuali discrete 26 T =[ k −h−1 ] h−1 =[ k −h−1] [ k −h−1][ k −h2 ] 2 [ =[ k −h−1] h−1 2h−2k −h2 2 [ k−h2 ] 2 ] = ed in conclusione si ha T= [k −h−1 ][ k h ] 2 Somma dei quadrati dei primi N numeri interi Consideriamo i numeri interi {1,2 ,3 , , N } ci riproponiamo di determinare la somma dei loro quadrati che indicheremo con Q che si scriverà N Q=1 2 3 ⋯N = ∑ m2 2 2 2 2 m=1 Al fine di determinare Q procederemo utilizzando un artificio. Si consideri la seguente successione a m=m13−m 3 m=1,2 ,3 , e determiniamo la somma dei suoi primi N termini N N N N N S N = ∑ [ m1 −m ]= ∑ [ m −3m 3m1−m ]= ∑ [ 3m 3m1]=3 ∑ m 3 ∑ mN 3 m=1 3 3 m =1 2 3 2 m=1 2 m =1 m =1 Calcoliamo ora i valori di a m per m=1,2 ,3 , N e sommiamoli utilizzando lo schema che segue m a m=m13−m 3 1 23 −13 2 3 3 − 23 3 4 3 − 3 3 4 53 − 43 ⋮ ⋮ N N 13 − N 3 = =N 13−1=S N L.Matrone, Variabili casuali discrete 27 e quindi si avrà N N 3 ∑ m 3 ∑ mN = N 13−1 2 m=1 m=1 e ricordando l'espressione della somma dei primi N numeri interi la precedente si scrive N 3 ∑ m23 m=1 N N 1 N = N 13−1 2 dalla quale si ricava N N N 1 −N = 2 3 = N 33N 33N1−1− N N 1− N = 2 1 = [ 2N 36N 26N−3N 2−3N −2N ]= 2 1 1 = [ 2N 33N 2 N ]= N 2N22NN 1= 2 2 1 1 = N [ 2N N 1 N 1 ]= N N 1 2N1 2 2 3 ∑ m2= N 13−1−3 m=1 ed in conclusione N 1 Q= ∑ m 2= N N 1 2N 1 6 m=1 L.Matrone, Variabili casuali discrete 28 La funzione di distribuzione di probabilità della Ipergeometrica è ben definita Bisogna dimostrare in modo analitico che bxn−r x=1 ∑ Nn n x =0 ovvero che n r = N ∑ bxn−x n (A1) x=0 nelle quali r =N −b . La dimostrazione procederà in due fasi, una prima parte nella quale sarà determinata una identità fra i coefficienti di due polinomi dello stesso grado ed una seconda nella quale, utilizzando il risultato ottenuto, sarà dimostrato il nostro asserto. Consideriamo i seguenti tre polinomi di grado b , N −b e N rispettivamente b P b z =∑ i z i i =0 N −b P N −b z = ∑ j z N P N z =∑ k z k j j=0 k=0 e poniamo N Q N z =P b z ⋅P N−b z =∑ k z k k=0 che è un polinomio di grado N come P N z e quindi per il principio di identità dei polinomi P N z =Q N z ⇔ k = k (A2) ∀ k =1,2 , , N Con le definizioni poste si potrà scrivere N b N −b b N −b Q N z =∑ k z =P b z ⋅P N −b z =∑ i z ⋅∑ j z =∑ ∑ i j z i j k k=0 i i=0 fissiamo ora un n tale che 0≤n≤N e poniamo i=0 j=0 j (A3) i =0 j =0 ∀ ib e j =0 ∀ jN −b ; i monomi di grado n nell'ultima espressione in (A3), ovvero quelli che contengono la potenza z n , si otterranno considerando le coppie di valori interi i e j per i quali i j=n e che possiamo evidenziare mediante L.Matrone, Variabili casuali discrete 29 lo schema seguente 0 1 2 ⋯ n n n−1 n−2 ⋯ 0 n n n ⋯ n i= j= i j= e quindi i monomi di potenza n sono dati da x n− x z n con x=0,1,2 ,n e la loro somma costituirà il termine di potenza n del polinomio Q N z ed in definitiva sarà n n =∑ x n−x =n (A4) x=0 in ragione della (A2). Ciò conclude la prima fase della nostra dimostrazione. Poniamo ora b b ∑ biz P b z =∑ i z = 1 z = b i i=0 i i = b i ⇒ j = N −b j ⇒ k = N k i=0 N −b N −b P N −b z = ∑ j z j=1z N −b = j=0 z ∑ N −b j j j=0 N N P N z =∑ k z =1z = k N k=0 ∑ Nk z k k =0 ⇒ nelle quali si è utilizzato il principio di identità dei polinomi; poiché vale la seguente identità N b 1z =1z ⋅ 1z N −b si può scrivere P N z = Pb z ⋅P N −b z e, tenendo conto del risultato in (A4), si avrà in definitiva n r = N ∑ bxn−x n x=0 che è quanto volevamo dimostrare. L.Matrone, Variabili casuali discrete 30