VARIABILI CASUALI O ALEATORIE Consideriamo i seguenti esempi: 1) Si lanci tre volte una moneta: il numero di "teste" che si possono presentare è uno dei seguenti : 0 o 1 o 2 o 3 . Gli eventi sono incompatibili e necessari. Possiamo schematizzare i risultati nel seguente modo: Xi 0 1 2 3 Pi 1 8 3 8 3 8 1 8 dove X i rappresenta l'evento e Pi la rispettiva probabilità. 3 La somma delle probabilità degli eventi considerati è uguale a 1 ∑p i = 1. i= 0 2) Lancio del dado: siamo interessati ai risultati delle singole facce 1 o 2 o 3 o 4 o 5 o 6 . Anche in questo caso gli eventi sono incompatibili e necessari. La schematizzazione è la seguente: Xi 1 2 3 4 5 6 Pi 1 6 1 6 1 6 1 6 1 6 1 6 Anche in questo esempio il valore che assume la variabile X i è casuale. A ciascun valore corrisponde una ben determinata probabilità ed essendo gli eventi incompatibili e 6 necessari la somma delle probabilità è uguale a 1 ∑p i =1 i =1 DEFINIZIONE DI VARIABILE CASUALE Si definisce variabile casuale X una variabile che può assumere diversi valori reali xi ,ciascuno associato agli eventi Ei , incompatibili e necessari, con rispettiva probabilità pi e con sommatoria delle probabilità pi uguale a 1 . FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 1 di 11 VARIABILE CASUALE DISCRETA Una variabile casuale si definisce discreta ( indicata anche con il simbolo v.c.d.) se le determinazioni xi che essa può assumere sono in numero limitato, finito . In generale se X è una v.c. discreta , con pi si indica la probabilità che X assuma il valore xi , in simboli si può scrivere P( X = xi ) = pi . La probabilità varia al variare di xi , è funzione di xi e quindi è funzione della variabile X . Questa funzione è chiamata funzione o distribuzione di probabilità e si può così rappresentare: Xi x1 x2 x3 xi … xn Pi p1 p2 p3 pi … pn La v.c. può essere rappresentata anche graficamente ; in un sistema di assi cartesiani sull'asse delle ascisse si riportano i valori xi e su quello delle ordinate le probabilità pi . Esempio: Si lancia 3 volte una moneta. Studiare la variabile casuale : X = "numero di volte che si presenta testa". Nel lancio della moneta 3 volte, la faccia testa si può presentare da un minimo di zero volte ad un massimo di 3 volte. La v.c. si può rappresentare secondo la tabella che segue: Xi Pi 0 1 8 1 3 8 2 3 8 3 1 8 3 ∑p i=0 i Pi 3 8 1 8 =1 0 1 2 3 Xi FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 2 di 11 dove i segmenti delle ordinate in corrispondenza dei valori 0, 1, 2, 3 ,rappresentano le probabilità. FUNZIONE DI RIPARTIZIONE o funzione cumulativa di probabilità. Sia X una v.c., disposti i valori xi in ordine crescente, alla funzione di probabilità si può associare la funzione di ripartizione F ( X ) che esprime la probabilità che la v.c. assuma un valore non superiore a xi . F ( Xi ) = P ( X ≤ x i ) = p1 + p 2 + ...+ pi esempio F ( X 3 ) = P ( X ≤ x3 ) = p1 + p2 + p3 Mediante la funzione di ripartizione si può facilmente calcolare la probabilità che la v.c. assuma un valore compreso tra due valori assegnati a < X ≤ b ( probabilità che la variabile casuale sia maggiore di a e minore o uguale a b ) P ( a < X ≤ b ) = F (b ) − F ( a ) La funzione di ripartizione svolge lo stesso ruolo della frequenza relativa cumulata studiata nella statistica descrittiva . Esemplificazione con il lancio di due dadi , evento ="somma delle facce" : Xi 2 3 4 5 6 7 8 9 10 11 12 Pi 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 F(X ) 1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 36/36 esempi: a) F ( 3) = P ( X ≤ 3) probabilità che la somma delle facce sia minore o uguale a 3, cioè la somma delle facce è 2 oppure 3 ed è uguale a 3/36 ; b) P ( 3 < X ≤ 8) = F (8) − F ( 3) = 26 / 36 − 3 / 36 = 23 / 36 e rappresenta la probabilità che la somma sia un numero compreso tra 4 e 8 , estremi inclusi. FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 3 di 11 VALORE MEDIO di una variabile casuale discreta . Nelle applicazioni interessa conoscere alcuni valori caratteristici delle variabili casuali. Un primo valore che sintetizza i valori della distribuzione della v.c. è il VALORE MEDIO o VALORE ATTESO n M ( X ) = E ( X ) = ∑ xi pi = x1 p1 + x2 p2 +...+ xn pn i =1 Il termine E ( X ) deriva dal termine inglese EXPECTATION ( speranza, aspettativa) . Il valore medio di una variabile casuale rappresenta il valore previsto, atteso o sperato che si potrà ottenere in un gran numero di prove. Esso non corrisponde necessariamente ad uno dei valori xi della distribuzione ma corrisponde solo al valore medio dopo aver effettuato un gran numero di prove. In generale , assegnata una variabile casuale X , Xi x1 x2 x3 xi … xn Pi p1 p2 p3 pi … pn il valore medio o valore atteso o speranza matematica è dato dalla somma dei prodotti di ogni valore della variabile casuale per la rispettiva probabilità. Esempio: in una operazione finanziaria si possono guadagnare 3.000 euro con probabilità 0,2, oppure 5.000 euro con probabilità 0,5, oppure 10.000 euro con probabilità 0,3. Calcolare il valore medio della variabile casuale. La variabile casuale può essere rappresentata in tabella: valori xi probabilità pi prodotti xi ⋅ pi 3.000 0.2 600 5.000 0.5 2.500 10.000 0.3 3.000 totali 1.0 6.100 M ( X ) = 3.000 ⋅ 0,20 + 5.000 ⋅ 0,50 + 10.000 ⋅ 0,30 = 6.100 euro. Il valore medio atteso , in un gran numero di prove , è pertanto 6.100 euro. In una singola prova gli eventi che si possono presentare sono o 3.000 o 5.000 o 10.000; se le prove vengono ripetute sempre nelle stesse condizioni un gran numero di volte , tenendo conto della probabilità statistica, possiamo ritenere che nel 20% dei casi si vincerà la somma di 3.000 euro, nel 50% dei casi la somma di 5.000 euro , nel 30% dei casi la somma di 10.000 euro con un guadagno medio appunto di 6.100 euro. Il valor medio di una variabile casuale coincide con la media aritmetica ponderata definita nella statistica descrittiva. FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 4 di 11 SCARTO di una variabile casuale discreta . Si definiscono SCARTI di una v.c.d. le differenze tra i valori assunti dalla variabile casuale X e la propria media Si = xi − M ( X ) . La variabile casuale scarto avrà la seguente distribuzione di probabilità: Si x1 − M ( X ) x2 − M ( X ) x3 − M ( X ) xi − M ( X ) … xn − M ( X ) Pi p1 p2 p3 pi … pn Il valore medio della variabile casuale scarto è sempre uguale a zero. E ( X i − M ( X )) = 0 Dimostrazione: n n n n n i =1 i =1 i =1 i =1 i =1 E ( X i − M ( X )) = ∑ ( xi − M ( X ) ) ⋅ pi = ∑ xi ⋅ pi − M ( X ) ⋅ ∑ pi = ∑ xi ⋅ pi − ∑ xi ⋅ pi ⋅ 1 = 0 essendo n ∑p M ( X ) una costante e i =1. i =1 La tabella della variabile scarto dell’esempio precedente sarà: valori probabilità Prodotti scarti semplici scarti semplici ponderati xi pi xi ⋅ pi ( xi − M ( X )) (xi − M ( X )) ⋅ pi 3.000 0.2 600 -3.100 -620 5.000 0.5 2.500 -1.100 -550 10.000 0.3 3.000 3.900 1.170 totali 1.0 6.100 0 M ( X ) = 6.100 QUADRATO DELLO SCARTO di una variabile casuale discreta . La variabile casuale quadrato dello scarto avrà la seguente distribuzione di probabilità: (Si )2 (x1 − M ( X ) )2 (x2 − M ( X ))2 (x3 − M ( X ))2 (xi − M ( X ))2 … (xn − M ( X ))2 Pi p1 p2 p3 pi … pn FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 5 di 11 VARIANZA E SCARTO QUADRATICO MEDIO di una variabile casuale discreta . La media è un valore sintetico della distribuzione. Più distribuzioni, anche se hanno la stessa media, possono differire sensibilmente. Per analizzare la dispersione dei valori di una v.c. dal valore medio si considera una nuova variabile casuale chiamata VARIANZA e si indica con il simbolo σ2 oppure VAR(X) e si calcola con la formula: n VAR ( X ) = ∑ ( xi − M ( X )) pi = ( x1 − M ( X )) p1 +( x 2 − M ( X )) p2 +...+( xn − M ( X )) pn 2 2 2 2 i =1 e si definisce come il valore medio del quadrato degli scarti tra i valori e la media E (xi − M ( X ) ) . 2 La varianza è uguale a zero quanto tutti i valori xi sono uguali tra loro e quindi non c'è variabilità nella distribuzione. In ogni altro caso la varianza è un valore positivo, essendo una somma di quantità quadratiche, e misura il grado di variabilità nella distribuzione; quanto maggiore è σ2, tanto più i valori xi sono differenti tra di loro e si disperdono intorno alla media. Tanto minore è σ2 , tanto più i valori xi sono addensati intorno alla media e minore è la variabilità dei dati. La radice quadrata della varianza σ prende il nome di DEVIAZIONE STANDARD o SCARTO QUADRATICO MEDIO della variabile casuale: σ= n ∑ (x i =1 − M ( X )) p i 2 i σ è espresso nella stessa unità di misura della v.c. e rappresenta la misura per valutare la dispersione dei valori della variabile. Se , ad esempio, la v.c. X è espressa in metri, anche σ è espressa in metri,mentre la varianza σ2 è espressa in metri quadrati. Per calcolare la varianza dell'esempio precedente riguardante l'operazione finanziaria si procede alla costruzione della seguente tabella : valori xi probabilità prodotti scarti semplici scarti quadratici scarti quadratici ponderati xi ⋅ pi ( xi − M ( X )) ( xi − M ( X ))2 ( xi − M ( X )) 2 ⋅ pi 3.000 0.2 600 -3.100 9.610.000 1.922.000 5.000 0.5 2.500 -1.100 1.210.000 605.000 10.000 0.3 3.000 3.900 15.210.000 4.563.000 totali 1.0 6.100 M ( X ) = 6.100 σ2= 7.090.000 7.090.000 σ=2.662,7 ABBREVIAZIONE DEL CALCOLO DELLA VARIANZA FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 6 di 11 La varianza di una v.c.d. può essere agevolmente calcolata con la formula ridotta: n VAR( X ) = ∑ xi2 ⋅ pi − (M ( X ) ) 2 i =1 Dimostrazione: n ∑ (x − M ( X )) 2 i i =1 n n pi =∑ xi2 ⋅ pi − 2 M ( X ) ⋅ ∑ xi ⋅ pi + (M ( X )) i =1 i =1 valori n 2 xi n xi ∑p =∑ i =1 n 2 i 2 2 i =1 i =1 probabilità n ⋅ pi − 2(M ( X )) + (M ( X )) = ∑ xi2 ⋅ pi − (M ( X ) ) prodotti prodotti xi ⋅ pi xi2 ⋅ pi 3.000 0.2 600 1.800.000 5.000 0.5 2.500 12.500.000 10.000 0.3 3.000 30.000.000 totali 1.0 6.100 44.300.000 VAR( X ) = ∑ xi2 ⋅ pi − (M ( X ) ) = 44.300.000 − (6.100 ) = 7.090.000 2 2 i =1 FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 7 di 11 2 PROVE RIPETUTE e DISTRIBUZIONE BINOMIALE Si ricorre alla distribuzione binomiale quando un fenomeno è dicotomico, cioè esso si presenta attraverso solo due modalità o può essere ricondotto a due mediante gli eventi contrari. ( esempio: lancio della moneta, eventi testa e croce; prodotto difettoso o non difettoso; persone che possiedono una certa modalità ) . La distribuzione binomiale trae la sua origine nello schema di Bernoulli delle prove ripetute schematizzabile con estrazioni da un'urna rimettendo ogni volta la pallina estratta nell'urna: le prove sono indipendenti e la probabilità p del verificarsi dell'evento favorevole è costante in ogni prova. _ Sia E un evento, con E indichiamo l'evento contrario, - con p indichiamo la probabilità del verificarsi dell'evento E , costante in ogni prova, - con q indichiamo la probabilità del verificarsi dell'evento E , q = 1 − p , costante in ogni _ prova, - con n indichiamo il numero delle prove da effettuare, - con k indichiamo il numero delle volte che si presenta l'evento E . La probabilità che in n prove si verifichi k volte l'evento E è data dalla formula : n Pk = p k q k n−k Dimostrazione: data l'indipendenza delle prove la probabilità di ottenere in n prove l'evento E nelle prime k _ prove e l'evento E nelle successive n-k prove si ha semplicemente moltiplicando tra loro le probabilità (1 p4 ⋅ p4 ⋅2 p ⋅4 p4 ⋅ ⋅ ⋅3p ) ⋅ (1 q ⋅4 q4 ⋅ q2⋅ q4⋅ ⋅4 ⋅3 q) = p k ⋅ q n−k . ( n − k )→ prove k → prove _ Per avere la probabilità di avere k volte l'evento E e n-k l'evento E qualunque sia l'ordine basta calcolare in _ quanti modi diversi possiamo ottenere k volte E e n-k volte E , cioè le permutazioni di n elementi dove k elementi si ripetono k volte e n-k elementi si ripetono n-k volte. Il numero possibile dei modi in cui ordinare è dato da n n! = k !⋅ ( n − k )! k . FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 8 di 11 La distribuzione binomiale è una variabile casuale; fissato il numero delle prove n , l'evento E si può presentare da zero volte a n volte con le rispettive probabilità; essendo n gli eventi incompatibili e necessari sarà ∑ k=0 Pk = 1 . La distribuzione binomiale si potrà rappresentare anche con la consueta tabella delle variabili casuali: Xi 0 1 2 i … n Pi p0 p1 p2 pi … pn Oltre alla funzione di distribuzione si considera la FUNZIONE DI RIPARTIZIONE definita dalla formula F ( X i ) = P ( X ≤ xi ) = po + p1 + p2 + ... + pi ed esprime la probabilità che l'evento E si verifichi 0 volte o 1 volta o 2 volte o … i volte , cioè la probabilità che l'evento E si verifichi non più di i volte , fino a i volte. Esempio: 1) Da un mazzo di 40 carte si estrae per 4 volte una carta, rimettendo ogni volta la carta estratto nel mazzo. Studiare la variabile casuale X = numero delle figure estratte. Lo schema è quello bernoulliano perché la probabilità di estrarre una figura è costante in ogni prova che vengono ripetute sempre nelle stese condizioni; indicato con : p = probabilità di estrarre una figura da un mazzo di carte di 40 carte , p = 12 =0,30 ; 40 q = probabilità di non estrarre una figura da un mazzo di carte di 40 carte , q =0,70; n = numero delle estrazioni effettuate, n =4; k = numero delle volte che si presenta l'evento favorevole E = 'figura estratta', k =0,1,2,3,4. n Pk = p k q k n−k la probabilità che l'evento E si verifichi esattamente k volte, gli eventi avranno le seguenti singole probabilità Pi : FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 9 di 11 4 P0 = ( 0 ,3 ) 0 ⋅ ( 0 ,7 ) 4 − 0 = 0 ,2 4 0 1 0 4 P1 = ( 0 , 3 ) 1 ⋅ ( 0 , 7 ) 4 − 1 = 0 , 4 1 1 6 1 4 P2 = ( 0 , 3 ) 2 ⋅ ( 0 , 7 ) 4 − 2 = 0 , 2 6 4 6 2 4 P3 = ( 0 , 3 ) 3 ⋅ ( 0 , 7 ) 4 − 3 = 0 , 0 7 5 6 3 4 P4 = ( 0 , 3 ) 4 ⋅ ( 0 , 7 ) 4 − 4 = 0 , 0 0 8 1 4 P3 ,ad esempio, esprime la probabilità che nell'estrazione di 4 carte da un mazzo di 40 , rimettendo le carte estratte nel mazzo, escano esattamente 3 figure. F2 ,ad esempio, esprime la probabilità che escano non più di due figure, cioè o zero figure, o 1 figura o 2 figure. La variabile può essere rappresentata mediante la tabella delle v.c.d. : Xi 0 1 2 3 4 Pi 0,2401 0,4116 0,2646 0,0756 0,0081 Se il numero delle estrazioni salisse a otto si avrebbe la seguente variabile casuale : Xi 0 1 2 3 4 5 6 7 8 Pi 0,0576 0,1977 0,2965 0,2541 0,1361 0,0467 0,01 0,0012 0,0001 Fi 0,0576 0,2553 0,5518 0,8059 0,942 0,9887 0,9987 0,9999 1 grafico della variabile casuale con estrazione di otto carte con reimmissione nel mazzo estrazione di otto carte da un mazzo di 40 carte probabilità 0,4 0,3 2 0,2 0,1 3 1 4 0 0 0 5 1 2 3 4 5 6 6 7 7 8 8 evento figura FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 10 di 11 MEDIA E VARIANZA DELLA VARIABILE CASUALE BINOMIALE La media della variabile casuale binomiale si calcola ,come per le altre v.c., mediante somma dei prodotti delle xi ( k ) modalità per le rispettive probabilità pi : n M ( X ) = ∑ k ⋅ Pk = 0 ⋅ P0 + 1 ⋅ P1 +...+n ⋅ Pn k =0 Si dimostra che la media è uguale al prodotto della probabilità p per il numero delle prove n : M ( X ) = n ⋅ p La varianza della variabile casuale binomiale si calcola ,come per le altre v.c., mediante somma dei quadrati degli scarti dei valori xi ( k ) dalla media M ( X ) . Si dimostra che la varianza è uguale al prodotto della probabilità p per la probabilità q per il numero delle prove n : VAR( X ) = σ 2 ( X ) = n ⋅ p ⋅ q . Lo scarto quadratico medio si ottiene al solito calcolando la radice quadrata della varianza: s.q.m. = σ = n⋅ p⋅q Esempio: un dado viene lanciato 720 volte; determinare media e varianza dell'evento faccia '6': E = 'nel lancio di un dado si presenta la faccia 6' ; p = probabilità dell'evento E = 1 / 6 ; _ q =probabilità dell’evento contrario E = 5 / 6 , n = 720, numero delle prove indipendenti ; a) M (X ) = n ⋅ p = 1 ⋅ 720 = 120 il valore atteso è pari a 120, cioè lanciando 720 volte un dado dovremmo 6 aspettarci che la faccia '6' esca 120 volte; questo valore è solo un risultato "atteso", di probabilità. Lanciando effettivamente il dado 720 volte il risultato reale può ovviamente discostarsi da quello teorico anche se la differenza , se il dado non è truccato, sarà minima. 1 5 2 b) VAR( X ) = σ ( X ) = n ⋅ p ⋅ q = 6 ⋅ 6 ⋅ 720 = 100; s.q.m. = σ = 100 = 10 BIBLIOGRAFIA Le lezioni hanno trovato spunto dai seguenti testi: 1. Gambotto Manzone – Consolini , matematica con applicazioni informatiche 2, Tramontana ; 2. Scaglianti, il modello non deterministico, CEDAM; 3. Spiegel, collana SCHAUM , statistica, Etas libri; 4. Trovato – Manfredi, calcolo delle probabilità e statistica inferenziale, Ghisetti e Corvi editori; 5. Girone – Sallustio, esercizi di statistica, Cacucci editore; 6. Piccinato, calcolo delle probabilità, la goliardica editrice. FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33 STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO VARIABILI CASUALI DISCRETE Pagina 11 di 11