Variabili aleatorie Una variabile aleatoria (o casuale) è un’etichetta di tipo numerico che si assegna al risultato di un esperimento. Definizione: Sia E un esperimento ideale e S lo spazio campionario dei possibili esiti . Una variabile aleatoria è una funzione: : S , () In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado S={1,2,3,4,5,6} X(k)=k, k=1,2,…,6 In atri casi si definisce un’opportuna codifica. Esempio: lancio di una moneta S={C,T} (C)=0 (T)=1 Variabili aleatorie Consideriamo due tipi di variabili aleatorie (v.a.) V.a. discrete v.a. che assumono un numero finito o numerabile di valori v. a. continue v.a. che assumono un insieme di valori che “ha la potenza del continuo” Ad esempio i valori assunti da tali variabili possono essere tutti i numeri reali , solo un intervallo [a,b] o una semiretta [a,+oo[ 2 v.a. discrete Esempi v.a. che assumono un numero finito o numerabile di valori Esperimento Lancio della moneta due possibili realizzazioni TESTA o CROCE Lancio di un dado equo Il numero di telefonate in un call center in un prefissato intervallo di tempo T sapendo che in media arriva una telefonata ogni 20 secondi V.a. discreta V.a. di Bernoulli (1654-1705) Variabile dicotomica con due possibili realizzazioni 0 e 1 e con rispettive probabilità p e 1-p. V.a. uniforme discreta Variabile con k possibili realizzazioni equiprobabili con rispettive probabilità p= 1/k V.a. di Poisson Variabile che assume tutti i valori naturali. Legge degli eventi rari. 3 v. a. continue v.a. che assumono un insieme di valori che “ha la potenza del continuo Esempi Esperimento Far ruotare una bottiglia e misurare l’angolo che forma rispetto ad una prefissata direzione (tutti i valori tra 0 e 360 gradi escluso sono equiprobabili ) Si esegue una delle seguenti misure - la lunghezza di una trave, - la densità dell’azoto, - il peso di un individuo V.a. continua V.a. uniforme continua Variabile con un continuo di possibili realizzazioni tutte equiprobabili V.a. normale o gaussiana Variabile che ammette come realizzazioni tutti i valori reali. Fissato un valore centrale μ, la probabilità di una valore dipende solo dalla distanza da μ. Valori più vicini sono molto più probabili 4 v. a. continue v.a. che assumono un insieme di valori che “ha la potenza del continuo” Esempi Esperimento Supponiamo che in un certo negozio (aperto 6 ore) entrino in medie 18 persone al giorno . Ovvero in media 3 persone ogni ora. Quanto tempo passa tra l’entrata di un cliente e il successivo? V.a. continua V.a. esponenziale o esponenziale negativa Variabile che ammette come realizzazioni solo valori reali positivi. Valo troppo grandi meno probabili Il numero di telefonate medio in un call center è di una telefonata ogni 20 secondi. Supponendo di aver appena ricevuto una telefonata tra quanto tempo avverrà la prossima? V.a. esponenziale o esponenziale negativa 5 Funzioni di distribuzione Come si associano le probabilità alle variabili casuali? Definizione: : S x=()I Ad ogni v.a. si assegnano le probabilità mediante una funzione che è detta funzione di ripartizione o funzione di distribuzione Sia E un esperimento ideale, S lo spazio campionario dei possibili esiti e P una funzione di probabilità definita su S. La funzione di distribuzione F di una v.a. X associa a ciascun valore x la probabilità che la v.a. assuma valori non superiori a x F: [0, 1] F (x)=P(X()≤x) 6 Funzioni di distribuzione Proprietà: FX è una funzione di ripartizione se FX ( x) è non decrescente FX x è continua a destra x 0 FX x 1 lim FX x 0 x lim FX x 1 x 7 Funzioni di distribuzione Proprietà: Posto FX x lim FX t t x Si dimostra che P(a X b) FX (b) FX (a) P(a X b) FX (b) FX (a ) Probabilità intervalli P(a X b) FX (b ) FX (a ) P(a X b) FX (b ) FX (a) P( X b) 1 P( X b) 1 FX (b) P( X b) 1 P( X b) 1 FX (b ) Probabilità semirette 8 Funzioni di distribuzione per v.a. discrete Per variabili aleatorie discrete la funzione di distribuzione Fx è data da: FX x P X x P X xi pxi xi x xi x dove p è detta funzione di probabilità ed è definita in modo che pxi P X xi funzione di probabilità 9 variabile aleatoria di BERNOULLI Esperimento lancio di una moneta truccata S={T,C} Variabile aleatoria : {T,C} {0,1} C 0 T 1 P(T)=p(1)=p P(C)=p(0)=q=1-p Funzione di distribuzione F: [0, 1] x <0 F(x)=0 0 ≤ x <1 F(x)=q 1≤x F(x)=1 Esempio F(-2)=Prob(X≤-2 )=0 F(0.36)=Prob(X≤0.36 )=q La funzione di distribuzione è una a (due) gradini 1 F q 0 1 10 V.a. UNIFORME DISCRETA Esperimento lancio di un dado S={1,2,3,4,5,6} La funzione di distribuzione è una funzione a sei (k) gradini Funzione di distribuzione F: [0, 1] x <1 F(x)=0 1 ≤ x <2 F(x)=1/6 2 ≤ x <2 F(x)=2/6 3 ≤ x <2 F(x)=3/6 4 ≤ x <2 F(x)=4/6 5 ≤ x <2 F(x)=5/6 6≤x F(x)=1 P( P( )=1/6=1/k )=1/6=1/k P( P( )=1/6=1/k )=1/6=1/k P( P( )=1/6=1/k )=1/6=1/k Variabile aleatoria : { } {1,2,3,4,5,6} 1 5/6 4/6 3/6 F 2/6 1/6 0 1 2 3 4 5 6 Esempio F(3.1)=Prob(X≤3.1 )=3/6 11 V.a. poissoniana o distribuzione di Poisson Esempio (inventato) Supponiamo di voler calcolare la probabilità che una persona di Napoli abbia bisogna del meccanico in un fissato anno esattamente k=0,1,…,n volte Dati rilevati a Napoli nel 2003 interventi dal meccanico Quante persone Tot interventi 0 166 0 1 297 297 2 267 534 3 160 480 4 74 296 5 26 130 6 7 42 7 3 21 1000 1800 totale 12 Graficamente … V.a. poissoniana o distribuzione di Poisson Il grafico delle frequenza assolute somiglia al grafico della successione di punti Poissoniana p(n)= e-a(an/n!) V.a. poissoniana o distribuzione di Poisson funzione di probabilità p(x)=(ax/x!)e-a Variabile aleatoria : {persona di Napoli} N numero naturale a è detto parametro della legge di Poisson e rappresenta la frequenza media di accadimento dell'evento osservato Esempio Supponiamo di voler calcolare la probabilità che una persona di Napoli vada dal meccanico da 2 a 4 volte, sapendo che a la frequenza media è data da a=1800/1000 p(2)=(a2/2!)e-a= 0.2678 p(3)=(a3/3!)e-a =0.1607 p(4)=(a4/4!)e-a =0.0723 p(2≤X≤4)= p(2) + p(3) + p(4)= 0.5008= 50.08% 14 Parametri di una v.a. discreta La distribuzione dei valori assunti da una v.a. si può caratterizzare attraverso differenti parametri media varianza deviazione standard media (valor medio, valore atteso, aspettazione ) X EX xk pxk k varianza ( dispersione ) X2 VarX E X X 2 xk X 2 pxk deviazione standard k DevStd[ X ] X X2 E X X 2 15 Parametri di una v.a. discreta variabile aleatoria di BERNOULLI Funzione di probabilità media X xk pxk 0q 1 p p p(1)=p p(0)=q=1-p k varianza xk X pxk (0 p) 2 q (1 p) 2 p p 2 q q 2 p pq 2 X 2 k deviazione standard DevStd[ X ] X2 pq 16 Parametri di una v.a. discreta V.a. UNIFORME DISCRETA Funzione di probabilità p(k)=1/n k=1,…,n media 1 1 1 (n 1) X xk p xk 1 2 n 1 k n n n 2 varianza xk X 2 X 2 k n² - 1 p xk 12 deviazione standard DevStd[ X ] 2 X n² - 1 12 17 Parametri di una v.a. discreta V.a. poissoniana o distribuzione di Poisson Funzione di probabilità p(k)=(ak/k!)e-k media a k a a 0 a a k a X k pk k e 0 e k e k! 0! k! k 0 x 0 k 1 k 1 a a k 1 a a k e a e a k k! k! k 1 k 1 k 1 a a e a a e a e a a k 1 k 1! 18 Parametri di una v.a. discreta V.a. poissoniana o distribuzione di Poisson varianza Dalla proprietà Funzione di probabilità p(k)=(ak/k!)e-k VarX E X 2 EX 2 segue k 2 pk a 2 a 2 a a 2 a 2 X k 0 deviazione standard DevStd[ X ] X2 a 19 Funzioni di distribuzione per v.a. continue Per variabili aleatorie continue la funzione di distribuzione Fx è data da: FX x P X x x f t dt dove p è detta funzione di densità di probabilità ed è tale che f xi P X xi densità di probabilità P(a X b) FX (b) FX (a) 20 Funzioni di distribuzione per v.a. continue Ricordando che P(a X b) FX (b) FX (a) Risulta b Pa X b f t dt a La probabilità che una v.a. assuma valore in un intervallo è calcolabile mediante un integrale definito 21 Parametri di una v.a. continua Anche per le v.a. continue la distribuzione dei valori assunti si può caratterizzare attraverso gli stessi parametri che per le v.a discrete media xi pxi se X è discreta i X EX xf x dx se X è continua 2 varianza x pxi se X è discreta i X X2 i 2 x f x dx se X è continua X deviazione standard DevStd[ X ] X2 22 Parametri di una v.a. proprietà Anche nel caso di v.a. continue per media varianza e deviazione standard valgono tutte le proprietà discusse nel caso discreto EaX b aEX b EX Y EX EY VarX E X 2 EX 2 VarcX c 2VarX c 23 Parametri di una v.a. proprietà Inoltre VarX Y VarX VarY 2Cov[ X , Y ] Cov[ X , Y ] E[( X X )(Y Y )] Se X e Y sono indipendenti Cov[ X , Y ] 0 da cui VarX Y VarX VarY 24 Esperimento V.a. esponenziale o esponenziale negativa Il numero di telefonate medio in un call center è di una telefonata ogni 20 secondi. Supponendo di aver appena ricevuto una telefonata tra quanto tempo avverrà la prossima? Variabile aleatoria : S [0, +∞[ ti X(ti) continua La variabile casuale continua X(t) associa ad ogni telefonata ti il tempo che la divide dalla precedente. Si assume che la probabilità di aspettare più di un fissato tempo T decada esponenzialmente con T. Da cui La densità di probabilità è data da e t se t 0 f t se t 0 0 con parametro pari alla frequenza media osservata per il fenomeno FX x x x f t dt e t dt e t x 0 0 1 e x 25 Esperimento V.a. esponenziale o esponenziale negativa Il numero di telefonate medio in un call center è di una telefonata ogni 20 secondi. Supponendo di aver appena ricevuto una telefonata tra quanto tempo avverrà la prossima? Variabile aleatoria : S [0, +∞[ ti X(ti) continua FX FX x 1 e x 1 0 Esperimento V.a. esponenziale o esponenziale negativa Il numero di telefonate medio in un call center è di una telefonata ogni 20 secondi. Supponendo di aver appena ricevuto una telefonata tra quanto tempo avverrà la prossima? Variabile aleatoria : S [0, +∞[ ti X(ti) continua Esempio Supponiamo di voler calcolare la probabilità la prossima telefonata arrivi non prima di t1=10 secondi e non dopo t2= 15. Allora sapendo che la frequenza media è data da λ=1/20=0.05 15 P10 X 15 e t dt 10 e 10 e 15 0.6065 - 0.4724 0.1341 13.41% Parametri di una v.a. continua densità di probabilità variabile aleatoria ESPONENZIALE e t se t 0 f t se t 0 0 media X EX xf x dx xe dx varianza 0 0 varianza E X EX 2 X 2 2 x 1 (per parti) 2 1 1 (per parti) x x e dx 2 0 deviazione standard DevStd[ X ] 2 X 1 28 V.a. normale o gaussiana Esperimento Si eseguono 2000 misure xi della lunghezza di una trave. Ogni prova fornisce un risultato diverso. Assumendo che esiste un unico valore vero μ=6m per la misura della trave i valori ottenuti sono tutti errati: xi= μ +ei Si assume che - gli errori ei possono essere sia positivi che negativi con uguale probabilità. - errori grandi sono molto meno probabili (frequenti) degli errori piccoli - L’errore quadratico medio è dato dal parametro σ=5 cm Diremo che la misura della trave è μ ±σ. Con questo si assume che gran parte delle misure ottenute cade nell’intervallo di estremi μ -σ e μ +σ In figura il grafico delle frequenze assolute ottenute per le duemila misure V.a. normale o gaussiana Si dimostra che la distribuzione di probabilità più adatta a descrivere il comportamento degli errori accidentali in tali situazioni è la v.a. gaussiana detta anche curva di Gauss, Campana di Gauss o curva degli errori. densità di probabilità f N x 1 e 2 1 x 2 2 la media è il centro di simmetria di f(x) la deviazione standard è la distanza tra la media e i punti di flesso di f(x) ± fN(x) sono i punti i punti di flesso Variabile aleatoria N: S x Parametri di una v.a. continua densità di probabilità v.a. normale o gaussiana e t se t 0 f t se t 0 0 media 1 E[ N ] xf x dx x e 2 varianza 1 x 2 2 dx (per parti) varianza 1 Var[ N ] x e 2 2 1 x 2 2 dx 2 (per parti) deviazione standard DevStd[ X ] 31 V.a. normale o gaussiana PROBLEMA L’altezza dei marziani M è una v.a. gaussiana di media 150 cm e deviazione standard 10 cm. Che probabilità c’è che un marziano sia alto tra i 170 e i 180 cm ? Sol. 180 1 P170 M 180 FN (180) FN (170) e 17010 2 1 x 150 2 10 2 dx Come calcolare gli integrali (generalizzati) del tipo 2 1 x x 1 FN x e 2 dx 2 In generale la valutazione degli integrali? che coinvolgono la distribuzione di Gauss si esegue in due passi: 1. si riformula il problema in termini di un’altra v.a. detta Gaussiana standard o normale standard 2. Il calcolo dell’integrale si fa usando opportune tabelle V.a. normale standard o gaussiana standard La distribuzione Gaussiana Standard è una distribuzione gaussiana con media =0 e varianza 2=1. 1 x 2 x2 2 2 f NS x FNS x 1 e 2 dx x2 2 1 e 2 densità di probabilità Gaussiana Standard 1 f N x e 2 densità di probabilità Gaussiana x 1 2 x e x2 2 dx fNS(x) =1 =0 x 33 V.a. normale standard o gaussiana standard La distribuzione Gaussiana Standard è una distribuzione gaussiana con media =0 e varianza 2=1. La v.a. normale standard è la variabile standardizzata che si ottiene dalla gaussiana sottrendo la media la media e dividendo per N(,2) NS(0,1) N(-,2/2) Pa N b Pa N b a a N a a P NS P 34 V.a. normale o gaussiana 1. si riformula il problema in termini di un’altra v.a. detta Gaussiana standard o normale standard Sol. 180 150 170 150 P170 M 180 P NS P2 N S 3 10 10 3 1 e 2 2 x2 2 3 1 e 2 dx 0 x2 2 dx 1 2 2 e x2 2 dx 0 2. Il calcolo dell’integrale si fa usando opportune tabelle della funzione ERF(x) dove erf ( x) 2 P170 M 180 x t e dt 2 1 1 erf (3 / 2 ) erf (2 / 2 ) 2 2 0 si dimostra (mediante sostituzione) che 2 1 2 x e 0 t 2 1 dt erf ( x / 2 2) P 0.0214 0.21% V.a. normale o gaussiana si dimostra inoltre che vale la proprietà FNS x x 1 e 2 t2 2 dt 1 1 erf ( x / 2 2 2) da cui ad esempio segue che 1 1 P N S 1.2 erf (1.2 / 2 2 2 ) 0.8849 88.49% V.a. normale o gaussiana si dimostra inoltre che vale la proprietà erf ( z ) erf ( z ) cioè erf è funzione dispari da cui ad esempio segue che per calcolare la probabilità di un intervallo simmetrico [-x,x] basta calcolare erf (x / P x N S x 1 erf ( x / 2 2) 1 erf ( x / 2 1 erf ( x / 2 2) 2 ) , infatti 1 erf ( x / 2 2 ) erf ( x / 2) 2) da cui ad esempio segue che per calcolare la probabilità di un intervallo [a,b] con a NEGATIVO basta calcolare 1 erf (b / 2 2) 1 erf ( a / 2 2) 1 erf (b / 2 Pa N S b 2) 1 erf ( a / 2 2) Esempio P 0.7 N S 1.2 1 1 erf (1.2 / 2 ) erf (0.7 / 2 ) 0.6429 64.29% 2 2 Tavola di 1 erf ( x / 2 ) Tavola dell'area fra 0 e x della 2 normale standard, ovvero valori 1 di x si ottiene sommando il valore sulla colonna e sulla riga. erf ( x / 2 ) 2 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 Esempio dalla nona riga e terza colonna si ha 0.82 t2 2 1 1 1 1 P0 N SP 0erf .82(1.2 / 2 )e erf dt / 2) 0.2939 (0.7erf / (20).82 0.6429 64.29% 2 2 0 2 2 Tavola di 1 erf ( x / 2 ) Tavola dell'area fra 0 e x della 2 normale standard, ovvero valori 1 di x si ottiene sommando il valore sulla colonna e sulla riga. erf ( x / 2 ) 2 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 Esempio dalla prima riga e ottava colonna si ha P0 N S 1.68 1 2 1.68 0 e t2 2 dt 1 erf (1.68 / 2 ) 0.4535 2