Probabilità Probabilità Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità Se tutti gli eventi fossero ugualmente possibili, la probabilità p(E) di un evento E sarebbe uguale al rapporto tra il numeri f di casi favorevoli e il numero n dei casi possibili, ovvero p(E)=f/n Esempio: Si lancia due volte una moneta. Quale e’ la probabilità che escano due teste ? 1) I casi possibili sono 4: TT, TC, CT, CC 2) I casi possibili sono 3: escono 2 teste, esce 1 testa, escono 0 teste Probabilità Se, in una sequenza di n prove, un evento E si verifica s volte, si dice che il rapporto s/n è la frequenza relativa di E rispetto alla data sequenza di prove. Legge empirica del caso: Effettuando numerose prove, eseguite nelle stesse condizioni, la frequenza relativa di un evento è assai prossima alla sua probabilità; l’approssimazione è tanto maggiore quanto più numerose sono le prove effettuate Definizione frequentista della probabilità: La probabilità di un evento è il limite a cui tende la frequenza relativa, al tendere all’infinito del numero di prove effettuate Probabilità Definizione frequentista della probabilità: La probabilità di un evento è il limite a cui tende la frequenza relativa, al tendere all’infinito del numero di prove effettuate Ma alcune volte gli Eventi sono “irripetibili”… Definizione soggettiva della probabilità: dato un qualsiasi evento E, se mi è indifferente ricevere la somma s incondizionatamente, oppure la Somma S soltanto se E si verifica, si dice che la probabilità soggettiva p di quell’evento è p=s/S Variabile casuale (v.c.) E’ scomodo trattare direttamente gli eventi e può essere più semplice associare delle quantità numeriche agli eventi. Ciò si realizza attraverso la definizione di VARIABILE CASUALE: Una variabile casuale X è una variabile quantitativa i cui valori variano seguendo le regole della probabilità Variabile casuale (v.c.) Una v.c. X può essere discreta o continua: X è discreta se assume un numero finito o numerabile di risultati. Esempio: il numero di teste in 10 lanci di una moneta, il numero di volte in cui si ha un numero superiore a 4 in 5 lanci di un dado… X è continua se può assumere qualsiasi valore nell’ambito di uno specifico intervallo. Per esempio: altezza degli studenti del corso di statistica, il peso della confezione di caramelle di una certa marca…. Una v.c. è completamente specificata attraverso la sua distribuzione di probabilità Distribuzione di probabilità La distribuzione di probabilità p(x) di una variabile casuale X indica la probabilità della variabile casuale per ciascuno dei suoi valori possibili Si ha dunque che per una variabile casuale f(x)=P(X=x) per tutti i possibili valori x che X può assumere. f(x) è detta funzione di densità di probabilità (probability density function (pdf)) La pdf di una variabile discreta è detta funzione di massa (indicata anche con p(x)) ed è rappresentabile attraverso un istogramma o sotto forma tabellare Distribuzioni di probabilità discrete e continue Esempio di funzione di probabilità (caso discreto) Esempio di funzione di densità di probabilità (caso continuo) Distribuzioni di probabilità discrete Esperimento: lancio di 2 monete S= {(T,T);(T,C);(C,T);(C,C)} Variabile casuale: X = numero di teste; v.c. discreta, i suoi possibili valori sono: • 0 (se non si ottiene alcuna testa) • 1 (se una delle due monete dà testa) • 2 (se entrambe le monete danno testa) Quindi: • P(X=0)=P(C,C)=1/4 • P(X=1)=P((T,C) oppure (C,T))=2/4 • P(X=2)=P(T,T)=1/4 x P(x)=P(X=x) 0 ¼ 1 ½ 2 ¼ Distribuzioni di probabilità discrete 0 ≤p(x)≤ 1 Le probabilità associate ai valori di una variabile casuale devono essere comprese tra 0 e 1 inclusi ∑p(x)=1 La somma delle probabilità di tutti i valori x di una variabile casuale deve essere 1 La distribuzione di probabilità di una variabile casuale discreta può essere rappresentata in modo grafico attraverso un istogramma di distribuzione di probabilità Esempio precedente: x P(x)=P(X=x) 0 ¼ 1 ½ 2 ¼ Distribuzione di probabilità discrete Media o Valore Atteso µ = E ( x) = ∑ xp( x) x Se una funzione H dipende da p(x) il valore atteso di H puo’ essere calcolato come E ( H ( x)) = ∑ H ( x) p ( x) x Calcolo delle probabilità usando i dati Dalle vendite di TV osservate in passato (below left), si ricava una rappresentazione tabulare della distribuzione di probabilità delle vendite Numero Unità vendute 0 1 2 3 4 di giorni 80 50 40 10 20 200 x 0 1 2 3 4 f (x ) .40 .25 .20 .05 .10 1.00 Rappresentazione grafica Rappresentazione grafica delle vendite giornaliere di TV .50 Probability .40 .30 .20 .10 Values of Random Variable x (TV sales) Esempio Valore Atteso di variabili casuali discrete x f (x ) xf (x ) --------------------------0 .40 .00 1 .25 .25 2 .20 .40 3 .05 .15 4 .10 .40 1.20 = E (x ) Il valore atteso delle vendite giornaliere di TV è 1.2 Calcoliamo la deviazione standard Esempio Varianza e Deviazione Standard di una variabile casuale discreta x x-µ 0 1 2 3 4 -1.2 -0.2 0.8 1.8 2.8 (x - µ )2 1.44 0.04 0.64 3.24 7.84 f (x ) .40 .25 .20 .05 .10 (x - µ )2f (x ) .576 .010 .128 .162 .784 1.660 = σ 2 La varianza delle vendite giornaliere è 1.66 TV (al quadrato) La deviazione standard delle vendite è di 1.29 TV Funzione di distribuzione cumulativa (cdf) F ( x) = P( X ≤ x) P(a < X ≤ b) = F (b) − F (a ) x 0 1 2 3 4 f (x ) .40 .25 .20 .05 .10 1.00 F(x) .40 .65 .85 .90 1.00 La distribuzione di probabilità binomiale La variabile casuale Binomiale è una distribuzione probabilità discreta caratterizzata dalle seguenti proprietà: di Le osservazioni di una distribuzione binomiale sono determinate da un esperimento fatto da un numero n di prove reiterate L’esito di ogni prova dell’esperimento (ovvero ciascuna osservazione) può essere classificato in due categorie incompatibili ed esaustive, dette per convenzione successo e insuccesso La probabilità p di ottenere un successo è costante per ogni osservazione, così come la probabilità (1-p) che si verifichi un insuccesso Le prove dell’esperimento sono indipendenti, ovvero il risultato di una osservazione, successo o insuccesso, è indipendente dal risultato di qualsiasi altra La variabile casuale binomiale rappresenta il numero di successi ottenuti in un campione di n prove indipendenti La distribuzione di probabilità binomiale esempio In un’urna ci sono 100 palline, di cui 30 sono rosse e le rimanenti sono blu. Supponendo di estrarre 10 palline con reinserimento, ovvero la pallina estratta viene rimessa nell’urna, qual è la probabilità di estrarre esattamente una pallina di colore rosso? • L’esperimento consiste nell’estrarre una pallina da un urna, con reinserimento della pallina estratta, per n=10 volte si hanno n=10 osservazioni • L’esito di ogni prova dell’esperimento è “pallina rossa” o “pallina blu” due categorie incompatibili ed esaustive, e “pallina rossa” è l’esito “successo” • La probabilità di ottenere successo ovvero “pallina rossa” è pari a p=30/100 ed è costante per ogni prova • Le prove dell’esperimento, ovvero le estrazioni, sono indipendenti • Il numero di successi è un numero compreso tra 0 e 10 • Si vuole calcolare la probabilità che ci sia esattamente un successo in n=10 prove • Definiamo X = numero di successi in n prove X ~ Binomiale (n, p) n x n! n− x p ( x) = ⋅ p ⋅ (1 − p ) = ⋅ p x ⋅ (1 − p ) n − x x!(n − x)! x La distribuzione di probabilità binomiale dimostrazione Vogliamo calcolare la probabilità di avere x successi e (n-x) insuccessi. Dal momento che gli eventi sono indipendenti, le probabilità andranno moltiplicate Dobbiamo avere x successi quando ciascun successo ha probabilità p e n-x insuccessi quando ciascun insuccesso ha probabilità 1-p La probabilità di avere una combinazione sarà uguale alla moltiplicazione tra questi valori: p x (1 − p ) n − x Ci sono però differenti combinazioni alternative, quindi la probabilità di avere esattamente x successi in n tentativi è data da: n x n! n− x p ( x) = ⋅ p ⋅ (1 − p ) = ⋅ p x ⋅ (1 − p ) n − x x!(n − x)! x Funzione di distribuzione di probabilità della distribuzione binomiale La distribuzione di probabilità binomiale esempio Nell’esempio precedente X~Binomiale(n,p) con n=10 e p=0.25: 10 10! p (1) = ⋅ 0.251 ⋅ (1 − 0.25)10−1 = ⋅ 0.251 ⋅ (1 − 0.25)10−1 = 0.187 1!(10 − 1)! 1 Per esempio la distribuzione di probabilità binomiale con una probabilità di successo pari a 0.25 può essere rappresentata dal seguente istogramma dove: asse orizzontale: possibili valori della variabile asse verticale: probabilità Ruolo del parametro p: Nelle 3 distribuzioni Binomiali n = 5, mentre p varia assumendo i valori 0.3, 0.5 e 0.8. Dai grafici possiamo dedurre che: Se p = 0.5, la distribuzione è simmetrica, in caso contrario è asimmetrica, positivamente se p < 0.5, negativamente se p > 0.5. Per ogni fissato n, la massima dispersione dei valori si ha quando p = 0.5; se p tende a 0 o a 1, la distribuzione tende a concentrarsi sui valori più prossimi a 0 o a n, rispettivamente. p definisce la posizione della distribuzione sull'asse reale, nel senso che np identifica un punto vicino alla moda della distribuzione. Ruolo del parametro n: p=0.5 (istogrammi simmetrici) mentre n varia assumendo i valori 5, 10, 20. Per una corretta interpretazione della figura osserviamo che le altezze dei bastoni sono comparabili perché la scala verticale è la stessa, mentre la scala sull'asse orizzontale è diversa. In sintesi: Al crescere di n l'intervallo di variazione del numero dei successi si estende (nell'esempio passa da 0-5 a 0-10 a 0-20) il che comporta, a parità di p, un aumento della dispersione dei valori osservabili. Al crescere di n aumenta il numero delle determinazioni osservabili e quindi si riduce il valore delle singole probabilità (l'istogramma si allarga e si abbassa sensibilmente). Tuttavia il picco della distribuzione continua a segnalare con chiarezza il parametro p dell'urna (in termini relativi, 0.5). La distribuzione di probabilità binomiale – caratteristiche principaliSe X e una variabile casuale che segue una distribuzione binomiale con paramentri n (numero di tentativi) e p (probabilità di successo), X avrà: Media pari a : E(X) = n*p Varianza pari a: Var(X) = n*p (1-p) Esempio 1 Determinare la probabilità che su 12 lanci di una moneta buona si ottengano esattamente 8 teste. p=q=1/2 n=12 x=8 n x n! n −x p(x) = ⋅ p ⋅ (1− p) = ⋅ p x ⋅ (1− p) n −x x!(n − x)! x € € 12 12 ⋅11⋅10 ⋅ 9 8 4 p12 (8) = ⋅ 0,5 ⋅ 0.5 = ⋅ 0.5 8 ⋅ 0.5 4 ≅ 0.1208 4 ⋅ 3⋅ 2 8 Esempio 2 Determinare la probabilità che estraendo (con rimpiazzo) per 5 volte una carta da un mazzo da 40 si ottengano: 1) Esattamente 3 figure 2) Almeno 3 figure 3) Almeno una figura p=12/40=0.3 Esempio 2 p=12/40=0.3 1) Esattamente 3 figure 5 p5 (3) = ⋅ 0,33 ⋅ 0.7 2 = 10 ⋅ 0,33 ⋅ 0.7 2 ≅ 0.1323 3 2) Almeno 3 figure p5 (3) + p5 (4) + p5 (5) ≅ 0.1323 + 0.0284 + 0.0024 = 0.1631 € 3) Almeno una figura p5 (1) + p5 (2) + p5 (3) + p5 (4) + p5 (5) = € € 5 1− p5 (0) = 1− ⋅ 0.30 ⋅ 0.7 5 = 1− 0.16807 = 0.83193 0 Esempio 3 Un tiratore colpisce un bersaglio con probabilità 0.2. Quale è la probabilità che su 8 tiri si colpisca 2 volte il bersaglio ? E che si colpisca almeno due volte ? Soluzione: p8 (2) ≅ 0.2936 1− p8 (0) − p8 (1) ≅ 0.4967 € € Distribuzioni di probabilità continue Per i dati continui la variabile casuale può assumere qualsiasi valore in un intervallo di infiniti numeri reali La pdf f(x) di una variabile casuale X ha le seguenti proprietà: 1. f(x) è definita su tutti i numeri reali 2. f (x) ≥ 0 per tutti i valori di x . 3. L’area sottesa dalla curva f è uguale a 1: ∫ f ( x)= 1 x 4. b P (a ≤ X ≤ b ) = ∫ f ( x)dx a y = f ( x) y = f ( x) a b Distribuzioni di probabilità continue Se X è una v.c. continua, allora: - per ogni numero c, P(x = c) = 0 - per ogni due numeri a e b con a < b, P ( a ≤ X ≤ b) = P ( a < X ≤ b) = P ( a ≤ X < b) = P ( a < X < b) Funzioni di probabilità cumulative La funzione di probabilità cumulativa, F(x) per una v.c. continua X è definita per ogni x da F ( x) = P ( X ≤ x ) = ∫ x −∞ f ( y )dy Per ogni x, F(x) è l’area della curva a sinistra di x. F(x) per il calcolo delle probabilità Sia X una v.c. continua con pdf f(x) e cdf F(x). Allora per ogni numero a, P ( X > a ) = 1 − F (a) E per ogni numero a and b con a < b, P (a ≤ X ≤ b ) = F (b) − F (a ) Esempio Funzione di probabilità (pdf) 0.75(1 − x 2 ) − 1 ≤ x ≤ 1 f ( x) = 0 otherwise −∞ 1 f (v)dv = ∫ 0.75(1 − v 2 )dv = 1 −1 Funzione di distribuzione cumulativa F ( x) = ∫ x −∞ ∫ ∞ x f (v)dv = ∫ 0.75(1 − v 2 )dv =0.5 + 0.75 x − 0.25 x 3 −1 0 F ( x) = 0.5 + 0.75 x − 0.25 x 3 1 x ≤ −1 −1 < x ≤ 1 x >1 Probabilità di eventi P (−0.5 ≤ x ≤ 0.5) = F (0.5) − F (−0.5) = ∫ 0.5 − 0.5 0.75(1 − v 2 )dv = 68.75% P ( X ≤ x) = F ( x) = 0.95 = 0.5 + 0.75 x − 0.25 x 3 ⇒ x = 0.73 Valore Atteso Il valore atteso o valor medio di una v.c. continua X con f (x) è: ∞ µ X = E (X ) = ∫ −∞ x ⋅ f ( x)dx Valore atteso di h(X) se X è una v.c. continua con pdf f(x) e h(x) è una funzione di X, allora ∞ E [h( x) ] = µh ( X ) = ∫ h( x) ⋅ f ( x)dx −∞ Varianza e Deviazione Standard La varianza di una v.c. continua X con pdf f(x) e media µ è: 2 σX ∞ = V ( x) = ∫ (x − µ) −∞ 2 ⋅ f ( x)dx 2 = E[( X − µ ) ] La deviazione standard is σ X = V ( x). 2 2 ( )− [E ( X )] V (X ) = E X Esempio 0.75(1 − x 2 ) − 1 ≤ x ≤ 1 f ( x) = 0 otherwise 1 µ = E ( X ) = ∫ 0.75 x(1 − x 2 )dx = 12 (0.75) x 2 − 14 (0.75) x 4 2 2 −1 1 [ 2 2 [ 3 ] +1 −1 =0 σ = E ([ µ − X ] ) = ∫ ( x − 0) 0.75(1 − x )dx = (0.75) x − (0.75) x −1 1 3 1 5 ] 5 +1 −1 = 0.2 Distribuzione Uniforme Una variabile continua X segue una distribuzione uniforme sull’intervallo [A, B] se: 1 A≤ x≤ B f (x; A, B ) = B − A 0 otherwise Esempio Distribuzione Uniforme 1. In certi esperimenti l’errore commesso nella determinazione della solubilità di una sostanza è una variabile aleatoria X avente distribuzione uniforme con A=-0.025 e B= 0.025. Trovare la probabilità che l’errore: a) Sia compreso tra 0.010 e 0.015; 0.015 − 0.010 P(0.010 ≤ X ≤ 0.015) = = 0.1 0.025 + 0.025 b) Sia compreso tra –0.012 e 0.012. € Esempio Distribuzione Uniforme 2. Si consideri una variabile aleatoria X con distribuzione uniforme. Essendo noto che E(X)=6 e V(X)=2 trovare: a) Pr(X>=5.5) b) la mediana di X. A+B E(X)= 2 € € (B − A) 2 V (X)= 12 Esercizio Marcello sa che il suo amico Carlo arriverà al bar Sport in un istante compreso tra le nove e le dieci di una data mattina. Egli decide di recarsi al bar alle 9:30 e di attendere 10 minuti. Quale è la probabilità che Marcello incontri Carlo ? Esercizio Un tiratore lancia una freccetta su un bersaglio circolare del raggio di 25 cm il quale ha una zona centrale di raggio 10 cm. Se il tiratore colpisce il bersaglio e tutti u punti di esso hanno la stessa probabilità di essere colpiti, quale è la probabilità che sia colpito un punto della zona centrale ? Distribuzione Normale Una v.c. X è detta avere una distribuzione normale con parametri µ e σ −∞ < µ < ∞ σ >0 se la pdf di X è 1 − ( x − µ )2 /(2σ 2 ) f ( x) = e σ 2π −∞ < x < ∞ Distribuzione Normale Standard La distribuzione normale con parametri µ = 0 and σ = 1 è chiamata distribuzione normale standard. La v.c. è denotata con Z. La pdf è 1 − z2 / 2 f ( z;0,1) = e σ 2π La cdf è Φ( z ) = P( Z ≤ z ) = −∞ < z < ∞ z ∫ −∞ f ( y;0,1)dy Distribuzione Normale Standard Shaded area = Φ (z ) Standard normal curve 0 z Distribuzione Normale Standard Sia Z la variabile normale standard. Trovare (dalla tabella) a. P ( Z ≤ 0.85) Area a sinistra di 0.85 = 0.8023 b. P(Z > 1.32) 1 − P( Z ≤ 1.32) = 0.0934 Distribuzione Normale Standard c. P(−2.1 ≤ Z ≤ 1.78) Trovare l’area a sinistra di 1.78 e sottrarre l’area a sinistra di –2.1. = P( Z ≤ 1.78) − P( Z ≤ −2.1) = 0.9625 – 0.0179 = 0.9446 Esempi Calcolare, servendosi della Tavola, le aree sottese dalla curva normale standard relative ai seguenti intervalli: a) [0;2] b) [0;1.24] c) [-1.4;1.4] d) [1.5;2.75] e) [-0.75;1.37] f) [-2.1;-0.5] Distribuzione Standard non standard se X ha una distribuzione normale con parametri µ e σ allora X −µ Z= σ ha una distribuzione standard. Approssimazione Normale della Binomiale Sia X una v.c. binomiale basata su n prove, con probabilità di successo p. Per n abbastanza grande (empiricamente se npq>10), X può essere approssimata con una distribuzione normale con µ = np and σ = npq . Esempio In un piccolo college il tasso di superamento dell’esame di Algebra è 72%. Su 500 studenti determinare la probabilità che superino l’esame al più 375 studenti. µ = np = 500(.72) = 360 σ = npq = 500(.72)(.28) ≈ 10 375.5 − 360 P( X ≤ 375) ≈ Φ = Φ (1.55) 10 = 0.9394 Curva Normale Valore approssimato della percentuale dell’area compresa tra valori di deviazione standard (regola empirica). 99.7% 95% 68% Curva Normale Esempio Sia X una variabile normale con µ = 80 and e σ = 20. Trovare Find P( X ≤ 65). 65 − 80 P ( X ≤ 65 ) = P Z ≤ 20 = P (Z ≤ −.75 ) = 0.2266 Esempio Una particolare influenza si sviluppa in una scuola. Si osserva che la durata dell’influenza è distribuita come una normale con µ = 6 days giorniand e σ = 1.5 days. giorni Calcolare la probabilità che a uno studente selezionato a caso, l’influenza duri tra 3.75 e 9 giorni. Esempio 9−6 3.75 − 6 P (3.75 ≤ X ≤ 9 ) = P ≤Z≤ 1.5 1.5 = P (−1.5 ≤ Z ≤ 2 ) = 0.9772 – 0.0668 = 0.9104 Percentili di una distribuzione normale (100p)th percentile (100 p )th for = µ + ⋅ σ µ , σ ) for normal ( standard normal