Probabilità
Probabilità
 
 
Gli eventi sono stati definiti come i possibili risultati di un
esperimento.
Ogni evento ha una probabilità
 
 
Se tutti gli eventi fossero ugualmente possibili, la probabilità
p(E) di un evento E sarebbe uguale al rapporto tra il numeri f
di casi favorevoli e il numero n dei casi possibili, ovvero
p(E)=f/n
Esempio:
Si lancia due volte una moneta. Quale e’ la probabilità che
escano due teste ?
1)  I casi possibili sono 4: TT, TC, CT, CC
2)  I casi possibili sono 3: escono 2 teste, esce 1 testa, escono 0
teste
Probabilità
 
Se, in una sequenza di n prove, un evento E si verifica s
volte, si dice che il rapporto s/n è la frequenza relativa di
E rispetto alla data sequenza di prove.
 
Legge empirica del caso: Effettuando numerose prove,
eseguite nelle stesse condizioni, la frequenza relativa di
un evento è assai prossima alla sua probabilità;
l’approssimazione è tanto maggiore quanto più numerose
sono le prove effettuate
 
Definizione
frequentista
della
probabilità:
La
probabilità di un evento è il limite a cui tende la frequenza
relativa, al tendere all’infinito del numero di prove
effettuate
Probabilità
 
Definizione frequentista della probabilità:
La
probabilità di un evento è il limite a cui tende la frequenza
relativa, al tendere all’infinito del numero di prove
effettuate
Ma alcune volte gli Eventi sono “irripetibili”…
 
Definizione soggettiva della probabilità: dato un
qualsiasi evento E, se mi è indifferente ricevere la somma
s incondizionatamente, oppure la Somma S soltanto se E
si verifica, si dice che la probabilità soggettiva p di
quell’evento è p=s/S
Variabile casuale (v.c.)
 
 
E’ scomodo trattare direttamente gli eventi e può essere
più semplice associare delle quantità numeriche agli eventi.
Ciò si realizza attraverso la definizione di VARIABILE
CASUALE:
Una variabile casuale X è una variabile quantitativa i cui valori
variano seguendo le regole della probabilità
Variabile casuale (v.c.)
 
Una v.c. X può essere discreta o continua:
 
 
 
X è discreta se assume un numero finito o numerabile di
risultati. Esempio: il numero di teste in 10 lanci di una
moneta, il numero di volte in cui si ha un numero
superiore a 4 in 5 lanci di un dado…
X è continua se può assumere qualsiasi valore
nell’ambito di uno specifico intervallo. Per esempio:
altezza degli studenti del corso di statistica, il peso della
confezione di caramelle di una certa marca….
Una v.c. è completamente specificata attraverso
la sua distribuzione di probabilità
Distribuzione di probabilità
La distribuzione di probabilità p(x) di una variabile casuale X indica la
probabilità della variabile casuale per ciascuno dei suoi valori possibili
 
Si ha dunque che per una variabile casuale
f(x)=P(X=x)
per tutti i possibili valori x che X può assumere.
 
f(x) è detta funzione di densità di probabilità
(probability density function (pdf))
 
La pdf di una variabile discreta è detta funzione di massa
(indicata anche con p(x)) ed è rappresentabile attraverso
un istogramma o sotto forma tabellare
Distribuzioni di probabilità
discrete e continue
Esempio di funzione di probabilità
(caso discreto)
Esempio di funzione di densità di probabilità
(caso continuo)
Distribuzioni di probabilità discrete
Esperimento: lancio di 2 monete
S= {(T,T);(T,C);(C,T);(C,C)}
Variabile casuale:
X = numero di teste; v.c. discreta, i suoi possibili valori sono:
•  0 (se non si ottiene alcuna testa)
•  1 (se una delle due monete dà testa)
•  2 (se entrambe le monete danno testa)
Quindi:
•  P(X=0)=P(C,C)=1/4
•  P(X=1)=P((T,C) oppure (C,T))=2/4
•  P(X=2)=P(T,T)=1/4
x
P(x)=P(X=x)
0
¼
1
½
2
¼
Distribuzioni di probabilità discrete
 
 
 
0 ≤p(x)≤ 1 Le probabilità associate ai valori di una variabile
casuale devono essere comprese tra 0 e 1 inclusi
∑p(x)=1 La somma delle probabilità di tutti i valori x di una
variabile casuale deve essere 1
La distribuzione di probabilità di una variabile casuale discreta può
essere rappresentata in modo grafico attraverso un istogramma di
distribuzione di probabilità
Esempio precedente:
x
P(x)=P(X=x)
0
¼
1
½
2
¼
Distribuzione di probabilità discrete
Media o Valore Atteso
µ = E ( x) = ∑ xp( x)
x
Se una funzione H dipende da p(x) il valore atteso di H
puo’ essere calcolato come
E ( H ( x)) = ∑ H ( x) p ( x)
x
Calcolo delle probabilità usando i dati
 
Dalle vendite di TV osservate in passato (below
left), si ricava una rappresentazione tabulare
della distribuzione di probabilità delle vendite
Numero
Unità vendute
0
1
2
3
4
di giorni
80
50
40
10
20
200
x
0
1
2
3
4
f (x )
.40
.25
.20
.05
.10
1.00
Rappresentazione grafica
Rappresentazione grafica delle vendite giornaliere di TV
.50
Probability
 
.40
.30
.20
.10
Values of Random Variable x (TV sales)
Esempio
 
Valore Atteso di variabili casuali discrete
x
f (x ) xf (x )
--------------------------0
.40
.00
1
.25
.25
2
.20
.40
3
.05
.15
4
.10
.40
1.20 = E (x )
Il valore atteso delle vendite giornaliere di TV è 1.2
Calcoliamo la deviazione standard
Esempio
 
Varianza e Deviazione Standard di una
variabile casuale discreta
x
x-µ
0
1
2
3
4
-1.2
-0.2
0.8
1.8
2.8
(x - µ )2
1.44
0.04
0.64
3.24
7.84
f (x )
.40
.25
.20
.05
.10
(x - µ )2f (x )
.576
.010
.128
.162
.784
1.660 = σ 2
La varianza delle vendite giornaliere è 1.66 TV (al quadrato)
La deviazione standard delle vendite è di 1.29 TV
Funzione di distribuzione cumulativa (cdf)
F ( x) = P( X ≤ x) P(a < X ≤ b) = F (b) − F (a )
x
0
1
2
3
4
f (x )
.40
.25
.20
.05
.10
1.00
F(x)
.40
.65
.85
.90
1.00
La distribuzione di probabilità binomiale
La variabile casuale Binomiale è una distribuzione
probabilità discreta caratterizzata dalle seguenti proprietà:
 
 
 
 
di
Le osservazioni di una distribuzione binomiale sono determinate da
un esperimento fatto da un numero n di prove reiterate
L’esito di ogni prova dell’esperimento (ovvero ciascuna
osservazione) può essere classificato in due categorie incompatibili
ed esaustive, dette per convenzione successo e insuccesso
La probabilità p di ottenere un successo è costante per ogni
osservazione, così come la probabilità (1-p) che si verifichi un
insuccesso
Le prove dell’esperimento sono indipendenti, ovvero il risultato di
una osservazione, successo o insuccesso, è indipendente dal
risultato di qualsiasi altra
La variabile casuale binomiale rappresenta il numero di successi ottenuti in un
campione di n prove indipendenti
La distribuzione di probabilità binomiale esempio In un’urna ci sono 100 palline, di cui 30 sono rosse e le rimanenti sono blu.
Supponendo di estrarre 10 palline con reinserimento, ovvero la pallina estratta
viene rimessa nell’urna, qual è la probabilità di estrarre esattamente una pallina
di colore rosso?
•  L’esperimento consiste nell’estrarre una pallina da un urna, con reinserimento
della pallina estratta, per n=10 volte si hanno n=10 osservazioni
• L’esito di ogni prova dell’esperimento è “pallina rossa” o “pallina blu”
due
categorie incompatibili ed esaustive, e “pallina rossa” è l’esito “successo”
• La probabilità di ottenere successo ovvero “pallina rossa” è pari a p=30/100 ed
è costante per ogni prova
• Le prove dell’esperimento, ovvero le estrazioni, sono indipendenti
• Il numero di successi è un numero compreso tra 0 e 10
• Si vuole calcolare la probabilità che ci sia esattamente un successo in n=10
prove
• Definiamo X = numero di successi in n prove X ~ Binomiale (n, p)
n x
n!
n− x
p ( x) =   ⋅ p ⋅ (1 − p ) =
⋅ p x ⋅ (1 − p ) n − x
x!(n − x)!
 x
La distribuzione di probabilità binomiale dimostrazione  
 
 
 
Vogliamo calcolare la probabilità di avere x successi e (n-x) insuccessi.
Dal momento che gli eventi sono indipendenti, le probabilità andranno
moltiplicate
Dobbiamo avere x successi quando ciascun successo ha probabilità p e n-x
insuccessi quando ciascun insuccesso ha probabilità 1-p
La probabilità di avere una combinazione sarà uguale alla moltiplicazione
tra questi valori:
p x (1 − p ) n − x
 
Ci sono però differenti combinazioni alternative, quindi la probabilità di
avere esattamente x successi in n tentativi è data da:
n x
n!
n− x
p ( x) =   ⋅ p ⋅ (1 − p ) =
⋅ p x ⋅ (1 − p ) n − x
x!(n − x)!
 x
Funzione di distribuzione di probabilità della distribuzione binomiale
La distribuzione di probabilità binomiale esempio  
Nell’esempio precedente
X~Binomiale(n,p) con n=10 e p=0.25:
10 
10!
p (1) =   ⋅ 0.251 ⋅ (1 − 0.25)10−1 =
⋅ 0.251 ⋅ (1 − 0.25)10−1 = 0.187
1!(10 − 1)!
1 
Per esempio la distribuzione di probabilità
binomiale con una probabilità di successo pari a
0.25 può essere rappresentata dal seguente
istogramma dove:
  asse orizzontale: possibili valori della
variabile
  asse verticale: probabilità
Ruolo del parametro p:
Nelle 3 distribuzioni Binomiali n = 5, mentre p varia assumendo i valori 0.3, 0.5 e 0.8.
Dai grafici possiamo dedurre che:
 Se p = 0.5, la distribuzione è simmetrica, in caso contrario è asimmetrica, positivamente
se p < 0.5, negativamente se p > 0.5.
 Per ogni fissato n, la massima dispersione dei valori si ha quando p = 0.5; se p tende a 0
o a 1, la distribuzione tende a concentrarsi sui valori più prossimi a 0 o a n,
rispettivamente.
 p definisce la posizione della distribuzione sull'asse reale, nel senso che np identifica un
punto vicino alla moda della distribuzione.
Ruolo del parametro n:
p=0.5 (istogrammi simmetrici) mentre n varia assumendo i valori 5, 10, 20. Per una
corretta interpretazione della figura osserviamo che le altezze dei bastoni sono
comparabili perché la scala verticale è la stessa, mentre la scala sull'asse orizzontale
è diversa. In sintesi:
  Al crescere di n l'intervallo di variazione del numero dei successi si estende
(nell'esempio passa da 0-5 a 0-10 a 0-20) il che comporta, a parità di p, un aumento
della dispersione dei valori osservabili.
  Al crescere di n aumenta il numero delle determinazioni osservabili e quindi si
riduce il valore delle singole probabilità (l'istogramma si allarga e si abbassa
sensibilmente). Tuttavia il picco della distribuzione continua a segnalare con
chiarezza il parametro p dell'urna (in termini relativi, 0.5).
La distribuzione di probabilità binomiale
– caratteristiche principaliSe X e una variabile casuale che segue una distribuzione
binomiale con paramentri n (numero di tentativi) e p
(probabilità di successo), X avrà:
 Media
pari a :
E(X) = n*p
 Varianza
pari a:
Var(X) = n*p (1-p)
Esempio 1
Determinare la probabilità che su 12 lanci di una moneta
buona si ottengano esattamente 8 teste.
p=q=1/2 n=12 x=8
 n x
n!
n −x
p(x) =   ⋅ p ⋅ (1− p) =
⋅ p x ⋅ (1− p) n −x
x!(n − x)!
 x
€
€
12
12 ⋅11⋅10 ⋅ 9
8
4
p12 (8) =   ⋅ 0,5 ⋅ 0.5 =
⋅ 0.5 8 ⋅ 0.5 4 ≅ 0.1208
4 ⋅ 3⋅ 2
8 
Esempio 2
Determinare la probabilità che estraendo (con rimpiazzo) per
5 volte una carta da un mazzo da 40 si ottengano:
1) 
Esattamente 3 figure
2) 
Almeno 3 figure
3) 
Almeno una figura
p=12/40=0.3
Esempio 2
p=12/40=0.3
1) Esattamente 3 figure
 5
p5 (3) =   ⋅ 0,33 ⋅ 0.7 2 = 10 ⋅ 0,33 ⋅ 0.7 2 ≅ 0.1323
 3
2) Almeno 3 figure
p5 (3) + p5 (4) + p5 (5) ≅ 0.1323 + 0.0284 + 0.0024 = 0.1631
€
3) Almeno una figura
p5 (1) + p5 (2) + p5 (3) + p5 (4) + p5 (5) =
€
€
 5
1− p5 (0) = 1−   ⋅ 0.30 ⋅ 0.7 5 = 1− 0.16807 = 0.83193
 0
Esempio 3
Un tiratore colpisce un bersaglio con probabilità 0.2.
Quale è la probabilità che su 8 tiri si colpisca 2 volte il
bersaglio ? E che si colpisca almeno due volte ?
Soluzione:
p8 (2) ≅ 0.2936
1− p8 (0) − p8 (1) ≅ 0.4967
€
€
Distribuzioni di probabilità continue
Per i dati continui la variabile casuale può assumere qualsiasi
valore in un intervallo di infiniti numeri reali
La pdf f(x) di una variabile casuale X ha le seguenti proprietà:
1.  f(x) è definita su tutti i numeri reali
2. f (x) ≥ 0 per tutti i valori di x .
3.  L’area sottesa dalla curva f è uguale a 1:
∫ f ( x)= 1
x
4. 
b
P (a ≤ X ≤ b ) = ∫ f ( x)dx
a
y = f ( x)
y = f ( x)
a
b
Distribuzioni di probabilità continue
Se X è una v.c. continua, allora:
-  per ogni numero c, P(x = c) = 0
-  per ogni due numeri a e b con a < b,
P ( a ≤ X ≤ b) = P ( a < X ≤ b)
= P ( a ≤ X < b)
= P ( a < X < b)
Funzioni di probabilità cumulative
La funzione di probabilità cumulativa,
F(x) per una v.c. continua X è definita
per ogni x da
F ( x) = P ( X ≤ x ) = ∫
x
−∞
f ( y )dy
Per ogni x, F(x) è l’area della curva a
sinistra di x.
F(x) per il calcolo delle probabilità
Sia X una v.c. continua con pdf f(x) e
cdf F(x). Allora per ogni numero a,
P ( X > a ) = 1 − F (a)
E per ogni numero a and b con a < b,
P (a ≤ X ≤ b ) = F (b) − F (a )
Esempio
 
Funzione di probabilità (pdf)
0.75(1 − x 2 ) − 1 ≤ x ≤ 1
f ( x) = 
0
otherwise

 
−∞
1
f (v)dv = ∫ 0.75(1 − v 2 )dv = 1
−1
Funzione di distribuzione cumulativa
F ( x) = ∫
x
−∞
 
∫
∞
x
f (v)dv = ∫ 0.75(1 − v 2 )dv =0.5 + 0.75 x − 0.25 x 3
−1
0


F ( x) = 0.5 + 0.75 x − 0.25 x 3

1

x ≤ −1
−1 < x ≤ 1
x >1
Probabilità di eventi
P (−0.5 ≤ x ≤ 0.5) = F (0.5) − F (−0.5) = ∫
0.5
− 0.5
0.75(1 − v 2 )dv = 68.75%
P ( X ≤ x) = F ( x) = 0.95 = 0.5 + 0.75 x − 0.25 x 3 ⇒ x = 0.73
Valore Atteso
Il valore atteso o valor medio di una v.c.
continua X con f (x) è:
∞
µ X = E (X ) =
∫
−∞
x ⋅ f ( x)dx
Valore atteso di h(X)
se X è una v.c. continua con pdf f(x) e
h(x) è una funzione di X, allora
∞
E [h( x) ] = µh ( X ) =
∫ h( x) ⋅ f ( x)dx
−∞
Varianza e Deviazione Standard
La varianza di una v.c. continua X con
pdf f(x) e media µ è:
2
σX
∞
= V ( x) =
∫ (x − µ)
−∞
2
⋅ f ( x)dx
2
= E[( X − µ ) ]
La deviazione standard is σ X = V ( x).
2
2
( )− [E ( X )]
V (X ) = E X
Esempio
0.75(1 − x 2 ) − 1 ≤ x ≤ 1
f ( x) = 
0
otherwise

1
µ = E ( X ) = ∫ 0.75 x(1 − x 2 )dx = 12 (0.75) x 2 − 14 (0.75) x 4
2
2
−1
1
[
2
2
[
3
]
+1
−1
=0
σ = E ([ µ − X ] ) = ∫ ( x − 0) 0.75(1 − x )dx = (0.75) x − (0.75) x
−1
1
3
1
5
]
5 +1
−1
= 0.2
Distribuzione Uniforme
Una variabile continua X segue una
distribuzione uniforme sull’intervallo [A, B]
se:
 1
A≤ x≤ B

f (x; A, B ) =  B − A
 0
otherwise
Esempio Distribuzione Uniforme
1.  In certi esperimenti l’errore commesso nella determinazione della solubilità di
una sostanza è una variabile aleatoria X avente distribuzione uniforme con
A=-0.025 e B= 0.025. Trovare la probabilità che l’errore:
a)  Sia compreso tra 0.010 e 0.015;
0.015 − 0.010
P(0.010 ≤ X ≤ 0.015) =
= 0.1
0.025 + 0.025
b) Sia compreso tra –0.012 e 0.012.
€
Esempio Distribuzione Uniforme
2. Si consideri una variabile aleatoria X con distribuzione uniforme.
Essendo noto che E(X)=6 e V(X)=2 trovare:
a) Pr(X>=5.5)
b) la mediana di X.
A+B
E(X)=
2
€
€
(B − A) 2
V (X)=
12
Esercizio
Marcello sa che il suo amico Carlo arriverà al bar Sport in un istante
compreso tra le nove e le dieci di una data mattina. Egli decide di
recarsi al bar alle 9:30 e di attendere 10 minuti.
Quale è la probabilità che Marcello incontri Carlo ?
Esercizio
Un tiratore lancia una freccetta su un bersaglio circolare del raggio di
25 cm il quale ha una zona centrale di raggio 10 cm.
Se il tiratore colpisce il bersaglio e tutti u punti di esso hanno la stessa
probabilità di essere colpiti, quale è la probabilità che sia colpito un
punto della zona centrale ?
Distribuzione Normale
Una v.c. X è detta avere una distribuzione
normale con parametri µ e σ
−∞ < µ < ∞ σ >0
se la pdf di X è
1
− ( x − µ )2 /(2σ 2 )
f ( x) =
e
σ 2π
−∞ < x < ∞
Distribuzione Normale Standard
La distribuzione normale con parametri
µ = 0 and σ = 1
è chiamata distribuzione normale standard.
La v.c. è denotata con Z. La pdf è
1
− z2 / 2
f ( z;0,1) =
e
σ 2π
La cdf è
Φ( z ) = P( Z ≤ z ) =
−∞ < z < ∞
z
∫
−∞
f ( y;0,1)dy
Distribuzione Normale Standard
Shaded area = Φ (z )
Standard
normal
curve
0
z
Distribuzione Normale Standard
Sia Z la variabile normale standard.
Trovare (dalla tabella)
a. P ( Z ≤ 0.85)
Area a sinistra di 0.85 = 0.8023
b. P(Z > 1.32)
1 − P( Z ≤ 1.32) = 0.0934
Distribuzione Normale Standard
c. P(−2.1 ≤ Z ≤ 1.78)
Trovare l’area a sinistra di 1.78 e
sottrarre l’area a sinistra di –2.1.
= P( Z ≤ 1.78) − P( Z ≤ −2.1)
= 0.9625 – 0.0179
= 0.9446
Esempi
Calcolare, servendosi della Tavola, le aree sottese dalla curva
normale standard relative ai seguenti intervalli:
a)  [0;2]
b)  [0;1.24]
c)  [-1.4;1.4]
d)  [1.5;2.75]
e)  [-0.75;1.37]
f)  [-2.1;-0.5]
Distribuzione Standard non standard
se X ha una distribuzione normale con
parametri µ e σ allora
X −µ
Z=
σ
ha una distribuzione standard.
Approssimazione Normale della Binomiale
Sia X una v.c. binomiale basata su n prove, con
probabilità di successo p. Per n abbastanza
grande (empiricamente se npq>10), X può
essere approssimata con una distribuzione
normale con
µ = np and σ = npq .
Esempio
In un piccolo college il tasso di superamento
dell’esame di Algebra è 72%. Su 500 studenti
determinare la probabilità che superino l’esame
al più 375 studenti.
µ = np = 500(.72) = 360
σ = npq = 500(.72)(.28) ≈ 10
 375.5 − 360 
P( X ≤ 375) ≈ Φ 
 = Φ (1.55)
10


= 0.9394
Curva Normale
Valore approssimato della percentuale dell’area compresa tra
valori di deviazione standard (regola empirica).
99.7%
95%
68%
Curva Normale
Esempio
Sia X una variabile normale con
µ = 80 and
e σ = 20.
Trovare
Find P( X ≤ 65).
65 − 80 

P ( X ≤ 65 ) = P  Z ≤

20 

= P (Z ≤ −.75 )
= 0.2266
Esempio
Una particolare influenza si sviluppa in
una scuola. Si osserva che la durata
dell’influenza è distribuita come una
normale con
µ = 6 days
giorniand
e σ = 1.5 days.
giorni
Calcolare la probabilità che a uno
studente selezionato a caso, l’influenza
duri tra 3.75 e 9 giorni.
Esempio
9−6
 3.75 − 6
P (3.75 ≤ X ≤ 9 ) = P 
≤Z≤

1.5 
 1.5
= P (−1.5 ≤ Z ≤ 2 )
= 0.9772 – 0.0668
= 0.9104
Percentili di una distribuzione normale
(100p)th percentile
(100 p )th for 
=
µ
+
⋅
σ


µ
,
σ
)
for normal (
standard normal 