Teoria della probabilità e Statistica
(cenni)
Cenni su teoria della probabilità e statistica
Definizione di popolazione e campione
Variabili aleatorie
Definizione funzione di distribuzione
Definizione funzione densità di probabilità
Definizione media e varianza
Funzioni di una variabile aleatoria
Variabili aleatorie vettoriali
Funzioni di variabili aleatorie vettoriali
Motivazioni
Teoria della
probabilità
– Statistica
classica
•
Gli esiti di un singolo esperimento non sono prevedibili, anche
dopo ripetute esecuzioni nelle stesse condizioni
•
Ciò è dovuto all’inevitabile errore sperimentale
•
Si possono comunque individuare delle regolarità nell’insieme dei
risultati di un numero elevato di ripetizioni dello stesso
esperimento
– ovvero si può modellare la casualità presente in una misura
sperimentale
La modellazione dell’errore sperimentale è quindi una
modellazione di tipo statistico
•
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
1
Teoria della probabilità. Definizione
popolazione e campione
Teoria della
probabilità
– Statistica
classica
•
•
POPOLAZIONE
Insieme di tutte le possibili osservazioni, di dimensione N
•
Esempi:
– Le misure sperimentali, in linea di principio infinite, che
possono essere effettuate
– I risultati delle elezioni politiche in un paese, ottenuti dallo
spoglio dei voti.
Teoria della probabilità. Definizione
popolazione e campione
•
•
•
•
•
•
Teoria della
probabilità
– Statistica
classica
CAMPIONE
Insieme dei valori osservati. È pertanto un sottoinsieme della
popolazione.
La dimensione del campione n è il numero di valori osservati.
In genere:
n«N
Esempi:
– Il numero finito di prove sperimentali che si è, nella realtà,
effettuato.
– Le proiezioni dei risultati elettorali ottenute grazie ai cosiddetti
“exit poll”.
N.B. Il numero di possibili campioni che si può estrarre da una
popolazione è pari a:
N!
n!N - n !
– Per N→∞ i possibili campioni sono infiniti
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
2
Teoria della probabilità. Definizione
popolazione e campione.
•
In genere non è possibile conoscere il dettaglio di tutta la
popolazione:
– La popolazione è costituita da un insieme infinito (come nel
caso delle possibili misure sperimentali)
– È comunque dal punto di vista pratico impossibile (come nel
caso delle elezioni politiche)
– Non ha comunque senso applicativo (esempio: crash test delle
vetture)
Teoria della probabilità. Definizione
popolazione e campione.
•
Teoria della
probabilità
– Statistica
classica
Teoria della
probabilità
– Statistica
classica
Interpretazione grafica
Popolazione
Campione
Inferenza
statistica
Campagna sperimentale
Dal campione si intende ottenere informazioni sulla popolazione
generatrice non nota
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
3
Teoria della probabilità. Definizione
popolazione e campione.
•
Riepilogo
Campione
Teoria della
probabilità
– Statistica
classica
Popolazione
Processo
deduttivo
Processo induttivo
Caratterizzazione Campione:
Statistica descrittiva
(introdotta nella precedente
sezione)
Caratterizzazione Popolazione:
Teoria della probabilità e
statistica (nella sezione
corrente)
Introduzione concetto processo
aleatorio
•
Teoria della
probabilità
– Statistica
classica
Un processo si dice aleatorio se:
– Esso è replicabile sempre nelle stesse condizioni
– Il suo risultato cambia al variare delle esperienza in quanto è
affetta da una componente casuale.
– Nei fatti, una esperienza aleatoria non restituisce mai lo stesso
risultato se ripetuta più volte.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
4
Introduzione concetto processo
aleatorio
•
Teoria della
probabilità
– Statistica
classica
Schema di un esperimento
Valore vero della
quantità misurata

Misura sperimentale
ottenuta
y=+e
+
e
Errore
sperimentale
Teoria della probabilità
Modellazione Esperimento Aleatorio
•
Il modello matematico di un processo aleatorio ha lo
scopo di prevedere le regolarità (statistiche) di
un’esperienza, non il singolo esito!
•
•
Esempi:
Lancio di un dado
– Quale è, per esempio, la frequenza della
comparsa dei lati in cui sono rappresentati i
numeri pari
Lancio di una moneta
– La frequenza della comparsa della testa e/o della
croce
Misure sperimentali
– Il modello matematico deve prevedere, se esiste,
il trend centrale delle misure sperimentali.
•
•
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
Teoria della
probabilità
– Statistica
classica
5
Teoria della
probabilità
– Statistica
classica
Teoria della Probabilità
Spazio campione - Definizione
•
L’insieme di tutti i possibili risultati che può registrare una
esperienza aleatoria prende il nome di spazio campione 
•
Uno spazio campione può essere finito o infinito, a seconda che
esso sia costituito da un numero finito o infinito di elementi.
•
•
Esempi:
Lancio dei dadi:
 ={
•
,
,
,
,
,
}
Risultato di una misura sperimentale:
esempio: Misura di una temperatura in un reattore
 =R+
•
Nel primo caso lo spazio campione è un insieme discreto finito, nel
secondo caso è un insieme infinito continuo
Teoria della Probabilità
Evento
•
Teoria della
probabilità
– Statistica
classica
Un evento E è un qualunque sottoinsieme dello spazio campione

•
•
Esempi:
Numeri pari nel lancio dei dadi:
{
E=
•
,
,
}
Risultati sperimentali: temperature osservate superiori a 100°
E = {T>100.0}
•
Oppure che si osservi la temperatura T = 273.5 K
E = 273.5 K
•
L’ultimo evento introdotto è un evento elementare. Per
definizione, gli eventi elementari non possono essere l’unione di
altri eventi
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
6
Teoria della
probabilità
– Statistica
classica
Teoria della Probabilità
Evento
•
Si possono introdurre i concetti di eventi complementari secondo
le regole di insiemistica.
EC =
•
Nel caso dei dadi:
EC =  – E =
•
-E
{
,
}
,
Nel caso del primo esempio di temperatura nel reattore:
EC={T ≤ 100.0}
•
Un evento in cui non vi siano elementi si chiama evento
impossibile e si indica con il simbolo Ø.
Rappresentazione grafica degli
eventi
Insiemistica - Diagrammi di Venn

A
E
B

 evento elementare

A  B
E
A
B
A

A  B
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
Teoria della
probabilità
– Statistica
classica
B

A  B
7
Rappresentazione grafica degli
eventi
Insiemistica - Diagrammi di Venn
E
B
A


Ec =  - E:
A - B
Ec: Evento complementare
A
Teoria della
probabilità
– Statistica
classica
B
B
A


A  B = Ø
BA
A e B mutuamente esclusivi
Definizione Probabilità – Approccio
frequentista
Teoria della
probabilità
– Statistica
classica
Il concetto di probabilità emerge direttamente dal concetto di
frequenza relativa.
Consideriamo il caso dei lanci dei dadi ed effettuiamo 10 lanci.
•
•
{ , , , , , , , , , }
•
Si calcola la frequenza relativa
per i diversi eventi elementari
dello spazio campione:
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
N(
)/NTOT=0.00
N(
)/NTOT=0.50
N(
)/NTOT=0.20
N(
)/NTOT=0.10
N(
)/NTOT=0.10
N(
)/NTOT=0.10
8
Definizione Probabilità – Approccio
frequentista
•
Aumentando le dimensioni •
del campione di dati
sperimentali (per esempio
n=50) si può avere
Le frequenze relative tendono
asintoticamente a dei valori che
non cambiano più all’aumentare
delle dimensioni del campione
Caso n → ∞
Caso n = 50
N(
)/NTOT=0.15
N(
)/NTOT=1/6
N(
)/NTOT=0.19
N(
)/NTOT=1/6
N(
)/NTOT=0.16
N(
)/NTOT=1/6
N(
)/NTOT=0.17
N(
)/NTOT=1/6
N(
)/NTOT=0.18
N(
)/NTOT=1/6
N(
)/NTOT=0.15
N(
)/NTOT=1/6
Definizione Probabilità – Approccio
frequentista
•
•
•
Teoria della
probabilità
– Statistica
classica
Teoricamente per n → ∞ le frequenze relative non cambiano più.
La frequenza con cui si verifica un evento elementare rimane
costante all’aumentare delle prove.
Questo è vero anche per tutti gli eventi A dello spazio campione
(per esempio: numeri pari/dispari etc.)
Definizione frequentista della funzione probabilità:
È possibile quindi definire in modo rigoroso la funzione probabilità
del processo casuale in esame:
P  E   lim FN  E   lim
N 
•
Teoria della
probabilità
– Statistica
classica
N 
N E
N
N.B. Questo concetto è applicabile solo per processi
replicabili.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
9
Definizione Probabilità (Approccio
Frequentista)
•
Teoria della
probabilità
– Statistica
classica
Rappresentazione intuitiva dell’approccio frequentista
Popolazione
N →∞
Campione
Campione → Popolazione
Assiomi di Kolmogorov (1933)
•
Teoria della
probabilità
– Statistica
classica
Una volta introdotto il concetto di probabilità per un evento di un
processo stocastico, tutta la teoria della probabilità può essere
sviluppate partendo da tre assiomi fondamentali:
1.
0  PE 1  E
2.
P   1
3.
P  A  B   P A  P B 
se A  B  0
Nel caso di spazi campioni infiniti la 3. può essere scritta:
3 bis.

P


E
j 1
j

   PEj 
 j
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
se
Ei  Ek  0  i, k
10
Assiomi di Probabilità –
Kolmogoroff (1933)
•
•
Teoria della
probabilità
– Statistica
classica
Sfruttando gli assiomi di Kolmogoroff è possibile ricavare tutte le
proprietà della probabilità:
Esempio – Regola per insiemi complementari
 
P AC  1 - P  A 
•
Dimostrazione:
A  AC  
e
A  AC  0
 
P   1  P A  P AC
Assiomi di Probabilità –
Kolmogoroff (1933)
•
Teoria della
probabilità
– Statistica
classica
Altre proprietà che possono essere ricavate:
1. Regola di addizione per un numero finito di eventi mutualmente
esclusivi:
Ai  Ak  0  i, k
 n
 n
 P  A j    PA j 
 j 1  j 1
2. Regola di addizione per eventi arbitrari
P  A  B   P  A  P  B  - P  A  B 
3. Probabilità dell’evento impossibile:
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
P(Ø) = 0
11
Definizione Probabilità Condizionata
•
Probabilità che si verifichi B se A si è verificato:
P B A 
•
P A  B 
P A
1)
In maniera analoga si può definire la probabilità dell’evento A
condizionato dall’evento B.
PA B  
•
P A  B 
PB 
2)
La 1) e la 2) sono valide se, rispettivamente, P(A)≠0 e P(B)≠0
Probabilità Condizionata Definizione
•
Teoria della
probabilità
– Statistica
classica
Teoria della
probabilità
– Statistica
classica
Le probabilità condizionate sono delle funzioni probabilità
dato che soddisfano gli assiomi di Kolmogoroff per un
qualunque insieme M
1. P(A|M) ≥ 0 per ogni evento A
2. P(|M) = 1
3. Nel caso A e B disgiunti
– P(A  B|M) = P(A|M) + P(B|M)
•
•
Se B  A allora P(A|B) = 1
Se {Ai  M Ø}, Ai = 1,2, … sono mutualmente esclusivi, allora
P(A1  A2  … |M) = P(A1|M) + P(A2|M) + …
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
12
Probabilità Condizionata - Esempio
Teoria della
probabilità
– Statistica
classica
•
•
Esempio:
Uno scatola contiene 10 viti di cui 3 difettose. Estraiamo due viti a
caso. Determinare la probabilità che nessuna vite estratta sia
difettosa
•
•
•
•
Evento A: Prima vite non difettosa
Evento B: Seconda vite non difettosa
P(A)=7/10
Una volta estratta 1 vite restano nella scatola 9 viti quindi:
P(B|A)=6/9=2/3
La probabilità che anche la seconda vite sia difettosa è quindi:
P(AB)=P(A) P(B|A)=47%
•
Indipendenza stocastica Definizione
•
Teoria della
probabilità
– Statistica
classica
La nozione di indipendenza stocastica di eventi è fondamentale
nella teoria della probabilità e nella pratica della sperimentazione:
Definizione: Due eventi si dicono indipendenti se:
P  A  B   P  A  P B 
•
Dalla definizione di probabilità condizionata:
P(AB)=P(B)P(A|B)
•
Nel caso in cui P(AB)=P(A) P(B) si ottiene:
P(A|B)=P(A).
•
Ovvero qualunque cosa accada a B essa non dà informazioni su A.
Quindi A e B sono indipendenti
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
13
Indipendenza stocastica – Esempio
•
•
Teoria della
probabilità
– Statistica
classica
Riesaminiamo l’esempio delle viti considerando di reimmettere
nella scatola la vite estratta inizialmente.
Intuitivamente, questo implica la perdita di informazione acquisita
con il precedente risultato
•
•
P(A) = P(B) = 0.7
P(AB) = P(A) P(B) = 49 %
•
Nota: Non si devono confondere eventi disgiunti con eventi
indipendenti.
Infatti due eventi disgiunti non sono indipendenti:
•
Indipendenza stocastica –
Considerazioni
Teoria della
probabilità
– Statistica
classica
•
Da notare la profonda differenza concettuale tra i due esempi
•
Nel primo caso, il verificarsi di un evento condiziona la probabilità
degli eventi successivi.
•
Nel secondo caso, il reimmettere la vite nel contenitore azzera le
informazioni acquisite nella prima esperienza.
•
Informazioni pregresse, da un punto di vista logico,
possono implicare dipendenza tra i dati sperimentali.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
14
Teoria della
probabilità
– Statistica
classica
Indipendenza stocastica – Esempi
con i diagrammi di Venn
B
B
A
A

P(A|B) = 1
P(B|A) = P(AB)/P(A) = P(B)/P(A)
B
A

A
B

P(A|B) ≠ P(A)

P(A|B) = P(B|A) = 0
Variabili aleatorie - Introduzione
•
•
•
Teoria della
probabilità
– Statistica
classica
In presenza di un processo aleatorio, si associa implicitamente
un numero ad un risultato dell’esperienza
Da un punto di vista matematico, è necessario sempre
associare ad un esito di un esperimento aleatorio un numero che
individui univocamente l’esito osservato.
Associare ad un processo aleatorio (scalare) un numero reale è un
procedimento che facciamo sempre in modo intuitivo
Deformazione
molla
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
Numero
reale
R
15
Teoria della
probabilità
– Statistica
classica
Teoria della probabilità –
Esempi Variabili Aleatorie
•
Lancio del dado
Lancio Moneta
Y
1
Y
0
2
3
1
4
5
Esempi di Variabili aleatorie
Discrete: il processo casuale
può assumere valori al più in
un insieme numerabile
6
Variabili aleatorie – Definizione
•
Teoria della
probabilità
– Statistica
classica
Una variabile aleatoria è una funzione che associa ad ogni
esito di un processo aleatorio, un distinto numero reale

Variabile
aleatoria Y
Insieme dei possibili risultati
del processo aleatorio

Insieme valori
numerici che assume
la funzione Y
• In termini rigorosi
Y : wW → y=Y(w)  Y  
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
16
Variabili aleatorie - Definizione
Teoria della
probabilità
– Statistica
classica
•
La variabile aleatoria Y è una funzione che assume valori tali che
dipendono dal “caso”
•
Proprietà:
– Y è definita nello spazio  degli esperimenti ed assume valori
nel codominio  sottoinsieme dei numeri reali.
– Qualunque sottoinsieme del codominio  (evento) ha una
probabilità ben definita di accadere
Variabili aleatorie – Definizione
•
•
Teoria della
probabilità
– Statistica
classica
Da notare che Y è una funzione (variabile aleatoria) mentre i
valori assunti da tale funzione y=Y(), valori calcolabili quando
l’esito dell’esperimento sia noto, sono numeri reali
Nel seguito:
Y
y
→
→
variabile aleatoria
singolo esito osservato della VA
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
17
Funzioni distribuzione e densità di
probabilità di una VA scalare
•
•
•
Teoria della
probabilità
– Statistica
classica
Definizione
Secondo la definizione classica, la funzione di distribuzione
emerge automaticamente dalle proprietà asintotiche di un
campione di dimensioni infinite.
Si può facilmente dimostrare che, per ogni variabile aleatoria Y, la
funzione (reale di una variabile reale) distribuzione di
probabilità (CDF: Cumulative Distribution Function)
FY  y   PY  y   lim
N 
N Y  y 
N
è sufficiente per definire la probabilità di un qualunque evento
pertinente al processo aleatorio.
Funzioni distribuzione e densità di
probabilità di una VA scalare
•
Teoria della
probabilità
– Statistica
classica
Proprietà della distribuzione di probabilità
FY  y  : y      0,1
•
Inoltre:
1. FY(+ ) = 1, FY(-) = 0
2. FY è una funzione non decrescente
3. Se FY(y0)=0 allora FY(y)=0 se y <y0
4. P {Y >y1 } = 1- FY(y1)
5. FY è una funzione continua da destra: FY(y+) = FY(y)
6. P {y1 < Y  y2} = FY(y2)-FY(y1)
È facile dimostrare come tali proprietà derivino dagli assiomi
di Kolmogoroff
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
18
Teoria della
probabilità
– Statistica
classica
Funzioni distribuzione e densità di
probabilità di una VA scalare
•
Esempio di calcolo di probabilità di un evento dalla funzione di
distribuzione.
Calcolo probabilità
che y cada in E
FY(d)
FY(c)
FY(b)
E = E1  E 2
P{y  E} =
FY(a)
P{a < y b}+P{c < y < d}
a
=FY(b)-FY(a)+ FY(d)-FY(c)
b c
y
E1
Funzioni distribuzione e densità di
probabilità di una VA scalare
•
d
E2
Teoria della
probabilità
– Statistica
classica
In molte circostanze, per la caratterizzazione delle variabili
aleatorie è molto più utile ricorrere alla derivata della funzione di
distribuzione
y
d
fY  y  
FY  y  ovvero FY  y    f  u  du
dy
-
•
•
La funzione fY(y) prende il nome di funzione densità di probabilità
(pdf)
Proprietà della funzione densità di probabilità
– fY(y) ≥ 0 sempre

–
 f   d   1
-
– F  y2  - F  y1  
y2
 f   d 
y1
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
19
Teoria della
probabilità
– Statistica
classica
Funzioni distribuzione e densità di
probabilità di una VA scalare
•
Esempio di calcolo di probabilità di un evento dalla funzione
densità di probabilità
fY(y)
P  y  E 
P  y  E1  P  y  E2  
 f  y  dy   f  y  dy 
Y
Y
E1
E2
b
d
 f  y  dy   f  y  dy
Y
Y
a
c
a
b c
d
y
E1
Funzioni distribuzione e densità di
probabilità di una VA scalare
E2
Teoria della
probabilità
– Statistica
classica
•
Nei casi di maggiore interesse la variabile aleatoria Y è di tipo
continuo, ovvero può assumere un qualunque valore lungo
l’intervallo in cui è definito
•
In tal caso la funzione di distribuzione è una funzione di tipo
continua e la probabilità che si verifichi un evento elementare è
pari a zero:
P Y    lim  F   - F  -     0
 0
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
20
Teoria della
probabilità
– Statistica
classica
Distribuzione di probabilità
Definizione media e varianza
•
•
Spesso, è sufficiente per caratterizzare una variabile aleatoria
(almeno in forma approssimata) conoscere solo alcune grandezze
che sono calcolabili dalle funzioni densità di probabilità come ad
esempio media e varianza.
Il valore medio di una variabile aleatoria è dato da:

Y 
 y f  y  dy
-
•
Tale valore prende anche il nome di VALORE ATTESO della
variabile aleatoria Y ed è indicato con il simbolo
Y=E(Y)
•
Se una distribuzione è simmetrica rispetto a y=c, (f(c+y)=f(c-y))
si vede che =c
Teoria della
probabilità
– Statistica
classica
Variabili aleatorie: Altre misure del
trend centrale
Mediana di una variabile aleatoria Y
Il valore m per cui:
1
FY m  
2
Area = 0.5
0.5
Area = 0.5
0.4
0.3
fY(y)
•
•
0.2
0.1
0.0
0
Moda di una variabile aleatoria Y
Il valore c per cui la funzione densità di
probabilità assume valore massimo:
4
6
y
8
0.5
fY(y) max
0.4
0.3
f Y(y)
•
•
2
Mediana
c:
fY max
0.2
0.1
•
Se la distribuzione è simmetrica,
media e mediana coincidono.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
0.0
0
2
4
y
6
8
Moda
21
Variabili aleatorie: Altre misure del
trend centrale
•
Teoria della
probabilità
– Statistica
classica
Nel caso generale di distribuzioni non simmetriche media,
mediana e moda non coincidono
Moda
0.5
Mediana
0.4
Media
fY(y)
0.3
0.2
0.1
0.0
0
2
4
y
6
8
Variabili aleatorie: Indici di
posizione e dispersione
•
Teoria della
probabilità
– Statistica
classica
Varianza: è una misura della dispersione della distribuzione
intorno al suo valore atteso. Per definizione:
s Y2    y j - Y  fY  y j 
2
Y discreta
j

s Y2    y - Y  fY  y dy
2
Y continua
-
•
•
se esiste.
La varianza è sempre non negativa
Altra grandezza usata per valutare la dispersione della
distribuzione è la deviazione standard (ha la stessa unità di
misura della media)
s Y  s Y2
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
22
Teoria della
probabilità
– Statistica
classica
Distribuzione di probabilità
Definizione media e varianza
Qualitativamente: al diminuire della varianza, la pdf si restringe
intorno al suo valore medio
Diminuisce l’incertezza nel processo aleatorio
•
•
0.4
Area
=
0.95
(1)
0.3
f(x)
(2)
1.2
f(x)
0.8
0.2
s 12  s 22
0.1
0.4
0.0
0.0
-4
-3.2
-2
0
x
1.5
2
4
-4
-2
-1.1 x
0 0.4
2
4
L’intervallo di valori in cui gli esiti del processo aleatorio ricadono più
frequentemente è molto più ampio nel primo caso che nel secondo
Distribuzione di probabilità –
Definizione momenti
•
Teoria della
probabilità
– Statistica
classica
Possiamo generalizzare media e varianza con i momenti:

n
mn 
 y f  y  dy
-
momento n-esimo

Mn 
n
  y -   f  y  dy
momento centrale n-esimo
-
•
•
La media è quindi il momento primo della distribuzione, mentre la
varianza è il momento centrale di ordine 2.
N.B. E’ possibile valutare i momenti di una distribuzione solo se
essi sono definiti.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
23
Teoria della
probabilità
– Statistica
classica
Variabili aleatorie
Funzioni continue - Esempi
•
Funzione di distribuzione uniforme
 1

fY  y    b - a
 0

se y   a, b 
Dipende da due
parametri: a e b
se y   a, b 
FY(y)
pdf
fY(y)
cdf
1
1/(b-a)
a
b
y
a
b
Variabili aleatorie
Funzioni continue - Esempi
•
•
y
Teoria della
probabilità
– Statistica
classica
Distribuzione uniforme
È possibile calcolare la media e varianza di tale funzione di
distribuzione:
Questo risultato

b
poteva essere
1
ab
Y   y f  y  dy   y
dy 
intuitivo
dato che la
b-a
2
-
a
funzione è
simmetrica rispetto
al suo punto medio
  y - 
-
2
2
a - b
ab 1

f  y  dy    y dy 

2
b
a
12


a
b

s Y2 
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
2
24
Teoria della
probabilità
– Statistica
classica
Variabili aleatorie
Funzioni continue - Esempi
•
Distribuzione di tipo Esponenziale
f  y   l exp  -l y 
F  y   1 - exp  -l y 
fY(y)
y0
La funzione ha un solo
parametro: l

FY(y)
pdf
y
1
l2
y
Variabili aleatorie
Funzioni continue - Esempi
•
l
s2 
cdf
1
l
1
Teoria della
probabilità
– Statistica
classica
Distribuzione di tipo Weibull

yk 

f  y   ly exp - l 
k 

k

y 
F  y   1 - exp - l 
k 

k -1
y0
1
 k k  1 
 Y    1  
l  k 
2
2
 k k   2  k  1 k  
s    
 - 
 
 l    k   k  
2
Y
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
N.B. per k = 1
la Weibull
degenera nella
distribuzione di
tipo
esponenziale
In letteratura la
sua espressione
non è univoca e
si trovano altre
formulazioni
equivalenti
25
Variabili aleatorie
Funzioni continue - Esempi
•
Teoria della
probabilità
– Statistica
classica
Distribuzione di tipo Weibull
2.5
2
k<1
y(y)
1.5
k=1
k>1
1
0.5
0
0
0.5
1
1.5
2
2.5
3
3.5
4
y
Variabili aleatorie:
Teorema limite centrale
•
Teoria della
probabilità
– Statistica
classica
Esiste un teorema di statistica che afferma:
“Sia {Xi} una successione di variabili aleatorie
indipendenti di media  e varianza s2, indipendenti ed
identicamente distribuite, allora la somma
n
Sn   X i
i 1
converge asintoticamente verso una variabile aleatoria
normale (o altrimenti detta Gaussiana)”
se le sorgenti di errore in una osservazione sono infinite ed
indipendenti, la variabile aleatoria può essere assunta di tipo
Normale
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
26
Carl Friedrich Gauss
Teoria della
probabilità
– Statistica
classica
Gaussiana
Funzione di distribuzione Gaussiana
•
Teoria della
probabilità
– Statistica
classica
Una variabile aleatoria (continua) si dice normale o Gaussiana se
la sua densità di probabilità è:
 1  y - Y  2 
fY 
exp  
s Y2 
2 s Y
 2
1
•
•
•
•
La funzione è definita lungo tutto l’asse reale (ovvero un
qualunque numero reale può essere un esito di una VA di tipo
normale)
Il grafico di tale funzione è una curva a campana simmetrica
rispetto a y=Y
La distribuzione dipende da due parametri,  e s2.
La maggior parte delle variabili aleatorie con cui si avrà a che fare
sono Gaussiane (o comunque derivate dalla Gaussiana).
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
27
Funzione di distribuzione Gaussiana
Teoria della
probabilità
– Statistica
classica
•
La gaussiana è simmetrica rispetto al valore Y pertanto la media
coincide con il valore Y
•
Si può verificare matematicamente che il parametro s2 definito
nell’espressione coincide con la varianza della funzione di
distribuzione.
Funzione di distribuzione Gaussiana
Teoria della
probabilità
– Statistica
classica
In figura sono riportate tre gaussiane con egual media e varianza
0.25, 0.5, 1
Varianza s2 = 0.25
1.5
1.25
1
0.75
Varianza s2 = 1
0.5
0.25
-2
•
-1
1
2
3
4
La distribuzione di probabilità non è disponibile analiticamente ma
esiste sotto forma tabulare.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
28
Funzione di distribuzione Gaussiana
Teoria della
probabilità
– Statistica
classica
N.B.
-s
 - s
- s

 s
s
s
68.26%
Questo è vero
per ogni valore
di  e s nel
caso della
Gaussiana!
95.46%
99.73%
Aree sottese dalla distribuzione normale
Distribuzione normale (o di tipo
Gaussiano)
•
•
•
•
Teoria della
probabilità
– Statistica
classica
Al diminuire di s, i risultati dell’esperienza aleatoria assumono
valori in intervalli sempre più piccoli
L’incertezza diventa sempre più piccola
Non esistono delle tabelle per calcolare le probabilità per i generici
valori di  e s.
Vedremo nel seguito come è possibile ricondurre il calcolo della
probabilità sempre alla VA di tipo standard
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
29
Variabili aleatorie: Distribuzioni –
Riepilogo concetti
•
•
Rappresentazione casualità tramite:
– Introduzione concetto Variabile Aleatoria (VA)
– Caratterizzazione proprietà VA tramite funzioni a valori reali
Definizione funzioni di distribuzione e densità di probabilità
– Proprietà
– Esempi
• VA di tipo Uniforme
•
Esponenziale
•
Weibull
•
Gaussiana (o Normale)
– Teorema del limite centrale
Funzioni di una variabile aleatoria.
Esempio con VA discreta
•
•
•
Teoria della
probabilità
– Statistica
classica
Teoria della
probabilità
– Statistica
classica
Il seguente gioco assegna le seguenti vincite per un lancio di dadi:
– 0.10 euro se esce un numero dispari
– 0.20 euro se esce il 2
– 0.30 euro se esce il 4
– 0.40 euro se esce il 6
Quale è la probabilità che il giocatore vinca 0.2 euro nella singola
giocata?
La possibilità che si vinca una certa cifra con questo gioco è una
variabile aleatoria?
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
30
Funzioni di una variabile aleatoria.
Caso discreto
•
Teoria della
probabilità
– Statistica
classica
I possibili eventi elementari per la nuova VA vincita al gioco
possono essere :
1 = {0.1, 0.2, 0.3, 0.4}
•
•
Se il dado è regolare, è possibile ricavare quale è la probabilità
che si verifichi il singolo evento.
È possibile quindi definire una funzione di una variabile aleatoria.
In questo caso associo ad ogni evento dello spazio campione  un
altro elemento di uno spazio 1
0.1
0.2

g  y   0.3
0.4

0

euro
y  1,3,5
euro
y2
euro
y4
euro
y6
altrove
fY(y)
fZ(z)
Funzioni di una variabile aleatoria.
Esempio caso discreto
1/6
½
Teoria della
probabilità
– Statistica
classica
1/6
1
2
3
4
5
6
y
Funzione densità di probabilità
del lancio di dadi
0.1
0.2
0.3
0.4
z
Funzione densità probabilità
vincita di euro
Z = g(Y)
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
31
Funzioni di una variabile aleatoria
Y()
g(Y)
R
Spazio
campione

Codominio della VA Y
=
Spazio campione della
VA
Y
W
Insieme dei
risultati possibili
Teoria della
probabilità
– Statistica
classica
Insieme dei valori che
può assumere la Y
1  R
1
Codominio della funzione
della VA
=
Spazio campione della
VA
Z=g(Y)
Insieme dei valori che
può assumere la Z = g(Y)
Funzioni di una variabile aleatoria.
Valore atteso
Teoria della
probabilità
– Statistica
classica
•
Funzione vincita al gioco dei dadi
•
Quanto si deve pagare per il singolo lancio affinché il gioco sia
equo?
•
Dovrei pagare per il singolo lancio una quota che sia la media
delle possibili vittorie (ovvero l’esito della nuova variabile
aleatoria) per la singola esperienza.
Nel caso in esame:
•
1
1
1
1 1
0.10  0.20  0.30  0.40 
2
6
6
6 5
•
Il valore ottenuto si definisce il valore atteso della funzione g(y) e
si indica con il simbolo E(g(y))
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
32
Funzioni di una variabile aleatoria.
Valore atteso
•
•
Teoria della
probabilità
– Statistica
classica
Definizione:
Sia Y una variabile aleatoria e g( · ) una funzione misurabile, si
definisce quindi media (o valore atteso) di g(Y) lo scalare:
E  g Y    g  y j  f  y j 
Caso discreto
j

E  g Y    g  y  f  y  dy
Caso continuo
-
•
N.B. La g(y) deve essere definita per ogni Y per cui la funzione pdf
fY(y) non è nulla.
Funzioni di una variabile aleatoria –
Valore atteso
•
Teoria della
probabilità
– Statistica
classica
Esempio – Si consideri la seguente trasformazione
g Y   Y - Y 
2
•
È immediato verificare che il valore atteso di tale funzione coincide
con la varianza della VA Y:


-
-
E g Y    g  y  fY  y dy    y - Y  fY  y dy  sY2
2
66
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
33
Funzioni di una variabile aleatoria
Proprietà del valore atteso
•
Teoria della
probabilità
– Statistica
classica
Altre proprietà del valore atteso:
E c  c
E c g Y    c E  g Y  
E c1 g1 Y   c2 g 2 Y    c1 E  g1 Y    c2 E  g 2 Y  
Funzioni di una variabile aleatoria.
Determinazione della media
•
•
Teoria della
probabilità
– Statistica
classica
Data una variabile aleatoria Y ed una trasformazione g(y)
formiamo la nuova Variabile Aleatoria Z=g(Y).
La media di Z è

Z  E  Z  
 z f  z  dz
Z
-
•
•
•
Se è nota la distribuzione di Y non è necessario conoscere la fZ
per determinare la media di Z.
Teorema della media:
Siano Y e Z due variabili aleatorie tali che Z = g(Y), è valida la
seguente proprietà (N.B. se esistono gli integrali presi in
considerazione)

 Z  EZ  Z  


z f Z  z  dz  EY  g Y   
-
Valutato in Z
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
 g ( y) f  y  dy
Y
-
Valutato in Y
34
Trasformazioni affini di una
Variabile Aleatoria
•
Definizione trasformazione affine:
Z = g(Y)=aY+b
•
a,b 
In genere ci si riferisce a tale trasformazione come lineare
(ma rigorosamente non lo è dato che non rispetta il principio di
sovrapposizione degli effetti)
Trasformazioni affini–
Determinazione media
•
•
Teoria della
probabilità
– Statistica
classica
Teoria della
probabilità
– Statistica
classica
Problema: Non si conosce di che tipo di variabile aleatoria sia Y
ma ne conosciamo media e varianza, è possibile determinare la
media e la varianza di Z?
Se g(Y) è una trasformazione affine:
 Z  EZ Z 
Z = g(Y)=aY+b
 EY aY  b   a EY Y   b
 a Y  b
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
35
Trasformazioni affini variabile
aleatoria – Calcolo della varianza
•
Teoria della
probabilità
– Statistica
classica
Anche per la varianza è possibile determinare una espressione
analitica
 
 a E Y - a 

2

2
s 2Z  EZ Z 2 -  2Z  EY a Y  b  - a Y  b  
2
2
2
Y
2
Y
 EY 2 a b Y  - 2abY  a 2sY2
Funzioni di una variabile aleatoria
Calcolo della varianza
•
•
Teoria della
probabilità
– Statistica
classica
Anche detta legge di propagazione degli errori.
Sia data una legge Z = g(Y), si intende calcolare la varianza della
nuova VA
2
s 2  Z   E  Z -  Z  


2
2
 E  g Y  -  Z    E  g Y   -  Z2




2
 E  g Y   - E 2  g Y 


Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
36
Funzioni di una variabile aleatoria.
Determinazione di media e varianza
Teoria della
probabilità
– Statistica
classica
•
Invece se la trasformazione è non lineare si possono solo stimare
in modo approssimato la media e la varianza di Z
•
Si linearizza g intorno a Y:
g  y   g  Y  
•
dg
dy
 y - Y  
Y
1 d 2g
2 dy 2
 y - Y 
2
Y
Troncando al primo ordine:
 
dg
g
y
f
y
dy





Y
-
-  g  Y   dy



Z  E  Z  
 y - Y   fY  y  dy  g  Y 
Y

Funzioni di una variabile aleatoria.
Determinazione di media e varianza
•
Troncando al secondo ordine:
 Z  g  Y  
•
Teoria della
probabilità
– Statistica
classica
1 d 2g
2 dy 2
s Y2
Y
Per la varianza
 dg
s 
 dy

2
2
Z
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
Y
 2
 sY


37
Teoria della
probabilità
– Statistica
classica
Funzioni di variabile aleatoria.
Caratterizzazione completa VA.
•
Ci si può domandare come sia distribuita Z. Procediamo per gradi
e supponiamo per semplicità che la funzione g sia monotona in
modo da avere una corrispondenza biunivoca tra Y e Z.
Dominio z
y(z)
z
P{z≤Z≤z+dz}=y(z)dz
z=g(y)
dz
P{y≤Y ≤y+dy}=y(y)dy
dy
y
Dominio y
y(y)
P{y≤Y ≤y+dy}=P{z≤Z≤z+dz}=
y(y)dy=y(z)dz
Teoria della
probabilità
– Statistica
classica
Funzioni di variabile aleatoria.
Caratterizzazione completa VA.
•
z e dz non sono qualunque ma corrispondono a y e dy
 z  g  y 

-1
 y  g  z 
•
Obiettivo: conoscere fZ(z)
y  dy
P  y  Y  y  dy  
 f   d  f  y  dy
Y
Y
y
P z  Z  z  dz   f Z  z  dz
f Z z  dz  f Y  y  dy
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
 f Z z  


f Y  y  fY g -1  z 

dz
dz
dy
dy y  g -1  z 
38
Funzioni di variabile aleatoria.
Caratterizzazione completa VA.
•
Teoria della
probabilità
– Statistica
classica
Esempio: Trasformazione affine
Z=aY+b
•
Da cui:
g’(y)=a
z -b
a
•
L’equazione z=ay+b ha una unica soluzione: y 
•
Quindi:
•
Se la funzione di trasformazione è affine non cambia il tipo di
variabile aleatoria. Questo è vero qualunque sia Y.
f Z z  
1  z -b
fY 

a  a 
Teoria della
probabilità
– Statistica
classica
•
Da cui, esplicitando la dipendenza inversa di y da z
2

 z -b
 

- Y  

1
1
a
 1
 
f Z z  
exp - 
2

a 2 s Y
2
sY






2
 1 z - b - aY  
1


exp 
a 2s Y2
2 a s y
 2

   aY  b 

  Z 2
2 2 
 s Z  a sY 

La nuova VA è
ancora una
Gaussiana di media
Z=a+bY
e varianza
sZ2=a2sY2
 1  z -  z 2 

exp 2

2 s Z
 2 sZ 
1
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
39
Funzioni di VA Gaussiane
Trasformazioni lineari
•
Data una variabile aleatoria Y (di tipo gaussiano) di media
varianza
•
Si consideri la seguente trasformazione lineare:
Y - Y
sY
Di che tipo è la nuova variabile aleatoria?
Quale è la media e la varianza della nuova variabile?
È facile verificare che:
Z  0
s Z2  1
Gaussiana di tipo
standard
Funzioni di VA Gaussiane
Trasformazioni lineari
•
•
•
Y e
sY2
Z
•
•
•
Teoria della
probabilità
– Statistica
classica
Teoria della
probabilità
– Statistica
classica
Nota la funzione di distribuzione standard è possibile ricavare le
proprietà di una qualsiasi distribuzione gaussiana
In particolare, è possibile calcolare la probabilità che si verifichi un
dato evento per un generico processo, con media e varianza note.
Questo è possibile sapendo solo i valori della distribuzione di tipo
standard.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
40
Teoria della
probabilità
– Statistica
classica
Calcolo probabilità per una
Gaussiana generica
z=
(y – )
s
 = 5; s2 = 10
-5
0
5
 = 10; s2 = 0.5
10
15
-5
0
5
8 10
15
Normale standard
-5 -2.83 -1.58 0 1.58
5
Calcolo probabilità per una
Gaussiana generica
10
15
Teoria della
probabilità
– Statistica
classica
•
Esempio: calcolare quale è la probabilità che si verifichi un evento
appartenente all’intervallo [0,5] per la variabile aleatoria di media
3 e deviazione standard 2:
•
Si deve calcolare quale è la probabilità che la variabile aleatoria di
tipo standard assuma un valore nell’intervallo corrispondente.
82
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
41
Calcolo probabilità per una
Gaussiana generica
•
Teoria della
probabilità
– Statistica
classica
Dobbiamo calcolare la probabilità:
P  0  X  5
•
Gli estremi dell’intervallo corrispondente per la distribuzione di
tipo standard possono essere facilmente calcolati
x1 -  X
0-3
sX
2
x - X 5 - 3
z2  2

1
sX
2
z1 

P  0  X  5 
P  -1.5  Z  1 
0.8413 - 0.0668  77.4%
Calcolo probabilità per una
Gaussiana generica
•
•
•
Teoria della
probabilità
– Statistica
classica
Esercizi
Sia Y una variabile aleatoria di tipo normale, di media  = 16 e
varianza s2 = 25
Calcolare:
– P(Y > 20)
– P(20 < Y < 25)
– P(Y < 10)
– P(12 < Y < 24)
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
42
Funzioni di VA Gaussiane –
Esempio trasformazioni non lineari
•
•
Teoria della
probabilità
– Statistica
classica
Esempio: Trasformazione non lineari
Data una variabile aleatoria Y di tipo normale, descritta dalla
seguente distribuzione
 1  y - Y  2 
fY 
exp  
s Y2 
2 s Y
 2
1
•
si consideri la seguente trasformazione non lineare
Z  eY
•
•
Si intende calcolare la distribuzione della variabile aleatoria Z.
Innanzitutto quali valori può assumere la VA Z?
Funzioni di VA Gaussiane –
Esempio trasformazioni non lineari
Teoria della
probabilità
– Statistica
classica
•
Una variabile aleatoria di tipo gaussiano può assumere un
qualunque valore reale.
– Il suo esponenziale ovviamente no
– Questa indicazione è già sufficiente per stabilire che
l’esponenziale di una variabile aleatoria di tipo Gaussiano non è
più dello stesso tipo.
•
Questa proprietà è vera per qualunque tipo di variabile aleatoria:
una trasformazione non lineare implica una trasformazione
del tipo di variabile aleatoria.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
43
Teoria della
probabilità
– Statistica
classica
Funzioni di VA Gaussiane –
Esempio trasformazioni non lineari
•
•
Come visto precedentemente
Si può facilmente vedere che
g'y z  e y
g -1 z   logz 
•
fY  y 
dz
dy
y log  z 



f Y g -1  z 
g'y z
z
z
Da cui
f Z z  
•
•
f Z z  
 1 log z - Y 2 

exp 
s Y2
2 sY z
 2

1
z 0
Ed è uguale a zero per z < 0.
Tale distribuzione prende il nome di distribuzione Lognormale
Teoria della
probabilità
– Statistica
classica
Funzioni di VA Gaussiane:
Distribuzione Lognormale
•
Grafico e proprietà della distribuzione Lognormale
0.3
f(z)
0.2
0.1
0.0
0
2
4
6
8
10
z
•
È un tipico esempio di distribuzione asimmetrica

s2
E Z    Z  exp Y  Y 
2 

Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
s Z2  exps Y2  - 1 exp2 Y  s Y2 
44
Funzioni di una variabile aleatoria
Trasformazioni non biunivoche
•
Teoria della
probabilità
– Statistica
classica
Nel caso di trasformazione non biunivoca le cose si complicano dal
punto di vista operativo, ma concettualmente il problema non è
molto diverso
g’(y3)
Z=g(Y)
g’(y2)
g’(y1)
z+dz
z
y1 y1+dy1
y2 y2+dy2
y3 y3+dy3
Funzioni di una variabile aleatoria
Trasformazioni non biunivoche
•
Dalla corrispondenza degli eventi riguardanti la VA Z e la VA Y è
facile dimostrare che
fZ  z  
•
Teoria della
probabilità
– Statistica
classica
fY  y1 
g '  y1 

fY  y2 
g '  y2 
 ... 
fY  yn 
g '  yn 
Per i valori di z per i quali l’equazione Z = g(Y) ha le soluzioni
y1,y2,…,yn e
fZ  z   0
•
Per i valori di z per cui l’equazione z=g(y) non ammette soluzioni
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
45
Variabili Aleatorie Vettoriali
•
•
Teoria della
probabilità
– Statistica
classica
Spesso negli esperimenti si osservano molte quantità
contemporaneamente.
E’ evidente che è possibile generalizzare il concetto di variabile
aleatoria introducendo la VA vettoriale:
Y  Y1 , Y2 , ..., YN
T
•
Una VA vettoriale ad N componenti è rappresentabile in uno
spazio ad N dimensioni.
•
Se N=2 gli eventi sono sottoinsiemi del piano.
Variabili Aleatorie Vettoriali
•
•
Teoria della
probabilità
– Statistica
classica
Se in un esperimento stocastico osserviamo 2 quantità dobbiamo
associare all’esperimento due variabili aleatorie: Y1 ed Y2.
Ogni esecuzione dell’esperimento fornisce una coppia di numeri
(y1 ed y2)
Y2
b2
a2
a1
•
b1
Y1
Se si conosce la probabilità:
P a1  Y1  b1 , a2  Y2  b2 
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
46
VA vettoriali – Funzione densità di
probabilità congiunta
•
Teoria della
probabilità
– Statistica
classica
La distribuzione di probabilità della VA vettoriale Y è:
F  y1 , y2   P Y1  y1 , Y2  y2 
P a1  Y1  b1 , a2  Y2  b2   F  b1 , b2  - F  a1 , b2  - F  b1 , a2   F  a1 , a2 
•
La funzione densità di probabilità congiunta fY(y1,y2) è tale che:
y1 y2
F  y1 , y2  
  f  w, v  dwdv
- -
b2 b1
P a1  Y1  b1 , a2  Y2  b2  
  f  w, v  dwdv
a2 a1
 
  f  w, v  dwdv  1
- -
V.A. VETTORIALI –
Distribuzioni Marginali
•
Teoria della
probabilità
– Statistica
classica
Ad ogni distribuzione bidimensionale possiamo associare 2
distribuzioni monodimensionali che sono dette distribuzioni
marginali:
y1 
FY1  y1   P Y1  y1 , -  Y2   
  f  w, v  dwdv
- -
•
Analogamente, si può osservare:

fY1  y1  
 f  w, v  dv
-

fY2  y 2  
 f  w, v  dw
-
•
Le distribuzioni marginali fY1 e fY2 rappresentano le probabilità che
si verifichino, rispettivamente, gli eventi Y1 e Y2,
indipendentemente dall’esito dell’altra componente
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
47
VA vettoriali – Funzione densità di
probabilità congiunta
•
Teoria della
probabilità
– Statistica
classica
Esempi di pdf bidimensionali
fY(y1,y2)
Rappresentazione tridimensionale
Curve di isolivello
V.A. VETTORIALI –
Distribuzioni Marginali
•
•
•
Teoria della
probabilità
– Statistica
classica
La F della VA vettoriale si dice congiunta. Nel caso generico Ndimensionale si ha una F congiunta ed N marginali.
Importante:
Dalla funzione densità di probabilità (distribuzione) congiunta è
sempre possibile risalire alle funzioni densità di probabilità
(distribuzioni) marginali, mentre non è in genere vero il contrario
Distribuzione
congiunta
Distribuzioni
marginali
96
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
48
V.A. VETTORIALI –
Distribuzioni Marginali
•
Teoria della
probabilità
– Statistica
classica
Distribuzioni marginali Esempio
fY1(y1)
fY2(y2)
V.A. INDIPENDENTI: Definizione
•
Teoria della
probabilità
– Statistica
classica
Due VA Y1 ed Y2 di congiunta F(y1, y2) si dicono indipendenti se:
F  y1 , y2   Fy1  y1  Fy2  y2 
f  y1 , y2   f y1  y1  f y2  y2 
•
In tal caso, per ogni coppia di eventi {a1<Y1b1} e {a2<Y2b2}
vale:
P a1  Y1  b1 , a2  Y2  b2   P a1  Y1  b1  P a2  Y2  b2 
cioè se e solo se i due eventi sono indipendenti. Ovviamente il
discorso è generalizzabile ad N dimensioni.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
49
VA Vettoriali – Funzione densità di
probabilità condizionata
•
•
Teoria della
probabilità
– Statistica
classica
Concetto di funzione densità di probabilità condizionata.
Per semplicità si assuma Y  2 un vettore di variabili aleatorie
tale che:
Y1 
Y 
Y2 
Y1  R,
Y2  R
– Probabilità di Y1 condizionata dalla componente Y2:
fy
1
y y   f  y , y 
1
Y
y2
1
2
f Y2  y2 
2
– Probabilità di Y2 condizionata dalla componente Y1:
fy
y y   f  y , y 
1
Y
2
y1
2
1
2
f y1  y1 
VA Vettoriali – Funzione densità di
probabilità condizionata
•
Teoria della
probabilità
– Statistica
classica
Caso particolare: VA vettoriali bidimensionali
Y 
Y   1
Y2 
Y1 , Y2  R
fY 1 Y 2  y1 y2  
f Y  y1 , y2 
;
f y  y2 
f y 2  y2    f Y  y1 , y2 dy1  0
f Y  y1 , y2 
;
f y  y1 
f y1  y1    f Y  y1 , y2 dy2  0
2
fY 2 Y 1  y2 y1  
1
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria

-

-
50
Teoria della
probabilità
– Statistica
classica
VA Vettoriali – Funzione densità di
probabilità condizionata
•
Esempi di probabilità condizionate:
fY Y  a  y1 y2  a  
1
2
f Y  y1 , y2  a 
fY  y2  a 
2
y2=a
fY
2
Y1  b
y
2
y1  b  
f Y  y1  b, y2 
fY  y1  b 
1
y1=b
VA Vettoriali – Funzione densità di
probabilità condizionata
•
Teoria della
probabilità
– Statistica
classica
Da notare che nel caso di variabili aleatorie Y1 e Y2 indipendenti:
f Y  y1 , y2   fY  y1  fY  y2 
1
•
2
si ha:
fY 1 Y 2  y1 y2   fY  y1 
1
fY 2 Y 1  y2 y1   fY  y2 
2
•
Quando due VA sono indipendenti qualunque evento dell’una non
è condizionato dagli eventi dell’altra.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
51
VA Vettoriali –
Definizione VA indipendenti
•
•
Teoria della
probabilità
– Statistica
classica
Esempio 2D
Due VA Y1 ed Y2 di congiunta F(y1, y2) si dicono indipendenti se:
F  y1 , y2   Fy1  y1  Fy2  y2 
f  y1 , y2   f y1  y1  f y2  y2 
•
In tal caso:
Distribuzione
congiunta
Distribuzioni
marginali
Variabili Aleatorie Vettoriali
•
Teoria della
probabilità
– Statistica
classica
Caso Gaussiano:

Y1 ~ N 1 , s12


Y2 ~ N  2 , s 22

2
 1  y1 - 1  
1
exp 
s12
2 s1
 2

2
 1  y2 -  2  
1
f Y2 
exp 
s 22
2 s 2
 2

f Y1 
•
Se le due VA sono indipendenti allora la congiunta:
fY 
•
 1  y1 - 1 2 1  y2 -  2 2 
exp 
2  s 1s 2
s 12
2
s 22
 2

1
NB: la congiunta contiene 4 parametri
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
52
Teoria della
probabilità
– Statistica
classica
Variabili aleatorie vettoriali
Caso coppia di VA Gaussiane
•
Una coppia di variabili aleatorie Y = (Y1, Y2) si dicono
congiuntamente gaussiane (o normali) e si denotano con il
simbolo
Y ~ N μ, V

•
se la loro pdf congiunta assume la seguente espressione:
 y - μ T V -1 y - μ 
1

fY y 
exp  

2
2 det V


I parametri di tale pdf sono:
– Il vettore μ è il vettore delle medie
– La matrice V , simmetrica, definita positiva, è la matrice di
covarianza

 
•

V



s 12 s 12
s 12 s 22
Variabili aleatorie vettoriali
Caso Gaussiano
•
Gli elementi della matrice di covarianza sono:


 E Y -   
s 12  E Y1 - 1 2
s
2
2
2
2
2
s 12  E Y1 - 1 Y2 -  2 
VA Y1 e Y2 indipendenti
•
•
Teoria della
probabilità
– Statistica
classica
varianza della VA Y1
varianza della VA Y2
covarianza delle VA Y1 e Y2
La covarianza è nulla
Non è vero generalmente il contrario (ma per gaussiane si)
Per convincersi che la matrice di covarianza V caratterizza la
dispersione dei dati si può vedere che, per una coppia di VA
congiuntamente gaussiane le linee di isolivello della pdf hanno
equazione:
(y-)TV-1(y-) = cost
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
53
Teoria della
probabilità
– Statistica
classica
Variabili aleatorie vettoriali
Coefficiente di correlazione
•
•
Dalla matrice di covarianza è possibile determinare la correlazione
tra due variabili aleatorie.
Siano date due variabili aleatorie Y1 e Y2. Il coefficiente di
correlazione è definito come:
covY1 , Y2 
s
 12
V Y1 V Y2  s 1s 2
r12 
•
Per come è definito:
- 1  r12  1
Teoria della
probabilità
– Statistica
classica
Variabili aleatorie vettoriali
Caso Gaussiano VA Indipendenti
3
2
1
0.1
0.075
0.05
0.025
0
0
2
0
-1
-2
0
-2
-2
2
-3
-3
V
1 0
0 2
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
μ
-2
-1
0
1
2
3
0
0
54
Teoria della
probabilità
– Statistica
classica
Variabili Aleatorie Vettoriali di tipo
Normale – VA indipendenti
•
Nel caso di variabili aleatorie di tipo Gaussiano indipendenti:

Y1 ~ N 1 , s 12


Y2 ~ N  2 , s 22

 1  y1 - 1 2 
1
fY1 
exp 
2
2 s 1
 2 s1

 1  y2 -  2 2 
exp 
s 22
2 s 2
 2

1
fY2 
•
La congiunta assume la seguente forma:
f Y  fY 1 f Y 2 
•
 1  y1 - 1 2 1  y2 -  2 2 
exp  
2
2  s 1s 2
2
s 22
 2 s1

1
NB: la congiunta contiene 4 parametri
Teoria della
probabilità
– Statistica
classica
Variabili aleatorie vettoriali
Caso Gaussiano VA Indipendenti
•
Rappresentazione distribuzioni marginali e probabilità condizionate
fY1
=0
s2=1
-3
-2
-1
y1
0
y1
0
1
2
3
fY  y1 | y2  1.5 1  0, s 12  1
-3
-2
-1
3
fY2
y1
0
1
2
3
2
1
-3
-2
-1
1
2
3
fY  y1 | y2  -1.5  1  0, s 12  1
0
-1
=0
s2=2
La probabilità dell’evento y1
non cambia con il valore di y2
-2
-3
-3
-2
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
-1
0
1
2
3
55
Teoria della
probabilità
– Statistica
classica
Variabili Aleatorie Vettoriali di tipo
Normale – VA non indipendenti
2
1
0.2
0
2
0.1
0
0
-1
-2
0
-2
-2
2
-2
V
1 
 2
μ
-1
0
1
0
0
Teoria della
probabilità
– Statistica
classica
Variabili Aleatorie Vettoriali di tipo
Normale – VA non indipendenti
•
2
Rappresentazione distribuzioni marginali e probabilità
condizionate
fY1
=0
s2=1
-3
-3
-2
-1
y1
0
1
2
3
-2
-1
0
1
2
3
fY  y1 | y2  1.5 1  1.2, s 12  0.36
fY2
-3
=0
s2=1
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
-2
-1
0
1
2
3
fY  y1 | y2  -1.5  1  -1.2, s 12  0.36
56
Teoria della
probabilità
– Statistica
classica
Variabili Aleatorie Vettoriali di tipo
Normale – VA non indipendenti
•
Nel caso di correlazione |r| = 1 la distribuzione degenera in una
retta.
3
2
1
0.4
0
2
0.2
0
-1
0
-2
-2
0
-2
2
-3
-3
-2
-1
0
1
2
3
Domanda: in questo caso come si comportano le marginali e
le probabilità condizionate?
Variabili Aleatorie di tipo Normale
Vettoriali – Caso Generico
•
Nel caso generico di n componenti la variabile aleatoria vettoriale
assume la forma:
f Y y  
•
•
•
•
Teoria della
probabilità
– Statistica
classica
1
n/2
2  
 1

T
exp - y - μ  V -1 y - μ  
det V
 2



I parametri di tale pdf sono raccolti nel vettore  e nella matrice
V:
 = (1, , ... , n);
V, matrice (n × n) definita positiva, è la matrice di covarianza.
Ancora, se le VA componenti sono indipendenti, la matrice V è
diagonale perché tutte le covarianze sono nulle.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
57
Trasformazioni di Variabili aleatorie
Vettoriali
•
•
Teoria della
probabilità
– Statistica
classica
I concetti esposti per le trasformazioni di variabili scalari possono
essere estesi al caso vettoriale.
Si consideri la generica trasformazione non lineare:
Y
Y1
Y2
Z
g1 Y1 , Y2 
g 2 Y1 , Y2 
o, equivalentemente Z  g  Y 
•
Vogliamo determinare la densità di probabilità congiunta di Z.
Trasformazioni di Variabili aleatorie
Vettoriali
•
Teoria della
probabilità
– Statistica
classica
Il ruolo della derivata nella trasformazione è assunto dallo
Jacobiano, ma i passaggi sono concettualmente analoghi al caso
scalare:
 z1  g1  y1 , y2 

 z2  g 2  y1 , y2 
y1i , y2i Radici del sistema
Nrad
fZ 
i 1
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
fY  y1i , y2i 
 Jy
1i
, y2i 
J
z1
y1
z1
y2
z2
y1
z2
y2
58
Trasformazioni di Variabili aleatorie
Vettoriali – Caso Lineare
•
Se si usa una trasformazione lineare:
Z

 n 1
•
Teoria della
probabilità
– Statistica
classica
aT
 n  n

Y

 n 1
b
 n 1
La conoscenza della sola media Y e della matrice di covarianza VY
della VA Y permette la determinazione della media Z e della
matrice di covarianza della VA VZ
μ Z  aT  μ Z  b
VZ  a T  VY  a
•
Come nel caso scalare risulta inoltre che solo le trasformazioni
lineari conservano il tipo di Variabile aleatoria
Trasformazioni di Variabili aleatorie
Vettoriali – Caso Lineare
•
Nel caso lineare è possibile anche analizzare trasformazioni di VA
vettoriali di dimensioni differenti, per esempio da una VA
vettoriale Y di dimensioni (n × 1) ad una W di dimensioni (p × 1)
W

 p 1
•
Teoria della
probabilità
– Statistica
classica
cT

 p  n
Y

n 1
d
 p 1
Generalizzando le relazioni precedenti si ottiene:
μ W  cT  μ Z  d
VW  cT  VZ  c
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
59
Trasformazioni di Variabili aleatorie
Vettoriali – Caso Lineare
•
•
Teoria della
probabilità
– Statistica
classica
Un caso particolare di interesse è quando p = 1.
In tal caso si ottiene, almeno per VA vettoriali indipendenti:
W  c1Y 1  d   c2Y 2  d   ...  cn Yn  d 
2
2
sW
 c12 sY2 1  c22 sY2 2  ...  cn2 sYn
•
Per esempio, nel caso W = Y1 + Y2+ … +Yn
W  Y 1  Y 2  ...  Yn
s W2  s Y21  s Y2 2  ...  s Yn2
Trasformazioni di Variabili aleatorie
Vettoriali
Teoria della
probabilità
– Statistica
classica
•
Particolare importanza hanno le trasformazioni di una VA
vettoriale Y in una VA scalare (caso m=1)
•
Sono, ad esempio, di uso molto comune alcune VA scalari che
derivano (attraverso trasformazioni non lineari) da variabili
aleatorie vettoriali gaussiane Y ad n componenti, con vettore delle
medie  = 0 e matrice di covarianza V = I.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
60
Teoria della
probabilità
– Statistica
classica
Variabili Aleatorie derivate dalla
gaussiana - Variabile 
•
Si consideri una VA vettoriale ad n componenti Y = (Y1, Y2, …, Yn)
Y~N(0,I)
•
Le componenti sono quindi tutte indipendenti e gaussiane di
media nulla e varianza unitaria. La variabile aleatoria scalare
Z  Y12  Y22  ...  Yn2
•
prende il nome di variabile aleatoria 2 ad n gradi di libertà.
•
Tale variabile aleatoria è caratterizzata completamente da un solo
parametro, il numeri di gradi di libertà n.
Variabile aleatoria
•
Teoria della
probabilità
– Statistica
classica

Funzione densità di probabilità
n
n
n
n
0.5
=
=
=
=
1
2
4
6
0.4
0.3
0.2
0.1
0
0
1
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
2
3
4
5
6
7
8
9
10
61
Variabile aleatoria
•

Teoria della
probabilità
– Statistica
classica
Proprietà di una variabile aleatoria 2 ad n gradi di libertà
  E  n2   n
s 2  2n
n-2
y

2
2
K
y
e
  n

0
2
n
•
y0
y0
Il massimo si ha per y = n-2. Da osservare che per n → ∞ la
distribuzione 2 tende ad una gaussiana.
Kn 
1
n
2
2 n / 2
VA derivate dalla gaussiana
Distribuzione t-Student
•
•
Teoria della
probabilità
– Statistica
classica
Sia Y una variabile aleatoria gaussiana di media 0 e varianza
unitaria, e Z una 2 ad r gradi di libertà
Inoltre Y e Z siano tra loro indipendenti. La variabile aleatoria data
da:
T
Y
 r2
r
è una distribuzione t di Student ad r gradi di libertà.
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
62
Teoria della
probabilità
– Statistica
classica
VA derivate dalla Gaussiana
Distribuzione t-Student
•
In figura sono mostrate le funzioni densità per 1,3,6 gradi di
libertà.
n =2
n=4
Distribuzione Standard
0.4
William
Sealy
Gosset
“creatore”
della t di
Student
fY(y)
0.3
n
0.2
0.1
0.0
-4
•
•
-2
0
2
y
4
La T è simmetrica rispetto a y=0
Per r →+∞ la t di Student tende ad una gaussiana di tipo
standard.
Teoria della
probabilità
– Statistica
classica
VA derivate dalla Gaussiana
Distribuzione t-Student
•
Espressione analitica della t di Student
fr  y  K
1
y2 

1  
r 

•
•
•
r 1 ,
2
yR
  1 


2 

K

  
2
Essendo K una costante di normalizzazione.
Proprietà:
Dipende da un solo parametro il numero intero r
Media:
Y  0
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
2
Varianza: s Y 

 -2
  2
63
Teoria della
probabilità
– Statistica
classica
VA derivate dalla Gaussiana
La distribuzione F di Fisher
•
Se le variabili aleatorie Y e W sono VA di tipo 2 rispettivamente
ad m ed n gradi di libertà, la VA scalare Z
Y
Z
W
m
n
è una VA di tipo F di Fisher ad (m,n) gradi di libertà.
• La VA ha due parametri, m ed n.
VA derivate dalla Gaussiana
La distribuzione F di Fisher
•
Teoria della
probabilità
– Statistica
classica
Espressione analitica della F di Fisher
 mn
m- 2
  2   n  n / 2
y 2



 
m n
  m  n   m    m   2
1    y 
  2  2
 n 

fY  y; m, n   

0





Media: Y 
n
,
n-2
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
y0
m, n  N
altrove
m  n - 22n
mn - 4 n - 2
2
n  2 
2
Varianza: s Y 
2
64
VA derivate dalla Gaussiana
La distribuzione F di Fisher
•
Teoria della
probabilità
– Statistica
classica
Grafici della F di Fisher al variare dei gradi di libertà
1.2
(10, 4) g.d.l.
(10, 10) g.d.l
1.0
fY(y)
(10, 50) g.d.l.
(10, Infinity) g.d.l.
0.8
0.6
0.4
0.2
0.0
0.0
0.5
1.0
1.5
y
Analisi dei Processi Chimici e
Biotecnologici - Statistica Teoria
2.0
2.5
3.0
3.5
4.0
Sir Ronald Aylmer
Fisher
1890 - 1962
65