Teoria della probabilità e Statistica (cenni) Cenni su teoria della probabilità e statistica Definizione di popolazione e campione Variabili aleatorie Definizione funzione di distribuzione Definizione funzione densità di probabilità Definizione media e varianza Funzioni di una variabile aleatoria Variabili aleatorie vettoriali Funzioni di variabili aleatorie vettoriali Motivazioni Teoria della probabilità – Statistica classica • Gli esiti di un singolo esperimento non sono prevedibili, anche dopo ripetute esecuzioni nelle stesse condizioni • Ciò è dovuto all’inevitabile errore sperimentale • Si possono comunque individuare delle regolarità nell’insieme dei risultati di un numero elevato di ripetizioni dello stesso esperimento – ovvero si può modellare la casualità presente in una misura sperimentale La modellazione dell’errore sperimentale è quindi una modellazione di tipo statistico • Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 1 Teoria della probabilità. Definizione popolazione e campione Teoria della probabilità – Statistica classica • • POPOLAZIONE Insieme di tutte le possibili osservazioni, di dimensione N • Esempi: – Le misure sperimentali, in linea di principio infinite, che possono essere effettuate – I risultati delle elezioni politiche in un paese, ottenuti dallo spoglio dei voti. Teoria della probabilità. Definizione popolazione e campione • • • • • • Teoria della probabilità – Statistica classica CAMPIONE Insieme dei valori osservati. È pertanto un sottoinsieme della popolazione. La dimensione del campione n è il numero di valori osservati. In genere: n«N Esempi: – Il numero finito di prove sperimentali che si è, nella realtà, effettuato. – Le proiezioni dei risultati elettorali ottenute grazie ai cosiddetti “exit poll”. N.B. Il numero di possibili campioni che si può estrarre da una popolazione è pari a: N! n!N - n ! – Per N→∞ i possibili campioni sono infiniti Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 2 Teoria della probabilità. Definizione popolazione e campione. • In genere non è possibile conoscere il dettaglio di tutta la popolazione: – La popolazione è costituita da un insieme infinito (come nel caso delle possibili misure sperimentali) – È comunque dal punto di vista pratico impossibile (come nel caso delle elezioni politiche) – Non ha comunque senso applicativo (esempio: crash test delle vetture) Teoria della probabilità. Definizione popolazione e campione. • Teoria della probabilità – Statistica classica Teoria della probabilità – Statistica classica Interpretazione grafica Popolazione Campione Inferenza statistica Campagna sperimentale Dal campione si intende ottenere informazioni sulla popolazione generatrice non nota Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 3 Teoria della probabilità. Definizione popolazione e campione. • Riepilogo Campione Teoria della probabilità – Statistica classica Popolazione Processo deduttivo Processo induttivo Caratterizzazione Campione: Statistica descrittiva (introdotta nella precedente sezione) Caratterizzazione Popolazione: Teoria della probabilità e statistica (nella sezione corrente) Introduzione concetto processo aleatorio • Teoria della probabilità – Statistica classica Un processo si dice aleatorio se: – Esso è replicabile sempre nelle stesse condizioni – Il suo risultato cambia al variare delle esperienza in quanto è affetta da una componente casuale. – Nei fatti, una esperienza aleatoria non restituisce mai lo stesso risultato se ripetuta più volte. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 4 Introduzione concetto processo aleatorio • Teoria della probabilità – Statistica classica Schema di un esperimento Valore vero della quantità misurata Misura sperimentale ottenuta y=+e + e Errore sperimentale Teoria della probabilità Modellazione Esperimento Aleatorio • Il modello matematico di un processo aleatorio ha lo scopo di prevedere le regolarità (statistiche) di un’esperienza, non il singolo esito! • • Esempi: Lancio di un dado – Quale è, per esempio, la frequenza della comparsa dei lati in cui sono rappresentati i numeri pari Lancio di una moneta – La frequenza della comparsa della testa e/o della croce Misure sperimentali – Il modello matematico deve prevedere, se esiste, il trend centrale delle misure sperimentali. • • Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria Teoria della probabilità – Statistica classica 5 Teoria della probabilità – Statistica classica Teoria della Probabilità Spazio campione - Definizione • L’insieme di tutti i possibili risultati che può registrare una esperienza aleatoria prende il nome di spazio campione • Uno spazio campione può essere finito o infinito, a seconda che esso sia costituito da un numero finito o infinito di elementi. • • Esempi: Lancio dei dadi: ={ • , , , , , } Risultato di una misura sperimentale: esempio: Misura di una temperatura in un reattore =R+ • Nel primo caso lo spazio campione è un insieme discreto finito, nel secondo caso è un insieme infinito continuo Teoria della Probabilità Evento • Teoria della probabilità – Statistica classica Un evento E è un qualunque sottoinsieme dello spazio campione • • Esempi: Numeri pari nel lancio dei dadi: { E= • , , } Risultati sperimentali: temperature osservate superiori a 100° E = {T>100.0} • Oppure che si osservi la temperatura T = 273.5 K E = 273.5 K • L’ultimo evento introdotto è un evento elementare. Per definizione, gli eventi elementari non possono essere l’unione di altri eventi Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 6 Teoria della probabilità – Statistica classica Teoria della Probabilità Evento • Si possono introdurre i concetti di eventi complementari secondo le regole di insiemistica. EC = • Nel caso dei dadi: EC = – E = • -E { , } , Nel caso del primo esempio di temperatura nel reattore: EC={T ≤ 100.0} • Un evento in cui non vi siano elementi si chiama evento impossibile e si indica con il simbolo Ø. Rappresentazione grafica degli eventi Insiemistica - Diagrammi di Venn A E B evento elementare A B E A B A A B Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria Teoria della probabilità – Statistica classica B A B 7 Rappresentazione grafica degli eventi Insiemistica - Diagrammi di Venn E B A Ec = - E: A - B Ec: Evento complementare A Teoria della probabilità – Statistica classica B B A A B = Ø BA A e B mutuamente esclusivi Definizione Probabilità – Approccio frequentista Teoria della probabilità – Statistica classica Il concetto di probabilità emerge direttamente dal concetto di frequenza relativa. Consideriamo il caso dei lanci dei dadi ed effettuiamo 10 lanci. • • { , , , , , , , , , } • Si calcola la frequenza relativa per i diversi eventi elementari dello spazio campione: Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria N( )/NTOT=0.00 N( )/NTOT=0.50 N( )/NTOT=0.20 N( )/NTOT=0.10 N( )/NTOT=0.10 N( )/NTOT=0.10 8 Definizione Probabilità – Approccio frequentista • Aumentando le dimensioni • del campione di dati sperimentali (per esempio n=50) si può avere Le frequenze relative tendono asintoticamente a dei valori che non cambiano più all’aumentare delle dimensioni del campione Caso n → ∞ Caso n = 50 N( )/NTOT=0.15 N( )/NTOT=1/6 N( )/NTOT=0.19 N( )/NTOT=1/6 N( )/NTOT=0.16 N( )/NTOT=1/6 N( )/NTOT=0.17 N( )/NTOT=1/6 N( )/NTOT=0.18 N( )/NTOT=1/6 N( )/NTOT=0.15 N( )/NTOT=1/6 Definizione Probabilità – Approccio frequentista • • • Teoria della probabilità – Statistica classica Teoricamente per n → ∞ le frequenze relative non cambiano più. La frequenza con cui si verifica un evento elementare rimane costante all’aumentare delle prove. Questo è vero anche per tutti gli eventi A dello spazio campione (per esempio: numeri pari/dispari etc.) Definizione frequentista della funzione probabilità: È possibile quindi definire in modo rigoroso la funzione probabilità del processo casuale in esame: P E lim FN E lim N • Teoria della probabilità – Statistica classica N N E N N.B. Questo concetto è applicabile solo per processi replicabili. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 9 Definizione Probabilità (Approccio Frequentista) • Teoria della probabilità – Statistica classica Rappresentazione intuitiva dell’approccio frequentista Popolazione N →∞ Campione Campione → Popolazione Assiomi di Kolmogorov (1933) • Teoria della probabilità – Statistica classica Una volta introdotto il concetto di probabilità per un evento di un processo stocastico, tutta la teoria della probabilità può essere sviluppate partendo da tre assiomi fondamentali: 1. 0 PE 1 E 2. P 1 3. P A B P A P B se A B 0 Nel caso di spazi campioni infiniti la 3. può essere scritta: 3 bis. P E j 1 j PEj j Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria se Ei Ek 0 i, k 10 Assiomi di Probabilità – Kolmogoroff (1933) • • Teoria della probabilità – Statistica classica Sfruttando gli assiomi di Kolmogoroff è possibile ricavare tutte le proprietà della probabilità: Esempio – Regola per insiemi complementari P AC 1 - P A • Dimostrazione: A AC e A AC 0 P 1 P A P AC Assiomi di Probabilità – Kolmogoroff (1933) • Teoria della probabilità – Statistica classica Altre proprietà che possono essere ricavate: 1. Regola di addizione per un numero finito di eventi mutualmente esclusivi: Ai Ak 0 i, k n n P A j PA j j 1 j 1 2. Regola di addizione per eventi arbitrari P A B P A P B - P A B 3. Probabilità dell’evento impossibile: Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria P(Ø) = 0 11 Definizione Probabilità Condizionata • Probabilità che si verifichi B se A si è verificato: P B A • P A B P A 1) In maniera analoga si può definire la probabilità dell’evento A condizionato dall’evento B. PA B • P A B PB 2) La 1) e la 2) sono valide se, rispettivamente, P(A)≠0 e P(B)≠0 Probabilità Condizionata Definizione • Teoria della probabilità – Statistica classica Teoria della probabilità – Statistica classica Le probabilità condizionate sono delle funzioni probabilità dato che soddisfano gli assiomi di Kolmogoroff per un qualunque insieme M 1. P(A|M) ≥ 0 per ogni evento A 2. P(|M) = 1 3. Nel caso A e B disgiunti – P(A B|M) = P(A|M) + P(B|M) • • Se B A allora P(A|B) = 1 Se {Ai M Ø}, Ai = 1,2, … sono mutualmente esclusivi, allora P(A1 A2 … |M) = P(A1|M) + P(A2|M) + … Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 12 Probabilità Condizionata - Esempio Teoria della probabilità – Statistica classica • • Esempio: Uno scatola contiene 10 viti di cui 3 difettose. Estraiamo due viti a caso. Determinare la probabilità che nessuna vite estratta sia difettosa • • • • Evento A: Prima vite non difettosa Evento B: Seconda vite non difettosa P(A)=7/10 Una volta estratta 1 vite restano nella scatola 9 viti quindi: P(B|A)=6/9=2/3 La probabilità che anche la seconda vite sia difettosa è quindi: P(AB)=P(A) P(B|A)=47% • Indipendenza stocastica Definizione • Teoria della probabilità – Statistica classica La nozione di indipendenza stocastica di eventi è fondamentale nella teoria della probabilità e nella pratica della sperimentazione: Definizione: Due eventi si dicono indipendenti se: P A B P A P B • Dalla definizione di probabilità condizionata: P(AB)=P(B)P(A|B) • Nel caso in cui P(AB)=P(A) P(B) si ottiene: P(A|B)=P(A). • Ovvero qualunque cosa accada a B essa non dà informazioni su A. Quindi A e B sono indipendenti Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 13 Indipendenza stocastica – Esempio • • Teoria della probabilità – Statistica classica Riesaminiamo l’esempio delle viti considerando di reimmettere nella scatola la vite estratta inizialmente. Intuitivamente, questo implica la perdita di informazione acquisita con il precedente risultato • • P(A) = P(B) = 0.7 P(AB) = P(A) P(B) = 49 % • Nota: Non si devono confondere eventi disgiunti con eventi indipendenti. Infatti due eventi disgiunti non sono indipendenti: • Indipendenza stocastica – Considerazioni Teoria della probabilità – Statistica classica • Da notare la profonda differenza concettuale tra i due esempi • Nel primo caso, il verificarsi di un evento condiziona la probabilità degli eventi successivi. • Nel secondo caso, il reimmettere la vite nel contenitore azzera le informazioni acquisite nella prima esperienza. • Informazioni pregresse, da un punto di vista logico, possono implicare dipendenza tra i dati sperimentali. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 14 Teoria della probabilità – Statistica classica Indipendenza stocastica – Esempi con i diagrammi di Venn B B A A P(A|B) = 1 P(B|A) = P(AB)/P(A) = P(B)/P(A) B A A B P(A|B) ≠ P(A) P(A|B) = P(B|A) = 0 Variabili aleatorie - Introduzione • • • Teoria della probabilità – Statistica classica In presenza di un processo aleatorio, si associa implicitamente un numero ad un risultato dell’esperienza Da un punto di vista matematico, è necessario sempre associare ad un esito di un esperimento aleatorio un numero che individui univocamente l’esito osservato. Associare ad un processo aleatorio (scalare) un numero reale è un procedimento che facciamo sempre in modo intuitivo Deformazione molla Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria Numero reale R 15 Teoria della probabilità – Statistica classica Teoria della probabilità – Esempi Variabili Aleatorie • Lancio del dado Lancio Moneta Y 1 Y 0 2 3 1 4 5 Esempi di Variabili aleatorie Discrete: il processo casuale può assumere valori al più in un insieme numerabile 6 Variabili aleatorie – Definizione • Teoria della probabilità – Statistica classica Una variabile aleatoria è una funzione che associa ad ogni esito di un processo aleatorio, un distinto numero reale Variabile aleatoria Y Insieme dei possibili risultati del processo aleatorio Insieme valori numerici che assume la funzione Y • In termini rigorosi Y : wW → y=Y(w) Y Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 16 Variabili aleatorie - Definizione Teoria della probabilità – Statistica classica • La variabile aleatoria Y è una funzione che assume valori tali che dipendono dal “caso” • Proprietà: – Y è definita nello spazio degli esperimenti ed assume valori nel codominio sottoinsieme dei numeri reali. – Qualunque sottoinsieme del codominio (evento) ha una probabilità ben definita di accadere Variabili aleatorie – Definizione • • Teoria della probabilità – Statistica classica Da notare che Y è una funzione (variabile aleatoria) mentre i valori assunti da tale funzione y=Y(), valori calcolabili quando l’esito dell’esperimento sia noto, sono numeri reali Nel seguito: Y y → → variabile aleatoria singolo esito osservato della VA Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 17 Funzioni distribuzione e densità di probabilità di una VA scalare • • • Teoria della probabilità – Statistica classica Definizione Secondo la definizione classica, la funzione di distribuzione emerge automaticamente dalle proprietà asintotiche di un campione di dimensioni infinite. Si può facilmente dimostrare che, per ogni variabile aleatoria Y, la funzione (reale di una variabile reale) distribuzione di probabilità (CDF: Cumulative Distribution Function) FY y PY y lim N N Y y N è sufficiente per definire la probabilità di un qualunque evento pertinente al processo aleatorio. Funzioni distribuzione e densità di probabilità di una VA scalare • Teoria della probabilità – Statistica classica Proprietà della distribuzione di probabilità FY y : y 0,1 • Inoltre: 1. FY(+ ) = 1, FY(-) = 0 2. FY è una funzione non decrescente 3. Se FY(y0)=0 allora FY(y)=0 se y <y0 4. P {Y >y1 } = 1- FY(y1) 5. FY è una funzione continua da destra: FY(y+) = FY(y) 6. P {y1 < Y y2} = FY(y2)-FY(y1) È facile dimostrare come tali proprietà derivino dagli assiomi di Kolmogoroff Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 18 Teoria della probabilità – Statistica classica Funzioni distribuzione e densità di probabilità di una VA scalare • Esempio di calcolo di probabilità di un evento dalla funzione di distribuzione. Calcolo probabilità che y cada in E FY(d) FY(c) FY(b) E = E1 E 2 P{y E} = FY(a) P{a < y b}+P{c < y < d} a =FY(b)-FY(a)+ FY(d)-FY(c) b c y E1 Funzioni distribuzione e densità di probabilità di una VA scalare • d E2 Teoria della probabilità – Statistica classica In molte circostanze, per la caratterizzazione delle variabili aleatorie è molto più utile ricorrere alla derivata della funzione di distribuzione y d fY y FY y ovvero FY y f u du dy - • • La funzione fY(y) prende il nome di funzione densità di probabilità (pdf) Proprietà della funzione densità di probabilità – fY(y) ≥ 0 sempre – f d 1 - – F y2 - F y1 y2 f d y1 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 19 Teoria della probabilità – Statistica classica Funzioni distribuzione e densità di probabilità di una VA scalare • Esempio di calcolo di probabilità di un evento dalla funzione densità di probabilità fY(y) P y E P y E1 P y E2 f y dy f y dy Y Y E1 E2 b d f y dy f y dy Y Y a c a b c d y E1 Funzioni distribuzione e densità di probabilità di una VA scalare E2 Teoria della probabilità – Statistica classica • Nei casi di maggiore interesse la variabile aleatoria Y è di tipo continuo, ovvero può assumere un qualunque valore lungo l’intervallo in cui è definito • In tal caso la funzione di distribuzione è una funzione di tipo continua e la probabilità che si verifichi un evento elementare è pari a zero: P Y lim F - F - 0 0 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 20 Teoria della probabilità – Statistica classica Distribuzione di probabilità Definizione media e varianza • • Spesso, è sufficiente per caratterizzare una variabile aleatoria (almeno in forma approssimata) conoscere solo alcune grandezze che sono calcolabili dalle funzioni densità di probabilità come ad esempio media e varianza. Il valore medio di una variabile aleatoria è dato da: Y y f y dy - • Tale valore prende anche il nome di VALORE ATTESO della variabile aleatoria Y ed è indicato con il simbolo Y=E(Y) • Se una distribuzione è simmetrica rispetto a y=c, (f(c+y)=f(c-y)) si vede che =c Teoria della probabilità – Statistica classica Variabili aleatorie: Altre misure del trend centrale Mediana di una variabile aleatoria Y Il valore m per cui: 1 FY m 2 Area = 0.5 0.5 Area = 0.5 0.4 0.3 fY(y) • • 0.2 0.1 0.0 0 Moda di una variabile aleatoria Y Il valore c per cui la funzione densità di probabilità assume valore massimo: 4 6 y 8 0.5 fY(y) max 0.4 0.3 f Y(y) • • 2 Mediana c: fY max 0.2 0.1 • Se la distribuzione è simmetrica, media e mediana coincidono. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 0.0 0 2 4 y 6 8 Moda 21 Variabili aleatorie: Altre misure del trend centrale • Teoria della probabilità – Statistica classica Nel caso generale di distribuzioni non simmetriche media, mediana e moda non coincidono Moda 0.5 Mediana 0.4 Media fY(y) 0.3 0.2 0.1 0.0 0 2 4 y 6 8 Variabili aleatorie: Indici di posizione e dispersione • Teoria della probabilità – Statistica classica Varianza: è una misura della dispersione della distribuzione intorno al suo valore atteso. Per definizione: s Y2 y j - Y fY y j 2 Y discreta j s Y2 y - Y fY y dy 2 Y continua - • • se esiste. La varianza è sempre non negativa Altra grandezza usata per valutare la dispersione della distribuzione è la deviazione standard (ha la stessa unità di misura della media) s Y s Y2 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 22 Teoria della probabilità – Statistica classica Distribuzione di probabilità Definizione media e varianza Qualitativamente: al diminuire della varianza, la pdf si restringe intorno al suo valore medio Diminuisce l’incertezza nel processo aleatorio • • 0.4 Area = 0.95 (1) 0.3 f(x) (2) 1.2 f(x) 0.8 0.2 s 12 s 22 0.1 0.4 0.0 0.0 -4 -3.2 -2 0 x 1.5 2 4 -4 -2 -1.1 x 0 0.4 2 4 L’intervallo di valori in cui gli esiti del processo aleatorio ricadono più frequentemente è molto più ampio nel primo caso che nel secondo Distribuzione di probabilità – Definizione momenti • Teoria della probabilità – Statistica classica Possiamo generalizzare media e varianza con i momenti: n mn y f y dy - momento n-esimo Mn n y - f y dy momento centrale n-esimo - • • La media è quindi il momento primo della distribuzione, mentre la varianza è il momento centrale di ordine 2. N.B. E’ possibile valutare i momenti di una distribuzione solo se essi sono definiti. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 23 Teoria della probabilità – Statistica classica Variabili aleatorie Funzioni continue - Esempi • Funzione di distribuzione uniforme 1 fY y b - a 0 se y a, b Dipende da due parametri: a e b se y a, b FY(y) pdf fY(y) cdf 1 1/(b-a) a b y a b Variabili aleatorie Funzioni continue - Esempi • • y Teoria della probabilità – Statistica classica Distribuzione uniforme È possibile calcolare la media e varianza di tale funzione di distribuzione: Questo risultato b poteva essere 1 ab Y y f y dy y dy intuitivo dato che la b-a 2 - a funzione è simmetrica rispetto al suo punto medio y - - 2 2 a - b ab 1 f y dy y dy 2 b a 12 a b s Y2 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 2 24 Teoria della probabilità – Statistica classica Variabili aleatorie Funzioni continue - Esempi • Distribuzione di tipo Esponenziale f y l exp -l y F y 1 - exp -l y fY(y) y0 La funzione ha un solo parametro: l FY(y) pdf y 1 l2 y Variabili aleatorie Funzioni continue - Esempi • l s2 cdf 1 l 1 Teoria della probabilità – Statistica classica Distribuzione di tipo Weibull yk f y ly exp - l k k y F y 1 - exp - l k k -1 y0 1 k k 1 Y 1 l k 2 2 k k 2 k 1 k s - l k k 2 Y Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria N.B. per k = 1 la Weibull degenera nella distribuzione di tipo esponenziale In letteratura la sua espressione non è univoca e si trovano altre formulazioni equivalenti 25 Variabili aleatorie Funzioni continue - Esempi • Teoria della probabilità – Statistica classica Distribuzione di tipo Weibull 2.5 2 k<1 y(y) 1.5 k=1 k>1 1 0.5 0 0 0.5 1 1.5 2 2.5 3 3.5 4 y Variabili aleatorie: Teorema limite centrale • Teoria della probabilità – Statistica classica Esiste un teorema di statistica che afferma: “Sia {Xi} una successione di variabili aleatorie indipendenti di media e varianza s2, indipendenti ed identicamente distribuite, allora la somma n Sn X i i 1 converge asintoticamente verso una variabile aleatoria normale (o altrimenti detta Gaussiana)” se le sorgenti di errore in una osservazione sono infinite ed indipendenti, la variabile aleatoria può essere assunta di tipo Normale Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 26 Carl Friedrich Gauss Teoria della probabilità – Statistica classica Gaussiana Funzione di distribuzione Gaussiana • Teoria della probabilità – Statistica classica Una variabile aleatoria (continua) si dice normale o Gaussiana se la sua densità di probabilità è: 1 y - Y 2 fY exp s Y2 2 s Y 2 1 • • • • La funzione è definita lungo tutto l’asse reale (ovvero un qualunque numero reale può essere un esito di una VA di tipo normale) Il grafico di tale funzione è una curva a campana simmetrica rispetto a y=Y La distribuzione dipende da due parametri, e s2. La maggior parte delle variabili aleatorie con cui si avrà a che fare sono Gaussiane (o comunque derivate dalla Gaussiana). Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 27 Funzione di distribuzione Gaussiana Teoria della probabilità – Statistica classica • La gaussiana è simmetrica rispetto al valore Y pertanto la media coincide con il valore Y • Si può verificare matematicamente che il parametro s2 definito nell’espressione coincide con la varianza della funzione di distribuzione. Funzione di distribuzione Gaussiana Teoria della probabilità – Statistica classica In figura sono riportate tre gaussiane con egual media e varianza 0.25, 0.5, 1 Varianza s2 = 0.25 1.5 1.25 1 0.75 Varianza s2 = 1 0.5 0.25 -2 • -1 1 2 3 4 La distribuzione di probabilità non è disponibile analiticamente ma esiste sotto forma tabulare. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 28 Funzione di distribuzione Gaussiana Teoria della probabilità – Statistica classica N.B. -s - s - s s s s 68.26% Questo è vero per ogni valore di e s nel caso della Gaussiana! 95.46% 99.73% Aree sottese dalla distribuzione normale Distribuzione normale (o di tipo Gaussiano) • • • • Teoria della probabilità – Statistica classica Al diminuire di s, i risultati dell’esperienza aleatoria assumono valori in intervalli sempre più piccoli L’incertezza diventa sempre più piccola Non esistono delle tabelle per calcolare le probabilità per i generici valori di e s. Vedremo nel seguito come è possibile ricondurre il calcolo della probabilità sempre alla VA di tipo standard Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 29 Variabili aleatorie: Distribuzioni – Riepilogo concetti • • Rappresentazione casualità tramite: – Introduzione concetto Variabile Aleatoria (VA) – Caratterizzazione proprietà VA tramite funzioni a valori reali Definizione funzioni di distribuzione e densità di probabilità – Proprietà – Esempi • VA di tipo Uniforme • Esponenziale • Weibull • Gaussiana (o Normale) – Teorema del limite centrale Funzioni di una variabile aleatoria. Esempio con VA discreta • • • Teoria della probabilità – Statistica classica Teoria della probabilità – Statistica classica Il seguente gioco assegna le seguenti vincite per un lancio di dadi: – 0.10 euro se esce un numero dispari – 0.20 euro se esce il 2 – 0.30 euro se esce il 4 – 0.40 euro se esce il 6 Quale è la probabilità che il giocatore vinca 0.2 euro nella singola giocata? La possibilità che si vinca una certa cifra con questo gioco è una variabile aleatoria? Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 30 Funzioni di una variabile aleatoria. Caso discreto • Teoria della probabilità – Statistica classica I possibili eventi elementari per la nuova VA vincita al gioco possono essere : 1 = {0.1, 0.2, 0.3, 0.4} • • Se il dado è regolare, è possibile ricavare quale è la probabilità che si verifichi il singolo evento. È possibile quindi definire una funzione di una variabile aleatoria. In questo caso associo ad ogni evento dello spazio campione un altro elemento di uno spazio 1 0.1 0.2 g y 0.3 0.4 0 euro y 1,3,5 euro y2 euro y4 euro y6 altrove fY(y) fZ(z) Funzioni di una variabile aleatoria. Esempio caso discreto 1/6 ½ Teoria della probabilità – Statistica classica 1/6 1 2 3 4 5 6 y Funzione densità di probabilità del lancio di dadi 0.1 0.2 0.3 0.4 z Funzione densità probabilità vincita di euro Z = g(Y) Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 31 Funzioni di una variabile aleatoria Y() g(Y) R Spazio campione Codominio della VA Y = Spazio campione della VA Y W Insieme dei risultati possibili Teoria della probabilità – Statistica classica Insieme dei valori che può assumere la Y 1 R 1 Codominio della funzione della VA = Spazio campione della VA Z=g(Y) Insieme dei valori che può assumere la Z = g(Y) Funzioni di una variabile aleatoria. Valore atteso Teoria della probabilità – Statistica classica • Funzione vincita al gioco dei dadi • Quanto si deve pagare per il singolo lancio affinché il gioco sia equo? • Dovrei pagare per il singolo lancio una quota che sia la media delle possibili vittorie (ovvero l’esito della nuova variabile aleatoria) per la singola esperienza. Nel caso in esame: • 1 1 1 1 1 0.10 0.20 0.30 0.40 2 6 6 6 5 • Il valore ottenuto si definisce il valore atteso della funzione g(y) e si indica con il simbolo E(g(y)) Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 32 Funzioni di una variabile aleatoria. Valore atteso • • Teoria della probabilità – Statistica classica Definizione: Sia Y una variabile aleatoria e g( · ) una funzione misurabile, si definisce quindi media (o valore atteso) di g(Y) lo scalare: E g Y g y j f y j Caso discreto j E g Y g y f y dy Caso continuo - • N.B. La g(y) deve essere definita per ogni Y per cui la funzione pdf fY(y) non è nulla. Funzioni di una variabile aleatoria – Valore atteso • Teoria della probabilità – Statistica classica Esempio – Si consideri la seguente trasformazione g Y Y - Y 2 • È immediato verificare che il valore atteso di tale funzione coincide con la varianza della VA Y: - - E g Y g y fY y dy y - Y fY y dy sY2 2 66 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 33 Funzioni di una variabile aleatoria Proprietà del valore atteso • Teoria della probabilità – Statistica classica Altre proprietà del valore atteso: E c c E c g Y c E g Y E c1 g1 Y c2 g 2 Y c1 E g1 Y c2 E g 2 Y Funzioni di una variabile aleatoria. Determinazione della media • • Teoria della probabilità – Statistica classica Data una variabile aleatoria Y ed una trasformazione g(y) formiamo la nuova Variabile Aleatoria Z=g(Y). La media di Z è Z E Z z f z dz Z - • • • Se è nota la distribuzione di Y non è necessario conoscere la fZ per determinare la media di Z. Teorema della media: Siano Y e Z due variabili aleatorie tali che Z = g(Y), è valida la seguente proprietà (N.B. se esistono gli integrali presi in considerazione) Z EZ Z z f Z z dz EY g Y - Valutato in Z Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria g ( y) f y dy Y - Valutato in Y 34 Trasformazioni affini di una Variabile Aleatoria • Definizione trasformazione affine: Z = g(Y)=aY+b • a,b In genere ci si riferisce a tale trasformazione come lineare (ma rigorosamente non lo è dato che non rispetta il principio di sovrapposizione degli effetti) Trasformazioni affini– Determinazione media • • Teoria della probabilità – Statistica classica Teoria della probabilità – Statistica classica Problema: Non si conosce di che tipo di variabile aleatoria sia Y ma ne conosciamo media e varianza, è possibile determinare la media e la varianza di Z? Se g(Y) è una trasformazione affine: Z EZ Z Z = g(Y)=aY+b EY aY b a EY Y b a Y b Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 35 Trasformazioni affini variabile aleatoria – Calcolo della varianza • Teoria della probabilità – Statistica classica Anche per la varianza è possibile determinare una espressione analitica a E Y - a 2 2 s 2Z EZ Z 2 - 2Z EY a Y b - a Y b 2 2 2 Y 2 Y EY 2 a b Y - 2abY a 2sY2 Funzioni di una variabile aleatoria Calcolo della varianza • • Teoria della probabilità – Statistica classica Anche detta legge di propagazione degli errori. Sia data una legge Z = g(Y), si intende calcolare la varianza della nuova VA 2 s 2 Z E Z - Z 2 2 E g Y - Z E g Y - Z2 2 E g Y - E 2 g Y Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 36 Funzioni di una variabile aleatoria. Determinazione di media e varianza Teoria della probabilità – Statistica classica • Invece se la trasformazione è non lineare si possono solo stimare in modo approssimato la media e la varianza di Z • Si linearizza g intorno a Y: g y g Y • dg dy y - Y Y 1 d 2g 2 dy 2 y - Y 2 Y Troncando al primo ordine: dg g y f y dy Y - - g Y dy Z E Z y - Y fY y dy g Y Y Funzioni di una variabile aleatoria. Determinazione di media e varianza • Troncando al secondo ordine: Z g Y • Teoria della probabilità – Statistica classica 1 d 2g 2 dy 2 s Y2 Y Per la varianza dg s dy 2 2 Z Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria Y 2 sY 37 Teoria della probabilità – Statistica classica Funzioni di variabile aleatoria. Caratterizzazione completa VA. • Ci si può domandare come sia distribuita Z. Procediamo per gradi e supponiamo per semplicità che la funzione g sia monotona in modo da avere una corrispondenza biunivoca tra Y e Z. Dominio z y(z) z P{z≤Z≤z+dz}=y(z)dz z=g(y) dz P{y≤Y ≤y+dy}=y(y)dy dy y Dominio y y(y) P{y≤Y ≤y+dy}=P{z≤Z≤z+dz}= y(y)dy=y(z)dz Teoria della probabilità – Statistica classica Funzioni di variabile aleatoria. Caratterizzazione completa VA. • z e dz non sono qualunque ma corrispondono a y e dy z g y -1 y g z • Obiettivo: conoscere fZ(z) y dy P y Y y dy f d f y dy Y Y y P z Z z dz f Z z dz f Z z dz f Y y dy Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria f Z z f Y y fY g -1 z dz dz dy dy y g -1 z 38 Funzioni di variabile aleatoria. Caratterizzazione completa VA. • Teoria della probabilità – Statistica classica Esempio: Trasformazione affine Z=aY+b • Da cui: g’(y)=a z -b a • L’equazione z=ay+b ha una unica soluzione: y • Quindi: • Se la funzione di trasformazione è affine non cambia il tipo di variabile aleatoria. Questo è vero qualunque sia Y. f Z z 1 z -b fY a a Teoria della probabilità – Statistica classica • Da cui, esplicitando la dipendenza inversa di y da z 2 z -b - Y 1 1 a 1 f Z z exp - 2 a 2 s Y 2 sY 2 1 z - b - aY 1 exp a 2s Y2 2 a s y 2 aY b Z 2 2 2 s Z a sY La nuova VA è ancora una Gaussiana di media Z=a+bY e varianza sZ2=a2sY2 1 z - z 2 exp 2 2 s Z 2 sZ 1 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 39 Funzioni di VA Gaussiane Trasformazioni lineari • Data una variabile aleatoria Y (di tipo gaussiano) di media varianza • Si consideri la seguente trasformazione lineare: Y - Y sY Di che tipo è la nuova variabile aleatoria? Quale è la media e la varianza della nuova variabile? È facile verificare che: Z 0 s Z2 1 Gaussiana di tipo standard Funzioni di VA Gaussiane Trasformazioni lineari • • • Y e sY2 Z • • • Teoria della probabilità – Statistica classica Teoria della probabilità – Statistica classica Nota la funzione di distribuzione standard è possibile ricavare le proprietà di una qualsiasi distribuzione gaussiana In particolare, è possibile calcolare la probabilità che si verifichi un dato evento per un generico processo, con media e varianza note. Questo è possibile sapendo solo i valori della distribuzione di tipo standard. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 40 Teoria della probabilità – Statistica classica Calcolo probabilità per una Gaussiana generica z= (y – ) s = 5; s2 = 10 -5 0 5 = 10; s2 = 0.5 10 15 -5 0 5 8 10 15 Normale standard -5 -2.83 -1.58 0 1.58 5 Calcolo probabilità per una Gaussiana generica 10 15 Teoria della probabilità – Statistica classica • Esempio: calcolare quale è la probabilità che si verifichi un evento appartenente all’intervallo [0,5] per la variabile aleatoria di media 3 e deviazione standard 2: • Si deve calcolare quale è la probabilità che la variabile aleatoria di tipo standard assuma un valore nell’intervallo corrispondente. 82 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 41 Calcolo probabilità per una Gaussiana generica • Teoria della probabilità – Statistica classica Dobbiamo calcolare la probabilità: P 0 X 5 • Gli estremi dell’intervallo corrispondente per la distribuzione di tipo standard possono essere facilmente calcolati x1 - X 0-3 sX 2 x - X 5 - 3 z2 2 1 sX 2 z1 P 0 X 5 P -1.5 Z 1 0.8413 - 0.0668 77.4% Calcolo probabilità per una Gaussiana generica • • • Teoria della probabilità – Statistica classica Esercizi Sia Y una variabile aleatoria di tipo normale, di media = 16 e varianza s2 = 25 Calcolare: – P(Y > 20) – P(20 < Y < 25) – P(Y < 10) – P(12 < Y < 24) Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 42 Funzioni di VA Gaussiane – Esempio trasformazioni non lineari • • Teoria della probabilità – Statistica classica Esempio: Trasformazione non lineari Data una variabile aleatoria Y di tipo normale, descritta dalla seguente distribuzione 1 y - Y 2 fY exp s Y2 2 s Y 2 1 • si consideri la seguente trasformazione non lineare Z eY • • Si intende calcolare la distribuzione della variabile aleatoria Z. Innanzitutto quali valori può assumere la VA Z? Funzioni di VA Gaussiane – Esempio trasformazioni non lineari Teoria della probabilità – Statistica classica • Una variabile aleatoria di tipo gaussiano può assumere un qualunque valore reale. – Il suo esponenziale ovviamente no – Questa indicazione è già sufficiente per stabilire che l’esponenziale di una variabile aleatoria di tipo Gaussiano non è più dello stesso tipo. • Questa proprietà è vera per qualunque tipo di variabile aleatoria: una trasformazione non lineare implica una trasformazione del tipo di variabile aleatoria. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 43 Teoria della probabilità – Statistica classica Funzioni di VA Gaussiane – Esempio trasformazioni non lineari • • Come visto precedentemente Si può facilmente vedere che g'y z e y g -1 z logz • fY y dz dy y log z f Y g -1 z g'y z z z Da cui f Z z • • f Z z 1 log z - Y 2 exp s Y2 2 sY z 2 1 z 0 Ed è uguale a zero per z < 0. Tale distribuzione prende il nome di distribuzione Lognormale Teoria della probabilità – Statistica classica Funzioni di VA Gaussiane: Distribuzione Lognormale • Grafico e proprietà della distribuzione Lognormale 0.3 f(z) 0.2 0.1 0.0 0 2 4 6 8 10 z • È un tipico esempio di distribuzione asimmetrica s2 E Z Z exp Y Y 2 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria s Z2 exps Y2 - 1 exp2 Y s Y2 44 Funzioni di una variabile aleatoria Trasformazioni non biunivoche • Teoria della probabilità – Statistica classica Nel caso di trasformazione non biunivoca le cose si complicano dal punto di vista operativo, ma concettualmente il problema non è molto diverso g’(y3) Z=g(Y) g’(y2) g’(y1) z+dz z y1 y1+dy1 y2 y2+dy2 y3 y3+dy3 Funzioni di una variabile aleatoria Trasformazioni non biunivoche • Dalla corrispondenza degli eventi riguardanti la VA Z e la VA Y è facile dimostrare che fZ z • Teoria della probabilità – Statistica classica fY y1 g ' y1 fY y2 g ' y2 ... fY yn g ' yn Per i valori di z per i quali l’equazione Z = g(Y) ha le soluzioni y1,y2,…,yn e fZ z 0 • Per i valori di z per cui l’equazione z=g(y) non ammette soluzioni Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 45 Variabili Aleatorie Vettoriali • • Teoria della probabilità – Statistica classica Spesso negli esperimenti si osservano molte quantità contemporaneamente. E’ evidente che è possibile generalizzare il concetto di variabile aleatoria introducendo la VA vettoriale: Y Y1 , Y2 , ..., YN T • Una VA vettoriale ad N componenti è rappresentabile in uno spazio ad N dimensioni. • Se N=2 gli eventi sono sottoinsiemi del piano. Variabili Aleatorie Vettoriali • • Teoria della probabilità – Statistica classica Se in un esperimento stocastico osserviamo 2 quantità dobbiamo associare all’esperimento due variabili aleatorie: Y1 ed Y2. Ogni esecuzione dell’esperimento fornisce una coppia di numeri (y1 ed y2) Y2 b2 a2 a1 • b1 Y1 Se si conosce la probabilità: P a1 Y1 b1 , a2 Y2 b2 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 46 VA vettoriali – Funzione densità di probabilità congiunta • Teoria della probabilità – Statistica classica La distribuzione di probabilità della VA vettoriale Y è: F y1 , y2 P Y1 y1 , Y2 y2 P a1 Y1 b1 , a2 Y2 b2 F b1 , b2 - F a1 , b2 - F b1 , a2 F a1 , a2 • La funzione densità di probabilità congiunta fY(y1,y2) è tale che: y1 y2 F y1 , y2 f w, v dwdv - - b2 b1 P a1 Y1 b1 , a2 Y2 b2 f w, v dwdv a2 a1 f w, v dwdv 1 - - V.A. VETTORIALI – Distribuzioni Marginali • Teoria della probabilità – Statistica classica Ad ogni distribuzione bidimensionale possiamo associare 2 distribuzioni monodimensionali che sono dette distribuzioni marginali: y1 FY1 y1 P Y1 y1 , - Y2 f w, v dwdv - - • Analogamente, si può osservare: fY1 y1 f w, v dv - fY2 y 2 f w, v dw - • Le distribuzioni marginali fY1 e fY2 rappresentano le probabilità che si verifichino, rispettivamente, gli eventi Y1 e Y2, indipendentemente dall’esito dell’altra componente Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 47 VA vettoriali – Funzione densità di probabilità congiunta • Teoria della probabilità – Statistica classica Esempi di pdf bidimensionali fY(y1,y2) Rappresentazione tridimensionale Curve di isolivello V.A. VETTORIALI – Distribuzioni Marginali • • • Teoria della probabilità – Statistica classica La F della VA vettoriale si dice congiunta. Nel caso generico Ndimensionale si ha una F congiunta ed N marginali. Importante: Dalla funzione densità di probabilità (distribuzione) congiunta è sempre possibile risalire alle funzioni densità di probabilità (distribuzioni) marginali, mentre non è in genere vero il contrario Distribuzione congiunta Distribuzioni marginali 96 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 48 V.A. VETTORIALI – Distribuzioni Marginali • Teoria della probabilità – Statistica classica Distribuzioni marginali Esempio fY1(y1) fY2(y2) V.A. INDIPENDENTI: Definizione • Teoria della probabilità – Statistica classica Due VA Y1 ed Y2 di congiunta F(y1, y2) si dicono indipendenti se: F y1 , y2 Fy1 y1 Fy2 y2 f y1 , y2 f y1 y1 f y2 y2 • In tal caso, per ogni coppia di eventi {a1<Y1b1} e {a2<Y2b2} vale: P a1 Y1 b1 , a2 Y2 b2 P a1 Y1 b1 P a2 Y2 b2 cioè se e solo se i due eventi sono indipendenti. Ovviamente il discorso è generalizzabile ad N dimensioni. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 49 VA Vettoriali – Funzione densità di probabilità condizionata • • Teoria della probabilità – Statistica classica Concetto di funzione densità di probabilità condizionata. Per semplicità si assuma Y 2 un vettore di variabili aleatorie tale che: Y1 Y Y2 Y1 R, Y2 R – Probabilità di Y1 condizionata dalla componente Y2: fy 1 y y f y , y 1 Y y2 1 2 f Y2 y2 2 – Probabilità di Y2 condizionata dalla componente Y1: fy y y f y , y 1 Y 2 y1 2 1 2 f y1 y1 VA Vettoriali – Funzione densità di probabilità condizionata • Teoria della probabilità – Statistica classica Caso particolare: VA vettoriali bidimensionali Y Y 1 Y2 Y1 , Y2 R fY 1 Y 2 y1 y2 f Y y1 , y2 ; f y y2 f y 2 y2 f Y y1 , y2 dy1 0 f Y y1 , y2 ; f y y1 f y1 y1 f Y y1 , y2 dy2 0 2 fY 2 Y 1 y2 y1 1 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria - - 50 Teoria della probabilità – Statistica classica VA Vettoriali – Funzione densità di probabilità condizionata • Esempi di probabilità condizionate: fY Y a y1 y2 a 1 2 f Y y1 , y2 a fY y2 a 2 y2=a fY 2 Y1 b y 2 y1 b f Y y1 b, y2 fY y1 b 1 y1=b VA Vettoriali – Funzione densità di probabilità condizionata • Teoria della probabilità – Statistica classica Da notare che nel caso di variabili aleatorie Y1 e Y2 indipendenti: f Y y1 , y2 fY y1 fY y2 1 • 2 si ha: fY 1 Y 2 y1 y2 fY y1 1 fY 2 Y 1 y2 y1 fY y2 2 • Quando due VA sono indipendenti qualunque evento dell’una non è condizionato dagli eventi dell’altra. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 51 VA Vettoriali – Definizione VA indipendenti • • Teoria della probabilità – Statistica classica Esempio 2D Due VA Y1 ed Y2 di congiunta F(y1, y2) si dicono indipendenti se: F y1 , y2 Fy1 y1 Fy2 y2 f y1 , y2 f y1 y1 f y2 y2 • In tal caso: Distribuzione congiunta Distribuzioni marginali Variabili Aleatorie Vettoriali • Teoria della probabilità – Statistica classica Caso Gaussiano: Y1 ~ N 1 , s12 Y2 ~ N 2 , s 22 2 1 y1 - 1 1 exp s12 2 s1 2 2 1 y2 - 2 1 f Y2 exp s 22 2 s 2 2 f Y1 • Se le due VA sono indipendenti allora la congiunta: fY • 1 y1 - 1 2 1 y2 - 2 2 exp 2 s 1s 2 s 12 2 s 22 2 1 NB: la congiunta contiene 4 parametri Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 52 Teoria della probabilità – Statistica classica Variabili aleatorie vettoriali Caso coppia di VA Gaussiane • Una coppia di variabili aleatorie Y = (Y1, Y2) si dicono congiuntamente gaussiane (o normali) e si denotano con il simbolo Y ~ N μ, V • se la loro pdf congiunta assume la seguente espressione: y - μ T V -1 y - μ 1 fY y exp 2 2 det V I parametri di tale pdf sono: – Il vettore μ è il vettore delle medie – La matrice V , simmetrica, definita positiva, è la matrice di covarianza • V s 12 s 12 s 12 s 22 Variabili aleatorie vettoriali Caso Gaussiano • Gli elementi della matrice di covarianza sono: E Y - s 12 E Y1 - 1 2 s 2 2 2 2 2 s 12 E Y1 - 1 Y2 - 2 VA Y1 e Y2 indipendenti • • Teoria della probabilità – Statistica classica varianza della VA Y1 varianza della VA Y2 covarianza delle VA Y1 e Y2 La covarianza è nulla Non è vero generalmente il contrario (ma per gaussiane si) Per convincersi che la matrice di covarianza V caratterizza la dispersione dei dati si può vedere che, per una coppia di VA congiuntamente gaussiane le linee di isolivello della pdf hanno equazione: (y-)TV-1(y-) = cost Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 53 Teoria della probabilità – Statistica classica Variabili aleatorie vettoriali Coefficiente di correlazione • • Dalla matrice di covarianza è possibile determinare la correlazione tra due variabili aleatorie. Siano date due variabili aleatorie Y1 e Y2. Il coefficiente di correlazione è definito come: covY1 , Y2 s 12 V Y1 V Y2 s 1s 2 r12 • Per come è definito: - 1 r12 1 Teoria della probabilità – Statistica classica Variabili aleatorie vettoriali Caso Gaussiano VA Indipendenti 3 2 1 0.1 0.075 0.05 0.025 0 0 2 0 -1 -2 0 -2 -2 2 -3 -3 V 1 0 0 2 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria μ -2 -1 0 1 2 3 0 0 54 Teoria della probabilità – Statistica classica Variabili Aleatorie Vettoriali di tipo Normale – VA indipendenti • Nel caso di variabili aleatorie di tipo Gaussiano indipendenti: Y1 ~ N 1 , s 12 Y2 ~ N 2 , s 22 1 y1 - 1 2 1 fY1 exp 2 2 s 1 2 s1 1 y2 - 2 2 exp s 22 2 s 2 2 1 fY2 • La congiunta assume la seguente forma: f Y fY 1 f Y 2 • 1 y1 - 1 2 1 y2 - 2 2 exp 2 2 s 1s 2 2 s 22 2 s1 1 NB: la congiunta contiene 4 parametri Teoria della probabilità – Statistica classica Variabili aleatorie vettoriali Caso Gaussiano VA Indipendenti • Rappresentazione distribuzioni marginali e probabilità condizionate fY1 =0 s2=1 -3 -2 -1 y1 0 y1 0 1 2 3 fY y1 | y2 1.5 1 0, s 12 1 -3 -2 -1 3 fY2 y1 0 1 2 3 2 1 -3 -2 -1 1 2 3 fY y1 | y2 -1.5 1 0, s 12 1 0 -1 =0 s2=2 La probabilità dell’evento y1 non cambia con il valore di y2 -2 -3 -3 -2 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria -1 0 1 2 3 55 Teoria della probabilità – Statistica classica Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti 2 1 0.2 0 2 0.1 0 0 -1 -2 0 -2 -2 2 -2 V 1 2 μ -1 0 1 0 0 Teoria della probabilità – Statistica classica Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti • 2 Rappresentazione distribuzioni marginali e probabilità condizionate fY1 =0 s2=1 -3 -3 -2 -1 y1 0 1 2 3 -2 -1 0 1 2 3 fY y1 | y2 1.5 1 1.2, s 12 0.36 fY2 -3 =0 s2=1 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria -2 -1 0 1 2 3 fY y1 | y2 -1.5 1 -1.2, s 12 0.36 56 Teoria della probabilità – Statistica classica Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti • Nel caso di correlazione |r| = 1 la distribuzione degenera in una retta. 3 2 1 0.4 0 2 0.2 0 -1 0 -2 -2 0 -2 2 -3 -3 -2 -1 0 1 2 3 Domanda: in questo caso come si comportano le marginali e le probabilità condizionate? Variabili Aleatorie di tipo Normale Vettoriali – Caso Generico • Nel caso generico di n componenti la variabile aleatoria vettoriale assume la forma: f Y y • • • • Teoria della probabilità – Statistica classica 1 n/2 2 1 T exp - y - μ V -1 y - μ det V 2 I parametri di tale pdf sono raccolti nel vettore e nella matrice V: = (1, , ... , n); V, matrice (n × n) definita positiva, è la matrice di covarianza. Ancora, se le VA componenti sono indipendenti, la matrice V è diagonale perché tutte le covarianze sono nulle. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 57 Trasformazioni di Variabili aleatorie Vettoriali • • Teoria della probabilità – Statistica classica I concetti esposti per le trasformazioni di variabili scalari possono essere estesi al caso vettoriale. Si consideri la generica trasformazione non lineare: Y Y1 Y2 Z g1 Y1 , Y2 g 2 Y1 , Y2 o, equivalentemente Z g Y • Vogliamo determinare la densità di probabilità congiunta di Z. Trasformazioni di Variabili aleatorie Vettoriali • Teoria della probabilità – Statistica classica Il ruolo della derivata nella trasformazione è assunto dallo Jacobiano, ma i passaggi sono concettualmente analoghi al caso scalare: z1 g1 y1 , y2 z2 g 2 y1 , y2 y1i , y2i Radici del sistema Nrad fZ i 1 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria fY y1i , y2i Jy 1i , y2i J z1 y1 z1 y2 z2 y1 z2 y2 58 Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare • Se si usa una trasformazione lineare: Z n 1 • Teoria della probabilità – Statistica classica aT n n Y n 1 b n 1 La conoscenza della sola media Y e della matrice di covarianza VY della VA Y permette la determinazione della media Z e della matrice di covarianza della VA VZ μ Z aT μ Z b VZ a T VY a • Come nel caso scalare risulta inoltre che solo le trasformazioni lineari conservano il tipo di Variabile aleatoria Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare • Nel caso lineare è possibile anche analizzare trasformazioni di VA vettoriali di dimensioni differenti, per esempio da una VA vettoriale Y di dimensioni (n × 1) ad una W di dimensioni (p × 1) W p 1 • Teoria della probabilità – Statistica classica cT p n Y n 1 d p 1 Generalizzando le relazioni precedenti si ottiene: μ W cT μ Z d VW cT VZ c Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 59 Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare • • Teoria della probabilità – Statistica classica Un caso particolare di interesse è quando p = 1. In tal caso si ottiene, almeno per VA vettoriali indipendenti: W c1Y 1 d c2Y 2 d ... cn Yn d 2 2 sW c12 sY2 1 c22 sY2 2 ... cn2 sYn • Per esempio, nel caso W = Y1 + Y2+ … +Yn W Y 1 Y 2 ... Yn s W2 s Y21 s Y2 2 ... s Yn2 Trasformazioni di Variabili aleatorie Vettoriali Teoria della probabilità – Statistica classica • Particolare importanza hanno le trasformazioni di una VA vettoriale Y in una VA scalare (caso m=1) • Sono, ad esempio, di uso molto comune alcune VA scalari che derivano (attraverso trasformazioni non lineari) da variabili aleatorie vettoriali gaussiane Y ad n componenti, con vettore delle medie = 0 e matrice di covarianza V = I. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 60 Teoria della probabilità – Statistica classica Variabili Aleatorie derivate dalla gaussiana - Variabile • Si consideri una VA vettoriale ad n componenti Y = (Y1, Y2, …, Yn) Y~N(0,I) • Le componenti sono quindi tutte indipendenti e gaussiane di media nulla e varianza unitaria. La variabile aleatoria scalare Z Y12 Y22 ... Yn2 • prende il nome di variabile aleatoria 2 ad n gradi di libertà. • Tale variabile aleatoria è caratterizzata completamente da un solo parametro, il numeri di gradi di libertà n. Variabile aleatoria • Teoria della probabilità – Statistica classica Funzione densità di probabilità n n n n 0.5 = = = = 1 2 4 6 0.4 0.3 0.2 0.1 0 0 1 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 2 3 4 5 6 7 8 9 10 61 Variabile aleatoria • Teoria della probabilità – Statistica classica Proprietà di una variabile aleatoria 2 ad n gradi di libertà E n2 n s 2 2n n-2 y 2 2 K y e n 0 2 n • y0 y0 Il massimo si ha per y = n-2. Da osservare che per n → ∞ la distribuzione 2 tende ad una gaussiana. Kn 1 n 2 2 n / 2 VA derivate dalla gaussiana Distribuzione t-Student • • Teoria della probabilità – Statistica classica Sia Y una variabile aleatoria gaussiana di media 0 e varianza unitaria, e Z una 2 ad r gradi di libertà Inoltre Y e Z siano tra loro indipendenti. La variabile aleatoria data da: T Y r2 r è una distribuzione t di Student ad r gradi di libertà. Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 62 Teoria della probabilità – Statistica classica VA derivate dalla Gaussiana Distribuzione t-Student • In figura sono mostrate le funzioni densità per 1,3,6 gradi di libertà. n =2 n=4 Distribuzione Standard 0.4 William Sealy Gosset “creatore” della t di Student fY(y) 0.3 n 0.2 0.1 0.0 -4 • • -2 0 2 y 4 La T è simmetrica rispetto a y=0 Per r →+∞ la t di Student tende ad una gaussiana di tipo standard. Teoria della probabilità – Statistica classica VA derivate dalla Gaussiana Distribuzione t-Student • Espressione analitica della t di Student fr y K 1 y2 1 r • • • r 1 , 2 yR 1 2 K 2 Essendo K una costante di normalizzazione. Proprietà: Dipende da un solo parametro il numero intero r Media: Y 0 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 2 Varianza: s Y -2 2 63 Teoria della probabilità – Statistica classica VA derivate dalla Gaussiana La distribuzione F di Fisher • Se le variabili aleatorie Y e W sono VA di tipo 2 rispettivamente ad m ed n gradi di libertà, la VA scalare Z Y Z W m n è una VA di tipo F di Fisher ad (m,n) gradi di libertà. • La VA ha due parametri, m ed n. VA derivate dalla Gaussiana La distribuzione F di Fisher • Teoria della probabilità – Statistica classica Espressione analitica della F di Fisher mn m- 2 2 n n / 2 y 2 m n m n m m 2 1 y 2 2 n fY y; m, n 0 Media: Y n , n-2 Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria y0 m, n N altrove m n - 22n mn - 4 n - 2 2 n 2 2 Varianza: s Y 2 64 VA derivate dalla Gaussiana La distribuzione F di Fisher • Teoria della probabilità – Statistica classica Grafici della F di Fisher al variare dei gradi di libertà 1.2 (10, 4) g.d.l. (10, 10) g.d.l 1.0 fY(y) (10, 50) g.d.l. (10, Infinity) g.d.l. 0.8 0.6 0.4 0.2 0.0 0.0 0.5 1.0 1.5 y Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 2.0 2.5 3.0 3.5 4.0 Sir Ronald Aylmer Fisher 1890 - 1962 65