Statistica-UBG’0304 A.Fassò Statistica Prof. Alessandro Fassò ingegneria.unibg.it/fasso CdL: Ing.Informatica e Meccanica Parte 1a - Probabilità generale aa 2003/2004 p.1 Statistica-UBG’0304 A.Fassò Introduzione Decisioni in condizioni di incertezza Dati empirici Teoria Conclusioni operative Conoscenza e consapevolezza dell’errore Identificazione e Quantificazione dell’incertezza Modelli statistici Parte 1a - Probabilità generale p.2 Statistica-UBG’0304 A.Fassò Articolazione della Materia - Statistica Descrittiva - Calcolo delle Probabilità - Inferenza Statistica Parte 1a - Probabilità generale p.3 Statistica-UBG’0304 A.Fassò Costruzione di modelli Sintesi di teoria, dati empirici e conclusioni operative di interesse. Tecniche di costruzione del modello (identificazione e stima) Capacità (auto)-critica: validazione del modello Parte 1a - Probabilità generale p.4 Statistica-UBG’0304 A.Fassò Applicazioni Ambito Meccanico-Produttivo 1. Monitoraggio e Controllo: della Qualità, della Produzione, della Sicurezza 2. Problemi Sperimentali 3. Misure 4. Teoria delle code (Ricerca Operativa, Logistica, Impianti) 5. Sicurezza 6. Simulazione (SA-demo) 7. Affidabilità Parte 1a - Probabilità generale p.5 Statistica-UBG’0304 A.Fassò Ambito Informatico 1. Code e Reti a. ES: Dimensionamento buffer di un server Tempi di attesa, probabilità di overflow, ... (Modelli Stocastici) 2. 3. Sicurezza e Difesa da Intrusioni (demo) a. ES: Numero eventi e EWMA (Statistica Industriale) b. ES: Sequenze Markoviane di eventi (Modelli Stocastici) Data Mining Parte 1a - Probabilità generale p.6 Statistica-UBG’0304 A.Fassò Problemi di Previsione 1. Economico-Finanziario 2. Ambientale 3. Automazione - Controllo predittivo Problemi di Monitoraggio 1. Qualità, Produzione, Sicurezza 2. Servizi 3. Ambiente 4. Portafoglio (finanza) Parte 1a - Probabilità generale p.7 Statistica-UBG’0304 A.Fassò Materie Collegate Corsi avanzati di Statistica Statistica Industriale (5cfu), Prof. I.Negri Statistica II (modelli dinamici) (5cfu), Prof. R.Colombi Processi Stocastici (5cfu), Prof. A.Fassò Modelli Stocastici (5cfu), Prof. A.Fassò Parte 1a - Probabilità generale p.8 Statistica-UBG’0304 A.Fassò Altri Corsi che utilizzano concetti di Statistica Automatica e Identificazione di Modelli e Analisi dati (LS) Impianti Informatici Gestione Industriale della Qualità Laboratorio di Fisica Organizzazione della produzione Impianti Parte 1a - Probabilità generale p.9 Statistica-UBG’0304 A.Fassò Lezioni ed Esami 6h di lezione ed esercitazione alla settimana (mar,mer e gio) Mercoledì: Esercizi e complementi di Calcolo delle Probabilità, Dott.ssa Nicolis 2h di laboratorio alla settimana in ambiente Matlab, mer.pom., Ing. Locatelli e Dott.ssa Nicolis Ricevimento: giovedì h 10.00-11.30, oppure su appuntamento [email protected] E-learning: questo materiale: ingegneria.unibg.it/fasso esercizi, auto-valutazione, temi d’esame ed altro: elearning2.unibg.it/ilias Parte 1a - Probabilità generale p.10 Statistica-UBG’0304 A.Fassò Modalità d’esame: L’esame consta di una parte scritta ed una orale. La parte scritta può essere superata con 2 verifiche intermedie nell’anno 1. Calcolo delle Probabilità (15-21 aprile) 2. Inferenza Statistica (14-19 giugno) oppure con uno scritto finale negli appelli ordinari. La parte orale, negli appelli ordinari, consta di una o più domande riguardanti la teoria, la discussione e/o la soluzione di esercizi e problemi anche con l’ausilio di Matlab usando gli strumenti acquisiti nel laboratorio. Parte 1a - Probabilità generale p.11 Statistica-UBG’0304 A.Fassò Preparazione dell’Esame e Bibliografia 1. Frequenza 2. Guida alle lezioni e materiale su internet (ingegneria.unibg.it/fasso) 3. D.C. Montgomery, G.C. Runger & N.F. Hubele 2004: Statistica per Ingegneria, Egea. 4. S. Ross 2003 Probabilità e Statistica per l’Ingegneria e le Scienze, Apogeo 5. Ilia Negri (2001): Lezioni di calcolo delle probabilita’ ed esercizi svolti, editrice CUSL, Milano. 6. elearning2.unibg.it/ilias. Parte 1a - Probabilità generale p.12 Statistica-UBG’0304 A.Fassò Calcolo delle Probabilità Richiami di Insiemistica Insiemi A, B, . . Elementi a, b, x, y, . . . Definizione per elencazione: A a, b, c, d A a 1 , a 2 , . . . , a k Definizione tramite una proprietà: A x tali che .... Parte 1a - Probabilità generale x | .... p.13 Statistica-UBG’0304 A.Fassò Esempi (insiemi numerici) 1. Insiemi finiti B 2, 4, 6, 8, 10 2. numeri pari minori o uguali a 10 x | x 2i, i 1, . . . , 5 Insiemi numerabili A interi numerabili positivi 1, 2, . . . 3. Insiemi continui limitati (es: intervalli o unione di intervalli) A x |a x b 4. Insiemi continui illimitati (es: semiretta) x |x 0 Parte 1a - Probabilità generale p.14 Statistica-UBG’0304 A.Fassò Relazioni fra Insiemi Appartenenza Uguaglianza Inclusione Esempi a A oppure a A AB A B oppure B A 1. B 2, 4, 6, 8, 10 2. B 3. A 1 x | 4. A 2 x |0 x 2 B, 3 B numeri interi 2 x Parte 1a - Probabilità generale p.15 Statistica-UBG’0304 A.Fassò Note A B, B A A B 1. Uguaglianza e Inclusione 2. Proprietà transitiva dell’inclusione Parte 1a - Probabilità generale A B, B C A C p.16 Statistica-UBG’0304 A.Fassò Spazio e Insieme vuoto Spazio ambiente o Campionario: Insieme vuoto: A Insieme delle parti: A Parte 1a - Probabilità generale A p.17 Statistica-UBG’0304 A.Fassò Operazioni Unione A BC x |x B oppure x C Intersezione A BC x |x B e x C A B A B AB Differenza A BC x |x B e x C Complemento o Negazione A nonB B B x |x B Parte 1a - Probabilità generale p.18 Statistica-UBG’0304 A.Fassò Regole di De Morgan A B nonĀ B A B nonĀ B Defnizione di Insiemi disgiunti AB Parte 1a - Probabilità generale p.19 Statistica-UBG’0304 A.Fassò Partizione di A1, A2, . . . , Ak disgiunti A 1 A 2 . . . A k kj1 A j Scomposizione di B B B A 1 B A 2 . . . B A k Parte 1a - Probabilità generale p.20 Statistica-UBG’0304 A.Fassò Esperimenti Casuali Esperimento deterministico e risultati incerti insieme dei possibili risultati sperimentali Esempio: lancio di un dado f 1 , f 2 , . . . , f 6 Eventi elementari Eventi Eventi ed Insiemi A Parte 1a - Probabilità generale p.21 Statistica-UBG’0304 A.Fassò Definizione Assiomatica della Probabilità Andiamo a definire la probabilità come la misura di un evento. Consideriamo finito e l’insieme delle parti di . Allora la funzione P:R è una probabilità se e solo se per ogni A valgono le segg. 3 proprietà: 1. Nonnegatività 2. Normalizzazione 3. Additività: PA 0 P 1 Se A, B e sono disgiunti Parte 1a - Probabilità generale PA B PA PB. p.22 Statistica-UBG’0304 A.Fassò Interpretazione della probabilità Approccio soggettivista Paradigma della scommessa nei giochi equi posta PA vincita (vincita netta attesa nulla) Approccio classico a priori (eventi equiprobabili) PA misura la fiducia (soggettiva) del verificarsi di A PA # casi favorevoli # casi possibili Approccio frequentista a posteriori Parte 1a - Probabilità generale p.23 Statistica-UBG’0304 A.Fassò Estensioni numerabile, insieme dei sottoinsiemi di continuo, classe di eventi A detta algebra P : 0, 1 Allora il 3° assioma è generalizzato nel seg.: additività Consideriamo gli eventi A 1 , A 2 , . . . , A n , . . . a 2 a 2 disgiunti A i A j allora PA 1 A 2 . . . PA j . j1 Parte 1a - Probabilità generale p.24 Statistica-UBG’0304 A.Fassò Proprietà e Regole di Calcolo Finitezza e normalizzazione, A 0 PA 1 Monotonicità, A B , PA PB Evento quasi impossibile: PA 0 Evento impossibile: P 0 Parte 1a - Probabilità generale p.25 Statistica-UBG’0304 A.Fassò Evento quasi certo: PA 1 Evento certo: P 1 Negazione A : PnonA 1 PA Unione di eventi qualsiasi, A, B PA B PA PB PA B Differenza, A B , PB A PB PA. Parte 1a - Probabilità generale p.26 Statistica-UBG’0304 A.Fassò Assegnazione della Probabilità 1 , . . . , N 0 P i 1 P 1 . . . P n 1 1. Esempio (approccio classico): a. esperimento casuale: estrazione di 1 pallina da un urna contenente 10 palline numerate 1, . . . , 10 b. 1 , . . . , 10 1, . . . , 10 c. P i Pi Parte 1a - Probabilità generale 1 10 p.27 Statistica-UBG’0304 2. 3. A.Fassò Esempio: lancio di due monete ordinate a. 1 , . . . , 4 tt, tc, ct, cc b. P i 1 4 Esempio: lancio di due monete (senza ordine) a. 1 , . . . , 4 tt, tc, cc b. Ptt Pcc c. Ptc 1 4 1 2 Parte 1a - Probabilità generale p.28 Statistica-UBG’0304 A.Fassò Probabilità Condizionata PAB PA|B PB NB: PB 0 Aggiornamento delle informazioni: B Formula moltiplicativa: PAB PA|BPB PB|APA Parte 1a - Probabilità generale p.29 Statistica-UBG’0304 A.Fassò Teorema delle PROBABILITA’ TOTALI B 1 , . . . , B k partizione di PA PA|B 1 PB 1 . . . PA|B k PB k Parte 1a - Probabilità generale p.30 Statistica-UBG’0304 A.Fassò Esempio Controllo Statistico della Qualità D ”pezzo difettoso” L i ”pezzo dalla Linea i” Linea produttiva Produzione oraria Difettosità 1 500 15% 2 1000 1% PD PD|L 1 PL 1 PD|L 2 PL 2 0. 15 1 0. 01 2 0. 057 3 3 Parte 1a - Probabilità generale p.31 Statistica-UBG’0304 A.Fassò Eventi Indipendenti Definizione di indipendenza PAB PAPB CONSEGUENZE: PA|B PA Esempio: Lancio 2 monete 1 t 1 , c 1 e e PB|A PB 2 t 2 , c 2 1 2 t 1 t 2 , t 1 c 2 , c 1 t 2 , c 1 c 2 Pt 2 |t 1 Pt 2 Parte 1a - Probabilità generale p.32 Statistica-UBG’0304 A.Fassò Esempio: 2 Estrazioni senza reinserimento da urna 3 rosse, 2 verdi 1 r 1 , v 1 e 2 r 2 , v 2 1 2 r 1 r 2 , r 1 v 2 , v 1 r 2 , v 1 v 2 Pr 1 3 5 Pr 2 |v 1 3 4 e Pv 1 2 5 e Pr 2 |r 1 2 4 Pr 2 Pr 2 |v 1 Pv 1 Pr 2 |r 1 Pr 1 3 Pr 1 !!! 5 Parte 1a - Probabilità generale p.33 Statistica-UBG’0304 A.Fassò Richiami di Calcolo Combinatorio Estrazioni da un urna campionamento Campionamento in blocco Permutazioni (Fattoriale) n! nn 1 . . . 2 1 0! 1 Disposizioni Semplici (n oggetti a gruppi di r) (ordinamento) n! D n,r nn 1. . . n r 1 n r! Parte 1a - Probabilità generale p.34 Statistica-UBG’0304 A.Fassò Combinazioni Semplici (n oggetti a gruppi di r) D n,r n! nr r! r!n r! nn 1. . . n r 1 r! C n,r Parte 1a - Probabilità generale p.35 Statistica-UBG’0304 A.Fassò Campionamento con Reinserimento Disposizioni con Ripetizione: D n,r n r Combinazioni con Ripetizione: C n,r n 1r r Parte 1a - Probabilità generale n 1 r! n!r 1! p.36 Statistica-UBG’0304 A.Fassò Teorema di Bayes Problematica delle ”probabilità inverse”: Osservato l’evento A siamo interessati alle ”probabilità delle cause” di A Esempio CSQ (segue) Torniamo all’esempio Linea produttiva Produzione oraria Difettosità 1 500 15% 2 1000 1% PL 1 |nonD PL 1 ? Parte 1a - Probabilità generale p.37 Statistica-UBG’0304 A.Fassò Teorema di Bayes B j partizione di PB j Insieme delle possibili cause di A Probabilità a priori delle cause B j PA|B j Probabilità condizionate o verosimiglianze PB j |A Probabilità a posteriori della causa B j noto l’effetto A. PB j |A Parte 1a - Probabilità generale PA|B j PB j i PA|B i PB i p.38 Statistica-UBG’0304 A.Fassò Esempio CSQ (segue) PD|L 1 PL 1 PL 1 |D PD|L 1 PL 1 PD|L 2 PL 2 0. 15 13 0. 88 1 2 0. 15 3 0. 01 3 Calcolare PL 2 |D. Parte 1a - Probabilità generale p.39 Statistica-UBG’0304 A.Fassò Esempio: Algoritmi anti-spamming (popfile.sourceforge.net) Probabilità di spamming di ciascuna mail Classificazione Aggiornamento delle informazioni ad ogni nuova mail ricevuta e classificata B 1 "la mail è spamming" B 2 "la mail è buona" E kj1 E j "email osservata" E j "j ma parola presente nella mail" Parte 1a - Probabilità generale p.40 Statistica-UBG’0304 A.Fassò Si applica il Teorema di Bayes Probabilità a posteriori di spamming: PE|B 1 PB 1 PB 1 |E PE|B 1 PB 1 PE|B 2 PB 2 Si classifica in B i se PB i /E è max in i. Parte 1a - Probabilità generale p.41 Statistica-UBG’0304 A.Fassò In pratica classificazione manuale P B i e P E j |B i Cioè si calcolano le probabilità come frequenze relative nella casella postale dell’interessato: P B i P E j /B i # parole B i # tutte le parole usate nella casella # parole E j delle mail classificate B i # tutte le parole B i Si usa l’ipotesi semplificativa (molto forte !) di indipendenza fra le parole Parte 1a - Probabilità generale p.42