Statistica-UBG’0304
A.Fassò
Statistica
Prof. Alessandro Fassò
ingegneria.unibg.it/fasso
CdL: Ing.Informatica e Meccanica
Parte 1a - Probabilità generale
aa 2003/2004
p.1
Statistica-UBG’0304
A.Fassò
Introduzione
Decisioni in condizioni di incertezza
Dati empirici

 Teoria
 Conclusioni operative
Conoscenza e consapevolezza dell’errore
 Identificazione e Quantificazione dell’incertezza

Modelli statistici
Parte 1a - Probabilità generale
p.2
Statistica-UBG’0304
A.Fassò
Articolazione della Materia
- Statistica Descrittiva
- Calcolo delle Probabilità
- Inferenza Statistica
Parte 1a - Probabilità generale
p.3
Statistica-UBG’0304
A.Fassò
Costruzione di modelli

Sintesi di teoria, dati empirici e conclusioni operative di interesse.

Tecniche di costruzione del modello (identificazione e stima)

Capacità (auto)-critica: validazione del modello
Parte 1a - Probabilità generale
p.4
Statistica-UBG’0304
A.Fassò
Applicazioni

Ambito Meccanico-Produttivo
1.
Monitoraggio e Controllo: della Qualità, della Produzione, della
Sicurezza
2.
Problemi Sperimentali
3.
Misure
4.
Teoria delle code (Ricerca Operativa, Logistica, Impianti)
5.
Sicurezza
6.
Simulazione (SA-demo)
7.
Affidabilità
Parte 1a - Probabilità generale
p.5
Statistica-UBG’0304

A.Fassò
Ambito Informatico
1.
Code e Reti
a.
ES: Dimensionamento buffer di un server
Tempi di attesa, probabilità di overflow, ...
(Modelli Stocastici)
2.
3.
Sicurezza e Difesa da Intrusioni (demo)
a.
ES: Numero eventi e EWMA (Statistica Industriale)
b.
ES: Sequenze Markoviane di eventi (Modelli Stocastici)
Data Mining
Parte 1a - Probabilità generale
p.6
Statistica-UBG’0304


A.Fassò
Problemi di Previsione
1.
Economico-Finanziario
2.
Ambientale
3.
Automazione - Controllo predittivo
Problemi di Monitoraggio
1.
Qualità, Produzione, Sicurezza
2.
Servizi
3.
Ambiente
4.
Portafoglio (finanza)
Parte 1a - Probabilità generale
p.7
Statistica-UBG’0304
A.Fassò
Materie Collegate
Corsi avanzati di Statistica

Statistica Industriale (5cfu), Prof. I.Negri

Statistica II (modelli dinamici) (5cfu), Prof. R.Colombi

Processi Stocastici (5cfu), Prof. A.Fassò

Modelli Stocastici (5cfu), Prof. A.Fassò
Parte 1a - Probabilità generale
p.8
Statistica-UBG’0304
A.Fassò
Altri Corsi che utilizzano concetti di Statistica

Automatica e Identificazione di Modelli e Analisi dati (LS)

Impianti Informatici

Gestione Industriale della Qualità

Laboratorio di Fisica

Organizzazione della produzione

Impianti
Parte 1a - Probabilità generale
p.9
Statistica-UBG’0304
A.Fassò
Lezioni ed Esami

6h di lezione ed esercitazione alla settimana (mar,mer e gio)




Mercoledì: Esercizi e complementi di Calcolo delle Probabilità, Dott.ssa
Nicolis
2h di laboratorio alla settimana in ambiente Matlab, mer.pom., Ing. Locatelli
e Dott.ssa Nicolis
Ricevimento: giovedì h 10.00-11.30, oppure su appuntamento
[email protected]
E-learning:

questo materiale: ingegneria.unibg.it/fasso

esercizi, auto-valutazione, temi d’esame ed altro: elearning2.unibg.it/ilias
Parte 1a - Probabilità generale
p.10
Statistica-UBG’0304
A.Fassò
Modalità d’esame:
L’esame consta di una parte scritta ed una orale.



La parte scritta può essere superata con 2 verifiche intermedie nell’anno
1.
Calcolo delle Probabilità (15-21 aprile)
2.
Inferenza Statistica (14-19 giugno)
oppure con uno scritto finale negli appelli ordinari.
La parte orale, negli appelli ordinari, consta di una o più domande
riguardanti la teoria, la discussione e/o la soluzione di esercizi e problemi
anche con l’ausilio di Matlab usando gli strumenti acquisiti nel laboratorio.
Parte 1a - Probabilità generale
p.11
Statistica-UBG’0304
A.Fassò
Preparazione dell’Esame e Bibliografia
1.
Frequenza
2.
Guida alle lezioni e materiale su internet (ingegneria.unibg.it/fasso)
3.
D.C. Montgomery, G.C. Runger & N.F. Hubele 2004: Statistica per
Ingegneria, Egea.
4.
S. Ross 2003 Probabilità e Statistica per l’Ingegneria e le Scienze,
Apogeo
5.
Ilia Negri (2001): Lezioni di calcolo delle probabilita’ ed esercizi
svolti, editrice CUSL, Milano.
6.
elearning2.unibg.it/ilias.
Parte 1a - Probabilità generale
p.12
Statistica-UBG’0304
A.Fassò
Calcolo delle Probabilità
Richiami di Insiemistica

Insiemi A, B, . .

Elementi a, b, x, y, . . .

Definizione per elencazione:
A  a, b, c, d
A  a 1 , a 2 , . . . , a k 

Definizione tramite una proprietà:
A  x tali che ....
Parte 1a - Probabilità generale

x | ....
p.13
Statistica-UBG’0304
A.Fassò
Esempi (insiemi numerici)
1.
Insiemi finiti
B   2, 4, 6, 8, 10 

2.
numeri pari minori o uguali a 10
x | x  2i, i  1, . . . , 5
Insiemi numerabili
A
interi numerabili positivi
 1, 2, . . . 
3.
Insiemi continui limitati (es: intervalli o unione di intervalli)
A  x |a  x  b
4.
Insiemi continui illimitati (es: semiretta)
   x |x  0
Parte 1a - Probabilità generale
p.14
Statistica-UBG’0304
A.Fassò
Relazioni fra Insiemi

Appartenenza

Uguaglianza

Inclusione

Esempi
a  A oppure a  A
AB
A  B oppure B  A
1.
B   2, 4, 6, 8, 10
2.
B 
3.
A 1  x |
4.
A 2  x |0  x     
2  B,
3  B
numeri interi

2
 x     
Parte 1a - Probabilità generale
p.15
Statistica-UBG’0304
A.Fassò
Note
A  B, B  A  A  B
1.
Uguaglianza e Inclusione
2.
Proprietà transitiva dell’inclusione
Parte 1a - Probabilità generale
A  B, B  C  A  C
p.16
Statistica-UBG’0304
A.Fassò
Spazio  e Insieme vuoto

Spazio ambiente o Campionario:

Insieme vuoto:

A

Insieme delle parti:   
A
Parte 1a - Probabilità generale

A
p.17
Statistica-UBG’0304
A.Fassò
Operazioni

Unione
A  BC 

x |x  B oppure x  C
Intersezione
A  BC 
x |x  B e x  C
A  B  A  B  AB

Differenza
A  BC 

x |x  B e x  C
Complemento o Negazione
A  nonB  B    B  x |x  B
Parte 1a - Probabilità generale
p.18
Statistica-UBG’0304

A.Fassò
Regole di De Morgan
A  B  nonĀ  B 

A  B  nonĀ  B 
Defnizione di Insiemi disgiunti
AB  
Parte 1a - Probabilità generale
p.19
Statistica-UBG’0304

A.Fassò
Partizione di 
A1, A2, . . . , Ak
disgiunti
  A 1  A 2 . . . A k   kj1 A j

Scomposizione di B
B  B  A 1   B  A 2  . . . B  A k 
Parte 1a - Probabilità generale
p.20
Statistica-UBG’0304
A.Fassò
Esperimenti Casuali

Esperimento deterministico e risultati incerti
  insieme dei possibili risultati sperimentali

Esempio: lancio di un dado
  f 1 , f 2 , . . . , f 6 

Eventi elementari

Eventi

Eventi ed Insiemi

A
Parte 1a - Probabilità generale
p.21
Statistica-UBG’0304
A.Fassò
Definizione Assiomatica
della Probabilità
Andiamo a definire la probabilità come la misura di un evento. Consideriamo
 finito e  l’insieme delle parti di . Allora la funzione
P:R
è una probabilità se e solo se per ogni A   valgono le segg. 3 proprietà:
1.
Nonnegatività
2.
Normalizzazione
3.
Additività:
PA  0
P  1
Se A, B   e sono disgiunti
Parte 1a - Probabilità generale
 PA  B  PA  PB.
p.22
Statistica-UBG’0304
A.Fassò
Interpretazione della probabilità

Approccio soggettivista



Paradigma della scommessa nei giochi equi
posta
PA 
vincita
(vincita netta attesa nulla)
Approccio classico a priori (eventi equiprobabili)


PA misura la fiducia (soggettiva) del verificarsi di A
PA 
# casi favorevoli
# casi possibili
Approccio frequentista a posteriori
Parte 1a - Probabilità generale
p.23
Statistica-UBG’0304
A.Fassò
Estensioni



 numerabile,  insieme dei sottoinsiemi di 
 continuo,  classe di eventi A   detta  algebra
P :   0, 1
Allora il 3° assioma è generalizzato nel seg.:
 additività
Consideriamo gli eventi A 1 , A 2 , . . . , A n , . . .   a 2 a 2 disgiunti
A i  A j   allora

PA 1  A 2 . . .  
 PA j .
j1
Parte 1a - Probabilità generale
p.24
Statistica-UBG’0304
A.Fassò
Proprietà e Regole di Calcolo


Finitezza e normalizzazione, A  
0  PA  1
Monotonicità, A  B  ,
PA  PB

Evento quasi impossibile:
PA  0

Evento impossibile:
P  0
Parte 1a - Probabilità generale
p.25
Statistica-UBG’0304

A.Fassò
Evento quasi certo:
PA  1

Evento certo:
P  1

Negazione A   :
PnonA  1  PA


Unione di eventi qualsiasi, A, B  
PA  B  PA  PB  PA  B
Differenza, A  B  ,
PB  A  PB  PA.
Parte 1a - Probabilità generale
p.26
Statistica-UBG’0304
A.Fassò
Assegnazione della Probabilità

   1 , . . . ,  N 
0  P i   1
P 1  . . . P n   1
1.
Esempio (approccio classico):
a.
esperimento casuale: estrazione di 1 pallina da un urna contenente 10
palline numerate 1, . . . , 10
b.
   1 , . . . ,  10   1, . . . , 10
c.
P i   Pi 
Parte 1a - Probabilità generale
1
10
p.27
Statistica-UBG’0304
2.
3.
A.Fassò
Esempio: lancio di due monete ordinate
a.
   1 , . . . ,  4   tt, tc, ct, cc
b.
P i  
1
4
Esempio: lancio di due monete (senza ordine)
a.
   1 , . . . ,  4   tt, tc, cc
b.
Ptt  Pcc 
c.
Ptc 
1
4
1
2
Parte 1a - Probabilità generale
p.28
Statistica-UBG’0304
A.Fassò
Probabilità Condizionata
PAB
PA|B 
PB


NB: PB  0
Aggiornamento delle informazioni:   B
Formula moltiplicativa:
PAB  PA|BPB  PB|APA
Parte 1a - Probabilità generale
p.29
Statistica-UBG’0304
A.Fassò
Teorema delle PROBABILITA’ TOTALI
B 1 , . . . , B k partizione di 
PA  PA|B 1 PB 1  . . . PA|B k PB k 
Parte 1a - Probabilità generale
p.30
Statistica-UBG’0304
A.Fassò
Esempio Controllo Statistico della Qualità


D ”pezzo difettoso”
L i ”pezzo dalla Linea i”
Linea produttiva Produzione oraria Difettosità
1
500
15%
2
1000
1%
PD  PD|L 1 PL 1   PD|L 2 PL 2 
 0. 15 1  0. 01 2  0. 057
3
3
Parte 1a - Probabilità generale
p.31
Statistica-UBG’0304
A.Fassò
Eventi Indipendenti
Definizione di indipendenza
PAB  PAPB

CONSEGUENZE:
PA|B  PA

Esempio: Lancio 2 monete
 1  t 1 , c 1 
e
e
PB|A  PB
 2  t 2 , c 2 
   1   2  t 1 t 2 , t 1 c 2 , c 1 t 2 , c 1 c 2 
Pt 2 |t 1   Pt 2 
Parte 1a - Probabilità generale
p.32
Statistica-UBG’0304

A.Fassò
Esempio: 2 Estrazioni senza reinserimento da
urna  3 rosse, 2 verdi
 1  r 1 , v 1 
e
 2  r 2 , v 2 
   1   2  r 1 r 2 , r 1 v 2 , v 1 r 2 , v 1 v 2 
Pr 1   3
5
Pr 2 |v 1   3
4
e
Pv 1   2
5
e
Pr 2 |r 1   2
4
Pr 2   Pr 2 |v 1 Pv 1   Pr 2 |r 1 Pr 1 
 3  Pr 1  !!!
5
Parte 1a - Probabilità generale
p.33
Statistica-UBG’0304
A.Fassò
Richiami di Calcolo Combinatorio
Estrazioni da un urna  campionamento
Campionamento in blocco

Permutazioni (Fattoriale)
n!  nn  1 . . . 2  1
0!  1

Disposizioni Semplici (n oggetti a gruppi di r) (ordinamento)
n!
D n,r 
 nn  1. . . n  r  1
n  r!
Parte 1a - Probabilità generale
p.34
Statistica-UBG’0304

A.Fassò
Combinazioni Semplici (n oggetti a gruppi di r)
D n,r
n!
 nr 
r!
r!n  r!
nn  1. . . n  r  1

r!
C n,r 
Parte 1a - Probabilità generale
p.35
Statistica-UBG’0304
A.Fassò
Campionamento con Reinserimento

Disposizioni con Ripetizione:
D n,r  n r

Combinazioni con Ripetizione:
C n,r  n  1r  r
Parte 1a - Probabilità generale

n  1  r!
n!r  1!
p.36
Statistica-UBG’0304
A.Fassò
Teorema di Bayes
Problematica delle ”probabilità inverse”: Osservato l’evento A siamo interessati
alle ”probabilità delle cause” di A
Esempio CSQ (segue)
Torniamo all’esempio
Linea produttiva Produzione oraria Difettosità
1
500
15%
2
1000
1%
PL 1 |nonD  PL 1  ?
Parte 1a - Probabilità generale
p.37
Statistica-UBG’0304
A.Fassò
Teorema di Bayes




B j partizione di 
PB j 

Insieme delle possibili cause di A
Probabilità a priori delle cause B j
PA|B j 
Probabilità condizionate o verosimiglianze
PB j |A
Probabilità a posteriori della causa B j noto l’effetto A.
PB j |A 
Parte 1a - Probabilità generale
PA|B j PB j 
 i PA|B i PB i 
p.38
Statistica-UBG’0304
A.Fassò
Esempio CSQ (segue)
PD|L 1 PL 1 
PL 1 |D 
PD|L 1 PL 1   PD|L 2 PL 2 
0. 15 13

 0. 88
1
2
0. 15 3  0. 01 3

Calcolare PL 2 |D.
Parte 1a - Probabilità generale
p.39
Statistica-UBG’0304
A.Fassò
Esempio: Algoritmi anti-spamming
(popfile.sourceforge.net)


Probabilità di spamming di ciascuna mail 
Classificazione
Aggiornamento delle informazioni ad ogni nuova mail ricevuta e classificata
B 1  "la mail è spamming"
B 2  "la mail è buona"
E   kj1 E j "email osservata"
E j  "j  ma parola presente nella mail"
Parte 1a - Probabilità generale
p.40
Statistica-UBG’0304
A.Fassò
Si applica il Teorema di Bayes
Probabilità a posteriori di spamming:
PE|B 1 PB 1 
PB 1 |E 
PE|B 1 PB 1   PE|B 2 PB 2 
Si classifica in B i se PB i /E è max in i.
Parte 1a - Probabilità generale
p.41
Statistica-UBG’0304
A.Fassò
In pratica
classificazione manuale

P B i  e P E j |B i 
Cioè si calcolano le probabilità come frequenze relative nella casella postale
dell’interessato:
P B i  
P E j /B i  
# parole  B i
# tutte le parole usate nella casella
# parole E j delle mail classificate B i
# tutte le parole  B i
Si usa l’ipotesi semplificativa (molto forte !) di indipendenza fra le parole
Parte 1a - Probabilità generale
p.42