9. Introduzione alla Statistica

Teoria dei Fenomeni Aleatori
AA 2012/13
Introduzione alla Statistica
Nella statistica, anziché predire la probabilità che si verifichino gli
eventi di interesse (cioè passare dal modello alla realtà),
• si osserva un fenomeno
• se ne estraggono le caratteristiche essenziali.
Si passa dalla realtà al modello.
o Si sceglie il modello che meglio si adatta alla realtà osservata,
cioè quello per il quale risulta “più probabile” la realtà osservata.
481
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Introduzione alla Statistica (segue)
Ipotesi fondamentali della Statistica
⇓
• Osservazione ripetuta nelle medesime condizioni di una o più
grandezze;
• L’unica “variabilità” della grandezza, nel corso delle osservazioni,
è dovuto alla “aleatorietà del fenomeno”.
⇓
Campione Aleatorio:
• Insieme di valori ottenuti per la grandezza sotto osservazione.
482
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Introduzione alla Statistica (segue)
Definizione di Campione aleatorio:
o Osservando n volte, nelle medesime condizioni, la grandezza
aleatoria si ottiene il campione aleatorio:
{ x1 ,x2 ,...,xn }
costituito da n “realizzazioni” (o “determinazioni”) di n variabili
aleatorie
X 1 , X 2 ,..., X n
statisticamente indipendenti ed ugualmente distribuite (i.i.d).
483
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Introduzione alla Statistica (segue)
Campione Aleatorio
⇓
Mediante Procedure di Inferenza Statistica
⇓
• Stima dei parametri del modello probabilistico più plausibile con le
⇓
osservazioni.
“Procedure di Stima”
• Individuazione del modello probabilistico più plausibile con le
⇓
osservazioni.
“Verifica delle Ipotesi Statistiche”
484
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Introduzione alla Statistica (segue)
Predizione dell’osservazione:
Noto il modello probabilistico: f X ( x )
⇓
Predire ciò che sarà osservato: P ( a < X ≤ b )
• Se la relazione tra larghezza dell’intervallo e larghezza di f X ( x )
(caratterizzabile mediante la varianza) è tale che la probabilità
cercata è “molto alta”, la predizione diventa una quasi certezza.
Esempio: se X ∼ N ( 0,1) gaussiana standard, i valori osservati di X
cadranno con probabilità: P ( −2 < X ≤ +2 ) = 0.954
485
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Introduzione alla Statistica (segue)
Predizione dell’osservazione:
Quando il modello probabilistico non è noto si ricorre alla conoscenza
di alcuni momenti (in particolare la media η e la varianza σ2 )
• Disuguaglianza di Chebyshev:
σ2
P ( X − η ≥ ε) < 2
ε
• Disuguaglianza di Markov:
η
P ( X ≥ c) <
c
Esse forniscono dei limiti inferiori per la probabilità che X cada
all’interno di un certo intervallo.
486
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Teoria degli Errori
Data una grandezza da misurare, indicato con M il valore misurato,
la relazione che sussiste tra il valore vero V ed M risulta:
M =V + E
dove E è l’errore commesso nella misura.
o Accuratezza della misura:
L'accuratezza è il grado di corrispondenza del dato misurato
(desumibile da una serie di valori osservati) con il dato vero.
o Precisione della misura:
La precisione è il grado di convergenza di dati misurati su un
valore medio della serie a cui appartengono.
487
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Accuratezza e Precisione
A
B
C
D
o A e C rappresentano due serie di dati ugualmente accurate.
o B è precisa ma non accurata (il valore atteso non è il centro del
bersaglio).
o D mostra il caso “peggiore”, in cui i dati sono imprecisi e non
accurati.
488
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Classificazione degli Errori
• Errori Sistematici: sono gli errori deterministici, costanti e
ripetibili.
• Errori Casuali: generano dispersione dei valori e possono
essere prodotti da variazioni casuali non ripetibili (errore
statistico). Per ottenere un valore medio affidabile è necessario
effettuare un numero sufficientemente elevato di rilevazioni.
• In statistica la precisione è esprimibile in termini di deviazione
standard.
• Uno strumento preciso dovrebbe essere anche accurato, a meno
di conoscere l'entità dello scostamento (errore sistematico) ed
apportare le opportune correzioni.
489
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Teoria degli Errori (segue)
Errore Relativo:
o L’incertezza della misura può essere valutata anche in termini
relativi rapportando l’errore assoluto al valore vero:
E M −V M
=
−1
e= =
V
V
V
o Poiché non si conosce il valore vero V , nell’ipotesi che la misura
sia “abbastanza accurata e precisa” l’errore relativo si può
approssimare con:
e
E
M
490
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Teoria degli Errori (segue)
• Essendo l’errore casuale aleatorio lo si indica in una “fascia di
incertezza” attorno al suo valore assoluto vero E , così il risultato
del procedimento di misura viene indicato nella forma:
M ±E
intendendo che il valore effettivo dell’errore è compreso entro una
fascia di ampiezza minore di E attorno al valore misurato M .
491
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Statistica dell’Errore
Se le sorgenti di errore casuale sono numerose e nessuna
predomina sulle altre:
• l’errore casuale è una variabile aleatoria con distribuzione
Gaussiana a valor medio nullo e varianza σ 2E .
Segue che:
La misura M = V + E è una variabile aleatoria gaussiana con:
E [M ] = V
Var [ M ] = σ 2E
492
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Statistica dell’Errore (segue)
o Si può quindi predire con che probabilità il valore misurato differirà
da quello vero per una quantità massima prefissata.
o Normalmente si adotta la deviazione standard σ E come misura
dell’errore E . Per cui l’errore sarà il valore assoluto:
• inferiore a σ E con probabilità del 68.3 % ;
• inferiore a 2σ E con probabilità del 95.4 % .
o Talvolta si preferisce adottare l’errore probabile definito come:
0.67σ E
che corrisponde ad una fascia all’interno della quale il valore
misurato cade con probabilità del 50 % .
493
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Statistica dell’Errore (segue)
Esempio:
Adottando la deviazione standard come misura dell’errore, quando si
indica il risultato del procedimento di misura come:
50 ± 2
si intende che
σE = 2
Il valore vero sarà, quindi, compreso tra 48 e 52 con probabilità del
68.3 % .
P ( 48 < V ≤ 52 ) = 0.683
494
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Uso di un Singolo Insieme di Misure
o Essendo l’errore aleatorio non si effettua una sola misura della
grandezza di interesse, piuttosto una serie di misure nelle stesse
condizioni in modo da costituire il Campione Aleatorio:
{M 1 ,M 2 ,...,M n }
da impiegare per stimare la grandezza con più precisione.
o Si può dimostrare che la “migliore stima” del valore vero (uguale al
valore atteso della variabile aleatoria che descrive la singola
misura) è:
1
M=
n
∑M
n
i
media campionaria
i =1
495
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
La Media Campionaria delle Misure
La media campionaria costituisce un’ottima stima del:
E [M ] = V
o Infatti il valore atteso della media campionaria è proprio il valore
vero della grandezza:
E ⎡⎣ M ⎤⎦ = E [ M ] = V
o La deviazione standard (cioè l’errore al termine delle misure
ripetute) è legata all’errore sulla singola misura, σ E , dalla
relazione:
σM =
σE
n
496
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
La Media Campionaria delle Misure (segue)
Se non è nota σ E sulla singola misura, occorre prima stimare σ E dal
campione aleatorio mediante la varianza campionaria “corretta” S :
1
ˆE =S=
σ
n −1
∑(M − M )
n
2
i
i =1
e poi stimare σ M come:
ˆE
σ
1
ˆM =
σ
=
n ( n − 1)
n
∑(M − M )
n
2
i
i =1
497
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Uso di Due Misure Indipendenti
Se vengono effettuati due misure M A e M B in condizioni diverse si
perverrà in generale a risultati diversi.
Se la grandezza da misurare ha il valore vero V si otterrà:
M A = V + EA
M B = V + EB
Per determinare la combinazione migliore di M A e M B occorre
ricordare che M A e M B sono due variabili aleatorie gaussiane con:
E [M A ] = E [M B ] = V
Var [ M A ] = Var [ E A ] = σ A
Var [ M B ] = Var [ EB ] = σ B
498
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Uso di Due Misure Indipendenti (segue)
o La densità congiunta di M A e M B è quindi:
2
2
⎡
⎛
x A − V ) ( xB − V ) ⎞ ⎤
(
1
+
f M A M B ( x A ,xB ) =
exp ⎢ − ⎜
⎟⎥
2
2
2 πσ Aσ B
2σ B ⎟⎠ ⎥
⎢⎣ ⎜⎝ 2σ A
⎦
o Si può ritenere che il valore vero V più probabile sia quello che
massimizza
la
densità
congiunta
(criterio
della
massima
verosimiglianza), ovvero minimizza l’esponente
( xA − V )
2σ 2A
2
xB − V )
(
+
2
2σ 2B
499
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Uso di Due Misure Indipendenti (segue)
Annullando la derivata prima rispetto a V dell’esponente si ottiene
x A − V xB − V
+
=0
2
2
σA
σB
⎛ 1
1 ⎞ x A xB
ovvero:
V⎜ 2 + 2 ⎟= 2 + 2
⎝ σ A σB ⎠ σ A σB
Quindi la stima migliore per la grandezza sotto misura è:
x A xB
+ 2
2
σ
σB
V̂ = A
1
1
+ 2
2
σ A σB
cioè la media delle due misure x A e xB pesate con l’inverso delle
rispettive varianze.
500
Docenti: Gaspare Galati – Gabriele Pavan
Teoria dei Fenomeni Aleatori
AA 2012/13
Uso di N Misure Indipendenti
Più
in
generale,
dovendo
combinare
n
misure
indipendenti
M 1 ,M 2 ,...,M n , ognuna affetta da errore di varianza σi2 , la stima
migliore della grandezza sotto misura è:
∑
xi
σi2
∑
1
σi2
n
V̂ =
i =1
n
i =1
cioè la media delle n misure pesate con l’inverso delle rispettive
varianze.
501
Docenti: Gaspare Galati – Gabriele Pavan