Teoria dei Fenomeni Aleatori AA 2012/13 Introduzione alla Statistica Nella statistica, anziché predire la probabilità che si verifichino gli eventi di interesse (cioè passare dal modello alla realtà), • si osserva un fenomeno • se ne estraggono le caratteristiche essenziali. Si passa dalla realtà al modello. o Si sceglie il modello che meglio si adatta alla realtà osservata, cioè quello per il quale risulta “più probabile” la realtà osservata. 481 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Introduzione alla Statistica (segue) Ipotesi fondamentali della Statistica ⇓ • Osservazione ripetuta nelle medesime condizioni di una o più grandezze; • L’unica “variabilità” della grandezza, nel corso delle osservazioni, è dovuto alla “aleatorietà del fenomeno”. ⇓ Campione Aleatorio: • Insieme di valori ottenuti per la grandezza sotto osservazione. 482 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Introduzione alla Statistica (segue) Definizione di Campione aleatorio: o Osservando n volte, nelle medesime condizioni, la grandezza aleatoria si ottiene il campione aleatorio: { x1 ,x2 ,...,xn } costituito da n “realizzazioni” (o “determinazioni”) di n variabili aleatorie X 1 , X 2 ,..., X n statisticamente indipendenti ed ugualmente distribuite (i.i.d). 483 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Introduzione alla Statistica (segue) Campione Aleatorio ⇓ Mediante Procedure di Inferenza Statistica ⇓ • Stima dei parametri del modello probabilistico più plausibile con le ⇓ osservazioni. “Procedure di Stima” • Individuazione del modello probabilistico più plausibile con le ⇓ osservazioni. “Verifica delle Ipotesi Statistiche” 484 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Introduzione alla Statistica (segue) Predizione dell’osservazione: Noto il modello probabilistico: f X ( x ) ⇓ Predire ciò che sarà osservato: P ( a < X ≤ b ) • Se la relazione tra larghezza dell’intervallo e larghezza di f X ( x ) (caratterizzabile mediante la varianza) è tale che la probabilità cercata è “molto alta”, la predizione diventa una quasi certezza. Esempio: se X ∼ N ( 0,1) gaussiana standard, i valori osservati di X cadranno con probabilità: P ( −2 < X ≤ +2 ) = 0.954 485 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Introduzione alla Statistica (segue) Predizione dell’osservazione: Quando il modello probabilistico non è noto si ricorre alla conoscenza di alcuni momenti (in particolare la media η e la varianza σ2 ) • Disuguaglianza di Chebyshev: σ2 P ( X − η ≥ ε) < 2 ε • Disuguaglianza di Markov: η P ( X ≥ c) < c Esse forniscono dei limiti inferiori per la probabilità che X cada all’interno di un certo intervallo. 486 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Teoria degli Errori Data una grandezza da misurare, indicato con M il valore misurato, la relazione che sussiste tra il valore vero V ed M risulta: M =V + E dove E è l’errore commesso nella misura. o Accuratezza della misura: L'accuratezza è il grado di corrispondenza del dato misurato (desumibile da una serie di valori osservati) con il dato vero. o Precisione della misura: La precisione è il grado di convergenza di dati misurati su un valore medio della serie a cui appartengono. 487 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Accuratezza e Precisione A B C D o A e C rappresentano due serie di dati ugualmente accurate. o B è precisa ma non accurata (il valore atteso non è il centro del bersaglio). o D mostra il caso “peggiore”, in cui i dati sono imprecisi e non accurati. 488 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Classificazione degli Errori • Errori Sistematici: sono gli errori deterministici, costanti e ripetibili. • Errori Casuali: generano dispersione dei valori e possono essere prodotti da variazioni casuali non ripetibili (errore statistico). Per ottenere un valore medio affidabile è necessario effettuare un numero sufficientemente elevato di rilevazioni. • In statistica la precisione è esprimibile in termini di deviazione standard. • Uno strumento preciso dovrebbe essere anche accurato, a meno di conoscere l'entità dello scostamento (errore sistematico) ed apportare le opportune correzioni. 489 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Teoria degli Errori (segue) Errore Relativo: o L’incertezza della misura può essere valutata anche in termini relativi rapportando l’errore assoluto al valore vero: E M −V M = −1 e= = V V V o Poiché non si conosce il valore vero V , nell’ipotesi che la misura sia “abbastanza accurata e precisa” l’errore relativo si può approssimare con: e E M 490 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Teoria degli Errori (segue) • Essendo l’errore casuale aleatorio lo si indica in una “fascia di incertezza” attorno al suo valore assoluto vero E , così il risultato del procedimento di misura viene indicato nella forma: M ±E intendendo che il valore effettivo dell’errore è compreso entro una fascia di ampiezza minore di E attorno al valore misurato M . 491 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Statistica dell’Errore Se le sorgenti di errore casuale sono numerose e nessuna predomina sulle altre: • l’errore casuale è una variabile aleatoria con distribuzione Gaussiana a valor medio nullo e varianza σ 2E . Segue che: La misura M = V + E è una variabile aleatoria gaussiana con: E [M ] = V Var [ M ] = σ 2E 492 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Statistica dell’Errore (segue) o Si può quindi predire con che probabilità il valore misurato differirà da quello vero per una quantità massima prefissata. o Normalmente si adotta la deviazione standard σ E come misura dell’errore E . Per cui l’errore sarà il valore assoluto: • inferiore a σ E con probabilità del 68.3 % ; • inferiore a 2σ E con probabilità del 95.4 % . o Talvolta si preferisce adottare l’errore probabile definito come: 0.67σ E che corrisponde ad una fascia all’interno della quale il valore misurato cade con probabilità del 50 % . 493 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Statistica dell’Errore (segue) Esempio: Adottando la deviazione standard come misura dell’errore, quando si indica il risultato del procedimento di misura come: 50 ± 2 si intende che σE = 2 Il valore vero sarà, quindi, compreso tra 48 e 52 con probabilità del 68.3 % . P ( 48 < V ≤ 52 ) = 0.683 494 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Uso di un Singolo Insieme di Misure o Essendo l’errore aleatorio non si effettua una sola misura della grandezza di interesse, piuttosto una serie di misure nelle stesse condizioni in modo da costituire il Campione Aleatorio: {M 1 ,M 2 ,...,M n } da impiegare per stimare la grandezza con più precisione. o Si può dimostrare che la “migliore stima” del valore vero (uguale al valore atteso della variabile aleatoria che descrive la singola misura) è: 1 M= n ∑M n i media campionaria i =1 495 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 La Media Campionaria delle Misure La media campionaria costituisce un’ottima stima del: E [M ] = V o Infatti il valore atteso della media campionaria è proprio il valore vero della grandezza: E ⎡⎣ M ⎤⎦ = E [ M ] = V o La deviazione standard (cioè l’errore al termine delle misure ripetute) è legata all’errore sulla singola misura, σ E , dalla relazione: σM = σE n 496 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 La Media Campionaria delle Misure (segue) Se non è nota σ E sulla singola misura, occorre prima stimare σ E dal campione aleatorio mediante la varianza campionaria “corretta” S : 1 ˆE =S= σ n −1 ∑(M − M ) n 2 i i =1 e poi stimare σ M come: ˆE σ 1 ˆM = σ = n ( n − 1) n ∑(M − M ) n 2 i i =1 497 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Uso di Due Misure Indipendenti Se vengono effettuati due misure M A e M B in condizioni diverse si perverrà in generale a risultati diversi. Se la grandezza da misurare ha il valore vero V si otterrà: M A = V + EA M B = V + EB Per determinare la combinazione migliore di M A e M B occorre ricordare che M A e M B sono due variabili aleatorie gaussiane con: E [M A ] = E [M B ] = V Var [ M A ] = Var [ E A ] = σ A Var [ M B ] = Var [ EB ] = σ B 498 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Uso di Due Misure Indipendenti (segue) o La densità congiunta di M A e M B è quindi: 2 2 ⎡ ⎛ x A − V ) ( xB − V ) ⎞ ⎤ ( 1 + f M A M B ( x A ,xB ) = exp ⎢ − ⎜ ⎟⎥ 2 2 2 πσ Aσ B 2σ B ⎟⎠ ⎥ ⎢⎣ ⎜⎝ 2σ A ⎦ o Si può ritenere che il valore vero V più probabile sia quello che massimizza la densità congiunta (criterio della massima verosimiglianza), ovvero minimizza l’esponente ( xA − V ) 2σ 2A 2 xB − V ) ( + 2 2σ 2B 499 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Uso di Due Misure Indipendenti (segue) Annullando la derivata prima rispetto a V dell’esponente si ottiene x A − V xB − V + =0 2 2 σA σB ⎛ 1 1 ⎞ x A xB ovvero: V⎜ 2 + 2 ⎟= 2 + 2 ⎝ σ A σB ⎠ σ A σB Quindi la stima migliore per la grandezza sotto misura è: x A xB + 2 2 σ σB V̂ = A 1 1 + 2 2 σ A σB cioè la media delle due misure x A e xB pesate con l’inverso delle rispettive varianze. 500 Docenti: Gaspare Galati – Gabriele Pavan Teoria dei Fenomeni Aleatori AA 2012/13 Uso di N Misure Indipendenti Più in generale, dovendo combinare n misure indipendenti M 1 ,M 2 ,...,M n , ognuna affetta da errore di varianza σi2 , la stima migliore della grandezza sotto misura è: ∑ xi σi2 ∑ 1 σi2 n V̂ = i =1 n i =1 cioè la media delle n misure pesate con l’inverso delle rispettive varianze. 501 Docenti: Gaspare Galati – Gabriele Pavan