Distribuzione Normale o Curva di Gauss Distribuzione Normale o Curva di Gauss E’ la più importante distribuzione di variabili casuali continue, in quanto descrive la distribuzione di probabilità della maggior parte dei fenomeni quantitativi antropometrici. E’ detta anche curva degli errori accidentali perché descrive la probabilità di commettere un errore accidentale in misure ripetute della stessa grandezza Presenta una tipica forma a campana, è unimodale e simmetrica, presenta il punto di massimo in corrispondenza della media, coincidente con mediana e moda, e tende a zero man mano che la distribuzione tende asintoticamente a -∞ e + ∞. Al centro della distribuzione, la curva si presenta più o meno dispersa e la misura della dispersione intorno alla media è data dalla deviazione standard. Media e deviazione standard sono detti rispettivamente il parametro di locazione e di scala della distribuzione Curva degli errori accidentali L’errore accidentale è l’errore di misura che si commette per un insieme di cause tra loro indipendenti e non individuabili Gli errori accidentali mediamente si annullano La probabilità di un errore di segno positivo è uguale alla probabilità di un errore di segno negativo All’aumentare dell’entità dell’errore, la probabilità di commetterlo si riduce. Al limite, la probabilità di commettere un errore infinitamente grande è uguale a zero. Distribuzione Normale La v.c. Normale X, è una v.c. continua che può assumere valori su tutto l’asse reale. La funzione di densità è data da: 1 f(x) 2 EX V X 2 4 1 x e 2 2 - 2>0 Distribuzione Normale 0,75 0,60 0,45 N(0;1) 0,30 0,15 0,00 5 -4,5 -3,0 -1,5 0,0 1,5 3,0 4,5 Distribuzione Normale 0,45 =0 =1 =2 =3 0,0 1,5 3,0 =4 =5 0,30 0,15 0,00 6 -1,5 4,5 6,0 7,5 Esistono una doppia infinità di curve, per ogni possibile valore di μ e σ2 Volendo calcolare la probabilità che x sia compreso entro due possibili valori x1 ed x2, vi sono due possibilità: 1. Si calcola l’integrale della funzione normale nell’intervallo [x1,x2] 2. Si trasforma la funzione normale con parametri μ e σ2 nella distribuzione normale standard per la quale gli integrali sono stati calcolati e tabulati Distribuzione Normale Proprietà Ogni trasformazione lineare di una v.c. Normale è ancora una v.c. Normale La somma di due v.c. Normali indipendenti è ancora una v.c. Normale con media e varianza pari, rispettivamente, alla somma delle medie e delle varianze delle due v.c. Normali. 8 Curtosi ipernormale Normale iponormale indice di curtosi di Pearson E X - E X SD X 4 k indice di curtosi di Fisher = - 3 9 >0 se leptocurtica =0 mesocurtica <0 platicurtica 4 xi M ni i 1 N 4 3 La curva normale è simmetrica e mesocurtica La linea blu descrive la funzione di densità Normale e l’area ad essa sottesa è pari ad 1. Ciascuna porzione dell’area misura una probabilità La v.c. Normale Standardizzata Z Se la v.c. X ha una distribuzione normale con parametri e 2, allora Z= (X- )/ è ancora una v.c. Normale con media nulla e varianza unitaria. 1 f(z) 2 0,30 0,15 0,95 11 0,00 -1,96 0,00 1,96 z2 e 2 Funzione di ripartizione Normale standardizzata z 1 z per ogni z 0 permette di semplificare i calcoli delle aree sottese dalla funzione di densità. Il calcolo dell’area sottesa nell’intervallo [-2,2] 2 2 2 1 2 22 1 2 0,977 1 0,954 0.977 0.8 0.6 0.4 0.2 0.0 -3.50 12 -1.75 0.00 2.00 3.50 La Normale standard E’ la curva normale avente media zero e varianza 1 Attraverso una semplice trasformazione lineare è possibile passare da una qualunque curva Normale alla Normale standard z x Attraverso la trasformazione inversa è possibile tornare dalla Normale standard ad una qualunque curva Normale con media μ e deviazione standard σ x z * Utilizzando la distribuzione normale è possibile calcolare la probabilità che un’osservazione abbia un valore superiore (o inferiore) ad una determinata soglia. 68.2% -2 -1 +1 +2 +1 +2 95.4% -2 L’area compresa nell’intervallo 3 -1 è uguale a 99.7% 1.645 1.96 2.33 2.58 Si supponga che la distribuzione delle stature sia normale con media 170 e deviazione standard 4 cm. Calcolare: Pr ob168.8 X 170.1 168.8 170 0.3 4 170.1 170 z2 0.025 4 z1 1. Si standardizzano i valori: P2 P1 -0.3 0.025 Pr ob 0.3 z 0.025 1 P1 P2 1 0.382 0.488 0.13 Si supponga che la distribuzione delle stature sia normale con media 170 e deviazione standard 4 cm. Calcolare: Pr ob170.1 X 172 170.1 170 0.025 4 172 170 z2 0 .5 4 z1 1. Si standardizzano i valori: P1 P2 0.025 0.5 Pr ob0.025 z 0.5 P1 P2 0.488 0.309 0.179 Si supponga che la distribuzione delle stature sia normale con media 170 e deviazione standard 4 cm. Calcolare il 15° Percentile: 1. Si determina il percentile della normale standardizzata che stacca alla coda inferiore una probabilità pari a 0.15: 15% Z=-1.04 x=165.84 z0.15 1.04 x0.15 170 1.04 * 4 165.84 Si supponga che la distribuzione delle stature sia normale con media 170 e deviazione standard 4 cm. Calcolare il 65° Percentile: 1. Si determina il percentile della normale standardizzata che stacca alla coda inferiore una probabilità pari a 0.65 e quindi alla coda superiore lo 0.35: z0.65 0.39 x0.65 170 0.39 * 4 171.56 65% z=0.39 x=171.56