OD PROBABILITÀ 94 OD FENOMENI CASUALI La probabilità si occupa di fenomeni casuali fenomeni di cui, a priori, non si sa quale esito si verificherà. Esempio Lancio di una moneta Testa o Croce ? 95 OD DEFINIZIONI DI PROBABILITÀ PROBABILITÀ CLASSICA o A PRIORI È calcolata con ragionamento astratto, non sperimentalmente. La probabilità p(E) di un evento casuale E è data da: p(E ) = m n ° casi − favorevoli = N n ° casi − possibili I casi possibili sono mutuamente esclusivi, equiprobabili e numerabili. Esempio Qual è la probabilità di ottenere 5 lanciando un dado? p( E ) = m 1 = = 0.167 = 16.7% N 6 96 OD PROBABILITÀ A POSTERIORI o FREQUENZA RELATIVA È calcolata a posteriori dopo aver ripetuto più volte lo stesso esperimento. Esempio Lanciamo una moneta N volte e calcoliamo quante volte (m) si verifica l’evento “Testa”. La frequenza relativa di T è P(T) = m/N. Se N=100 e m=43 m 43 p (T ) = = = 0 . 43 N 100 Prima dell’esperimento ci si aspettava che P(T) = P(C) = 0.50. 97 OD PROBABILITÀ CLASSICA E PROBABILITÀ FREQUENTISTA Per N tendente a infinito P(T) = P(C) = 0.50. La probabilità p(E) di un evento casuale E è il valore limite cui tende la sua frequenza relativa all’aumentare del numero di osservazioni. m p ( E ) = lim N → ∞ N 98 OD 99 OD DISTRIBUZIONI DI PROBABILITÀ 100 OD DISTRIBUZIONI DI PROBABILITÀ Dagli archivi del reparto di ostetricia di un piccolo ospedale di provincia risulta che la probabilità che si verifichino 0, 1, 2, 3, 4 o più nascite in una settimana è rispettivamente uguale a 0.72, 0.14, 0.07, 0.06 e 0.01. È possibile sintetizzare la situazione come segue: Numero di nascite (X=x) Probabilità (X=x) 0 0.72 1 0.14 2 0.07 3 0.06 ≥4 0.01 La tabella è un esempio di distribuzione di probabilità. 101 OD La distribuzione di probabilità di una variabile casuale (X) è un elenco di tutti i possibili valori che la variabile può assumere e delle relative probabilità. La somma di queste probabilità è uguale a 1, poiché i possibili esiti (1 nascita, 2 nascite, …) sono mutuamente esclusivi ed esaustivi. Una distribuzione di probabilità può essere illustrata anche da un grafico. 0,8 0,7 0,6 P(X) 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 ≥4 N° di nati / settimana (X) 102 OD Un altro esempio Lanciando un dado qual è la probabilità che esca 1, che esca 2, …., che esca 6? N° uscito (X) 1 2 3 4 5 6 P(X) 1/6=0.17 1/6=0.17 1/6=0.17 1/6=0.17 1/6=0.17 1/6=0.17 0,20 P(X) 0,15 0,10 0,05 0,00 1 2 3 4 5 6 N° uscito (X) 103 OD DISTRIBUZIONI DI PROBABILITÀ EMPIRICHE IPOTETICHE (o teoretiche) Descrivono set di dati realmente osservati (primo esempio). Descrivono dati che si può prevedere di osservare, sotto date condizioni (secondo esempio). N.B.: una distribuzione di frequenza diventa distribuzione di probabilità per un numero di esperimenti tendente ad infinito. 104 OD DISTRIBUZIONI DI PROBABILITÀ DI VARIABILI CONTINUE LA DISTRIBUZIONE NORMALE 105 OD DISTRIBUZIONI DI PROBABILITÀ DI VARIABILI CONTINUE VARIABILI DISCRETE VARIABILI CONTINUE Possono assumere solo Possono assumere qualsiasi valore particolari valori entro un entro un dato intervallo. dato intervallo. Grafico: diagramma a colonne Grafico: istogramma o poligono di distanziate frequenza ↓ ↓ tante colonne quanti i valori tante colonne quanti i valori assunti assunti infiniti valori → infinite colonne ↓ all’aumentare del n° di osservazioni il profilo del poligono di frequenza tende a diventare “liscio” f ( f(x) x x 106 OD L’AREA SOTTESA ALLA CURVA f(x ) x La probabilità che la variabile assuma un ben determinato valore puntuale è nulla: n° eventi favorevoli Pr (X=x) = —————————— = n° totale eventi 1 —=0 ∞ Tuttavia è possibile chiedersi: qual è la probabilità che una osservazione sia minore (o maggiore) di un certo valore, o sia compresa tra due valori? 107 OD 1. Pr(X<x0) Dato un valore x0, la probabilità che la variabile X assuma un valore minore di x0 è la parte di area che sta prima di x0. f(x ) x0 x 2. Pr(X>x0) Dato un valore x0, la probabilità che la variabile X assuma un valore maggiore di x0 è la parte di area che sta dopo x0. f(x ) x0 x 108 OD 3. Pr(x0<X<x1) Dati due valori x0 e x1, la probabilità che la variabile X assuma un valore compreso tra x0 e x1 è la parte di area compresa tra x0 e x1. f(x ) x0 x1 x 109 OD LA DISTRIBUZIONE NORMALE È una particolare distribuzione di probabilità continua. f(x) Area = 1 σ σ µ= moda = mediana x Asse di simmetria x = µ • • • • Ha forma a campana; è simmetrica rispetto ad un asse centrale x = µ; media µ, moda e mediana coincidono; la deviazione standard σ della variabile è una misura di dispersione della campana; • la distribuzione normale è completamente determinata dai parametri µ e σ; • area sottesa alla curva = 1. Molte variabili biomediche (PAS/PAD, Altezza. Peso, Livelli ematici) seguono una distribuzione approssimativamente normale. 110 OD µeσ Parametri della Distribuzione Normale N(0,1.8) N(-5,1.8) N(5,1.8) 0,25 0,2 0,15 0,1 0,05 0 -12 -10 -8 -6 -4 -2 0 2 µ variabile 4 6 8 10 12 σ costante N(0,2) N(0,1) N(0,0.5) 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 -5 -4 -3 -2 -1 µ costante 0 1 2 3 4 5 σ variabile 111 OD SUDDIVISIONE DELL’AREA SOTTO LA CURVA NORMALE µ ± σ → 68% 0.68 σ µ-σ σ µ+σ µ x µ ± 2σ → 95% 0.95 2σ µ - 2σ 2σ µ + 2σ µ x µ ± 3σ → 99.7% 0.997 3σ µ - 3σ 3σ µ µ + 3σ x 112 OD DISTRIBUZIONE NORMALE STANDARDIZZATA Una distribuzione normale si dice “standard” se se µ=0 e σ=1 0,4 0,3 0,2 0,1 0 -4 -3 -2 -1 0 1 2 3 4 µ = Moda = Mediana = 0 Punti di inflessione alle ascisse + 1 Area sottesa alla curva = 1 Asse di simmetria → x = 0 113 OD DALLA DISTRIBUZIONE NORMALE ALLA NORMALE STANDARDIZZATA È possibile standardizzare una variabile casuale normale X mediante la trasformazione: Z= X−µ σ Molti testi contengono le cosiddette Tavole della distribuzione normale, dove, per una griglia discreta di valori z, sono riportate le probabilità P(Z < z) sotto la normale standard. 114 OD APPLICAZIONI DELLA DISTRIBUZIONE NORMALE Quando si sa (o si può assumere) che variabili casuali sono, almeno approssimativamente, distribuite in modo normale è possibile rispondere a domande di tipo probabilistico su di esse. Esempio 1 Pr(X<x0) (Daniel 4.7.1 pag.102) Da uno studio condotto sulla malattia di Alzheimer, Dusheiko ha riportato i dati che sono compatibili con l’ipotesi che il peso del cervello delle vittime della malattia si distribuisca normalmente. Dai dati possiamo calcolare una media di 1076.80 grammi e una deviazione standard di 105.76 grammi. Se assumiamo che questi risultati siano applicabili a tutte le vittime della malattia di Alzheimer, trova la probabilità che una vittima della malattia, scelta a caso, abbia un cervello che pesa meno di 800 grammi. 115 OD Soluzione In primo luogo è utile rappresentare graficamente la distribuzione, tratteggiando l’area che corrisponde alla probabilità richiesta. f (x) x 800 µ=1076.80 Peso cervello(g) Se la distribuzione fosse normale standard, potremmo facilmente determinare la probabilità richiesta, usando le tavole apposite. Trasformiamo i valori di x nei corrispondenti valori di z usando la seguente formula: z= x−µ σ 800 − 1076.80 = = −2.62 105.76 116 OD Rappresentiamo graficamente: f (x) x 800 µ=1076.80 Peso cervello(g) z -2,62 0 Dalle tavole risulta che l’area a sinistra di z=-2.62 è 0.0044. P(x<800) = P(z<-2.62) = 0.0044 La probabilità che un paziente scelto a caso abbia un peso del cervello minore di 800 grammi è uguale a 0.0044 (0.44%). 117 OD Esempio 2 Pr(x0<X<x1) (Daniel 4.7.2 pag.104) Supponiamo di conoscere che la statura di una certa popolazione di individui sia approssimativamente distribuita come una normale con media di 70 pollici e deviazione standard di 3 pollici. Qual è la probabilità che una persona estratta a caso da questo gruppo sia alta fra 65 e 74 pollici? Calcoliamo gli opportuni valori di z e rappresentiamo graficamente: z1 = x1 − µ σ = 65 − 70 = −1,67 3 z2 = x2 − µ σ = 74 − 70 = 1,33 3 f (x) Pr(65<x<74) = ? x 0 65 70 74 Statura (pollici) z -1,67 0 +1,33 118 OD Dalle tavole risulta che l’area tra - ∞ e 1.33 è 0.9082 l’area tra - ∞ e –1.67 è 0.0475. L’area richiesta è la loro differenza: P(65<x<74) = P(-1,67<z<1,33) = = P(z<1,33) - P(z<-1,67) = = 0,9082-0,0475=0,8607=86.07%. 119 OD Esempio 3 Pr(X>x0) (Daniel 4.7.3 pag.105) Determinare la probabilità che una persona scelta a caso dalla popolazione sia alta 77 pollici o più. Calcoliamo il graficamente: z = x − µ σ = valore di z e rappresentiamo 77 − 70 = 2 , 33 3 f (x) Pr(x>77) =1 –Pr(x<77) = ? x 0 70 77 Statura (pollici) z 0 +2,33 Poiché le tavole riportano le aree comprese tra -∞ e un dato valore (cioè la probabilità che z sia minore di un dato valore), possiamo calcolare la probabilità richiesta nel modo seguente: P(x>77) = 1 - P(x<77) = 1 - P(z<2,33) = 1 - 0,9901 = 0,0099 = 0.99% 120