Modelli matematici di fenomeni aleatori Variabilità e casualità La casualità è alla base della scelta degli individui che compongono un campione ai fini di un’indagine statistica. La casualità è alla base degli errori di misurazione Il numero di chiamate che arrivano ad un centralino telefonico in un dato intervallo di tempo, in un dato luogo Il numero di battiti cardiaci di un dato individuo dopo una prova da sforzo La percentuale di pezzi difettosi prodotti da un dato macchinario Sono esempi di grandezze variabili rappresentate da numeri a priori non noti Modelli matematici di fenomeni aleatori: Variabili aleatorie Ciascuna di queste grandezze può assumere valori diversi, e non si può stabilire in anticipo quale valore la grandezza assumerà in una singola osservazione, perché essa si presenta in modo non prevedibile con certezza; sarà solo possibile cercare di valutare a priori con che probabilità essa può assumere ciascuno dei valori possibili. Modelli matematici di fenomeni aleatori: Variabili aleatorie Ogni volta che associamo ad un’unità non ancora osservata del collettivo in esame una caratteristica che lo contraddistingue, espressa attraverso un valore numerico e non nota a priori, otteniamo una variabile aleatoria. La variabile aleatoria è il modello astratto della variabile statistica. Modelli matematici di fenomeni aleatori: Variabili aleatorie Ad esempio, se ci interessa controllare se un dato individuo scelto a caso in una data popolazione ha o no una certa caratteristica C, potremo codificare l’evento con il numero 1 se l’individuo presenterà la caratteristica C, codificheremo con 0 l’evento contrario (l’individuo non presenta C). Abbiamo appena definito una variabile aleatoria che può assumere due soli valori 1, 0. Modelli matematici di fenomeni aleatori: Variabili aleatorie Se scommettiamo sul risultato del lancio di un dado con la regola di guadagnare 4 euro se esce il 6 e di pagare 1 euro per qualunque altro risultato, avremo ancora una v.a. dicotomica che vale +4 se si realizza l’evento “esce il 6”, mentre assume il valore -1 se l’evento “esce il 6” non si realizza. Indichiamo con X questa v.a., se il dado non è truccato, possiamo dire che P(X=4)=1/6, P(X=-1)=5/6 Modelli matematici di fenomeni aleatori: Variabili aleatorie Una variabile aleatoria si dice discreta se può assumere un numero finito o un’infinità numerabile di valori; si dice, invece, continua se può assumere i valori in tutto R o in un suo sottoinsieme continuo. Una variabile aleatoria discreta corrisponde ad un carattere quantitativo discreto, una variabile aleatoria continua ad un carattere continuo. Modelli matematici di fenomeni aleatori: Variabili aleatorie Supponiamo di avere due dadi regolari distinguibili le cui facce siano numerate da 1 a 6. Se i dadi vengono lanciati e i numeri sulle facce superiori vengono registrati come coppia ordinata, l’insieme dei possibili risultati elementari è rappresentato da un insieme contenente 36 elementi. Se si suppone che i dadi siano regolari, allora ciascuno di questi 36 risultati ha probabilità 1/36 Modelli matematici di fenomeni aleatori: Variabili aleatorie Supponiamo ora che sia data una funzione che associ ad ogni risultato, cioè ad ogni coppia (a,b), la somma dei punti realizzati nei due lanci, cioè il numero a + b. Ad ogni elemento viene quindi associato un elemento dell’insieme numerico T = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}. La funzione X definita sopra è una variabile aleatoria discreta. E’ possibile determinare facilmente con che probabilità tale legge associa ad un risultato elementare uno o l’altro degli elementi di T. Modelli matematici di fenomeni aleatori: Variabili aleatorie Si definisce distribuzione di probabilità di una variabile aleatoria X discreta, la relazione che ad ogni valore x, assumibile da X, fa corrispondere la probabilità dell’evento {X=x}. Modelli matematici di fenomeni aleatori: Variabili aleatorie Anche per una variabile aleatoria X, in analogia al caso statistico, si definisce la funzione di ripartizione che ad ogni valore x, assumibile da X, associa la probabilità che X sia non superiore a x: F(x) = P(X ≤ x) Variabili aleatorie discrete:valor medio Sia X una variabile aleatoria discreta con un numero finito di valori; ai valori x1, x2, x3, ..., xn corrispondono rispettivamente le probabilità p1, p2, p3, ..., pn. Si dice valore atteso, o speranza matematica, o semplicemente media di X la media aritmetica ponderata di tali valori (assumendo le probabilità come pesi), ovvero il valore E(X): n E ( X ) = ∑ xi pi i =1 Variabili aleatorie discrete:valor medio La media di una variabile aleatoria, se esiste, gode di alcune proprietà: 1. La media di una variabile aleatoria costante, è la costante stessa. 2. Se X è una variabile aleatoria e a e b sono delle costanti allora: E(aX+b) = aE(X)+b. 3. La media della somma di due variabili aleatorie è uguale alla somma delle medie delle singole variabili. Cioè: E(X + Y) = E(X) + E(Y). Variabili aleatorie discrete:scarto Sia data una variabile aleatoria X, consideriamo la differenza tra la variabile aleatoria X e la sua media: X - E(X). Questa nuova variabile aleatoria si chiama deviazione, o variabile aleatoria scarto. Si dimostra subito che: E(X - E(X)) = 0. ⇒La media della variabile aleatoria scarto è nulla. Variabili aleatorie discrete:varianza Sia X una variabile aleatoria discreta; si definisce varianza di X, e si indica con σ2(X), la media del quadrato della variabile aleatoria scarto: σ2(X)=E[(X-E(X))2] Vale a dire: 2 n 2 σ ( X ) = ∑ ( xi − E ( X )) pi i =1 Variabili aleatorie discrete:varianza Le principali proprietà della varianza della variabile X sono le seguenti: 1. Data X, di media E(X), risulta: σ2(X) = E(X2) - E(X)2 2. Se X è una variabile aleatoria, di media E(X), e a e b sono costanti, risulta: σ2(aX + b) = a2σ2(X). Variabili aleatorie discrete:deviazione standard Per caratterizzare la dispersione di una distribuzione di probabilità, è più opportuno utilizzare una grandezza, detta scarto quadratico medio, o scarto standard o deviazione standard di X, data dalla radice quadrata (aritmetica) della varianza: σ(X) =√[σ2 (X)] o, in forma più esplicita: 2 σ (X ) = E[( X − E ( X )) ] Variabili aleatorie discrete:CV Dalla proprietà 2. della varianza, per lo scarto quadratico medio si ottiene: σ(aX) = aσ(X); σ(X + b) = σ(X). Si definisce il coefficiente di variazione: CV(X)= σ(X)/E(X). Variabili aleatorie discrete standardizzate Si verifica che, come nel caso statistico, la variabile Z così definita: X − E( X ) Z= σ (X ) ha media pari a 0 e varianza e scarto standard pari a 1. Tale variabile si dice standardizzata Modelli per variabili discrete Ci sono molti modelli diversi (o distribuzioni teoriche) adatti per distribuzioni di variabili aleatorie discrete. I due più comuni sono le distribuzioni Binomiale e di Poisson, che forniscono modelli buoni per rispondere a quesiti quali: 1) In una data popolazione una certa caratteristica C è presente nel 21% dei casi. Prendendo un campione casuale di 12 individui, qual è la probabilità che più di 5 individui presentino la caratteristica C? Modelli per variabili discrete 2) Il numero medio di piantine per metro quadrato in un appezzamento è 3. Qual’è la probabilità che in un’area di 4 metri quadrati vi siano meno di 5 piantine? Al problema 1) si risponde utilizzando la distribuzione binomiale. Al problema 2) si risponde utilizzando la distribuzione di Poisson. Distribuzione binomiale Abbiamo già introdotto la distribuzione binomiale per le estrazioni con rimessa da un’urna contenente biglie di vario colore e sappiamo che la probabilità in n estrazioni con rimessa che si verifichi esattamente k volte un dato evento di probabilità p è data da n k P(X=k)= p (1-p)n-k k Distribuzione binomiale: media e varianza Per una distribuzione binomiale si ha: E(X)=np σ2(X)=np(1-p) σ (X)=√[np(1-p)] Distribuzione di Poisson In situazioni in cui un esperimento viene ripetuto un numero n molto alto di volte e la probabilità p che tale esperimento abbia esito positivo è molto bassa in modo tale che il prodotto np = a rimanga circa costante e non troppo elevato, in questi casi viene utilizzata una distribuzione di probabilità dipendente dal parametro a = np, detta distribuzione di Poisson di parametro a. Distribuzione di Poisson: media e varianza Tale distribuzione assegna ad ogni k∈{0, 1, 2, , ...} la probabilità: P(X = k) = (e-a ·ak ) /k! si ha: E(X) = a; σ2(X) = a. Alcuni esempi TEST A RISPOSTA MULTIPLA: Ti viene richiesto di rispondere ad un test composto da 20 domande a risposta multipla: ogni risposta ha 4 alternative. Il punteggio per ogni risposta giusta è 1 e per ogni risposta non data o sbagliata è 0. Non sei preparato e decidi di rispondere a caso ad ogni domanda, quale sarà il tuo punteggio medio? Per ogni domanda il punteggio medio sarà 1·1/4+0·3/4=0.25, quindi, per 20 domande sarà 20·0.25=5 Il tuo rendimento non è molto esaltante…..! Alcuni esempi TEST A RISPOSTA MULTIPLA: Il Prof. che prepara il test vuole scoraggiare al massimo le risposte a caso e quindi decide di assegnare un punteggio negativo: (-1) alle tre risposte sbagliate. Se continui a rispondere a caso, quale sarà il tuo punteggio medio? Stavolta avremo 1·(1/4) +(-1)(3/4)=-1/2, moltiplicato per le 20 domande si ha un punteggio -10! Alcuni esempi Sapendo che una cellula in una data coltura cellulare viene infettata in media da 2 virus, qual è la probabilità che una data cellula venga infettata da almeno un virus? Indichiamo con X la v.a. che conta il numero di virus che infettano una data cellula, si ha P(X≥1) = 1 - P(X=0) = 1 - e-2 ≈0.86 Alcuni esempi Un entomologo sta studiando un bruco divoratore di foglie; esaminando 200 foglie di varie piante, vi ha trovato presenti dei bruchi, secondo i numeri forniti dalla seguente tabella: N. dei bruchi 0 1 2 3 ≥4 N.delle foglie 140 48 10 2 0 Calcola il numero medio di bruchi per foglia. E’ ragionevole assumere che la distribuzione di bruchi sia descritta da una legge di Poisson? Alcuni esempi Il numero medio di bruchi per foglia risulta 0.37, la varianza circa 0.39, quindi abbastanza vicina al valore della media Possiamo calcolare il numero “atteso” di bruchi, nel caso che la distribuzione sia di Poisson di parametro a. Che valore dare ad a? Possiamo stimare a con la media campionaria 0.37. Troveremmo P(X=0)=e-0.37≈0.69, da cui ,numero foglie stimate con 0 bruchi 200(0.69)=138, P(X=1)=(0.37)(0.69)=0.2553, da cui numero foglie stimate con 1 bruco circa 51 Analogamente P(X=2)=0.2553(0.37)/2≈0.05, quindi numero foglie con 2 bruchi circa 10 Alcuni esempi P(X=3)=0.05(0.37)/3≈0.006, quindi numero foglie con 3 bruchi circa 1 Dunque numero foglie con ≥4 bruchi, 200-138-51-10-1=0 Riassumendo N.bruchi N.foglie osservate N.foglie “attese” 0 140 138 1 48 51 2 10 10 3 2 1 ≥4 0 0 I valori osservati e gli “attesi” sono molto vicini e le piccole differenze sembrano ragionevolmente rientrare nella fluttuazione casuale