lezione28-29:Variabili aleatorie discrete(15 e 18--04-13)

Modelli matematici di fenomeni aleatori
Variabilità e casualità
La casualità è alla base della scelta degli individui che
compongono un campione ai fini di un’indagine statistica.
La casualità è alla base degli errori di misurazione Il numero di chiamate che arrivano ad un centralino
telefonico in un dato intervallo di tempo, in un dato luogo
Il numero di battiti cardiaci di un dato individuo dopo una
prova da sforzo
La percentuale di pezzi difettosi prodotti da un dato
macchinario
Sono esempi di grandezze variabili rappresentate da
numeri a priori non noti
Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Ciascuna di queste grandezze può assumere valori diversi,
e non si può stabilire in anticipo quale valore la grandezza
assumerà in una singola osservazione, perché essa si
presenta in modo non prevedibile con certezza; sarà solo
possibile cercare di valutare a priori con che probabilità
essa può assumere ciascuno dei valori possibili.
Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Ogni volta che associamo ad un’unità non ancora
osservata del collettivo in esame una caratteristica che lo
contraddistingue, espressa attraverso un valore numerico e
non nota a priori, otteniamo una variabile aleatoria. La variabile aleatoria è il modello astratto della variabile
statistica.
Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Ad esempio, se ci interessa controllare se un dato
individuo scelto a caso in una data popolazione ha o no
una certa caratteristica C, potremo codificare l’evento con
il numero 1 se l’individuo presenterà la caratteristica C,
codificheremo con 0 l’evento contrario (l’individuo non
presenta C). Abbiamo appena definito una variabile aleatoria che può
assumere due soli valori 1, 0. Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Se scommettiamo sul risultato del lancio di un dado con la
regola di guadagnare 4 euro se esce il 6 e di pagare 1 euro
per qualunque altro risultato, avremo ancora una v.a.
dicotomica che vale +4 se si realizza l’evento “esce il 6”,
mentre assume il valore -1 se l’evento “esce il 6” non si
realizza. Indichiamo con X questa v.a., se il dado non è
truccato, possiamo dire che P(X=4)=1/6, P(X=-1)=5/6
Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Una variabile aleatoria si dice discreta se può assumere
un numero finito o un’infinità numerabile di valori; si
dice, invece, continua se può assumere i valori in tutto R o
in un suo sottoinsieme continuo.
Una variabile aleatoria discreta corrisponde ad un carattere
quantitativo discreto, una variabile aleatoria continua ad un
carattere continuo.
Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Supponiamo di avere due dadi regolari distinguibili le cui
facce siano numerate da 1 a 6. Se i dadi vengono lanciati e
i numeri sulle facce superiori vengono registrati come
coppia ordinata, l’insieme dei possibili risultati elementari
è rappresentato da un insieme contenente 36 elementi.
Se si suppone che i dadi siano regolari, allora ciascuno di
questi 36 risultati ha probabilità 1/36
Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Supponiamo ora che sia data una funzione che associ ad
ogni risultato, cioè ad ogni coppia (a,b), la somma dei
punti realizzati nei due lanci, cioè il numero a + b.
Ad ogni elemento viene quindi associato un elemento
dell’insieme numerico T = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.
La funzione X definita sopra è una variabile aleatoria
discreta. E’ possibile determinare facilmente con che probabilità
tale legge associa ad un risultato elementare uno o l’altro
degli elementi di T.
Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Si definisce
distribuzione di probabilità di una variabile
aleatoria X discreta, la relazione che ad ogni valore x,
assumibile da X, fa corrispondere la probabilità
dell’evento {X=x}. Modelli matematici di fenomeni aleatori:
Variabili aleatorie
Anche per una variabile aleatoria X, in analogia al
caso statistico, si definisce la funzione di
ripartizione che ad ogni valore x, assumibile da X,
associa la probabilità che X sia non superiore a x:
F(x) = P(X ≤ x)
Variabili aleatorie discrete:valor medio
Sia X una variabile aleatoria discreta con un numero finito
di valori; ai valori x1, x2, x3, ..., xn corrispondono
rispettivamente le probabilità p1, p2, p3, ..., pn. Si dice
valore atteso, o speranza matematica, o semplicemente
media di X la media aritmetica ponderata di tali valori
(assumendo le probabilità come pesi), ovvero il valore
E(X):
n
E ( X ) = ∑ xi pi
i =1
Variabili aleatorie discrete:valor medio
La media di una variabile aleatoria, se esiste, gode di
alcune proprietà:
-La media di una variabile aleatoria costante, è la costante
stessa.
-Se X è una variabile aleatoria e a e b sono delle costanti
allora:
E(aX+b) = aE(X)+b.
-La media della somma di due variabili aleatorie è uguale
alla somma delle medie delle singole variabili. Cioè:
E(X + Y) = E(X) + E(Y).
Variabili aleatorie discrete:scarto
Sia data una variabile aleatoria X, consideriamo la
differenza tra la variabile aleatoria X e la sua media:
X - E(X).
Questa nuova variabile aleatoria si chiama deviazione,
o variabile aleatoria scarto.
Si dimostra subito che: E(X - E(X)) = 0.
⇒La media della variabile aleatoria scarto è nulla.
Variabili aleatorie discrete:varianza
Sia X una variabile aleatoria discreta; si definisce
varianza di X, e si indica con σ2(X), la media del
quadrato della variabile aleatoria scarto:
σ2(X)=E[(X-E(X))2]
Vale a dire:
2
n
2
σ ( X ) = ∑ ( xi − E ( X )) pi
i =1
Variabili aleatorie discrete:varianza
Le principali proprietà della varianza della variabile X
sono le seguenti:
-Data X, di media E(X), risulta:
σ2(X) = E(X2) - E(X)2
-Se X è una variabile aleatoria, di media E(X), e a e b
sono costanti, risulta:
σ2(aX + b) = a2σ2(X). Variabili aleatorie discrete:deviazione
standard
Per caratterizzare la dispersione di una distribuzione di
probabilità, è più opportuno utilizzare una
grandezza, detta scarto quadratico medio, o scarto
standard o deviazione standard di X, data dalla
radice quadrata (aritmetica) della varianza:
σ(X) =√[σ2 (X)]
o, in forma più esplicita:
2
σ (X ) = E[( X − E ( X )) ]
Variabili aleatorie discrete:CV
Dalla proprietà 2. della varianza, per lo scarto
quadratico medio si ottiene:
σ(aX) = |a|σ(X);
σ(X + b) = σ(X).
Si definisce il coefficiente di variazione:
CV(X)= σ(X)/E(X).
Variabili aleatorie discrete standardizzate
Si verifica che, come nel caso statistico, la variabile Z
così definita:
X − E( X )
Z=
σ (X )
ha media pari a 0 e varianza e scarto standard pari a 1.
Tale variabile si dice standardizzata
Modelli per variabili discrete
Ci sono molti modelli diversi (o distribuzioni teoriche)
adatti per distribuzioni di variabili aleatorie discrete.
I due più comuni sono le distribuzioni Binomiale e
di Poisson, che forniscono modelli buoni per
rispondere a quesiti quali:
1) In una data popolazione una certa caratteristica C è
presente nel 21% dei casi. Prendendo un campione
casuale di 12 individui, qual è la probabilità che più
di 5 individui presentino la caratteristica C?
Modelli per variabili discrete
2)  Il numero medio di piantine per metro quadrato in
un appezzamento è 3. Qual’è la probabilità che in
un’area di 4 metri quadrati vi siano meno di 5
piantine? Al problema 1) si risponde utilizzando la distribuzione
binomiale.
Al problema 2) si risponde utilizzando la distribuzione
di Poisson.
Distribuzione binomiale
Abbiamo già introdotto la distribuzione binomiale per
le estrazioni con rimessa da un’urna contenente
biglie di vario colore e sappiamo che la probabilità
in n estrazioni con rimessa che si verifichi
esattamente k volte un dato evento di probabilità p è
data da
&n# k
P(X=k)= $$ !! p (1-p)n-k
%k "
Distribuzione binomiale: media e varianza
Per una distribuzione binomiale si ha:
E(X)=np
σ2(X)=np(1-p)
σ (X)=√[np(1-p)]
Distribuzione geometrica
Il tiratore imperturbabile
Un tiratore che spara contro un bersaglio fino a che non riesce a
colpirlo , ma ad ogni tentativo ha sempre la stessa probabilità p
di colpire il bersaglio (non impara dall’esperienza). La v.a.
numero delle prove necessarie prima di riuscire a colpire il
bersaglio è una v.a. discreta con una infinità numerabile di
valori,
0,1,2,3,….., k,…..
Con la seguente distribuzione di probabilità:
P(X=k)=p(1-p)k
Distribuzione geometrica: valor medio e
varianza
Si dimostra che il valor medio di una legge geometrica è 1/p,
mentre la varianza è data dal rapporto (1-p)/p2
Distribuzione di Poisson
In situazioni in cui un esperimento viene ripetuto un
numero n molto alto di volte e la probabilità p che
tale esperimento abbia esito positivo è molto bassa
in modo tale che il prodotto np = a rimanga circa
costante e non troppo elevato, in questi casi viene
utilizzata una distribuzione di probabilità dipendente
dal parametro a = np, detta distribuzione di Poisson
di parametro a.
Distribuzione di Poisson: media e varianza
Tale distribuzione assegna ad ogni k∈{0, 1, 2, , ...}
la probabilità:
P(X = k) = (e-a ·ak ) /k!
si ha:
E(X) = a;
σ2(X) = a.
Alcuni esempi
TEST A RISPOSTA MULTIPLA: Ti viene richiesto
di rispondere ad un test composto da 20 domande a
risposta multipla: ogni risposta ha 4 alternative. Il
punteggio per ogni risposta giusta è 1 e per ogni
risposta non data o sbagliata è 0. Non sei preparato e
decidi di rispondere a caso ad ogni domanda, quale
sarà il tuo punteggio medio?
Per ogni domanda il punteggio medio sarà
1·1/4+0·3/4=0.25, quindi, per 20 domande sarà
20·0.25=5
Il tuo rendimento non è molto esaltante…..!
Alcuni esempi
TEST A RISPOSTA MULTIPLA: Il Prof. che
prepara il test vuole scoraggiare al massimo le
risposte a caso e quindi decide di assegnare un
punteggio negativo: (-1) alle tre risposte sbagliate.
Se continui a rispondere a caso, quale sarà il tuo
punteggio medio?
Stavolta avremo 1·(1/4) +(-1)(3/4)=-1/2, moltiplicato
per le 20 domande si ha un punteggio -10!
Alcuni esempi
Sapendo che una cellula in una data coltura cellulare
viene infettata in media da 2 virus, qual è la
probabilità che una data cellula venga infettata da
almeno un virus?
Indichiamo con X la v.a. che conta il numero di virus
che infettano una data cellula, si ha
P(X≥1) = 1 - P(X=0) = 1 - e-2 ≈0.86
Alcuni esempi
Un entomologo sta studiando un bruco divoratore di
foglie; esaminando 200 foglie di varie piante, vi ha
trovato presenti dei bruchi, secondo i numeri forniti
dalla seguente tabella:
N.
dei
0
1
2
3
≥4
bruchi
N.delle
140
48
10
2
0
foglie
Calcola il numero medio di bruchi per foglia. E’ ragionevole assumere che la distribuzione di bruchi sia
descritta da una legge di Poisson?
Alcuni esempi
Il numero medio di bruchi per foglia risulta 0.37, la
varianza circa 0.39, quindi abbastanza vicina al valore
della media
Possiamo calcolare il numero “atteso” di bruchi, nel
caso che la distribuzione sia di Poisson di parametro
a. Che valore dare ad a? Possiamo stimare a con la
media campionaria 0.37. Troveremmo P(X=0)=e-0.37≈0.69, da cui ,numero foglie stimate con
0 bruchi 200(0.69)=138, P(X=1)=(0.37)(0.69)=0.2553, da cui numero foglie
stimate con 1 bruco circa 51
Analogamente P(X=2)=0.2553(0.37)/2≈0.05, quindi
numero foglie con 2 bruchi circa 10
Alcuni esempi
P(X=3)=0.05(0.37)/3≈0.006, quindi numero foglie con
3 bruchi circa 1
Dunque numero foglie con ≥4 bruchi, 200-138-51-10-1=0
Riassumendo
N.bruchi N.foglie osservate
N.foglie “attese”
0
140
138
1
48
51
2
10
10
3
2
1
≥4
0
0
I valori osservati e gli “attesi” sono molto vicini e le
piccole differenze sembrano ragionevolmente rientrare
nella fluttuazione casuale