Antonella Bodini
Istituto di Matematica Applicata e Tecnologie Informatiche
“E. Magenes” del CNR
Materiale ad uso dei ricercatori che hanno seguito il corso di
formazione interna in Statistica, edizione 2016.
STATISTICA
Variabili casuali continue
Le variabili aleatorie discrete
Principali densità discrete
E, Var
๐ธ ๐‘‹ =๐‘ฅ
๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ =
Unif.
๐‘ƒ(๐‘‹ = ๐‘ฅ๐‘– ) =1/n ,
๐‘– = 1, … , ๐‘› < ∞
Bern(p)
๐‘ƒ(๐‘‹ = 1)=p, ๐‘ƒ(๐‘‹ =0)=1-p
Bin(n,p)
(*)
๐‘› ๐‘˜
๐‘ƒ(๐‘‹ = ๐‘˜)=
๐‘ (1 − ๐‘)๐‘›−๐‘˜ ,
๐‘˜
๐‘˜ = 0,1, … , ๐‘›
๐ธ ๐‘‹ = ๐‘›๐‘
V๐‘Ž๐‘Ÿ ๐‘‹ = ๐‘›๐‘(1 − ๐‘)
Numero di
successi in n
prove
indipendenti e
identiche
Geom(p)
๐‘ƒ ๐‘‹ = ๐‘˜ = ๐‘(1 − ๐‘) , ๐‘˜ ≥ 0
๐ธ ๐‘‹ = (1 − ๐‘) ๐‘
๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ = (1 − ๐‘)/๐‘2
Tempo del primo
successo in prove
ripetute identiche
Po( )
๐‘ƒ ๐‘‹ = ๐‘˜ = ๐‘’ −๐œ† ๐œ†๐‘˜! , ๐‘˜ ≥ 0
๐ธ ๐‘‹ = ๐œ†, ๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ = ๐œ†
O distribuzione
degli eventi rari
๐‘›−1
๐‘˜
๐‘˜
(*) n=1 fornisce la Bernoulli(p)
๐‘ฅ๐‘– − ๐‘ฅ
2
๐ธ ๐‘‹ =๐‘
๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ = ๐‘(1 − ๐‘)
Ex. il dado
equilibrato.
Esito di una prova
con due soli
possibili risultati
V.a. assolutamente continua
๐‘
๐‘“ ๐‘ฅ ≥ 0 e integrabile
๐‘ƒ ๐‘Ž <๐‘‹ ≤๐‘ =๐น ๐‘ −๐น ๐‘Ž =
๐‘“ ๐‘ฅ ๐‘‘๐‘ฅ
๐‘Ž
+∞
๐‘“ ๐‘ฅ ๐‘‘๐‘ฅ = 1
๐‘ƒ ๐‘‹ = ๐‘Ž = 0 qualunque sia ๐‘Ž
−∞
f. ripartizione N(0,1)
1.0
0.4
N(0,1)
0.0
0.0
0.2
0.1
0.4
0.2
0.6
0.3
0.8
0.8413
-5
-4
-2
0
1
2
4
-4
-2
0
1
2
4
Valore atteso e varianza
๐ธ ๐‘‹ =
๐‘–=1,…,๐‘› ๐‘ฅ๐‘– ๐‘ƒ
๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ =
๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ =
๐ธ ๐‘‹ = ๐‘ฅ๐‘“ ๐‘ฅ ๐‘‘๐‘ฅ
๐‘‹ = ๐‘ฅ๐‘–
2
๐‘–=1,…,๐‘›(๐‘ฅ๐‘– −๐ธ(๐‘‹)) ๐‘ƒ
๐‘ฅ−๐ธ ๐‘‹
2
๐‘“ ๐‘ฅ ๐‘‘๐‘ฅ =
๐‘‹ = ๐‘ฅ๐‘– = ๐ธ ๐‘‹ 2 − ๐ธ 2 (๐‘‹)
๐‘ฅ 2 ๐‘“ ๐‘ฅ ๐‘‘๐‘ฅ − ๐ธ 2 ๐‘‹ = ๐ธ ๐‘‹ 2 − ๐ธ 2 ๐‘‹
๐ธ ๐‘Ž๐‘‹ + ๐‘ = ๐‘Ž๐ธ ๐‘‹ + ๐‘
๐‘‰๐‘Ž๐‘Ÿ ๐‘Ž๐‘‹ + ๐‘ = ๐‘Ž2 ๐‘‰๐‘Ž๐‘Ÿ(X)
๐ธ ๐‘‹+๐‘Œ =๐ธ ๐‘‹ +๐ธ ๐‘Œ
๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ + ๐‘Œ = ๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ + ๐‘‰๐‘Ž๐‘Ÿ ๐‘Œ + ๐ถ๐‘œ๐‘ฃ(๐‘‹, ๐‘Œ)
๐ถ๐‘œ๐‘ฃ ๐‘‹, ๐‘Œ =
๐‘–=1,…,๐‘›(๐‘ฅ๐‘– −๐ธ(๐‘‹))(๐‘ฆ๐‘– −๐ธ(๐‘Œ))๐‘ƒ(๐‘‹
๐ถ๐‘œ๐‘ฃ ๐‘‹, ๐‘Œ =
๐‘ฅ−๐ธ ๐‘‹
se X e Y sono indipendenti
= ๐‘ฅ๐‘– , ๐‘Œ = ๐‘ฆ๐‘– ) = ๐ธ(๐‘‹๐‘Œ) − ๐ธ(๐‘‹)๐ธ(๐‘Œ)
๐‘ฆ − ๐ธ ๐‘Œ ๐‘“ ๐‘ฅ, ๐‘ฆ ๐‘‘๐‘ฅ๐‘‘๐‘ฆ = ๐ธ ๐‘‹๐‘Œ − ๐ธ ๐‘‹ ๐ธ(๐‘Œ)
๐ถ๐‘œ๐‘ฃ ๐‘‹, ๐‘Œ = 0 e ๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ + ๐‘Œ = ๐‘‰๐‘Ž๐‘Ÿ ๐‘‹ + ๐‘‰๐‘Ž๐‘Ÿ ๐‘Œ
Densità note
Alcune ben note densità continue
Uniforme su
๐‘Ž, ๐‘
Gaussiana:
๐‘ต(๐, ๐ˆ๐Ÿ )
Gamma:
๐‘ฎ ๐œถ, ๐œท , ๐œถ >
๐ŸŽ, ๐œท > ๐ŸŽ
Esponenziale:
๐‘ฌ๐’™๐’‘ ๐€ , ๐€ > ๐ŸŽ
๐Œ๐Ÿ ๐’Œ
t-Student:
๐’• ๐‚ ,
๐‚>๐ŸŽ
๐‘“ ๐‘ฅ =1 ๐‘ − ๐‘Ž , ๐‘Ž < ๐‘ฅ < ๐‘
๐‘“ ๐‘ฅ =
(๐‘ฅ−๐œ‡)2
−
๐‘’ 2๐œŽ2
2๐œ‹๐œŽ 2 ,
๐‘ฅ∈๐‘…
E(X)
Var(X)
๐‘Ž+๐‘
2
(๐‘−๐‘Ž)2
12
๐œ‡ ∈๐‘…
๐œŽ2
๐›ผ๐›ฝ
๐›ผ๐›ฝ 2
1
๐œ†
๐‘˜
1
๐œ†
2๐‘˜
0, se ๐œˆ > 1
๐œˆ
๐œˆ−2 , se ๐œˆ > 2
๐‘ฅ
๐‘“ ๐‘ฅ =
−
๐‘ฅ ๐›ผ−1 ๐‘’ ๐›ฝ ,
1
๐›ฝ๐›ผ Γ ๐›ผ
(
shape,
๐‘ฅ>0
scale, 1/
๐‘“ ๐‘ฅ = ๐œ†๐‘’ −๐œ†๐‘ฅ ,
rate)
๐‘ฅ>0
Gamma(α = ๐‘˜ 2 , con α intero; ๐›ฝ = 2)
๐‘“ ๐‘ฅ =
Γ
๐œˆ+1
2
๐œˆ๐œ‹ Γ
๐œˆ
2
1+
๐œˆ+1
2 − 2
๐‘ฅ
๐œˆ
,
๐‘ฅ>0
Densità note
Gaussiana(0,1)
Gamma(5.5,1/3)
-1
0
1
2
3
4
0.0
0.0
0.0
0.1
0.1
0.1
0.2
0.2
0.2
0.3
0.3
0.4
0.3
0.4
0.5
0.5
0.4
Uniforme(0,2)
Script4.R
5
-4
-2
0
2
4
0
2
4
Chi.q(3)
8
10
0.5
0.4
0.20
-10
-5
0
5
10
0.0
0.0
0.00
0.1
0.05
0.1
0.2
0.10
0.2
0.3
0.15
0.3
6
Esp(2)
0.25
t-Student(4)
0
5
10
15
20
0
10
20
30
40
V.a. assolutamente continua
Gamma(2,2)
Gamma(2,2)
๐‘ƒ ๐‘‹ ≤ 4 = 0.594
0.10
0.10
0.05
0.05
0.15
0.15
๐‘ƒ 2.5 ≤ ๐‘‹ ≤ 6 = 0.445
0.00
0.00
๐‘ƒ ๐‘‹ > 10 = 0.04
0
4
5
(retini.R)
10
15
20
0
2.5
5 6.0
10
15
20
๐‘ฅ โˆถ ๐‘ƒ ๐‘‹ > ๐‘ฅ = 0.05
quantile di ordine 0.95
E adesso?
๏ฒ=0.548
E adesso?
E adesso?
E adesso?
Abbiamo descritto e sintetizzato dati
di varia forma, provenienti da un
qualche esperimento
I dati come
campione
casuale
Abbiamo introdotto la
probabilità come una misura
dell’incertezza sull’esito
dell’esperimento.
Abbiamo introdotto le variabili
aleatorie come quantità di
interesse legate all’esito di un
esperimento.
I dati come campione casuale
campione casuale
semplice:
È un campione
scelto per mezzo di
un meccanismo che
assegna
ad ogni unità della
popolazione la
stessa probabilità di
far parte del
campione. Questo
rende il campione
rappresentativo.
Il campione casuale
Un sottinsieme casuale di k u.s. da una popolazione finita di N
elementi può essere ottenuto col metodo delle estrazioni
dall’urna senza reimmissione: palline tutte uguali, indistinguibili
al tatto, numerate da 1 a N e ogni numero è univocamente
associato ad una u.s. Estrazione di k palline.
๐‘!
๐‘
=๐‘˜! ๐‘−๐‘˜ !
possibili
๐‘˜
campioni, tutti ugualmente probabili.
Si hanno quindi
Ex. 10 ragazzi, campione di 3 ragazzi per indagare sulla loro
altezza: 10 9 8 / 3 2 1 = 120 possibili terne.
Il campione casuale
La virtù del campionamento casuale sta più nella sua promessa
(di imparzialità fra le unità estratte e quindi fra i campioni)
e meno nel suo risultato occasionale
(l'effettivo campione che si produce in una particolare
situazione)
(A. Cazzola, Univ. Bologna)
Ex. 10 ragazzi, campione di 3 ragazzi per indagare sulla loro
altezza: 10 9 8 / 3 2 1 = 120 possibili terne.
h (in cm): 165, 177, 184, 173, 173, 168, 182, 160, 185, 174
Il campione casuale
Se la proporzione di credenti nell’aldilà è la stessa nei due sessi, p:
q=prop. di Femmine nella popolazione
Credenza nell’aldilà
FREQUENZE ATTESE
Sesso
Femmine
Maschi
Sì
No
nqp
nq(1-p)
n(1-q)p
n(1-q)(1-p)
np
nq
n(1-p)
n(1-q)
n
Credenza nell’aldilà
Sesso
Femmine
Maschi
Maschi
Sì
No
435
432,1
375
375
377,9
810=np
147
149,9
134
134
131,1
281
810=np
281
582=nq
๐‘ž=
582
=0.533
1091
509
509
n=1091
n=1091
๐‘=
810
=0.742
1091