leggi dei grandi numeri

LEGGI DEI GRANDI NUMERI
Esiste un insieme di teoremi che riguardano la convergenza di una successione di v.a. ad
una costante.
Queste leggi si definiscono deboli se la successione converge in probabilità ad una
costante, forti se la successione converge quasi certamente alla costante.
VERSIONE INTUITIVA DELLE LEGGI DEI GRANDI NUMERI
La legge dei grandi numeri, detta anche legge empirica del caso oppure teorema di
Bernoulli (in quanto la sua prima formulazione è dovuta a Jakob Bernoulli), descrive il
comportamento della media di una sequenza di n v.a. indipendenti e caratterizzate dalla
stessa distribuzione di probabilità (n misure della stessa grandezza, n lanci della stessa
moneta ecc.) al tendere ad infinito della numerosità della sequenza stessa (n). In altre
parole, grazie alla legge dei grandi numeri, possiamo fidarci che la media che calcoliamo a
partire da un numero sufficiente di campioni sia sufficientemente vicina alla media vera.
In termini generici, per la legge dei grandi numeri si può dire:


che la media della sequenza è una approssimazione, che migliora al crescere di n,
della media della distribuzione;
e che, viceversa, si può prevedere che sequenze siffatte mostreranno una media
tanto più spesso e tanto più precisamente prossima alla media della distribuzione
quanto più grande sarà n.
Un caso particolare di applicazione della legge dei grandi numeri è la previsione
probabilistica della proporzione di successi in una sequenza di n realizzazioni indipendenti
di un evento E: per n che tende a infinito, la proporzione di successi converge alla
probabilità di E (vedi l’esempio riportato più sotto).
LEGGE FORTE DEI GRANDI NUMERI
Se, data una successione di variabili casuali X1,X2,...,Xn,... indipendenti e identicamente
distribuite con media μ, si considera la media calcolata
la legge (forte) dei grandi numeri afferma che
ossia la media campionaria converge quasi certamente alla media comune delle Xi.
LEGGE DEBOLE DEI GRANDI NUMERI
Se, data una successione di variabili casuali X1,X2,...,Xn,... aventi la stessa media μ, la
stessa varianza finita e indipendenti, si considera la media campionaria
la legge (debole) dei grandi numeri afferma che per ogni
:
ossia la media campionaria converge in probabilità alla media comune delle Xi.
Esempio.
Supponiamo di avere un evento (come il fatto che lanciando un dado esca il sei) con
probabilità sconosciuta p (sconosciuta perché il dado potrebbe essere truccato, o
semplicemente difettoso: non possiamo saperlo in anticipo).
Eseguendo n lanci consecutivi otteniamo una stima della probabilità di fare sei con quel
dado, data da
dove le X della somma rappresentano l'esito dei lanci e valgono uno se in quel lancio è
uscito il sei, o zero se è uscito un altro numero. La legge dei grandi numeri afferma
semplicemente che, tante più prove usiamo per calcolare la stima, tanto più questa sarà
vicina, probabilmente, alla probabilità reale dell'evento p.
Se la stima X(n) che calcoleremo sarà molto vicina a un sesto, che è la probabilità teorica
che esca il sei per un dado perfetto, potremo essere ragionevolmente certi che il dado in
questione non è polarizzato per il sei (per essere sicuri che il dado non sia truccato in
nessun modo dovremmo ripetere il test anche per gli altri cinque numeri). Che cosa
significhi ragionevolmente sicuri dipende da quanto vogliamo essere precisi nel nostro
test: con dieci prove avremmo una stima grossolana, con cento ne otterremmo una molto
più precisa, con mille ancora di più e così via: il valore di n che siamo disposti ad accettare
come sufficiente dipende dal grado di casualità che riteniamo necessario per il dado in
questione.
VERSIONE FORMALE DELLE LEGGI DEI GRANDI NUMERI
Data la successione Xn di v.a. indipendenti generate da prove bernoulliane, distribuite in
modo identico, facciamo l’assunzione che per ciascuna v.a. la probabilità che si verifichi il
successo sia costante e pari a p.
Quindi
-
ciascuna v.a. Xn assume valore 1 con probabilità p e valore 0 con probabilità 1-p
la successione Xn distribuita in modo bernoulliano con parametro p rappresenta un
processo bernoulliano con un parametro p che si può vedere sia come la
probabilità dell’ evento E che il valor medio di Xn .
Le somme parziali costituiscono una v.a. che rappresenta la frequenza assoluta dei
successi in n prove bernoulliane:
S1  X 1
S2  X1  X 2
S 3  X 1  X 2  X 3 ....
Sn  X1  X 2  X 3  X n
Chiamiamo questa v.a. SnBin(n,p) con valor medio e varianza
E (S n )  np
Var( S n )  np(1  p)
n
S
X  X 2  ...  X n
La successione Fn  n  1

n
n
X
i 1
i
n
si può vedere come la frequenza relativa dei successi. Ha valor medio e varianza
E ( Fn ) 
np
p
n
Var ( Fn )  Var (
Sn
Var ( S n ) np(1  p) p(1  p)
)


n
n
n2
n2
Si osserva che il valor medio è costante al variare di n, mentre la varianza tende a 0 al
crescere di n.
LEGGI DEBOLI DEI GRANDI NUMERI
LEGGE DEBOLE DEI GRANDI NUMERI (versione Khintchine)
Se X n è una successione di v.a. indipendenti ed identicamente distribuite con valor medio
comune E(X)=p, per qualsiasi >0 si ha che la successione Fn converge in probabilità a p,
ossia
p
Fn 

p
LEGGE DEBOLE DEI GRANDI NUMERI PER PROVE BERNOULLIANE (Bernoulli)
Se XnBer(p), la frequenza relativa con cui l’evento si realizza in n prove indipendenti Fn
converge in probabilità al valore di probabilità associato all’evento:
p
Fn 

p
Possiamo riscrivere questa espressione come
lim
S
P( n  p   )  0
n  
n
Questo significa che l’evento (
l’evento (
Sn
 p   ) è molto improbabile al crescere di n, mentre
n
Sn
 p   ) diviene certo.
n
Questo è il motivo per la cui la legge dei grandi numeri si accosta alla legge empirica del
caso.
LEGGE DEBOLE DEI GRANDI NUMERI PER PROVE BERNOULLIANE DIFFERENTI
(Poisson)
Se XnBer(p) è una successione di v.a. indipendenti, allora per ogni >0 si ha
n
lim
P( Fn 
n  
p
i 1
n
i
 ) 1
LEGGI FORTI DEI GRANDI NUMERI
LEGGE FORTE DEI GRANDI NUMERI PER PROVE BERNOULLIANE (Borel)
Viene sostituita nella formula di Bernoulli la convergenza in probabilità con la convergenza
quasi certa.
Se XnBer(p) , allora la successione Fn converge quasi certamente alla convergenza in
probabilità p,
qc
Fn 
p
LEGGE FORTE DEI GRANDI NUMERI (Kolmogorov)
Se Xn è una successione di v.a. indipendenti aventi ciascuna valor medio E(Xi)=pi e
varianze  i2 uniformemente limitate, allora la successione sotto riportata tende a zero:
n
Fn 
p
i 1
n
i
qc

0
TEOREMA LIMITE CENTRALE
Un gruppo di risultati teorici ha portato a dimostrare che, sotto certe condizioni, somma (e
quindi media ) di v.a. di qualsiasi tipo convergono alla v.a. normale.
Si consideri una successione X n di v.a. indipendenti ed identicamente distribuite con
valor medio comune E(Xn)= e varianza
Var(Xn)=2<+,
la v.a. somma Sn ha valor medio e varianza
E ( S n )  n
Var ( S n )n 2
Queste grandezze però assumono valori infiniti per n tendente ad infinito.
Si utilizza allora la v.a. somma standardizzata
Zn 
S n  E (S n )
Var ( S n )

S n  n
 n
che ha valor medio e varianza pari a
E(Z n )  0
Var (Z n )  1
Una formulazione rigorosa del teorema limite centrale è stata data da De Moivre e
Laplace:
TEOREMA LIMITE CENTRALE (DE MOIVRE – LAPLACE)
La v.a. Sn somma di v.a. Xn statisticamente indipendenti ed identicamente distribuite, con
E(Xn)=p e Var(Xn)=p(1-p), converge in distribuzione ad una v.a. normale standardizzata:
Zn 
S n  np
np(1  p)
d


Z N(0,1)
Il teorema è applicabile nel caso di n   .Nella pratica si vede però che, anche se le
v.a. Xn non sono del tutto simmetriche, la v.a. Sn assume una distribuzione che
approssima bene la gaussiana già per n superiore a poche decine (a volte a poche unità).
Questo perché la sommia o la media di v.a. gaussiane ha sempre distribuzione normale, e
in virtù di questo teorema la gaussiana si può vedere come distribuzione limite di altre
distribuzioni (Bernoulli, Poisson, gamma, chi quadrato, Student, lognormale).
Possiamo dire che Zn può essere approssimato da Z purchè:
- le n v.a. abbiano la stessa distribuzione e n>30
- le n v.a. siano indipendenti e np>5 .
Questo teorema consente quindi di approssimare la distribuzione di una v.a. attraverso la
distribuzione della v.a. normale standardizzata.
-La media di n v.a. uniformi per n2 presenta distribuzioni unimodali e simmetriche che
tendono velocemente alla v.a. normale standardizzata.
La distribuzione della somma di n=12 v.a. uniformi è un’ottima approssimazione della
funzione densità della v.a. normale standardizzata ed era un tempo utilizzata per la
generazione dei numeri pseudocasuali normali, ottenuti con l’estrazione (con ripetizione)
da un’urna contenente le 10 cifre.
-Data una v.a. binomiale XBin(n,p) , se vista come somma di n v.a. bernouliiane di
parametro p, se n è grande e p non è prossimo allo zero, la v.a. X può essere
approssimata da una distribuzione normale standardizzata:
Z
X  np
np (1  p)
in cui l’approssimazione da v.a. a continua si può effettuare considerando che ad un
singolo valore della prima corrisponda un intervallo di valori della seconda.
-Data una v.a. di Poisson XPo() , X converge in distribuzione ad una v.a. normale, e se
 è grande (si indica spesso 18) X può essere approssimata da una v.a. normale avente
valor medio  e varianza .
-La v.a. chi-quadrato è data dalla somma di v.a. normali standardizzate e indipendenti al
quadrato.
Le considerazioni riportate sopra motivano l’importanza della distribuzione normale in tutti
gli studi statistici e probabilistici di distribuzione, e giustificano teoricamente l’osservazione
secondo la quale molti fenomeni composti da diverse componenti hanno distribuzione
empirica normale.