Distribuzioni campionarie
Annibale Biggeri
Dipartimento di Statistica
Introduzione
Le Revisioni sistematiche o meta-analisi sono
revisioni e sintesi quantitative dei risultati di
studi simili ma condotti indipendentemente.
Tra il 1970 ed il 1986 abbiamo 13 RS rispetto
a 416 nel periodo 1993-96: 416
Studio Lido-R Ctrl-R Lido-D Ctrl-D
Chopra
39
43
2
1
Mogesen
44
44
4
4
Pitt
107
110
6
4
Darby
103
100
7
5
Bennett
110
106
7
3
O’Brian
154
146
11
4
Risk difference
(95% CI)
Study
% Weight
1
0.20 (-0.35,0.74)
5.3
2
0.00 (-0.36,0.36)
13.3
3
0.11 (-0.20,0.42)
17.4
4
0.08 (-0.21,0.37)
20.6
5
0.20 (-0.09,0.49)
17.4
6
0.23 (0.00,0.46)
26.0
Overall (95% CI)
0.14 (0.02,0.27)
-.742978
0
.742978
Risk difference
Hine et al ArchIntMed 1989
• 6.6 % (37/557) nel gruppo Lidocaina contro
3.8 % (21/549) nel gruppo controllo
• c’e’ davvero un effetto sfavorevole della
lidocaina nei pz con infarto del miocardio ?
• 5 studi sono negativi, 1 al limite della
significatività mostra un effetto sfavorevole
• presi singolarmente sono troppo piccoli per
dare una risposta
La variabilità campionaria
• Il concetto fondamentale è che una statistica
calcolata su un campione casuale è essa
stessa una variabile casuale
• Dobbiamo legare la variabilità della
statistica campionaria con la variabilità
della variabile (fenomeno in studio) per la
quale il campione casuale è stato estratto
Definizione 1
• La distribuzione di probabilità di una
statistica campionaria è chiamata la
distribuzione campionaria della statistica
Proprietà delle d. campionarie
• Se una variabile casuale Y ha media  e
varianza 2 allora la distribuzione delle
medie campionarie avrà media  e varianza
2 / n , dove n è la dimensione del
campione.
Definizione 2
• La deviazione standard della distribuzione
campionaria è chiamata errore standard
Esempio
• Sia IQ una variabile casuale con media 100
e deviazione standard 15. Si consideri l’IQ
medio di una classe di 25 studenti.
• Qual è la media e la varianze della
distribuzione delle medie campionarie di IQ
con n=25 ?
Singola
oss. Y
Media di
25 oss.
media
Popolazione
varianza
varianza
100
152=225
15
100
225/25=9
3
Commenti
• Il termine errore standard è usato per
distinguere la dev. Standard di una statistica
campionaria da quella della variabile
(fenomeno) in studio
• Si noti il legame tra dimensione
campionaria e precisione (1/)
Teorema del limite centrale
Primo risultato
• Se Y è distribuita in modo Gaussiano con
media  e varianza 2 allora Y basato su
campioni di dimensione n sarà distribuito
Gaussianamente con media  e
varianza 2 / n .
Esempio
• Qual è la probabilità che l’IQ medio di una
classe di 25 studenti superi 106 ?


106  100 

Pr Y  106  Pr  Z 

3


 Pr Z  2 
 1  0.9772
 0.0228
Teorema del Limite Centrale
• Se Y è una variabile casuale con media  e
varianza 2 allora Y basato su campioni di
dimensione n sarà distribuito
Gaussianamente con media  e
varianza 2 / n , per n sufficientemente
grande.
Frac tio n
.092
0
1
.186186
Frac tio n
.15
Frac tio n
0
0
0
(mean) unif
1
0
.24
(mean) unif
1
.275
Frac tio n
unif
Frac tio n
0
0
0
0
(mean) unif
1
0
(mean) unif
1
1
1
2
3
4
5
2
3
1 1.5 2
1.5 2 2.5
2 2.5 3
2.5 3 3.5
3 3.5 4
4
5
2.5 3
3 3.5
3.5 4
4 4.5
4.5 5
Y |
Freq.
Percent
Cum.
------------+----------------------------------1 |
1
20.00
20.00
2 |
1
20.00
40.00
3 |
1
20.00
60.00
4 |
1
20.00
80.00
5 |
1
20.00
100.00
------------+----------------------------------Total |
5
100.00
Y
|
Freq.
Percent
Cum.
------------+----------------------------------1 |
1
4.00
4.00
1.5 |
2
8.00
12.00
2 |
3
12.00
24.00
2.5 |
4
16.00
40.00
3 |
5
20.00
60.00
3.5 |
4
16.00
76.00
4 |
3
12.00
88.00
4.5 |
2
8.00
96.00
5 |
1
4.00
100.00
------------+----------------------------------Total |
25
100.00
.2
.15
.15
Fraction
Fraction
.2
.1
.05
.1
.05
0
0
1
2
3
var2
4
5
1
2
3
var1
4
5
Le medie sono uguali e pari a 3
Le varianze sono rispettivamente 2 e 1
Infatti per la popolazione (1,2,3,4,5) la varianza è
[ (1-3)2 + (2-3)2 + (3-3 )2 + (4-3 )2 +(5-3 )2 ] / 5
= 4 + 1 + 0 + 1 + 4 = 10/5 = 2
Per i campioni di dimensione 2 la varianza è
[ 0*5 + 0.25*8 + 1*6 + 2.25*4 + 4*2 ] / 25 = 25 / 25 = 1
oppure 2/n = 2 / 2 = 1
Altre distribuzioni campionarie
• Distribuzione campionaria della varianza
• Distribuzione campionaria del rapporto t
Sono ottenibili per popolazioni Gaussiane
(mean) mgauss=gauss
(sd) sdgauss=gauss
by(quattro)
t=(mgauss)/sdgauss
chi=sdgauss*sdgauss
.3
Fraction
.2
.1
0
0
2
4
chi
6
Fraction
.4
.2
0
-5
0
t
5