Distribuzioni campionarie Annibale Biggeri Dipartimento di Statistica Introduzione Le Revisioni sistematiche o meta-analisi sono revisioni e sintesi quantitative dei risultati di studi simili ma condotti indipendentemente. Tra il 1970 ed il 1986 abbiamo 13 RS rispetto a 416 nel periodo 1993-96: 416 Studio Lido-R Ctrl-R Lido-D Ctrl-D Chopra 39 43 2 1 Mogesen 44 44 4 4 Pitt 107 110 6 4 Darby 103 100 7 5 Bennett 110 106 7 3 O’Brian 154 146 11 4 Risk difference (95% CI) Study % Weight 1 0.20 (-0.35,0.74) 5.3 2 0.00 (-0.36,0.36) 13.3 3 0.11 (-0.20,0.42) 17.4 4 0.08 (-0.21,0.37) 20.6 5 0.20 (-0.09,0.49) 17.4 6 0.23 (0.00,0.46) 26.0 Overall (95% CI) 0.14 (0.02,0.27) -.742978 0 .742978 Risk difference Hine et al ArchIntMed 1989 • 6.6 % (37/557) nel gruppo Lidocaina contro 3.8 % (21/549) nel gruppo controllo • c’e’ davvero un effetto sfavorevole della lidocaina nei pz con infarto del miocardio ? • 5 studi sono negativi, 1 al limite della significatività mostra un effetto sfavorevole • presi singolarmente sono troppo piccoli per dare una risposta La variabilità campionaria • Il concetto fondamentale è che una statistica calcolata su un campione casuale è essa stessa una variabile casuale • Dobbiamo legare la variabilità della statistica campionaria con la variabilità della variabile (fenomeno in studio) per la quale il campione casuale è stato estratto Definizione 1 • La distribuzione di probabilità di una statistica campionaria è chiamata la distribuzione campionaria della statistica Proprietà delle d. campionarie • Se una variabile casuale Y ha media e varianza 2 allora la distribuzione delle medie campionarie avrà media e varianza 2 / n , dove n è la dimensione del campione. Definizione 2 • La deviazione standard della distribuzione campionaria è chiamata errore standard Esempio • Sia IQ una variabile casuale con media 100 e deviazione standard 15. Si consideri l’IQ medio di una classe di 25 studenti. • Qual è la media e la varianze della distribuzione delle medie campionarie di IQ con n=25 ? Singola oss. Y Media di 25 oss. media Popolazione varianza varianza 100 152=225 15 100 225/25=9 3 Commenti • Il termine errore standard è usato per distinguere la dev. Standard di una statistica campionaria da quella della variabile (fenomeno) in studio • Si noti il legame tra dimensione campionaria e precisione (1/) Teorema del limite centrale Primo risultato • Se Y è distribuita in modo Gaussiano con media e varianza 2 allora Y basato su campioni di dimensione n sarà distribuito Gaussianamente con media e varianza 2 / n . Esempio • Qual è la probabilità che l’IQ medio di una classe di 25 studenti superi 106 ? 106 100 Pr Y 106 Pr Z 3 Pr Z 2 1 0.9772 0.0228 Teorema del Limite Centrale • Se Y è una variabile casuale con media e varianza 2 allora Y basato su campioni di dimensione n sarà distribuito Gaussianamente con media e varianza 2 / n , per n sufficientemente grande. Frac tio n .092 0 1 .186186 Frac tio n .15 Frac tio n 0 0 0 (mean) unif 1 0 .24 (mean) unif 1 .275 Frac tio n unif Frac tio n 0 0 0 0 (mean) unif 1 0 (mean) unif 1 1 1 2 3 4 5 2 3 1 1.5 2 1.5 2 2.5 2 2.5 3 2.5 3 3.5 3 3.5 4 4 5 2.5 3 3 3.5 3.5 4 4 4.5 4.5 5 Y | Freq. Percent Cum. ------------+----------------------------------1 | 1 20.00 20.00 2 | 1 20.00 40.00 3 | 1 20.00 60.00 4 | 1 20.00 80.00 5 | 1 20.00 100.00 ------------+----------------------------------Total | 5 100.00 Y | Freq. Percent Cum. ------------+----------------------------------1 | 1 4.00 4.00 1.5 | 2 8.00 12.00 2 | 3 12.00 24.00 2.5 | 4 16.00 40.00 3 | 5 20.00 60.00 3.5 | 4 16.00 76.00 4 | 3 12.00 88.00 4.5 | 2 8.00 96.00 5 | 1 4.00 100.00 ------------+----------------------------------Total | 25 100.00 .2 .15 .15 Fraction Fraction .2 .1 .05 .1 .05 0 0 1 2 3 var2 4 5 1 2 3 var1 4 5 Le medie sono uguali e pari a 3 Le varianze sono rispettivamente 2 e 1 Infatti per la popolazione (1,2,3,4,5) la varianza è [ (1-3)2 + (2-3)2 + (3-3 )2 + (4-3 )2 +(5-3 )2 ] / 5 = 4 + 1 + 0 + 1 + 4 = 10/5 = 2 Per i campioni di dimensione 2 la varianza è [ 0*5 + 0.25*8 + 1*6 + 2.25*4 + 4*2 ] / 25 = 25 / 25 = 1 oppure 2/n = 2 / 2 = 1 Altre distribuzioni campionarie • Distribuzione campionaria della varianza • Distribuzione campionaria del rapporto t Sono ottenibili per popolazioni Gaussiane (mean) mgauss=gauss (sd) sdgauss=gauss by(quattro) t=(mgauss)/sdgauss chi=sdgauss*sdgauss .3 Fraction .2 .1 0 0 2 4 chi 6 Fraction .4 .2 0 -5 0 t 5