BIOSTATISTICA 2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale Marta Blangiardo, Imperial College, London Department of Epidemiology and Public Health [email protected] ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.1 2. UN CARATTERE MISURATO IN UN CAMPIONE SPECULARE PARAMETRI UNIVERSO PROGRAMMARE INFERIRE CAMPIONE STIMATORI DESCRIVERE ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.2 2. UN CARATTERE MISURATO IN UN CAMPIONE CARATTERE (VARIABILE) QUALITATIVO QUANTITATIVO NOMINALE DISCRETO (ES.GENERE) (ES.NUMERO DI FIORI DI UNA PIANTA) ORDINALE (ES.GIUDIZIO ALL’ESAME) CONTINUO (ES.STATURA) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.3 2. UN CARATTERE MISURATO IN UN CAMPIONE Siamo interessati a stimare l’incremento del peso delle cavie nutrite con una certa dieta UNIVERSO PARAMETRI CAMPIONE STIMATORI ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.4 2. UN CARATTERE MISURATO IN UN CAMPIONE Siamo interessati a stimare l’incremento del peso delle cavie nutrite con una certa dieta UNIVERSO PARAMETRI PROGRAMMARE CAMPIONE STIMATORI Ad un campione casuale di 12 cavie viene somministrata la dieta in studio dalla nascita fino all’età di 3 mesi e ne vengono registrati gli incrementi di peso ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.5 2. UN CARATTERE MISURATO IN UN CAMPIONE CAMPIONE STATISTICHE DESCRIVERE 56 59 63 52 57 68 n = 12 64 61 57 60 63 60 yi: generica i-esima osservazione (i = 1, 2,…,12) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.6 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA CAMPIONE STATISTICHE A. Come si distribuiscono i dati campionari? B. Come possiamo sintetizzare i dati campionari? C. Quanto sono dispersi i dati campionari? ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.7 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA A. Come si distribuiscono i dati campionari? 56 59 63 52 57 68 64 61 57 60 63 60 Classi di valori Frequenze assolute Frequenze relative (%) 50 - 54 54 - 58 58 - 62 62 - 66 66 - 70 1 3 4 3 1 8.3 25.0 33.3 25.0 8.3 totale 12 100.0 DISTRIBUZIONE DI FREQUENZA ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.8 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA A. Come si distribuiscono i dati campionari? Classi di valori Frequenze assolute Frequenze relative 1 3 4 3 1 8.3 25.0 33.3 25.0 8.3 50 - 54 54 - 58 58 - 62 62 - 66 frequenze 66 - 70 ISTOGRAMMA 4 3 2 1 50 54 58 62 66 70 classi di valori ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.9 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA A. Come si distribuiscono i dati campionari? Distribuzione simmetrica Distribuzione con asimmetria positiva Distribuzione con asimmetria negativa ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.10 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA Possiamo ottenere la distribuzione di frequenza anche per gli altri tipi di caratteri: Carattere nominale (genere): MMMMM FFMMF Carattere ordinale (giudizio all’esame): Buono Buono Suff Suff Suff Insuff Ottimo Buono Suff Insuff 4 7 6 5 4 3 2 1 0 3 2 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - Ottimo F Buono M Suff 0 Insuff 1 2.11 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA CAMPIONE STATISTICHE A. Come si distribuiscono i dati campionari? B. Come sintetizzare Quale possiamo valore assumono in i dati campionari? media i dati campionari? C. Quanto sono dispersi i dati campionari? ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.12 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? INDICI DI POSIZIONE Medie Medie non analitiche analitiche Media Moda aritmetica Mediana Media (e quartili) geometrica ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.13 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? Medie non analitiche Moda È il dato campionario che si manifesta con maggiore frequenza. Essendo una media non analitica possiamo calcolarla per qualsiasi tipo di carattere (qualitativo o quantitativo) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.14 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? MMMMMFFMMF 7 6 ISTOGRAMMA frequenze 5 4 Carattere Nominale 3 2 1 M F MODA ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.15 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? Buono Buono Suff Suff Suff Insuff Ottimo Buono Suff Insuff ISTOGRAMMA Carattere Ordinale frequenze 4 3 2 1 Insuff Suff Buono Ottimo MODA ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.16 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? 52 56 57 57 59 60 60 61 63 63 64 68 frequenze Qual è il valore modale? ISTOGRAMMA Carattere Quantitativo 4 3 2 1 50 54 58 62 66 70 classe modale = 58 - 62 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.17 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? Distribuzione unimodale Distribuzione bimodale ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.18 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? Medie non analitiche Mediana È l’osservazione centrale dei dati campionari disposti in ordine crescente o decrescente. Essendo una media non analitica possiamo calcolarla anche per caratteri qualitativi ordinali (NON nominali) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.19 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? Buono Buono Suff Suff Suff Insuff Ottimo Buono Suff Insuff Insuff Disposizione in ordine crescente Insuff Insuff Insuff Suff Suff Suff Suff Buono Buono Buono Ottimo n=11 Me = Insuff Insuff Suff Suff Suff 11+1 = 6° 2 Me=Suff Suff Buono Buono Buono Ottimo ISTOGRAMMA frequenze 4 Carattere Ordinale 3 2 1 Insuff Suff Buono Ottimo MEDIANA ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.20 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? Buono Buono Suff Suff Suff Ottimo Insuff Ottimo Buono Suff Insuff Insuff Disposizione in ordine crescente Insuff Insuff Insuff Suff Suff Suff Suff Buono Buono Buono Ottimo Ottimo n=12 Me = 12 2 = 6° e 12 Me = 2 +1 = 7° ISTOGRAMMA frequenze 4 Carattere Ordinale 3 2 1 Insuff Suff Buono Ottimo MEDIANA ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.21 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? 56 59 63 52 57 68 64 61 57 60 63 60 Disposizione in ordine crescente 52 56 57 57 59 60 60 61 63 63 64 68 n=12 Me = 12 12 = 6°=60 2 Me = 2 +1 = 7°=60 Me = 60 52 56 57 57 59 60 60 61 63 63 64 128 La mediana rimane 60! Non è sensibile ai valori estremi! ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.22 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA frequenze B. Come possiamo sintetizzare i dati campionari? ISTOGRAMMA 4 3 2 1 50 54 58 62 66 70 Me=60 ISTOGRAMMA 4 3 2 1 50 54 58 62 66 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 70 … 120 130 2.23 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? Medie non analitiche Quartili Sono le osservazioni che dividono in 4 parti uguali i dati campionari disposti in ordine crescente o decrescente. Essendo medie non analitiche possiamo calcolarle anche per caratteri qualitativi ordinali (NON nominali) 25% q25 25% 25% Me 25% q75 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.24 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? ESEMPIO 1: n/4 non è un numero intero Buono Buono Suff Suff Suff Insuff Ottimo Buono Suff Insuff Insuff Disposizione in ordine crescente Insuff Insuff Insuff Suff Suff Suff Suff Buono Buono Buono Ottimo n=11 1°quartile: a sn abbiamo il 25% della popolazione, a ds il 75% 11 q25 = 4 = 2.75 prendo il primo numero intero più grande (3°) Mediana (o 2°quartile): a sn abbiamo il 50% della popolazione, a ds il 50% Me = 11+1 = 6° 2 3°quartile: a sn abbiamo il 75% della popolazione, a ds il 25% q75 = 3 4 * 11 = 8.25 prendo il primo numero intero più grande (9°) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.25 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? ESEMPIO 1: n/4 non è un numero intero Insuff Insuff Insuff Suff Suff Suff Suff Buono Buono Buono Ottimo Modalità Insuff Frequenze assolute Frequenze cumulate 3 3 3°pos: q25=insuff 6°pos: Suff 4 7 Buono 3 10 Ottimo - 1 11 Me=suff 9°pos: q75=buono n=11 frequenze 4 3 2 1 Insuff q25 Suff Buono MEDIANA q75 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - Ottimo 2.26 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? ESEMPIO 2: n/4 è un numero intero Buono Buono Suff Suff Suff Ottimo Insuff Insuff Buono Suff Insuff Insuff Disposizione in ordine crescente Insuff Insuff Insuff InsuffSuff Suff Suff Suff Buono Buono Buono Ottimo n=12 1°quartile: a sn abbiamo il 25% della popolazione, a ds il 75% 12 q25 = 4 =3 prendo n/4 (3°) e n/4+1 (4°) Mediana (o 2°quartile): a sn abbiamo il 50% della popolazione, a ds il 50% Me = 12 2 = 6° e 12 Me = 2 +1 = 7° 3°quartile: a sn abbiamo il 75% della popolazione, a ds il 25% 3 q75 = * 12 = 9 4 prendo 3*n/4 (9°) e 3*n/4+1 (10°) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.27 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? ESEMPIO 2: n/4 è un numero intero Insuff Insuff Insuff Suff Suff Suff Suff Buono Buono Buono Ottimo Modalità Insuff Suff Buono Frequenze assolute Frequenze cumulate 4 4 4 8 3 11 3°e 4° pos: q25=insuff 6°e 7° pos: Me=suff 9°e 10° pos: q75=buono Ottimo - 1 12 n=12 frequenze 4 3 2 1 Insuff q25 Suff Buono MEDIANA q75 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - Ottimo 2.28 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? INDICI DI POSIZIONE MEDIE ANALITICHE MEDIA ARITMETICA Somma dei valori osservati divisa il numero di osservazioni (numerosità campionaria) yi ∑ = n y= i 1 n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.29 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? n MEDIA ARITMETICA ∑ y = i y = i 1 n 56 59 63 52 57 68 64 61 57 60 63 60 = 56 + 59 +...+ 63 + 60 = 12 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 720 = 60 12 2.30 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA frequenze B. Come possiamo sintetizzare i dati campionari? ISTOGRAMMA 4 3 2 1 50 54 58 62 66 70 MEDIA ARITMETICA y = 60 Definisce la posizione media dei valori campionari ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.31 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? frequenze 56 59 63 52 57 68 64 61 57 60 63 60 4 3 2 1 50 54 58 62 66 70 y = 60 frequenze 56 59 63 52 57 128 64 61 57 60 63 60 4 3 2 1 50 54 58 62 66 La media aritmetica è influenzata dai valori estremi ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 70 126 y = 65 2.32 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA La media aritmetica si può calcolare SOLO per caratteri QUANTITATIVI: Carattere nominale (genere): MMMMM FFMMF Carattere ordinale (giudizio all’esame): Buono Buono Suff Suff Suff Insuff Ottimo Buono Suff Insuff yi ∑ = n y= i 1 n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.33 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA Distribuzione simmetrica Media Mediana = Moda aritmetica = Distribuzione con asimmetria positiva Moda Mediana Media aritmetica Distribuzione con asimmetria negativa Media Mediana aritmetica ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - Moda 2.34 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? MEDIA GEOMETRICA Radice n-esima del prodotto dei valori osservati n Mg = n ∏ yi i=1 che, per le proprietà dei logaritmi diventa: ∑ log(yi ) n 1 log(Mg) = ∑ log( yi ) = n i=1 n i =1 n Il logaritmo della media geometrica è la media aritmetica dei logaritmi dei valori osservati ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.35 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA B. Come possiamo sintetizzare i dati campionari? Grandezze biologiche misurate in scala di diluizione “a raddoppio” Titoli anticorpali Espressi in logaritmi Possono essere scritti come 1/25 - log(25) 1/50 - [log(2)1 + log(25)] - (1 log 2+log 25) 1/100 - [log(2)2 + log(25)] - (2 log 2+log 25) 1/200 - [log(2)3 + log(25)] - (3 log 2+log 25) 1/400 - [log(2)4 + log(25)] - (4 log 2+log 25) - (0 log 2+log 25) 0 + 1+ 2 + 3 + 4 ⋅ log(2) + log(25)]= log(Mg)=−[ 5 = − [ 2 ⋅ 0.301 + 1.398] = - 2 il cui antilogaritmo è: 10-2 = 1/100 5 e quindi Mg = 1/100 = 1/25*1/50*1/100*1/200*1/400 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.36 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA CAMPIONE STATISTICHE A. Come si distribuiscono i dati campionari? B. Come possiamo sintetizzare i dati campionari? C. Quanto sono dispersi i dati campionari? ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.37 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? dispersione dispersione posizione ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.38 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? CAMPO DI VARIAZIONE (o range o escursione) È l’ampiezza assoluta tra i valori estremi delle osservazioni ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.39 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? 56 59 63 52 57 68 64 61 57 60 63 60 Disposizione in ordine crescente 52 56 57 57 59 60 60 61 63 63 64 68 CAMPO DI VARIAZIONE = (68 - 52) = = 16 52 56 57 57 59 60 60 61 63 63 64 128 CAMPO DI VARIAZIONE = (128 - 52) = = 76 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.40 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? Il box plot è un utile strumento per visualizzare la distribuzione di un carattere visualizzandone indici di posizione e di dispersione 56 59 63 52 57 68 q25=57 64 61 57 60 63 60 Me=60 q75=63 Distanza interquartilica (IQR) = q75-q25 = 6 Soglia per outliers: >1.5*IQR più grande di q75 o <1.5*IQR più piccolo di q25 73 71 Outliers q75+1.5*IQR=63+1.5*6=72 66 63 60 58 IQR 57 53 47 q25-1.5*IQR==57-1.5*6=48 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.41 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? DEVIAZIONE STANDARD Radice quadrata della somma degli scarti quadratici dei valori osservati dalla media aritmetica divisa il numero di osservazioni meno uno 12 s= Σ(yi - y) 2 i =1 n-1 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.42 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? yi 52 56 57 57 59 60 60 61 63 63 64 68 y = 60 (yi - y) 52 - 60 = - 8 56 - 60 = - 4 57 - 60 = - 3 57 - 60 = - 3 59 - 60 = - 1 60 - 60 = - 0 60 - 60 = - 0 61 - 60 = - 1 63 - 60 = - 3 63 - 60 = - 3 64 - 60 = - 4 68 - 60 = - 8 Σ (yi - y) = 0 12 i =1 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.43 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? (yi - y) 2 yi 52 56 57 57 59 60 60 61 63 63 64 68 y = 60 2 (52 - 60) (56 - 60) (57 - 60) (57 - 60) (59 - 60) (60 - 60) (60 - 60) (61 - 60) (63 - 60) (63 - 60) (64 - 60) (68 - 60) 2 2 2 2 2 2 2 2 2 2 2 = 64 = 16 = 9 = 9 = 1 = 0 = 0 = 1 = 9 = 9 = 16 = 64 Σ (yi - y) 12 2 i =1 = 198 Devianza ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.44 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? Σ (yi - y) 12 2 i =1 = 198 Devianza Aumenta con il numero di osservazioni 12 12 ΣΣ(y (yii -- y) y) 22 i i=1 =1 198 198 ==16.5 == 18.0 12 11 nn-1 Varianza Unità di misura elevata al quadrato rispetto ai dati originali 12 12 ΣΣ(y (yii -- y) y) 22 i i=1 =1 nn- 1 Deviazione == 16.5 18.0 == 4.1 4.2 standard Perché (n - 1) e non n? ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.45 2a. UN CARATTERE MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA DESCRITTIVA C. Quanto sono dispersi i dati campionari? i yi 1 52 2 56 3 57 4 57 5 59 6 60 7 60 8 61 9 63 10 63 11 64 12 68 (yi - y) (52 - 60) = -8 (56 - 60) = -4 (57 - 60) = -3 (57 - 60) = 3 (59 - 60) = -1 (60 - 60) = 0 (60 - 60) = 0 (61 - 60) = 1 (63 - 60) = 3 (63 - 60) = 3 (64 - 60) = 4 (68 - 60) = 8 12 y = 60 Da quante osservazioni dipende dev? Nota y voglio calcolare dev VINCOLO Σ (yi - y) = 0 i =1 Mi basta calcolare (y1-y), (y2-y),…,(yn-1-y) e l’ultimo termine (yn-y) è completamente determinato dal vincolo: mi servono solo n-1 osservazioni (n-1 gdl) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.46 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE SPECULARE PARAMETRI UNIVERSO PROGRAMMARE INFERIRE CAMPIONE STIMATORI DESCRIVERE ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.47 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE POPOLAZIONE BERSAGLIO µ ? 10 10 15 15 Campione 12 12 20 20 STATISTICA 16 16 INFERENZIALE descrizione y Forma Posizione Distribuzione di frequenza Media aritmetica Dispersione Deviazione standard STATISTICA DESCRITTIVA ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.48 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE POPOLAZIONE BERSAGLIO Campione Tutti i possibili 1 campioni Frequenza Distribuzione campionaria y Medie campionaria campionarie Media ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.49 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Proprietà delle distribuzione campionaria A. Come si distribuiscono le medie campionarie? B. Quale valore assumono in media le medie campionarie? C. Quanto sono disperse le medie campionarie? ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.50 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Frequenza Proprietà delle distribuzione campionaria Mediecampionaria campionarie Media TEOREMA DEL LIMITE CENTRALE A DISTRIBUZIONE approssimativamente normale indipendentemente dalla forma della distribuzione di frequenza della variabile nella popolazione bersaglio (se n sufficientemente grande) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.51 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Frequenza Distribuzione campionaria Mediecampionaria campionarie Media A. Come si distribuiscono le medie campionarie? B. Quale valore assumono in media le medie campionarie? C. Quanto sono disperse le medie campionarie? ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.52 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Frequenza Proprietà della distribuzione campionaria µ Mediecampionaria campionarie Media TEOREMA DEL LIMITE CENTRALE B MEDIA CAMPIONARIA: stimatore corretto coincide con quella della media aritmetica del carattere nella popolazione dalla quale i campioni sono stati estratti ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.53 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Frequenza Distribuzione campionaria Mediecampionaria campionarie Media A. Come si distribuiscono le medie campionarie? B. Quale valore assumono in media le medie campionarie? C. C. Quanto Quantosono sonodisperse dispersele le medie mediecampionarie? campionarie? ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.54 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Frequenza Proprietà della distribuzione campionaria σ es = n µ Mediecampionaria campionarie Media TEOREMA DEL LIMITE CENTRALE C ERRORE STANDARD è la deviazione standard di una distribuzione campionaria: es = σ n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.55 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Proprietà della distribuzione campionaria Distribuzione normale es = σ n Medie Media campionarie: campionaria y µ Osservazioni yi non per forza Gaussiane e caratterizzate da due parametri: µ e σ2 Medie campionarie y~N(µ µ,σ σ2/n) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.56 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Proprietà della distribuzione campionaria Le medie campionarie sono tanto più Frequenza disperse intorno alla media µ tanto più: σ es = n µ Mediecampionaria campionarie Media il carattere è disperso nella popolazione il campione è piccolo ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.57 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Proprietà della distribuzione campionaria Forma normale σ es = n µ yi Distribuzione normale standardizzata area = 1 yi - µ 1 z= yi - µ σ n 0 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.58 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione normale − f ( yi ) = 1 σ ⋅ 2⋅π n ⋅e ( yi − µ ) 2 σ2 2⋅ n σ es = n µ Medie campionarie: yi Distribuzione normale standardizzata f ( z) = 1 0 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 1 ⋅e 2⋅π n z2 − 2 n z 2.59 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Misure di variabilità Σ (yi - y) 12 2 Devianza i =1 Σ(yi - y) 12 i =1 n -1 2 = σ2 12 Σ(yi - y) i =1 n-1 2 =σ σ Varianza Deviazione standard Errore standard n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.60 Distribuzione normale standardizzata 0 1 2 3 4 5 6 7 8 9 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 ………… 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.61 2b. 3. UN UNCARATTERE CARATTEREQUANTITATIVO QUANTITATIVOMISURATO MISURATOIN INUN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione normale standardizzata Area = 0.6915 Pr { z ≤ +0.5} = 0.6915 Area = 0.1517 Pr { 0.1 ≤ z ≤ 0.5} = Pr {z ≤ 0.5} - Pr {z ≤ 0.1} = 0.1517 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.62 2b. 3. UN UNCARATTERE CARATTEREQUANTITATIVO QUANTITATIVOMISURATO MISURATOIN INUN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione normale standardizzata Area = 0.4207 Pr { z ≥ 0.2} = 1 - Pr { z ≤ 0.2} = 1 – 0.5793 = 0.4207 Area = 0.2119 Pr { z ≤ - 0.8} = Pr {z ≥ 0.8} 1 - Pr { z ≤ 0.8} = 0.2119 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.63 2b. 3. UN UNCARATTERE CARATTEREQUANTITATIVO QUANTITATIVOMISURATO MISURATOIN INUN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione normale standardizzata Area = 0.950 Area: 0.383 z - 0.5 0 + 0.5 Pr { -0.5≤ ≤ z ≤ 0.5} = 0.383 y-µ Pr { -0.5 ≤ z ≤ 0.5} = 0.383 σ/ n Pr { y -0.5 σ / n ≤ µ ≤ y + 0.5 σ / n } = 0.383 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.64 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione normale standardizzata Area = 0.950 z - 1.96 0 + 1.96 Pr { y - 1.96 σ / n ≤ µ ≤ y + 1.96 σ / n } = 0.95 Limiti di confidenza al 95% della media µ della popolazione ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.65 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE POPOLAZIONE BERSAGLIO µ ? 10 10 15 15 Campione 12 12 20 20 n = 12 16 16 descrizione y = 60 Media aritmetica Pr { 60 y - 1.96 σ / 12 n ≤ µ ≤ 60 y + 1.96 σ / n 12 } = 0.95 ? ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.66 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Dalla distribuzione normale standardizzata... area = 1 1 0 z= σ y-µ n …alla distribuzione “t” area = 1 σ è sostituito dal 1 suo stimatore s 0 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - t= y-µ s 2.67 n 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione t 0.045 0.04 0.035 gdl1 0.03 gdl2 gdl3 0.025 0.02 0.015 0.01 0.005 0 0 20 40 60 0 y- µ 80 t= 100 s 120 n Non esiste una sola distribuzione t, ma una famiglia di distribuzioni corrispondenti ai diversi gradi di libertà ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.68 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione t gdl 0.4 0.3 0.25 0.2 0.15 0.1 0.05 1 0.3249 0.7265 1.0000 1.3764 1.9626 3.0777 6.3138 12.7062 2 0.2887 0.6172 0.8165 1.0607 1.3862 1.8856 3 0.2767 0.5844 0.7649 0.9785 1.2498 4 0.2707 0.5686 0.7407 0.9410 5 0.2672 0.5594 0.7267 6 0.2648 0.5534 7 0.2632 0.5491 0.025 0.001 0.0005 318.3088 636.6192 2.9200 4.3027 31.5991 1.6377 2.3534 22.3271 …. 3.1824 10.2145 12.9240 1.1896 1.5332 2.1318 2.7764 7.1732 8.6103 0.9195 1.1558 1.4759 2.0150 2.5706 5.8934 6.8688 0.7176 0.9057 1.1342 1.4398 1.9432 2.4469 5.2076 5.9588 0.7111 0.8960 1.1192 1.4149 1.8946 2.3646 4.7853 5.4079 …. 45 0.2549 0.5281 0.6800 0.8497 1.0485 1.3006 1.6794 2.0141 3.2815 3.5203 50 0.2547 0.5278 0.6794 0.8489 1.0473 1.2987 1.6759 2.0086 3.2614 3.4960 60 0.2545 0.5272 0.6786 0.8477 1.0455 1.2958 1.6706 2.0003 ….3.2317 3.4602 70 0.2543 0.5268 0.6780 0.8468 1.0442 1.2938 1.6669 1.9944 3.2108 3.4350 80 0.2542 0.5265 0.6776 0.8461 1.0432 1.2922 1.6641 1.9901 3.1953 3.4163 100 0.2540 0.5261 0.6770 0.8452 1.0418 1.2901 1.6602 1.9840 3.1737 3.3905 120 0.2539 0.5258 0.6765 0.8446 1.0409 1.2886 1.6577 1.9799 3.1595 3.3735 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.69 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE n=10 Pr { t≤1} = n=5 Pr { 0.1 ≤ t ≤ 0.5} = ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.70 2b. 3. UN UNCARATTERE CARATTEREQUANTITATIVO QUANTITATIVOMISURATO MISURATOIN INUN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione normale standardizzata n=15 Pr { t ≥ 0.2} = n=8 Pr { t ≤ - 0.8} = ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.71 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE POPOLAZIONE BERSAGLIO µ 10 10 15 15 Campione 12 12 20 20 n=8 16 16 Pr=95%: t0.975=2.36 descrizione t0.025=-2.36 y = 60 s = 4.2 Media aritmetica Deviazione standard Pr { y - 2.36 s / n ≤ µ ≤ y + 2.36 s / n } = 0.95 60 4.2 8 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.72 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE y ± t (s / √ n) ricordando che y = 60 e s = 4.2, scegliendo un valore di t corrispondente a una probabilità del 95% che, per (n-1= 7) gdl, è 2.36, allora µ è compresa nell’intervallo: 60 ± 2.36 (4.2 / √ 8) 56.5, 63.5 con una probabilità del 95% Intervallo di confidenza al 95% della media µ della popolazione ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.73 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE y ± t (s / √ n) y = 60 n=8 56.5, 63.5 s = 4.2 t(1-0.95)/2;11 = 2.36 Pr = 95 % 56.5 60 63.5 Se volessimo diminuire il grado di incertezza n=8 56.3, 63.7 s = 4.2 t(1-0.99)/2;11 = 3.50 Pr = 99 % 56.3 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 60 63.7 2.74 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE y ± t (s / √ n) y = 60 n=8 56.5, 63.5 s = 4.2 t(1-0.95)/2;11 = 2.36 Pr = 95 % 56.5 60 63.5 Se disponessimo di un campione meno numeroso n= 6 56.2, 63.8 s = 4.2 t(1-0.99)/2;11 = 2.571 Pr = 95 % 56.2 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 60 63.8 2.75 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE y ± t (s / √ n) y = 60 n=8 56.5, 63.5 s = 4.2 t(1-0.95)/2;11 = 2.36 Pr = 95 % 56.5 60 63.5 Se il carattere fosse più disperso nella popolazione n= 8 54.7, 65.3 s = 6.0 t(1-0.95)/2;11 = 2.36 Pr = 95 % 54.7 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 60 65.3 2.76 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Interpretazione degli intervalli di confidenza IC al 95% X0.025 X X0.975 Se ripetessimo l’esperimento 100 volte, la media µ sarebbe compresa nell’intervallo 95 volte In 95 casi µ è compresa qui X0.025 ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - X0.975 2.77 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Distribuzione di 10 intervalli di confidenza Livello di confidenza 90% La VERA media non è contenuta nell’intervallo di confidenza ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.78 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Inferenza Ci sono essenzialmente 4 tipi di inferenza I1. Calcolo delle probabilità I2. Stima dei parametri I3. Intervalli di confidenza Assumiamo che i parametri siano noti Assumiamo che i parametri siano ignoti I4. Test d’ipotesi •Variabile di interesse continua •Il fenomeno in studio ha una distribuzione simmetrica? yi~N(µ µ,σ σ2) ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.79 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN Continuous CAMPIONE: dataELEMENTI DI STATISTICA INFERENZIALE Il passo successivo è valutare i parametri della distribuzione per poter fare inferenza sui parametri della popolazione di interesse. Tipicamente ci interessano 1. La media della popolazione 2. La varianza della popolazione 1. Media µ e deviazione standard σ della popolazione sono note ─ Calcolo delle probabilità 2. La media della popolazione µ è ignota (oggetto dell’inferenza), ma la deviazione standard σ è nota 3. Sia la media µ che la deviazione standard σ sono ignote ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.80 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Popolazione normale – entrambi i parametri sono noti Caso 1: Media µ e deviazione standard σ della popolazione sono note I1. Calcolo delle probabilità E’ facile calcolare le probabilità di una variabile casuale Normale standard, tramite opportune tavole “Standardizziamo” la nostra variabile casuale normale e calcoliamo la probabilità dalle tavole Pr { -0.5≤ ≤ y ≤ 0.5} Pr { -0.5 -µ µ σ/ n ≤ z ≤ -0.5 +µ µ σ/ n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - } 2.81 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Popolazione normale – media ignota Caso 2: Media µ ignota e deviazione standard σ nota I2. Stima dei parametri L’unico parametro da stimare è la media µ dato che la deviazione standard è nota Utilizziamo l’informazione proveniente dal campione n ∑ y = i y = i 1 n Associamo una stima della dispersione del parametro tramite lo standard error σ se= n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.82 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Popolazione normale – media ignota Caso 2: Media µ ignota e deviazione standard σ nota I3. Intervallo di confidenza Possiamo identificare un intervallo di confidenza, ad esempio al 95% per la media della popolazione µ: Pr { y – zα/2 σ / n ≤ µ ≤ y + zα/2 σ / n } = 0.95 σ n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.83 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Popolazione normale – entrambi i parametri sono ignoti Caso 3: Media µ e deviazione standard σ della popolazione sono ignote I2. Stima dei parametri Dobbiamo stimare sia la media che la varianza campionaria Utilizziamo l’informazione proveniente dal campione n n ∑ y = i ∑ (yi - y)2 y = i 1 s = i= 1 n n-1 L’errore standard sarà se = s n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.84 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE Popolazione normale – entrambi i parametri sono ignoti Caso 3: Media µ e deviazione standard σ della popolazione sono ignote I3. Intervallo di confidenza Possiamo identificare un intervallo di confidenza, ad esempio al 95% per la media della popolazione µ: Pr { y – tg, α/2 s / n ≤ µ ≤ y + tg, α/2 s / n } = 0.95 Dobbiamo utilizzare la stima campionaria della deviazione standard σ n ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.85 2b. UN CARATTERE QUANTITATIVO MISURATO IN UN CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE (Popolazione) Parametri and stimatori (Popolazione normale) Quantità teoretiche (funzioni di parametri ignoti µ, σ2) Media e deviazione standard della popolazione (oggetto di inferenza) µ, σ2 vs Quantità osservabili x̄, s2 x Media e deviazione standard campionarie (usate per stimare µ e σ2) Idealmente vorremmo misurare µ. Dato che non possiamo, utilizziamo un suo stimatore x̄, s2 x (NB Di solito ci interessa µ) Idelamente vorremmo avere un’idea dell’incertezza associata alla stima se= σ n Errore standard: rappresenta una stima dell’incertezza intorno allo stimatore della media µ Nella pratica usiamo l’informazione campionaria per stimare questa variabilità se= s n Errore standard stimato: dato che non conosciato il vero valore σ l’unica cosa da fare è utilizzare l’informazione campionaria per stimare questa quantità ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE - 2.86