La staqsqca inferenziale La staqsqca inferenziale

07/01/15 La sta+s+ca inferenziale Generalizzare un risultato calcolato su un campione alla popolazione Conclusioni calcolate sul campione Popolazione Ipotesi Campione 1 La sta+s+ca inferenziale •  Possibilità di estendere una s+ma fa;a su un campione alla popolazione generale da cui è stato estra;o il campione •  Lo scopo di un test sta+s+co –  Prendere una decisione (“sì” o “no”) su da+ osserva+ su base probabilis+ca 2 1 07/01/15 S+ma •  Osservazioni su un campione à inferenze sulla popolazione rappresentata da tuH i soggeH con cara;eris+che analoghe a quelle del campione •  Variabilità casuale del campione stesso stre;amente collegata, tra l’altro, al numero di soggeH inclusi in uno studio •  Le quan+tà sta+s+che o;enute (medie, proporzioni, etc.) sono s"me imprecise dei veri valori nella popolazione generale Gabriella Serio -­‐ Facoltà di Medicina e Chirurgia – Università degli Studi di Bari S+ma •  Una misura descriHva calcolata dai da+ di una popolazione è de;a parametro •  Una misura descriHva calcolata dai da+ di un campione è de;a s5ma del parametro •  Due possibili approcci: –  Valutazione della s+ma –  Test delle ipotesi Gabriella Serio -­‐ Facoltà di Medicina e Chirurgia – Università degli Studi di Bari 2 07/01/15 S+ma •  S+ma puntuale: si calcola un singolo valore numerico per s+mare il corrispondente parametro –  Es. una media, una proporzione, una deviazione standard •  S+ma di intervallo: si calcola un intervallo di valori che, con un certo grado di probabilità, conterrà il parametro da s+mare Gabriella Serio -­‐ Facoltà di Medicina e Chirurgia – Università degli Studi di Bari Distribuzioni di campionamento •  Molto spesso i campioni hanno dimensioni ancora minori e la loro numerosità gioca un ruolo importante, nel determinare la forma della distribuzione –  Distribuzione t di Student –  Distribuzione F o di Fisher –  Distribuzione del Chi – quadro 3 07/01/15 Distribuzione t di Student Se, oltre alla media, anche la deviazione standard σ della popolazione è incognita, la deviazione standard s del campione rappresenta la s+ma più logica ed a;endibile della deviazione standard della popolazione. Con σ ignota, la distribuzione di probabilità non è fornita dalla distribuzione normale, bensì dalla distribuzione t di Student. La distribuzione normale considera la variazione di campionamento solo della media. La distribuzione t considera anche la variazione di campionamento della deviazione standard. Distribuzione t di Student •  In campioni di piccole dimensioni •  Funzione di probabilità •  La curva corrispondente è simmetrica, leggermente più bassa della normale e con frequenze maggiori agli estremi, quando il numero di gdl (ν) è molto piccolo. 4 07/01/15 Distribuzione t di Student Funzione di probabilità Le cara;eris+che della distribuzione t sono: •  distribuzione dei da+ normale; •  osservazioni raccolte in modo indipendente; •  area unitaria al di so;o della curva di densità e di forma simmetrica; •  si oHene una famiglia di distribuzioni (una distribuzione per ogni grado di libertà) a differenza di quanto avviene per la gaussiana; •  sempre più “dispersa” al diminuire dei gradi di libertà; •  è “robusta”, valida anche per distribuzioni di da+ con marcata deviazione dalla normalità. La distribuzione t -­‐ Student ha un’importante proprietà: per n → ∞ essa tende alla distribuzione normale standard N (0, 1), ma ha una dispersione più elevata per piccoli valori di n > 2. Per questo mo+vo trova frequen+ applicazioni in Sta+s+ca, quando la s+ma dei valori medi di una popolazione è da effe;uare su piccoli campioni. 5 07/01/15 La distribuzione t-­‐student: •  ha la stessa forma della distribuzione di Gauss con picco meno alto e code più pesan+; •  È simmetrica intorno alla media; •  ha media zero; •  ha varianza>1, che si avvicina all’unità per n→∞ •  esiste una famiglia di distribuzioni t dis+nte dai gradi di libertà; •  tn→N(0,1) per campioni grandi (gradi di libertà→∞). Anche per la distribuzione t-­‐student esistono delle tavole per determinare i valori di area so;o la curva (probabilità) per i corrisponden+ pun+ sull’asse delle ascisse e in relazione ai diversi di gradi di libertà Distribuzione F o di Fisher Per lo studio di piccoli campioni. Per testare se due campioni estraH da una popolazione hanno la stessa varianza. I due campioni sono fra loro indipenden+ ed ognuno ha il suo numero di gradi di libertà. Se due variabili sono indipenden+, allora il rapporto fra le due variabili, ciascuna divisa per il proprio numero di gradi di libertà, è distribuito secondo una distribuzione simile a quella in figura. 6 07/01/15 2.5.
DISTRIBUZIONI CAMPIONARIE
DERIVATE DALLA
NORMALEDERIVATE
ED UTILI PER
2.5. DISTRIBUZIONI
CAMPIONARIE
DALLA NORMALE ED UTILI PER
L’INFERENZA
L’INFERENZA
Oppure La distribuzione normale è valida La
per distribuzione
campioni molto
numerosi,
teoricamente
infiniti.
Spesso
è
normale
è valida
per campioni
molto
numerosi,
teoricamente infiniti. Spesso è
possibile disporne nella statistica economica
e
sociale,
in
cui
si
analizzano
i
dati
personali
di
una
Data u
na d
istribuzione n
ota d
i u
na p
opolazione d
a c
ui possibile disporne nella statistica economica e sociale, in cui si analizzano i dati personali di una
calcolare la mpratica
edia μdella
e la varianza σ pbiologica,
ossiamo regione o una nazione. Nella praticapossiamo della ricerca
statistica
naturalistica
ed ambientale,
per
regione
o una
nazione. biologica,
Nella
ricerca
statistica
naturalistica ed ambientale, per
applicare d
ue c
ampionamen+ s
uccessivi s
u d
e;a l’inferenza sono disponibili alcune decine,
al
massimo
poche
centinaia
di
osservazioni.
In
molti
settori
l’inferenza sono disponibili alcune decine, al massimo poche centinaia di osservazioni. In molti settori
popolazione, uhanno
no con n1 campioni e minori
uno con n2loro
campioni. della ricerca applicata, molto spesso
dimensioni
e la
dellai campioni
ricerca applicata,
molto
spessoancora
i campioni
hanno
dimensioni ancora minori e la loro
O;erremo due medie x̄1 e xdella
̄2 ed distribuzione.
anche due sEssa
car+ quadra+ci numerosità gioca un ruolo importante,
nel
determinare
la
forma
non
numerosità gioca un ruolo importante, nel determinare la forma della distribuzione. Essa non
medi s 2 e s 2. 1
2
può più essere considerata normalepuò
od più
approssimativamente
ma seodneapprossimativamente
discosta quanto più tale,
il ma se ne discosta quanto più il
essere consideratatale,
normale
campione è piccolo.
campione è piccolo.
F = s 2 / s
2 Per l’inferenza, nella statistica parametrica
l’ipotesi
fondamentale
è che
campioni
siano
1 questi2l’ipotesi
Per l’inferenza,
nella
statistica parametrica
fondamentale
è che questi campioni siano
estratti da una popolazione normalmente
distribuita.
E’
un’ipotesi
limitativa,
ma
basilare
per
le
estratti da una popolazione normalmente distribuita. E’ un’ipotesi limitativa, ma basilare per le
distribuzioni t di Student e F di Fisher,
che insieme
rappresentano
le distribuzioni
fondamentali
distribuzioni
t di Student
e F di Fisher,
che insieme
rappresentano le distribuzioni fondamentali
dell’inferenza statistica parametrica. dell’inferenza
E’ importante statistica
comprendere
come
le
3
distribuzioni
più
utilizzate
parametrica. E’ importante comprendere come le 3 distribuzioni più utilizzate
nell’inferenza statistica, la distribuzione
χ2 di Pearson
in quella
non parametrica,
distribuzione
t dinon parametrica, la distribuzione t di
nell’inferenza
statistica,
la distribuzione
χ2 dilaPearson
in quella
Student e la F di Fisher, per la statistica
parametrica,
siano legate
e matematicamente
Student
e la F di Fisher,
per lalogicamente
statistica parametrica,
siano legate logicamente e matematicamente
con la distribuzione normale e tra loro.
con la distribuzione normale e tra loro.
2.5.1 LA DISTRIBUZIONE χ2
2.5.1 LA DISTRIBUZIONE χ2
cui uso è stato
introdotto dallo
inglese
Karl
Pearson dallo statistico inglese Karl Pearson
La distribuzione Chi-quadrato ( χ ),
), il cui uso
è stato
introdotto
Laildistribuzione
Chi-quadrato
( χ2statistico
Distribuzione del Chi quadro 2
(1857–1936), può essere fatta derivare
dalla distribuzione
Date dalla
n variabili
casualinormale. Date n variabili casuali
(1857–1936),
può essere normale.
fatta derivare
distribuzione
indipendenti x1, x2, …, xn,
indipendenti x , x , …, x ,
casuali indipenden+ x1, x2, ..., xn, normalmente distribuite con µ• = Date 0normalmente
e σ =n1, variabili distribuite con µ = 0 e σ = 1,
normalmente istribuite con μ = 0 e σ = 1, il χ2 è una dei loro d
quadrati.
il χ2 è una variabile casuale data dalla
è una variabile
casuale data dalla somma dei loro quadrati.
il χ2somma
1
2
n
variabile casuale data dalla somma dei loro quadra+ 2
La funzione di densità di probabilità
della
distribuzione
èdi probabilità
•  Funzione i dχensità di probabilità La
funzione
diddensità
della distribuzione χ2 è
f(x) = K ⋅ x
(ν / 2) − 1
exp (-x/2)
f(x) = K ⋅ x
(ν / 2) − 1
exp (-x/2)
/
Γ
(
ν
/
2
).
−ν/2
dove ν = 1, 2, ...
e
K=2
/ Γ ( ν / 2 ).
2
La funzione di densità del χ è determinata
solo
parametro
il numero disolo
gradi
libertà, ν, il numero di gradi di libertà,
La funzione
didal
densità
del χ2 èν,determinata
daldiparametro
2 è determinata • 
La f
unzione d
i d
ensità d
el χ
solo dal 2
pertanto viene scritta come χ (ν).
pertanto viene scritta come χ2 .
dove ν = 1, 2, ...
e
K=2
−ν/2
(ν)
parametro ν, il numero di gradi di libertà, pertanto 2
viene scri;a 2come χ (ν) forme sempre diverse, fino
La distribuzione χ2 parte da ν uguale a 1 e al suo aumentare
assume
La distribuzione χ parte da ν uguale a 1 e al suo aumentare assume forme sempre diverse, fino
ad una forma approssimativamenteadnormale
per approssimativamente
ν = 30
una forma
normale per ν = 30
88
88
7 07/01/15 La distribuzione del chi-­‐quadro è usata per lo studio di piccoli campioni Ha un’ importante proprietà: se n variabili v=n indipenden+ seguono una distribuzione normale standardizzata, la loro somma segue una distribuzione del Chi-­‐quadro di parametro ni. " X −µ %
2
χ = ∑$$ j j ''
σj &
j=1 #
n
2
Per una sua notevole proprietà asinto+ca, al crescere di n la distribuzione del Chi-­‐quadro tende ad assumere una forma a ‘’campana’’ simmetrica rispe;o al suo valor medio, e si può dimostrare che per n >> 1 è ben approssimata da una legge normale N (n, 2n) con media n e varianza 2n. Nel grafico sono mostrate le varie distribuzioni al variare di v, i gradi di liberta'. 8 07/01/15 Teorema del limite centrale •  La distribuzione delle medie campionarie sarà approssima5vamente normale, indipendentemente dalla distribuzione dei valori nella popolazione d’origine (popolazione da cui sono sta+ traH i campioni) •  Il valore medio dell’insieme di tu=e le possibili medie campionarie sarà uguale alla media della popolazione •  La deviazione standard dell’insieme di tu;e le possibili medie campionarie di una data numerosità, definita come errore standard della media, è funzione sia della deviazione standard della popolazione che dalla numerosità campionaria re la distribuzione dei valori intorno alla media della popolazione,
che per
dispersione delle medie campionarie ( X ) intorno alla media de
Errore standard medie di nla
da+ a rispetto a prima•  Dispersione è che nondelle si utilizza
deviazione standard,
dard
σ
n
unto la misura della dispersione delle medie di n dati, con frequenza
X = µ ± Zα / 2 ⋅
σ
n
9 o quale intervallo si troverà il 95% delle medie campionarie di 10 d
07/01/15 Intervalli di confidenza •  Le s+me di intervallo forniscono informazioni sia sul valore numerico del parametro incognito che sul grado di a;endibilità della s+ma •  La procedura di calcolo degli intervalli, deH di confidenza, si basa sulla determinazione di due limi+ entro i quali, con una probabilità 1-­‐α, è contenuto il parametro, a par+re dalle informazioni campionarie 1-­‐α = P(L1 ≤ θ ≤ L2) con 0≤ α ≤1 –  L1 e L2 dipenden+ dalla dimensione del campione –  1-­‐α grado di a=endibilità della s5ma ed è de=o livello di confidenza –  s5ma ± (fa=ore di correzione × errore della s5ma) Lo scopo principale degli intervalli di confidenza è quello di indicare l’imprecisione delle s+me campionarie come rappresentazione dei valori della popolazione L’imprecisione della s+ma campionaria è indicata dall’ampiezza degli intervalli: Più ampi sono gli intervalli ð Minore è la precisione L’ampiezza dipende essenzialmente da tre fa;ori: •  dal numero di soggeH studia+ (campioni poco numerosi, conclusioni ina;endibili) •  dalla variabilità dei soggeH in studio (minore variabilità, s+ma più precisa) •  dal livello di confidenza (maggiore è il livello di confidenza, tanto più ampi sono gli intervalli) 10 07/01/15 L’intervallo di confidenza per la media •  L’intervallo di confidenza per la s+ma della media di una distribuzione normale a varianza incognita a livello di confidenza 1 − α ha la forma seguente: VALORE DELLA DISTRIBUZIONE T DI STUDENT con n-­‐1 gradi di libertà •  S = l’errore standard, rappresenta l’unità di misura dell’errore casuale di s+ma commesso u+lizzando la media campionaria come s+matore della media della popolazione campionata ESEMPIO Supponiamo di voler fare inferenza sul peso medio di neona+ di 39 seHmane di gestazione e di sesso maschile. Sapendo che il peso alla nascita è una v.c. Gaussiana, con media incognita (µ) e d.s. (σ) nota pari a 440 gr, si calcoli l’intervallo al 95% per µ a par+re da un c.c.s estra;o dalla popolazione, di numerosità 16. n = 16 Media Campionaria = 3434 gr s = 535 gr Limite superiore dell’ I.C. 95% = 3434 +2.12 *(535/√16) = 3719 Limite inferiore dell’ I.C. 95% = 3434 – 2.12 *(535/√16) = 3149 Intervallo di confidenza al 95%: [3149 -­‐ 3719] Il peso medio alla nascita dei neona+ maschi alla 39° seHmana di gestazione è un valore compreso tra 3149 e 3719. La probabilità che tale affermazione sia vera è pari a al 95% 11 07/01/15 Significato di un I.C. al 95% Dire che siamo confiden+ al 95% che l’I.C. calcolato comprenda µ significa che: •  Se selezioniamo 100 Campioni casuali dalla popolazione e u+lizziamo ques+ campioni per calcolare 100 diversi intervalli di confidenza per µ, circa 95 comprenderanno la media reale della popolazione, 5 no •  Una volta estra;o il campione, µ può essere compresa o meno nell’intervallo e dicendo che lo è, fissando il livello di confidenza al 95%, potremmo sbagliarci 5 volte su 100 Es: Estrazione di 50 campioni di numerosità 20 da una distribuzione gaussiana con µ=0 e δ=1. Le barre rappresentano gli intervalli di confidenza al 95% per tu;e le 50 medie campionarie calcolate. Da+ i 50 campioni dell’esempio seguente, osserviamo che soltanto in tre casi (6% dei campioni) l’intervallo di confidenza non comprende la vera media di popolazione. 12 07/01/15 I.C. per una proporzione •  In modo analogo a quanto visto per la media, o;eniamo il seguente intervallo per la probabilità p (proporzione) ⎛ ∧
⎜
⎜ p − Zα / 2
⎜
⎝
∧
∧
p(1 − p) ∧
, p + Zα / 2
n
∧
∧ ⎞
p(1 − p) ⎟
⎟
n
⎟
⎠
•  Z α/2 è il valore che delimita un’area di α/2 nella coda superiore della distribuzione normale standardizzata ESEMPIO Si consideri di voler fare inferenza sulla distribuzione della sopravvivenza a 5 anni dei pazien+ al di so;o dei 40 anni ai quali è stato diagnos+cato un cancro al polmone. Questa distribuzione ha una media della popolazione p non nota. In un campione casuale di 52 pazien+, solo 6 sopravvivono a 5 anni, pertanto ∧
p =6/52 =0.115
STIMA PUNTUALE Dato che la dimensione del campione è sufficientemente grande per gius+ficare l’uso dell’approssimazione alla normale l’I.C. al 95% per p è o;enuto nel seguente modo (0.115-­‐1.96√0.115((1-­‐0.115))/52, 0.115-­‐1.96√0.115((1-­‐0.115))/52) = (0.028,0.202) STIMA INTERVALLARE 13 07/01/15 Come agisce l’errore di campionamento Si possono comme;ere due +pi di errore u+lizzando un test di ipotesi Stato di
Natura
H0 è vera
H0 è falsa
DECISIONE CORRETTA
Si commette
Errore di II tipo
Si commette
Errore di I tipo
DECISIONE CORRETTA
Azioni
Si accetta H0
Si rifiuta H0
Errore ALFA o errore di I +po •  L’espressione “p<“ indica la probabilità di una conclusione falsamente posi5va –  Un tra/amento risulta migliore dell’altro quando in realtà non lo è •  Tanto più piccolo è il valore di p, tanto meno probabile è che i tra=amen5 pos5 a confronto abbiano un effe=o simile 14 07/01/15 Errore BETA o errore di II +po •  Comme=endo l’errore BETA, si afferma che i tra=amen5 sono uguali quando in realtà essi sono differen5 (falso nega"vo) •  L’errore BETA si verifica solitamente in caso di campioni di piccole dimensioni •  Non si evidenzia un effe;o favorevole quando questo è presente Come agisce l’errore di campionamento •  Errore di I 5po: rifiuto un’ipotesi quando essa è vera –  Probabilità di errore di I +po: •  α = P(rifiutare H0|è vera H0) •  Errore di II 5po: acce;are un’ipotesi quando è falsa –  Probabilità di errore di II +po: •  β = P(acce;o H0|è falsa H0) •  La “regola” di rifiuto deve essere costruita in modo tale che α e β siano piccole •  Dato che la minimizzazione contemporanea di α e β non è possibile, solitamente si fissa un α acce;abile (1%, 5%,10%) e si minimizza β (max 20-­‐30%). •  α viene anche chiamato livello di significa+vità 15 07/01/15 Potenza di uno studio clinico •  La potenza di uno studio clinico è la sua capacità di fare emergere un effe;o se questo esiste realmente –  Uno studio clinico con una bassa potenza è privo di ogni u+lità, in quanto avrà una probabilità molto scarsa di raggiungere l’obieHvo che lo sperimentatore si prefigge •  Quando si parla di potenza di uno studio clinico ci si riferisce alla potenza sta+s+ca 1-­‐ß, che rappresenta la probabilità che la differenza a;esa possa essere scoperta ad un predefinito livello di significa+vità α –  Più alta è la potenza, maggiore è la possibilità che la differenza minima a=esa tra i gruppi in tra=amento possa essere dimostrata Gabriella Serio -­‐ Facoltà di Medicina e Chirurgia – Università degli Studi di Bari La potenza del test •  La potenza del test è data da 1 − ß = P (RIFIUTARE H0|è falsa H0) •  Indica la capacità del test di individuare l’ipotesi alterna5va quando è vera ß minimo à (1-­‐ ß) massimo •  Quando si costruisce il sistema di ipotesi si ricerca quella suddivisione dello spazio campionario che rende massima la potenza del test 16 07/01/15 Verifica delle ipotesi ObieHvo: guidare il clinico, il ricercatore o l’amministratore a prendere una decisione riguardo ad un parametro della popolazione esaminando un campione di quella popolazione •  L’osservazione dei fenomeni porta alla formulazione di teorie che richiedono un conferma basata su una metodologia scien5fica Le ipotesi sta+s+che sono una formulazione delle ipotesi di ricerca in modo tale da poter essere valutate con opportune tecniche sta+s+che IPOTESI STATISTICA IPOTESI di RICERCA Gabriella Serio -­‐ Facoltà di Medicina e Chirurgia – Università degli Studi di Bari 17 07/01/15 Verifica delle ipotesi 1.  Analisi dei da+ –  Assunzioni sul modello probabilis+co, sui parametri, sul campione 2.  Formulazione dell’ipotesi: –  Vengono definite due ipotesi •  H0 à IPOTESI NULLA •  H1 à IPOTESI ALTERNATIVA 3.  Costruzione della sta+s+ca test e della sua distribuzione 4.  Definizione della Regola di Decisione e valutazione degli errori: –  α rifiutare l’ipotesi nulla vera –  β acce;are l’ipotesi nulla falsa 5.  Decisione sta+s+ca e decisione clinica Verifica delle ipotesi •  Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (di cara;ere biologico, medico, economico,...) è supportata dall’evidenza empirica •  Il fenomeno studiato deve essere rappresentato mediante una distribuzione di probabilità e l’ipotesi sulle cara=eris5che del fenomeno studiato è trado;a in ipotesi su uno o più parametri della distribuzione (test parametrico) •  Esempi di ipotesi: –  La media o/enuta dal campione d’indagine può essere uguale ad un certo valore fissato? –  La differenza di peso in due gruppi tra/aB con media diversa è diversa da zero? –  La proporzione di malaB di tumore al polmone fumatori è diversa da quella di non fumatori? 18 07/01/15 Le ipotesi Le ipotesi sul valore del parametro possono essere semplici: è specificato un solo valore (per es. μ = μ0) •  composte: sono specifica+ più valori unidirezionali (per es. μ > μ0) • 
bidirezionali (per es. μ ≠μ0) L’ipotesi nulla è solitamente semplice, mentre l’ipotesi alterna+va composta Il test d’ipotesi REGOLA DI RIFIUTO •  Prima di conoscere i da+ del campione, viene definita una regola per il rifiuto o meno dell’ipotesi nulla •  In genere, la regola consiste nel calcolare sui da+ del campione una sta+s+ca test. Se la sta+s+ca test è inferiore ad una soglia stabilita, non si rifiuta H0. Se la sta+s+ca test calcolata supera la soglia, si rifiuta H0. •  La regola di decisione consiste quindi nel suddividere lo spazio campionario C in due regioni, C0 regione di acce;azione, C1 regione di rifiuto sulla base dei possibili valori della sta+s+ca 19 07/01/15 Il test d’ipotesi LE CONCLUSIONI •  Quando si verifichi che da+ provenien+ da un certo contesto, e rileva+ in accordo con un sistema definitorio dato, sono conformi ad un’ipotesi formulata, non significa che l’ipotesi è provata, bensì che ha superato una prova. •  Si dice che la teoria da cui l’ipotesi discende è stata corroborata. Test parametrici e non parametrici Nell'ambito sta+s+co, a seconda delle ipotesi si dis+ngue tra: •  test parametrico •  test non parametrico 20 07/01/15 Test parametrici e non parametrici Un criterio di scelta dei test è quello di ado;are il modello che meglio si approssima ai da+ empirici: •  cara;eri CONTINUI e campioni di dimensioni elevate → test PARAMETRICO •  cara;eri DISCRETI o piccoli campioni estraH da una popolazione di cui si ignora la distribuzione → test NON PARAMETRICO A.  Da5 proven5 da distribuzioni gaussiane (o molto simili ad esse) –  Rispe;ando determinate ipotesi si u+lizzano preferibilmente test parametrici B.  Da5 provenien5 da distribuzioni diverse dalla curva di Gauss –  in generale obbligatorio applicare test non parametrici NB: •  Nel caso B è in generale errato applicare test parametrici, nel caso A si possono applicare test parametrici o non parametrici •  Nel caso A è preferibile impiegare test parametrici –  a parità di numerosità del campione, ques+ sono molto più poten5 dei corrisponden+ test non parametrici à evidenziare differenze significa+ve con campioni meno numerosi rispe;o ai corrisponden+ test non parametrici 21 07/01/15 Osservazione sui test parametrici •  Ogni test sta+s+co parametrico impone talune condizioni sulla distribuzione dei parametri della popolazione dalla quale è stato estra;o il campione usato nella ricerca •  Molte volte (sbagliando) si suppone che queste condizioni siano valide senza effe;uare nessuna verifica •  La validità dei risulta+ o;enu+ applicando un test parametrico, dipende dalla validità dei presuppos+ •  Un test sta+s+co non parametrico è invece basato su un modello che specifica solo condizioni molto generiche e non richiede condizioni rela+ve alla forma specifica della distribuzione della popolazione da cui è stato estra;o il campione •  Un modo grossolano per valutare qualita+vamente for+ scostamen+ dalla normalità è quello di analizzare visivamente l’istogramma di frequenza dei da5 raccol5 •  Un istogramma in cui si evidenziano chiaramente più mode oppure fortemente asimmetrico a destra o a sinistra suggerisce che i da+ che si vogliono analizzare non seguono una distribuzione gaussiana •  Un tale approccio non porta però a nessuna informazione quan5ta5va precisa ed è da considerarsi mediocre •  Il modo più classico per valutare la normalità di osservazioni univariate è tramite l’analisi dei coefficien5 di asimmetria e di curtosi 22 07/01/15 Test t di Student Si può impiegare per confrontare le medie di due campioni, quando si può in primo luogo supporre che la variabile casuale che si vorrà analizzare sia distribuita in maniera gaussiana •  Segue procedimen+ di calcolo differen+ a seconda che si analizzino due campioni –  di da5 appaia5 (ad esempio rilevazioni ante-­‐post) –  due campioni di da5 indipenden5, anche di diversa numerosità Test t di Student per da5 appaia5 PREMESSE: •  I valori di sono distribui+ in modo gaussiano (non è indispensabile che i valori originali seguano la distribuzione normale) •  le osservazioni sono indipenden+ l’una dall’altra Si ipo+zzi che x1, x2, …., xn siano le osservazioni del gruppo 1 e che y1, y2, …., yn siano le corrisponden+ osservazioni nel gruppo 2, di modo che ciascuna osservazione xi sia appaiata alla corrispondente osservazione yi. Si calcolino le differenze di = xi – yi con i = 1,2, ….,n. 23 07/01/15 CALCOLO: 1.  Si calcola la media m e la deviazione standard s delle differenze di d; 2.  Si calcola l’errore standard della media ES = s /
n
3.  Il valore t è calcolato come t = m = m
n
ES
s
4.  Scelto il livello di significa+vità α, l’ipotesi nulla potrà essere rifiutata con p<α (differenza significa+va) se il t calcolato supererà in valore assoluto quello indicato nella tabella del t di Student in corrispondenza a n–1 gradi di libertà La seguente Tabella 1 riporta i valori criBci del t di Student per test monodirezionale e bidirezionale Tabella 1 – Valori cri"ci della distribuzione t di Student per un test bilaterale (area nelle due code) o monolaterale (area in una coda). N.B. Si no5 che, quando il numero dei gradi di libertà (e quindi la numerosità delle osservazioni) aumenta, i valori cri5ci di t tendono a quelli corrisponden5 della curva di Gauss standardizzata. 24 07/01/15 ESERCIZIO 1: La tabella so;o riporta i valori di temperatura corporea in °C misura+ su 6 pazien+ al momento della somministrazione di un presunto an+termico e tre ore dopo. Valutare gli effeH del farmaco u+lizzando il test t di Student bidirezionale. m = 0,92 °C
s = 0,393 °C
t=
0,92
6 = 5,74
0,393
Dalla Tabella 1 con 5 gradi di libertà il valore cri+co tabellare con α = 0,01 è (per il test bidirezionale) t0,01= 4,032. Quindi, essendo il t calcolato uguale a 5,74, le differenze fra prima e dopo la somministrazione del farmaco sono significa+ve con p<0,01. 25 07/01/15 ESERCIZIO 2: La tabella so;o riporta i valori di VEMS (volume espiratorio massimo nel primo secondo) in litri misurata su un gruppo di 5 asma+ci prima e dopo un broncodilatatore. Valutare gli effeH del farmaco usando il test t di Student bidirezionale. m = – 0,8 / 5= – 0,16 litri s = 0,114 litri t=
− 0,16
5 = −3,14
0,114
Dalla Tabella 1 con 4 gradi di libertà i valori cri+ci tabellari sono (per il test bidirezionale) t0,05=2,776 e t0,02=3,747 e quindi 0,02 < p < 0,05. Test t di Student per campioni indipenden+ PREMESSE: 1.  I da+ seguono in modo acce;abile una distribuzione normale 2.  I da+ sono indipenden+ 3.  Le deviazioni standard per le due popolazioni sono uguali (in generale diciamo che il rapporto tra la deviazione standard maggiore e quella minore non è maggiore di 2) Si voglia verificare l’ipotesi nulla che le medie di due popolazioni, s+mate mediante due campioni indipenden+ di numerosità n1 e n2, siano uguali 26 07/01/15 CALCOLO: •  Si calcolano le medie m1 e m2 dei due campioni •  Si calcolano le deviazioni standard s1 e s2 dei due campioni •  Il valore t è calcolato come: t =
m1 − m 2
(n1 − 1) s12 + (n 2 − 1) s 22
n1 + n 2 − 2
n1 n 2
n1 + n 2
•  Scelto il livello di significa+vità α, l’ipotesi nulla potrà essere rifiutata con p<α (differenza significa+va) se il t calcolato supererà in valore assoluto quello indicato nella tabella del t di Student in corrispondenza a n1+n2–2 gradi di libertà ESERCIZIO 1: La tabella a lato riporta i valori di pressione arteriosa sistolica in un campione di 7 individui ipertesi tra;a+ con un farmaco an+pertensivo e quelli misura+ in un gruppo di controllo. Valutare gli effeH del farmaco u+lizzando il test t di Student bidirezionale. t=
152,1 − 177,5
2
2
6 × (9,512 ) + 5 × (9,354 )
7+6−2
7×6
= − 4,83
7+6
27 07/01/15 Dalla Tabella 1 con 11 gradi di libertà il valore cri+co tabellare con α = 0,001 è (per il test bidirezionale) t0,001= 4,437. Quindi, essendo il t calcolato uguale a – 4,83, si può rifiutare l’ipotesi nulla (uguaglianza delle medie) con p<0,001. Test non parametrici per il confronto di due campioni 28 07/01/15 Confronto tra campioni indipenden+ test della somma dei ranghi (Wilcoxon) Assunzioni: •  campioni indipenden+ •  non si possono fare assunzioni sulla distribuzione Frequenza cardiaca misurata in baH+ al minuto degli 11 soggeH con angina e degli 11 soggeH con infarto Anginosi 81
65
77
87
95
89
103
89
78
83
91
Campione combinato Osservazioni 61i 61i 65i 65a 68i 68i 69i 70i 75i 77a 78i 78a 79i 80i 81a 83a 87a 89a 89a 91a 95a 103a Infartua+ 61 75 78 80 68 65 68 69 70 79 61 Assegnazione del rango Numero d’ordine Rango à
1 à 1,5 à
2 à 1,5 à
3 à 3,5 à
4 à 3,5 à
5 à 5,5 à
6 à 5,5 à
7 à 7 à
8 à 8 à
9 à 9 à
10 à 10 à
11 à 11,5 à
12 à 11,5 à
13 à 13 à
14 à 14 à
15 à 15 à
16 à 16 à
17 à 17 à
18 à 18,5 à
19 à 18,5 à
20 à 20 à
21 à 21 à
22 à 22 Campione combinato 61i 61i 65i
65a 68i
68i 69i
70i 75i
77a 78i
78a 79i
80i 81a
83a 87a
89a 89a
91a 95a
103a NB: a valori uguali si assegna rango pari alla media dei ranghi che ciascun valore avrebbe se fossero diversi 29 07/01/15 Campione combinato Osservazioni 61i 61i 65i 65a 68i 68i 69i 70i 75i 77a 78i 78a 79i 80i 81a 83a 87a 89a 89a 91a 95a 103a Assegnazione del rango Numero d’ordine Rango à
1 à 1,5 à
2 à 1,5 à
3 à 3,5 à
4 à 3,5 à
5 à 5,5 à
6 à 5,5 à
7 à 7 à
8 à 8 à
9 à 9 à
10 à 10 à
11 à 11,5 à
12 à 11,5 à
13 à 13 à
14 à 14 à
15 à 15 à
16 à 16 à
17 à 17 à
18 à 18,5 à
19 à 18,5 à
20 à 20 à
21 à 21 à
22 à 22 Somma ranghi degli anginosi ΣRa=173 Somma ranghi degli infartua+ ΣRi=80 •  Cerco sulle tavole di Wilcoxon il valore tabulato in corrispondenza della numerosità dei due campioni e del livello di significa+vità •  Confronto il valore del campione di numerosità più piccola con l’intervallo tabulato •  Se il valore calcolato cade fuori dall’intervallo tabulato allora rifiuto H0, altrimen+ acce;erò H0 •  Nel nostro caso i valori tabula+ sono 96-­‐157, per cui rifiuto H0 Confronto tra campioni non indipenden5 test della somma dei ranghi con segno (Wilcoxon con segno) Si vuole verificare l’efficacia di una dieta sulla riduzione dei livelli di colesterolo in un gruppo di soggeH obesi. Pertanto il livello di colesterolo è stato misurato prima e dopo la dieta X2 Dopo X1 Prima 200 201 236 231 216 221 233 260 224 228 216 237 296 326 195 235 207 240 247 267 210 284 209 201 Prof.ssa G. Serio, Prof. P. Trerotoli, Ca;edra di Sta+s+ca Medica, Università di Bari 60/26 30 07/01/15 X1 201 231 221 260 228 237 326 235 240 267 284 201 X2 di= X2 – X1 200 -­‐1 236 +5 216 -­‐5 233 -­‐27 224 -­‐4 216 -­‐21 296 -­‐30 195 -­‐40 207 -­‐33 247 -­‐20 210 -­‐74 209 +8 Differenze senza segno in ordine non decrescente e rela5vo rango 1
4
5
5
8
20
21
27
30
33
40
74
1
2
3,5
3,5
5
6
7
8
9
10
11
12
Sommo tra loro i ranghi •  segno posi+vo ΣR+= 8.5 •  segno nega+vo ΣR-­‐= 69.5 -­‐
-­‐
+
-­‐
+
-­‐
-­‐
-­‐
-­‐
-­‐
-­‐
-­‐
61/26 Per prendere la decisione confronterò i valori calcola+ con un intervallo di valori che trovo sulle tavole dei ranghi con segno in corrispondenza del numero di coppie e del livello di significa+vità (es. α= 0.05) stabilito a priori •  Se la coppia di valori calcola+ cade all’interno dell’intervallo tabulato allora acce;o H0; •  se invece i valori cadono all’esterno dell’intervallo tabulato rifiuterò H0. Esempio 13 – 65: •  Nel nostro caso entrambe le somme dei ranghi sono fuori dell’intervallo, rifiuto l’ipotesi nulla e concludo che la dieta è stata efficace Prof.ssa G. Serio, Prof. P. Trerotoli, Ca;edra di Sta+s+ca Medica, Università di Bari 62/26 31 07/01/15 Osservazione importante!!!!!! Se nei calcoli risultassero differenze uguali a zero queste vanno eliminate, perché allo zero non è possibile assegnare un segno e conseguentemente si riduce la dimensione del campione Prof.ssa G. Serio, Prof. P. Trerotoli, Ca;edra di Sta+s+ca Medica, Università di Bari 63/26 Verifica di ipotesi per il confronto tra più medie: ANALISI DELLA VARIANZA PARAMETRICA (ANOVA) o ANALISI DELLA VARIANZA A UNA VIA o TEST F DI FISHER Il principio alla base di questo test è quello di stabilire se due o più medie campionarie possono derivare da popolazioni che hanno la stessa media parametrica 32 07/01/15 Quando le medie sono solamente due è indifferente usare questo test o il t-­‐test, mentre dobbiamo necessariamente u+lizzare l’ANOVA quando le medie sono più di due, o quando vogliamo suddividere la variabile di raggruppamento in più variabili per eliminare eventuali fon+ di variazione oltre a quella prodo;a dal fa;ore di cui vogliamo valutare l’effe;o. Se effe;uassimo a due a due i confron+ u+lizzando il test t di Student, la probabilità di errore di I +po aumenta proporzionalmente al numero di confron+ e, anche se nominalmente fosse pari a 0.05, per tre confron+ sarebbe pari a 0.14, per cinque confron+ a 0.25. Assunzioni •  Distribuzione della variabile di +po gaussiano •  Campioni indipenden+ •  Varianze omogenee 33 07/01/15 Come indice dell'uguaglianza tra le due varianze, viene u+lizzato il TEST F DI FISHER (segue la distribuzione F di Fisher), fondato sul rapporto varianza-­‐tra / varianza-­‐entro F(p-­‐1, n-­‐p) = sF2 / se2 Se è vera l'ipotesi nulla H0 H0: µ1 = µ2 = µ3 =…= µK il rapporto dovrebbe risultare uguale ad 1. Se è vera l'ipotesi alterna5va H1 H1 : le µi non sono tu;e uguali il rapporto dovrebbe risultare superiore a 1. •  Il test e la tabella rela+va sono unilaterali, appunto perché il valore deve essere maggiore di 1 •  Con un numero infinito di tra;amen+ e di repliche, è sufficiente un rapporto superiore a 1 per rifiutare l'ipotesi nulla; con un numero rido;o di da+, il rapporto può essere superiore a 1, per effe;o delle variazioni casuali •  I valori cri+ci per i rispeHvi gradi di libertà sono forni+ dalla distribuzione F •  Se il valore di F calcolato è superiore a quello tabulato, alla probabilità α prefissata, si rifiuta l'ipotesi nulla e si acce;a l'ipotesi alterna+va: almeno una media è diversa dalle altre. •  Se il valore F calcolato è inferiore a quello riportato nella tabella, si acce=a l'ipotesi nulla, o almeno non può essere rifiutato che le medie sono tu;e uguali. 34 07/01/15 Verifica di ipotesi per il confronto tra più medie: ANALISI DELLA VARIANZA NON PARAMETRICA o TEST DI KRUSKAL-­‐WALLIS Si usano quando non si conosce il +po di distribuzione o quando almeno una delle assunzioni alla base del test t di Student o dell’Anova è violata. Esso viene u+lizzato per confrontare più serie di misure provenien+ da un campionamento effe;uato su di una popolazione Si possono confrontare i risulta+ di più strumen+ di misura, più procedure anali+che, più operatori, ecc. •  La null-­‐hypothesis è che i 3 o più campioni estraH da una singola popolazione abbiano la stessa central tendency, di conseguenza, è richiesto che i tre set di misure siano indipenden+ e che le scale siano almeno ordinali •  Come tuH i test non parametrici ci vuole un discreto numero di misure per confrontare le due distribuzioni. Di solito si usa un numero totale compreso fra una decina e la soglia di Student •  Non è richiesto che le distribuzioni o;enute siano Gaussiane o di Student, o seguano un’altra distribuzione nota •  Non è richiesto che la numerosità delle due distribuzioni sia uguale (ma viene meglio se sono simili) 35 07/01/15 Confron+ mul+pli o a posteriori chiama+ anche confron+ non prestabili+ o non pianifica+, in italiano, oppure in inglese post-­‐hoc comparisons, incidental comparisons o mul+ple comparisons o con l’acronimo UMCP (Unplanned Mul+ple Comparison Procedures) § TEST LSD di Fisher § TEST di BONFERRONI § TEST di DUNCAN Si usano quando non è possibile programmare i confron+ a priori, al momento del disegno sperimentale, per carenza d’informazione. Si consiglia di applicarli solo dopo che l’analisi della varianza ha permesso di rifiutare l’ipotesi nulla sull’uguaglianza delle medie. Da qui il termine post-­‐hoc. Test LSD di Fisher Chiamato in inglese Least Significant Difference (Differenza Minima Significa+va). E’ quello più potente. Per non effe;uare tuH i singoli confron+ tra più medie e riuscire ugualmente ad avere la visione generale delle differenze significa+ve, un modo rapido è il calcolo di una differenza minima. Il metodo è analogo all’intervallo fiduciale di una differenza tra due medie, con il test t di Student. 36 07/01/15 Disponendo di k medie, ognuna calcolata su n da+, con il t di Student si oHene l’intervallo di confidenza per una generica coppia di medie ( e ). Sono significa+ve tu;e le p differenze (con D = -­‐ ) che in valore assoluto superano la quan+tà LSD, s+mata con LSD = dove -­‐ tα/2 = percen+le con probabilità α/2 della distribuzione t con gdl 2(n-­‐1), -­‐ ν = gdl della varianza d’errore s+mata con l’ANOVA, come s+ma più corre;a della varianza campionaria (s2) di ogni gruppo. Disuguaglianza di Bonferroni Per effe;uare p volte il test t di Student mantenendo costante la probabilità totale αT (experiment-­‐wise), la probabilità α di ogni confronto (comparison-­‐wise) deve essere minore di αT/p La disuguaglianza di Bonferroni può essere scri;a come α < αT / p Per esempio, quando con 3 confron+ la probabilità totale αT di comme;ere un errore di I +po non deve essere superiore a 0.05, la probabilità α di ogni singolo confronto deve essere minore di 0.0166 (0.05/3); se i confron+ fossero 4, la probabilità α di ogni confronto non deve superare 0.0125 (0.05/4). 37 07/01/15 Test di bonferroni La denominazione viene ado;ata anche per la correzione di Bonferroni, che è un metodo molto semplice, che viene u+lizzato spesso sulle maggiori riviste scien+fiche. Il metodo è conserva+vo ed è molto semplice: dato il valore nominale della p o;enuta da un test di Student, questa va mol+plicata per il numero di confron+ che si effe;uano. Ad esempio, se la significa+vità è p=0.03 ma si effe;uano tre confron+, la p diviene p=0.09, quindi non più significa+va. TEST DI DUNCAN Perme;e di effe;uare test sequenziali, ma è meno conserva+vo. I tra;amen+ vengono ordina+ in base alle medie osservate; si procede quindi a confrontare il primo e l’ul+mo tra;amento. Se il risultato è significa+vo, si passa al penul+mo tra;amento e così via. Duncan = Dove q α,1, dfE = valore della tavola di Duncan in corrispondenza della colonna pari al numero di campioni in assaggio e della riga pari al numero di gradi di libertà dell’errore (ANOVA), MSE è la media dei quadra+ dell’errore e b il numero di osservazioni. La differenza che viene fuori vale per confrontare la media più alta e quella più bassa. Per le altre devo cercare sulla tavola in corrispondenza della colonna pari al n. di campioni -­‐1 se confronto la media più alta con la penul+ma, n. di campioni -­‐2 se confronto la media più alta con la terzul+ma, ecc. 38 07/01/15 Verifica di ipotesi per il confronto tra due proporzioni Confronto tra le proporzioni di due popolazioni Spesso si è interessa+ a effe;uare confron+ e ad analizzare differenze tra due popolazioni con riferimento alla proporzione di casi con una certa cara;eris+ca •  Per confrontare due proporzioni sulla base dei risulta+ di due campioni si può ricorrere al test Z per la differenza tra due proporzioni, la cui sta+s+ca test ha distribuzione approssima+vamente normale quando le ampiezza campionarie sono sufficientemente elevate •  ASSUNZIONI • 
–  Campioni indipenden+ –  La variabile in studio che conta il numero di guarigioni (“successo”) sul totale delle prove (numerosità del campione): segue una distribuzione binomiale approssimabile ad una distribuzione di Gauss standard se n → ∞ e p → 0,5. •  IPOTESI –  H0: p1 = p2 oppure
–  H1: p1 ≠ p2 p1 – p2 = 0 39 07/01/15 π1
π2
p1 p2
Statistica Z per la differenza tra due proporzioni
Z=
( p1 − p2 ) − (π 1 − π 2 )
⎛ 1 1 ⎞
p (1 − p ) ⎜ + ⎟
⎝ n1 n2 ⎠
con p =
X1 + X 2
X
X , p1 = 1 , p2 = 2
n1 + n2
n1
n2
Test del chi-­‐quadrato Quando non è possibile approssimare la distribuzione binomiale ad una Gauss il confronto di proporzioni si effe;ua con il test chi-­‐quadrato •  Per il confronto di due proporzioni in campioni indipenden5 si basa sulla differenza fra frequenze osservate O e a=ese E: (O − E ) 2
2
χ =∑
E
40 07/01/15 I DATI si inseriscono in una tabella 2x2 IPOTESI Criterio 1 Criterio 2 1 2 Totale 1 a b a+b 2 c d c+d a+c b+d N Totale H 0:
p 1= p 2
H 1:
p1 ≠ p2
STATISTICA TEST
2
N ( ad − bc)
χ2 =
(a + b) × (c + d) × (a + c) × (b + d)
CALCOLO DEL NUMERO DI OSSERVAZIONI ATTESE Probabilità di esito favorevole: p.1 Probabilità di esito non favorevole: p.2 Probabilità di avere tra;amento A: p1. Probabilità di avere tra;amento B: p2. p11 è la probabilità di avere il tra;amento A ed un risultato favorevole, Ovvero p11 = P (favorevole∩A) E così via: p21 = P (favorevole∩B) p12 = P (non favorevole∩A) p22 = P (non favorevole∩B) 41 07/01/15 REGOLA DI DECISIONE •  Fissato α acce;abilmente piccolo (0,05), troverò sulle tavole un valore in corrispondenza di α prescelto e dei gradi di libertà della sta+s+ca che nelle tabelle 2x2 sono sempre pari a 1 (tabulato è 3,841) •  Se il valore calcolato della sta+s+ca è maggiore del valore tabulato rifiuterò l’ipotesi nulla, se invece il valore calcolato è minore del tabulato acce;erò l’ipotesi nulla Zona di acce;azione Zona di rifiuto χ2 tab Correzione di Yates •  Va ricordato che il test chi-­‐quadrato va usato con tabelle le cui entrate siano frequenze. È un errore usarlo con valori medi oppure percentuali •  Il test chi-­‐quadrato è un metodo approssimato valido quando le frequenze sono grandi •  Una regola perché sia valido è che il valore a;eso di ogni cella sia maggiore o uguale a 5. •  Quando le frequenze a;ese sono basse (ma sempre >5) si applica la correzione di Yates che riduce di ½ la grandezza assoluta di (O-­‐E) per ciascuna cella •  La correzione è dovuta al fa;o che il chi-­‐quadrato si basa sull’approssimazione normale della binomiale e quindi si tra;a di una correzione per la con+nuità 42 07/01/15 Correzione di Yates 2
2
|
(
ad
−
bc
)
−
N
/
2
|
N
2
χ =
r1⋅ r 2 ⋅ c1⋅ c2
(O − E − 1 / 2) 2
χ =∑
E
2
IL CHI QUADRO DI MANTEL -­‐ HAENSZEL Quando nello studio osservazionale interviene una variabile di confondimento occorre stra+ficare casi e controlli in funzione delle sue categorie. ObieHvo: confrontare due proporzioni, studiare il legame in presenza di un fa=ore di stra5ficazione Assunzioni: §  Campioni indipenden+ §  Distribuzione binomiale 43 07/01/15 La sta+s+ca test valuta contemporaneamente i risulta+ di tuH gli stra+ 2 (|Σai -­‐Σ E(ai)| -­‐½)2 X
=
CMH
Σvar(ai) La distribuzione della sta+s+ca test è X2 con 1 grado di libertà Regola di decisione: Individuo il valore tabulato del X2 con 1 grado di libertà e livello di significa+vità 0,05. Se il X2 cmh > X20,05 (valore tabulato) rifiuto H0 Tabella di con+ngenza rela+va all’i-­‐esima categoria della v. di confounding D Casi
Tot
E+
D+
ai
Controlli
Dbi
E-
ci
di
ci+di
ai+ci
bi+di
E
ai+bi
44 07/01/15 TEST DI OMOGENEITÀ Per ogni categoria della variabile di confondimento abbiamo un OR Occorre verificare l’ipotesi nulla
Si u+lizza un test Chi-­‐quadro:
con pesi da+ dall’inverso della varianza s+mata del log dell’ORi:
Se il test risulta non significa+vo, possiamo calcolare un OR globale Test di associazione: 45 07/01/15 PROCEDURA: 1.  Calcolare 2.  Calcolare ei =
vi =
(ai + bi )(ai + ci )
ni
(ai + bi )(ci + d i )(ai + ci )(bi + di )
ni
2
k
⎛ k
⎞
⎜ a − e ⎟
i
i
⎜
⎟
i =1 ⎠
2
~. χ (21)
χ MH
= ⎝ i =1
k
vi
∑
3.  Calcolare ∑
∑
i =1
Test di McNemar (tabella 2x2 per campioni appaia+) Quando i 2 cara;eri sono contemporaneamente presen+ negli individui, nel senso che si manifestano come diversi comportamen+ o risposte a diverse situazioni, allora possiamo configurare una classificazione in cui ogni sogge;o si esprime per entrambe le condizioni. 2 (b -­‐ c|-­‐1)2 Χ c = b + c 46 07/01/15 INDICE DI ACCORDO TRA VALUTAZIONI: K DI COHEN E’ una misura dell’accordo (coefficient of agreement) tra le risposte qualita+ve o categoriali di due persone (inter-­‐observer varia+on) oppure della medesima persona in momen+ differen+ (intra-­‐observer varia+on), valutando gli stessi oggeH. po – pe k= 1 -­‐ pe Dove: po : proporzione totale osservata pe : proporzione totale a;esa 47