t di Student

annuncio pubblicitario
Analisi dei dati per i disegni
ad un fattore
t di Student
• La statistica t di Student é definita come
t = (Y-s2/N)-1/2
dove Y é la variabile,
il parametro valor medio della popolazione,
s é la deviazione standard stimata ed N il
numero delle osservazioni.
t di Student
Essa rappresenta lo scarto dalla media
misurato in unità dell’errore standard della
distribuzione campionaria.
Può essere utilizzato per costruire intervalli
di confidenza attorno alla stima puntuale
della media campionaria,
t di Student
Il parametro  con livello di confidenza
(1-si trova all’interno dell’intervallo:
<Y> ± (t /2) s2/N)-1/2
t di Student
La statistica t di Student consente di realizzare
un test di inferenza statistica per il
confronto tra due medie campionarie.
In questo caso H0 prevede che la differenza
tra le due medie campionarie sia nulla.
t di Student
La statistica t di Student per il confronto tra
medie campionarie ha quindi al numeratore
la differenza delle medie campionarie e al
denominatore l’errore standard della
distribuzione della differenza delle medie
campionarie.
t di Student
Se i due campioni sono composti da N1 ed N2
valori rispettivamente, la statistica risulterà
avere (N1+N2-2) gradi di libertà o gdl,
perché sia lo scarto tra le medie che il
corrispondente errore standard sono stimati
a partire dai dati.
Inferenza statistica
Si rifiuta H0 in Si accetta H0
base ai dati
in base ai dati
H0 è vera
Errore di I tipo Decisione
False Alarm corretta
Hit
(
H0 è falsa
Decisione
corretta
Correct
Rejection
Errore di II
tipo
Omission (
La statistica del 2
La statistica del  é costituita da somme di
punti Z al quadrato.
Il numero dei gdl è pari al numero di punti Z
sommati.
La statistica del 2
La distribuzione del  con pochi gdl è
asimmetrica e ha come valore atteso lo zero;
all’aumentare dei gdl il valore atteso tende ad
essere pari al valore dei gdl, mentre la
varianza tende ad essere pari a 2
La statistica F di Fisher
La statistica F di Fisher é costituita dal
rapporto tra due 
F= (
La statistica F di Fisher
La distribuzione F è asimmetrica, non
negativa e ha una forma che dipende
dai gdl.
Tra la statistica F e la t intercorre
un’ovvia relazione:
F= (t
L’analisi della varianza
L’ANOVA è una tecnica statistica che
sottopone a verifica l’ipotesi nulla secondo
la quale le medie campionarie di J gruppi
sono estratte dalla medesima popolazione, e
quindi sono pari al parametro della
popolazione :
H0 : 1 = 2 = 3 = ..... = J = 
L’analisi della varianza
Nell’ANOVA ad una via i gruppi sono
individuati a partire dai livelli di un
unico fattore o trattamento.
• Si chiamano effetti del trattamento ()
gli scarti tra la media di un gruppo e la
media generale:
 J = (J - 
L’analisi della varianza
L’ANOVA fornisce un modello dei dati, nel
senso che permette di esprimere il valore
delle osservazioni in termini dei parametri
del modello più un termine di errore;
per il modello tra i soggetti abbiamo:
Yij =  + eij
L’analisi della varianza
Il punto di partenza dell’analisi è la scomposizione
della devianza totale:
SQTOTALE = i,j(Yij-<Y>)2 =
= i,j ( (Yij- <YJ>) + (<YJ>-<Y>) )2 =
= i,j (Yij- <YJ>)2 + nj j (<YJ>-<Y>)2 =
=SQINTRAGRUPPO + SQINTERGRUPPO
dove nj è la numerosità del gruppo j-esimo.
L’analisi della varianza
Per valutare l’entità e la significatività
statistica degli effetti (nel loro insieme),
l’ANOVA confronta la media dei quadrati
intgruppo
QMINTERGRUPPO = SQINTERGRUPPO/(J-1)
con la media dei quadrati intragruppo
QMINTRAGRUPPO = SQINTraGRUPPO/(N - J)
L’analisi della varianza
Sotto l’ipotesi nulla, queste due quantità
riflettono due stime equivalenti della
varianza dell’errore.
Quindi se la variabilità interna ai gruppi e
quella tra i gruppi così stimate sono
equivalenti allora l’ipotesi nulla sarà
verificata.
L’analisi della varianza
Per realizzare il confronto si utilizza la
statistica F di Fisher, che per un confronto
ad N soggetti e J gruppi ha la forma:
FJ-1,N-J = QM INTERGRUPPO / QMINTRAGRUPPO
L’analisi della varianza
Ricordiamo
che
l’ANOVA
assume
l’omoschedasticità, ovvero l’uguaglianza
delle varianze tra i gruppi.
L’ipotesi di uguaglianza delle varianze è
verificata con il test di Levène.
Se il test di Levène è significativo sarebbe
necessario rinunciare all’ANOVA e
ricorrere ad un confronto non parametrico,
ad esempio usando il test di Wilcoxon.
L’analisi della varianza
• Ciò é specialmente vero nel caso di gruppi
non bilanciati, cioè di gruppi con
numerosità molto diverse tra loro.
L’analisi della varianza
• Tuttavia, dato che gli effetti della
eteroschedasticità consistono in un aumento della
probabilità di commettere errori di primo tipo, in
caso di
moderata eteroschedasticità
(fino ad un rapporto 3:1 tra la varianza massima e la
minima)
si può procedere con l’ANOVA considerando però
un valore  più restrittivo.
L’analisi della varianza
• L’ANOVA assume inoltre la normalità e
l’indipendenza degli errori.
• Se queste assunzioni non sono rispettate la
possibilità di commettere errori di I tipo
aumenta e la sensibilità del test diminuisce.
L’analisi della varianza
• Il modello ANOVA consente di stimare
l’entità degli effetti attraverso il quoziente
2, che fornisce la quota di varianza
spiegata dalla variabile indipendente; 2 é
definito in termini di somma dei quadrati:
2=SQINTERGRUPPO/ SQTOTALE
L’analisi della varianza
• Dato che SQTOTALE= SQINTERGRUPPO+
SQINTraGRUPPO, si ha che 2 varia tra zero ed
uno.
• Quando si analizzano fenomeni complessi è
possibile che la quota di varianza spiegata
da una singola variabile indipendente sia
anche molto piccola.
Scarica