Statistica Parametrica e Statistica Non Parametrica

I risultati di prove interlaboratorio
nel settore della microbiologia ambientale
15a e 16a Prova Interlaboratorio MIAC
1a Prova Interlaboratorio MIAS
Statistica Parametrica
e
Statistica Non Parametrica
Dottor Tarcisio Niglio
Servizio Informatico
Istituto Superiore di Sanità
Roma, 9 dicembre 2008
Statistica Parametrica
e
Statistica Non Parametrica
Cosa ne dicono i “Sacri Testi” statistici ?!?
Nell'ambito della statistica parametrica
si ipotizza che la variabile casuale X
su cui si effettua l'inferenza,
sia descritta da una distribuzione
la cui espressione sia nota.
Se f(x) esprime
la distribuzione di probabilità/densità
della variabile casuale X
allora f(x) = f(x,μ),
dove μ è uno scalare
o un vettore di parametri.
-σ
µ
+σ
1000
800
600
400
f(x)
200
0
0,75
0,80
0,90
1,00
1,10
1,20
1,05
1,25
1,35
1,45
1,50
-σ
µ +σ
Nell'ambito
della
statistica
parametrica
1000
si ipotizza che la variabile casuale X
su cui si effettua l'inferenza,
800
sia descritta da una distribuzione
la cui espressione sia nota.
600
Se f(x) esprime
f(x)
la distribuzione di probabilità/densità
della variabile casuale X
200
allora f(x) = f(x,μ),
dove μ è uno scalare
0
o un vettore di parametri.
400
0,75
0,80
0,90
1,00
1,10
1,20
1,05
1,25
1,35
1,45
1,50
.
Le variabili casuali continue
sono delle variabili casuali
per le quali l'insieme
dei valori possibili
ha la potenza del continuo
ossia può essere posto
in relazione biunivoca
con la retta reale,
il che vuol dire in altri termini
che i valori possibili sono delle
variabili continue.
cm
200
180
160
140
120
100
10
11
12
13
14
15
16
17
18
19
20
anni
250
200
150
100
50
0
0,75
0,80
0,85
0,90
0,95
1,00
1,05
1,10
1,15
1,20
1,25
300
250
200
150
100
50
0
0,75
0,80
0,85
0,90
0,95
1,00
1,05
1,10
1,15
1,20
1,25
300
250
200
150
100
50
0
0,75
0,80
0,85
0,90
0,95
1,00
1,05
1,10
1,15
1,20
1,25
Nella statistica non parametrica
i modelli matematici non
necessitano
di ipotesi a priori
sulle caratteristiche
della popolazione
(ovvero di un Parametro)
o comunque le ipotesi
sono meno restrittive
di quelle usuali
nella statistica parametrica.
1
2
0
2
In un questionario poniamo:
1 = maschio
2 = femmina
0 = non so (???)
.
1
2
0
Analisi della Frequenza:
2
Risposta “1” = una evenienza
Risposta “2” = due evenienze
Risposta “0” = una evenienza
In un questionario poniamo:
1 = maschio
2 = femmina
0 = non so (???)
Proviamo ad applicare la statistica parametrica a questi dati …..
La formulare per calcolare la media aritmetica è:
di conseguenza
µ = ( 1 + 2 + 2 + 0 ) / 4 = 1,25
Proviamo ad applicare la statistica parametrica a questi dati …..
La formulare per calcolare la media aritmetica è:
MA
CHE
ST I
AFF
A MO
ERM
A
N
= ( 1 + 2 + 2 + 0 ) /D
4O
= 1,25
?!?
di conseguenza
µ
1
2
0
2
Il valore caratteristico del nostro campione
che rappresenta la relativa popolazione è:
?!?
1 = maschio
2 = femmina
0 = non so
1,25
?!?
cm
200
180
160
140
120
100
10
11
12
13
14
15
16
17
18
19
20
anni
In un questionario poniamo:
1 = maschio
2 = femmina
0 = non so
=0
=1
=2
=M
=F
=?
=₪
=Ђ
=Љ
1000
800
600
400
200
0
0,75
0,80
0,85
0,90
0,95
1,00
1,05
1,10
1,15
1,20
1,25
Il test dei segni per ranghi di Wilcoxon
si applica nel caso
di un singolo campione
con due misure accoppiate.
Esso ipotizza che
la variabile dipendente
derivi da una variabile casuale continua
misurabile almeno su intervalli.
Il test dei “run”
(detto pure test di Wald-Wolfowitz)
verifica
l'ipotesi di casualità
nella distribuzione di una sequenza di dati.
Si definisce “run”
una sequenza di simboli uguali adiacenti.
Ad esempio la seguente sequenza:
++++---+++--++++++---è divisa in sei run,
tre formati da “+” e tre da “-”.
Il test di Wilcoxon-Mann-Whitney
noto pure come “test U” di Mann-Whitney
o test di Wilcoxon
è uno dei più potenti test non parametrici
per verificare,
in presenza di valori ordinali
provenienti da una distribuzione
continua,
se due campioni statistici
provengono dalla stessa popolazione.
Con test chi quadrato (χ²)
si intende uno dei test di verifica d'ipotesi.
La variabile casuale Chi Quadrato
verifica se l'ipotesi nulla è
probabilisticamente compatibile con i dati.
A seconda delle ipotesi di partenza,
tale test viene considerato
a volte parametrico
ed altre volte non parametrico.
DRY_T1_B
Frequency
Percent
DRY_T1_A
Frequency
Percent
1
4
10 %
1
15
37 %
2
34
85 %
2
24
60 %
3
2
5%
3
1
3%
4
0
0%
4
0
0%
40
100 %
40
100 %
Total
χ² = 8.43
p =
Total
d.f. = 3 x 1 = 3
0.01480269
?!?
Auguri a tutti per un
?!?
Buon Natale 2008 ed un Sereno 2009
Troverete una copia
delle diapositive viste
nel workshop di oggi
(e di alcune passate edizioni)
sul sito internet:
http://www.tarcisio.net