Michele Scardi
Test basati su permutazioni (MCPP)
„
„
„
„
Sono un caso speciale dei test di
randomizzazione, che utilizzano serie di numeri
casuali formulare delle inferenze statistiche.
La potenza di calcolo dei moderni PC ha reso
possibile la loro applicazione diffusa.
Questi metodi non richiedono che siano
soddisfatte particolari assunzioni circa la
distribuzione dei dati.
Quindi, questi metodi sono molto più adatti dei
tradizionali test statistici (es. t-tests, ANOVA,
etc.) in applicazioni ecologiche.
Test basati su permutazioni (MCPP)
„
„
„
„
„
„
Si definisce una statistica il cui valore sia proporzionale
all’intensità del processo o della relazione studiati
Si definisce un’ipotesi nulla H0
Si crea un set di dati basati sul “rimescolamento” di
quelli realmente osservati (la modalità di
“rimescolamento” viene definita in funzione dell’ipotesi
nulla)
Si ricalcola la statistica di riferimento e si compara il
valore con quello osservato
Si ripetono gli ultimi due punti molte volte (es. 1000 volte)
Se la statistica osservata è maggiore del limite ottenuto
nel 95% dei casi basati su “rimescolamento”, si rigetta H0
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
1
Michele Scardi
Specie 1
Specie 2
Specie 3
Specie 4
Specie 5
Specie 6
Specie 7
Specie 8
Specie 9
Specie 10
A1
0
0
0
1
0
8
5
0
2
12
stazioni di campionamento
A2
A3
B1
B2
0
0
1
1
0
0
0
1
1
1
9
5
0
1
0
0
0
0
1
1
12
9
0
1
8
4
9
11
0
1
4
6
4
5
3
5
6
8
1
2
Indicator Species Analysis
-----------------------------------------ID
Taxon
I.V.
Med StDev
p *
-----------------------------------------1 Specie 1
66.7
35.2 24.18
.371
2 Specie 2
66.7
38.7 24.86
.442
3 Specie 3
90.0
62.1 14.74
.102
4 Specie 4
66.7
35.8 24.35
.384
5 Specie 5
66.7
35.2 24.18
.371
6 Specie 6
94.2
61.6 15.62
.102
7 Specie 7
62.2
55.6
4.37
.187
8 Specie 8
98.1
57.0 19.37
.102
9 Specie 9
56.0
56.1
4.49
.605
10 Specie 1
89.7
62.2 14.33
.102
MRPP
B3
0
1
4
0
0
2
8
2
6
0
(Multi-Response Permutation Procedures)
---------------------------------------------GRUPPO A: distanza euclidea media = 8.516
GRUPPO B: distanza euclidea media = 11.959
<--
<-<--
T = -2.947
δ osservato = 10.238
δ atteso = 19.590
Accordo intra-gruppo, R =
p =
0.477
0.022 *
<--
MRPP
Se ∆ è la distanza media intragruppo
osservata fra i gruppi definiti a priori,
pesata per la dimensione dei diversi
gruppi, allora:
T=
∆ osservato − ∆ atteso
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
σ ∆2
R = 1−
∆ osservato
∆ atteso
2
Michele Scardi
MRPP
Merluccius merluccius
------------- Multi-Response Permutation Procedures (MRPP) -------------Area A, controllo:
Area B, M/C Haven:
n = 43
n = 20
Test statistic: T
Observed delta
Expected delta
Variance of delta
Skewness of delta
average within-group distance = 1.3570038
average within-group distance = 7.5528164
= -14.493640
=
3.3239284
=
3.7441384
=
0.84057736E-03
= -2.0045495
Chance-corrected within-group agreement, R = 0.11223141
Probability of a smaller or equal delta, p = 0.00000019
Indicator Species Analysis
L'abbondanza relativa RAkj della specie j
nel gruppo di campioni k è
RAkj =
x kj
g
∑x
k =1
La frequenza media RFkj della
presenza di una specie j nel gruppo di
campioni k è
Combinando abbondanze relative (RA)
e frequenze medie (RF) si ottiene quindi
il valore indicatore (IV)
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
kj
nk
bijk
i =1
nk
RFkj = ∑
IVkj = RAkj ⋅ RFkj ⋅ 100
3
Michele Scardi
Indicator Species Analysis
Merluccius merluccius
Group:
A
B
Number of items: 43 20
n
ID
Avg Max INDVAL
p
taxon
---------------------------------------------------------------1 EUFASI
24 44
4 44 0.017
Eufasiacei
2 THYSAN
12 25
0 25 0.004
Thysanopoda aequalis
3 RESPES
13 26 26
1 0.046
Resti pesci
4 RESCRO
10 20
0 20 0.009
Resti crostacei
5 MISIDA
2
5
5
0 0.595
Misidacei nc
6 DECAPO
2
3
2
3 0.999
Decapodi nc
7 CEFALO
2
5
5
0 0.554
Cefalopodi
8 CHLORO
3
5
0
5 0.299
Chlorotocus crassicornis
9 CRANGO
1
2
2
0 0.999
Crangon sp
10 SARDIN
3
5
0
5 0.299
Sardina pilchardus
11 ROCINE
3
5
0
5 0.307
Rocinela sp
12 POLICH
1
2
2
0 0.999
Policheti
----------------------------------------------------------------
10
9
8
B1
7
A1
6
A3
B1
SP2
A2
B2
5
Sito B
A2
4
B2
B3
Sito A
A3
B3
A1
3
2
1
Si compara la composizione della
comunità bentonica fra un area
protetta ed una non protetta.
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
0
0
1
2
3
4
5
SP1
4
Michele Scardi
10
SP2
9
8
7
SP2
6
9
8
7
6
5
4
3
2
1
0
Sito B
1/5m
Sito A
5
Sito A
2/10m
3/20m
sta zione
Sito B
4
6
3
5
2
SP1
4
1
Sito A
3
Sito B
2
0
0
1
2
3
4
1
5
0
SP1
1/5m
2/10m
3/20m
sta zione
Distanza euclidea
10
Dij = ( xi − x j ) 2 + ( yi − y j ) 2
9
8
7
SP2
6
Sito A
5
Sito B
4
3
2
1
0
0
1
2
3
4
5
SP1
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
5
Michele Scardi
ANOSIM
(ANalysis Of SIMilarities)
N=6
R=
rb − rw
= 0.5
N ( N − 1) / 4
rw rb
ordina
n=6
n=9
25%
25%
rb − rw
R=
N ( N − 1) / 4
100%
P=90%
20%
20%
80%
15%
60%
15%
10%
40%
10%
5%
20%
5%
0%
0%
-0.4
-0.4
-0.3
-0.3
-0.2
-0.2
-0.1
-0.1
0
0
0.1
0.1
0.2
0.2
0.3
0.3
0.4
0.4
0.5
0.5
0.6
0.6
0.7
0.7
0.8
0%
0.8
R= 0.50
R= 0.20
R= 0.19
R= -0.26
rw= 5.75
rb=9.50
rw= 7.08
rb=8.61
rw= 7.17
rb=8.56
rw= 9.17
rb=7.22
...
n=6 n=9
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
n=6 n=9
n=6 n=9
n=6 n=9
6
Michele Scardi
10
9
8
B1
7
A1
6
B1
SP2
A2
A3
B2
5
Sito B
A2
4
B2
Sito A
A3
B3
A1
3
2
B3
1
0
Db>Dw
0
1
2
3
4
5
SP1
(differenze “inter”>differenze “intra”)
10
9
A1
8
B1
7
A1
6
A3
B1
SP2
A2
B2
5
4
Sito A
Sito B
A2
3
B2
B3
2
1
B3
0
A3
-1
Si compara la composizione della
comunità bentonica fra un area
protetta ed una non protetta.
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
-1
0
1
2
3
4
5
6
SP1
7
Michele Scardi
ANOSIM
(ANalysis Of SIMilarities)
R = −0.370
p = 0.171
10
9
A1
8
B1
7
A1
6
A3
B1
SP2
A2
B2
5
4
Sito A
Sito B
A2
3
B2
B3
2
1
B3
0
A3
-1
Dw>Db
-1
0
1
2
3
4
5
6
SP1
(differenze “intra”>differenze “inter”)
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
8
Michele Scardi
Test di Mantel
Matrice X
distanze geografiche
Matrice Y
dissimilarità cenotica
A
B
C
D
E
A
0.0
1.2
2.6
1.8
3.2
B
1.2
0.0
3.1
0.5
2.7
C
2.6
3.1
0.0
1.1
4.2
D
1.8
0.5
1.1
0.0
3.4
E
3.2
2.7
4.2
3.4
0.0
A
B
C
D
E
A
0.00
0.01
0.21
0.07
0.45
B
0.29
0.00
0.17
0.04
0.34
C
0.56
0.48
0.00
0.16
0.78
D
0.45
0.06
0.27
0.00
0.21
E
0.49
0.12
0.59
0.02
0.00
Statistiche di Mantel
assoluta
standardizzata
La distribuzione di riferimento si genera ricalcolando la statistica
dopo permutazioni aleatorie di una delle due matrici o (per matrici
molto grandi) approssimando una distribuzione t di Student.
L'analisi dei dati nella progettazione e
nella gestione delle aree marine protette
9