Test 14-GEN-2016
In un allevamento di galline su 100 pulcini nati solo 38 sono
femmine. Che probabilità ha la nascita di 38 femmine o
meno? Cioè calcola la somma delle probabilità di 0, 1,
2 . . . . . . 38 femmine. N.B. la probabilità della nascita di un
pulcino maschio è uguale a quella di un pulcino femmina e i
fattoriali sono inutilizzabili con questa numerosità). 8 punti
Calcola tutte le misure di
tendenza centrale e di
dispersione nei seguenti
dati. 7 punti
numeri
2
6
0
0
3
8
10
Dopo aver fatto l'analisi della varianza sui dati riportati in tabella
indica con lettere diverse le
medie che differiscono
statisticamente (N.B. prima di fare i calcoli codifica
opportunamente i dati). 15 punti
TESI
n
medie
MS errore
A
4
0,0020
B
C
D
4
4
4
0,0038 0,0025 0,0025
0,000000767
E
4
0,0045
Non potendo utilizzare i fattoriali per trovare le probabilità da “38” a 0 possiamo
approssimare utilizzando la distribuzione normale; per rendere la distribuzione
continua e non discontinua. Considero quindi l'area nella distribuzione normale da 37,5 a
meno infinito (38 = 37,5-38,5; 37=36,5-37,5 ecc.).
Calcolo quindi la media e la deviazione standard della distribuzione:
σ = n xp x q =  100*0,5*0,5 = 5
µ = n x p = 100 x 0,5 = 50
Calcolo l'area sottesa fra i due punti Z:
Da Z = x - μ
Se Z = -2,4 l'area fra media (50) e 38 è -0,4918
= 38,5 - 50 = 12 = -2,3
σ
5
L'area da 38 a 0 sarà quindi 0,500-04893=0,0107
5
Z
1
2
2,1
2,2
2,3
2,4
RISPOSTA: La probabilità di avere al massimo 38
femmine è quindi P= 0,0107 oppure 0,0107 x 100 =
1,07% = P.
Potrei anche utilizzare il Chi quadro
11,5
-11,5
osservata
62
38
100
attesa
50
50
100
scarto
12
-12
Yates
-0,5
0,5
al quadrato diviso
al quadrato diviso
50
50
132,25
132,25
diviso
diviso
CHI quadro
gl
1
2
0,95
0,004
0,10
0,0164
0,9
0,02
0,21
scarto corretto
11,5
-11,5
50
50
2,645
2,645
5,290
0
0,3413
0,4772
0,4821
0,4861
0,4893
0,4918
0,01
0,3438
0,4778
0,4826
0,4864
0,4896
0,4920
Nota: il test del chi quadro, oltre a non consentire la
determinazione della probabilità precisa ma solo l'intervallo
considera inoltre la probabilità dei quadrati degli scarti quindi
sia positivi che negativi, in pratica “calcola” sia l'area sx che
dx della distribuzione.
La probabilità calcolata con il chi quadro risulta quindi
approssimativamente doppia di quella richiesta e deve essere
divisa per 2. Infatti la P calcolata con d.norm. 0,0107*2 =
circa 0,02 = P calcolata con il Chi quadro cioè 5,29, molto
vicino a 5,41 = P 0,02.
Probabilità percentuale di un valore di chi quadro maggiore del valore in tabella
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,06
0,15
0,27
0,45
0,71
1,07
1,64
2,71
0,45
0,71
1,02
1,39
1,83
2,41
3,22
4,61
0,05
3,84
5,99
0,02
5,41
7,82
0,01
6,63
9,21
Somma quadrati scarti errore
VAR.ERR
G.L.
0,767
per
15
=
Termine di correzione
media
numerosità
2
per
4
=
3,8
per
4
=
2,5
per
4
=
2,5
per
4
=
4,5
per
4
=
somma
20
elevata al quadrato
diviso numerosità
1) Codifico moltiplicando per 1.000 le
medie e per 1.0002 la varianza
dell'errore
2) Riporto le SS ed i g.l.
nella tabella della varianza
11,505
8,0
15,2
10,0
10,0
18,0
61,2
3745,44
20
187,3
somma quadrati scarti trattamenti
somma tesi
8 al quadrato
=
64
15,2
231,04
10
100
10
100
18
324
819,04
diviso numerosità per tesi
4
204,8
meno termine di correzione
187,3
17,488
SORGENTI
TRATTAMENTI
ERRORE
TOTALE
SS
17,488
11,505
28,993
DF
4
15
19
MS
4,372
0,767
F
5,70013
3) Confronto l'F trovato con quello atteso tabulato
g.l.
1
161,448
18,513
10,128
7,709
6,608
5,987
5,591
5,318
5,117
4,965
4,747
4,6
4,494
4,414
4,351
4,242
4,171
1
2
3
4
5
6
7
8
9
10
12
14
16
18
20
25
30
2
199,5
19
9,552
6,944
5,786
5,143
4,737
4,459
4,256
4,103
3,885
3,739
3,634
3,555
3,493
3,385
3,316
3
215,707
19,164
9,277
6,591
5,409
4,757
4,347
4,066
3,863
3,708
3,49
3,344
3,239
3,16
3,098
2,991
2,922
4
224,583
19,247
9,117
6,388
5,192
4,534
4,12
3,838
3,633
3,478
3,259
3,112
3,007
2,928
2,866
2,759
2,69
5
230,162
19,296
9,013
6,256
5,05
4,387
3,972
3,687
3,482
3,326
3,106
2,958
2,852
2,773
2,711
2,603
2,534
6
233,986
19,33
8,941
6,163
4,95
4,284
3,866
3,581
3,374
3,217
2,996
2,848
2,741
2,661
2,599
2,49
2,421
7
236,768
19,353
8,887
6,094
4,876
4,207
3,787
3,500
3,293
3,135
2,913
2,764
2,657
2,577
2,514
2,405
2,334
8
238,883
19,371
8,845
6,041
4,818
4,147
3,726
3,438
3,23
3,072
2,849
2,699
2,591
2,51
2,447
2,337
2,266
9
240,543
19,385
8,812
5,999
4,772
4,099
3,677
3,388
3,179
3,02
2,796
2,646
2,538
2,456
2,393
2,282
2,211
10
241,882
19,396
8,786
5,964
4,735
4,060
3,637
3,347
3,137
2,978
2,753
2,602
2,494
2,412
2,348
2,236
2,165
12
243,906
19,413
8,745
5,912
4,678
4,00
3,575
3,284
3,073
2,913
2,687
2,534
2,425
2,342
2,278
2,165
2,092
Tavole realizzate con la funzione “invF” di libre office
g.l.
1
2
3
4
5
6
7
8
9
10
11
12
14
16
1
4052
98,5
34,12
21,2
16,26
13,75
12,25
11,26
10,56
10,04
9,65
9,33
8,862
8,531
2
5000
99
30,82
18
13,27
10,92
9,547
8,649
8,022
7,559
7,21
6,927
6,515
6,226
3
5403
99,17
29,46
16,69
12,06
9,78
8,451
7,591
6,992
6,552
6,22
5,953
5,564
5,292
4
5625
99,25
28,71
15,98
11,39
9,148
7,847
7,006
6,422
5,994
5,67
5,412
5,035
4,773
5
5764
99,3
28,24
15,52
10,97
8,746
7,46
6,632
6,057
5,636
5,32
5,064
4,695
4,437
6
5859
99,33
27,91
15,21
10,67
8,466
7,191
6,371
5,802
5,386
5,07
4,821
4,456
4,202
7
5928
99,36
27,67
14,98
10,46
8,26
6,993
6,178
5,613
5,2
4,89
4,64
4,278
4,026
8
5981
99,37
27,49
14,8
10,29
8,102
6,84
6,029
5,467
5,057
4,74
4,499
4,14
3,89
9
6022
99,39
27,35
14,66
10,16
7,976
6,719
5,911
5,351
4,942
4,63
4,388
4,03
3,78
10
6056
99,4
27,23
14,55
10,05
7,874
6,62
5,814
5,257
4,849
4,54
4,296
3,939
3,691
12
6106
99,42
27,05
14,37
9,888
7,718
6,469
5,667
5,111
4,706
4,4
4,155
3,8
3,553
14
6143
99,43
26,92
14,25
9,77
7,605
6,359
5,559
5,005
4,601
4,29
4,052
3,698
3,451
16
6170
99,44
26,83
14,15
9,68
7,519
6,275
5,477
4,924
4,52
4,21
3,972
3,619
3,372
18
6192
99,44
26,75
14,08
9,61
7,451
6,209
5,412
4,86
4,457
4,15
3,909
3,556
3,31
20
6209
99,45
26,69
14,02
9,553
7,396
6,155
5,359
4,808
4,405
4,1
3,858
3,505
3,259
25
6240
99,46
26,58
13,91
9,449
7,296
6,058
5,263
4,713
4,311
4,01
3,765
3,412
3,165
4) trovo le minime differenze significative fra le medie a 0,01 impiegando il t
bis) non è sbagliato trovarle anche a 0,05 ma non è necessario.
SORGENTI
TRATTAMENTI
ERRORE
TOTALE
SS
17,488
11,505
28,993
DF
4
15
19
MS
4,372
0,767
F
5,70013
MDS =
Numerosità
di
ciascuna tesi = 4
=t∗√ 0,3833
4 +4 8
= =0,5
4*4 16
t * 0,6192
gl= n A +nB −2=6
due code
una coda
g.l.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
80
100
1.000
infinito
0,5
0,25
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,681
0,679
0,678
0,677
0,675
0,674
probabilità % di un valore più elevato di t trascurando il segno.
0,4
0,3
0,2
0,1
0,05
0,02
0,2
0,15
0,1
0,05
0,025
0,01
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,851
0,848
0,846
0,845
0,842
0,842
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,050
1,045
1,043
1,042
1,037
1,036
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,296
1,292
1,290
1,282
1,282
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,671
1,664
1,660
1,646
1,645
12,710
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,000
1,990
1,984
1,962
1,960
31,820
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,390
2,374
2,364
2,330
2,326
0,01
0,005
0,002
0,001
0,001
0,0005
63,660
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,660
2,639
2,626
2,581
2,576
318,310
22,327
10,215
7,173
5,893
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,307
3,232
3,195
3,174
3,098
3,090
636,620
31,599
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,768
3,745
3,725
3,707
3,690
3,674
3,659
3,646
3,551
3,460
3,416
3,390
3,300
3,291
3,707 *
0,6192
2,447 *
0,6192
MDS 0,01 =
MDS 0,05 =
2,2950
1,5149
5) calcolo e metto in ordine le medie e le confronto con la
MDS0,01 calcolata
2,00 2,00 2,00 4,50 4,50
2,50 = 3,75 = 4,50 = 3,75 = 2,00 =
0,50 1,75 2,50 0,75 2,50
2,00
2,50
3,75
4,50
6) riporto le lettere nella tabella
non è necessario!
bis) calcolo e metto in ordine le medie e le confronto con
la MDS0,05 calcolata
2,00 2,00 3,75 2,50 4,50
2,50 = 3,75 = 2,50 =4,50 = 3,75 =
0,50 1,75 1,25 2,00 0,75
2,00
2,50
1,5149
3,75
4,50
Riporto le lettere nella tabella:
TESI
A
B
C
D
n
4
4
4
4
media
0,0020 A a 0,0038 AB bc 0,0025 AB ab 0,0025 AB ab
MS errore 0,000000767
Oppure Dev.St.Err.= 0,000875614
E
4
0,0045 B c
Nota: lettere diverse maiuscole indicano differenze significative per p<0,01
●
Lettere minuscole per p<0,05 (le minuscole sono opzionali e non necessarie in
quanto F era altamente significativo cioè per p<0,01. È quindi necessario
calcolare le MDS a p=0,01 ed è solo “accessorio” calcolarle anche per p=0,05)
Nota: l'esercizio è quello del test di dicembre 2015 presentato “alla rovescia”
senza i “blocchi”, cioè invece dei dati originali da sottoporre ad analisi della
varianza sono stati presentati i dati “tabulati” come devono essere presentati
correttamente per essere diffusi nel mondo scientifico.
Nota i risultati sono diversi perché nell'enunciato dell'esercizio sono stati “tolti i
blocchi” per rendere l'esercizio stesso più facile.
Se fosse stato scritto (nell'enunciato o negli ipotetici materiali e metodi della ricerca) che i dati
erano stati analizzati secondo uno schema con 4 blocchi randomizzati i gradi di libertà
dell'errore avrebbero dovuto essere diminuiti di ulteriori 3 unità (4-1), quelle legate ai blocchi, e
i risultati sarebbero stati identici. Provalo come esercizio da svolgere a casa
somma
media
mediana
moda
media geometrica
media armonica
Termine Correzione
somma quadrati scarti
Varianza
dev.st.
err.st.
coefficiente di variazione
=
=
=
=
=
=
=
=
=
=
=
=
Log 10
numeri
x2
inverse
2
4
0,30103
0,5
6
36
0,7781513 0,1666667
0
0
Err:502
#DIV/0!
0
0
Err:502
#DIV/0!
3
9
0,4771213 0,3333333
8
64
0,90309
0,125
10
100
1
0,1
29
213
Err:502
#DIV/0!
4,1
4,142857 Err:502
#DIV/0!
3,0
0,0
Err:502 Non calcolabileErr:502
Err:502 Non calcolabile
#DIV/0!
Log di zero e uno diviso zero
120,1429
non esistono! il primo tende a
92,85714
meno infinito e il secondo a più
infinito e nel punto non sono
15,48 15,47619
definibili
3,93
3,933979
1,49
94,96%