Test 14-GEN-2016 In un allevamento di galline su 100 pulcini nati solo 38 sono femmine. Che probabilità ha la nascita di 38 femmine o meno? Cioè calcola la somma delle probabilità di 0, 1, 2 . . . . . . 38 femmine. N.B. la probabilità della nascita di un pulcino maschio è uguale a quella di un pulcino femmina e i fattoriali sono inutilizzabili con questa numerosità). 8 punti Calcola tutte le misure di tendenza centrale e di dispersione nei seguenti dati. 7 punti numeri 2 6 0 0 3 8 10 Dopo aver fatto l'analisi della varianza sui dati riportati in tabella indica con lettere diverse le medie che differiscono statisticamente (N.B. prima di fare i calcoli codifica opportunamente i dati). 15 punti TESI n medie MS errore A 4 0,0020 B C D 4 4 4 0,0038 0,0025 0,0025 0,000000767 E 4 0,0045 Non potendo utilizzare i fattoriali per trovare le probabilità da “38” a 0 possiamo approssimare utilizzando la distribuzione normale; per rendere la distribuzione continua e non discontinua. Considero quindi l'area nella distribuzione normale da 37,5 a meno infinito (38 = 37,5-38,5; 37=36,5-37,5 ecc.). Calcolo quindi la media e la deviazione standard della distribuzione: σ = n xp x q = 100*0,5*0,5 = 5 µ = n x p = 100 x 0,5 = 50 Calcolo l'area sottesa fra i due punti Z: Da Z = x - μ Se Z = -2,4 l'area fra media (50) e 38 è -0,4918 = 38,5 - 50 = 12 = -2,3 σ 5 L'area da 38 a 0 sarà quindi 0,500-04893=0,0107 5 Z 1 2 2,1 2,2 2,3 2,4 RISPOSTA: La probabilità di avere al massimo 38 femmine è quindi P= 0,0107 oppure 0,0107 x 100 = 1,07% = P. Potrei anche utilizzare il Chi quadro 11,5 -11,5 osservata 62 38 100 attesa 50 50 100 scarto 12 -12 Yates -0,5 0,5 al quadrato diviso al quadrato diviso 50 50 132,25 132,25 diviso diviso CHI quadro gl 1 2 0,95 0,004 0,10 0,0164 0,9 0,02 0,21 scarto corretto 11,5 -11,5 50 50 2,645 2,645 5,290 0 0,3413 0,4772 0,4821 0,4861 0,4893 0,4918 0,01 0,3438 0,4778 0,4826 0,4864 0,4896 0,4920 Nota: il test del chi quadro, oltre a non consentire la determinazione della probabilità precisa ma solo l'intervallo considera inoltre la probabilità dei quadrati degli scarti quindi sia positivi che negativi, in pratica “calcola” sia l'area sx che dx della distribuzione. La probabilità calcolata con il chi quadro risulta quindi approssimativamente doppia di quella richiesta e deve essere divisa per 2. Infatti la P calcolata con d.norm. 0,0107*2 = circa 0,02 = P calcolata con il Chi quadro cioè 5,29, molto vicino a 5,41 = P 0,02. Probabilità percentuale di un valore di chi quadro maggiore del valore in tabella 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,06 0,15 0,27 0,45 0,71 1,07 1,64 2,71 0,45 0,71 1,02 1,39 1,83 2,41 3,22 4,61 0,05 3,84 5,99 0,02 5,41 7,82 0,01 6,63 9,21 Somma quadrati scarti errore VAR.ERR G.L. 0,767 per 15 = Termine di correzione media numerosità 2 per 4 = 3,8 per 4 = 2,5 per 4 = 2,5 per 4 = 4,5 per 4 = somma 20 elevata al quadrato diviso numerosità 1) Codifico moltiplicando per 1.000 le medie e per 1.0002 la varianza dell'errore 2) Riporto le SS ed i g.l. nella tabella della varianza 11,505 8,0 15,2 10,0 10,0 18,0 61,2 3745,44 20 187,3 somma quadrati scarti trattamenti somma tesi 8 al quadrato = 64 15,2 231,04 10 100 10 100 18 324 819,04 diviso numerosità per tesi 4 204,8 meno termine di correzione 187,3 17,488 SORGENTI TRATTAMENTI ERRORE TOTALE SS 17,488 11,505 28,993 DF 4 15 19 MS 4,372 0,767 F 5,70013 3) Confronto l'F trovato con quello atteso tabulato g.l. 1 161,448 18,513 10,128 7,709 6,608 5,987 5,591 5,318 5,117 4,965 4,747 4,6 4,494 4,414 4,351 4,242 4,171 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 25 30 2 199,5 19 9,552 6,944 5,786 5,143 4,737 4,459 4,256 4,103 3,885 3,739 3,634 3,555 3,493 3,385 3,316 3 215,707 19,164 9,277 6,591 5,409 4,757 4,347 4,066 3,863 3,708 3,49 3,344 3,239 3,16 3,098 2,991 2,922 4 224,583 19,247 9,117 6,388 5,192 4,534 4,12 3,838 3,633 3,478 3,259 3,112 3,007 2,928 2,866 2,759 2,69 5 230,162 19,296 9,013 6,256 5,05 4,387 3,972 3,687 3,482 3,326 3,106 2,958 2,852 2,773 2,711 2,603 2,534 6 233,986 19,33 8,941 6,163 4,95 4,284 3,866 3,581 3,374 3,217 2,996 2,848 2,741 2,661 2,599 2,49 2,421 7 236,768 19,353 8,887 6,094 4,876 4,207 3,787 3,500 3,293 3,135 2,913 2,764 2,657 2,577 2,514 2,405 2,334 8 238,883 19,371 8,845 6,041 4,818 4,147 3,726 3,438 3,23 3,072 2,849 2,699 2,591 2,51 2,447 2,337 2,266 9 240,543 19,385 8,812 5,999 4,772 4,099 3,677 3,388 3,179 3,02 2,796 2,646 2,538 2,456 2,393 2,282 2,211 10 241,882 19,396 8,786 5,964 4,735 4,060 3,637 3,347 3,137 2,978 2,753 2,602 2,494 2,412 2,348 2,236 2,165 12 243,906 19,413 8,745 5,912 4,678 4,00 3,575 3,284 3,073 2,913 2,687 2,534 2,425 2,342 2,278 2,165 2,092 Tavole realizzate con la funzione “invF” di libre office g.l. 1 2 3 4 5 6 7 8 9 10 11 12 14 16 1 4052 98,5 34,12 21,2 16,26 13,75 12,25 11,26 10,56 10,04 9,65 9,33 8,862 8,531 2 5000 99 30,82 18 13,27 10,92 9,547 8,649 8,022 7,559 7,21 6,927 6,515 6,226 3 5403 99,17 29,46 16,69 12,06 9,78 8,451 7,591 6,992 6,552 6,22 5,953 5,564 5,292 4 5625 99,25 28,71 15,98 11,39 9,148 7,847 7,006 6,422 5,994 5,67 5,412 5,035 4,773 5 5764 99,3 28,24 15,52 10,97 8,746 7,46 6,632 6,057 5,636 5,32 5,064 4,695 4,437 6 5859 99,33 27,91 15,21 10,67 8,466 7,191 6,371 5,802 5,386 5,07 4,821 4,456 4,202 7 5928 99,36 27,67 14,98 10,46 8,26 6,993 6,178 5,613 5,2 4,89 4,64 4,278 4,026 8 5981 99,37 27,49 14,8 10,29 8,102 6,84 6,029 5,467 5,057 4,74 4,499 4,14 3,89 9 6022 99,39 27,35 14,66 10,16 7,976 6,719 5,911 5,351 4,942 4,63 4,388 4,03 3,78 10 6056 99,4 27,23 14,55 10,05 7,874 6,62 5,814 5,257 4,849 4,54 4,296 3,939 3,691 12 6106 99,42 27,05 14,37 9,888 7,718 6,469 5,667 5,111 4,706 4,4 4,155 3,8 3,553 14 6143 99,43 26,92 14,25 9,77 7,605 6,359 5,559 5,005 4,601 4,29 4,052 3,698 3,451 16 6170 99,44 26,83 14,15 9,68 7,519 6,275 5,477 4,924 4,52 4,21 3,972 3,619 3,372 18 6192 99,44 26,75 14,08 9,61 7,451 6,209 5,412 4,86 4,457 4,15 3,909 3,556 3,31 20 6209 99,45 26,69 14,02 9,553 7,396 6,155 5,359 4,808 4,405 4,1 3,858 3,505 3,259 25 6240 99,46 26,58 13,91 9,449 7,296 6,058 5,263 4,713 4,311 4,01 3,765 3,412 3,165 4) trovo le minime differenze significative fra le medie a 0,01 impiegando il t bis) non è sbagliato trovarle anche a 0,05 ma non è necessario. SORGENTI TRATTAMENTI ERRORE TOTALE SS 17,488 11,505 28,993 DF 4 15 19 MS 4,372 0,767 F 5,70013 MDS = Numerosità di ciascuna tesi = 4 =t∗√ 0,3833 4 +4 8 = =0,5 4*4 16 t * 0,6192 gl= n A +nB −2=6 due code una coda g.l. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 80 100 1.000 infinito 0,5 0,25 1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,683 0,683 0,683 0,681 0,679 0,678 0,677 0,675 0,674 probabilità % di un valore più elevato di t trascurando il segno. 0,4 0,3 0,2 0,1 0,05 0,02 0,2 0,15 0,1 0,05 0,025 0,01 1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,851 0,848 0,846 0,845 0,842 0,842 1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,050 1,045 1,043 1,042 1,037 1,036 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,296 1,292 1,290 1,282 1,282 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,664 1,660 1,646 1,645 12,710 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,990 1,984 1,962 1,960 31,820 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,374 2,364 2,330 2,326 0,01 0,005 0,002 0,001 0,001 0,0005 63,660 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,639 2,626 2,581 2,576 318,310 22,327 10,215 7,173 5,893 5,208 4,785 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,610 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,385 3,307 3,232 3,195 3,174 3,098 3,090 636,620 31,599 12,924 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,768 3,745 3,725 3,707 3,690 3,674 3,659 3,646 3,551 3,460 3,416 3,390 3,300 3,291 3,707 * 0,6192 2,447 * 0,6192 MDS 0,01 = MDS 0,05 = 2,2950 1,5149 5) calcolo e metto in ordine le medie e le confronto con la MDS0,01 calcolata 2,00 2,00 2,00 4,50 4,50 2,50 = 3,75 = 4,50 = 3,75 = 2,00 = 0,50 1,75 2,50 0,75 2,50 2,00 2,50 3,75 4,50 6) riporto le lettere nella tabella non è necessario! bis) calcolo e metto in ordine le medie e le confronto con la MDS0,05 calcolata 2,00 2,00 3,75 2,50 4,50 2,50 = 3,75 = 2,50 =4,50 = 3,75 = 0,50 1,75 1,25 2,00 0,75 2,00 2,50 1,5149 3,75 4,50 Riporto le lettere nella tabella: TESI A B C D n 4 4 4 4 media 0,0020 A a 0,0038 AB bc 0,0025 AB ab 0,0025 AB ab MS errore 0,000000767 Oppure Dev.St.Err.= 0,000875614 E 4 0,0045 B c Nota: lettere diverse maiuscole indicano differenze significative per p<0,01 ● Lettere minuscole per p<0,05 (le minuscole sono opzionali e non necessarie in quanto F era altamente significativo cioè per p<0,01. È quindi necessario calcolare le MDS a p=0,01 ed è solo “accessorio” calcolarle anche per p=0,05) Nota: l'esercizio è quello del test di dicembre 2015 presentato “alla rovescia” senza i “blocchi”, cioè invece dei dati originali da sottoporre ad analisi della varianza sono stati presentati i dati “tabulati” come devono essere presentati correttamente per essere diffusi nel mondo scientifico. Nota i risultati sono diversi perché nell'enunciato dell'esercizio sono stati “tolti i blocchi” per rendere l'esercizio stesso più facile. Se fosse stato scritto (nell'enunciato o negli ipotetici materiali e metodi della ricerca) che i dati erano stati analizzati secondo uno schema con 4 blocchi randomizzati i gradi di libertà dell'errore avrebbero dovuto essere diminuiti di ulteriori 3 unità (4-1), quelle legate ai blocchi, e i risultati sarebbero stati identici. Provalo come esercizio da svolgere a casa somma media mediana moda media geometrica media armonica Termine Correzione somma quadrati scarti Varianza dev.st. err.st. coefficiente di variazione = = = = = = = = = = = = Log 10 numeri x2 inverse 2 4 0,30103 0,5 6 36 0,7781513 0,1666667 0 0 Err:502 #DIV/0! 0 0 Err:502 #DIV/0! 3 9 0,4771213 0,3333333 8 64 0,90309 0,125 10 100 1 0,1 29 213 Err:502 #DIV/0! 4,1 4,142857 Err:502 #DIV/0! 3,0 0,0 Err:502 Non calcolabileErr:502 Err:502 Non calcolabile #DIV/0! Log di zero e uno diviso zero 120,1429 non esistono! il primo tende a 92,85714 meno infinito e il secondo a più infinito e nel punto non sono 15,48 15,47619 definibili 3,93 3,933979 1,49 94,96%