I risultati di prove interlaboratorio nel settore della microbiologia ambientale 15a e 16a Prova Interlaboratorio MIAC 1a Prova Interlaboratorio MIAS Statistica Parametrica e Statistica Non Parametrica Dottor Tarcisio Niglio Servizio Informatico Istituto Superiore di Sanità Roma, 9 dicembre 2008 Statistica Parametrica e Statistica Non Parametrica Cosa ne dicono i “Sacri Testi” statistici ?!? Nell'ambito della statistica parametrica si ipotizza che la variabile casuale X su cui si effettua l'inferenza, sia descritta da una distribuzione la cui espressione sia nota. Se f(x) esprime la distribuzione di probabilità/densità della variabile casuale X allora f(x) = f(x,μ), dove μ è uno scalare o un vettore di parametri. -σ µ +σ 1000 800 600 400 f(x) 200 0 0,75 0,80 0,90 1,00 1,10 1,20 1,05 1,25 1,35 1,45 1,50 -σ µ +σ Nell'ambito della statistica parametrica 1000 si ipotizza che la variabile casuale X su cui si effettua l'inferenza, 800 sia descritta da una distribuzione la cui espressione sia nota. 600 Se f(x) esprime f(x) la distribuzione di probabilità/densità della variabile casuale X 200 allora f(x) = f(x,μ), dove μ è uno scalare 0 o un vettore di parametri. 400 0,75 0,80 0,90 1,00 1,10 1,20 1,05 1,25 1,35 1,45 1,50 . Le variabili casuali continue sono delle variabili casuali per le quali l'insieme dei valori possibili ha la potenza del continuo ossia può essere posto in relazione biunivoca con la retta reale, il che vuol dire in altri termini che i valori possibili sono delle variabili continue. cm 200 180 160 140 120 100 10 11 12 13 14 15 16 17 18 19 20 anni 250 200 150 100 50 0 0,75 0,80 0,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 300 250 200 150 100 50 0 0,75 0,80 0,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 300 250 200 150 100 50 0 0,75 0,80 0,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 Nella statistica non parametrica i modelli matematici non necessitano di ipotesi a priori sulle caratteristiche della popolazione (ovvero di un Parametro) o comunque le ipotesi sono meno restrittive di quelle usuali nella statistica parametrica. 1 2 0 2 In un questionario poniamo: 1 = maschio 2 = femmina 0 = non so (???) . 1 2 0 Analisi della Frequenza: 2 Risposta “1” = una evenienza Risposta “2” = due evenienze Risposta “0” = una evenienza In un questionario poniamo: 1 = maschio 2 = femmina 0 = non so (???) Proviamo ad applicare la statistica parametrica a questi dati ….. La formulare per calcolare la media aritmetica è: di conseguenza µ = ( 1 + 2 + 2 + 0 ) / 4 = 1,25 Proviamo ad applicare la statistica parametrica a questi dati ….. La formulare per calcolare la media aritmetica è: MA CHE ST I AFF A MO ERM A N = ( 1 + 2 + 2 + 0 ) /D 4O = 1,25 ?!? di conseguenza µ 1 2 0 2 Il valore caratteristico del nostro campione che rappresenta la relativa popolazione è: ?!? 1 = maschio 2 = femmina 0 = non so 1,25 ?!? cm 200 180 160 140 120 100 10 11 12 13 14 15 16 17 18 19 20 anni In un questionario poniamo: 1 = maschio 2 = femmina 0 = non so =0 =1 =2 =M =F =? =₪ =Ђ =Љ 1000 800 600 400 200 0 0,75 0,80 0,85 0,90 0,95 1,00 1,05 1,10 1,15 1,20 1,25 Il test dei segni per ranghi di Wilcoxon si applica nel caso di un singolo campione con due misure accoppiate. Esso ipotizza che la variabile dipendente derivi da una variabile casuale continua misurabile almeno su intervalli. Il test dei “run” (detto pure test di Wald-Wolfowitz) verifica l'ipotesi di casualità nella distribuzione di una sequenza di dati. Si definisce “run” una sequenza di simboli uguali adiacenti. Ad esempio la seguente sequenza: ++++---+++--++++++---è divisa in sei run, tre formati da “+” e tre da “-”. Il test di Wilcoxon-Mann-Whitney noto pure come “test U” di Mann-Whitney o test di Wilcoxon è uno dei più potenti test non parametrici per verificare, in presenza di valori ordinali provenienti da una distribuzione continua, se due campioni statistici provengono dalla stessa popolazione. Con test chi quadrato (χ²) si intende uno dei test di verifica d'ipotesi. La variabile casuale Chi Quadrato verifica se l'ipotesi nulla è probabilisticamente compatibile con i dati. A seconda delle ipotesi di partenza, tale test viene considerato a volte parametrico ed altre volte non parametrico. DRY_T1_B Frequency Percent DRY_T1_A Frequency Percent 1 4 10 % 1 15 37 % 2 34 85 % 2 24 60 % 3 2 5% 3 1 3% 4 0 0% 4 0 0% 40 100 % 40 100 % Total χ² = 8.43 p = Total d.f. = 3 x 1 = 3 0.01480269 ?!? Auguri a tutti per un ?!? Buon Natale 2008 ed un Sereno 2009 Troverete una copia delle diapositive viste nel workshop di oggi (e di alcune passate edizioni) sul sito internet: http://www.tarcisio.net