CALCOLO DELLE PROBABILITÀ E STATISTICA MATEMATICA 2 20 giugno 2008 1. Si vuole verificare se esista una dipendenza fra colore degli occhi e numero di diottrie totali mancanti nei due occhi. Vengono effettuate le seguenti osservazioni su 152 persone miopi. <2 diottrie 2-6 diottrie 6-10 diottrie >10 diottrie occhi azzurri occhi castani 10 7 8 12 7 15 9 11 occhi verdi occhi neri 7 13 9 14 5 10 8 7 Sulla base di tali dati si può affermare che esista dipendenza tra colore degli occhi e diottrie mancanti? (usare un livello di significatività α = 0.05) 2. Siano X1 , . . . , Xn e Y1 . . . , Yn due campioni per le variabili X e Y , rispettivamente. Si fornisca un metodo per verificare H0 : E(X) = E(Y ) contro H1 : E(X) 6= E(Y ) sia nel caso in cui X e Y hanno distribuzione normale, che nel caso in cui la distribuzione di X e Y è incognita. 3. In 20 esperimenti chimici indipendenti e dello stesso tipo vengono misurate le quantitá aleatorie X1 =temperatura della reazione, X2 =pressione a cui avviene la reazione, X3 = peso del composto finale. Dal campione congiunto cosı́ ottenuto si effettua un’analisi delle componenti principali e si ricavano la matrice di covarianza campionaria di X = (X1 , X2 , X3 ) e le sue matrici degli autovalori e autovettori. Esse sono, rispettivamente, 1.0510 3.6499 5.3729 46.6356 0 0 7.9351 0 S = 3.6499 25.6416 18.9317 Λ= 0 5.3729 18.9317 27.8934 0 0 0.0155 −0.1394 0.1279 0.9819 B = −0.6764 −0.7365 −0.0001 −0.7232 0.6642 −0.1892 a) É possibile eliminare qualche componente principale, e, in caso affermativo, quali? b) Si effettua un nuovo esperimento, indipendente dai precedenti, e si ottengono le seguenti misurazioni per le 3 variabili sopra descritte X ∗ = (X1∗ , X2∗ , X3∗ ) = (0.45, 0.33, 2.8). I risultati di questo esperimento sono significativamente diversi dai precedenti? (Per i test utilizzare α = 0.05) 1 Riportiamo di seguito alcune formule utili per i test collegati alla PCA: • Intervallo di fiducia per la statistica Q = (X − X̂)0 (X − X̂) è [0, Qα ], con √ ¸1/h0 cα 2θ2 h0 2 θ2 h0 (h0 − 1) + Qα = θ1 +1 θ1 θ1 2 P P P 1 θ3 , cα =oppurtuno valore critico dove θ1 = pi=k+1 λi , θ2 = pi=k+1 λi 2, θ3 = pi=k+1 λi 3, h0 = 1 − 2θ 3θ2 2 di una N (0, 1). · • Test per individuare le k componenti principali che portano più informazioni: utilizza la statistica Pp p X j=k+1 λj C = −(n − 1) log(λj ) + (n − 1)(p − k) log( ) p−k j=k+1 che sotto l’ipotesi nulla ha distribuzione χ2(p−k−1)(p−k+2)/2 . 2